$\rm2020.10:$ 进行了小修小补。 $\rm2020.11:$ 重制了更严谨的 “k进制不进位加法卷积” 部分。 $\rm2020.11:$ 加更集合幂级数。 # 0x01.$\rm FWT$ 概论 - **位运算卷积** 众所周知，多项式乘法是加法卷积，因为第 $i$ 项和第 $j$ 项的乘积贡献到第 $i+j$ 项。类似地定义位运算卷积 : 第 $i$ 项和第 $j$ 项的乘积贡献到第 $i⊕j$ 项。其中 $⊕$ 是某种**位运算**。即 $S[k]=\sum\limits_{i⊕j=k}A[i]B[j]$ ，记作卷积式 $A*B=S$ 。 - **构造的尝试** 众所周知，$\rm FFT$ 把多项式转换成点值之后，从卷积变为了直接点积。我们自然也期望把位运算卷积转化成点积。设 $FWT(A)$ 是幂级数 $A$ 经过 $\rm FWT$ 变换之后得到的幂级数。我们需要令其满足 : $A*B=C \Longleftrightarrow FWT(A)·FWT(B)=FWT(C)$ (点积)。 $\rm FFT$ 是一个**线性变换**，我们也希望 $\rm FWT$ 变换是线性的。我们还不知道怎么变换，于是设 $c(i,j)$ 为变换系数，即 $A[j]$ 对 $FWT(A)[i]$ 的贡献系数。则 $FWT(A)[i]=\sum\limits_{j=0}^{n-1}c(i,j)A_j$ 根据 $FWT(A)·FWT(B)=FWT(C)$ ,得到 : $$FWT(A)[i]FWT(B)[i]=FWT(C)[i]$$ $$\sum\limits_{j=0}^{n-1}c(i,j)A[j]\sum\limits_{k=0}^{n-1}c(i,k)B[k]=\sum\limits_{p=0}^{n-1}c(i,p)C[p]$$ $$\sum\limits_{j=0}^{n-1}\sum\limits_{k=0}^{n-1}c(i,j)c(i,k)A[j]B[k]=\sum\limits_{p=0}^{n-1}c(i,p)C[p]$$ 根据 $A*B=C$ ,又能得到 : $$C[p]=\sum\limits_{t_1⊕t_2=p}A[t_1]B[t_2]$$ $$\sum\limits_{p=0}^{n-1}c(i,p)C[p]=\sum\limits_{p=0}^{n-1}c(i,p)\sum\limits_{t_1⊕t_2=p}A[t_1]B[t_2]$$ $$\sum\limits_{j=0}^{n-1}\sum\limits_{k=0}^{n-1}c(i,j)c(i,k)A[j]B[k]=\sum\limits_{p=0}^{n-1}c(i,p)\sum\limits_{t_1⊕t_2=p}A[t_1]B[t_2]$$ $$\sum\limits_{j=0}^{n-1}\sum\limits_{k=0}^{n-1}c(i,j)c(i,k)A[j]B[k]=\sum\limits_{p=0}^{n-1}\sum\limits_{t_1⊕t_2=p}A[t_1]B[t_2]c(i,t_1⊕t_2)=\sum\limits_{t_1=0}^{n-1}\sum\limits_{t_2=0}^{n-1}A[t_1]B[t_2]c(i,t_1⊕t_2)$$ 对比左右两边，得到 $c(i,j)c(i,k)=c(i,j⊕k)$ ，只需要满足这个就好了。另外,由于位运算每一位的独立性, $c(i,j)$ 也有一个重要性质: 可以分位考虑。假设我们已经(根据真值表)求出满足要求的 $c([0,1],[0,1])$，我们能这样构造出所有的 $c$ : 设二进制数 $a$ 的每一位分别为 : $a_0,a_1,a_2...$ 则有 $c(i,j)=c(i_0,j_0)c(i_1,j_1)c(i_2,j_2)...$ ，就是**把每一位的变换系数乘起来**。那么 : 对于每个 $t$ ，都有 $c(i_t,j_t)c(i_t,k_t)=c(i_t,j_t⊕k_t)\Longleftrightarrow c(i,j)c(i,k)=c(i,j⊕k)$ 这就符合我们的条件。好了,现在假设我们已经有了符合要求的 $c$ ,如何快速求解 $\rm FWT$ 变换呢? $FWT(A)[i]=\sum\limits_{j=0}^{n-1}c(i,j)A[j]$ 根据这个式子直接求和,复杂度至少是 $O(n^2)$ 的,并没有起到优化作用。我们考虑**按位拆半**： $=\sum\limits_{j=0}^{(n/2)-1}c(i,j)A[j]+\sum\limits_{j=(n/2)}^{n-1}c(i,j)A[j]$ 设 $i'$ 为 $i$ 去掉二进制首位剩下的数。在首位分开考虑 : $=\sum\limits_{j=0}^{(n/2)-1}c(i_0,j_0)c(i',j')A[j]+\sum\limits_{j=(n/2)}^{n-1}c(i_0,j_0)c(i',j')A[j]$ $=c(i_0,0)\sum\limits_{j=0}^{(n/2)-1}c(i',j')A[j]+c(i_0,1)\sum\limits_{j=(n/2)}^{n-1}c(i',j')A[j]$ 考虑到 $c(i',j')$ 就是去掉最高位的子变换,这里规模减半了。设 $A_0$ 为幂级数下标首位为 $0$ 的部分,类似地有 $A_1$。若 $i_0=0$ ,则有 : $FWT(A)[i]=c(0,0)FWT(A_0)[i]+c(0,1)FWT(A_1)[i]\quad \big(i\in[0,n/2)\big)$ 若 $i_0=1$ ,则有 : $FWT(A)[i+(n/2)]=c(1,0)FWT(A_0)[i]+c(1,1)FWT(A_1)[i]\quad \big(i\in[0,n/2)\big)$ 我们就能以 $O(n)$ 的代价,根据上列式子合并两个规模为 $n/2$ 的子变换。所以,若 $n=2^m$ ,需要合并 $m$ 次,复杂度为 $O(m2^m)$。 ( 可能有点抽象,但是您如果写过FFT,看到代码就会懂了 ) 此外,逆变换 $\rm IFWT$ 就是对 $c$ 矩阵求个逆,具体见下文。 ( 一个重要的地方是,这个构造出来的 $c$ 矩阵**一定要有逆**,否则就变换不回去TAT ) # 0x02.基础位运算卷积针对不同的位运算,根据 $c(i,j)c(i,k)=c(i,j⊕k)$ 构造出 $c([0,1],[0,1])$ 即可。我们把这个矩阵称为**位矩阵**。构造的过程可能有些繁杂，可以直接记结论，或者去后面看扩展版的。 ## $1.1\ \rm Or$ 卷积设位矩阵为 $c=\begin{bmatrix}c(0,0)&c(0,1)\\c(1,0)&c(1,1)\end{bmatrix}$ **起点** : $c(i,j)c(i,k)=c(i,j|k)$ - $c(0,0)c(0,0)=c(0,0|0)$ $\Rightarrow c(0,0)=1$ 或 $0$。同理不难推知 $c(\_,\_)∈\{0,1\}$ - $c(0,1)c(0,0)=c(0,1|0)$ $\Rightarrow c(0,1)=0$ 或 $c(0,0)=c(0,1)=1$ - $c(1,1)c(1,0)=c(1,1|0)$ $\Rightarrow c(1,1)=0$ 或 $c(1,0)=c(1,1)=1$ 首先,如果有一排0或者一列0那么这个矩阵就没有逆,那么可以构造出: 两种情况 : $\begin{bmatrix}1&1\\1&0\end{bmatrix}$ 或 $\begin{bmatrix}1&0\\1&1\end{bmatrix}$。 > **Tips** : $Or$ 卷积的上面第二个矩阵 $FWT$ 相当于子集求和。 > 原因:第二个矩阵相当于 $c(i,j)=[i\&j=j]$ > $A'_i=\sum\limits_{i\&j=j}A_i$等价于$A'_i=\sum\limits_{j∈i}A_i$。 > (也可以使用高维前缀和来推导) (下面采用第二个矩阵) $FWT(A)[i]=FWT(A_0)[i]$ $FWT(A)[i+(n/2)]=FWT(A_0)[i]+FWT(A_1)[i]$ 对于逆变换,把矩阵求个逆可得 $\begin{bmatrix}1&0\\-1&1\end{bmatrix}$ 。 $IFWT(A)[i]=IFWT(A_0)[i]$ $IFWT(A)[i+(n/2)]=IFWT(A_1)[i]-IFWT(A_0)[i]$ ## $1.2\ \rm And$ 卷积 **起点** : $c(i,j)c(i,k)=c(i,j\&k)$。同上,容易得到 $c(\_,\_)∈\{0,1\}$。 - $c(0,1)c(0,0)=c(0,1\&0)$ $\Rightarrow c(0,0)=0$ 或 $c(0,0)=c(0,1)=1$ - $c(1,1)c(1,0)=c(1,1\&0)$ $\Rightarrow c(1,0)=0$ 或 $c(1,0)=c(1,1)=1$ 还是老样子,如果有一排 $0$ 或者一列 $0$ 那么这个矩阵就没有逆,那么可以构造出: 两种情况 : $\begin{bmatrix}0&1\\1&1\end{bmatrix}$ 或 $\begin{bmatrix}1&1\\0&1\end{bmatrix}$,下面采用第二种。 $FWT(A)[i]=FWT(A_0)[i]+FWT(A_1)[i]$ $FWT(A)[i+(n/2)]=FWT(A_1)[i]$ 把矩阵求个逆可得$\begin{bmatrix}1&-1\\0&1\end{bmatrix}$: $IFWT(A)[i]=IFWT(A_0)[i]-IFWT(A_1)[i]$ $IFWT(A)[i+(n/2)]=IFWT(A_1)[i]$ ## $1.3\ \rm Xor$ 卷积 **起点** : $c(i,j)c(i,k)=c(i,j\ \text{xor}\ k)$ - 对于任意的 $x,y$ ,均有 $c(0,0)c(x,y)=c(x,y\ \text{xor}\ 0)=c(x,y)$ $\Rightarrow c(0,0)=1$. - $c(1,1)c(1,1)=c(1,0)$ 此时若 $c(1,1)=c(1,0)=0$,则一行为 $0$ ,矩阵无逆。所以 $c(1,1),c(1,0)$ 必然都非 $0$。 - $c(1,0)c(1,1)=c(1,1)$ 刚才说$c(1,1)$ 非 $0$,所以此处 $c(1,0)$ 一定是1. - $c(0,1)c(0,1)=c(0,0)$ $\Rightarrow c(0,1)∈\{-1,1\}$ 两种情况 : $\begin{bmatrix}1&1\\-1&1\end{bmatrix}$ 或 $\begin{bmatrix}1&1\\1&-1\end{bmatrix}$ ,下面采用第二种。附：不难观察出 $c(i,j)=(-1)^{|i\&j|}$ $FWT(A)_i=FWT(A_0)_i+FWT(A_1)_i$ $FWT(A)_{i+(n/2)}=FWT(A_0)_i-FWT(A_1)_{i}$ 求逆可得$\begin{bmatrix}0.5&0.5\\0.5&-0.5\end{bmatrix}$ $IFWT(A)_i=\dfrac{IFWT(A_0)_i+IFWT(A_1)_i}{2}$ $IFWT(A)_{i+(n/2)}=\dfrac{IFWT(A_0)_i-IFWT(A_1)_i}{2}$ ## $1.4$ 模板题 & Code: [P4717 【模板】快速沃尔什变换 (FWT)](https://www.luogu.com.cn/problem/P4717) - **FWT** : [评测记录](https://www.luogu.com.cn/record/34249999) ```cpp #include #include #include #define Maxn 135000 #define ll long long using namespace std; const int mod=998244353,inv2=499122177; inline int read(){ int X=0;char ch=0; while(ch<48||ch>57)ch=getchar(); while(ch>=48&&ch<=57)X=X*10+(ch^48),ch=getchar(); return X; } const ll Cor[2][2] ={{1,0},{1,1}}, Cand[2][2] ={{1,1},{0,1}}, Cxor[2][2] ={{1,1},{1,mod-1}}, ICor[2][2] ={{1,0},{mod-1,1}}, ICand[2][2]={{1,mod-1},{0,1}}, ICxor[2][2]={{inv2,inv2},{inv2,mod-inv2}}; void FWT(ll *F,const ll c[2][2],int n) { for (int len=1;len #include #define Maxn 140000 #define mod 998244353 #define ll long long using namespace std; inline int read() { register int X=0; register char ch=0; while(ch<48||ch>57)ch=getchar(); while(ch>=48&&ch<=57)X=X*10+(ch^48),ch=getchar(); return X; } int n,pn,inv2; ll f[Maxn],g[Maxn]; ll a[Maxn],b[Maxn],c[Maxn]; void mulor(ll *a,ll *b,ll *c,int len) { if (!(len>>=1)){ c[0]=(a[0]*b[0])%mod; return ; }for (int i=0;i>=1)){ c[0]=(a[0]*b[0])%mod; return ; }for (int i=0;i>=1)){ c[0]=(a[0]*b[0])%mod; return ; }for (int i=0;i #include #define MaxN 1050000 using namespace std; const int mod=1000000009; int read(){ int X=0;char ch=0; while(ch<48||ch>57)ch=getchar(); while(ch>=48&&ch<=57)X=X*10+(ch^48),ch=getchar(); return X; } int m; struct Poly { int a[21]; void operator += (const Poly &B){ for (int i=0;i<=m;i++) a[i]=(a[i]+B.a[i])%mod; } void operator -= (const Poly &B){ for (int i=0;i<=m;i++) a[i]=(a[i]-B.a[i])%mod; } Poly operator * (const Poly &B) const{ Poly R; for (int i=0;i<=m;i++)R.a[i]=0; for (int i=0;i<=m;i++) for (int j=0;i+j<=m;j++) R.a[i+j]=(R.a[i+j]+1ll*a[i]*B.a[j])%mod; return R; } }; void DWT(Poly *f,int n) { for (int l=1;l>1]+(i&1); for (int i=0;i