在我的博客看效果更佳：[点这里](https://www.cnblogs.com/1000Suns/p/14048210.html) --- 本文主要参考 IOI 2020 中国国家候选队论文《浅谈利用分散层叠算法对经典分块问题的优化》。本文仅描述了该算法的基本思想及实现，更深入的理论及应用请在论文中查阅。（或者哪天我有闲心了来写本文提供的代码并没有经过精细实现，同时依赖于模板题的一些特殊限制，所以不推荐作为模板使用，也不保证在一般情况下仍然有正确性。 --- 分散层叠算法可以解决下述问题： - 给定 $k$ 个有序序列，长度的和为 $n$。$q$ 次询问，每次给定数 $x$，求出其在每个序列的后继。下文中认为，这个后继是非严格的。对于 $k=1$ 是一个经典的二分算法，可以做到 $O(n)-O(\log n)$。这个算法做 $k$ 次即有 $O(n)-O(k\log\frac{n}{k})$ 的复杂度。另一种常见算法，是将这 $k$ 个序列归并成一个长为 $n$ 的序列，同时对于每个元素记录其后面第一个来自第 $i$ 个序列的数是哪个。那么每次查询都可以在大序列中二分，通过在大序列的后继记录的信息得到在每个序列的后继。这个算法的复杂度为 $O(nk)-O(k+\log n)$，同时空间复杂度也是 $O(nk)$。分散层叠算法可以 $O(n)-O(k+\log n)$ 解决这个问题，且空间复杂度是 $O(n)$。 --- 我们将一开始给出的第 $i$ 个序列叫做 $L_i$。然后预处理另外 $k$ 个有序序列 $M_i$。 $M_k=L_k$，而对于 $i using namespace std; typedef long long ll; typedef pair PII; const int maxn=22222,maxk=111,mod=998244353; #define MP make_pair #define PB push_back #define lson o<<1,l,mid #define rson o<<1|1,mid+1,r #define FOR(i,a,b) for(int i=(a);i<=(b);i++) #define ROF(i,a,b) for(int i=(a);i>=(b);i--) #define MEM(x,v) memset(x,v,sizeof(x)) inline ll read(){ char ch=getchar();ll x=0,f=0; while(ch<'0' || ch>'9') f|=ch=='-',ch=getchar(); while(ch>='0' && ch<='9') x=x*10+ch-'0',ch=getchar(); return f?-x:x; } struct node{ int v,nxt1,nxt2; }; int n,k,q,d,lstans,a[maxk][maxn],tl,len[maxk],hhh[maxn]; node b[maxk][maxn],tmp[maxn]; void build(){ len[k]=n; FOR(i,1,len[k]) b[k][i]=(node){a[k][i],i,0}; ROF(i,k-1,1){ tl=0; FOR(j,1,len[i+1]) if(j%2==0) tmp[++tl]=b[i+1][j],tmp[tl].nxt2=j; int cur=1,cur2=1; FOR(j,1,n){ while(cur<=tl && tmp[cur].v<=a[i][j]){ tmp[cur].nxt1=j; b[i][++len[i]]=tmp[cur]; cur++; } while(cur2<=len[i+1] && b[i+1][cur2].v<=a[i][j]) cur2++; b[i][++len[i]]=(node){a[i][j],j,cur2}; } while(cur<=tl){ tmp[cur].nxt1=n+1; b[i][++len[i]]=tmp[cur]; cur++; } } FOR(i,1,len[1]) hhh[i]=b[1][i].v; /* FOR(i,1,k){ FOR(j,1,len[i]) printf("(%d,%d,%d) ",b[i][j].v,b[i][j].nxt1,b[i][j].nxt2); puts(""); }*/ } int main(){ n=read();k=read();q=read();d=read(); FOR(i,1,k) FOR(j,1,n) a[i][j]=read(); build(); FOR(_,1,q){ int x=read()^lstans; // printf("work %d\n",x); lstans=0; int p=lower_bound(hhh+1,hhh+len[1]+1,x)-hhh; // printf("first at %d\n",p); FOR(i,1,k){ while(p<=len[i] && b[i][p].v=2 && b[i][p-1].v>=x) p--; if(p<=len[i]){ lstans^=a[i][b[i][p].nxt1]; p=b[i][p].nxt2; } else{ p=len[i+1]+1; } } if(_%d==0) printf("%d\n",lstans); } } ```