灵梦
2020-03-20 17:44:20
本文讲解了一种叫做 Segment Tree Beats 的使用线段树维护区间最值操作的方法,和维护区间历史最值的常用手段。主要参考了了吉老师 2016 年集训队论文(见文末参考资料)。
前置知识:懒标记线段树。
首先假设我们有一个序列
给出一个长度为
n(n\leq 10^6) 的序列A 和m(m\leq 10^6) 次操作,每次操作为以下三种类型之一:
- 给出
l,r,k ,对于所有i\in[l,r] ,将A_i 变成\min(A_i,k) ;- 给出
l,r ,求序列A 区间[l,r] 的最大值;- 给出
l,r ,求\sum_{i=l}^{r}A_i 。
在这道题中,第一种操作就是区间最值操作。我们发现,关于区间最大值的询问是可以使用带懒标记的线段树维护的,而区间和则不是很容易求出,因为这不能在下传标记时快速更新答案。
考虑到区间取
举个例子,现在要以
按照上面描述的操作,我们应该沿着红色的边 DFS,最后在红色的节点上更新区间和并打上标记。
这样做的复杂度可以证明是
显然只有暴力 DFS 的过程会影响复杂度,我们考虑一次区间最值操作中哪些节点会被搜索到。发现到达的节点区间中不同的数的个数(下称「值域」)一定会减少(因为至少将最大值与次大值合并了)。线段树每层节点表示的区间的值域一共是
O(n) 的,一共\log 层加起来就是O(n\log n) 。再加上每次操作的复杂度,可以得到复杂度的一个下界为O((n+m)\log n) 。
为了方便理解,下面给出这道题区间修改打标记的代码:
void update(int o, int k) // 只打标记不下传
{
if (k<tr[o].mx)
// 这里需要判一下当前节点是否为最大值
{
tr[o].sum+=(1ll*k-tr[o].mx)*tr[o].cnt;
tr[o].mx=tr[o].tag=k;
}
}
void pushdown(int o) // 下传标记到左右子树
{
if (~tr[o].tag)
{
update(lc, tr[o].tag);
update(rc, tr[o].tag);
tr[o].tag=-1; // 这个题里没有负数,把标记清为 -1 即可
}
}
void modify(int o, int l, int r, int k)
{
if (tr[o].l>r||tr[o].r<l||k>=tr[o].mx) return; // 情况 1
if (l<=tr[o].l&&tr[o].r<=r&&k>tr[o].se)
{ update(o, k); return; } // 情况 2
pushdown(o);
modify(lc, l, r, k), modify(rc, l, r, k); // 继续在子树内搜索
pushup(o);
}
我们在支持上一道例题中所有操作的同时,加入区间加操作。
此时有两种考虑这个问题的方法:
其中后者看似麻烦一些,但思想很重要,可以扩展到更复杂的问题中(尤其是后面会提到的历史最值问题),因此最好也要理解。如果还不是很明白也没有关系,在下一道例题中会详细讲解。
之前的复杂度分析在这道题无法被沿用。论文中给出了一个基于对标记的分析的
给出一个长度为
n(n\leq 5\times 10^5) 的序列A 和m(m\leq 5\times 10^5) 次操作,每次操作为以下六种类型之一:
- 给出
l,r,k ,对于所有i\in[l,r] ,将A_i 加上k ;- 给出
l,r,k ,对于所有i\in[l,r] ,将A_i 变成\max(A_i,k) ;- 给出
l,r,k ,对于所有i\in[l,r] ,将A_i 变成\min(A_i,k) ;- 给出
l,r ,求\sum_{i=l}^{r}A_i ;- 给出
l,r ,求序列A 区间[l,r] 的最大值;- 给出
l,r ,求序列A 区间[l,r] 的最小值。
在这道题中,区间取最大值和最小值的操作同时出现了。虽然我们同样可以套用第一道例题的方法,维护区间加、区间取
应这道题的需要,我们将一个区间的元素划分为最大值、最小值和其他值三种。首先在每个节点上肯定要维护区间和
那么,我们需要分别维护这三个数域上的加减标记。但是有一些细节要注意:
以上两点都会在下面的代码段中体现:
// add1, add2, add3 分别表示最小值、最大值和其他值的加减标记。
// k1, k2, k3 也是按这个顺序。
void update(int o, int k1, int k2, int k3)
// 作用标记并合并标记,一定要注意顺序
{
if (tr[o].mn1==tr[o].mx1)// 只有一种值时,最大值等于最小值
{
if (k1==k3) k1=k2; else k2=k1; // 不应被其他值的标记作用
tr[o].sum+=1ll*k1*tr[o].cmn;
}
else tr[o].sum+=1ll*k1*tr[o].cmn+1ll*k2*tr[o].cmx
+1ll*k3*(tr[o].r-tr[o].l+1-tr[o].cmn-tr[o].cmx);
if (tr[o].mn2==tr[o].mx1) tr[o].mn2+=k2;
// 次小值等于最大值,应该被最大值标记作用
else if (tr[o].mn2!=INF) tr[o].mn2+=k3;
// 否则应该被其他值标记作用
if (tr[o].mx2==tr[o].mn1) tr[o].mx2+=k1;
else if (tr[o].mx2!=-INF) tr[o].mx2+=k3;
// 对次大值同理
tr[o].mn1+=k1, tr[o].mx1+=k2;
tr[o].add1+=k1, tr[o].add2+=k2, tr[o].add3+=k3;
}
void pushdown(int o) // 下传标记
{
int mn=min(tr[lc].mn1, tr[rc].mn1);
int mx=max(tr[lc].mx1, tr[rc].mx1);
// 找出最大值和最小值
update(lc, tr[lc].mn1==mn?tr[o].add1:tr[o].add3,
tr[lc].mx1==mx?tr[o].add2:tr[o].add3, tr[o].add3);
// 下传标记到左子树,若左子树中有最大值则下传最大值加减标记,否则下传其他值加减标记。对最小值同理
update(rc, tr[rc].mn1==mn?tr[o].add1:tr[o].add3,
tr[rc].mx1==mx?tr[o].add2:tr[o].add3, tr[o].add3);
// 右子树同理
tr[o].add1=tr[o].add2=tr[o].add3=0;
}
有些奇怪的问题可以转化为区间最值操作。下面这道题本来可以在第一道例题后面直接讲,但我还是选择了将更重要的内容放到前面。
给出一个长度为
n(n\leq 10^6) 的序列A 和m(q\leq 10^6) 次操作,每次操作为以下两种类型之一:
- 给出
x,v ,将A_x 变成v ;- 给出
x ,求A_x,A_{x+1},\cdots,A_n 的不同后缀最小值个数。
首先这道题与 楼房重建 是同一个问题,所以也有一个
观察到本题询问的是一个后缀而不是区间,可以考虑按下标从后往前扫描线,使用线段树维护关于时间的后缀最小值。假设现在扫描到了位置
对比这种做法和两个
这里再次强调,上面的这种处理区间最值的方法的核心是数域的划分。也就是说,我们以一个
对于序列
而区间历史最值则是指求序列
对于一些修改操作不复杂的问题(区间加,区间覆盖等),我们可以沿用懒标记的做法。这是最基本也是最重要的一种做法。
给出一个长度为
n(n\leq 10^5) 的序列A ,定义辅助数组B ,初始时与A 完全相同。给出m(m\leq 10^5) 次操作,每次操作为以下四种类型之一:
- 给出
l,r,k ,对于所有i\in[l,r] ,将A_i 加上k ;- 给出
l,r,k ,对于所有i\in[l,r] ,将A_i 变成k ;- 给出
l,r ,求序列A 区间[l,r] 的最大值;- 给出
l,r ,求序列B 区间[l,r] 的最大值。每次操作后,对于所有
i ,将B_i 变成\max(B_i,A_i) 。
发现序列
先考虑区间加操作,我们在线段树的每个节点上维护两个值:区间当前最大值
考虑历史最值标记的合并。当节点
现在加入区间覆盖操作,我们把标记换成二元组
这里给出打标记和下传标记部分的代码:
// 以下代码段中,所有带下划线的变量都是历史最值
void plus(int o, int k, int k_) // 区间加标记
{
tr[o].mx_=max(tr[o].mx_, tr[o].mx+k_), tr[o].mx+=k;
// 更新历史最大值和当前最大值,这里要注意顺序
if (!tr[o].tag)
tr[o].add_=max(tr[o].add_, tr[o].add+k_), tr[o].add+=k;
// 如果没有区间覆盖标记,正常更新 add 标记
else tr[o].cov_=max(tr[o].cov_, tr[o].cov+k_), tr[o].cov+=k;
// 否则直接加到 cov 上
}
void cover(int o, int k, int k_) // 区间覆盖标记
{
tr[o].mx_=max(tr[o].mx_, k_), tr[o].mx=k;
tr[o].cov_=max(tr[o].cov_, k_), tr[o].cov=k, tr[o].tag=1;
}
void pushdown(int o) // 下传标记
{
if (tr[o].add)
{
plus(lc, tr[o].add, tr[o].add_);
plus(rc, tr[o].add, tr[o].add_);
tr[o].add=tr[o].add_=0;
}
if (tr[o].tag) // 这里的 tag 表示当前节点有没有区间覆盖标记
{
cover(lc, tr[o].cov, tr[o].cov_);
cover(rc, tr[o].cov, tr[o].cov_);
tr[o].tag=0, tr[o].cov_=INT_MIN;
}
}
所有操作的复杂度都和普通线段树一致,总共是
此外,有些数据结构问题可以离线后转化为这种历史最值问题,下面是一道例题。
给出长度为
n(n\leq 10^5) 的序列A 和q(q\leq 10^5) 次询问,每次询问给出[l,r] ,求区间[l,r] 相同数只算一次 的最大子段和。序列A 的值域为[-10^5,10^5] 。
这道题用常规方法不好快速解决,我们考虑离线。
将询问按
在有些题目中,区间历史最值的询问会与本文第一部分讲解的区间最值操作同时出现。我们考虑这种问题的解决方法,通常可以分为下面的两类。
给出一个长度为
n(n\leq 5\times 10^5) 的序列A ,定义辅助数组B ,初始时与A 完全相同。给出m(m\leq 5\times 10^5) 次操作,每次操作为以下五种类型之一:
- 给出
l,r,k ,对于所有i\in[l,r] ,将A_i 加上k ;- 给出
l,r,k ,对于所有i\in[l,r] ,将A_i 变成\max(A_i-k,0) ;- 给出
l,r,k ,对于所有i\in[l,r] ,将A_i 变成k ;- 给出
p ,询问A_p ;- 给出
p ,询问B_p 。每次操作后,对于所有
i ,将B_i 变成\max(B_i,A_i) 。
定义标记
其中红色段表示两个函数的最大值。容易发现这个最大值也是一个类似的两段函数,我们直接把
给出一个长度为
n(n\leq 5\times 10^5) 的序列A ,定义辅助数组B ,初始时与A 完全相同。给出m(m\leq 5\times 10^5) 次操作,每次操作为以下四种类型之一:
- 给出
l,r,k ,对于所有i\in[l,r] ,将A_i 加上k ;- 给出
l,r,k ,对于所有i\in[l,r] ,将A_i 变成\max(A_i,k) ;- 给出
l,r ,求序列A 区间[l,r] 的最小值;- 给出
l,r ,求序列B 区间[l,r] 的最小值。每次操作后,对于所有
i ,将B_i 变成\max(B_i,A_i) 。
这道题与上一道例题的最大区别在于区间最值操作与历史最值询问是反向的,因为一个是取最大值,而另一个是求历史最小值。如果用上一题的方法维护历史标记的话,两个函数取最小值就会出现下图的情况:
其中紫色段表示两个函数的最小值。可以看出这样合并会导致函数段数无限增长,就不好维护了。我们需要其他的方法。
本文上一部分提到了一种通过划分数域把区间最值操作转化为区间加减的方法。在这里我们需要把一个区间的元素划分成最小值和非最小值两部分。那么区间最值操作可以转化为对最小值的加减操作,而题目中的区间加减则同时作用于这两类值。于是我们以一个
前两个标记是只修改最小值的,所以下传时要判断当前节点是否包含区间最小值,这也在前文例题中提到了。复杂度为
这一部分的内容作为补充。因为网上资料较少,笔者几乎没遇到过这种题目,所以这里写得比较简略。
这里我们先考虑区间加减、区间求历史最值和的问题。比如下面的问题:
给出一个长度为
n(n\leq 10^5) 的序列A ,定义辅助数组B ,初始时与A 完全相同。给出m(m\leq 10^5) 次操作,每次操作为以下两种类型之一:
- 给出
l,r,k ,对于所有i\in[l,r] ,将A_i 加上k ;- 给出
l,r ,求\sum_{i=l}^{r}B_i 。每次操作后,对于所有
i ,将B_i 变成\min(B_i,A_i) 。
发现用上面的方法求历史最值
综上,有
现在我们在上面这题中,加入区间取最大值操作,这道题就变成了论文的最后一道例题 赛格蒙特彼茨(segment-beats)。这是一个比较复杂的问题,我们仍考虑维护一个差分数组
并没有这么简单。因为对于一个区间内
这种方式的复杂度被证明有一个
本文内容到这里就结束了。所有有名字的例题的笔者的完整 AC 代码可以在这里看到。
为了配套这篇日报,我特意造了一道模板题,看完上文后做这题就不难了。