参考 2018 年高睿泉的集训队论文《浅谈保序回归问题》。 ## 保序回归问题 ### 定义保序回归问题是指，对于一个正整数 $p$，给定一个偏序关系（有向无环图），图中每个点 $i$ 有权值 $(w_i,y_i)$，你要给每个点赋上另一个权值 $f_i$，使得图中任意一条有向路径上的 $f_i$ 递增，并最小化回归代价: $$ \sum_{i\in U} w_i|f_i-y_i|^p $$ 我们把上述问题称作 **$L_p$ 问题**。举个简单的例子，[P4331](https://www.luogu.com.cn/problem/P4331) 这道题就可以转化为全序关系（链）上的 $L_1$ 问题，可以使用单调栈 + 堆来解决。但这种方法不能拓展到偏序关系上，所以这里不深入讨论。 ### $L_p$ 均值与其性质我们定义 $L_p$ 均值为使 $\sum\limits_{i\in U}w_i|k-y_i|^p$ 最小的 $k$，也就是所有 $f_i$ 相等时的最优取值。对目标式求导，解出其零点就是 $L_p$ 均值，这里给出 $L_1$ 均值为 $y_i$ 的带权中位数，$L_2$ 均值为 $y_i$ 的带权平均数（$\left(\sum\limits_{i\in U}w_iy_i\right)\left/\left(\sum\limits_{i\in U}w_i\right)\right.$）。可以证明，当 $p>1$ 时，$L_p$ 均值是唯一的；且 $L_p$ 问题一定存在一组最优解，使得对于任意 $f_i$ 都可以找到某个点集，使它的 $L_p$ 均值等于 $f_i$。 ### 整体二分 ### 应用整体二分的思想，可以得到一个求问题的近似解的算法。我们在原问题的基础上加入一些限制。定义 $solve(U,l,r)$ 表示当前点集为 $U$，且 $f_i$ 的取值在区间 $[l,r]$ 内的 $L_p$ 问题。设 $mid=\lfloor(l+r)/2\rfloor$，如果我们能够知道 $U$ 的任意一组最优解中，有哪些点是 $\leq mid$ 的，就可以将当前问题划分成两个规模减半的子问题了。尝试构造另一个问题。设开区间 $(a,b)$ 被 $[l,r]$ 包含，且 $U$ 的任意非空子集的 $L_p$ 均值都不在 $(a,b)$ 内。这个性质保证了对于任意的子问题，都存在一组最优解满足其所有元素均不在 $(a,b)$ 中。下面给出一个引理： > 若 $solve(U,a,b)$ 的一组最优解为 $\tilde z$，且满足 $\tilde z_{i}\notin (a,b),\forall i\in U$。则存在 $solve(U,l,r)$ 的一组最优解 $z$，使得 $z_i\leq a$ 当且仅当 $\tilde z_i=a$。证明：利用反证法。由于上面的性质，显然 $solve(U,a,b)$ 的解只有 $a$ 与 $b$ 两种取值。下面把 $\tilde z_i=a$ 的点称为 A 类点，$\tilde z_i=b$ 的点称为 B 类点，假设存在 B 类点 $i$ 满足 $z_i\leq a$。设点集 $U$ 的 $L_p$ 均值为 $k$，分两种情况讨论： - 若 $k\geq b$，则可以发现对于一个 B 类点，它在区间 $(-\infty,k]$ 内的回归代价递减，而在区间 $[k,+\infty)$ 内的回归代价递增。设 $t$ 是满足 $z_i\leq a$ 的 B 类点中最大的 $z_i$，那么我们把所有 $z_i=t$ 的 B 类点移动到 $b$ 位置处，它们的回归代价变小，而所有点的相对大小关系不变。因此与 $z$ 是 $solve(U,l,r)$ 的一组最优解的假设矛盾。 - 若 $k\leq a$，则 $z_i\leq a$ 的 B 类点 $i$ 显然不会存在 A 类点 $j$ 满足 $z_i\leq z_j$ 这样的偏序关系。如果这样的 B 类点只有 $z_i=t$ 这一种取值，则其所有 $y_i\leq a$，所以将它们改为 A 类点回归代价会减小，且所有点的相对大小仍不发生改变。因此与 $\tilde z$ 是 $solve(U,a,b)$ 的一组最优解的假设矛盾。对于这些 B 类点的 $z_i$ 有多种取值的情况，则考虑设点集 $V=\{i\mid z_i #include using namespace std; typedef unsigned long long ull; const int MAXN=1005; const int INF=1E9; namespace MF { struct Edge { int from, to, cap, flow; Edge(int u, int v, int c, int f): from(u), to(v), cap(c), flow(f) {} }; int n, s, t, flow; vector edges; vector g[MAXN]; int h[MAXN], cur[MAXN]; void init(int v, int a, int b) { n=v, s=a, t=b, flow=0; edges.clear(); for (int i=1; i<=n; i++) g[i].clear(); } void addEdge(int from, int to, int cap) { edges.push_back(Edge(from, to, cap, 0)); edges.push_back(Edge(to, from, 0, 0)); g[from].push_back(edges.size()-2); g[to].push_back(edges.size()-1); } bool bfs() { queue q; for (int i=1; i<=n; i++) cur[i]=h[i]=0; h[s]=1, q.push(s); while (!q.empty()) { int u=q.front(); q.pop(); for (int i=0; ie.flow&&!h[e.to]) h[e.to]=h[u]+1, q.push(e.to); } } return h[t]; } int dfs(int u, int f) { if (u==t) return f; for (int &i=cur[u]; ie.flow&&h[e.to]==h[u]+1) { int d=dfs(e.to, min(f, e.cap-e.flow)); if (d>0) { e.flow+=d; edges[g[u][i]^1].flow-=d; return d; } } } return 0; } void Dinic() { while (bfs()) while (int f=dfs(s, INF)) flow+=f; } } namespace XB { ull d[64]; void clear() { for (int i=0; i<64; i++) d[i]=0; } int insert(ull x) { for (int i=63; i>=0; i--) if (x&1ll< G[MAXN]; void solve(int l, int r, int L, int R) { if (l>r) return; if (R-L==1) { MF::init(r-l+3, r-l+2, r-l+3); for (int i=l; i<=r; i++) q[p[i]]=i-l+1; for (int i=l; i<=r; i++) { int u=p[i], cost=2*(w[u]-L)-1; if (cost>0) MF::addEdge(MF::s, q[u], cost); else MF::addEdge(q[u], MF::t, -cost); for (int v: G[u]) if (q[v]) MF::addEdge(q[u], q[v], INF); } for (int i=l; i<=r; i++) q[p[i]]=0; MF::Dinic(); for (int i=l; i<=r; i++) if (!MF::h[i-l+1]) f[p[i]]=L; else f[p[i]]=R; return; } int mid=(L+R)/2; MF::init(r-l+3, r-l+2, r-l+3); for (int i=l; i<=r; i++) q[p[i]]=i-l+1; for (int i=l; i<=r; i++) { int u=p[i]; if (mid