题解 P6621 【[2020 年联考 A 卷] 魔法商店】

灵梦

2020-06-22 20:36:30

题解

参考 2018 年高睿泉的集训队论文《浅谈保序回归问题》。

保序回归问题

定义

保序回归问题是指,对于一个正整数 p,给定一个偏序关系(有向无环图),图中每个点 i 有权值 (w_i,y_i),你要给每个点赋上另一个权值 f_i,使得图中任意一条有向路径上的 f_i 递增,并最小化回归代价:

\sum_{i\in U} w_i|f_i-y_i|^p

我们把上述问题称作 L_p 问题

举个简单的例子,P4331 这道题就可以转化为全序关系(链)上的 L_1 问题,可以使用单调栈 + 堆来解决。但这种方法不能拓展到偏序关系上,所以这里不深入讨论。

L_p 均值与其性质

我们定义 L_p 均值为使 \sum\limits_{i\in U}w_i|k-y_i|^p 最小的 k,也就是所有 f_i 相等时的最优取值。对目标式求导,解出其零点就是 L_p 均值,这里给出 L_1 均值为 y_i 的带权中位数,L_2 均值为 y_i 的带权平均数 (\left(\sum\limits_{i\in U}w_iy_i\right)\left/\left(\sum\limits_{i\in U}w_i\right)\right.)。可以证明,当 p>1 时,L_p 均值是唯一的;且 L_p 问题一定存在一组最优解,使得对于任意 f_i 都可以找到某个点集,使它的 L_p 均值等于 f_i

整体二分

应用整体二分的思想,可以得到一个求问题的近似解的算法。

我们在原问题的基础上加入一些限制。定义 solve(U,l,r) 表示当前点集为 U,且 f_i 的取值在区间 [l,r] 内的 L_p 问题。设 mid=\lfloor(l+r)/2\rfloor,如果我们能够知道 U 的任意一组最优解中,有哪些点是 \leq mid 的,就可以将当前问题划分成两个规模减半的子问题了。

尝试构造另一个问题。设开区间 (a,b)[l,r] 包含,且 U 的任意非空子集的 L_p 均值都不在 (a,b) 内。这个性质保证了对于任意的子问题,都存在一组最优解满足其所有元素均不在 (a,b) 中。下面给出一个引理:

solve(U,a,b) 的一组最优解为 \tilde z,且满足 \tilde z_{i}\notin (a,b),\forall i\in U。则存在 solve(U,l,r) 的一组最优解 z,使得 z_i\leq a 当且仅当 \tilde z_i=a

证明:利用反证法。由于上面的性质,显然 solve(U,a,b) 的解只有 ab 两种取值。下面把 \tilde z_i=a 的点称为 A 类点,\tilde z_i=b 的点称为 B 类点,假设存在 B 类点 i 满足 z_i\leq a。设点集 UL_p 均值为 k,分两种情况讨论:

因为 a<b,所以如果 U 中任意一点 i 选择了 b,则其后继节点也都只能选 b。那么问题就转化为了一个最小权闭合子图问题,节点 i 的权值为 w_i[(b-y_i)^p-(a-y_i)^p]。将权值取反可以转化为最大权闭合子图问题,这是一个经典的网络流模型,且可以根据残量网络构造方案。

回到原问题,考虑找到满足性质的区间 (mid,mid+\epsilon),那么就可以由 solve(U,mid,mid+\epsilon) 的最优解来确定 U 中的哪些点在原问题的最优解中是 \leq mid 的。但直接找到这样的区间比较麻烦,可能还需要跑浮点网络流,会遇到精度等一系列问题。

由于 U 的任意非空子集的 L_p 的并集是有限集,所以一定存在足够小的 \epsilon 使得区间中没有这些元素。当 \epsilon 无限趋近于 0 时,节点 i 的权值为 w_i[(mid+\epsilon-y_i)^p-(mid-y_i)^p]。把所有点的权值除以 \epsilon,最优方案不变,权值变为 w_i(mid-y_i)^pmid 处的导数。当 p=2 时,权值为 2w_i(mid-y_i),于是问题得到了完美的解决。

本题题解

题目中要求了大小关系的子集都是给定的 n 个 01 向量的极大线性无关组。所以从某一组向量中拿走一个,线性空间维数会减一,也就能再加入一个向量。因此任意两组向量之间是可以由替换元素这个操作来互相转化的,并且替换的顺序没有限制。于是我们只需要从向量组 A 的每个元素向能替换它的元素连边,向量组 B 反之,即可构造出偏序关系。然后就可以跑 L_2 问题了。

然后有个问题就是这题要求修改后的价格为整数,可以这样处理:当 r-l=1 时,仍然是答案只有两种取值的情况,因此仍可以用转化成最小闭合子图问题,相应地每个点的权值设为选 r 与选 l 的代价差即可。

代码

#include <cstdio>
#include <queue>
using namespace std;
typedef unsigned long long ull;
const int MAXN=1005;
const int INF=1E9;
namespace MF
{
    struct Edge
    {
        int from, to, cap, flow;
        Edge(int u, int v, int c, int f):
            from(u), to(v), cap(c), flow(f) {}
    };
    int n, s, t, flow;
    vector<Edge> edges;
    vector<int> g[MAXN];
    int h[MAXN], cur[MAXN];
    void init(int v, int a, int b)
    {
        n=v, s=a, t=b, flow=0;
        edges.clear();
        for (int i=1; i<=n; i++) g[i].clear();
    }
    void addEdge(int from, int to, int cap)
    {
        edges.push_back(Edge(from, to, cap, 0));
        edges.push_back(Edge(to, from, 0, 0));
        g[from].push_back(edges.size()-2);
        g[to].push_back(edges.size()-1);
    }
    bool bfs()
    {
        queue<int> q;
        for (int i=1; i<=n; i++) cur[i]=h[i]=0;
        h[s]=1, q.push(s);
        while (!q.empty())
        {
            int u=q.front(); q.pop();
            for (int i=0; i<g[u].size(); i++)
            {
                Edge e=edges[g[u][i]];
                if (e.cap>e.flow&&!h[e.to])
                    h[e.to]=h[u]+1, q.push(e.to);
            }
        }
        return h[t];
    }
    int dfs(int u, int f)
    {
        if (u==t) return f;
        for (int &i=cur[u]; i<g[u].size(); i++)
        {
            Edge &e=edges[g[u][i]];
            if (e.cap>e.flow&&h[e.to]==h[u]+1)
            {
                int d=dfs(e.to, min(f, e.cap-e.flow));
                if (d>0)
                {
                    e.flow+=d;
                    edges[g[u][i]^1].flow-=d;
                    return d;
                }
            }
        }
        return 0;
    }
    void Dinic()
    {
        while (bfs())
            while (int f=dfs(s, INF)) flow+=f;
    }
}
namespace XB
{
    ull d[64];
    void clear()
    {
        for (int i=0; i<64; i++) d[i]=0;
    }
    int insert(ull x)
    {
        for (int i=63; i>=0; i--)
            if (x&1ll<<i)
                if (d[i]) x^=d[i];
                else return d[i]=x, i;
        return -1;
    }
}
ull c[MAXN];
int w[MAXN], a[66], b[66];
int p[MAXN], q[MAXN], t1[MAXN], t2[MAXN];
int f[MAXN];
vector<int> G[MAXN];
void solve(int l, int r, int L, int R)
{
    if (l>r) return;
    if (R-L==1)
    {
        MF::init(r-l+3, r-l+2, r-l+3);
        for (int i=l; i<=r; i++) q[p[i]]=i-l+1;
        for (int i=l; i<=r; i++)
        {
            int u=p[i], cost=2*(w[u]-L)-1;
            if (cost>0) MF::addEdge(MF::s, q[u], cost);
            else MF::addEdge(q[u], MF::t, -cost);
            for (int v: G[u]) if (q[v])
                MF::addEdge(q[u], q[v], INF);
        }
        for (int i=l; i<=r; i++) q[p[i]]=0;
        MF::Dinic();
        for (int i=l; i<=r; i++)
            if (!MF::h[i-l+1]) f[p[i]]=L;
            else f[p[i]]=R;
        return;
    }
    int mid=(L+R)/2;
    MF::init(r-l+3, r-l+2, r-l+3);
    for (int i=l; i<=r; i++) q[p[i]]=i-l+1;
    for (int i=l; i<=r; i++)
    {
        int u=p[i];
        if (mid<w[u]) MF::addEdge(MF::s, q[u], w[u]-mid);
        else MF::addEdge(q[u], MF::t, mid-w[u]);
        for (int v: G[u]) if (q[v])
            MF::addEdge(q[u], q[v], INF);
    }
    for (int i=l; i<=r; i++) q[p[i]]=0;
    MF::Dinic();
    int c1=0, c2=0;
    for (int i=l; i<=r; i++)
        if (!MF::h[i-l+1]) t1[++c1]=p[i];
        else t2[++c2]=p[i];
    for (int i=1; i<=c1; i++) p[l+i-1]=t1[i];
    for (int i=1; i<=c2; i++) p[l+c1+i-1]=t2[i];
    solve(l, l+c1-1, L, mid);
    solve(l+c1, r, mid, R);
}
int main()
{
//  freopen("shop.in", "r", stdin);
//  freopen("shop.out", "w", stdout);
    int n, m;
    scanf("%d%d", &n, &m);
    for (int i=1; i<=n; i++) scanf("%llu", &c[i]);
    for (int i=1; i<=n; i++) scanf("%d", &w[i]);
    for (int i=1; i<=m; i++) scanf("%d", &a[i]);
    for (int i=1; i<=m; i++) scanf("%d", &b[i]);
    for (int i=1; i<=m; i++)
    {
        XB::clear();
        for (int j=1; j<=m; j++)
            if (j!=i) XB::insert(c[a[j]]);
        for (int j=1; j<=n; j++)
            if (j!=a[i])
            {
                int t=XB::insert(c[j]);
                if (~t) G[a[i]].push_back(j), XB::d[t]=0;
            }
    }
    for (int i=1; i<=m; i++)
    {
        XB::clear();
        for (int j=1; j<=m; j++)
            if (j!=i) XB::insert(c[b[j]]);
        for (int j=1; j<=n; j++)
            if (j!=b[i])
            {
                int t=XB::insert(c[j]);
                if (~t) G[j].push_back(b[i]), XB::d[t]=0;
            }
    }
    for (int i=1; i<=n; i++) p[i]=i;
    solve(1, n, 0, 1E6);
    ull ans=0;
    for (int i=1; i<=n; i++) ans+=1ll*(f[i]-w[i])*(f[i]-w[i]);
    printf("%llu\n", ans);
    return 0;
}