主要是来提供一种常数较小的写法，讲解部分略去考虑最后的 DP 式子分为两部分： $$ \begin{aligned}f_{i,S}&\gets\min_{T\subseteq S}(f_{i,T}+f_{i,S\setminus T})\\f_{i,S}&\gets f_{j,S}+w(i,j)\end{aligned} $$ 大部分人就按照如上形式进行转移，但是这样常数很大，因为 **数组访问不连续**。在第一种转移的时候，内层枚举子集很不连续；在求最短路的时候，同样很不连续。为了访问连续，一个想法就是交换数组两维。同时在第一种转移的时候，先枚举子集再枚举 $i$，这样数组访问就很连续了；在求最短路时，所有转移都在 $f_{S}$ 中，比之前全部第二维为 $S$ 快多了。另一个优化是当 $T void checkmax(T &x, T y) { if (x < y) x = y; } template void checkmin(T &x, T y) { if (x > y) x = y; } int n, m, k, dp[1024][101]; std::vector> g[101]; bool vis[101]; void Spfa(int S) { std::queue q; for (int i = 0; i < n; i++) if (dp[S][i] != 0x3f3f3f3f) q.emplace(i), vis[i] = true; while (!q.empty()) { int u = q.front(); q.pop(), vis[u] = false; for (auto &&[v, w] : g[u]) if (dp[S][u] + w < dp[S][v]) { dp[S][v] = dp[S][u] + w; if (!vis[v]) q.emplace(v), vis[v] = true; } } } int main(int argc, char const *argv[]) { std::ios_base::sync_with_stdio(false); std::cin.tie(nullptr), std::cout.tie(nullptr); std::cin >> n >> m >> k; for (int i = 1; i <= m; i++) { int u, v, w; std::cin >> u >> v >> w, u--, v--; g[u].emplace_back(v, w), g[v].emplace_back(u, w); } std::memset(dp, 0x3f, sizeof(dp)); for (int i = 0; i < k; i++) { int x; std::cin >> x, x--; dp[1 << i][x] = 0; } for (int S = 1; S < (1 << k); S++) { for (int T = S & (S - 1); T; T = (T - 1) & S) { if (T < (S ^ T)) break; for (int i = 0; i < n; i++) checkmin(dp[S][i], dp[T][i] + dp[T ^ S][i]); } Spfa(S); } std::cout << *std::min_element(dp[(1 << k) - 1], dp[(1 << k) - 1] + n); return 0; } ```