P6660 [POI 2019] Pisarze / 作家

题目背景

Bajtek 拿到了一些波兰文的句段，他想知道这个这个句段从哪本书来的。 **本题为数据分析题。** # 请用 C++14/C++17 提交以避免不必要的 CE。

题目描述

他找到了 $t$ 个句段，并且确定这些句段来自以下三本书 - Adama Mickiewicza 的 Pan Tadeusz - Henryka Sienkiewicza 的 Quo Vadis - Bolesława Prusa 的 Lalka 求具体来自哪一本书。

输入格式

无

输出格式

无

说明/提示

#### 样例说明样例只截取了一部分，真正的样例见附加文件中的 sample.in 与 sample.out。 #### 数据规模与约定 **本题采用捆绑测试。** - Subtask 1（20 pts）：$t \le 100$，$500 \le |s_i| \le 2000$。 - Subtask 2（20 pts）：每行一定为完整的句子。 - Subtask 3（30 pts）：$30 \le |s_i| \le 80$。 - Subtask 4（30 pts）：无特殊限制。对于 $100\%$ 的数据，$1 \le t \le 1000$，$10 \le |s_i| \le 2000$，$\sum|s_i| \le 2 \times 10^6$。 **本题为数据分析题。** **本题采用 Special Judge**，您不需要准确识别每一组数据，SPJ 机制如下： - 假设 $t$ 为句段数，$p$ 为您答对的句段数。 - 如果 $p \ge 0.9 \times t$，那么您就会得到 $100\%$ 的分数。 - 如果 $p \le \dfrac{t}{3}$，很遗憾，您不会得到任何分数。 - 其他情况，您会得到 $100\times \dfrac{p-\frac{t}{3}}{0.9\times t-\frac{t}{3}}\%$ 的分数。附加文件中的 Mickiewicz.txt，Prus.txt 和 Sienkiewicz.txt 代表三段句段。数据生成器见附加文件中的 pistestgen.py，使用 `python3 pistestgen.py subtask name directory [seed]` 来生成一组数据，其中： - grupa 代表子任务的编号，从 $1$ 到 $4$ - nazma 为数据名，将会生成在 nazma.in 与 nazma.out 中 - katalog 为这三本书的文件夹 - ziarno 用于生成同一组数据 #### 说明翻译自 [POI 2019](https://sio2.mimuw.edu.pl/c/oi27-1/dashboard/) B [Pisarze](https://sio2.mimuw.edu.pl/c/oi27-1/p/pis/)。