P6660 [POI 2019] Pisarze / 作家

题目背景

Bajtek 拿到了一些波兰文的句段,他想知道这个这个句段从哪本书来的。 **本题为数据分析题。** # 请用 C++14/C++17 提交以避免不必要的 CE。

题目描述

他找到了 $t$ 个句段,并且确定这些句段来自以下三本书 - Adama Mickiewicza 的 Pan Tadeusz - Henryka Sienkiewicza 的 Quo Vadis - Bolesława Prusa 的 Lalka 求具体来自哪一本书。

输入格式

输出格式

说明/提示

#### 样例说明 样例只截取了一部分,真正的样例见附加文件中的 sample.in 与 sample.out。 #### 数据规模与约定 **本题采用捆绑测试。** - Subtask 1(20 pts):$t \le 100$,$500 \le |s_i| \le 2000$。 - Subtask 2(20 pts):每行一定为完整的句子。 - Subtask 3(30 pts):$30 \le |s_i| \le 80$。 - Subtask 4(30 pts):无特殊限制。 对于 $100\%$ 的数据,$1 \le t \le 1000$,$10 \le |s_i| \le 2000$,$\sum|s_i| \le 2 \times 10^6$。 **本题为数据分析题。** **本题采用 Special Judge**,您不需要准确识别每一组数据,SPJ 机制如下: - 假设 $t$ 为句段数,$p$ 为您答对的句段数。 - 如果 $p \ge 0.9 \times t$,那么您就会得到 $100\%$ 的分数。 - 如果 $p \le \dfrac{t}{3}$,很遗憾,您不会得到任何分数。 - 其他情况,您会得到 $100\times \dfrac{p-\frac{t}{3}}{0.9\times t-\frac{t}{3}}\%$ 的分数。 附加文件中的 Mickiewicz.txt,Prus.txt 和 Sienkiewicz.txt 代表三段句段。 数据生成器见附加文件中的 pistestgen.py,使用 `python3 pistestgen.py subtask name directory [seed]` 来生成一组数据,其中: - grupa 代表子任务的编号,从 $1$ 到 $4$ - nazma 为数据名,将会生成在 nazma.in 与 nazma.out 中 - katalog 为这三本书的文件夹 - ziarno 用于生成同一组数据 #### 说明 翻译自 [POI 2019](https://sio2.mimuw.edu.pl/c/oi27-1/dashboard/) B [Pisarze](https://sio2.mimuw.edu.pl/c/oi27-1/p/pis/)。