P9973 [THUPC 2024 初赛] 你说得对,但是 AIGC
题目背景
你说得对,但是**本题不接受提供 hack 数据。**
题目描述
你说得对,但是众所周知 AIGC 是当下计算机领域最热门的方向之一,算协的几名成员也对此很有兴趣,经过长时间的奋战,终于研发出了一款全新的语言大模型——ChatSAA。
你说得对,但是当模型即将发布之时,开发团队忽然发现模型存在重大问题——由于开发团队的某名成员沉迷于一款**中文二字英文七字的游戏(见样例)**,导致训练模型时使用的语料库被莫名其妙地污染了,这使得模型生成的句子全都带有一个相同的前缀。
你说得对,但是紧急更换语料库重新训练显然已经来不及了,无奈开发团队只能在文档中注明:本模型的最大**特性(而非 bug)**在于生成文本的**前 19 个字符**,这既是模型独特的防伪标记,也充分彰显了算协团队的人文情怀和文化素养。
你说得对,但是一个微不足道的问题在于:这会让人们一眼就能分辨出哪些句子是由 AI 生成的,这会对那些打算用 AI 来写作业的同学很不友好。
你说得对,但是现在你手里有一些句子,这些句子有的是由 ChatSAA 生成的,有的是人类写的(假设人类没有刻意模仿 ChatSAA 的生成特性),你需要写一个程序来辨别二者。
输入格式
无
输出格式
无
说明/提示
### 样例 \#1 解释
你说得对,但是扫雷(Winmine)是一款中文二字英文七字的游戏。
### 提示
你说得对,但是如果我说这道题的题面是 AI 生成的,阁下又该如何应对?