我用 AI 写了一篇高考作文，才发现它测的不是文采

AI2026年6月8日0 次阅读约 12 分钟

今天高考第一天，想到学子在考场上面对这道题，我也拿得到大脑专家版跑了一遍。

今年全国I卷的作文题是这样的——

词语是表达思想情感的载体，也是展现社会生活变化的窗口。当前，世界之变、时代之变、历史之变正以前所未有的方式展开。青年是常为新的，在你的成长过程中，你对哪一个词语的理解发生了变化？这变化有你成长的印记，对你有特殊的意义……

拿到题目后，我做了一个小测试。

我直接把题目丢给AI，让它自己选一个词，直出一版。

这次测试用的是得到大脑专家版。

我没有先给它工作流，也没有提前规定文体、人设、结构和素材，只给了题目，让它直接写。

它最后选了一个词：

凭证。

这个词其实挺有意思。

它既能落到个人成长里，比如奖状、成绩单、准考证；也能往时代变化里走，比如身份、数据、算法、Token。

所以从选词上看，AI这一步并不差。

然后它开始写。

裸写版的开头是这样的——

小时候，"凭证"对我而言，是握在手里的东西。我还记得小学时把三好学生的奖状贴在卧室墙上，用手掌把边角压平，那种踏实感仿佛在说：世界终于盖章认了我。我一度以为，凭证就是那些能被装进档案袋的纸张，盖章为证，白纸黑字，谁也拿不走。

坦白说，这个开头不差。

有画面，有个人记忆，也有一句挺准的表达：

世界终于盖章认了我。

如果只是看这一段，你会觉得：可以啊，AI这不是挺会写的吗？

但继续往后看，问题开始出现。

它很快开始调动素材：

苏美尔泥板。

雅浦岛石币。

柯林斯《文凭社会》。

固定思维和成长思维。

这些素材单独看都能和"凭证"发生关系。

但它们挤在同一篇800字作文里，就变成了一种很典型的AI写作症状：

知道很多，但没有一个真正打透。

尤其是这一段——

柯林斯在《文凭社会》中一针见血：大型组织看重文凭，实际上是在打着公平的旗号，也在无形中把某些人排除在晋升通道之外。

这句话当然有道理。

但一个正在高考考场里写作文的高中生，突然这么稳定地调用柯林斯、文凭社会、晋升通道、固定思维、成长思维，我会有点出戏。

不是说高中生不能懂这些。

而是这个人不见了。

他现在坐在哪里？

他为什么想到"凭证"？

他害怕什么？

他困惑什么？

这个词到底怎么改变了他？

这些东西在裸写版里没有真正出现。

它写得很顺，但没有活人感。

或者更准确地说：它像一篇知识型议论文，不像一个人在考场里写作文。

这就是AI裸写最容易出现的问题。

它不是不会写。

它太会写了。

它会迅速选择一条安全路径：

先写生活经验。

再写历史素材。

再写社会分析。

最后价值升华。

看起来很完整。

但它在写作的同时，把所有决策都混在一起做完了。

文体怎么定？默认议论文。

人设是谁？默认是一个成熟的讲道理者。

素材怎么选？能想到的都塞一点。

语气怎么拿？总结、拔高、金句感。

结尾怎么收？从"外在凭证"一步跳到"内在确信"。

每个选择都还行。

但每个选择都没有真正到位。

所以这篇文章的问题，不是文笔。

问题是：AI在写的时候，也在替我做决定。

而这些决定，本来应该在写之前完成。

裸写版的问题让我想了一阵——到底是AI不行，还是我用AI的方式有问题？

后来我看到Claude Code的工作方式，才理解这件事。

Claude Code有个plan mode——让AI先进入只读状态，只看不动手，把问题拆清楚、把计划写出来，等人确认了再执行。官方文档里的说法很直接：对于你想先审查、再落盘修改的任务，可以切到plan mode；Claude会先读取文件、提出计划，在你批准之前不会直接编辑。

这不是为了让AI变慢。而是为了避免它太快。

Anthropic 2026年的Agentic Coding Trends Report里也有一个很有意思的数据：开发者大约在60%的工作中使用AI，但真正能完全委托给AI的任务只有0–20%。报告也强调，有效使用AI仍然需要设置、监督、验证和人的判断。

这和写作很像。

AI不是把人的判断拿走了。

它只是把人的判断推到了更前面。

如果你不提前判断，AI就会替你判断。

而它替你做出的判断，通常都很安全、很顺滑、很平均。

所以我没有继续润色那篇裸写版。

因为润色解决不了这个问题。

它真正缺的不是更漂亮的句子，而是写之前的几个决定。

于是我又做了一次尝试。

这次，我先让"赵选题"写一张Plan卡。

不是让它直接写作文。

而是先把这篇作文最关键的几个选择做完。

谁在说话？

写给谁？

为什么此刻要写？

哪些素材能进来？

哪些素材必须舍掉？

这篇文章的变化路径是什么？

最后得到这样一张Plan卡——

这张卡看起来像大纲，但它不是大纲。

大纲解决的是：第一段写什么，第二段写什么，第三段写什么。

Plan解决的是：哪些选择必须在写之前完成。

有了这张卡，后面的"李文章"不需要再临场决定：

我要不要写成议论文？

我要不要引用柯林斯？

我要不要再塞一个雅浦岛石币？

我要不要突然讲成长思维？

我要用什么口吻说话？

这些选择已经提前做完了。

它只需要执行。

然后我让AI按照这张Plan卡重新写一版。

这次开头变成了这样——

四年后的我：你好。此刻我坐在高考的考场上，作文题问的是"你对哪一个词语的理解发生了变化"。我低头看了一眼桌面——准考证、身份证、答题卡上的条形码、座位号。忽然觉得有点奇怪：今天我带进考场的所有东西，都是为了证明"我是我"。而我正在写的这篇作文，大概也会变成另一种凭证吧。

这一段出来的时候，我觉得方向对了。

因为"凭证"终于不再只是一个概念。

它变成了桌面上的东西。

准考证。

身份证。

答题卡。

条形码。

座位号。

这些东西不需要解释。

每一个经历过考试的人，都知道那种感觉：你坐在那里，桌面上所有东西都在确认"你可以坐在这里"。

但它们也在提醒你：你正在被识别、编号、记录、评价。

这个词终于落回了考场。

后面写到苏美尔泥球的时候，它没有像裸写版那样继续铺知识，而是把素材放在了认知转折的位置。

直到翻到一篇文章，说五千年前苏美尔人用泥块记账——把代表不同货物的泥块装进球里密封起来，球面上按压出里面泥块的形状。这样不用拆开，看球面就能核对交易了多少。那层泥壳，就是人类最早的凭证之一。我愣了一下。原来凭证不只是别人"发"给我的东西，它从那么早的时候就开始了，是人类用来保存承诺、交换信任的方式。它有自己的历史，比我手里的奖状古老得多。原来凭证是人造的。那我是被造的那个，还是造的那个？

"那我是被造的那个，还是造的那个？"

这句话不算特别圆润。

但我觉得它有用。

因为它没有急着把道理说完。

它留下了一个高中生正在想问题的状态。

裸写版的状态是：我已经知道答案了，所以我来告诉你。

Plan版的状态是：我还没完全想明白，但我正在想。

这个差异很重要。

到后面，它没有继续堆材料，而是回到了两个很小的日常片段。

上学期我帮同桌讲懂了一道数学题，他说明白的那一刻，我知道我会了。没有人给我盖章，没有分数记录，但那一刻是真实的。还有那些晚上，想不清楚事情的时候，我就去操场跑步，一圈又一圈，不知不觉跑了十几圈。我没有参加长跑队，也不知道自己干嘛要跑，只是想把那种拧巴给跑掉。这算不算凭证？

这段没有第一篇那么"漂亮"。

但它把人带回来了。

它没有说：真正的凭证在心里。

它只是说：

我讲懂了一道题。

我跑了十几圈。

我把那种拧巴跑掉了一点。

没人给我盖章，但那一刻是真的。

这就够了。

最后它收在这里——

此刻坐在高考的考场上，这张试卷也是一张凭证。但我知道它不是唯一的凭证了。四年后的你读到这封信，大概会觉得此刻的我还是没想太明白——但至少，比刚拿到题目的时候，清楚了一点。

这不是满分作文式的结尾。

它没有彻底升华，也没有喊口号。

但我反而觉得，这句话很适合这次实验。

因为一个好的Plan，不一定让你立刻完美。它只是让你从混乱里清楚一点。

我让三个AI分别打了分——

评分方	直出版	Plan版
ChatGPT	52	54
DeepSeek	58	54
Claude	55	53

分数很接近，没有绝对高低。ChatGPT给了Plan版略高，DeepSeek和Claude反而给了裸写版更高。

有意思的是Claude的评语——它说Plan版"真实、细腻、现场感强，更有一类高分相"，裸写版"成熟、思辨、概念感强，但个人成长印记不足"。它看出了差异，但DeepSeek按结构完整度给了裸写版更高的分。

这反而说明了一件事：分数高低不是重点。重点是两版写出来的东西，风格完全不同。 同样的题目、同样的素材池，裸写版四平八稳，Plan版有人味有挣扎。三个AI的分数咬得很紧，但它们对"哪篇更像真的人在写"的判断完全不一样。

把两版放在一起看，差异就更清楚了。

维度	直出版	Plan版
文体	默认议论文	写给四年后自己的信
人设	成熟的知识型叙述者	正在考场里的高中生
对象	面向阅卷者讲道理	面向未来的自己确认一件事
素材	苏美尔、雅浦岛、柯林斯、成长思维一起上	准考证/答题卡、苏美尔泥球、日常经验
翻转	从"外在凭证"直接到"内在确信"	从被凭证定义，到开始寻找自己的凭证
效果	顺滑，但人不在里面	不完美，但有处境

这也是我重新理解"写作天团"的地方。

赵选题不是装饰。

张素材不是资料员。

李文章也不是万能写手。

它们真正的分工应该是：

赵选题负责把题目变成可执行判断。

张素材负责让素材服从判断，而不是把素材堆满。

李文章负责执行，不负责临场发散。

很多时候，我们用AI写作失败，不是因为AI不会写。

是因为我们把所有事情都丢给了同一个动作：

写。

结果AI当然能写完。

但它写完的是一堆默认选择的集合。

这次实验最后给我的结论，不是：

AI能不能写高考作文。

也不是：

AI能不能写出满分作文。

而是另一个更实际的判断：

在限时写作里，最关键的不是后面怎么改，而是前面有没有把决定做完。

后来我想，为什么"凭证"这个词会适合这次实验？

因为这场实验本身，也像是在问同一个问题：

当AI已经可以写出一篇顺滑的文章时，什么还能证明这是"我"的写作？

不是更漂亮的句子。

也不是更多的素材。

而是开写之前那些看不见的决定。

我让谁说话。

我让他说给谁听。

我把哪些素材留下。

我把哪些素材舍掉。

我决定保留那个高中生的困惑，而不是替他过早想明白。

这些决定，才是人留在文章里的凭证。

所以在AI可以生成文字的时代，真正稀缺的，可能不再是把话写出来的能力。

而是开写之前，知道自己为什么这样写的能力。

高考作文如此。

公众号如此。

方案、邮件、脚本，甚至很多人生里的判断，也差不多如此。

继续阅读

基于全文检索与主题相似度

AI工具2026年6月4日

我用 AI 写了一篇高考作文，才发现它测的不是文采

继续阅读

# 我花2999买了个AI编辑部，结果发现缺的是主编

AI时代，越有经验的人，为什么越不敢开始？

日更第10天，难的不是写，别把'更'锁死成一种形式