我用 AI 写了一篇高考作文,才发现它测的不是文采

AI0 次阅读12 分钟

今天高考第一天,想到学子在考场上面对这道题,我也拿得到大脑专家版跑了一遍。

今年全国I卷的作文题是这样的——

词语是表达思想情感的载体,也是展现社会生活变化的窗口。当前,世界之变、时代之变、历史之变正以前所未有的方式展开。青年是常为新的,在你的成长过程中,你对哪一个词语的理解发生了变化?这变化有你成长的印记,对你有特殊的意义……

拿到题目后,我做了一个小测试。

我直接把题目丢给AI,让它自己选一个词,直出一版。

这次测试用的是得到大脑专家版。

我没有先给它工作流,也没有提前规定文体、人设、结构和素材,只给了题目,让它直接写。

它最后选了一个词:

凭证。

这个词其实挺有意思。

它既能落到个人成长里,比如奖状、成绩单、准考证;也能往时代变化里走,比如身份、数据、算法、Token。

所以从选词上看,AI这一步并不差。

然后它开始写。

裸写版的开头是这样的——

小时候,"凭证"对我而言,是握在手里的东西。我还记得小学时把三好学生的奖状贴在卧室墙上,用手掌把边角压平,那种踏实感仿佛在说:世界终于盖章认了我。我一度以为,凭证就是那些能被装进档案袋的纸张,盖章为证,白纸黑字,谁也拿不走。

坦白说,这个开头不差。

有画面,有个人记忆,也有一句挺准的表达:

世界终于盖章认了我。

如果只是看这一段,你会觉得:可以啊,AI这不是挺会写的吗?

但继续往后看,问题开始出现。

它很快开始调动素材:


苏美尔泥板。

雅浦岛石币。

柯林斯《文凭社会》。

固定思维和成长思维。


这些素材单独看都能和"凭证"发生关系。

但它们挤在同一篇800字作文里,就变成了一种很典型的AI写作症状:

知道很多,但没有一个真正打透。

尤其是这一段——

柯林斯在《文凭社会》中一针见血:大型组织看重文凭,实际上是在打着公平的旗号,也在无形中把某些人排除在晋升通道之外。

这句话当然有道理。

但一个正在高考考场里写作文的高中生,突然这么稳定地调用柯林斯、文凭社会、晋升通道、固定思维、成长思维,我会有点出戏。

不是说高中生不能懂这些。

而是这个人不见了。

他现在坐在哪里?

他为什么想到"凭证"?

他害怕什么?

他困惑什么?

这个词到底怎么改变了他?

这些东西在裸写版里没有真正出现。

它写得很顺,但没有活人感

或者更准确地说:它像一篇知识型议论文,不像一个人在考场里写作文。

这就是AI裸写最容易出现的问题。

它不是不会写。

它太会写了。

它会迅速选择一条安全路径:


先写生活经验。

再写历史素材。

再写社会分析。

最后价值升华。


看起来很完整。

但它在写作的同时,把所有决策都混在一起做完了。


文体怎么定?默认议论文。

人设是谁?默认是一个成熟的讲道理者。

素材怎么选?能想到的都塞一点。

语气怎么拿?总结、拔高、金句感。

结尾怎么收?从"外在凭证"一步跳到"内在确信"。


每个选择都还行。

但每个选择都没有真正到位。

所以这篇文章的问题,不是文笔。

问题是:AI在写的时候,也在替我做决定。

而这些决定,本来应该在写之前完成。

裸写版的问题让我想了一阵——到底是AI不行,还是我用AI的方式有问题?

后来我看到Claude Code的工作方式,才理解这件事。

Claude Code有个plan mode——让AI先进入只读状态,只看不动手,把问题拆清楚、把计划写出来,等人确认了再执行。官方文档里的说法很直接:对于你想先审查、再落盘修改的任务,可以切到plan mode;Claude会先读取文件、提出计划,在你批准之前不会直接编辑。

这不是为了让AI变慢。而是为了避免它太快。

Anthropic 2026年的Agentic Coding Trends Report里也有一个很有意思的数据:开发者大约在60%的工作中使用AI,但真正能完全委托给AI的任务只有0–20%。报告也强调,有效使用AI仍然需要设置、监督、验证和人的判断。

这和写作很像。

AI不是把人的判断拿走了。

它只是把人的判断推到了更前面。

如果你不提前判断,AI就会替你判断。

而它替你做出的判断,通常都很安全、很顺滑、很平均。

所以我没有继续润色那篇裸写版。

因为润色解决不了这个问题。

它真正缺的不是更漂亮的句子,而是写之前的几个决定。

于是我又做了一次尝试。

这次,我先让"赵选题"写一张Plan卡。

不是让它直接写作文。

而是先把这篇作文最关键的几个选择做完。

谁在说话?

写给谁?

为什么此刻要写?

哪些素材能进来?

哪些素材必须舍掉?

这篇文章的变化路径是什么?

最后得到这样一张Plan卡——

image.png

这张卡看起来像大纲,但它不是大纲。

大纲解决的是:第一段写什么,第二段写什么,第三段写什么。

Plan解决的是:哪些选择必须在写之前完成。

有了这张卡,后面的"李文章"不需要再临场决定:

我要不要写成议论文?

我要不要引用柯林斯?

我要不要再塞一个雅浦岛石币?

我要不要突然讲成长思维?

我要用什么口吻说话?

这些选择已经提前做完了。

它只需要执行。

然后我让AI按照这张Plan卡重新写一版。

这次开头变成了这样——

四年后的我:你好。此刻我坐在高考的考场上,作文题问的是"你对哪一个词语的理解发生了变化"。我低头看了一眼桌面——准考证、身份证、答题卡上的条形码、座位号。忽然觉得有点奇怪:今天我带进考场的所有东西,都是为了证明"我是我"。而我正在写的这篇作文,大概也会变成另一种凭证吧。

这一段出来的时候,我觉得方向对了。

因为"凭证"终于不再只是一个概念。

它变成了桌面上的东西。

准考证。

身份证。

答题卡。

条形码。

座位号。

这些东西不需要解释。

每一个经历过考试的人,都知道那种感觉:你坐在那里,桌面上所有东西都在确认"你可以坐在这里"。

但它们也在提醒你:你正在被识别、编号、记录、评价。

这个词终于落回了考场。

后面写到苏美尔泥球的时候,它没有像裸写版那样继续铺知识,而是把素材放在了认知转折的位置。

直到翻到一篇文章,说五千年前苏美尔人用泥块记账——把代表不同货物的泥块装进球里密封起来,球面上按压出里面泥块的形状。这样不用拆开,看球面就能核对交易了多少。那层泥壳,就是人类最早的凭证之一。我愣了一下。原来凭证不只是别人"发"给我的东西,它从那么早的时候就开始了,是人类用来保存承诺、交换信任的方式。它有自己的历史,比我手里的奖状古老得多。原来凭证是人造的。那我是被造的那个,还是造的那个?

"那我是被造的那个,还是造的那个?"

这句话不算特别圆润。

但我觉得它有用。

因为它没有急着把道理说完。

它留下了一个高中生正在想问题的状态。

裸写版的状态是:我已经知道答案了,所以我来告诉你。

Plan版的状态是:我还没完全想明白,但我正在想。

这个差异很重要。

到后面,它没有继续堆材料,而是回到了两个很小的日常片段。

上学期我帮同桌讲懂了一道数学题,他说明白的那一刻,我知道我会了。没有人给我盖章,没有分数记录,但那一刻是真实的。还有那些晚上,想不清楚事情的时候,我就去操场跑步,一圈又一圈,不知不觉跑了十几圈。我没有参加长跑队,也不知道自己干嘛要跑,只是想把那种拧巴给跑掉。这算不算凭证?

这段没有第一篇那么"漂亮"。

但它把人带回来了。

它没有说:真正的凭证在心里。

它只是说:

我讲懂了一道题。

我跑了十几圈。

我把那种拧巴跑掉了一点。

没人给我盖章,但那一刻是真的。

这就够了。

最后它收在这里——

此刻坐在高考的考场上,这张试卷也是一张凭证。但我知道它不是唯一的凭证了。四年后的你读到这封信,大概会觉得此刻的我还是没想太明白——但至少,比刚拿到题目的时候,清楚了一点。

这不是满分作文式的结尾。

它没有彻底升华,也没有喊口号。

但我反而觉得,这句话很适合这次实验。

因为一个好的Plan,不一定让你立刻完美。它只是让你从混乱里清楚一点。

我让三个AI分别打了分——

评分方

直出版

Plan版

ChatGPT

52

54

DeepSeek

58

54

Claude

55

53

分数很接近,没有绝对高低。ChatGPT给了Plan版略高,DeepSeek和Claude反而给了裸写版更高。

有意思的是Claude的评语——它说Plan版"真实、细腻、现场感强,更有一类高分相",裸写版"成熟、思辨、概念感强,但个人成长印记不足"。它看出了差异,但DeepSeek按结构完整度给了裸写版更高的分。

这反而说明了一件事:分数高低不是重点。重点是两版写出来的东西,风格完全不同。 同样的题目、同样的素材池,裸写版四平八稳,Plan版有人味有挣扎。三个AI的分数咬得很紧,但它们对"哪篇更像真的人在写"的判断完全不一样。

把两版放在一起看,差异就更清楚了。

维度

直出版

Plan版

文体

默认议论文

写给四年后自己的信

人设

成熟的知识型叙述者

正在考场里的高中生

对象

面向阅卷者讲道理

面向未来的自己确认一件事

素材

苏美尔、雅浦岛、柯林斯、成长思维一起上

准考证/答题卡、苏美尔泥球、日常经验

翻转

从"外在凭证"直接到"内在确信"

从被凭证定义,到开始寻找自己的凭证

效果

顺滑,但人不在里面

不完美,但有处境

这也是我重新理解"写作天团"的地方。

赵选题不是装饰。

张素材不是资料员。

李文章也不是万能写手。

它们真正的分工应该是:

赵选题负责把题目变成可执行判断。

张素材负责让素材服从判断,而不是把素材堆满。

李文章负责执行,不负责临场发散。

很多时候,我们用AI写作失败,不是因为AI不会写。

是因为我们把所有事情都丢给了同一个动作:

写。

结果AI当然能写完。

但它写完的是一堆默认选择的集合。

这次实验最后给我的结论,不是:

AI能不能写高考作文。

也不是:

AI能不能写出满分作文。

而是另一个更实际的判断:

在限时写作里,最关键的不是后面怎么改,而是前面有没有把决定做完。

后来我想,为什么"凭证"这个词会适合这次实验?

因为这场实验本身,也像是在问同一个问题:

当AI已经可以写出一篇顺滑的文章时,什么还能证明这是"我"的写作?

不是更漂亮的句子。

也不是更多的素材。

而是开写之前那些看不见的决定。

我让谁说话。

我让他说给谁听。

我把哪些素材留下。

我把哪些素材舍掉。

我决定保留那个高中生的困惑,而不是替他过早想明白。

这些决定,才是人留在文章里的凭证。

所以在AI可以生成文字的时代,真正稀缺的,可能不再是把话写出来的能力。

而是开写之前,知道自己为什么这样写的能力。

高考作文如此。

公众号如此。

方案、邮件、脚本,甚至很多人生里的判断,也差不多如此。


继续阅读

基于全文检索与主题相似度

AI工具

# 我花2999买了个AI编辑部,结果发现缺的是主编

得到大脑专家版 · 8天真实体验反馈 我用得到大脑专家版写了7篇文章,前两篇我偷懒了——默认让AI做,自己不怎么管。出来的东西"神似而形不似",看上去像我会写的文章,但里面的判断不是我的,节奏不是我的,真正的钩子也不在。 后来我每篇都盯,每段都审,甚至自己推翻重来。最大的感受不是"AI太会写了",而是:我好像突然变成了

浅思录

AI时代,越有经验的人,为什么越不敢开始?

罗振宇的视频日记日更到了第100天。一百天前他开始每天录一条,刚好在儿童节这天到了节点。得到大脑首批专家版会员受邀来参加开放日活动,他做了场直播,请大家来一起过节,顺便一起唠唠嗑。 三个多小时,聊的是"AI时代,我们怎么写作"。 但真正让我坐直的,不是他讲AI怎么帮你写东西——而是互动环节里有人问了一个问题: "怎么知

浅思录

日更第10天,难的不是写,别把'更'锁死成一种形式

日更群里有人说:"最近三天可能要退出日更了,从早上9点到晚上9点都要上课。如果大家有更好高效写文的方式,求分享🙏" 我盯着这条消息想了一会。 对方问的是"怎么写更快",不是"能不能换个形式"。这本身就是个信号——我们默认日更就是写文章,写不动了,第一反应是提速,不是换路。 日更的"更"被我们理解成了"文章" 日更群里