我用 AI 写了一篇高考作文,才发现它测的不是文采
今天高考第一天,想到学子在考场上面对这道题,我也拿得到大脑专家版跑了一遍。
今年全国I卷的作文题是这样的——
词语是表达思想情感的载体,也是展现社会生活变化的窗口。当前,世界之变、时代之变、历史之变正以前所未有的方式展开。青年是常为新的,在你的成长过程中,你对哪一个词语的理解发生了变化?这变化有你成长的印记,对你有特殊的意义……
拿到题目后,我做了一个小测试。
我直接把题目丢给AI,让它自己选一个词,直出一版。
这次测试用的是得到大脑专家版。
我没有先给它工作流,也没有提前规定文体、人设、结构和素材,只给了题目,让它直接写。
它最后选了一个词:
凭证。
这个词其实挺有意思。
它既能落到个人成长里,比如奖状、成绩单、准考证;也能往时代变化里走,比如身份、数据、算法、Token。
所以从选词上看,AI这一步并不差。
然后它开始写。
裸写版的开头是这样的——
小时候,"凭证"对我而言,是握在手里的东西。我还记得小学时把三好学生的奖状贴在卧室墙上,用手掌把边角压平,那种踏实感仿佛在说:世界终于盖章认了我。我一度以为,凭证就是那些能被装进档案袋的纸张,盖章为证,白纸黑字,谁也拿不走。
坦白说,这个开头不差。
有画面,有个人记忆,也有一句挺准的表达:
世界终于盖章认了我。
如果只是看这一段,你会觉得:可以啊,AI这不是挺会写的吗?
但继续往后看,问题开始出现。
它很快开始调动素材:
苏美尔泥板。
雅浦岛石币。
柯林斯《文凭社会》。
固定思维和成长思维。
这些素材单独看都能和"凭证"发生关系。
但它们挤在同一篇800字作文里,就变成了一种很典型的AI写作症状:
知道很多,但没有一个真正打透。
尤其是这一段——
柯林斯在《文凭社会》中一针见血:大型组织看重文凭,实际上是在打着公平的旗号,也在无形中把某些人排除在晋升通道之外。
这句话当然有道理。
但一个正在高考考场里写作文的高中生,突然这么稳定地调用柯林斯、文凭社会、晋升通道、固定思维、成长思维,我会有点出戏。
不是说高中生不能懂这些。
而是这个人不见了。
他现在坐在哪里?
他为什么想到"凭证"?
他害怕什么?
他困惑什么?
这个词到底怎么改变了他?
这些东西在裸写版里没有真正出现。
它写得很顺,但没有活人感。
或者更准确地说:它像一篇知识型议论文,不像一个人在考场里写作文。
这就是AI裸写最容易出现的问题。
它不是不会写。
它太会写了。
它会迅速选择一条安全路径:
先写生活经验。
再写历史素材。
再写社会分析。
最后价值升华。
看起来很完整。
但它在写作的同时,把所有决策都混在一起做完了。
文体怎么定?默认议论文。
人设是谁?默认是一个成熟的讲道理者。
素材怎么选?能想到的都塞一点。
语气怎么拿?总结、拔高、金句感。
结尾怎么收?从"外在凭证"一步跳到"内在确信"。
每个选择都还行。
但每个选择都没有真正到位。
所以这篇文章的问题,不是文笔。
问题是:AI在写的时候,也在替我做决定。
而这些决定,本来应该在写之前完成。
裸写版的问题让我想了一阵——到底是AI不行,还是我用AI的方式有问题?
后来我看到Claude Code的工作方式,才理解这件事。
Claude Code有个plan mode——让AI先进入只读状态,只看不动手,把问题拆清楚、把计划写出来,等人确认了再执行。官方文档里的说法很直接:对于你想先审查、再落盘修改的任务,可以切到plan mode;Claude会先读取文件、提出计划,在你批准之前不会直接编辑。
这不是为了让AI变慢。而是为了避免它太快。
Anthropic 2026年的Agentic Coding Trends Report里也有一个很有意思的数据:开发者大约在60%的工作中使用AI,但真正能完全委托给AI的任务只有0–20%。报告也强调,有效使用AI仍然需要设置、监督、验证和人的判断。
这和写作很像。
AI不是把人的判断拿走了。
它只是把人的判断推到了更前面。
如果你不提前判断,AI就会替你判断。
而它替你做出的判断,通常都很安全、很顺滑、很平均。
所以我没有继续润色那篇裸写版。
因为润色解决不了这个问题。
它真正缺的不是更漂亮的句子,而是写之前的几个决定。
于是我又做了一次尝试。
这次,我先让"赵选题"写一张Plan卡。
不是让它直接写作文。
而是先把这篇作文最关键的几个选择做完。
谁在说话?
写给谁?
为什么此刻要写?
哪些素材能进来?
哪些素材必须舍掉?
这篇文章的变化路径是什么?
最后得到这样一张Plan卡——

这张卡看起来像大纲,但它不是大纲。
大纲解决的是:第一段写什么,第二段写什么,第三段写什么。
Plan解决的是:哪些选择必须在写之前完成。
有了这张卡,后面的"李文章"不需要再临场决定:
我要不要写成议论文?
我要不要引用柯林斯?
我要不要再塞一个雅浦岛石币?
我要不要突然讲成长思维?
我要用什么口吻说话?
这些选择已经提前做完了。
它只需要执行。
然后我让AI按照这张Plan卡重新写一版。
这次开头变成了这样——
四年后的我:你好。此刻我坐在高考的考场上,作文题问的是"你对哪一个词语的理解发生了变化"。我低头看了一眼桌面——准考证、身份证、答题卡上的条形码、座位号。忽然觉得有点奇怪:今天我带进考场的所有东西,都是为了证明"我是我"。而我正在写的这篇作文,大概也会变成另一种凭证吧。
这一段出来的时候,我觉得方向对了。
因为"凭证"终于不再只是一个概念。
它变成了桌面上的东西。
准考证。
身份证。
答题卡。
条形码。
座位号。
这些东西不需要解释。
每一个经历过考试的人,都知道那种感觉:你坐在那里,桌面上所有东西都在确认"你可以坐在这里"。
但它们也在提醒你:你正在被识别、编号、记录、评价。
这个词终于落回了考场。
后面写到苏美尔泥球的时候,它没有像裸写版那样继续铺知识,而是把素材放在了认知转折的位置。
直到翻到一篇文章,说五千年前苏美尔人用泥块记账——把代表不同货物的泥块装进球里密封起来,球面上按压出里面泥块的形状。这样不用拆开,看球面就能核对交易了多少。那层泥壳,就是人类最早的凭证之一。我愣了一下。原来凭证不只是别人"发"给我的东西,它从那么早的时候就开始了,是人类用来保存承诺、交换信任的方式。它有自己的历史,比我手里的奖状古老得多。原来凭证是人造的。那我是被造的那个,还是造的那个?
"那我是被造的那个,还是造的那个?"
这句话不算特别圆润。
但我觉得它有用。
因为它没有急着把道理说完。
它留下了一个高中生正在想问题的状态。
裸写版的状态是:我已经知道答案了,所以我来告诉你。
Plan版的状态是:我还没完全想明白,但我正在想。
这个差异很重要。
到后面,它没有继续堆材料,而是回到了两个很小的日常片段。
上学期我帮同桌讲懂了一道数学题,他说明白的那一刻,我知道我会了。没有人给我盖章,没有分数记录,但那一刻是真实的。还有那些晚上,想不清楚事情的时候,我就去操场跑步,一圈又一圈,不知不觉跑了十几圈。我没有参加长跑队,也不知道自己干嘛要跑,只是想把那种拧巴给跑掉。这算不算凭证?
这段没有第一篇那么"漂亮"。
但它把人带回来了。
它没有说:真正的凭证在心里。
它只是说:
我讲懂了一道题。
我跑了十几圈。
我把那种拧巴跑掉了一点。
没人给我盖章,但那一刻是真的。
这就够了。
最后它收在这里——
此刻坐在高考的考场上,这张试卷也是一张凭证。但我知道它不是唯一的凭证了。四年后的你读到这封信,大概会觉得此刻的我还是没想太明白——但至少,比刚拿到题目的时候,清楚了一点。
这不是满分作文式的结尾。
它没有彻底升华,也没有喊口号。
但我反而觉得,这句话很适合这次实验。
因为一个好的Plan,不一定让你立刻完美。它只是让你从混乱里清楚一点。
我让三个AI分别打了分——
评分方 | 直出版 | Plan版 |
|---|---|---|
ChatGPT | 52 | 54 |
DeepSeek | 58 | 54 |
Claude | 55 | 53 |
分数很接近,没有绝对高低。ChatGPT给了Plan版略高,DeepSeek和Claude反而给了裸写版更高。
有意思的是Claude的评语——它说Plan版"真实、细腻、现场感强,更有一类高分相",裸写版"成熟、思辨、概念感强,但个人成长印记不足"。它看出了差异,但DeepSeek按结构完整度给了裸写版更高的分。
这反而说明了一件事:分数高低不是重点。重点是两版写出来的东西,风格完全不同。 同样的题目、同样的素材池,裸写版四平八稳,Plan版有人味有挣扎。三个AI的分数咬得很紧,但它们对"哪篇更像真的人在写"的判断完全不一样。
把两版放在一起看,差异就更清楚了。
维度 | 直出版 | Plan版 |
|---|---|---|
文体 | 默认议论文 | 写给四年后自己的信 |
人设 | 成熟的知识型叙述者 | 正在考场里的高中生 |
对象 | 面向阅卷者讲道理 | 面向未来的自己确认一件事 |
素材 | 苏美尔、雅浦岛、柯林斯、成长思维一起上 | 准考证/答题卡、苏美尔泥球、日常经验 |
翻转 | 从"外在凭证"直接到"内在确信" | 从被凭证定义,到开始寻找自己的凭证 |
效果 | 顺滑,但人不在里面 | 不完美,但有处境 |
这也是我重新理解"写作天团"的地方。
赵选题不是装饰。
张素材不是资料员。
李文章也不是万能写手。
它们真正的分工应该是:
赵选题负责把题目变成可执行判断。
张素材负责让素材服从判断,而不是把素材堆满。
李文章负责执行,不负责临场发散。
很多时候,我们用AI写作失败,不是因为AI不会写。
是因为我们把所有事情都丢给了同一个动作:
写。
结果AI当然能写完。
但它写完的是一堆默认选择的集合。
这次实验最后给我的结论,不是:
AI能不能写高考作文。
也不是:
AI能不能写出满分作文。
而是另一个更实际的判断:
在限时写作里,最关键的不是后面怎么改,而是前面有没有把决定做完。
后来我想,为什么"凭证"这个词会适合这次实验?
因为这场实验本身,也像是在问同一个问题:
当AI已经可以写出一篇顺滑的文章时,什么还能证明这是"我"的写作?
不是更漂亮的句子。
也不是更多的素材。
而是开写之前那些看不见的决定。
我让谁说话。
我让他说给谁听。
我把哪些素材留下。
我把哪些素材舍掉。
我决定保留那个高中生的困惑,而不是替他过早想明白。
这些决定,才是人留在文章里的凭证。
所以在AI可以生成文字的时代,真正稀缺的,可能不再是把话写出来的能力。
而是开写之前,知道自己为什么这样写的能力。
高考作文如此。
公众号如此。
方案、邮件、脚本,甚至很多人生里的判断,也差不多如此。
继续阅读
基于全文检索与主题相似度
# 我花2999买了个AI编辑部,结果发现缺的是主编
得到大脑专家版 · 8天真实体验反馈 我用得到大脑专家版写了7篇文章,前两篇我偷懒了——默认让AI做,自己不怎么管。出来的东西"神似而形不似",看上去像我会写的文章,但里面的判断不是我的,节奏不是我的,真正的钩子也不在。 后来我每篇都盯,每段都审,甚至自己推翻重来。最大的感受不是"AI太会写了",而是:我好像突然变成了
AI时代,越有经验的人,为什么越不敢开始?
罗振宇的视频日记日更到了第100天。一百天前他开始每天录一条,刚好在儿童节这天到了节点。得到大脑首批专家版会员受邀来参加开放日活动,他做了场直播,请大家来一起过节,顺便一起唠唠嗑。 三个多小时,聊的是"AI时代,我们怎么写作"。 但真正让我坐直的,不是他讲AI怎么帮你写东西——而是互动环节里有人问了一个问题: "怎么知
日更第10天,难的不是写,别把'更'锁死成一种形式
日更群里有人说:"最近三天可能要退出日更了,从早上9点到晚上9点都要上课。如果大家有更好高效写文的方式,求分享🙏" 我盯着这条消息想了一会。 对方问的是"怎么写更快",不是"能不能换个形式"。这本身就是个信号——我们默认日更就是写文章,写不动了,第一反应是提速,不是换路。 日更的"更"被我们理解成了"文章" 日更群里