# 我花2999买了个AI编辑部,结果发现缺的是主编
得到大脑专家版 · 8天真实体验反馈
我用得到大脑专家版写了7篇文章,前两篇我偷懒了——默认让AI做,自己不怎么管。出来的东西"神似而形不似",看上去像我会写的文章,但里面的判断不是我的,节奏不是我的,真正的钩子也不在。
后来我每篇都盯,每段都审,甚至自己推翻重来。最大的感受不是"AI太会写了",而是:我好像突然变成了一个很忙、很累、还没有后台系统支持的总编辑。
为什么8个AI角色反而让人更累?
这件事要从头说起。
5月26日,得到十周年发布会,正式推出"得到大脑"专家版。我是得到9年的老用户,学了4000多小时,写了两千多篇笔记。平时也一直在用AI做内容——录音卡、Obsidian、各种Agent工作流,算是AI写作的积极分子。所以看到8个AI写作角色这个设计,我几乎没犹豫就下单了。前5000名早鸟价1999元,编号661。
当时我的第一反应是:这不就是一个小型AI编辑部吗?
先交代一下我说的是什么
得到大脑有三个层级:免费版每月能用5次基础AI能力;会员版299元/年,四大能力(点评、发芽、拷问、润色)无限用,还能打通得到内容库;专家版2999元/年,在会员版基础上多了一个8人写作专家团队——对应的是更重的任务:不是帮你记笔记、润色一段话,而是帮你从零开始完成一篇完整的文章。
我买的就是专家版。8个角色,各有各的活:选题有人做,素材有人找,文章有人写,审稿有人审,风格有人磨,事实有人查,排版有人做,知识有人管。还有三个独家卖点:得到十年打磨的品控金线、12万+得到优质内容库、你的笔记和知识库可以被专家团直接调用。
这个设计最诱人的地方是:它看上去不再是一个"工具",而像一间"编辑部"。
但"看上去像一个编辑部"和"真的像一个编辑部一样工作",中间有一段距离。
深度使用之后,交付了7篇长文,我的一个发现是——
一篇文章是怎么被8个Agent推着走的
拿其中一篇文章做例子。
6月1日,罗振宇做了一场三个多小时的直播,聊"AI时代,我们怎么写作"。我带着60条观点和一堆素材进来,丢给赵选题。
赵选题很快给了我两个方向。一个叫"AI时代默会知识是经济租",一个叫"越有经验的人越难开始一个新动作"。两个方向单独看都有道理。但问题是——这两条线是岔开的。一个是认知判断,帮你重新理解什么值钱;一个是行动困境,帮你跨过不敢开始的那道坎。赵选题没有告诉我这两条线该合在哪一条上。
我选了第二个方向,交给李文章。
李文章很快写出一篇结构完整的稿子。第一眼看,挺像。第二眼看,哪里都不太对。最典型的问题是第三层——从"等想清楚"一路跳到"成了顺带不成也有积淀",跳了六七步,每一步单独看都有道理,但步和步之间缺衔接,读者跟不上。还有一个更隐蔽的问题:我口述的素材,它直接塞进文章里,没有整合。口语和书面语是两套东西,我说的时候觉得挺顺,它写出来就变成了带着口语痕迹的半成品。
再丢给周审稿。
周审稿指出了一堆问题:金线不够清楚,论证重心飘,读者收益不明确,第二层旧答案松动不够,第三层逻辑链跳跃。它甚至指出了我对话中即兴说的一段话比原文更精准——"成了顺带赚钱,不成也有积淀"——建议我把它从对话里捞出来放进文章。
这个时候我突然意识到一件事:真正有价值的不是它帮我写,而是它逼我回答——这篇文章到底要成立在哪条主线上?
但周审稿给的是诊断,不是处方。它告诉你第三层逻辑链跳跃,但先改哪里、改完这一刀其他地方会不会自动好、哪些问题可以放第二轮——这些判断还是回到了我身上。
最后,是我自己推翻重来的。不是Agent之间互相审回来的,是我自己把第三层砍成两步翻转,自己把"架起来"改成"绑上去",自己把收尾从"然后某一天就绑上去了"改成一句大实话。
多Agent写作不是"把文章外包给AI",而是"把写作拆成一堆需要你调度的工序"。问题是,工序被拆开了,但调度系统没有一起长出来。
为什么会这样?
如果只把它理解成8个AI角色,就会误判它。它本质上是一套多Agent协同工作流。
多Agent的关键不在"人多",而在"谁决策、谁审核、谁执行、谁记录、谁复盘"。
我后来想到一个比喻:三省六部制。
三省六部是古代中国的中央行政架构。中书省出方案,门下省审核,六部负责执行。这个结构的重点不是每个部门都很能干——事实上,三省六部制有一句话叫"一旦制度走上正轨,只需要庸人治国、循规蹈矩"——重点在于中间有一套清晰的调度和决策机制。
把得到大脑专家版放进去对照,大致是这样:
中书省(出方案) | 赵选题 |
门下省(审核) | 周审稿 + 吴查查 |
六部(执行) | 李文章 + 张素材 + 刘风格 + 陈排版 + 王整理 |
看上去对得上。但三省六部制里,皇帝才是那个最终调度中枢——他决定听谁的、拍板往哪走、在门下省封驳的时候判断是该打回去还是推翻封驳。
在得到大脑专家版里,这个角色是空缺的。
看似我们当上了皇帝,但并没有真正坐上这把龙椅。
三省六部制有三个不足:信息传递损耗、缺调度中枢、制度僵化。一个一个对照——
信息传递损耗。三省之间公文传递,每经过一道手就丢一层上下文。得到大脑里也一样——赵选题出了方向,李文章不知道你为什么选这个;周审稿指出了问题,李文章不知道你最终采纳哪条。每个Agent只看到你交给它的那一步,你被迫在8个Agent之间当信息中转站。
缺调度中枢。三省六部制里,皇帝决定听谁的、拍板往哪走。得到大脑里没有这个角色——你不知道文章走到哪个阶段了,下一步最该叫谁,当前最重要的是改观点、改结构还是改表达。你被推着往下走,而不是被带着往下走。
制度僵化。三省六部制一旦走上正轨,"庸人治国、循规蹈矩"就能运转——说白了就是不需要动脑子,按流程走就行。但前提是任务在制度设计范围内。对应到用户身上,"庸人"就是那种心态——以为有了8个Agent就不用动脑子了,以为流程跑一遍就能出好文章。说白了,就是把自己也变成了那个"循规蹈矩"的庸人。前两篇我确实就是这么干的:默认让AI做,自己偷懒,出来的东西"神似而形不似"。但Agent正确执行≠输出是对的。
这三个不足,三省六部制用了一千多年也没完全解决。得到大脑专家版刚上线,更不可能自动消失。
8个Agent的真实体感
用下来7篇,我对8个角色有了真实的体感。不是打分评测,就是用下来的感受。8个角色,我分成四类来讲。
第一类:有内置判断体系的Agent,最强。
这类Agent不需要你告诉它"该怎么判断",它自己有一套标准。8个角色里只有一个真正算得上:周审稿。它背后有得到的品控金线——十年品控经验的封装。它不是简单说"这篇文章还不错",而是能从品控标准出发,指出主线、结构、读者收益、表达密度的问题。它甚至能从你对话中即兴说的话里,捞出比原文更精准的判断。这种能力不是通用的"AI审稿"能给的,是得到十年做内容积累下来的判断体系被蒸馏进了Agent里。
第二类:负责生成的Agent,很依赖你的输入质量。
赵选题、李文章、陈排版属于这一类。它们的强弱,取决于你往里面带了多少判断力。赵选题大方向能给你,但它出的5个层次,每个单独看都有道理,层次之间的逻辑却没带入你的本意——你选了一个方向往下推,推到一半才发现"这个逻辑不是我要的"。李文章更明显,口述素材直接塞进去没整合,信息密度过高逻辑链跳跃,"脚手架"没拆干净。陈排版也是同一类问题——你在风格、层次、重点上给的判断不够,它就没有内置标准可以兜底,风格单一、不稳定、容易崩。
第三类:负责辅助优化的Agent,适合做局部加工,不适合替你做根判断。
刘风格、吴查查、张素材属于这一类。吴查查不错,溯源上提供了可能性,但吃不准它的溯源基础——主要搜国内网页,真假难辨。刘风格存在感偏弱,但弱的原因可能不是它不行,而是我自己对风格还没拿捏住——画出来的到底是不是我,我自己都是问号。张素材调用得到知识库是有价值的,但素材适配判断不够——它给你的弹药不一定是你这场仗需要的。这类Agent能提高局部效率,但不能决定文章真正要说什么。
第四类:底层支持,但当前偏弱。
王整理属于这一类。只能外嵌爬取,不能整理得到内部的笔记内容——对于一个得到9年老用户来说,两千多篇笔记沉睡在那里调不出来,挺可惜的。它本该是整个工作流的地基——管知识、管积累——但当前地基还不够结实。
有自己判断体系的Agent强,需要你带判断体系进去的Agent弱。更扎心的是,我未必已经有自己的判断体系。
其中最值得单独说的是周审稿背后的品控金线——它不只是强,它暴露了一个更深的门槛。
金线skill:它最像"专家",但也最暴露门槛
8个角色里,周审稿排第一,不是因为它最会写,而是因为它背后有一套其他Agent没有的东西:得到金线skill。
金线skill的来头——得到内部代号叫"罗氏虾",是得到内部品控Agent对外开放版。得到品控手册已经迭代到11.0版了,现在不只是文档,而是变成了AI角色。得到APP总编室负责人宣明栋在金线C6分享会上提过这件事。说白了,十年做内容的品控经验,被蒸馏成了一个可以调用的判断体系。
我自己的笔记写了一句:"8个角色是骨架,金线才是灵魂。"
这让我意识到一件事:AI写作里,真正稀缺的不是生成能力,而是判断能力。
生成能力现在已经很方便了。我写"AI时代,越有经验的人,为什么越不敢开始?"那篇,李文章很快写出了结构完整的初稿——但什么是好选题?什么是清晰主线?什么是读者真正有获得感?什么地方只是顺滑废话?这些才是难的。
金线skill强就强在这里——它自己有一套完整的判断体系,不需要你喂给它,它就能指出你的文章"俗知俗见没松动""认知落差没制造""主线飘了"。这种能力不是通用的AI审稿能给的。
但金线skill也有门槛。
它能帮你诊断问题,却不能替你决定治疗方案。
它会给你很多建议——主线不清、论证重心飘、读者收益不明确、旧答案松动不够、逻辑链跳跃——但哪些建议要采纳,哪些建议要放弃,哪些建议要交给李文章去改,哪些必须你自己重写,这些判断还是回到了用户身上。
而且它给的建议,你不一定都看得懂。有时候你只能直接把金线报告丢给李文章,让它按报告改——但你有没有能力判断李文章改得对不对?这又回到了你的判断力。
诊断不需要你,但治疗需要你。而且治疗还得你自己会开药方。
所以问题不只是金线的门槛。整个系统都缺了一层东西。
缺的不是Agent,而是协同中枢
所以用下来最大的感受是:得到大脑专家版当前不是缺Agent,而是缺一个协同中枢。
它现在像是很多专家坐在不同房间里,每个人都有一套本事。但这些专家之间缺少一个产品层面的"大脑皮层"。
多Agent不会自动变成工作流。没有中控,它只是8个很会说话的房间。
6个功能不足,我归成三层来说。
第一层:它不够认识我。
它不知道我过去写过什么,不知道我稳定的表达偏好,不知道我哪些判断反复出现,也不知道我有哪些不能被改掉的个人风格。所以每次写作都像重新认识我一次。我纠正过李文章"不用架起来用绑上去",它改了当前段落,但下一段可能又犯了——偏好改了没有沉淀成共享规则。还有我的知识库——产品介绍里说"你的笔记和知识库可以被专家团直接调用",但至少在我使用的这段时间里,王整理只能外嵌爬取,不能整理得到内部的笔记内容。我两千多篇得到笔记沉睡在那里,Agent做选题素材时还是直接搜公网。
一句话:用户说一次,系统全员知道。用户自己的知识库不该沉睡。
第二层:它不够知道项目走到哪一步。
一篇文章在不同阶段需要不同帮助。选题阶段要放大可能性,成稿阶段要收束结构,审稿阶段要残酷判断,修改阶段要控制损耗。但现在系统没有明确告诉我:文章在哪个阶段?下一步最该叫谁?当前最重要的是改观点、改结构还是改表达?审稿建议没有优先级,你只能在一堆建议里自己当项目经理。Agent之间没有共享面板,赵选题知道的李文章不知道,你成了信息中转站。写作节奏没有阶段确认,李文章一口气写完,但你可能中途已经不认同方向了。
一句话:不要让用户在一堆建议里自己当项目经理。Agent之间不能靠用户传话。生成不是越快越好,关键节点要停下来对齐。
第三层:它不够把这次经验带到下次。
每次折腾完一篇文章,那些经验没有自动沉淀成下一次的工作流资产。"AI时代,越有经验的人,为什么越不敢开始?"这篇写完,周审稿自己反思了5条,李文章也反思了5条——这些反思非常有价值,但它们留在了对话里,没有自动更新到下一次的工作流里。这次我发现自己最容易犯的问题是主线飘,下次系统应该提前提醒我。这次我明确了某种标题风格不适合我,下次它应该少给我这类标题。但现在这些记忆很大程度上还是留在我脑子里,而不是留在系统里。
一句话:每一次创作都应该让系统变聪明。
所以,它当前最需要的不是第9个、第10个Agent,而是一个协同中枢——记住你是谁,知道项目到哪一步,判断谁该上场,把输出分级,调用你的知识库,并且把本次经验沉淀到下一次。
照出来的不是AI的问题
写到这里,我越来越觉得,这不是一篇关于"得到大脑专家版好不好用"的体验反馈,而是一面镜子。
它照出来的不是AI哪里不行,而是我自己哪里没想清楚。
我有没有稳定的选题判断?我知不知道自己文章里的金线是什么?我能不能分辨一篇文章只是顺,还是它真的成立?我有没有自己的风格边界?
说到底,Agent只能在你已经想清楚的范围内帮你。而你想清楚的那些东西,恰恰是多Agent工作流逼你面对的。
它会逼一个没有完整写作体系的人,开始面对一个问题:我到底要写什么?我到底凭什么判断一篇文章好不好?
多Agent工作流不是直接降低门槛,而是把门槛显影。
一个最小动作
说了这么多,不是要劝你买,也不是劝你别买。
如果你已经在用多Agent写作工作流,或者准备开始用,我建议你先做一个最小动作:
下次赵选题给你出完选题之后,先不要急着往下推给李文章。停5分钟,问自己三个问题:
第一,这个选题真正的冲突是什么?
第二,这个逻辑是我要的吗,还是只是AI给了一个看起来合理的逻辑?
第三,如果这篇文章只能让读者带走一句话,那句话是什么?
这5分钟,可能比后面5小时的修改都值钱。
因为多Agent写作里,最重要的不是让AI更快开始,而是让人更早判断。