# 我花2999买了个AI编辑部，结果发现缺的是主编

AI工具2026年6月4日0 次阅读约 15 分钟

得到大脑专家版 · 8天真实体验反馈

我用得到大脑专家版写了7篇文章，前两篇我偷懒了——默认让AI做，自己不怎么管。出来的东西"神似而形不似"，看上去像我会写的文章，但里面的判断不是我的，节奏不是我的，真正的钩子也不在。

后来我每篇都盯，每段都审，甚至自己推翻重来。最大的感受不是"AI太会写了"，而是：我好像突然变成了一个很忙、很累、还没有后台系统支持的总编辑。

为什么8个AI角色反而让人更累？

这件事要从头说起。

5月26日，得到十周年发布会，正式推出"得到大脑"专家版。我是得到9年的老用户，学了4000多小时，写了两千多篇笔记。平时也一直在用AI做内容——录音卡、Obsidian、各种Agent工作流，算是AI写作的积极分子。所以看到8个AI写作角色这个设计，我几乎没犹豫就下单了。前5000名早鸟价1999元，编号661。

当时我的第一反应是：这不就是一个小型AI编辑部吗？

先交代一下我说的是什么

得到大脑有三个层级：免费版每月能用5次基础AI能力；会员版299元/年，四大能力（点评、发芽、拷问、润色）无限用，还能打通得到内容库；专家版2999元/年，在会员版基础上多了一个8人写作专家团队——对应的是更重的任务：不是帮你记笔记、润色一段话，而是帮你从零开始完成一篇完整的文章。

我买的就是专家版。8个角色，各有各的活：选题有人做，素材有人找，文章有人写，审稿有人审，风格有人磨，事实有人查，排版有人做，知识有人管。还有三个独家卖点：得到十年打磨的品控金线、12万+得到优质内容库、你的笔记和知识库可以被专家团直接调用。

这个设计最诱人的地方是：它看上去不再是一个"工具"，而像一间"编辑部"。

但"看上去像一个编辑部"和"真的像一个编辑部一样工作"，中间有一段距离。

深度使用之后，交付了7篇长文，我的一个发现是——

一篇文章是怎么被8个Agent推着走的

拿其中一篇文章做例子。

6月1日，罗振宇做了一场三个多小时的直播，聊"AI时代，我们怎么写作"。我带着60条观点和一堆素材进来，丢给赵选题。

赵选题很快给了我两个方向。一个叫"AI时代默会知识是经济租"，一个叫"越有经验的人越难开始一个新动作"。两个方向单独看都有道理。但问题是——这两条线是岔开的。一个是认知判断，帮你重新理解什么值钱；一个是行动困境，帮你跨过不敢开始的那道坎。赵选题没有告诉我这两条线该合在哪一条上。

我选了第二个方向，交给李文章。

李文章很快写出一篇结构完整的稿子。第一眼看，挺像。第二眼看，哪里都不太对。最典型的问题是第三层——从"等想清楚"一路跳到"成了顺带不成也有积淀"，跳了六七步，每一步单独看都有道理，但步和步之间缺衔接，读者跟不上。还有一个更隐蔽的问题：我口述的素材，它直接塞进文章里，没有整合。口语和书面语是两套东西，我说的时候觉得挺顺，它写出来就变成了带着口语痕迹的半成品。

再丢给周审稿。

周审稿指出了一堆问题：金线不够清楚，论证重心飘，读者收益不明确，第二层旧答案松动不够，第三层逻辑链跳跃。它甚至指出了我对话中即兴说的一段话比原文更精准——"成了顺带赚钱，不成也有积淀"——建议我把它从对话里捞出来放进文章。

这个时候我突然意识到一件事：真正有价值的不是它帮我写，而是它逼我回答——这篇文章到底要成立在哪条主线上？

但周审稿给的是诊断，不是处方。它告诉你第三层逻辑链跳跃，但先改哪里、改完这一刀其他地方会不会自动好、哪些问题可以放第二轮——这些判断还是回到了我身上。

最后，是我自己推翻重来的。不是Agent之间互相审回来的，是我自己把第三层砍成两步翻转，自己把"架起来"改成"绑上去"，自己把收尾从"然后某一天就绑上去了"改成一句大实话。

多Agent写作不是"把文章外包给AI"，而是"把写作拆成一堆需要你调度的工序"。问题是，工序被拆开了，但调度系统没有一起长出来。

为什么会这样？

如果只把它理解成8个AI角色，就会误判它。它本质上是一套多Agent协同工作流。

多Agent的关键不在"人多"，而在"谁决策、谁审核、谁执行、谁记录、谁复盘"。

我后来想到一个比喻：三省六部制。

三省六部是古代中国的中央行政架构。中书省出方案，门下省审核，六部负责执行。这个结构的重点不是每个部门都很能干——事实上，三省六部制有一句话叫"一旦制度走上正轨，只需要庸人治国、循规蹈矩"——重点在于中间有一套清晰的调度和决策机制。

把得到大脑专家版放进去对照，大致是这样：

中书省（出方案）	赵选题
门下省（审核）	周审稿 + 吴查查
六部（执行）	李文章 + 张素材 + 刘风格 + 陈排版 + 王整理

看上去对得上。但三省六部制里，皇帝才是那个最终调度中枢——他决定听谁的、拍板往哪走、在门下省封驳的时候判断是该打回去还是推翻封驳。

在得到大脑专家版里，这个角色是空缺的。

看似我们当上了皇帝，但并没有真正坐上这把龙椅。

三省六部制有三个不足：信息传递损耗、缺调度中枢、制度僵化。一个一个对照——

信息传递损耗。三省之间公文传递，每经过一道手就丢一层上下文。得到大脑里也一样——赵选题出了方向，李文章不知道你为什么选这个；周审稿指出了问题，李文章不知道你最终采纳哪条。每个Agent只看到你交给它的那一步，你被迫在8个Agent之间当信息中转站。

缺调度中枢。三省六部制里，皇帝决定听谁的、拍板往哪走。得到大脑里没有这个角色——你不知道文章走到哪个阶段了，下一步最该叫谁，当前最重要的是改观点、改结构还是改表达。你被推着往下走，而不是被带着往下走。

制度僵化。三省六部制一旦走上正轨，"庸人治国、循规蹈矩"就能运转——说白了就是不需要动脑子，按流程走就行。但前提是任务在制度设计范围内。对应到用户身上，"庸人"就是那种心态——以为有了8个Agent就不用动脑子了，以为流程跑一遍就能出好文章。说白了，就是把自己也变成了那个"循规蹈矩"的庸人。前两篇我确实就是这么干的：默认让AI做，自己偷懒，出来的东西"神似而形不似"。但Agent正确执行≠输出是对的。

这三个不足，三省六部制用了一千多年也没完全解决。得到大脑专家版刚上线，更不可能自动消失。

8个Agent的真实体感

用下来7篇，我对8个角色有了真实的体感。不是打分评测，就是用下来的感受。8个角色，我分成四类来讲。

第一类：有内置判断体系的Agent，最强。

这类Agent不需要你告诉它"该怎么判断"，它自己有一套标准。8个角色里只有一个真正算得上：周审稿。它背后有得到的品控金线——十年品控经验的封装。它不是简单说"这篇文章还不错"，而是能从品控标准出发，指出主线、结构、读者收益、表达密度的问题。它甚至能从你对话中即兴说的话里，捞出比原文更精准的判断。这种能力不是通用的"AI审稿"能给的，是得到十年做内容积累下来的判断体系被蒸馏进了Agent里。

第二类：负责生成的Agent，很依赖你的输入质量。

赵选题、李文章、陈排版属于这一类。它们的强弱，取决于你往里面带了多少判断力。赵选题大方向能给你，但它出的5个层次，每个单独看都有道理，层次之间的逻辑却没带入你的本意——你选了一个方向往下推，推到一半才发现"这个逻辑不是我要的"。李文章更明显，口述素材直接塞进去没整合，信息密度过高逻辑链跳跃，"脚手架"没拆干净。陈排版也是同一类问题——你在风格、层次、重点上给的判断不够，它就没有内置标准可以兜底，风格单一、不稳定、容易崩。

第三类：负责辅助优化的Agent，适合做局部加工，不适合替你做根判断。

刘风格、吴查查、张素材属于这一类。吴查查不错，溯源上提供了可能性，但吃不准它的溯源基础——主要搜国内网页，真假难辨。刘风格存在感偏弱，但弱的原因可能不是它不行，而是我自己对风格还没拿捏住——画出来的到底是不是我，我自己都是问号。张素材调用得到知识库是有价值的，但素材适配判断不够——它给你的弹药不一定是你这场仗需要的。这类Agent能提高局部效率，但不能决定文章真正要说什么。

第四类：底层支持，但当前偏弱。

王整理属于这一类。只能外嵌爬取，不能整理得到内部的笔记内容——对于一个得到9年老用户来说，两千多篇笔记沉睡在那里调不出来，挺可惜的。它本该是整个工作流的地基——管知识、管积累——但当前地基还不够结实。

有自己判断体系的Agent强，需要你带判断体系进去的Agent弱。更扎心的是，我未必已经有自己的判断体系。

其中最值得单独说的是周审稿背后的品控金线——它不只是强，它暴露了一个更深的门槛。

金线skill：它最像"专家"，但也最暴露门槛

8个角色里，周审稿排第一，不是因为它最会写，而是因为它背后有一套其他Agent没有的东西：得到金线skill。

金线skill的来头——得到内部代号叫"罗氏虾"，是得到内部品控Agent对外开放版。得到品控手册已经迭代到11.0版了，现在不只是文档，而是变成了AI角色。得到APP总编室负责人宣明栋在金线C6分享会上提过这件事。说白了，十年做内容的品控经验，被蒸馏成了一个可以调用的判断体系。

我自己的笔记写了一句："8个角色是骨架，金线才是灵魂。"

这让我意识到一件事：AI写作里，真正稀缺的不是生成能力，而是判断能力。

生成能力现在已经很方便了。我写"AI时代，越有经验的人，为什么越不敢开始？"那篇，李文章很快写出了结构完整的初稿——但什么是好选题？什么是清晰主线？什么是读者真正有获得感？什么地方只是顺滑废话？这些才是难的。

金线skill强就强在这里——它自己有一套完整的判断体系，不需要你喂给它，它就能指出你的文章"俗知俗见没松动""认知落差没制造""主线飘了"。这种能力不是通用的AI审稿能给的。

但金线skill也有门槛。

它能帮你诊断问题，却不能替你决定治疗方案。

它会给你很多建议——主线不清、论证重心飘、读者收益不明确、旧答案松动不够、逻辑链跳跃——但哪些建议要采纳，哪些建议要放弃，哪些建议要交给李文章去改，哪些必须你自己重写，这些判断还是回到了用户身上。

而且它给的建议，你不一定都看得懂。有时候你只能直接把金线报告丢给李文章，让它按报告改——但你有没有能力判断李文章改得对不对？这又回到了你的判断力。

诊断不需要你，但治疗需要你。而且治疗还得你自己会开药方。

所以问题不只是金线的门槛。整个系统都缺了一层东西。

缺的不是Agent，而是协同中枢

所以用下来最大的感受是：得到大脑专家版当前不是缺Agent，而是缺一个协同中枢。

它现在像是很多专家坐在不同房间里，每个人都有一套本事。但这些专家之间缺少一个产品层面的"大脑皮层"。

多Agent不会自动变成工作流。没有中控，它只是8个很会说话的房间。

6个功能不足，我归成三层来说。

第一层：它不够认识我。

它不知道我过去写过什么，不知道我稳定的表达偏好，不知道我哪些判断反复出现，也不知道我有哪些不能被改掉的个人风格。所以每次写作都像重新认识我一次。我纠正过李文章"不用架起来用绑上去"，它改了当前段落，但下一段可能又犯了——偏好改了没有沉淀成共享规则。还有我的知识库——产品介绍里说"你的笔记和知识库可以被专家团直接调用"，但至少在我使用的这段时间里，王整理只能外嵌爬取，不能整理得到内部的笔记内容。我两千多篇得到笔记沉睡在那里，Agent做选题素材时还是直接搜公网。

一句话：用户说一次，系统全员知道。用户自己的知识库不该沉睡。

第二层：它不够知道项目走到哪一步。

一篇文章在不同阶段需要不同帮助。选题阶段要放大可能性，成稿阶段要收束结构，审稿阶段要残酷判断，修改阶段要控制损耗。但现在系统没有明确告诉我：文章在哪个阶段？下一步最该叫谁？当前最重要的是改观点、改结构还是改表达？审稿建议没有优先级，你只能在一堆建议里自己当项目经理。Agent之间没有共享面板，赵选题知道的李文章不知道，你成了信息中转站。写作节奏没有阶段确认，李文章一口气写完，但你可能中途已经不认同方向了。

一句话：不要让用户在一堆建议里自己当项目经理。Agent之间不能靠用户传话。生成不是越快越好，关键节点要停下来对齐。

第三层：它不够把这次经验带到下次。

每次折腾完一篇文章，那些经验没有自动沉淀成下一次的工作流资产。"AI时代，越有经验的人，为什么越不敢开始？"这篇写完，周审稿自己反思了5条，李文章也反思了5条——这些反思非常有价值，但它们留在了对话里，没有自动更新到下一次的工作流里。这次我发现自己最容易犯的问题是主线飘，下次系统应该提前提醒我。这次我明确了某种标题风格不适合我，下次它应该少给我这类标题。但现在这些记忆很大程度上还是留在我脑子里，而不是留在系统里。

一句话：每一次创作都应该让系统变聪明。

所以，它当前最需要的不是第9个、第10个Agent，而是一个协同中枢——记住你是谁，知道项目到哪一步，判断谁该上场，把输出分级，调用你的知识库，并且把本次经验沉淀到下一次。

照出来的不是AI的问题

写到这里，我越来越觉得，这不是一篇关于"得到大脑专家版好不好用"的体验反馈，而是一面镜子。

它照出来的不是AI哪里不行，而是我自己哪里没想清楚。

我有没有稳定的选题判断？我知不知道自己文章里的金线是什么？我能不能分辨一篇文章只是顺，还是它真的成立？我有没有自己的风格边界？

说到底，Agent只能在你已经想清楚的范围内帮你。而你想清楚的那些东西，恰恰是多Agent工作流逼你面对的。

它会逼一个没有完整写作体系的人，开始面对一个问题：我到底要写什么？我到底凭什么判断一篇文章好不好？

多Agent工作流不是直接降低门槛，而是把门槛显影。

一个最小动作

说了这么多，不是要劝你买，也不是劝你别买。

如果你已经在用多Agent写作工作流，或者准备开始用，我建议你先做一个最小动作：

下次赵选题给你出完选题之后，先不要急着往下推给李文章。停5分钟，问自己三个问题：

第一，这个选题真正的冲突是什么？

第二，这个逻辑是我要的吗，还是只是AI给了一个看起来合理的逻辑？

第三，如果这篇文章只能让读者带走一句话，那句话是什么？

这5分钟，可能比后面5小时的修改都值钱。

因为多Agent写作里，最重要的不是让AI更快开始，而是让人更早判断。