# AI时代的收集者谬误升级版
一、我以为我需要一手信息
今年2月底,我认真想搭一个AI News工具。
起因很简单:关注AI行业,但每天看到的信息几乎都是二手的。某个模型更新了,某个产品发布了,我总是从别人的公众号、别人的日报、别人的解读里才知道。等我看到的时候,已经过了好几手。
我想看到一手信息。
但真动手的时候,第一步就卡住了——我连有哪些信息源都不知道。
于是我花了几天时间,在Twitter上把自己关注的所有AI相关账号翻了一遍。官号、二级媒体号、有独特视角的个人博主、普通人……大大小小搜了六十多个。我想用Grok自动读取这些源,看看能不能搭一个自动抓取的News流。没搞成。
3月初,我接上了Claude Code,终于编译出了一个最简单的AI News——它能帮我抓Twitter上的AI新闻,按一些小规则筛选出来。
但说实话,我做出来之后,自己不太想看。
抓取经常断,筛选出来的东西也没有让我觉得"这比看别人的日报更有用"。后续也没有继续升级。陆陆续续有了别的想法,这件事就放下了。
然后,AI News的开源项目突然遍地都是。
卡兹克开源了他的AIHOT,Horizon也出来了——一个开源的AI信息聚合平台,多源抓取、去重、评分、摘要,搭建门槛很低。大大小小的博主在开源,中型博主在开源,我身边的朋友也在做。
我还没做完我的Twitter搜索,别人已经开源了更好的版本。
这件事让我停下来想了想。
不是"别人做完了我就不用做了"的那种停。是一种更深的不对劲——我原本以为,我的问题是"看不到一手信息"。只要我搭了工具、搜了更多源、跑在了别人前面,问题就解决了。
但当我真的看到这些开源项目的时候,我意识到一件事:
看到更多,本身不是答案。
卡兹克做了168个信源、11版评分策略,Horizon搭出了完整的信息雷达——但说实话,我自己用下来,基本上不会去看。
不是工具不好。是我没有一条主线,让这些信息有地方可去。
没有主线的一手信息,和没有主线的二手信息一样,只是谈资。
我以前以为我的问题是"看不到"。后来才发现,我的问题不是看不到,是不知道看了之后该往哪放。
二、收集者谬误的AI时代升级版
做知识管理的人大概都听过一个概念:收集者谬误。
它的意思是:你以为自己保存了一篇文章,就等于处理了它。收藏了,就是读过了。读过了,就是理解了。理解了,就是可以用了。
这是一个幻觉。但这个幻觉很舒服,因为保存的动作会释放一种"我已经处理了"的心理张力。觉得自己在建设,其实只是在堆仓库。我自己也干过这事。
AI时代,这个谬误升级了。
以前的收集者谬误是:我保存了,所以我处理了。
AI时代的升级版是:我搜到了一手信息,所以我比别人更早更准。
看起来比"保存了"高级多了。毕竟你确实在主动搜索,确实在看一手信源,确实比别人更早看到了那条消息。但本质上,它和"保存了所以处理了"是同一套逻辑——
"看到"被当成了"判断"。
没有主线的收集,不管是一手的还是二手的,都只是谈资。
我自己的经历就是证据:我搜了60多个Twitter博主,搭了一个能自动抓取筛选的工具,做出来了——然后不想看。不是因为工具不好,是因为我不知道看了之后该拿它怎么办。
这不是个例。我身边做AI News开源的朋友,工具做得比我好,信源覆盖比我广——但说实话,很多人用下来也是同样的感觉:刚开始新鲜几天,后面就不看了。
AI圈里有些前辈说得更狠:他们根本不看新闻。真正重要的东西,自然会推到你眼前。
这句话我一开始觉得太傲慢。后来慢慢理解了——他们不是不看信息,是信息已经在他们的主线上了。他们有自己的标准,知道什么值得注意,什么可以忽略。信息不是被"看到更多"筛选出来的,是被"我到底在往哪走"筛选出来的。
回头看,瓶颈一直在变:从"找不到"到"信谁"到"我到底在往哪走"。AI让前两个问题容易多了,但让第三个问题变得更紧迫。
而更根本的问题是:就算你找到了、也信了,如果你不加工——不跟自己已有的经验做联系,不想它下一步往哪存、往哪用——看再多也没用。找到不等于处理,保存不等于理解。记录本身必须带着重新组织,否则它只是在换一种方式堆仓库。
不是先看到更多信息再找到方向,而是先有方向,信息才有地方可去。
三、开源的是管道,判断是不可开源的
卡兹克开源了他的AIHOT——168个信源,T1/T1.5/T2三级分类,评分策略迭代了11版。
但他开源的是管道:信源列表、抓取脚本、评分框架。
真正不可开源的,是他用11版迭代凝结出来的判断标准——为什么选这些源、为什么这条值得推、为什么那条可以忽略、权重怎么算、阈值怎么定。这些东西长在他自己的主线上,没法fork。
这也是为什么,即使有了这么多开源的AI News工具,我用自己做的最简版抓出来之后,还是不想看。不是工具不好。是通用打分不是基于我的判断,它不认识我。别人的管道再好,没有我自己的判断标准穿进去,信息来了也只是又多了一堆待看列表。
开源的是管道,判断是不可开源的。
一个只收集、不判断的系统,只是囤积,不是判断。
四、先有签子,再穿东西
那怎么办?
我后来想明白了一件事:我需要的不是看到更多信息,而是先搞清楚我自己到底在往哪走。
有一次我打了个比方——你的主线就像烧烤的那根签子。没有签子,你拿一堆食材,不知道往哪穿,只能堆在盘子里。有了签子,你想插什么就插什么,不是随便插,是有选择地穿上去。
我现在的签子有三条,它们不是并列的,是递进的:
第一条:用AI把现有的工作串起来。这是当下就能用的——怎么用AI帮我把日常工作做得更快、更好,这是我每天都会碰到的问题。
第二条:把自己的信息沉淀下来。不管是读到的、想到的、做过的,都放进一个结构化的系统里,以后能找得到、能用得上。这是长期底座。
第三条:在前两者的基础上,看看能不能沉淀出一些别人也能用的东西。可能是深度研究报告,可能是个人偏好备忘,可能是某种可复用的方法。这是远期复利。
有了这三条线,我再去看AI News,感觉就不一样了。大部分news,答案是"跟我的主线无关"。那就过。
先有签子,再穿东西。
五、最小动作:试一张判断卡片
说了这么多,到底该怎么做?
有了主线,你就知道什么该看什么不用看。但"该看"的信息来了之后呢?——你还得判断它到底值不值得信、值不值得跟。这就是判断卡片在做的事。
我不是要你马上去搭一套完整的信息判断系统。先别急着搭——那太重了,大概率搭完也不用。
我想建议的最小动作是:试一张判断卡片。
什么是判断卡片?就是当你看到一条信息,觉得"这可能重要"的时候,不要只收藏,而是花两分钟写下四件事:
我现在判断什么?——一句话,把你从这条信息里提取出来的判断写下来。不是"这篇文章说了什么",而是"我看完之后,我相信什么"。
我有多确定?——给一个置信度,60%、70%、90%都行。不用精确,但必须写。写下来你才会发现,很多时候你以为自己很确定,其实没那么确定。
什么会改变我的想法?——如果未来出现了什么信号,我会承认自己判断错了?这个问题能逼你想清楚,你的判断到底建立在什么前提上。
什么时候复盘?——给自己定一个日期,到时候回来看这条判断。对了,信源升级;错了,信源降级。
这四件事,核心只有一个:把"我好像懂了"变成"我愿意为此下注"。
为什么必须用自己的话写?2014年,Mueller和Oppenheimer做过一个实验:两组学生听同一场讲座,一组用电脑打字记录,一组手写。结果手写组在概念理解上显著优于打字组。原因不是手写比打字好,而是手写速度跟不上,逼着你必须用自己的话重新组织信息——哪些重要,哪些次要,换一种说法。打字速度快,倾向于逐字照抄,深度加工较少。
这个实验的真正结论是:记录本身必须带着重新组织,不是只保存信息,而是在加工信息。判断卡片就是在做这件事——你写下的不是原文摘要,而是你自己的判断。
模糊是焦虑的温床,具体是清醒的开始。
AI让记录变得越来越简单——保存、摘要、分类,几秒钟就搞定。但越简单,越要警惕:记录变简单了,不代表思考变多了。AI能帮你整理和润色,但思考、感受、判断——这些只有你自己能做。
所以,先别急着搭一套完整的信息判断系统。也别急着把所有东西塞进AI里,期待它给你一个人生答案。
先写下你的三条主线是什么。然后,下一条让你觉得"这可能重要"的信息来了,试一张判断卡片。
至少这个阶段够了。
这篇文章不是一个终极系统发布。更像一次小版本更新。后续可以展开的还有很多:AI摘要制造的理解幻觉、信源分级的具体方法、30天判断系统实验——如果你感兴趣,我们后面慢慢聊。
继续阅读
基于全文检索与主题相似度
AI时代,普通人最该囤的不是技能,是记录
一场5小时发布会给我的三层判断 @宇怡辰 昨天看了得到十周年发布会。将近五个小时,从晚上七点半看到凌晨。 说实话,最触动我的不是产品功能。而是台上的三个人——罗振宇、脱不花、快刀青衣——做了十年内容,身上居然还有那种在生长的状态。不是那种"成功人士展示精力"的表演感,更像是被什么东西持续点燃着。 我坐在屏幕前,忽然冒出
看完〈穿Prada的恶魔2〉,我更确定普通人要拥抱 AI
看完《穿Prada的恶魔2》,最打动我的不是 Miranda 的酷,而是公司要被卖掉时 Nigel 还在认真选图。二十年前的 Runway 是权力中心,二十年后它被平台、资本和 AI 挤压得摇摇欲坠。AI 最先改变的不是某个岗位,而是工作的计价方式。普通人真正要守的,不是某个具体技能,而是在系统变化时,还愿意认真做好手上的判断。