# AI时代的收集者谬误升级版

浅思录2 次阅读10 分钟

一、我以为我需要一手信息

今年2月底,我认真想搭一个AI News工具。

起因很简单:关注AI行业,但每天看到的信息几乎都是二手的。某个模型更新了,某个产品发布了,我总是从别人的公众号、别人的日报、别人的解读里才知道。等我看到的时候,已经过了好几手。

我想看到一手信息。

但真动手的时候,第一步就卡住了——我连有哪些信息源都不知道。

于是我花了几天时间,在Twitter上把自己关注的所有AI相关账号翻了一遍。官号、二级媒体号、有独特视角的个人博主、普通人……大大小小搜了六十多个。我想用Grok自动读取这些源,看看能不能搭一个自动抓取的News流。没搞成。

3月初,我接上了Claude Code,终于编译出了一个最简单的AI News——它能帮我抓Twitter上的AI新闻,按一些小规则筛选出来。

但说实话,我做出来之后,自己不太想看。

抓取经常断,筛选出来的东西也没有让我觉得"这比看别人的日报更有用"。后续也没有继续升级。陆陆续续有了别的想法,这件事就放下了。

然后,AI News的开源项目突然遍地都是。

卡兹克开源了他的AIHOT,Horizon也出来了——一个开源的AI信息聚合平台,多源抓取、去重、评分、摘要,搭建门槛很低。大大小小的博主在开源,中型博主在开源,我身边的朋友也在做。

我还没做完我的Twitter搜索,别人已经开源了更好的版本。

这件事让我停下来想了想。

不是"别人做完了我就不用做了"的那种停。是一种更深的不对劲——我原本以为,我的问题是"看不到一手信息"。只要我搭了工具、搜了更多源、跑在了别人前面,问题就解决了。

但当我真的看到这些开源项目的时候,我意识到一件事:

看到更多,本身不是答案。

卡兹克做了168个信源、11版评分策略,Horizon搭出了完整的信息雷达——但说实话,我自己用下来,基本上不会去看。

不是工具不好。是我没有一条主线,让这些信息有地方可去。

没有主线的一手信息,和没有主线的二手信息一样,只是谈资。

我以前以为我的问题是"看不到"。后来才发现,我的问题不是看不到,是不知道看了之后该往哪放。

二、收集者谬误的AI时代升级版

做知识管理的人大概都听过一个概念:收集者谬误。

它的意思是:你以为自己保存了一篇文章,就等于处理了它。收藏了,就是读过了。读过了,就是理解了。理解了,就是可以用了。

这是一个幻觉。但这个幻觉很舒服,因为保存的动作会释放一种"我已经处理了"的心理张力。觉得自己在建设,其实只是在堆仓库。我自己也干过这事。

AI时代,这个谬误升级了。

以前的收集者谬误是:我保存了,所以我处理了。

AI时代的升级版是:我搜到了一手信息,所以我比别人更早更准。

看起来比"保存了"高级多了。毕竟你确实在主动搜索,确实在看一手信源,确实比别人更早看到了那条消息。但本质上,它和"保存了所以处理了"是同一套逻辑——

"看到"被当成了"判断"。

没有主线的收集,不管是一手的还是二手的,都只是谈资。

我自己的经历就是证据:我搜了60多个Twitter博主,搭了一个能自动抓取筛选的工具,做出来了——然后不想看。不是因为工具不好,是因为我不知道看了之后该拿它怎么办。

这不是个例。我身边做AI News开源的朋友,工具做得比我好,信源覆盖比我广——但说实话,很多人用下来也是同样的感觉:刚开始新鲜几天,后面就不看了。

AI圈里有些前辈说得更狠:他们根本不看新闻。真正重要的东西,自然会推到你眼前。

这句话我一开始觉得太傲慢。后来慢慢理解了——他们不是不看信息,是信息已经在他们的主线上了。他们有自己的标准,知道什么值得注意,什么可以忽略。信息不是被"看到更多"筛选出来的,是被"我到底在往哪走"筛选出来的。

回头看,瓶颈一直在变:从"找不到"到"信谁"到"我到底在往哪走"。AI让前两个问题容易多了,但让第三个问题变得更紧迫。

而更根本的问题是:就算你找到了、也信了,如果你不加工——不跟自己已有的经验做联系,不想它下一步往哪存、往哪用——看再多也没用。找到不等于处理,保存不等于理解。记录本身必须带着重新组织,否则它只是在换一种方式堆仓库。

不是先看到更多信息再找到方向,而是先有方向,信息才有地方可去。

三、开源的是管道,判断是不可开源的

卡兹克开源了他的AIHOT——168个信源,T1/T1.5/T2三级分类,评分策略迭代了11版。

但他开源的是管道:信源列表、抓取脚本、评分框架。

真正不可开源的,是他用11版迭代凝结出来的判断标准——为什么选这些源、为什么这条值得推、为什么那条可以忽略、权重怎么算、阈值怎么定。这些东西长在他自己的主线上,没法fork。

这也是为什么,即使有了这么多开源的AI News工具,我用自己做的最简版抓出来之后,还是不想看。不是工具不好。是通用打分不是基于我的判断,它不认识我。别人的管道再好,没有我自己的判断标准穿进去,信息来了也只是又多了一堆待看列表。

开源的是管道,判断是不可开源的。

一个只收集、不判断的系统,只是囤积,不是判断。

四、先有签子,再穿东西

那怎么办?

我后来想明白了一件事:我需要的不是看到更多信息,而是先搞清楚我自己到底在往哪走。

有一次我打了个比方——你的主线就像烧烤的那根签子。没有签子,你拿一堆食材,不知道往哪穿,只能堆在盘子里。有了签子,你想插什么就插什么,不是随便插,是有选择地穿上去。

我现在的签子有三条,它们不是并列的,是递进的:

第一条:用AI把现有的工作串起来。这是当下就能用的——怎么用AI帮我把日常工作做得更快、更好,这是我每天都会碰到的问题。

第二条:把自己的信息沉淀下来。不管是读到的、想到的、做过的,都放进一个结构化的系统里,以后能找得到、能用得上。这是长期底座。

第三条:在前两者的基础上,看看能不能沉淀出一些别人也能用的东西。可能是深度研究报告,可能是个人偏好备忘,可能是某种可复用的方法。这是远期复利。

有了这三条线,我再去看AI News,感觉就不一样了。大部分news,答案是"跟我的主线无关"。那就过。

先有签子,再穿东西。

五、最小动作:试一张判断卡片

说了这么多,到底该怎么做?

有了主线,你就知道什么该看什么不用看。但"该看"的信息来了之后呢?——你还得判断它到底值不值得信、值不值得跟。这就是判断卡片在做的事。

我不是要你马上去搭一套完整的信息判断系统。先别急着搭——那太重了,大概率搭完也不用。

我想建议的最小动作是:试一张判断卡片。

什么是判断卡片?就是当你看到一条信息,觉得"这可能重要"的时候,不要只收藏,而是花两分钟写下四件事:

  1. 我现在判断什么?——一句话,把你从这条信息里提取出来的判断写下来。不是"这篇文章说了什么",而是"我看完之后,我相信什么"。

  2. 我有多确定?——给一个置信度,60%、70%、90%都行。不用精确,但必须写。写下来你才会发现,很多时候你以为自己很确定,其实没那么确定。

  3. 什么会改变我的想法?——如果未来出现了什么信号,我会承认自己判断错了?这个问题能逼你想清楚,你的判断到底建立在什么前提上。

  4. 什么时候复盘?——给自己定一个日期,到时候回来看这条判断。对了,信源升级;错了,信源降级。

这四件事,核心只有一个:把"我好像懂了"变成"我愿意为此下注"。

为什么必须用自己的话写?2014年,Mueller和Oppenheimer做过一个实验:两组学生听同一场讲座,一组用电脑打字记录,一组手写。结果手写组在概念理解上显著优于打字组。原因不是手写比打字好,而是手写速度跟不上,逼着你必须用自己的话重新组织信息——哪些重要,哪些次要,换一种说法。打字速度快,倾向于逐字照抄,深度加工较少。

这个实验的真正结论是:记录本身必须带着重新组织,不是只保存信息,而是在加工信息。判断卡片就是在做这件事——你写下的不是原文摘要,而是你自己的判断。

模糊是焦虑的温床,具体是清醒的开始。

AI让记录变得越来越简单——保存、摘要、分类,几秒钟就搞定。但越简单,越要警惕:记录变简单了,不代表思考变多了。AI能帮你整理和润色,但思考、感受、判断——这些只有你自己能做。

所以,先别急着搭一套完整的信息判断系统。也别急着把所有东西塞进AI里,期待它给你一个人生答案。

先写下你的三条主线是什么。然后,下一条让你觉得"这可能重要"的信息来了,试一张判断卡片。

至少这个阶段够了。


这篇文章不是一个终极系统发布。更像一次小版本更新。后续可以展开的还有很多:AI摘要制造的理解幻觉、信源分级的具体方法、30天判断系统实验——如果你感兴趣,我们后面慢慢聊。

继续阅读

基于全文检索与主题相似度