Knowledge Model 笔记
AI 项目最危险的不是忘记,是记错以后还继续施工。
以前我把长期知识想得太像「存档」。聊过的内容保存下来,终端输出保存下来,报告保存下来,截图保存下来,以为这样下一次 AI 就能接上。
其实不是。AI 项目的现场不是图书馆,更像工地。今天 Claude 在一个窗口里讨论方向,Codex 在本地改文件,Kimi 在消化长文档,浏览器里还开着部署页面、预览页面、ChatGPT 对话。每个地方都在产生材料:一句判断、一段日志、一份报告、一个截图、一个临时通过的状态。
当天我当然知道哪个是草稿,哪个是中间态,哪个 PASS 带着 warning。问题是几天以后现场散了,只剩材料。下一个 AI 进来时,它看到的不是「现场」,而是一堆看起来都挺像证据的碎片。
这时候如果没有压缩,系统不会变聪明,只会变脏。
真正的冲突:材料越来越多,判断反而越来越不稳
我最早以为问题是「AI 忘了」。后来发现更常见的是「AI 记错了」。
比如一条线先被评成 95 分,后来独立审计打回 77 分,再后来补完缺口回到 96。三个数字都是真的,但它们不能直接混在一起用。如果下一次 AI 只看到 95,它可能会继续推进上线;如果只看到 77,它可能会重复修已经关闭的问题;如果只看到 96,它又可能忘了这个 96 仍然是 local controlled candidate,不是 production 放行。
问题不在记忆多少,而在判断结构。材料如果没被压成「当前可用结论」,下一次协作里就会变成污染源。
影响很实在。每次换窗口、换 AI、换一天,我都要重新解释:这份报告已经过期,那份只是 owner report,不是 independent audit;这个 PASS 是 local-only,不是上线许可;那个结论只是为了推进讨论,后来已经被推翻。
浪费时间还是小事。更麻烦的是旧判断复活,中间状态被误读成完成态,AI 在错误前提上继续写计划。它写得越顺,我越容易被带偏。
我试过的错误解法:把一切都存下来
最自然的反应是加记忆:怕丢,就全量保存。聊天也存,日志也存,报告也存,最好每句话以后都能搜到。
但这条路很快会反过来咬你。全量保存只解决「有没有材料」,不解决「这条材料现在还能不能用」。向量库能召回相似内容,但不会自动知道哪句话是试探,哪份报告已经被审计推翻,哪个结论只适用于本地预览。
我后来不再追求「让 AI 记住更多」。我更关心另一件事:让它少误用。
所以我开始做 Knowledge Model。它不是什么新名词,也不是另一个知识库工具。它是一套现场收工规则:每天产生的材料,哪些只做证据,哪些进入当前状态,哪些变成长期规则,哪些应该直接丢掉。
我的方法:四个问题决定一条材料能不能升格
一段内容就算「看起来有用」,也得先过四个问题,才进长期记忆:
- 第一,问题是什么。别泛泛说「上下文不足」,要说清楚哪个判断错了、哪个边界混了、哪个状态被误读了。
- 第二,它造成了什么影响。是浪费了一次接手时间,还是让旧结论复活,还是差点把 local-only 当成上线许可。
- 第三,我后来怎么看待这个问题。判断方式发生了什么变化,为什么不能再按原来的方式处理。
- 第四,下次要怎么做。它最后应该变成一条规则、一个 checklist、一个 skill、一个 task contract,还是只保留原始证据。
四个问题答不上来,就别急着叫知识。它最多是一段记录。
我把知识分成四层,不让它们互相冒充
材料现在被我分到四个位置。
- 原始证据层:聊天、日志、截图、测试输出、diff。只证明事情发生过,不直接指导下一步。
- 当前状态层:任务 README、notes、handoff、state 文件。回答「现在到底到哪一步」。
- 长期规则层:AGENTS.md、skills、checklist、memory 条目。用来改变以后 AI 的行为。
- 公开表达层:文章、复盘、方法论。把内部经验改写成别人也能理解的经验。
这四层不能混。证据不能冒充状态,状态不能冒充规则,规则也不能直接暴露成公开文章。很多混乱,都来自这些层混在一起:一段聊天被当成规则,一份报告被当成 verdict,一个 memory 摘要被当成当前状态。
它的作用很简单:不是帮我记住所有东西,而是逼我把东西放到正确的位置。
结果:不是记忆变多,而是交接变轻
结果不是 AI 突然什么都懂,而是接手成本下降。
新窗口不用先翻完整聊天史。它应该先看当前状态,再看最近 notes,再看 handoff,再根据需要追原始证据。它不应该从一个漂亮报告开始推断当前结论,更不应该从 memory 摘要直接决定下一步。
长期知识不是「我以前说过什么」的仓库,而是「我以后不想再重复什么」的工具。一次施工现场如果没收工,就只是一堆材料;收工之后,才可能变成下次开工时能用的资产。
我的 Knowledge Model,不是让 AI 记住更多,而是让 AI 少误用旧材料。
每次任务结束,我要留下的不是完整聊天,而是四样东西:问题、影响、判断变化、下一次动作。这四件事答得上来,经验才值得进长期知识;答不上来,就留在证据层,别污染未来的判断。