把 AI 施工现场压缩成长期知识：我的 Knowledge Model

Knowledge Model 笔记

AI 项目最危险的不是忘记，是记错以后还继续施工。

以前我把长期知识想得太像「存档」。聊过的内容保存下来，终端输出保存下来，报告保存下来，截图保存下来，以为这样下一次 AI 就能接上。

其实不是。AI 项目的现场不是图书馆，更像工地。今天 Claude 在一个窗口里讨论方向，Codex 在本地改文件，Kimi 在消化长文档，浏览器里还开着部署页面、预览页面、ChatGPT 对话。每个地方都在产生材料：一句判断、一段日志、一份报告、一个截图、一个临时通过的状态。

当天我当然知道哪个是草稿，哪个是中间态，哪个 PASS 带着 warning。问题是几天以后现场散了，只剩材料。下一个 AI 进来时，它看到的不是「现场」，而是一堆看起来都挺像证据的碎片。

这时候如果没有压缩，系统不会变聪明，只会变脏。

真正的冲突：材料越来越多，判断反而越来越不稳

我最早以为问题是「AI 忘了」。后来发现更常见的是「AI 记错了」。

比如一条线先被评成 95 分，后来独立审计打回 77 分，再后来补完缺口回到 96。三个数字都是真的，但它们不能直接混在一起用。如果下一次 AI 只看到 95，它可能会继续推进上线；如果只看到 77，它可能会重复修已经关闭的问题；如果只看到 96，它又可能忘了这个 96 仍然是 local controlled candidate，不是 production 放行。

问题不在记忆多少，而在判断结构。材料如果没被压成「当前可用结论」，下一次协作里就会变成污染源。

影响很实在。每次换窗口、换 AI、换一天，我都要重新解释：这份报告已经过期，那份只是 owner report，不是 independent audit；这个 PASS 是 local-only，不是上线许可；那个结论只是为了推进讨论，后来已经被推翻。

浪费时间还是小事。更麻烦的是旧判断复活，中间状态被误读成完成态，AI 在错误前提上继续写计划。它写得越顺，我越容易被带偏。

我试过的错误解法：把一切都存下来

最自然的反应是加记忆：怕丢，就全量保存。聊天也存，日志也存，报告也存，最好每句话以后都能搜到。

但这条路很快会反过来咬你。全量保存只解决「有没有材料」，不解决「这条材料现在还能不能用」。向量库能召回相似内容，但不会自动知道哪句话是试探，哪份报告已经被审计推翻，哪个结论只适用于本地预览。

我后来不再追求「让 AI 记住更多」。我更关心另一件事：让它少误用。

所以我开始做 Knowledge Model。它不是什么新名词，也不是另一个知识库工具。它是一套现场收工规则：每天产生的材料，哪些只做证据，哪些进入当前状态，哪些变成长期规则，哪些应该直接丢掉。

我的方法：四个问题决定一条材料能不能升格

一段内容就算「看起来有用」，也得先过四个问题，才进长期记忆：

第一，问题是什么。别泛泛说「上下文不足」，要说清楚哪个判断错了、哪个边界混了、哪个状态被误读了。
第二，它造成了什么影响。是浪费了一次接手时间，还是让旧结论复活，还是差点把 local-only 当成上线许可。
第三，我后来怎么看待这个问题。判断方式发生了什么变化，为什么不能再按原来的方式处理。
第四，下次要怎么做。它最后应该变成一条规则、一个 checklist、一个 skill、一个 task contract，还是只保留原始证据。

四个问题答不上来，就别急着叫知识。它最多是一段记录。

Knowledge Model 从原始材料、工作片段、判断，压缩到规则和长期资产

我把知识分成四层，不让它们互相冒充

材料现在被我分到四个位置。

原始证据层：聊天、日志、截图、测试输出、diff。只证明事情发生过，不直接指导下一步。
当前状态层：任务 README、notes、handoff、state 文件。回答「现在到底到哪一步」。
长期规则层：AGENTS.md、skills、checklist、memory 条目。用来改变以后 AI 的行为。
公开表达层：文章、复盘、方法论。把内部经验改写成别人也能理解的经验。

这四层不能混。证据不能冒充状态，状态不能冒充规则，规则也不能直接暴露成公开文章。很多混乱，都来自这些层混在一起：一段聊天被当成规则，一份报告被当成 verdict，一个 memory 摘要被当成当前状态。

它的作用很简单：不是帮我记住所有东西，而是逼我把东西放到正确的位置。

结果：不是记忆变多，而是交接变轻

结果不是 AI 突然什么都懂，而是接手成本下降。

新窗口不用先翻完整聊天史。它应该先看当前状态，再看最近 notes，再看 handoff，再根据需要追原始证据。它不应该从一个漂亮报告开始推断当前结论，更不应该从 memory 摘要直接决定下一步。

长期知识不是「我以前说过什么」的仓库，而是「我以后不想再重复什么」的工具。一次施工现场如果没收工，就只是一堆材料；收工之后，才可能变成下次开工时能用的资产。

我的 Knowledge Model，不是让 AI 记住更多，而是让 AI 少误用旧材料。

每次任务结束，我要留下的不是完整聊天，而是四样东西：问题、影响、判断变化、下一次动作。这四件事答得上来，经验才值得进长期知识；答不上来，就留在证据层，别污染未来的判断。