OpenClaw 可信系统笔记
系统能跑,不代表我敢托付。
一个个人 AI 系统最容易让人误判的时刻,是它第一次跑起来的时候。
服务启动了,页面打开了,Agent 能回话了,工具也能调用了。这个时候很容易说:好了,系统完成了。
但我现在越来越觉得,能跑只是第一层。真正麻烦的是:明天还能不能接上,另一个 AI 能不能看懂,出了错能不能复盘,我能不能放心把下一步交给它。
所以后来我补的不是“再换一个更聪明的模型”,而是一套让它能被检查、被交接、被恢复的工作系统。
01 / 能跑的幻觉
它会回答,不等于它知道自己在做什么
很多 AI 系统看起来已经能工作:能聊天、能写文件、能跑脚本、能调用外部工具。
但如果它不知道哪些文件才是真相源,不知道哪些动作需要停下来确认,不知道上一次为什么做出那个判断,那它只是“正在运行”,不是“可以托付”。
我自己踩过最多的坑,就是把一次成功执行当成系统能力。其实真正要看的不是这次有没有跑通,而是下次能不能稳定复现。
于是我的解决方案很朴素:把那些容易散在聊天里的东西,全部搬到可检查的文件、任务目录和证据链里。
文件真相源
状态不能只靠聊天记忆,要落到项目状态文件、任务目录和输出目录。
任务契约
每个任务写清楚目标、边界、输入、输出、验收和停止条件。
记忆资产
不是多记聊天,而是沉淀以后能搜索、复用、评分和迭代的判断。
证据链
重要结论要能追到来源、产物、测试、截图、报告或复盘。
Handoff
今天这个 AI 做完,明天另一个 AI 或明天的我能继续接手。
本地受控
可信之前,只做 local candidate,不急着碰真实外发和生产动作。
02 / 我的第一步
先把真相源从聊天搬到文件
以前很多状态会留在聊天里:我们做到了哪一步,哪个结论被推翻了,哪个文件才是最新版本,哪个动作只是跑通过一次。
现在我会尽量把这些东西压进真实文件:项目状态、当前任务、notes、outputs、handoff、验证截图、构建日志、审计表。聊天可以帮助推进,但不能独占真相。
这一步听起来很笨,但很关键。因为只要真相源还在聊天里,系统就很难交接;只要真相源落到文件里,另一个 Agent 才能重新进入现场。
03 / 任务契约
任务不再是一句聊天请求
我会把复杂任务写成一个小契约:干什么,哪些不做,依赖什么,怎么算完成。
这样 Agent 就不是“看情况发挥”,而是在一个明确边界里推进。
04 / 记忆资产
不是让它什么都记住
我真正想要的不是“它什么都记得”,而是关键经验能被检索、复用、评分和迭代。
记忆不是收藏夹。它要变成下次能用的工作资产。
05 / 证据、审计和交接
可信,是别人能复盘,明天能继续
我现在不太愿意只写“已完成”。我更想看到的是:用了什么来源,改了什么文件,产物在哪里,怎么验证,哪里还有警告。
这也是为什么我会保留 notes、outputs、截图、构建结果、审计结论和 handoff。它们不是形式主义,是让系统能被下一个人、下一个 AI、下一次会话接住。
在这之前,我宁愿把它叫本地受控候选版本。它可以证明方向,但不等于可以上线,不等于可以外发,不等于可以碰真实交易或生产动作。