我把“做个视频”拆成了九个节点

林鹿视频工厂 · 工程复盘

林鹿我折腾好几周了，一直一个毛病：我跟 AI 一块儿，能修出一个还行的视频，可下一个还得从头来。我要的不是修好一个片子，是林鹿自己能做片子——给它一句话，片子出来。这是两码事。修一个，是手艺；能自己做，得是一台机器。

这一周我干的，就是把“做个视频”拆成一条九个节点的流水线，从“把一句话逼成一张需求单”，一直到“开渲前最后一道闸”。九个节点我不一条条念——念完就是张清单。挑三件真费了劲、也真想明白点事的说。

第一件：我为什么不信它说“干完了”。

上回那次事故（换了个模型它当场就疯了）给我上了一课：AI 会一脸笃定地告诉你“干完了”“一切正常”，其实啥也没成。所以这条线我立了条死规矩——每个节点说“我做完了”都不算数，得配一道闸，自己跑一遍、吐出 exit 0，才算完。它的嘴我不听，我只认闸。

这不是跟谁赌气。是把“完成”这件事，从一句嘴上的话，变成一个能复算的事实。九个节点，九道闸。哪道是红的，这条线就过不去。

第二件：怎么锁住一张“没有脸”的脸。

整条线最难的是锁脸——让同一个角色，跨十几个镜头，还是同一个人、同一个东西。

我先用 MiniMax 的一个功能，拿一张定妆照去锁。写实角色——真人脸那种——锁得住。可我这片子里有几个角色压根没有脸：一个无面黑圆环、一个复眼、一个字母面具。我让它去锁那个圆环，它给我吐了一堆随机真人脸。彻底失败。根因一句话：那工具是冲着“人脸”去的，你给它一个没脸的设计，它无从下手。

这地方机器判不了，得我看。我盯着六张定型图看完，拍板：写实那三个，第一套够用；没脸那仨，换第二套——本地 ComfyUI 那条线，不锁脸，锁设计。圆环还是那个圆环，复眼还是那个复眼。

第三件：机器到哪儿为止，剩下的归我。

最后一道闸能验什么？这张图打不打得开、是不是 9:16、扫一遍有没有混进文字、两张脸的相似度是多少。机器能数的，数得很准。

它数不了的是：像不像那个角色、有没有电影感、有没有魂。这些它一个都判不了。

所以九个节点里，我埋了五个断点。每到一个，机器必须停下等我，我不签字它过不去：锁脸用哪套、这片子长什么样、每个角色走哪个方向、定型像不像、最后开渲前那二十张关键帧。最后那个，我一张一张看完，说一个字：“过。”

那个“过”也不是冲着“全绿”说的。有一张背景飘着个很淡的虚字，有十一张相似度报了“漂移”——多半是远景、多人的镜头，脸本来就小，数飘正常；那几个没脸的角色干脆判不了，看的是眼睛，稳。这些我都知道、都认，然后放行。机器给我摆事实，拍板的是我。

那一句“画面里不准出现文字、竖屏 9:16、中景平视”——这种铁律我也一次定死，以后所有林鹿的片子都照这个来。定一次，省后面一百次。

这一周我真正立住的，是一条线、一条规矩。线，是九个节点九道闸：AI 说“完成”我不听，我听闸。规矩，是机器只管它数得清的机械层，剩下“像不像、有没有魂”，我用五个断点把眼睛摁上去。

verify 全绿，不等于成片能用。这句话我刻在这台机器脑门上了。

画面这条线，只把“长什么样”定死了。真动起来——分镜怎么转、镜头怎么动、配音配乐——是下一摊。但脊椎立住了。林鹿离“自己会做片子”，近了一节。

附：这条线的九个节点

把这篇记录接到下一步