林鹿视频工厂 · 工程复盘
林鹿我折腾好几周了,一直一个毛病:我跟 AI 一块儿,能修出一个还行的视频,可下一个还得从头来。我要的不是修好一个片子,是林鹿自己能做片子——给它一句话,片子出来。这是两码事。修一个,是手艺;能自己做,得是一台机器。
这一周我干的,就是把“做个视频”拆成一条九个节点的流水线,从“把一句话逼成一张需求单”,一直到“开渲前最后一道闸”。九个节点我不一条条念——念完就是张清单。挑三件真费了劲、也真想明白点事的说。
第一件:我为什么不信它说“干完了”。
上回那次事故(换了个模型它当场就疯了)给我上了一课:AI 会一脸笃定地告诉你“干完了”“一切正常”,其实啥也没成。所以这条线我立了条死规矩——每个节点说“我做完了”都不算数,得配一道闸,自己跑一遍、吐出 exit 0,才算完。它的嘴我不听,我只认闸。
这不是跟谁赌气。是把“完成”这件事,从一句嘴上的话,变成一个能复算的事实。九个节点,九道闸。哪道是红的,这条线就过不去。
第二件:怎么锁住一张“没有脸”的脸。
整条线最难的是锁脸——让同一个角色,跨十几个镜头,还是同一个人、同一个东西。
我先用 MiniMax 的一个功能,拿一张定妆照去锁。写实角色——真人脸那种——锁得住。可我这片子里有几个角色压根没有脸:一个无面黑圆环、一个复眼、一个字母面具。我让它去锁那个圆环,它给我吐了一堆随机真人脸。彻底失败。根因一句话:那工具是冲着“人脸”去的,你给它一个没脸的设计,它无从下手。
这地方机器判不了,得我看。我盯着六张定型图看完,拍板:写实那三个,第一套够用;没脸那仨,换第二套——本地 ComfyUI 那条线,不锁脸,锁设计。圆环还是那个圆环,复眼还是那个复眼。
第三件:机器到哪儿为止,剩下的归我。
最后一道闸能验什么?这张图打不打得开、是不是 9:16、扫一遍有没有混进文字、两张脸的相似度是多少。机器能数的,数得很准。
它数不了的是:像不像那个角色、有没有电影感、有没有魂。这些它一个都判不了。
所以九个节点里,我埋了五个断点。每到一个,机器必须停下等我,我不签字它过不去:锁脸用哪套、这片子长什么样、每个角色走哪个方向、定型像不像、最后开渲前那二十张关键帧。最后那个,我一张一张看完,说一个字:“过。”
那个“过”也不是冲着“全绿”说的。有一张背景飘着个很淡的虚字,有十一张相似度报了“漂移”——多半是远景、多人的镜头,脸本来就小,数飘正常;那几个没脸的角色干脆判不了,看的是眼睛,稳。这些我都知道、都认,然后放行。机器给我摆事实,拍板的是我。
那一句“画面里不准出现文字、竖屏 9:16、中景平视”——这种铁律我也一次定死,以后所有林鹿的片子都照这个来。定一次,省后面一百次。
这一周我真正立住的,是一条线、一条规矩。线,是九个节点九道闸:AI 说“完成”我不听,我听闸。规矩,是机器只管它数得清的机械层,剩下“像不像、有没有魂”,我用五个断点把眼睛摁上去。
verify 全绿,不等于成片能用。这句话我刻在这台机器脑门上了。
画面这条线,只把“长什么样”定死了。真动起来——分镜怎么转、镜头怎么动、配音配乐——是下一摊。但脊椎立住了。林鹿离“自己会做片子”,近了一节。
附:这条线的九个节点
- 1 指令收敛 —— 把一句话逼成一张填满的需求单(六个槽都填满 + 题眼得带张力,不能是一堆名词堆)。
- 2 故事成形 —— 需求变故事(这轮做得轻,先搭架子,是个内容门)。
- 3 剖本分解 —— 拆成角色 / 场景 / 道具 / 服装四类清单,每件独立编号、来源不悬空。
- 4 视觉基调宪法 —— 给整片定统一长相(写实电影 + 锁死色板 + 画面无字 / 9:16 / 中景平视),一次定死、以后永久复用。
- 5 概念探索 —— 每个角色出几个方向,待我挑。
- 6 定型锁定 —— 锁脸 / 锁设计,整条线的脊椎(双轨:MiniMax 锁真人脸,本地 ComfyUI 锁没脸的设计)。
- 7 镜头设计 —— 给每个镜头补灯光和轴线(180° 别串)。
- 8 关键帧 —— 带参考图,把每镜的关键帧画出来。
- 9 开渲前 QC —— 最后一道机器闸(能否解码 / 是否 9:16 / OCR 查文字 / 跨镜相似度打分)。