画面技术要求 · 模型选型(三个同步文件之一)
出多真,不取决于"模型能多真",而取决于你这一步要做的那个决定。草图是要反复改的,所以贵的不是单张渲染,而是在没定的细节上把决定做错、还被它锚死。一条从便宜到贵的火候阶梯,每一档只回答一个决定,只渲染到够你拍板为止。
每一档草图都故意抽掉别的变量,好让一个决定能被干净地判断——细节和颜色会盖住骨架,让你看不清结构本身对不对。所以:构图在线稿上定,光影在黑白上定,色彩在色彩稿上定,从不把三件事搅在一起判断。关键一条:光影要看"明暗的块",不是看线。一张线稿根本编码不了"灯打对没有";而一张只有两三个调子的黑白稿(notan)正是测光影的传统工具——电影摄影师、概念设计师都在黑白里试光,就是这个道理。
为什么不能"AI 时代直接上写实"
能,但你没有跳过决定,只是把决定隐式地、在被编造的细节上做了,还锁死。代价四条:① 你在判断构图和光影时,眼睛被模型瞎编的质感、皮肤、玻璃带跑,看不出骨架对不对;② 一张"看着完成"的图把全队锚死在没人真正决定过的一堆细节上;③ AI 写实图每改一次就糊一档,三四次后不可用——而黑白稿改一次只要几秒;④ 写实图贵、难改,你只敢试两版就过早收敛。
价格为 2026 年的约数、易变(见末尾说明);用《奶箱响的那个清晨》举例。
这片可压成一次快速 blockout,别独立深做——光是它的实质,线条说不清光。
光是这片的实质,线条画不出"灯打对没有"。把第 1 档压成一次快速 blockout(1–2 张,只定灯、发光的瓶、两件物证、脸的位置),立刻进黑白光影稿——真正的决定在那儿。但别把构图完全跳过:位置不先定,后面每一档都在动地基。
写实现在便宜($0.04/张),但便宜不是关键,"在错的决定上花钱"才是。先写实=你在被编造的质感里判断光影,看不出骨架;且过度承诺、锚死、改了就糊。只有当某一拍的"写实质感本身"成为待定决策时(比如瓶身玻璃到底怎么折射光),才升到写实。
规则:待在一档,直到它回答完它那一个问题,再往上爬;绝不为了躲一个决定而升档。本片迭代最重的就是光影那一档——而它恰好最便宜。
一笔账(本片)
100 张黑白光影稿 ≈ $0.30(Flux schnell);500 张 ≈ $1.50。
一张过早的写实高清 ≈ $0.25——可一旦构图/光影本就错了,这 $0.25 全白花,还把你锚死在错的细节上。
便宜档可以试几百次;贵档只在锁定后出一次。钱花在"看 look 真正所在"的地方。
可控性(让每次迭代只动想动的那个变量):用开源栈(SDXL/SD3.5/Flux)+ ControlNet——因为闭源按 token 计价的模型(gpt-image、Gemini)没有 ControlNet、没有真 img2img 图控,每次调用都重画构图。机制:第 1 档锁版一次,作为 ControlNet 条件喂给后面每一档,这样换光不动构图、换色不动光影,迭代才真便宜、可逆。
更干净的测光工具:灰盒三维(Blender)——示意房间灰块 + 替身人偶 + 摆好的灯,出的是纯光影、零编造的情绪/姿势/道具,且天生一致(只动灯,别的不动)。代价:要先装 Blender、搭一个示意场景。判断光这件事,它比任何 2D AI 图都干净。
1–2 张线稿/粗块,把灯、发光的瓶、两件物证、脸的位置定下来,作为后面所有档的 ControlNet 锁版。
逼出 2–3 个调子:冷蓝读不读得出是环境光?暖台灯是不是唯一的主光?冰瓶是不是一团自发光的亮?两件物证稳在暗部?脸那处松看不看得见?在这里改几十上百遍。
只给关键几拍(1 看球、5a/5b 冰瓶、6 灯、8 脸):冷蓝与暖灯的冷暖编码对不对。从锁定的黑白稿 img2img,只动颜色。
构图、光影、色彩都拍板后,锁定的那几拍才动用最贵的模型渲成片;别的镜头不浪费这笔钱。
一致性是挣来的,不是默认的:只锁已经定了的那个变量,没定的绝不锁。太早要求一致,等于把没定的东西显得像定了——这是"假精确",会让全队在错的确定性上往下走,比不一致更危险。