← 回前期筹备

画面技术要求 · 模型选型(三个同步文件之一)

草图的火候

出多真,不取决于"模型能多真",而取决于你这一步要做的那个决定。草图是要反复改的,所以贵的不是单张渲染,而是在没定的细节上把决定做错、还被它锚死。一条从便宜到贵的火候阶梯,每一档只回答一个决定,只渲染到够你拍板为止。

这是三个需要同步维护的文件之一:概念(产品理念)· 案例(三元走查)· 画面技术要求(本页)。本页只管画面这块的技术要求与模型选型——是技术,不是艺术追求:每一档画面该长什么样、用什么模型、多少钱、从哪开始要求一致。
01

一个原则:渲染到够做决定就停

每一档草图都故意抽掉别的变量,好让一个决定能被干净地判断——细节和颜色会盖住骨架,让你看不清结构本身对不对。所以:构图在线稿上定,光影在黑白上定,色彩在色彩稿上定,从不把三件事搅在一起判断。关键一条:光影要看"明暗的块",不是看线。一张线稿根本编码不了"灯打对没有";而一张只有两三个调子的黑白稿(notan)正是测光影的传统工具——电影摄影师、概念设计师都在黑白里试光,就是这个道理。

为什么不能"AI 时代直接上写实"

能,但你没有跳过决定,只是把决定隐式地、在被编造的细节上做了,还锁死。代价四条:① 你在判断构图和光影时,眼睛被模型瞎编的质感、皮肤、玻璃带跑,看不出骨架对不对;② 一张"看着完成"的图把全队锚死在没人真正决定过的一堆细节上;③ AI 写实图每改一次就糊一档,三四次后不可用——而黑白稿改一次只要几秒;④ 写实图贵、难改,你只敢试两版就过早收敛。

02

四档火候(每档只回答一个决定)

价格为 2026 年的约数、易变(见末尾说明);用《奶箱响的那个清晨》举例。

1线稿 / blockout

回答构图:景框、视高、灯/瓶/两件物证/脸放在哪。模型手绘,或 Flux schnell / SDXL+ControlNet-lineart,纯线。约成本~$0.003/张(手绘免费);通常只画 1–2 张。长什么样纯线、块状摆位,只标位置;无光、无色、无情绪。

这片可压成一次快速 blockout,别独立深做——光是它的实质,线条说不清光。

2黑白光影稿(notan)· 本片主力

回答光影:冷蓝的环境光、那盏唯一的暖台灯、那只"会发光"的冰瓶、两件物证落在暗部、脸上那处松。这片的全部实质。模型自建 SDXL/SD3.5 + ControlNet-depth(锁住第 1 档的版)+ 去色/灰度;或 Flux schnell。约成本~$0.001–0.003/张。绝大多数迭代都花在这一档。长什么样平涂 2–3 个调子、块面化;人物只是剪影色块,无五官、无定死的姿势、无情绪;中性(不准凄凉/惨);道具克制(瓶上水珠别过量)。技术验收:一旦渲出成片般的情绪/姿势/细节即不合格——它会污染你对光的判断。抽象不是省事,是保护判断。

3色彩稿 / color key

回答色彩与情绪:冷蓝 vs 暖灯的冷暖编码,跨镜头的色彩节奏。模型从锁定的黑白稿做 img2img + ControlNet 保版,让色彩单独变。约成本~$0.003(开源栈)– $0.039(Gemini)/张;只给关键几拍。长什么样低细节,只给冷暖与情绪编码;构图、光影沿用已锁的。

4写实渲染 · 仅锁定镜头

回答质感/真实感:皮肤微观、玻璃折射、瓶身表面。模型gpt-image medium 或 Gemini(nano banana)出干净一致的成片帧。约成本~$0.039–0.042/张;high ~$0.25/张(这是成片价,不是草图价)。长什么样全质感、全细节、可上色;仅锁定镜头才出。
03

你的两个问题,答复

要不要涂鸦这一档?——基本跳过纯线稿

光是这片的实质,线条画不出"灯打对没有"。把第 1 档压成一次快速 blockout(1–2 张,只定灯、发光的瓶、两件物证、脸的位置),立刻进黑白光影稿——真正的决定在那儿。但别把构图完全跳过:位置不先定,后面每一档都在动地基。

要不要直接切相对真实的图?——不要

写实现在便宜($0.04/张),但便宜不是关键,"在错的决定上花钱"才是。先写实=你在被编造的质感里判断光影,看不出骨架;且过度承诺、锚死、改了就糊。只有当某一拍的"写实质感本身"成为待定决策时(比如瓶身玻璃到底怎么折射光),才升到写实。

04

怎么平衡成本:按价值升档(VOI)

规则:待在一档,直到它回答完它那一个问题,再往上爬;绝不为了躲一个决定而升档。本片迭代最重的就是光影那一档——而它恰好最便宜。

一笔账(本片)

100 张黑白光影稿 ≈ $0.30(Flux schnell);500 张 ≈ $1.50
一张过早的写实高清 ≈ $0.25——可一旦构图/光影本就错了,这 $0.25 全白花,还把你锚死在错的细节上。
便宜档可以试几百次;贵档只在锁定后出一次。钱花在"看 look 真正所在"的地方。

可控性(让每次迭代只动想动的那个变量):用开源栈(SDXL/SD3.5/Flux)+ ControlNet——因为闭源按 token 计价的模型(gpt-image、Gemini)没有 ControlNet、没有真 img2img 图控,每次调用都重画构图。机制:第 1 档锁版一次,作为 ControlNet 条件喂给后面每一档,这样换光不动构图、换色不动光影,迭代才真便宜、可逆。
更干净的测光工具:灰盒三维(Blender)——示意房间灰块 + 替身人偶 + 摆好的灯,出的是纯光影、零编造的情绪/姿势/道具,且天生一致(只动灯,别的不动)。代价:要先装 Blender、搭一个示意场景。判断光这件事,它比任何 2D AI 图都干净。

05

这条片子,怎么走

一次 blockout

定位置

1–2 张线稿/粗块,把灯、发光的瓶、两件物证、脸的位置定下来,作为后面所有档的 ControlNet 锁版。

黑白光影稿主力 · 反复在这

定光影

逼出 2–3 个调子:冷蓝读不读得出是环境光?暖台灯是不是唯一的主光?冰瓶是不是一团自发光的亮?两件物证稳在暗部?脸那处松看不看得见?在这里改几十上百遍。

色彩稿

定色彩

只给关键几拍(1 看球、5a/5b 冰瓶、6 灯、8 脸):冷蓝与暖灯的冷暖编码对不对。从锁定的黑白稿 img2img,只动颜色。

写实渲染仅锁定镜头

才上真

构图、光影、色彩都拍板后,锁定的那几拍才动用最贵的模型渲成片;别的镜头不浪费这笔钱。

一句话:先在黑白里把光影吵明白,再谈颜色,最后才谈真实。你做决策要看的光影,黑白稿就给得出,而且便宜到可以反复改。
06

一致性,从哪一档才开始要求

一致性是挣来的,不是默认的:只锁已经定了的那个变量,没定的绝不锁。太早要求一致,等于把没定的东西显得像定了——这是"假精确",会让全队在错的确定性上往下走,比不一致更危险。

探索之内 · 不要求一致

为什么同一拍的多版线稿、多版光影稿,本就该互不相同——发散是为了比较和选。强求一致会杀掉探索。

线稿 ⊥ 光影稿 · 必须割断

为什么文字稿是"大概的表述",由它来的线稿只是用完即弃的草思;而构图与光影是纠缠的(常要先看到怎么打光,才知道构图对不对)。把这种线稿硬锁进光影稿,等于把光影判断关进一个可能错的构图里,反而误导。让光影稿自由重新找构图。

棘轮上锁 · 定一个才锁一个

顺序构图定 → 锁构图(带进光影);光影定 → 锁光影(带进色彩);色彩定 → 锁色彩(带进写实)。每锁一个已定的变量,下游才对它要求一致。

跨镜头一致 · 最晚才严格

怎么保持同一张老周的脸、同一间屋、同一只瓶贯穿九拍——到写实/成片层才严格;在那之前,先由美术阐述与角色脊柱在文字里锁住世界与人物,图再慢慢对齐。
哪里不要求一致,和哪里要求一致,同样重要——前者保护探索,后者保护成片的连贯。文字阶段出不出线稿都行,但出了就当草稿、用完即弃,绝不让它假装成已定的画面。