这是什么 · 一页讲清
市面上的 AI 视频,给你的是一段"看着像 AI、却空无一物"的素材。我们做的是另一件事:陪你把一个念头,经由一支懂得推敲的 AI 剧组,锻造成一部真正的作品——有立意、有分量、经得起反复看,而其中每一个选择,都服务于它的主题。
因为生成模型给出的,是它见过的所有同类视频的平均值。你请它做一条世界杯牛奶广告,它便把上千条同类广告揉作一团,回你一版最不会出错、也最无新意的:那束金光、那个慢镜、那张谁都不是的脸。
它能给的是表面:一帧好看的画。它给不出的是意图:这部作品究竟要说什么,为何是这个人、这身衣裳、这束光。而平均值的另一个名字,正是俗套。
一部真正动人的作品,不会按一下按钮便凭空而出;它是一层一层立起来的。每一层都是一个判断:谁是主角、何以是她、着何衣、光从何来、用何色、镜头落于何处、何时而切。
而所有这些判断,都朝向同一个主题(这部作品到底要说什么)。让万般选择归于一个主题,这件事,古来便叫导演。我们所造的,是一支替你完成此事的 AI 剧组。
一句话
生成,给你的是峰顶的一帧平照;导演,是峰顶之下那座山。我们造的,是那座山。
我们不发明新流程,而是借电影业最成熟的四个阶段:开发 → 前期筹备 → 拍摄 → 后期(发行暂不在此讨论)。下面这几步,正落在这四个阶段里——而且一步比一步贵:开发与筹备几乎全在便宜的文字与草图上完成,只有定死的镜头才进入昂贵的拍摄与后期。这是电影业用一百年验证过的"先想清,再开机"。
核心阶段:案头工作
产品真正的卖点,不是一句话生成视频,而是这一段功夫。主题、故事、人物都已锁定,剧组也已选好,真正动手之前,主创围坐下来,在纯文字里把整部作品想透。这件事,戏剧与电影沿用了一百年,称作案头工作。详见下文专节。
可以是一桩品牌命题(三元牛奶欲做一支世界杯广告),也可以是一个曾打动你的瞬间(餐厅里,一个女孩悄然替吃不起饭的老人付了账)。无论是什么,只要它曾触动你。
掘这个品牌的调性、欲推的产品、本届世界杯的特点、不可触碰的红线(如无官方授权,则不得使用世界杯标识),以及世上同类作品曾如何作答。掘罢,带回几个不同的方向,而非一个答案。
导演、编剧坐下来反复推敲、彼此质疑,定下这部作品的根:要说的那个主题、讲谁的故事、何以是这个人、何时、何地。这是最要紧的一步,全凭文字,不需一帧画面。它如何打磨,见下一节。
主题既定,制片人按它配一组人:演员,以及导演、摄影、美术等剧组成员。这组人的品味,决定了后面每一层的取舍。
导演带主创在纯文字里,逐拍定"这镜要传达什么、为什么、最朴素怎么拍"——只定拍什么,不碰机位。这才是产品真正的卖点。
质感、表演、服装、场景、构图、光、色、剪辑、声音,逐层而上,每加一层都问一句:它,服务于主题吗?先以廉价草图反复推敲,推敲妥帖,再论其余。
唯有已然定下、确证服务于主题的那几个镜头,才动用最贵最好的模型渲为成片。金,用在刀刃上。
立基不是无序的争辩,而是一套有框架的推敲。剧组沿一条循环逐轮收敛:观察 → 定向 → 决断 → 再问(此循环军事上称 OODA)。导演守主题、编剧守人物、另有一人专挑俗套;而"合理性"的质疑不单设一角,它融进每一个角色——各自从自己的领域挑不合理(编剧:旧球怎会收在柜子里?)。
将调研带回的几个发散方向并列,连同 AI 自己倾向的那个俗套默认,一并审视。
逐个质问:它服务主题吗?是具体而真,还是借来的平均?把选择从"俗套均值"往"具体而真"里挖。
给出有理由的方向与备选,交制片人(你)拍板。剧组提议,你决定。
这个决断会暴露下一个该问的:何以是这个人?何以是单亲?于是回到观察,再走一轮。必要时,回头质疑主题本身。
这一步的产物
一份锁定的"创作纲领"(story bible):主题、故事、人物(及何以是这几个人物)、对白、时间、场景。地基既稳,上面每一层画面才知道自己为何而立。
三条纪律:先立主题,后谈故事;每一个细节(为何是父亲、为何北京、为何凌晨)都走一圈推敲;并把否决掉的理由一并留存——那才是真正的依据。
立基不是一道流程,是一场 loop
尤其是开放的创作(给你的是一个瞬间、一段文字,而不是一句封闭的商业命题),可走的方向极多,屋子会在这里停留很久:发散出许多方向,收敛到一个,又推翻、再发散。"否决整个主题、从头再来"是一个随时能按的按钮,不是失败后的退路。商业广告约束多、收敛快;开放创作发散大、回环多。
屋子不问"开放题",只递"会启发的问题"
"你想讲什么?"这种开放题没有抓手。会启发的问题是一扇具体的门,带着一个角度让你撞上去反应:重构(这是关于善良,还是关于"被不被看见"?)· 反转(如果他其实知道呢?)· 接你自己(你自己什么时候做过一件不需人知的事?)· 找矛盾(她图什么?戏就在"没有回报"里)· 烧俗套(俗套版是善有善报,烧掉它)· 换命题(或者这根本是关于旁观者?)。每一个都附着一个角度,不是空问。
打磨地基的几条心法(从真实讨论里长出来的)
选角既定、真正动手之前,主创围坐下来,在纯文字里把整部作品想透。这是戏剧与电影沿用百年的传统,称作案头。它是整条线真正的功夫所在,也是这个产品的核心:人当制片人,AI 当主创,一桌人把每个镜头"要传达什么、为什么"议清楚——全程没有一张画面。
这一桌,要回答什么
先把那一句话的主题立住,顺着它定下每个角色与全片的脊柱,再逐一议定每个镜头要让观众知道什么、感受到什么,以及它如何回到这一个主题。它只回答"拍什么、为什么",不回答"怎么拍"——机位、景别、构图,都留到后面的分镜。把意图在文字里定死,分镜不过是把它翻成画面。
案头分两半:导演阐述 → 主创阐述
这一桌的工作分两步,都是电影业沿用的真实文书。先是导演阐述:导演把主题、脊柱、以及每一拍的意图(即"节拍表")定下来。再是主创阐述:摄影、美术、表演、声音各写一份自己的创作阐述,挂在这些节拍上,把本行当那条线在文字里写清楚。而在主创阐述里,导演还要回到桌前当评估者,逐份审这些阐述符不符合那一个主题——这正是产品『主题一致性判断』在案头里的落点。两份阐述写完、且都弹回主题,案头才算收口,才轮到分镜。全程仍是纯文字。
谁在桌前,各议什么
怎么做(借自几位大师的案头法)
何以是核心
所有大师都先在文字里把电影决定完,再去预演、预剪。若直接跳到带机位的分镜,等于让"怎么拍"抢在"拍什么"前头——镜头便回不到主题,也绕不开俗套。案头这一桌,正是把"人当制片人、AI 当主创团队"真正落到实处的地方,也是任何"一句话生成视频"给不出的东西。
文字优先,一直贯穿到底:连分镜也先做文字版(每一拍的景别、机位、运动先用文字写定),再出草图,最后才动用最贵的模型渲成片。越往后越贵,所以越往前越要在文字里想清。
一部作品由近二十层构成,分三段。它们不是并列的旋钮,而是层层相依:塑料的脸无法演戏,未经设计的世界无从取景。每一层都朝向主题,且每一层(一站)之内,还分更细的板块。右侧标注它该用哪一档模型。
出图也分火候(渲染到够做决定就停)
"图"这一档里还分四级,从便宜到贵:线稿(定构图)→ 黑白光影稿(定光影——看光影的传统工具,便宜到能改几百遍)→ 色彩稿(定色彩)→ 写实渲染(仅锁定的镜头才上,最贵)。每一档只回答一个决定,渲染到够你拍板就停;直接上写实,等于在没定的细节上把决定做错、还被它锚死。
一致性是挣来的:只锁已经定了的那个变量,线稿和光影稿要割断,太早求一致就是假精确、会误导。详见 草图的火候。
其一,是一支会推敲、会彼此质疑的剧组,而非一个 AI 给一个答案。一个 AI 只会回你那个平均值(亦即俗套)。唯有一群各执立场的角色——导演守主题、编剧守人物、另有一人专挑俗套——相互辩诘、向具体处深掘,才能掘出一个真而新的东西。这场质疑本身,就是对抗俗套之法。
其二,金用在刀刃上。推敲与试错之时,用廉价草图,几分钱可改数十遍;唯方向已定、确证服务于主题的镜头,才以重金渲一次。该以文字想清的不必画,该以草图推敲的不必急于成片。
你始终是导演与制片人。剧组替你完成繁杂的推演,把选项与理由一一陈于案上;而每一个判断,皆由你拍板、由你执掌。AI 提议,你决断。
留与你的,是审美、故事的走向、价值的取舍、你欲言说的那个主题;交与 AI 的,是反复试错的繁役。是解放,而非替代。
为谁而作
为认真的创作者,亦为愿成就一部有分量的作品、而不止于一段素材的品牌。若你只求一段"堪用"的快片,市面工具已足;若你在意它究竟说了什么,此物方为你而设。