← 返回首页

这是什么 · 一页讲清

把一个念头,锻造成一部作品

市面上的 AI 视频,给你的是一段"看着像 AI、却空无一物"的素材。我们做的是另一件事:陪你把一个念头,经由一支懂得推敲的 AI 剧组,锻造成一部真正的作品——有立意、有分量、经得起反复看,而其中每一个选择,都服务于它的主题

这一页写给所有人,不必懂电影,也不必懂技术。

01

为什么 AI 视频,精致却空洞?

因为生成模型给出的,是它见过的所有同类视频的平均值。你请它做一条世界杯牛奶广告,它便把上千条同类广告揉作一团,回你一版最不会出错、也最无新意的:那束金光、那个慢镜、那张谁都不是的脸。

它能给的是表面:一帧好看的画。它给不出的是意图:这部作品究竟要说什么,为何是这个人、这身衣裳、这束光。而平均值的另一个名字,正是俗套

02

一部作品是"立"出来的,不是"生成"出来的

一部真正动人的作品,不会按一下按钮便凭空而出;它是一层一层立起来的。每一层都是一个判断:谁是主角、何以是她、着何衣、光从何来、用何色、镜头落于何处、何时而切。

而所有这些判断,都朝向同一个主题(这部作品到底要说什么)。让万般选择归于一个主题,这件事,古来便叫导演。我们所造的,是一支替你完成此事的 AI 剧组。

一句话

生成,给你的是峰顶的一帧平照;导演,是峰顶之下那座山。我们造的,是那座山。

03

整条线:借电影业的四个阶段

我们不发明新流程,而是借电影业最成熟的四个阶段:开发 → 前期筹备 → 拍摄 → 后期(发行暂不在此讨论)。下面这几步,正落在这四个阶段里——而且一步比一步贵:开发与筹备几乎全在便宜的文字与草图上完成,只有定死的镜头才进入昂贵的拍摄与后期。这是电影业用一百年验证过的"先想清,再开机"。

核心阶段:案头工作

产品真正的卖点,不是一句话生成视频,而是这一段功夫。主题、故事、人物都已锁定,剧组也已选好,真正动手之前,主创围坐下来,在纯文字里把整部作品想透。这件事,戏剧与电影沿用了一百年,称作案头工作。详见下文专节。

一星火开发 · 第一步

你带来一个起点

可以是一桩品牌命题(三元牛奶欲做一支世界杯广告),也可以是一个曾打动你的瞬间(餐厅里,一个女孩悄然替吃不起饭的老人付了账)。无论是什么,只要它曾触动你。

勘探开发 · 第二步

剧组先去深掘

掘这个品牌的调性、欲推的产品、本届世界杯的特点、不可触碰的红线(如无官方授权,则不得使用世界杯标识),以及世上同类作品曾如何作答。掘罢,带回几个不同的方向,而非一个答案。

立基开发 · 第三步(最后一步)

剧组推敲出一个方向

导演、编剧坐下来反复推敲、彼此质疑,定下这部作品的根:要说的那个主题、讲谁的故事、何以是这个人、何时、何地。这是最要紧的一步,全凭文字,不需一帧画面。它如何打磨,见下一节。

选角前期筹备

按主题配剧组

主题既定,制片人按它配一组人:演员,以及导演、摄影、美术等剧组成员。这组人的品味,决定了后面每一层的取舍。

案头前期筹备 · 核心

一拍一拍定意图

导演带主创在纯文字里,逐拍定"这镜要传达什么、为什么、最朴素怎么拍"——只定拍什么,不碰机位。这才是产品真正的卖点。

层叠前期筹备 → 拍摄

再将画面一层层立上去

质感、表演、服装、场景、构图、光、色、剪辑、声音,逐层而上,每加一层都问一句:它,服务于主题吗?先以廉价草图反复推敲,推敲妥帖,再论其余。

成片拍摄 + 后期

最后才以重金成片

唯有已然定下、确证服务于主题的那几个镜头,才动用最贵最好的模型渲为成片。金,用在刀刃上。

04

地基,是如何打磨出来的

立基不是无序的争辩,而是一套有框架的推敲。剧组沿一条循环逐轮收敛:观察 → 定向 → 决断 → 再问(此循环军事上称 OODA)。导演守主题、编剧守人物、另有一人专挑俗套;而"合理性"的质疑不单设一角,它融进每一个角色——各自从自己的领域挑不合理(编剧:旧球怎会收在柜子里?)。

观察

把方向摆上桌

将调研带回的几个发散方向并列,连同 AI 自己倾向的那个俗套默认,一并审视。

定向(最要紧)

对着主题推敲

逐个质问:它服务主题吗?是具体而真,还是借来的平均?把选择从"俗套均值"往"具体而真"里挖。

决断

浮出一个方向

给出有理由的方向与备选,交制片人(你)拍板。剧组提议,你决定。

再问

问一个更好的问题

这个决断会暴露下一个该问的:何以是这个人?何以是单亲?于是回到观察,再走一轮。必要时,回头质疑主题本身。

这一步的产物

一份锁定的"创作纲领"(story bible):主题、故事、人物(及何以是这几个人物)、对白、时间、场景。地基既稳,上面每一层画面才知道自己为何而立。
三条纪律:先立主题,后谈故事;每一个细节(为何是父亲、为何北京、为何凌晨)都走一圈推敲;并把否决掉的理由一并留存——那才是真正的依据。

立基不是一道流程,是一场 loop

尤其是开放的创作(给你的是一个瞬间、一段文字,而不是一句封闭的商业命题),可走的方向极多,屋子会在这里停留很久:发散出许多方向,收敛到一个,又推翻、再发散。"否决整个主题、从头再来"是一个随时能按的按钮,不是失败后的退路。商业广告约束多、收敛快;开放创作发散大、回环多。

屋子不问"开放题",只递"会启发的问题"

"你想讲什么?"这种开放题没有抓手。会启发的问题是一扇具体的门,带着一个角度让你撞上去反应:重构(这是关于善良,还是关于"被不被看见"?)· 反转(如果他其实知道呢?)· 接你自己(你自己什么时候做过一件不需人知的事?)· 找矛盾(她图什么?戏就在"没有回报"里)· 烧俗套(俗套版是善有善报,烧掉它)· 换命题(或者这根本是关于旁观者?)。每一个都附着一个角度,不是空问。

打磨地基的几条心法(从真实讨论里长出来的)

具体 > 普通。主角要是一个具体的人(58 岁的退休车工老周),不是"一个中年男人"。"普通"不等于"模糊"。
给看,别说。身份靠物件与行为露出——一本手写赛程本,就说明他看了一辈子球,不需要一个字、也不碰任何商标。
锚点选人。让锁定的真相(三元 70 年的入户奶箱)去选出"住单位老楼的退休工人",而不是把产品硬塞给一个随便的人。
剪掉点破主题的台词。画面已经承载的,别再用话说一遍——证据胜过煽情;主题那句话,留到末帧。
动机要传记化。他四点醒,是因为 30 年的班把钟拧到了那儿,不是为剧情而醒。
05

案头工作:落到画面之前的那一桌

选角既定、真正动手之前,主创围坐下来,在纯文字里把整部作品想透。这是戏剧与电影沿用百年的传统,称作案头。它是整条线真正的功夫所在,也是这个产品的核心:人当制片人,AI 当主创,一桌人把每个镜头"要传达什么、为什么"议清楚——全程没有一张画面。

这一桌,要回答什么

先把那一句话的主题立住,顺着它定下每个角色与全片的脊柱,再逐一议定每个镜头要让观众知道什么、感受到什么,以及它如何回到这一个主题。它只回答"拍什么、为什么",不回答"怎么拍"——机位、景别、构图,都留到后面的分镜。把意图在文字里定死,分镜不过是把它翻成画面。

案头分两半:导演阐述 → 主创阐述

这一桌的工作分两步,都是电影业沿用的真实文书。先是导演阐述:导演把主题、脊柱、以及每一拍的意图(即"节拍表")定下来。再是主创阐述:摄影、美术、表演、声音各写一份自己的创作阐述,挂在这些节拍上,把本行当那条线在文字里写清楚。而在主创阐述里,导演还要回到桌前当评估者,逐份审这些阐述符不符合那一个主题——这正是产品『主题一致性判断』在案头里的落点。两份阐述写完、且都弹回主题,案头才算收口,才轮到分镜。全程仍是纯文字。

谁在桌前,各议什么

导演 · 主持。立住主题与脊柱,逐一定下每一拍的意图与节拍,以及用最朴素的方式拍什么。
摄影。不急着定机位,先想清影像的方向——这部片靠什么光、什么色、什么质感来承载意义。
美术 · 道具。定这个世界由什么构成、每一件东西说明什么;让道具替人物说话,省下台词。
演员 · 表演。想清人物怎么反应——把心理化成看得见的行为,而不是说出来。
声音。定听觉的世界——哪一个声音是关键,哪里坚决不要配乐。
制片人(你)。参与讨论,在分歧处仲裁、拍板。预算不归你操心——这阶段的成本只是模型调用,产品已按成本/质量自动调度;你只做创作上的取舍。

怎么做(借自几位大师的案头法)

一句话主题(Lumet)。把整部作品压成一句话,当作橡皮筋:每一个决定都要能弹回它,弹不回就否决。
两级脊柱(Kazan)。一句全片超目标,加每个角色一句脊柱;心理只能化成看得见的行为,不许说教。
每一拍一个对象(Coppola)。逐拍写清:这一拍的核心意图、它的轻重、以及要避开的那个俗套。
两个问题(Mamet)。每一拍只问:它必须让观众知道什么?最朴素、最不耍花活的拍法是什么?意义在镜头的并置里生,不在单个漂亮画面里。
三道校验。弹不回主题的否决;只输出看得见的动作、不说教;违背人物性格的拒之门外。

何以是核心

所有大师都先在文字里把电影决定完,再去预演、预剪。若直接跳到带机位的分镜,等于让"怎么拍"抢在"拍什么"前头——镜头便回不到主题,也绕不开俗套。案头这一桌,正是把"人当制片人、AI 当主创团队"真正落到实处的地方,也是任何"一句话生成视频"给不出的东西。

文字优先,一直贯穿到底:连分镜也先做文字版(每一拍的景别、机位、运动先用文字写定),再出草图,最后才动用最贵的模型渲成片。越往后越贵,所以越往前越要在文字里想清。

06

逐层栈:一部作品的全部部件

一部作品由近二十层构成,分三段。它们不是并列的旋钮,而是层层相依:塑料的脸无法演戏,未经设计的世界无从取景。每一层都朝向主题,且每一层(一站)之内,还分更细的板块。右侧标注它该用哪一档模型。

一、地基层(文字 · 看不见,却定义一切)
最要紧、也最不需要图的一段。
主题(立意)
这部作品到底要说什么(价值 + 成因)。
文字
故事
事件的骨架与那个转折。
文字
人物
是谁,且何以是这几个人物。
文字
对白
说什么,或何以不说。
文字
时间
何时,以及时间的结构与对比。
文字
场景
何地,空间的选择。
文字
二、画面层(逐镜 · 看得见)
在每一镜的画面上,自下而上地叠。
质感 / 真实
逃离 AI 感,像真实拍摄(毛孔、胶片、材质)。
高质量图
表演
眼神、微表情、手势、姿态、动作、呼吸——此一站自身就含六个板块。
高质量图 / 视频
服装 / 造型
衣着即身世。
草图 → 高质量图
美术 / 世界
搭建的世界,即主题的具象。
草图 → 高质量图
走位 / 调度
身体在空间里的位置与移动。
草图
灯光
光是雕塑,加于已搭好的形之上。
上色草图
镜头 / 焦段
以何种眼睛观看(广、长、浅景深)。
草图 → 高质量图
构图 / 取景
画框内一切的安排——它是以下各层之和。
高质量图
色彩
色调与一部作品里色彩的弧线。
高质量图 + 后期
三、时间层(序列 · 跨镜,单帧看不见)
只存在于镜头与镜头之间——一段生成的画面永远碰不到。
剪辑 / 节奏
切的逻辑与韵律(情绪先于连续)。
视频 + 后期
声音 / 音乐 / 静默
听觉的世界——含配乐、音效、人声、静默四个板块。
音频 + 后期
运动
镜头与被摄体的运动。
视频
贯穿:连贯与一致 + 一次主题一致性的总检——这近二十层,是否都在说同一个主题。
档位之法:不是一律到最后才升级精度,而是"渲到做出当前这个判断所需的最低精度即可"。判走位,缩略图足矣;判眼神是否服务主题,则非一张真脸不可。精度,也用在刀刃上。
禁什么:每一层不只问"加什么",也问"禁什么"——有时一张禁拍清单(不要英雄镜头、不要渐强配乐、不要球衣),比加任何东西都更能守住主题。

出图也分火候(渲染到够做决定就停)

"图"这一档里还分四级,从便宜到贵:线稿(定构图)→ 黑白光影稿(定光影——看光影的传统工具,便宜到能改几百遍)→ 色彩稿(定色彩)→ 写实渲染(仅锁定的镜头才上,最贵)。每一档只回答一个决定,渲染到够你拍板就停;直接上写实,等于在没定的细节上把决定做错、还被它锚死。
一致性是挣来的:只锁已经定了的那个变量,线稿和光影稿要割断,太早求一致就是假精确、会误导。详见 草图的火候

07

何以能成就不一样的作品

其一,是一支会推敲、会彼此质疑的剧组,而非一个 AI 给一个答案。一个 AI 只会回你那个平均值(亦即俗套)。唯有一群各执立场的角色——导演守主题、编剧守人物、另有一人专挑俗套——相互辩诘、向具体处深掘,才能掘出一个真而新的东西。这场质疑本身,就是对抗俗套之法。

其二,金用在刀刃上。推敲与试错之时,用廉价草图,几分钱可改数十遍;唯方向已定、确证服务于主题的镜头,才以重金渲一次。该以文字想清的不必画,该以草图推敲的不必急于成片。

08

你,身在何处?

你始终是导演与制片人。剧组替你完成繁杂的推演,把选项与理由一一陈于案上;而每一个判断,皆由你拍板、由你执掌。AI 提议,你决断。

留与你的,是审美、故事的走向、价值的取舍、你欲言说的那个主题;交与 AI 的,是反复试错的繁役。是解放,而非替代。

为谁而作

为认真的创作者,亦为愿成就一部有分量的作品、而不止于一段素材的品牌。若你只求一段"堪用"的快片,市面工具已足;若你在意它究竟说了什么,此物方为你而设。