最近经常有朋友问:你们做一集AI短剧,到底要走多少步?
正好我们团队内部刚跑完一轮,踩了一堆坑。干脆把真实用的步骤整理出来,既给朋友一个交代,也给自己留个底。不一定最优,但都是现阶段的实操记录。
不希望人手的技艺被封存,是因为手艺能培养对美的意识。在自身周围,在人与人的联结中,在这社会中,让我们思考何为美、何为丑。
拿到剧本,我们习惯先不丢给AI,而是做一件事:拆成‘分镜表。一段剧情,拆成8-10个分镜。每个分镜写清楚四件事——场景、人物位置、表情、动作。
比如,剧本写“女主在庭院里听到动静,回头”,拆成分镜后变成:“中景,女主站在庭院中央,黄昏光线从左侧打来。她原本低着头,突然听到右侧有声响,身体转向右侧,回头,表情从惊讶变成释然。”
我们刚开始也直接给AI剧本,结果AI乱切镜头。后来硬着头皮把一场戏拆成8个镜头,写好场景、动作,重跑次数少了一大半。这步确实磨刀不误砍柴工,我们现在拿到剧本,第一反应就是先拆,不直接喂给AI了。
分镜有了,接下来不是直接生成视频,而是先“定角色”。
给每个主要角色建一张“身份证”:正面、侧面、背面三视图,加上服装、发型、五官的固定描述。这张身份证,会作为参考图贯穿整个制作过程。
为什么这一步这么重要?我们踩过最大的坑:第一集女主是丹凤眼,第三集变成了杏眼。观众不一定说得出哪里不对,但他们会直接划走。
这一步看着麻烦,但做好一次,整部剧角色不会串脸,太值了。我们现在每个角色必建身份证,后面省心太多。
角色定好了,开始逐镜出图。每个分镜给AI的指令包含三部分:角色参考图、场景描述、情绪和动作提示。
风格参数提前锁定,不每镜重调。我们一般先把画幅比例、基础模型、光影关键词固定成一个预设模版,这样后面只替换描述,风格不会跑偏。
这个环节最需要耐心。一个分镜可能需要跑三四次才能拿到满意的结果。我们的经验是:前三个分镜慢一点,跑顺之后后面会快很多。不要在第一个分镜上死磕,先跑完一轮再回来优化。
图片齐了,进入视频生成环节。每张图拖进视频工具,加上动态提示。这里有个我们踩过的坑:想让镜头“缓缓推近”,结果画面边缘一直在抖,甲方说“像监控录像”。
后来我们学聪明了:动作提示越简单越好。不要写“镜头推近”,写“稳定运镜,人物保持居中”。复杂运镜拆成多段,分步生成,不指望AI一次完成。
所有片段按分镜表顺序排列。加上AI配音、音效、背景音乐、字幕。剪辑节奏上,情节紧凑处镜头时长压到1.5秒以内——比如打脸情节,镜头超过两秒观众情绪就断了。情绪顶点卡在音乐重拍上。
现在做固定场景的文戏,从生图到粗剪出个小样,熟练了确实能压到十几分钟。但一旦涉及多人交互或复杂动作,一段几秒的镜头能耗一下午。这活儿快慢都有,就看你要什么效果。
这套流程我们现在每个新项目都拿出来对着做一遍,确实省下很多试错时间。它不是什么标准答案,更像一份不断更新的工作底稿。
你在做的过程中,哪一步最磨人?或者你有更取巧的招儿?评论区聊聊,我们也能偷师。
果壳之美,到底做什么的?
指挥AI做事,我们总结了四个字:拆、定、验、收
240亿的AI短剧风口,劝你冷静看完这3个“坎”