做AI短剧,很多人卡在一个环节——场景一致性。
分镜脚本写好了,人物三视图也搞定了,但场景图这一步,不少人直接懵了。
其实没那么复杂。今天把场景描述提取和场景图生成的完整方法拆开讲,全是可以直接复制用的干货。
你可能会想,直接生成分镜图不就行了,为什么还要多一步?
原因很简单。如果不提前把场景确定下来,后面每张分镜图里的场景细节都可能跑偏——这个房间一会儿有窗户,一会儿没有,一会儿破败,一会儿干净。
场景图就是给AI定下一个"标准答案",后面所有分镜都参考它,一致性才能保住。
核心思路是什么?把剧本里跟人物相关的东西全部剔除,只留纯静态的场景元素。
具体来说,只保留三类信息:
空间结构——房间多大、什么形态、门窗在哪、区域怎么划分。
固定道具——场景自带的、不会随人物进出而变化的物件,比如破旧铜镜、简易灶台、墙角的破碗。注意标清位置和状态。
环境氛围——光线、气味、音效暗示、天气痕迹、整体基调,比如"昏暗""霉味""破败"。
这里有个关键点容易忽略:人物手持的道具、临时放置的物品,统统不要。只保留"场景本身长什么样"。
把通用提示词复制到DeepSeek或者豆包这类AI工具里,然后附上你的剧本,AI就会按照"集数-场景名称"的结构,逐一输出每个场景的描述。
提取出来的效果大概是这样:
(截图只展示了一部分,实际会覆盖所有场景)
拿到场景描述后,还不能直接丢给绘图工具。
你需要再用一套提示词,让AI把这些文字描述转化成适合AI绘图的中文提示词。
几个核心要求:
- •每个场景生成两张图:俯视图看整体布局,主视图看拍摄角度
- •
- •
- •
直接在同一个对话框里输入转换提示词就行:
拿到绘图提示词后,打开即梦AI或者其他你顺手的绘图工具,逐个场景生成。
举个例子,生成"冷宫寝房/日/内"这个场景——
俯视图:
正视图:
效果很直观。破败的房间、简陋的木床、斑驳的墙面……这些细节一旦定下来,后续分镜图的一致性就有了保障。
如果AI输出的内容不够精准,直接追问一句:"请严格按空间结构+固定道具+环境氛围分类,剔除所有人物元素,语言保持直白可落地。"
同一集里重复出现的场景,如果没有新增布景元素,标注"同本集XX场景"就行,不用重复生成。
生成的场景图一定要保存好,后面做分镜的时候要反复用到。
整个流程其实就三步:提取描述→转绘图提示词→出图。方法不难,关键是每一步都别偷懒,场景细节越扎实,后面越省事。
最后送大家一个福利:如果你也对AI短剧制作、AI绘图实战、自媒体变现这些方向感兴趣,想在互联网找到一个靠谱的副业方向,关注公众号可以领取: