参考生视频,是当下做AI仿真人短剧绕不开的核心技术。
但大多数人都卡在同一个坎上——提示词不会写。
写多了,生出来一镜到底,毫无节奏感。写少了,人物动作直接崩一半。
这篇我把三种常见场景的提示词模板全部梳理出来了,实测验证过的,拿去直接用。
先搞清楚一个底层逻辑
参考生视频和纯文生视频,写提示词的思路完全不一样。
文生视频,你得从零开始描述画面——景别、色调、构图,全靠文字撑起来。
参考生视频不同。你已经上传了角色图和场景图,模型知道人长什么样。你只需要告诉它:这几秒钟里,发生了什么事。
所以提示词可以短很多,但动作和台词必须交代清楚。
短过渡镜头:3-5秒,越简单越好
表情变化、微小动作、情绪反应……这类镜头不需要任何运镜格式,大白话描述就行。
比如:
@图片1(男主)靠在椅背上,不耐烦地瞥了一眼窗外,轻叹一声。
出片快,废片率极低。复杂的物理运动让模型自己补,反而更自然。
连续剧情片段:10-15秒,直接喂剧本
有对话、有情绪转折的戏,把剧本原文粘进去就行。
格式很简单:资产绑定 + 剧本内容,台词用双引号包裹。
几个细节必须注意——
"只生成音效,不生成音乐。不要生成任何字幕。"这句话必须加。不加的话,每段音乐风格不统一,字幕样式也乱,后期根本没法处理。
台词必须用双引号。不加双引号,模型不会同步口型,嘴就不动了。
动作描写保留原文即可,不用额外改格式。
精细化控制:15秒结构化分镜
如果你对镜头调度有明确要求——先给手部特写,再切面部近景,最后双人全景——就需要结构化分镜提示词。
格式是:资产绑定 + 逐条列出「XX-XX秒,景别,运镜,画面描述」。
比如:0-3秒,全景,固定,两人厅堂对坐,气氛凝重。3-7秒,中景推进,角色A缓缓站起身,说道:"……"
这种写法可控性强,但时间分配要合理。4秒内别指望完成跨越整个房间的大动作,写了模型也做不到。
让AI帮你拆分镜
觉得自己拆分镜麻烦?把系统提示词扔给DeepSeek或豆包,让它把剧本自动转成结构化分镜格式。你只需要检查微调,就能直接用。(具体的转换提示词模板,文末可以领取。)
首尾帧接力:解决跳帧问题
多段素材拼接,最常见的问题就是接缝处跳帧——上一段人在左边,下一段突然跑右边了。
解决方法很简单:把上一段视频的最后一帧截图,作为下一段的首帧参考图上传。在剪映里滑到视频结尾,点截图按钮导出,然后提示词里写上"@图片X 作为首帧"。
两段视频就能自然衔接。这个操作建议做成标准流程,每段生完就截尾帧备用。
总结一下
三种场景对应三种写法。每次动手前先判断:这段是短过渡、连续剧情、还是精细调度?然后套对应模板就行,不用每次从头想。
其实AI短剧这个赛道,真正拉开差距的不是工具,而是你对细节的把控。提示词只是其中一环,但把这一环做好,出片效率能翻好几倍。
方法都在这了,不算难。但任何项目都需要过程,不是一上来就能赚大钱的,得不断积累、持续优化。希望这份分享能帮你在AI短剧赛道跑出成绩。
最后送大家一波福利
对 AI漫剧、自媒体运营、AI 视频感兴趣的小伙伴,可以加我微信一起交流,免费赠送一份【AI 自媒体大礼包】,包含
「爆款 AI 视频拆解」系列的提示词合集
Coze各类工作流源码
AI 工具导航 & AI 效率神器合集
n8n工作流2000套源码
工作V:AKAIGC777、AKAIGC888
私人V:AKAIGC666