上篇我们聊了《月刃·觉醒》的前三步——剧本创作、分镜拆解、提示词打磨。到那一步为止,我们手里已经握着一份完整的 9 集分镜表和一套可以直接喂给 AI 的提示词模板,感觉就像菜谱和食材都备齐了,就等着下锅。
这篇我会尽量把翻车经历讲详细,因为我觉得这些"翻车笔记"比成功经验更有价值。你看了我的翻车,至少能少走几步弯路。
好了,废话不多说,开干,结尾可观看完整短剧。

上篇提到过, AI 视频生成跟做饭特别像。备菜做完了,现在要上锅炒。但炒菜你得选对锅——不同的菜用不同的锅,不同的镜头也得用不同的工具来生成。

我这次用了三个核心工具,各有分工:
Seedance (即梦)——角色一致性担当
Seedance的角色一致性最好。孤月的红色义眼、浅绿古装纱衣、月刃狮头浮雕,这些标志性元素基本能保持。尤其是红色义眼这个细节,要求 AI 在每一帧里都保持同样的发光参数和色调,换别的工具很容易"跑偏"。
可灵 AI——动作打斗担当
动作镜头我全交给可灵 AI 。第4集孤月在废墟间高速移动、机械臂挥舞月刃,第6集360度环绕加踩墙垂直奔跑,都是可灵生成的。动态运镜和复杂动作,可灵确实更强。
通义万相——环境场景担当
通义万相我主要用来生成环境空镜头和场景背景。影月城天际线、废弃观星台的全景、第 8 集反抗军地下基地的全息地图,这些不需要角色出镜的纯场景镜头,通义万相的出图质量不错,而且风格比较好控制。
三个工具搭配,能覆盖9集短剧的所有镜头需求。
我拿第 1 集来拆解一下完整的 AI 生成流程,这样大家能有个直观的感受。
镜头 1 :小手松开旧衣( 00:00-00:03 )
这个镜头的提示词我写了三版才满意。第一版太写实了,出来的画面像儿童摄影;第二版又太抽象,小手的质感完全丢失。第三版我在提示词里加了一句关键描述:"手部皮肤纹理清晰可见,与周围冷色调形成强烈对比"——加了这句之后,画面质感一下子就上来了。
最终提示词大概是这样的:
Close-up shot. A small warm child's hand being roughly pulled away, gradually releasing a corner of a faded light-green old cloth. Background audio mixes heart-rending cries with cold mechanical operation sounds. Skin texture clearly visible on the hand, strong contrast with surrounding cold blue tones. Lighting transitions from warm yellow to cold blue. Cinematic, shallow depth of field, 9:16 vertical format, Tsui Hark wuxia aesthetic meets cyberpunk.
用 即梦Seedance 生成,角色一致性模式开启,生成 6 个候选,挑了其中手指细节最自然的一版。
镜头 2 :粒子溶解转场( 00:04-00:07 )
这个镜头让我翻车翻得最惨。
剧本要求是"小手的影像开始扭曲、像素化,逐渐化作一只布满精密经络纹理的机械手臂"。听起来很酷对吧?但 AI 的理解能力和我的想象之间隔了一条银河。
第一版出来我笑了——小手直接变成机械手套,中间连个过渡都没有,像变魔术一样。第二版倒是有了粒子效果,但粒子是彩色的——五颜六色的光点往四面八方飞,像放烟花一样,完全不是我要的那种"肉身消逝"的悲壮感。第三版出来我沉默了——小手溶解后变成一根机械触手,克苏鲁风格。我盯着屏幕三秒钟,真的在想要不要关电脑去睡一觉。
后来我换了个思路:先让 Seedance 生成"小手扭曲变形"的画面,再用可灵生成"机械手臂抓住月刃柄"的画面,最后在剪映里用自带的粒子溶解转场效果把两段拼起来。
我把这条经验当成了铁律:AI 理解不了太复杂的物理变化过程,拆成两步走,效果反而更好。
镜头 3 :孤月抬头义眼闪烁( 00:08-00:10 )
这个镜头反而是三个里面最顺利的。提示词写清楚"左眼红色义眼微微闪烁,右眼是人类瞳孔但毫无温度,背景是模糊的全息数据流瀑布", Seedance 一次就出了个还不错的版本。
但"还不错"和"能用"之间还有距离。义眼的红色不够正,偏橙了;闪烁的频率太快,看起来像在眨眼而不是"微光"。我在提示词里反复调——把"glowing red eye"改成"crimson prosthetic eye with subtle pulsating glow, frequency 0.5Hz",又加了一句"reference: cyberpunk red LED indicator light"来给 AI 一个具象的参考。调了四五版之后,终于得到了一个红色纯正、闪烁节奏沉稳的义眼效果。
【提示词模板 5 : Seedance 角色一致性】
[角色名], [年龄/性别], [核心外貌特征 1], [核心外貌特征 2], [标志性服装/道具], [情绪状态], [动作描述]. Environment: [场景描述]. Lighting: [光线描述]. Camera: [景别+运镜]. Style: Cyberpunk Wuxia, Tsui Hark cinematic aesthetic, film grain, shallow depth of field, 9:16 vertical format, 8k resolution. Character consistency mode: ON.
说到翻车,我必须专门开一个板块来吐槽,因为这次创作的翻车量真的够开一个博物馆了。
孤月的"百变造型"
孤月生成了二十多版。六根手指的、义眼变绿的、全身机甲的..……,别说浅绿纱衣了,连个人样都没有,看起来像铁甲小宝的赛博朋克版。
最离谱的一版,孤月的脸变成了一个中年男人的脸,但穿着浅绿古装纱衣,背后还背着月刃。我盯着屏幕看了五秒钟,脑子里只有一个想法:这到底是性转版孤月,还是 AI 觉得这个角色换个性别也行?
"一只眼流泪一只眼干涸"的终极难题
第 5 集父女擦肩而过那场戏,剧本里写了一句很关键的视觉描述:"机械左眼不会流泪,但右眼还会。"这句话是整部剧最重要的一个画面——一半是机器,一半是人。
结果 AI 死活不理解这个概念。我试了不下十种表述方式:"one eye crying one eye dry"、"left mechanical eye no tears right human eye tearing"、"asymmetrical crying"……出来的结果要么两只眼都在流泪,要么两只眼都干着,要么干脆给我一个闭着眼睛的侧面。
最后我的解决方案是:生成一个正常流泪的版本,然后在剪映里用遮罩把左眼的泪痕擦掉,同时给左眼加了一层微弱的红色发光效果来强调它的机械属性。费是费了点,但效果终于对了。
小技巧:把翻车版本留着
说个实用的建议——别急着删翻车版本。有些看起来完全不对的画面,加个滤镜、调个色调之后反而有意想不到的效果。比如那个六根手指的版本,我加了重度的胶片颗粒和暗角之后,手指的异常在暗光下几乎看不出来,反而那种"不完美"的感觉跟赛博朋克的废土气质莫名搭。后来有几集的环境空镜头,我就是用翻车版本加滤镜凑出来的。

如果说 AI 生成是炒菜,那后期剪辑就是摆盘上桌。食材再好,摆得乱七八糟,食客也不会买单。
我用的是剪映专业版,整个剪辑过程分三个阶段。

粗剪的目标很简单:按分镜表把所有镜头按顺序排列,快速搭出故事线。这个阶段我不做任何精细调整,只关注一件事——观众能不能看懂这个故事在讲什么。
9 集短剧,每集 10 秒,总共 90 秒的素材量,粗剪本身花不了太多时间。但问题在于, AI 生成的素材不是每一帧都能用,很多镜头只有中间 1-2 秒是好的,开头和结尾会有扭曲变形。所以粗剪的时候,我实际上是在做两件事:排列顺序 + 裁剪每段素材的有效区间。
这个阶段我给自己定了一个规矩:每集只保留最好的 3-5 秒素材,多余的果断砍掉。 短剧的节奏就是生命,一秒钟的拖沓都能让观众划走。
粗剪搭好了骨架,接下来要让它有"呼吸感"。这个阶段靠的是配乐。
我习惯先选好配乐,再根据音乐的节拍来调整剪辑点。打个比方,配乐是心跳,剪辑点就是脉搏——两者要对得上,观众看着才舒服。
【提示词模板 7 : AI 配乐生成】
请生成一段[时长]秒的背景音乐,用于[场景描述]。
风格要求:[风格关键词,如"赛博朋克武侠融合"/"电子+民乐"/"暗黑氛围"]
情绪曲线:[描述情绪变化,如"前 3 秒压抑低沉, 4-7 秒逐渐紧张, 8-10 秒爆发后骤然安静"]
乐器要求:[具体乐器,如"唢呐主旋律 + sub-bass 垫底 + 电子合成器铺底 + 板鼓驱动节奏"]
参考作品:[风格参考,如"徐克《新龙门客栈》配乐的紧张感 + 《银翼杀手 2049 》的电子氛围"]
输出格式: MP3 , 44.1kHz , 16bit
调色是让整部剧从"AI 生成感"变成"电影感"的一步。 AI 生成的原始画面往往色彩偏灰、对比度不够、饱和度要么太高要么太低,得统一调一遍。
我摸索出了一套"赛博武侠色调公式",在剪映里直接用参数面板调:
【提示词模板 8 :剪映调色参数】
基础调色(全剧通用):- 亮度:-5 ~ -8 (压暗整体,增加电影感)- 对比度:+12 ~ +15 (强化明暗反差)- 饱和度:-10 (适度去饱和,避免"塑料感")- 色温:偏冷蓝 +15 (赛博朋克基底色调)- 色调:偏绿 +5 (孤月标识色的环境映射)
高光/阴影分层调整:- 高光色温:偏青(霓虹灯反射的冷光感)- 阴影色温:偏暖橙(保留一丝人味)- 阴影提亮:+8 (暗部不死黑,保留细节)
特效叠加:- 胶片颗粒:强度 15-20 (增加质感,掩盖 AI 生成的"光滑感")- 暗角:强度 20-25 (聚焦视觉中心)- 色差:强度 5-8 (赛博朋克镜头畸变感)
这套参数不是一次性定下来的,是调了大概两三个晚上才固定住的。中间有段时间我把画面调得太蓝了,孤月整个人看起来像阿凡达,后来把色温往回拉了一点才正常。
很多人做AI短剧时,一开始把90%精力放在画面上,音效随便找几个素材库里的音贴上去就完事了。但我的经验是:音效至少占成片观感的 40%。
同样一个画面,配不同的音效,观众的情绪反应完全不一样。
以第 9 集"破晓新生"的为例,大结局的决战之后,画面从核心塔的赛博朋克场景切换到城市废墟上的日出。这个转场我琢磨了很久:电子音效逐渐减弱,自然音效逐渐增强——风声、远处的鸟叫、城市苏醒的嗡嗡声,最后只剩下一架温柔的钢琴。从"机器的世界"到"人的世界",声音的转变比画面的转变更能让观众感受到孤月的"回归"。

说到剪辑过程中的翻车,不得不提剪映的崩溃问题。
第 7 集和第 8 集的衔接处——也就是孤月决定潜入核心塔的那个高潮段落——我在剪映里叠加了大量的特效层:粒子效果、光晕、色差、胶片颗粒、动态模糊,再加上多轨音频。结果那段连卡了三次,每次都是拖动时间线的时候直接闪退。
后来我的解决方案是:把特效分层导出。 先把画面特效做完导出一版,再新建项目叠加音频和转场特效。虽然多了几步操作,但至少不怎么崩了。做 AI 视频创作,保存和备份的习惯真的能救命——我现在每完成一个阶段就另存一个版本,文件名按日期和阶段编号,最多的时候一个项目有十几个版本文件。

回头看整个创作过程,从最初的一个模糊想法——"做一个赛博朋克风格的武侠短剧"——到最终 9 集成片,前前后后大概花了一周时间。
这一周的节奏大概是这样的:先写剧本和分镜,反复推翻重来;接下来泡在 AI 工具里生成素材,跟各种翻车版本搏斗;最后全用来剪辑、调色、配音效,把碎片拼成一个完整的故事。
中间好几次想放弃。AI生成阶段最崩溃,看着屏幕上好几个"不太对"的孤月,当第十八版孤月还是不对的时候,我问自己:一个人做这个,到底图什么?
但每当我在剪映里把几个镜头拼在一起、配上音乐、调好色调,然后按下播放键的那一瞬间——看到画面里那个红色义眼的少女在赛博朋克的霓虹灯下缓缓抬头,月刃在她背后折射出冷蓝色的光——那种感觉,怎么说呢,就像你做了一道菜,尝了一口,发现味道刚好是你想要的。
做完《月刃·觉醒》之后,我最大的感受是: AI 能帮你生成画面、生成音乐、生成音效,但它没办法帮你决定"孤月为什么要在最后一刻选择放弃力量"。那个决定,那个让故事从"酷炫"变成"有点打动人"的东西,只能来自你自己。
这就是《月刃·觉醒》的创作全记录。希望这两篇文章能给你一些实实在在的帮助。如果你也在做 AI 短剧,或者正准备开始,记住一件事:翻车正常,崩溃也正常。重要的不是一次做对,而是做完觉得'还不错'。
老规矩,这次也准备了完整的资源包,内容包括:
想要资源包的朋友,关注我评论区留言"月刃剧本" ,我将在后台发你完整资源包。
我们下期见。
往期精选
AI短剧创作全记录(上):从剧本到分镜,9集赛博武侠是怎么炼成的