短剧制作全链路解决方案
生成时间: 2026-05-20
有效期: 建议在 3 个月内重新评估
谁可以参与:有真实、有阅历的,可以用这个方案编制短剧剧本
📋 概述
目标: 构建一套覆盖短剧制作"剧本→分镜→角色资产→视频生成→配音→字幕→剪辑合成→发布"全链路的 AI Skill 组合方案,让创作者用自然语言描述即可驱动整条产线。
适用场景:
- AI短剧创作者(竖屏9:16微短剧、漫剧、剧情号)
核心能力:
- 剧本创作: AI编剧团队协同,从一句话创意到完整分集剧本
- 视频合成: 逐镜视频生成 + FFmpeg 拼接成片
2026年短剧市场趋势:
- 中国AI短剧市场已突破500亿元,微短剧日活用户超3亿
- 主流短剧平台(ReelShort、DramaBox、GoodShort)全球扩张
🎯 需求分析
制作链路拆解
短剧全链路分为 6大核心环节 + 2个支撑环节:
[创意输入] → [①剧本] → [②分镜] → [③角色/场景资产] → [④视频生成] → [⑤配音] → [⑥字幕] → [⑦剪辑合成] → [⑧导出发布]
各环节技术需求
⭐ 方案设计:三层架构 + 双轨方案
架构总览
┌─────────────────────────────────────────────────────────┐
│ ③ 应用编排层(Orchestrator) │
│ OpenMontage / 自建 Agent Pipeline / Claude Skills │
│ 负责流程调度、工具选择、质量把关、成果审查 │
└─────────────────────────────────────────────────────────┘
↑ 调用
┌─────────────────────────────────────────────────────────┐
│ ② 专用工具层(Domain Tools) │
│ 剧本: 知剧AI/Huobao Drama/Claude+khazix-writer │
│ 分镜: AniShort/VIVAShort/Story2Board │
│ 视频: Wan2.2/CogVideo/Kling/Seedance │
│ 配音: CosyVoice/GPT-SoVITS/ElevenLabs │
│ 字幕: Whisper/FunASR │
│ 合成: FFmpeg/Remotion │
└─────────────────────────────────────────────────────────┘
↑ 依赖
┌─────────────────────────────────────────────────────────┐
│ ① 基础能力层(Foundation) │
│ 大语言模型: Claude/ChatGPT/Gemini/DeepSeek │
│ 图像模型: Flux/Stable Diffusion/DALL-E │
│ 视频模型: LTX-2/SAM3/Kling/Sora │
│ 语音模型: VITS/TTS引擎 │
└─────────────────────────────────────────────────────────┘
方案 A:开源自建方案(技术型团队)
适合:有技术能力的团队、追求可控性和自定义
核心组件:
| | | |
|---|
| Claude + khazix-writer (用户Skill) | | |
| 知剧AI (zhijuu.com) | | |
| Huobao Drama (chatfire-AI) | | |
| OpenMontage (calesthio) | | |
| Wan2.2 | | |
| CogVideo | | |
| Flux 2 + IP-Adapter | | |
| GPT-SoVITS / CosyVoice | | |
| Faster-Whisper / FunASR | | |
| FFmpeg + Remotion | | |
方案 B:SaaS 全链路方案(内容型团队)
适合:无技术团队、追求快速出片、商业变现
| | | | |
|---|
| Xyva | | | | |
| AniShort | | | | |
| 有戏AI | | | | |
| 万兴剧厂 | | Vidu Q3 + Kling 3.0、1人8集/天 | | |
| VIVAShort | | | | |
| 幻舟AI | | | | |
方案 C:混合方案(推荐 — 利用现有 Skill + 外部工具)
这是最推荐的方案!充分利用用户已有的 Skill 体系 + 最佳外部工具。
环节流程:
输入: 一句话创意 / 小说章节 / 爆款剧本
↓
[① 剧本创作]
→ Claude 原生编写 (剧本结构)
→ khazix-writer Skill(公众号/长文风格 → 对白润色)
→ ai2human-speech Skill(对白人味化)
→ 知剧AI (分集大纲 + 专业格式导出)
↓
[② 分镜设计]
→ Claudio 原生 (拆镜)
→ fireworks-tech-graph Skill(镜头流程图)
→ mermaid-diagrams Skill(关系图)
↓
[③ 角色资产]
→ canvas-design Skill(角色定妆图)
→ editorial-line-system Skill(风格化角色)
→ frontend-design Skill(场景概念图)
↓
[④ 视频生成]
→ Wan2.2 / Kling / Seedance (逐镜生成)
→ hyperframes Skill(动画关键帧)
→ remotion Skill(编程式动画)
↓
[⑤ 配音]
→ GPT-SoVITS / CosyVoice / ElevenLabs
↓
[⑥ 字幕]
→ Whisper / FunASR
↓
[⑦ 剪辑合成]
→ FFmpeg (拼接)
→ Remotion Skill(精细动画 + 字幕样式)
→ hyperframes Skill(场景转场)
↓
[⑧ 导出发布]
→ FFmpeg → MP4/MOV 成片
→ dev-browser Skill(自动发布到平台)
🔍 详细工具清单
一、剧本创作工具
1. 知剧AI (zhijuu.com) ⭐⭐⭐⭐⭐
- 来源
- 定位
- 两大模式: ①自己写剧本(一句话创意→完整剧本)②小说转剧本(上传小说→自动改编)
- 核心功能: 智能分集大纲、角色性格设计、专业台词对白、场景描写、分镜脚本、封面生成、Word导出
- 开源地址
- 价格
2. ChatGPT / Claude ⭐⭐⭐⭐⭐
- 定位
- 优势: ChatGPT灵活,Claude长文本+结构化反馈
- 最佳实践: ChatGPT做头脑风暴→Claude做剧本批注→Sudowrite做对白润色
3. Sudowrite ⭐⭐⭐⭐
4. 下载 Skill:
| |
|---|
| khazix-writer | |
| long-form-writer | |
| ai2human-speech | |
| de-ai-polish | |
| deep-dialogue | |
二、分镜设计工具
1. MStudio (mstudio.ai) ⭐⭐⭐⭐
2. Story2Board (GitHub) ⭐⭐⭐
3. 下载 Skill:
| |
|---|
| fireworks-tech-graph | |
| mermaid-diagrams | |
| graphify | |
| huashu-design | |
三、视频生成工具
核心开源模型
| | | |
|---|
| Wan-Video/Wan2.2 | | | |
| THUDM/CogVideo | | | |
| AILab-CVC/VideoCrafter | | | |
| hao-ai-lab/FastVideo | | | |
| Phantom-video/Phantom | | | |
商用API
| | | |
|---|
| Kling (快手) | | | |
| Seedance 2.0 (字节) | | | |
| Runway Gen-4 | | | |
| Veo 3.1 (Google) | | | |
| MiniMax Hailuo | | | |
下载 Skill:
| |
|---|
| hyperframes | |
| hyperframes-cli | |
| hyperframes-registry | |
| remotion | |
| heygen-skills | |
| website-to-hyperframes | |
四、配音工具
| | |
|---|
| GPT-SoVITS | | |
| CosyVoice | | |
| ChatTTS | | |
| ElevenLabs | | |
| Fish Audio | | |
五、字幕工具
| | |
|---|
| openai/whisper | | |
| Faster-Whisper | | |
| FunASR | | |
六、剪辑合成
七、全链路方案(一站式)
🔥 最推荐:OpenMontage ⭐3,799
- 定位
- 架构: Agent-First → 你自己的AI助手就是编排器
- 支持: 12+产线、52+工具、400+Agent技能
- 兼容: Claude Code、Cursor、Copilot、Windsurf
- 覆盖
- 许可
🔥 最推荐:Huobao Drama (火宝短剧) ⭐11,898
- 定位: 基于Go+Vue3的开源AI短剧自动化生成平台
- 覆盖
- 优势
- 商业版
🔥 国内SaaS推荐
| | |
|---|
| Xyva | 桌面端、20+模型聚合比价、AI编剧团队、隐私本地 | |
| AniShort | 团队协作最佳、节点化画布、Seedance2.0零排队 | |
| 有戏AI | | |
🧩 推荐实施方案(混合方案 C 详细说明)
第一步:剧本创作(0→1)
输入创意: "豪门千金被家族抛弃后,隐姓埋名入职对手公司..."
↓
┌─────────────────────────────────────────────┐
│ 1. Claude 先做剧本骨架 │
│ - 人物设定表(性格/目标/冲突) │
│ - 10集分集大纲(每集3-5个钩子点) │
│ - 每集开头前5秒"吸睛钩子" │
│ ↓ │
│ 2. khazix-writer Skill 润色 │
│ - 对白按公众号风格"有信息量有情绪" │
│ - 每集结尾设计"必须看下集"的悬念 │
│ ↓ │
│ 3. ai2human-speech Skill 对白人味化 │
│ - "你别走,我求你了" → "站住。你走一个试试?" │
│ - 每句对白做"说出来检验" │
│ ↓ │
│ 4. de-ai-polish Skill 去AI腔 │
│ - 去除"不仅...更..."句式 │
│ - 去除"可谓是/毫无疑问"等AI高频词 │
└─────────────────────────────────────────────┘
第二步:分镜 + 角色资产
分镜设计:
1. Claude 逐集拆镜 → 镜号/景别/运镜/动作描述/对白
2. fireworks-tech-graph → 视觉化分镜流程图
3. mermaid-diagrams → 角色关系图/情节时间线
角色资产:
1. canvas-design Skill → 主角定妆照(正面/侧面/背面)
2. editorial-line-system Skill → 风格化人物造型
3. frontend-design Skill → 关键场景概念图
第三步:视频生成 + 合成
逐镜视频:
1. 分镜表 → Kling/Seedance/Veo → 逐镜片段
(导入角色定妆图保持一致性)
2. 失败镜头 → 自动重试 → 单镜重生成
配音:
1. GPT-SoVITS → 每角色6秒样本 → 克隆音色
2. 按角色映射批量生成所有台词配音
字幕:
1. Faster-Whisper → 配音音频 → SRT字幕
2. FunASR → 中文精校时间轴
合成:
1. FFmpeg → 片段拼接 + 字幕烧录 + BGM混音
2. hyperframes Skill → 场景转场 + 标题卡 + 特效
3. Remotion Skill → 片头动画 + 下集预告卡
导出: 9:16竖屏 MP4/MOV/FCPXML
📦 Skill 与工具的映射总结
| | | |
|---|
| khazix-writer, long-form-writer, ai2human-speech, de-ai-polish, deep-dialogue | | Claude, ChatGPT, Sudowrite |
| fireworks-tech-graph, mermaid-diagrams, graphify | | |
| canvas-design, editorial-line-system, frontend-design, logo-generator | | |
| hyperframes, remotion, heygen-skills | | Wan2.2, CogVideo, VideoCrafter |
| | | GPT-SoVITS, CosyVoice, ChatTTS |
| | | |
| hyperframes-cli, remotion | | |
| OpenMontage | | |
| dev-browser, browse, playwright | | |
✅ 推荐优先级
立刻可用(零成本启动)
- Claude 原生
- 用户已有 Skills
- 知剧AI
轻度投入(月费 < ¥100)
- Kling / Seedance
- GPT-SoVITS
- Faster-Whisper
专业产线(永久方案)
- Xyva (¥599永久) → 全链路桌面工具 + 20+模型聚合
- OpenMontage
- Huobao Drama
⚠️ 风险与限制
| | |
|---|
| | |
| | |
| | ai2human-speech Skill 深度处理 |
| | Wan2.2 14B需16GB+显存;建议使用云GPU(如AutoDL) |
| | |
| | |
📚 参考资料
开源项目
- OpenMontage[1] ⭐3,799 — Agent视频生产系统
- Huobao Drama[2] ⭐11,898 — AI短剧自动化平台
- Wan2.2[3] ⭐15,752 — 开源视频生成模型
- CogVideo[4] ⭐12,654 — 文本/图片→视频
- Milimo Video[6] — AI原生电影剪辑工具
SaaS平台
- VIVAShort[10] — 免费剧本+分镜生成
- MicroDrama AI[11] — 一站式AI短剧创作
评测参考
- 2026 AI短剧平台深度测评[12] — 12大平台对比
- 2026 AI Short Drama Tool Comparison[13]
方案生成时间: 2026-05-20 10:30 CST
下次评估建议: 2026-08-20(该领域3个月内技能生态可能发生重大变化)
参考链接
[1] OpenMontage: https://github.com/calesthio/OpenMontage
[2] Huobao Drama: https://github.com/chatfire-AI/huobao-drama
[3] Wan2.2: https://github.com/Wan-Video/Wan2.2
[4] CogVideo: https://github.com/THUDM/CogVideo
[5] GPT-SoVITS: https://github.com/RVC-Boss/GPT-SoVITS
[6] Milimo Video: https://github.com/mainza-ai/milimovideo
[7] 知剧AI: https://zhijuu.com
[8] Xyva: https://xyva.fun
[9] AniShort: https://anishort.ai
[10] VIVAShort: https://vivashort.com
[11] MicroDrama AI: https://microdrama.ai
[12] 2026 AI短剧平台深度测评: https://www.163.com/dy/article/KQG59NNS05564VL7.html
[13] 2026 AI Short Drama Tool Comparison: https://linghuiai.net/en/guide/tips/ai-tools-comparison