首页  思维导图  详情



 



AI 漫剧（沙雕视频）抖音版优化工作流

2026-03-02 14:30:45   9  举报





AI智能生成

【核心内容】本工作流旨在展示如何高效制作并优化AI漫剧（又称沙雕视频）以适应抖音短视频平台。它涵盖了从剧本构思、角色设定、AI动画生成到后期编辑与发布的一系列步骤。【文件类型】本工作流采用清晰的图文结合形式，可以是PDF文档、演示文稿(PPT)或富文本格式(如Word文档)，确保信息的易读性和便于操作指导。【修饰语】本工作流特色在于其“实用高效”，“创意教程”，“适应抖音趋势”，以及“易于操作”，确保内容不仅包含理论知识，更加注重实际操作与抖音平台风格的适配。此外，它也强调“持续更新”以适应不断变化的社交媒体环境和技术发展。

沙雕视频

AI漫剧

短视频

短视频、内容、变现、电商、直播、IP

抖音

模板推荐

作者其他创作

大纲/内容

需求分析

平台特性

短平快、强冲突、高完播、强互动

AI 工具的实际落地痛点

出图崩、脸崩、节奏慢、版权坑

流程升级

细节补全、卡点优化、风险规避、数据闭环

闭环执行

核心动作 + 抖音专属要求 + 避坑点

小说→剧本

抖音核心

前 3 秒抓眼，60 秒闭环

职责优化

核心升级

从 “拆冲突 + 金句” 升级为抖音 60 秒黄金结构拆解

AI 写台词 / 旁白 / 转场，人类只抓 “故事核 + 完播钩子”

细化执行步骤

选品前置（抖音流量密码）

优先选

赘婿 / 战神 / 神医 / 萌宝 / 复仇 / 玄幻逆袭（抖音漫剧 TOP 题材）

单集

有强反转、强爽点、强悬念

避坑

拒绝慢热、多线叙事、晦涩设定，60 秒只讲1 个核心冲突 + 1 个爽点 / 泪点

AI 剧本生成（Prompt 精准化）

给 AI 的指令模板（直接复制用）

生成抖音 60 秒漫剧剧本，题材【XX】，核心冲突【XX】

前 3 秒必须有强钩子（如 “你敢动我女儿？”“我乃战神归来！”）；

台词口语化、短平快，单句不超 10 字，避免长句

旁白只做关键信息补充，不超过 3 句；

转场用 “闪回 / 黑屏 / 特写”，适配抖音快节奏；

结尾留悬念（如 “下集：他竟隐藏了真实身份！”）引导追更。

AI 输出

台词 + 旁白 + 转场标注 + 时间轴

（0-3s 钩子，3-15s 冲突，15-45s 爽点，45-60s 悬念）

人类把关（只做 3 件事

① 故事核

是否符合题材调性，无逻辑硬伤

② 钩子

前 3 秒是否抓眼，结尾是否有追更欲

③ 时长

总台词 + 旁白控制在150 字内（60 秒语速适配）

抖音专属要求

必须加

“下集更精彩”“点赞追更”** 等口播 / 字幕引导，提升完播 + 关注

金句优先选

“爽点金句

（如 “三十年河东，三十年河西，莫欺少年穷！”）

金句勿选

文艺金句

场景设计

抖音核心

风格统一 + 氛围感拉满，低成本出图

职责优化

核心升级

从 “出全景 + 氛围图” 升级为抖音场景标准化 + 光效关键词库

避免风格割裂，提升出图效率

细化执行步骤

世界观 + 关键词库（提前搭建，复用降本）

仙侠

关键词：古风、云雾、仙宫、御剑、桃花林

光效：柔光、丁达尔光、金色光晕、冷调

废土

关键词：废墟、沙尘、破旧建筑、机械残骸

光效：暗调、侧逆光、橙黄火光、颗粒感

赛博

关键词：霓虹、高楼、全息投影、机械义体

光效:赛博蓝紫、霓虹光带、冷光、反光

现代都市

关键词：写字楼、街头、公寓、咖啡厅

光效：自然光、暖光、冷白办公光

AI 出图（批量生成 + 筛选）

给 AI 指令

生成【题材】漫剧场景，全景图

光效关键词，动漫风格，高清，无文字，适合 60 秒短视频分镜”

单场景

生成5-8 张

人类筛选

优先选构图简洁、主体突出、无杂物的图

人类优化（光效 + 竖屏适配

① 光效统一

给所有场景加统一光效关键词

（如仙侠全加 “丁达尔光 + 柔光”），避免一张图一个风格

② 竖屏裁剪

将横版图裁为9:16 竖屏，保留核心场景

（如仙宫只留主殿，废土只留核心废墟）

③ 场景复用

同题材场景（如主角家、反派基地）只生成 1 套

后续剧集直接复用，节省算力

避坑点

拒绝生成过于复杂、细节过多的场景

AI 出图易崩，且抖音快节奏下观众无暇看细节

避免用真人实拍风场景

优先选二次元 / 动漫风，适配漫剧调性，且 AI 出图更稳定

角色设计

抖音核心

脸不崩 + 辨识度高，观众一眼认主角

职责优化

核心升级

从 “参考图 + 人设 + 三视图” 升级为抖音角色锁脸标准化 + 表情库

解决 AI 出图脸崩、换脸问题

细化执行步骤

角色人设 + 参考图（精准定位）

人设

3 句核心 +抖音专属标签

“战神男主：冷酷、护短、战力天花板

萌宝女主：可爱、机灵、团宠”

参考图

选3-5 张同风格动漫图（如原神、斗罗大陆风

避免真人图（AI 易画成真人，违和）

参考图需包含：正面、侧面、不同表情（笑 / 怒 / 冷）

AI 生成三视图（锁脸前置）

给 AI 指令

生成【角色名】三视图（正面 / 侧面 / 背面）

【题材】动漫风格

【人设关键词】，高清，细节完整，适合后续分镜出图”

人类筛选

选五官清晰、比例协调、无崩坏的三视图

作为后续出图的 “脸模板”

人类锁脸 + 表情优化（核心步骤）

① 锁脸操作

用 Midjourney/Stable Diffusion 的 **–cref（角色参考）

或 IP Adapter 功能，将三视图设为 “脸参考”

强制 AI 后续出图沿用该脸

② 表情库生成

基于锁脸后的角色，生成6 种核心表情

（怒、笑、冷、惊、哭、温柔），覆盖 60 秒剧情所有情绪

③ 角色比例统一

设定角色身高、体型关键词

如 “男主 185cm，宽肩窄腰；女主 165cm，娇小玲珑

避免分镜中角色忽大忽小

抖音专属要求

主角五官必须有记忆点

（如男主红瞳、女主桃花眼）

抖音刷到瞬间能认出，提升角色 IP 感

避免角色服饰过于复杂

优先选简洁、有辨识度的服饰

如战神穿黑金甲，萌宝穿粉裙

AI 出图更稳定，且观众易记

分镜

抖音核心

12-15 镜 + 运镜卡点，完播率拉满

职责优化

核心升级

从 “切镜头 + AI 运镜” 升级为抖音 60 秒分镜黄金节奏 + 运镜模板

人类只调 “情绪特写 + 卡点”

细化执行步骤

分镜数量 + 时间轴（严格按抖音完播逻辑）

固定分镜数：12-15 镜（60 秒平均每镜 4-5 秒）

时间轴严格

秒+镜头数+内容+运镜

0-3s（钩子）

1镜

强冲突特写

推镜（从远推到主角脸）

3-15s（冲突）

3-4 镜

交代背景 + 矛盾

摇镜（左右摇）、切镜（快速切换）

15-45s（爽点）

5-6 镜

核心剧情 + 反转

拉镜（从近拉到全景）、跟镜（跟随主角动作）

45-60s（悬念

2-3 镜

留悬念 + 引导追更

定镜（主角特写）、闪回（快速闪回关键画面）

AI 分镜生成（基于剧本 + 角色 + 场景）

给 AI 指令

基于【剧本】，生成 12 镜 9:16 竖屏分镜表

包含：镜号、画面内容、运镜、台词 / 旁白、时长

【题材】动漫风格

主角沿用【锁脸角色

场景沿用【场景库】

AI 输出

分镜表（含画面描述、运镜、时长）

人类无需重写，只做优化

人类调优（只做 2 件事）

① 情绪特写

将爽点、泪点、钩子的镜头设为特写镜

如男主怒吼时给脸部特写，女主哭时给眼睛特写

放大情绪

② 卡点调整

将笑点卡在第 3 秒、泪点卡在第 8 秒、爽点卡在第 30 秒（抖音完播黄金节点）

运镜速度匹配节奏（爽点用快切，泪点用慢推）

避坑点

拒绝长镜头（超过 6 秒）

抖音用户耐心不足，易划走

分镜画面必须有动作

如男主拔剑、女主逃跑

避免静态画面，提升视觉冲击力

出图

抖音核心

批量出图 + 手眼修复 + 高清留存，零崩图

核心升级

从 “批量跑图 + 手眼修复”

升级为AI 批量出图 + 人工质检 SOP + 崩图替换方案

保证每帧可用<br>

细化执行步骤

批量出图（分镜表驱动，算力最优）

工具

用 Stable Diffusion（ControlNet + 分镜表插件）

或 Midjourney（批量 Prompt）

按分镜表批量生成 12-15 张图，

单图生成 2-3 个版本（备用）

出图参数

分辨率1080*1920（9:16 竖屏）

采样率 20-30 步，避免过高算力浪费，保证出图速度

人工质检 + 修复（SOP 流程，高效不返工）

① 初筛

删除脸崩、手崩、眼歪、场景错乱的图

优先选高清、色彩统一、角色清晰的版本

② 手眼修复

用 PS / 醒图 / AI 修复工具（如 Remaker）

修复手部（多指 / 少指）、眼部（大小眼 / 斗鸡眼）

重点修复特写镜的手眼（观众最关注

③ 统一调色

用剪映 / PS 给所有图加统一滤镜

（如仙侠加 “古风暖调”，废土加 “暗调颗粒”）

保证风格统一

素材归档（复用降本）

按 “剧集 + 镜号” 命名（如 “战神归来_第 1 集_01 镜”）

归档到素材库

后续剧集可复用角色表情、场景图，减少重复出图

抖音专属要求

所有图必须无水印、无文字、无杂物

避免后期剪辑遮挡字幕 / 对话框

特写镜分辨率优先2K

全景镜 1080P 即可，平衡画质与算力

出视频

抖音核心

不闪帧 + 流畅拼接，省算力 + 高质感

职责优化

核心升级

从 “图生视频 + 选不闪帧” 升级为抖音图生视频模板 + 拼接节奏优化

解决闪帧、卡顿问题。

细化执行步骤

图生视频（批量跑 2-3 秒片段，算力最优）

工具

用 Runway Gen-2、Pika Labs、剪映 “图生视频” 功能

按分镜图批量生成 2-3 秒小视频

参数：帧率 30fps，运动幅度 “中等”（避免运动过大导致闪帧）

指令模板

“将【分镜图】生成 2 秒动漫视频

【运镜类型】，无闪帧，流畅，9:16 竖屏

【题材】风格”

人工筛选 + 拼接（核心：不闪帧 + 节奏）

① 筛片

删除闪帧、卡顿、运动模糊过度的片段

优先选运动自然、画面稳定的版本

② 拼接

按分镜顺序拼接

镜与镜之间加 0.1 秒黑屏 / 闪白转场（抖音快节奏适配，避免生硬切换）

③ 节奏调整

爽点片段加快播放速度（1.1-1.2 倍）

泪点片段放慢（0.9-0.8 倍）

钩子片段保持原速，提升情绪张力。

避坑点

拒绝用AI 自动长视频生成（易闪帧、卡顿）

必须拆成 2-3 秒小片段再拼接，省算力且质量更高

避免片段运动幅度差异过大（如前一段慢摇，后一段快推）

易导致观众视觉疲劳

配音

抖音核心

AI 克隆 + 情绪分层，口型精准 + 有感染力

职责优化

核心升级

从 “克隆声音 + 调情绪” 升级为抖音配音情绪模板 + 口型精准对齐

解决 AI 配音平淡、口型对不上问题。

细化执行步骤

声音克隆（3 秒录音 + 情绪训练）

工具

用剪映 “AI 配音”、讯飞配音、ElevenLabs

3 秒录自己的声音（读一句台词，如 “你敢动我家人？”）

克隆出专属音色

优化

给克隆声音加题材标签（如仙侠配 “古风御姐音”，战神配 “霸气男音”）

避免音色与题材违和

AI 配音 + 情绪分层（核心：区分怒吼 / 耳语）

按情绪给台词标注重音，给 AI 指令

为【剧本台词】配音，克隆音色【XX】

情绪：【钩子：愤怒 / 惊讶；冲突：激动 / 冰冷；爽点：霸气 / 得意；悬念：低沉 / 神秘】

语速：钩子快（1.2 倍），泪点慢（0.9 倍），怒吼加大音量，耳语减小音量，口型精准对齐

AI 输出

带情绪的配音文件，自动对口型（用 Wav2Lip、剪映 “口型同步” 功能）

人工调优（只做 3 件事）

① 情绪微调

怒吼加混响（提升霸气感），耳语加降噪（提升细腻感），泪点加轻微颤音（增强感染力）

② 口型修正

手动调整特写镜的口型（观众最关注），避免口型与台词脱节

③ 音量统一

所有配音音量控制在 **-16dB 到 - 12dB**（抖音音频标准），避免忽大忽小

抖音专属要求

配音必须口语化、有张力

拒绝平淡朗读，抖音用户对 “有情绪的声音” 更敏感

关键台词（如钩子、金句）

可重复配音 1-2 次（如 “莫欺少年穷！” 重复一遍），强化记忆点

剪辑

抖音核心

节奏卡点 + 互动引导，完播 + 点赞双提升

职责优化

核心升级

从 “加对话框 + 音效” 升级为抖音剪辑黄金节奏 + 互动元素植入

人类只抓 “节奏点 + 互动点”

细化执行步骤

基础剪辑（剪映一键操作，高效）

① 加对话框

用剪映 “动漫对话框” 模板，按台词添加

位置放在画面下方 1/3 处（不挡脸）

字体选粗体、醒目色（如仙侠用金色，现代用白色）

② 加音效

按剧情加抖音热门音效

（如愤怒加 “怒吼音效”，爽点加 “胜利音效”，悬念加 “紧张音效”）

音效音量比配音小 30%（不盖过人声）

③ 转场优化

镜与镜之间加抖音热门转场（如闪白、模糊、缩放）

钩子镜用 “快闪转场”，泪点镜用 “慢推转场”。

节奏卡点（核心：抖音完播黄金节点）

严格按以下节点调整剪辑节奏

第 3 秒：钩子音效 + 台词卡点，画面切主角特写；

第 8 秒：泪点 / 笑点卡点，画面切情绪特写，音效加重；

第 30 秒：爽点卡点，画面切全景 + 动作特写，音效拉满；

第 55-60 秒：悬念卡点，画面切主角冷脸，加 “下集更精彩” 音效

互动元素植入（抖音流量关键）

① 点赞 / 关注引导

在第 15 秒、45 秒、60 秒加 “点赞追更”“关注看全集” 的文字贴纸 / 动画

② 评论引导

在结尾加 “你觉得男主会复仇吗？

评论区告诉我”“猜下集剧情，抽粉丝送周边”，提升评论率

③ 话题标签

在剪辑时加抖音漫剧热门话题（如 #抖音漫剧 #战神归来 #赘婿逆袭），提升曝光

避坑点

对话框、贴纸不能挡脸、挡关键动作

否则影响观众观感，降低完播

音效不能过多、过杂

每镜只加 1 个核心音效，避免噪音干扰

字幕＋BGM

抖音核心

抖音核心：字幕醒目 + BGM 版权无忧，提升观看体验

职责优化

核心升级

从 “AI 字幕 + AI BGM” 升级为抖音字幕优化 + 版权 BGM 库

解决字幕看不清、BGM 侵权问题

细化执行步骤

字幕优化（AI 生成 + 人工精修）

① AI 生成

用剪映 “自动字幕” 功能，识别配音生成字幕，准确率 95% 以上；

② 人工精修

字体

选粗体、无衬线字体（如思源黑体、阿里巴巴普惠体），字号 24-28 号（抖音竖屏适配）

颜色

关键词（如钩子、金句、爽点）用红色 / 金色突出，普通台词用白色，背景加半透明黑底（保证看清）；

位置

放在画面下方 1/4 处，不挡对话框、不挡脸，每行字幕不超过 10 字，避免长句

纠错

修正 AI 识别错误的台词（如方言、生僻字），保证字幕与配音一致

BGM 优化（版权无忧 + 情绪匹配）

① 版权选择

优先用剪映版权库、抖音音乐库的 BGM（免费无侵权风险），拒绝用外网无版权音乐（易被限流）

② AI 生成 15 秒 loop

用 Suno AI、MusicFX 生成 15 秒循环 BGM

按题材选风格（仙侠用古风纯音乐，废土用摇滚，现代用流行），loop 适配 60 秒视频（重复 4 次）

③ 音量调整

BGM 音量比配音小 40%（-20dB 到 - 18dB）

钩子、爽点时 BGM 音量稍大，泪点、耳语时 BGM 音量稍小，突出人声

抖音专属要求

字幕必须同步配音

延迟不超过 0.1 秒，否则观众观感差

BGM 优先选抖音热门纯音乐

（如《古风纯音乐》《紧张氛围纯音乐》），自带流量，提升视频推荐

成片导出 + 上线

抖音核心

合规 + 数据复盘，持续优化

职责优化

核心升级

从 “导出 + 检查” 升级为抖音合规检查 + 数据复盘闭环

保证视频上线后流量最大化，持续迭代优化。

细化执行步骤

成片导出（参数标准化）

导出参数

1080P，30fps，H.264 编码，MP4 格式（抖音最佳适配格式）

码率 5-8Mbps（平衡画质与文件大小）

上线前检查（零失误，避免限流）

① 画面检查

字幕不挡脸、转场不掉帧、无闪帧、无水印

② 音频检查

配音清晰、BGM 音量合适、无杂音、口型对齐

③ 合规检查

无血腥、暴力、色情、政治敏感内容，无侵权素材（角色、场景、BGM 均为原创 / 版权授权）

④ 时长检查

严格控制在58-62 秒（抖音 60 秒流量池最优），避免过长或过短

上线发布（抖音流量技巧）

发布时间

选抖音漫剧用户活跃时段（12:00-14:00，18:00-23:00）

标题 + 话题

标题带关键词 + 悬念（如 “战神归来，竟被赘婿羞辱？下集反转燃爆！# 抖音漫剧 #战神逆袭”）

话题加1-2 个大话题 + 3-4 个小话题（如 #漫剧 #短剧推荐 #赘婿）

封面

选第 3 秒钩子镜作为封面，加醒目文字（如 “战神归来！”），提升点击率

数据复盘（持续优化，打造爆款）

发布后 24 小时，监控抖音后台数据

（完播率、点赞率、评论率、关注率、转发率）

完播率＜30%

优化前 3 秒钩子、节奏卡点，减少长镜头

点赞率＜5%

优化爽点、金句，加强情绪张力

关注率＜2%

优化结尾悬念、追更引导，增加互动元素

复盘后，将优化点迭代到下一集剧本、分镜、剪辑流程中

形成数据驱动的工作闭环。

核心总结

抖音适配

全流程围绕60 秒黄金结构、前 3 秒钩子、强情绪、高互动展开

每一步都贴合平台流量逻辑

降本增效

搭建场景库、角色库、分镜模板、BGM 库

复用素材，减少重复 AI 出图 / 配音，节省算力与时间；

质量可控

每一步都有SOP + 避坑点，解决 AI 出图崩、脸崩、闪帧、口型不对等核心痛点

数据闭环

上线后复盘数据，反向优化流程，持续提升视频质量与流量

期望

单集 60 秒 AI 漫剧从小说到上线3 小时完成

稳定产出符合抖音爆款逻辑的内容，批量运营

 Collect

Get Started

工作流

 Collect

Get Started

订单状态工作流

 Collect

Get Started

抖音、快手短视频平台对比

 Collect

Get Started

抖音短视频运营相关知识





0 条评论

下一页