本文整理自火山引擎官方发布的 Seedance-1.5-pro 提示词指南,这是目前最权威的 Seedance 2.0 系列使用手册,覆盖从基础原则到高级音视频同步的完整技巧。
模型核心能力
Seedance 1.5 Pro 是原生支持音频与视频联合生成的专业级模型,核心优势:
- 音画高精同步:高保真音画声一体输出,支持环境音、动作音、合成音、乐器音、背景音乐及人声
- 多人多语言对白:支持独白与多人对话,口型毫秒级精准对齐,覆盖中文、方言、英文及小语种
- 影视级叙事张力:运动幅度自然、节奏感强,人物情绪与表情呈现细腻
提示词核心公式
主体 + 运动 + 环境(可选)+ 运镜/切镜(可选)+ 美学描述(可选)+ 声音(可选)
基础原则
原则 1:描述必要的信息
给出主体和运动的限定描述,善用程度副词增加精确度。
示例(单一主体):
一个面容沧桑、身穿中世纪海盗服饰的男子站在大海边黑色的礁石上。
男子的表情富有激情,他向天空有力地举起双手,动作透露出对自由的渴望。
示例(大场面):
狂风暴雨中,海面上卷起巨大的海浪。
海水冲进城市,撞毁岸边的房屋。
数以百计的市民惊恐地逃跑。最终海啸淹没一切。
原则 2:描述清晰的信息
Prompt 要与画面、音频形成正确对应,用特征指定主体,且全程指定方式保持一致。
多人场景——明确每个人的位置和特征(重要):
赛车比赛的拍摄现场,画面中从左到右按顺序是赛车手、导演、摄影师。
画面最左边赛车服形象的人是赛车手,
中间中国青年形象的人是导演,
最右边黑人手上抱着摄影机形象的人是摄影师。
全景拍摄,黑人摄影师看向导演,带着疑惑用英语说:"We got it?"
镜头缓慢推近,偏向导演与赛车手(中景),带轻微手持的呼吸感。
赛车手自信地用法语说:"Perfecto",他说话时露出自豪的笑容。
导演听到后点了点头,然后用四川话满意说:"有了有了,这条过"
这个示例展示了 Seedance 1.5 pro 的独特能力:同一个视频中三人分别说不同语言(英语/法语/四川话),口型精准对齐。
切镜叙事技巧
精准的切镜描述是创作专业叙事视频的关键。
切镜基本原则
- 明确区分每个镜头,告诉模型确切的切镜信息
- 精准撰写切镜的时机
- 切镜之间有明确的景别/内容区分
示例:两镜头情感对话
第一镜头为侧面中景,男生看向窗外。
男生开口说:「大丈夫だと思ってた……」
随后切镜至第二镜头,第二镜头为男生面部特写。
第二镜头中,他说:「でも、たぶん自分に嘘ついてただけだ。」
示例:三人多语言对话切镜
镜头从三人同框的中景开始,中间黑人男子开口说道:"We need to clear this up."
接着切镜至第二镜头,第二镜头为左侧女子近景,冷静回应:"I've already made my choice."
接着切镜至第三镜头,第三镜头为白人男子近景,轻轻呼出一口气,说:"The problem is, your choice affects all of us."
最后镜头切回三人同框的中景,气氛明显变得紧张。
示例:超级英雄变身(四镜头 + 对白)
镜头1 正面中景。普通卧室内,夜晚,窗外城市微光透进来。
成年男子正对镜头站在床边,穿着普通 T 恤与牛仔裤。
男子皱眉看向自己的双手,空气中开始出现细微的能量粒子,房间灯光轻微闪烁一次。
镜头2 切镜到手部特写。
蓝白色能量迅速包裹双手,像液态金属与光能混合,从指尖向手臂流动。
镜头3 切镜男子面部特写。
能量沿着颈部与下颌攀升,皮肤表面浮现出清晰的英雄装甲纹路,眼睛亮起冷白色光。
镜头4 切镜到正面中远景。
能量在全身爆发,衣物被光能吞没并重构,完整的超级英雄战衣快速成型。
他说道:"Guess there's no going back."
声音生成技巧
描述公式:性别 + 年龄区间 + 声音属性 + 语速 + 情绪基线
单人对话示例:
一名女性,年龄区间约为 18-22 岁。
声音音域偏高但不尖锐,发声轻快,气声比例适中,音色明亮而有弹性。
语速中等偏快,语调起伏明显。情绪基线积极、外向,带有轻微兴奋感和青春活力。
说中文普通话。
她说:"如果有变动,记得第一时间跟我说一声。"
双人对话示例(两种音色对比):
两人正在办公区域中面对面交谈,整体氛围轻松,画面保持稳定无切镜。
第一位男性:声音属性为中音域,音色自然,语速中等偏快,情绪基线随意、略带关心。
他说道:"你现在主要卡在哪一块?"
另一位男性:声音属性为中音域偏低,发声稳重,语速中等,情绪基线平和、配合。
他说道:"核心部分已经处理好了,就是细节还要再对一遍。"
多语言多方言支持
| 语言类型 | 支持内容 |
|---|---|
| 中文方言 | 普通话、陕西话、四川话、粤语等 |
| 外语 | 英语、日语、韩语、西班牙语、印尼语等 |
| 混语 | 同一段视频中不同角色使用不同语言 |
常见场景提示词模板
产品展示视频
[品牌]香水瓶放置在纯黑背景上,专业三点式打光。
镜头缓缓环绕瓶身 360 度旋转,展示瓶身细节。
轻柔优雅的背景音乐渐入,营造高端质感。
人物情感特写
[外貌描述]的女性坐在咖啡馆靠窗位置,窗外是雨中的街道。
她拿起咖啡杯轻轻抿了一口,望向窗外若有所思,眼神里带有一丝忧郁。
镜头缓慢推近至面部中景,浅景深,背景虚化。
雨声轻轻敲打窗户,与背景音乐融合。
自然纪录片风格
大草原清晨,薄雾弥漫,金色阳光从地平线升起。
镜头以低角度拍摄,一头非洲象缓缓走过画面前景。
跟随拍摄,手持纪录片风格,带轻微抖动感。
自然环境音:风声、鸟叫、草叶摩擦声。
注意事项
camera_fixed: true时禁用运镜,适合需要稳定背景的场景(产品展示等)- 切镜时间点建议在提示词中明确说明,避免模型随机决定切换时机
- 音色描述越详细,生成结果越稳定;避免使用模糊的描述如「好听的声音」
- 方言和小语种的效果受训练数据影响,建议先小规模测试
来源:Seedance-1.5-pro 提示词指南 - 火山引擎 | 来源:火山引擎官方文档