含切镜视频生成提示词邪修?这份标准结构格式值得收藏

你是不是看到过非常专业的视频生成控制的演示呢?在别人用AI生成的视频演示中,你能看到他们可以让AI完全按照自己的想法生成视频。今天,我就把这个秘诀教给你。

想要严格控制AI生成视频的整体过程,我们推荐一种标准化结构的提示词格式,这种格式向AI提供了全面的生成依据,因此,可以做到精准把控。

让我们先看一个案例。

下面这个视频是用通用语言描述生成的视频:

提示词如下:

健身房,大叔对着镜子努力举哑铃,表情狰狞。旁边肌肉男轻松拉起三倍重量,结果裤子崩开,露出卡通内裤。大叔憋笑到岔气,哑铃砸到脚,单腿乱跳撞倒一排蛋白粉罐,粉尘漫天,所有人变成“雪人”。

而下面这段视频的,则是用我们标准结构的提示词生成:

提示词如下:

镜头1(0-2秒)
运镜:固定镜头
画面:中景,平视,顶光。中年大叔在健身房镜子前奋力举哑铃,面部肌肉紧绷,嘴角抽搐,双臂微微颤抖。
音效:哑铃碰撞声。
---
转场:镜头跟随视线右移
---
镜头2(2-5秒)
运镜:缓慢推进
画面:特写,侧光,低饱和度。肌肉男轻松举起三倍重哑铃,裤子突然崩开,露出卡通内裤,周围人表情从惊讶到憋笑。
音效:布料撕裂声。
---
镜头3(5-8秒)
运镜:轻微晃动
画面:全景,俯拍,高对比度。大叔憋笑岔气,哑铃脱手砸到脚,单腿跳跃撞倒蛋白粉罐,粉尘弥漫,所有人变成"雪人",表情从痛苦到滑稽。
音效:哑铃落地声、罐子倒下声、粉尘飞扬声。
---
音效(0-8秒):健身房背景噪音

可以看到,AI遵循了我们提示词中至少90%的指令。

那么,一款标准结构的提示词格式是怎样呢?下面就是一份我们总结的标准提示词示例。

写实纪实风、自然光、低饱和、轻微颗粒感。(可选)
---
镜头1(0-3秒)
运镜:固定镜头,轻微手持感(可选)
画面:中景,平视,侧光。角色A(通过 mention 引用)坐在凌乱书桌前,台灯只照亮半张脸。
台词(角色A,低沉且疲惫):“又来了。”(可选)
音效:虫鸣声。(可选)
---
转场:硬切,跟随角色A视线方向(可选)
---
镜头2(3-6秒)
运镜:缓慢前推(可选)
画面:特写,俯拍,焦点从虚到实。桌上笔记本内页墨水晕开形成黑色圆点。
台词(角色A,压低声线):“这不对劲。”(可选)
音效:笔在纸上的书写声。(可选)
---
...(可包含更多镜头、转场,总时长控制在 8-15 秒内)
---
音效(4-12秒):雨声(跨镜头,按需添加)
音效(12-13秒):巨大的雷声(跨镜头,按需添加)
---
**强制音频约束**:禁止出现任何音乐内容(包括但不限于背景音乐、配乐、歌曲、BGM、持续哼唱、乐器演奏),仅允许“音效 + 说话声”。

让我们来详细拆解一下:

  • 开头:提供整体视频的基础信息,这里提供基础的视频风格。
  • 镜头:
    • 时间跨度
    • 运镜:这里需要注意,我们在镜头内先指出运镜,这让AI可以更好的遵循指令,经过多番测试,生成的视频效果更好。
    • 画面:包含景别、光影、构图等镜头设计。然后才是对故事情节的具体展开。
    • 台词
    • 镜头音效
  • 镜头间转场
  • 其他镜头
  • 跨镜头音效:提供了该音效的持续时长
  • 其他提示信息

这份提示词所包含的信息非常具体,这种具体的指令,可以让AI更加可控的按照我们的需要去生成视频。

以上就是这份含切镜视频生成提示词标准结构格式的秘诀要领。赶快到你的视频生成中去试试吧。

即梦积分Seedance2.0视频成本估算表

爆款AI漫剧的“钩子”艺术:如何让AI生成让人欲罢不能的故事

支持音画同步(声音)的文生视频、图生视频模型有哪些?