ai-video-prompt

AI视频Prompt构建专家。采用"首尾帧图片+视频"工作流,支持多段5秒视频拼接生成长视频(30秒/60秒)。先生成关键帧图片,再生成视频Prompt,确保段与段之间无缝衔接。针对即梦平台优化,支持全中文Prompt输出。

3,891 stars

Best use case

ai-video-prompt is best used when you need a repeatable AI agent workflow instead of a one-off prompt.

AI视频Prompt构建专家。采用"首尾帧图片+视频"工作流,支持多段5秒视频拼接生成长视频(30秒/60秒)。先生成关键帧图片,再生成视频Prompt,确保段与段之间无缝衔接。针对即梦平台优化,支持全中文Prompt输出。

Teams using ai-video-prompt should expect a more consistent output, faster repeated execution, less prompt rewriting.

When to use this skill

  • You want a reusable workflow that can be run more than once with consistent structure.

When not to use this skill

  • You only need a quick one-off answer and do not need a reusable workflow.
  • You cannot install or maintain the underlying files, dependencies, or repository context.

Installation

Claude Code / Cursor / Codex

$curl -o ~/.claude/skills/ai-video-prompt/SKILL.md --create-dirs "https://raw.githubusercontent.com/openclaw/skills/main/skills/atmosphere16happy/ai-video-prompt/SKILL.md"

Manual Installation

  1. Download SKILL.md from GitHub
  2. Place it in .claude/skills/ai-video-prompt/SKILL.md inside your project
  3. Restart your AI agent — it will auto-discover the skill

How ai-video-prompt Compares

Feature / Agentai-video-promptStandard Approach
Platform SupportNot specifiedLimited / Varies
Context Awareness High Baseline
Installation ComplexityUnknownN/A

Frequently Asked Questions

What does this skill do?

AI视频Prompt构建专家。采用"首尾帧图片+视频"工作流,支持多段5秒视频拼接生成长视频(30秒/60秒)。先生成关键帧图片,再生成视频Prompt,确保段与段之间无缝衔接。针对即梦平台优化,支持全中文Prompt输出。

Where can I find the source code?

You can find the source code on GitHub using the link provided at the top of the page.

Related Guides

SKILL.md Source

# AI Video Prompt Builder - AI视频Prompt构建专家

## 概述

本Skill采用**"关键帧图片+多段视频拼接"**工作流,支持生成长视频(30秒/60秒或更长)。通过生成关键帧图片,再生成多段5秒视频,确保段与段之间无缝衔接。

**核心工作流:**
1. 规划视频总时长和段数(每段5秒)
2. 生成关键帧图片Prompt(N+1张,N=段数)
3. 生成每段5秒视频Prompt(基于相邻关键帧)
4. **关键:确保相邻段共用同一张关键帧**
5. 拼接成完整长视频

**核心能力:**
- 多段视频拼接规划
- 关键帧衔接一致性保障
- 道具/状态连贯性检查
- 详细描述防"违反常理"
- 即梦平台优化
- 全中文Prompt输出

**支持平台:**
- 即梦AI (Seedance) - 推荐
- Kling AI (可灵)
- Runway Gen-3/4
- OpenAI Sora

---

## 多段视频拼接原理

### 关键帧结构(以30秒=6段为例)

```
关键帧A(0s)
    ↓
关键帧B(5s)= 第1段尾帧 = 第2段首帧
    ↓
关键帧C(10s)= 第2段尾帧 = 第3段首帧
    ↓
关键帧D(15s)= 第3段尾帧 = 第4段首帧
    ↓
关键帧E(20s)= 第4段尾帧 = 第5段首帧
    ↓
关键帧F(25s)= 第5段尾帧 = 第6段首帧
    ↓
关键帧G(30s)= 第6段尾帧
```

**关键规则:**
- 30秒视频 = 6段 × 5秒 = **7张关键帧**
- 60秒视频 = 12段 × 5秒 = **13张关键帧**
- **相邻段必须共用同一张关键帧**

---

## 工作流程

### 阶段1:规划视频结构

**确定:**
- 总时长(30秒/60秒/其他)
- 段数(总时长 ÷ 5秒)
- 每段的起止状态
- 关键情绪转折点

### 阶段2:生成关键帧图片Prompt

**每张关键帧必须包含:**
1. **主体**:详细外貌+服装(完全一致)
2. **道具**:明确道具状态和位置
3. **表情**:具体神态
4. **姿势**:身体姿态
5. **环境**:场景+光线

**关键要求:**
- 所有关键帧的主体描述**完全相同**
- 道具状态变化要有**逻辑连贯性**
- 相邻关键帧的差异要**合理可控**

### 阶段3:生成每段视频Prompt

**每段结构:**
```
5秒视频:首帧状态 → 中间变化 → 尾帧状态
```

**要求:**
- 引用首帧图片
- 描述5秒内的完整变化
- 确保变化逻辑通向尾帧

### 阶段4:衔接一致性检查

**必须检查:**
- [ ] 第N段尾帧 = 第N+1段首帧(完全相同的Prompt)
- [ ] 道具状态连贯(玩具从有→掉→无,逻辑通顺)
- [ ] 主体外貌完全一致
- [ ] 服装完全一致
- [ ] 环境光线逻辑合理

---

## 关键帧衔接规范(防错误)

### 错误示例 ❌

**第1段尾帧B(5s):**
```
...手里抓着彩色玩具...
```

**第2段首帧B(5s):**
```
...手里无玩具...  ← 错误!道具不一致
```

### 正确示例 ✅

**第1段尾帧B(5s):**
```
...手里抓着彩色玩具...
```

**第2段首帧B(5s):**
```
...手里抓着彩色玩具...  ← 正确!完全一致
```

**第2段尾帧C(10s):**
```
...手里玩具掉落...  ← 在本段内变化
```

### 道具状态时间线规范

**必须明确记录每个关键帧的道具状态:**

| 时间 | 关键帧 | 道具状态 | 变化说明 |
|------|--------|---------|---------|
| 0s | A | 无玩具 | 初始状态 |
| 5s | B | 手中有玩具 | 妈妈给的 |
| 10s | C | 玩具掉落 | 紧张时掉了 |
| 15s | D | 无玩具 | 妈妈收起来了 |
| 20s | E | 无玩具 | 保持 |
| 25s | F | 无玩具 | 保持 |
| 30s | G | 无玩具 | 保持 |

**规则:**
- 道具变化只能发生在**段内**(视频生成时)
- 关键帧之间**道具状态必须一致**
- 变化要有**合理逻辑**(紧张→掉落,不是凭空消失)

---

## 详细描述规范

### 主体描述(所有关键帧必须相同)

```
一个可爱的周岁宝宝,圆脸,粉嫩脸颊,稀疏柔软的黑发,
明亮好奇的大眼睛,穿着白色连体衣
```

**禁止在不同关键帧中改变:**
- ❌ 脸型变了
- ❌ 发型变了
- ❌ 服装颜色变了
- ❌ 年龄变了

### 道具描述(明确状态和位置)

**规范格式:**
```
手里[状态]玩具([位置])
```

**示例:**
- `手里抓着彩色玩具(玩具在手中)`
- `手里玩具掉落(玩具不在手中,掉在腿上)`
- `手里无玩具(玩具在妈妈包里)`

### 表情描述(允许变化)

**规范格式:**
```
表情[具体神态]
```

**示例:**
- `表情平静,嘴角带着微笑`
- `表情开始紧张,眉头微皱`
- `表情害怕,眼睛睁大`

---

## 完整示例:30秒宝宝打疫苗

### 故事线规划

| 段 | 时间 | 场景 | 情绪 | 道具变化 |
|---|------|------|------|---------|
| 1 | 0-5s | 到达医院 | 好奇 | 无→有玩具 |
| 2 | 5-10s | 等待中 | 好奇→紧张 | 有→掉落 |
| 3 | 10-15s | 看到护士 | 紧张→害怕 | 掉落→无 |
| 4 | 15-20s | 注射瞬间 | 害怕→震惊→大哭 | 无 |
| 5 | 20-25s | 大哭中 | 痛苦 | 无 |
| 6 | 25-30s | 妈妈安抚 | 痛苦→平静 | 无 |

### 7张关键帧Prompt

#### A(0s)- 第1段首帧
```
中景固定镜头,可爱的周岁宝宝,圆脸粉嫩,黑发稀疏,
明亮好奇的大眼睛,穿白色连体衣,被妈妈抱着走进医院大门,
表情好奇东张西望,手里无玩具,医院明亮大厅,自然光,温馨,8K
```

#### B(5s)- 第1段尾帧 = 第2段首帧
```
中景固定镜头,同个宝宝,圆脸粉嫩,黑发稀疏,
明亮好奇的大眼睛,穿白色连体衣,被妈妈抱着坐在候诊区椅子上,
表情好奇观察周围环境,手里抓着彩色玩具(玩具在手中),
医院候诊区,其他小朋友在远处,自然光,8K
```

#### C(10s)- 第2段尾帧 = 第3段首帧
```
中景固定镜头,同个宝宝,圆脸粉嫩,黑发稀疏,
明亮好奇的大眼睛,穿白色连体衣,坐在妈妈腿上,
表情紧张眉头微皱,看向诊室方向,手里玩具掉落(玩具不在手中,掉在腿上),
医院候诊区,自然光,8K
```

#### D(15s)- 第3段尾帧 = 第4段首帧
```
特写固定镜头,同个宝宝,圆脸粉嫩,黑发稀疏,
明亮的大眼睛,穿白色连体衣,表情害怕眼睛睁大嘴巴微张,
看到护士拿着针管,身体向后缩,手里无玩具(玩具在妈妈包里),
诊室环境,clinical light,8K
```

#### E(20s)- 第4段尾帧 = 第5段首帧
```
特写固定镜头,同个宝宝,圆脸变红,黑发微乱,
明亮的大眼睛紧闭流泪,穿白色连体衣,表情痛苦嘴巴大张哭泣,
眼泪流下脸颊,小拳头紧握挥舞,手里无玩具,
诊室环境,clinical light,8K
```

#### F(25s)- 第5段尾帧 = 第6段首帧
```
中景固定镜头,同个宝宝,圆脸仍然泛红,黑发微乱,
明亮的大眼睛流泪,穿白色连体衣,坐在妈妈腿上,
表情痛苦但开始减弱,眼泪减少,小拳头松开,
妈妈手轻拍背部安抚,手里无玩具,
诊室环境,clinical light转柔和光,8K
```

#### G(30s)- 第6段尾帧
```
中景固定镜头,同个宝宝,圆脸恢复粉嫩,黑发整齐,
明亮好奇的大眼睛,穿白色连体衣,靠在妈妈怀里,
表情委屈但平静,小手放松,手里无玩具,
妈妈温柔安抚,柔和光,8K
```

### 6段视频Prompt

#### 第1段:0-5秒(到达医院)
```
5秒视频:宝宝被妈妈抱着走进医院,好奇地东张西望,
转头看医院环境,手指向彩色装饰,妈妈给宝宝玩具,
宝宝坐在妈妈腿上玩玩具,镜头跟随移动,
自然光,真实运动,平滑过渡
```

#### 第2段:5-10秒(等待中)
```
5秒视频:宝宝玩着玩具,突然听到叫号声表情变化,
转头看向诊室方向,眉头微皱开始紧张,
小手抓紧妈妈衣服,玩具从手中掉落,
镜头缓慢推进到宝宝脸部,自然光,真实情绪变化,平滑过渡
```

#### 第3段:10-15秒(看到护士)
```
5秒视频:宝宝表情紧张看向诊室,护士拿着针管走来,
宝宝表情从紧张变害怕,眼睛睁大身体向后缩,
小手推开,表情惊恐,妈妈收起掉落的玩具,
镜头切换到宝宝视角看护士,自然光,真实恐惧反应,平滑过渡
```

#### 第4段:15-20秒(注射瞬间)
```
5秒视频:护士消毒宝宝手臂,宝宝表情害怕,
针扎入瞬间宝宝表情从害怕变震惊,眼睛睁大嘴巴张开无声喘息,
然后立即爆发出大声哭泣,眼泪涌出,
特写镜头捕捉瞬间表情变化,clinical light,慢动作,平滑过渡
```

#### 第5段:20-25秒(大哭中)
```
5秒视频:宝宝大声哭泣眼泪流下,小拳头紧握挥舞身体扭动,
妈妈伸手轻拍宝宝背部安抚,宝宝哭声仍然很大,
镜头从特写拉远到中景,clinical light,真实哭泣,平滑过渡
```

#### 第6段:25-30秒(妈妈安抚)
```
5秒视频:妈妈轻拍宝宝背部温柔安抚,宝宝哭声逐渐变小变成抽泣,
身体逐渐放松靠在妈妈怀里,表情从痛苦变委屈平静,
眼泪停止,呼吸平稳,镜头缓慢拉远,
柔和光,温馨氛围,真实情绪平复,平滑过渡
```

---

## 衔接一致性检查表

### 关键帧对比检查

| 检查点 | 第1段尾帧B | 第2段首帧B | 状态 |
|--------|-----------|-----------|------|
| 主体外貌 | 圆脸,黑发稀疏 | 圆脸,黑发稀疏 | ✅ 一致 |
| 服装 | 白色连体衣 | 白色连体衣 | ✅ 一致 |
| 道具 | 手中有玩具 | 手中有玩具 | ✅ 一致 |
| 表情 | 好奇 | 好奇 | ✅ 一致 |

| 检查点 | 第2段尾帧C | 第3段首帧C | 状态 |
|--------|-----------|-----------|------|
| 主体外貌 | 圆脸,黑发稀疏 | 圆脸,黑发稀疏 | ✅ 一致 |
| 服装 | 白色连体衣 | 白色连体衣 | ✅ 一致 |
| 道具 | 玩具掉落 | 玩具掉落 | ✅ 一致 |
| 表情 | 紧张 | 紧张 | ✅ 一致 |

### 道具时间线检查

| 时间 | 关键帧 | 道具状态 | 逻辑 |
|------|--------|---------|------|
| 0s | A | 无玩具 | 初始 |
| 5s | B | 有玩具 | 妈妈给的 ✅ |
| 10s | C | 掉落 | 紧张掉了 ✅ |
| 15s | D | 无 | 妈妈收起来了 ✅ |
| 20s | E | 无 | 保持 ✅ |
| 25s | F | 无 | 保持 ✅ |
| 30s | G | 无 | 保持 ✅ |

---

## 在即梦平台的操作步骤

### 步骤1:生成7张关键帧图片

按顺序生成:A → B → C → D → E → F → G

**注意:**
- 每张图片都要仔细检查
- 确保主体外貌完全一致
- 确保道具状态符合时间线
- 确保相邻关键帧可衔接

### 步骤2:生成6段5秒视频

| 段 | 首帧 | 尾帧 | 视频时长 |
|---|------|------|---------|
| 1 | A | B | 0-5s |
| 2 | B | C | 5-10s |
| 3 | C | D | 10-15s |
| 4 | D | E | 15-20s |
| 5 | E | F | 20-25s |
| 6 | F | G | 25-30s |

### 步骤3:拼接视频

使用剪映/PR:
1. 按顺序导入6段视频
2. 检查衔接点(B→C→D→E→F)
3. 确保无缝衔接
4. 导出完整30秒视频

---

## 常见错误与修正

### 错误1:道具状态不一致

❌ **错误:**
```
第1段尾帧B:手里抓着玩具
第2段首帧B:手里无玩具  ← 矛盾!
```

✅ **修正:**
```
第1段尾帧B:手里抓着玩具
第2段首帧B:手里抓着玩具  ← 一致!
第2段尾帧C:玩具掉落      ← 变化发生在段内
```

### 错误2:主体外貌变化

❌ **错误:**
```
关键帧A:圆脸,黑发稀疏
关键帧B:瓜子脸,长发      ← 变了!
```

✅ **修正:**
```
关键帧A:圆脸,黑发稀疏
关键帧B:圆脸,黑发稀疏    ← 完全一致
```

### 错误3:服装颜色变化

❌ **错误:**
```
关键帧A:白色连体衣
关键帧B:蓝色连体衣        ← 变了!
```

✅ **修正:**
```
关键帧A:白色连体衣
关键帧B:白色连体衣        ← 完全一致
```

---

## 负面约束(每段通用)

```
无变形,无扭曲,无多余肢体,面部稳定,角色一致,
无闪烁,无突然变色,运动平滑,真实表情,自然眼泪,
符合物理规律,宝宝外貌一致,服装一致,道具逻辑连贯
```

---

**版本:** 4.0
**更新日期:** 2026-03-16
**更新内容:** 
- 添加多段视频拼接工作流
- 添加关键帧衔接一致性规范
- 添加道具状态时间线检查
- 添加常见错误与修正示例
**基于:** ChatGPT + 千问融合分析结果 + 实际使用反馈

Related Skills

demo-video

3891
from openclaw/skills

Create product demo videos by automating browser interactions and capturing frames. Use when the user wants to record a demo, walkthrough, product showcase, or interactive video of a web application. Supports Playwright CDP screencast for high-quality capture and FFmpeg for video encoding.

Video Production

prompt-injection-defense

3891
from openclaw/skills

Harden agent sessions against prompt injection from untrusted content. Use when the agent reads web search results, emails, downloaded files, PDFs, or any external text that could contain adversarial instructions. Provides content scanning, memory write guardrails (scan → lint → accept or quarantine), untrusted content tagging, and canary detection. Also use when setting up new tools that ingest external content (email checkers, RSS readers, web scrapers).

seedance-video

3891
from openclaw/skills

Generate AI videos using ByteDance Seedance. Use when the user wants to: (1) generate videos from text prompts, (2) generate videos from images (first frame, first+last frame, reference images), or (3) query/manage video generation tasks. Supports Seedance 1.5 Pro (with audio), 1.0 Pro, 1.0 Pro Fast, and 1.0 Lite models.

recipe-video-extractor

3891
from openclaw/skills

Extract a structured cooking recipe from a shared video URL when the user sends `recipe <url>`. Prioritize caption/description and comments via browser automation, then use web search/fetch as fallback with clear source attribution.

json2video-pinterest

3891
from openclaw/skills

Generate Pinterest-optimized vertical videos using JSON2Video API. Supports AI-generated or URL-based images, AI-generated or provided voiceovers, optional subtitles, and zoom effects. Use when creating video content for Pinterest affiliate marketing, creating vertical social media videos, automating video production with JSON2Video API, or generating videos with voiceovers and subtitles.

CinePrompt Skill

3891
from openclaw/skills

AI video prompt builder for cinematographers. Translates natural language shot descriptions into structured prompts optimized for AI video generators.

arch-video-cut

3891
from openclaw/skills

Automatic Architecture Video Editing Workflow with Self-Learning Preferences

short-video-script-generator-pro

3891
from openclaw/skills

AI Short Video Script Generator, support TikTok/YouTube Shorts/Instagram Reels, auto generate hook, shots, voiceover, subtitles, BGM, CTA. $0.005 USDT per use.

prompt-agent

3891
from openclaw/skills

将中文创意需求转换为 SDXL 或 Flux 可用的高质量英文图像提示词。当用户要求生成图片、画一张图、出图、AI绘画时触发。

ai-notes-of-video

3891
from openclaw/skills

The video AI notes tool is provided by Baidu. Based on the video download address provided by the user, it downloads and parses the video, and finally generates AI notes corresponding to the video (a total of three types of notes can be generated: document notes, outline notes, and image-text notes).

keevx-video-translate

3891
from openclaw/skills

Translate videos into a specified target language using the Keevx API. Supports audio-only translation, subtitle generation, and dynamic duration adjustment. Use this skill when the user needs to (1) Translate/dub a video (2) Translate a video from one language to another (3) Query the list of supported translation languages (4) Check the status of a video translation task. Keywords video translate, Keevx, dubbing.

keevx-image-to-video

3891
from openclaw/skills

Use the Keevx API to convert images to videos. Supports multiple models (V/KL), various resolutions (720p/1080p/4K), and audio generation. Use this skill when the user needs to: (1) Convert images to video (2) Generate video with Keevx (3) Create and query image-to-video tasks (4) Batch image-to-video conversion. Keywords: image to video, Keevx, video generation.