videocut-install

环境准备。安装依赖、下载模型、验证环境。触发词:安装、环境准备、初始化

154 stars

Best use case

videocut-install is best used when you need a repeatable AI agent workflow instead of a one-off prompt.

环境准备。安装依赖、下载模型、验证环境。触发词:安装、环境准备、初始化

Teams using videocut-install should expect a more consistent output, faster repeated execution, less prompt rewriting.

When to use this skill

  • You want a reusable workflow that can be run more than once with consistent structure.

When not to use this skill

  • You only need a quick one-off answer and do not need a reusable workflow.
  • You cannot install or maintain the underlying files, dependencies, or repository context.

Installation

Claude Code / Cursor / Codex

$curl -o ~/.claude/skills/videocut-install/SKILL.md --create-dirs "https://raw.githubusercontent.com/zrt-ai-lab/opencode-skills/main/videocut-install/SKILL.md"

Manual Installation

  1. Download SKILL.md from GitHub
  2. Place it in .claude/skills/videocut-install/SKILL.md inside your project
  3. Restart your AI agent — it will auto-discover the skill

How videocut-install Compares

Feature / Agentvideocut-installStandard Approach
Platform SupportNot specifiedLimited / Varies
Context Awareness High Baseline
Installation ComplexityUnknownN/A

Frequently Asked Questions

What does this skill do?

环境准备。安装依赖、下载模型、验证环境。触发词:安装、环境准备、初始化

Where can I find the source code?

You can find the source code on GitHub using the link provided at the top of the page.

SKILL.md Source

<!--
input: 无
output: 环境就绪
pos: 前置 skill,首次使用前运行

架构守护者:一旦我被修改,请同步更新:
1. ../README.md 的 Skill 清单
2. /CLAUDE.md 路由表
-->

# 安装

> 首次使用前的环境准备

## 快速使用

```
用户: 安装环境
用户: 初始化
用户: 下载模型
```

## 依赖清单

| 依赖 | 用途 | 安装命令 |
|------|------|----------|
| funasr | 口误识别 | `pip install funasr` |
| modelscope | 模型下载 | `pip install modelscope` |
| openai-whisper | 字幕生成 | `pip install openai-whisper` |
| ffmpeg | 视频剪辑 | `brew install ffmpeg` |

## 模型清单

### FunASR 模型(口误识别用)

首次运行自动下载到 `~/.cache/modelscope/`:

| 模型 | 大小 | 用途 |
|------|------|------|
| paraformer-zh | 953MB | 语音识别(带时间戳) |
| punc_ct | 1.1GB | 标点预测 |
| fsmn-vad | 4MB | 语音活动检测 |
| **小计** | **~2GB** | |

### Whisper 模型(字幕生成用)

首次运行自动下载到 `~/.cache/whisper/`:

| 模型 | 大小 | 用途 |
|------|------|------|
| large-v3 | 2.9GB | 字幕转录(质量最好) |

### 总计

约 **5GB** 模型文件

## 安装流程

```
1. 安装 Python 依赖
       ↓
2. 安装 FFmpeg
       ↓
3. 下载 FunASR 模型(口误识别)
       ↓
4. 下载 Whisper 模型(字幕生成)
       ↓
5. 验证环境
```

## 执行步骤

### 1. 安装 Python 依赖

```bash
pip install funasr modelscope openai-whisper
```

### 2. 安装 FFmpeg

```bash
# macOS
brew install ffmpeg

# Ubuntu
sudo apt install ffmpeg

# 验证
ffmpeg -version
```

### 3. 下载 FunASR 模型(约2GB)

```python
from funasr import AutoModel

model = AutoModel(
    model="paraformer-zh",
    vad_model="fsmn-vad",
    punc_model="ct-punc",
)
print("FunASR 模型下载完成")
```

### 4. 下载 Whisper 模型(约3GB)

```python
import whisper

model = whisper.load_model("large-v3")
print("Whisper 模型下载完成")
```

### 5. 验证环境

```python
from funasr import AutoModel

model = AutoModel(
    model="paraformer-zh",
    vad_model="fsmn-vad",
    punc_model="ct-punc",
    disable_update=True
)

# 测试转录(用任意音频/视频)
result = model.generate(input="test.mp4")
print("文本:", result[0]['text'][:50])
print("时间戳数量:", len(result[0]['timestamp']))
print("✅ 环境就绪")
```

## 常见问题

### Q1: 模型下载慢

**解决**:使用国内镜像或手动下载

### Q2: ffmpeg 命令找不到

**解决**:确认已安装并添加到 PATH

```bash
which ffmpeg  # 应该输出路径
```

### Q3: funasr 导入报错

**解决**:检查 Python 版本(需要 3.8+)

```bash
python3 --version
```

Related Skills

videocut-subtitle

154
from zrt-ai-lab/opencode-skills

字幕生成与烧录。转录→词典纠错→审核→烧录。触发词:加字幕、生成字幕、字幕

videocut-self-update

154
from zrt-ai-lab/opencode-skills

自更新 skills。记录用户反馈,更新方法论和规则。触发词:更新规则、记录反馈、改进skill

videocut-clip

154
from zrt-ai-lab/opencode-skills

执行视频剪辑。根据确认的删除任务执行FFmpeg剪辑,循环直到零口误,生成字幕。触发词:执行剪辑、开始剪、确认剪辑

videocut-clip-oral

154
from zrt-ai-lab/opencode-skills

口播视频转录和口误识别。生成审查稿和删除任务清单。触发词:剪口播、处理视频、识别口误

video-subtitle-remover

154
from zrt-ai-lab/opencode-skills

视频硬字幕/水印去除技能。自动配置基于 YaoFANGUK/video-subtitle-remover 的环境并执行去字幕。当用户要求"去除视频字幕"、"去水印"、"把这个视频的字幕干掉"时触发此技能。

video-stickfigure

154
from zrt-ai-lab/opencode-skills

火柴人图片生成技能。使用AI生成粉笔画风格火柴人,并用HSV统一背景色。当需要生成火柴人视频素材时触发。

video-creator

154
from zrt-ai-lab/opencode-skills

视频创作技能。图片+音频合成视频,支持TTS配音、淡入淡出转场、字幕、片尾、BGM。当用户提到「生成视频」「做视频」「教学视频」「图文转视频」「做视频号」「配音视频」「图文结合视频」「古诗视频」「故事视频」时触发。内含生图→配音→合成全流程,无需单独调用image-service。

video-copywriting

154
from zrt-ai-lab/opencode-skills

短视频文案创作技能。包含爆款公式、黄金结构、三关校验。当需要撰写短视频文案时触发。

uni-agent

154
from zrt-ai-lab/opencode-skills

统一智能体协议适配层。一套 API 调用所有 Agent 协议(ANP/MCP/A2A/AITP 等)。当用户需要调用 Agent、跨协议通信、连接工具时触发此技能。

story-to-scenes

154
from zrt-ai-lab/opencode-skills

长文本拆镜批量生图引擎。将故事、课程、连环画脚本智能拆分场景,批量生成风格统一、角色一致的配图。当用户提到「拆镜生图」「故事配图」「批量场景图」「连环画生成」「绘本生成」时使用此技能。

smart-query

154
from zrt-ai-lab/opencode-skills

智能数据库查询技能。通过SSH隧道连接线上数据库,支持自然语言转SQL、执行查询、表结构探索。当用户需要查询数据库、问数据、看表结构时使用此技能。

skill-creator

154
from zrt-ai-lab/opencode-skills

Skill 开发指南。当用户需要创建新 Skill 或更新已有 Skill 时触发,提供标准化模板、目录规范和最佳实践。