videocut-install
环境准备。安装依赖、下载模型、验证环境。触发词:安装、环境准备、初始化
Best use case
videocut-install is best used when you need a repeatable AI agent workflow instead of a one-off prompt.
环境准备。安装依赖、下载模型、验证环境。触发词:安装、环境准备、初始化
Teams using videocut-install should expect a more consistent output, faster repeated execution, less prompt rewriting.
When to use this skill
- You want a reusable workflow that can be run more than once with consistent structure.
When not to use this skill
- You only need a quick one-off answer and do not need a reusable workflow.
- You cannot install or maintain the underlying files, dependencies, or repository context.
Installation
Claude Code / Cursor / Codex
Manual Installation
- Download SKILL.md from GitHub
- Place it in
.claude/skills/videocut-install/SKILL.mdinside your project - Restart your AI agent — it will auto-discover the skill
How videocut-install Compares
| Feature / Agent | videocut-install | Standard Approach |
|---|---|---|
| Platform Support | Not specified | Limited / Varies |
| Context Awareness | High | Baseline |
| Installation Complexity | Unknown | N/A |
Frequently Asked Questions
What does this skill do?
环境准备。安装依赖、下载模型、验证环境。触发词:安装、环境准备、初始化
Where can I find the source code?
You can find the source code on GitHub using the link provided at the top of the page.
SKILL.md Source
<!--
input: 无
output: 环境就绪
pos: 前置 skill,首次使用前运行
架构守护者:一旦我被修改,请同步更新:
1. ../README.md 的 Skill 清单
2. /CLAUDE.md 路由表
-->
# 安装
> 首次使用前的环境准备
## 快速使用
```
用户: 安装环境
用户: 初始化
用户: 下载模型
```
## 依赖清单
| 依赖 | 用途 | 安装命令 |
|------|------|----------|
| funasr | 口误识别 | `pip install funasr` |
| modelscope | 模型下载 | `pip install modelscope` |
| openai-whisper | 字幕生成 | `pip install openai-whisper` |
| ffmpeg | 视频剪辑 | `brew install ffmpeg` |
## 模型清单
### FunASR 模型(口误识别用)
首次运行自动下载到 `~/.cache/modelscope/`:
| 模型 | 大小 | 用途 |
|------|------|------|
| paraformer-zh | 953MB | 语音识别(带时间戳) |
| punc_ct | 1.1GB | 标点预测 |
| fsmn-vad | 4MB | 语音活动检测 |
| **小计** | **~2GB** | |
### Whisper 模型(字幕生成用)
首次运行自动下载到 `~/.cache/whisper/`:
| 模型 | 大小 | 用途 |
|------|------|------|
| large-v3 | 2.9GB | 字幕转录(质量最好) |
### 总计
约 **5GB** 模型文件
## 安装流程
```
1. 安装 Python 依赖
↓
2. 安装 FFmpeg
↓
3. 下载 FunASR 模型(口误识别)
↓
4. 下载 Whisper 模型(字幕生成)
↓
5. 验证环境
```
## 执行步骤
### 1. 安装 Python 依赖
```bash
pip install funasr modelscope openai-whisper
```
### 2. 安装 FFmpeg
```bash
# macOS
brew install ffmpeg
# Ubuntu
sudo apt install ffmpeg
# 验证
ffmpeg -version
```
### 3. 下载 FunASR 模型(约2GB)
```python
from funasr import AutoModel
model = AutoModel(
model="paraformer-zh",
vad_model="fsmn-vad",
punc_model="ct-punc",
)
print("FunASR 模型下载完成")
```
### 4. 下载 Whisper 模型(约3GB)
```python
import whisper
model = whisper.load_model("large-v3")
print("Whisper 模型下载完成")
```
### 5. 验证环境
```python
from funasr import AutoModel
model = AutoModel(
model="paraformer-zh",
vad_model="fsmn-vad",
punc_model="ct-punc",
disable_update=True
)
# 测试转录(用任意音频/视频)
result = model.generate(input="test.mp4")
print("文本:", result[0]['text'][:50])
print("时间戳数量:", len(result[0]['timestamp']))
print("✅ 环境就绪")
```
## 常见问题
### Q1: 模型下载慢
**解决**:使用国内镜像或手动下载
### Q2: ffmpeg 命令找不到
**解决**:确认已安装并添加到 PATH
```bash
which ffmpeg # 应该输出路径
```
### Q3: funasr 导入报错
**解决**:检查 Python 版本(需要 3.8+)
```bash
python3 --version
```Related Skills
videocut-subtitle
字幕生成与烧录。转录→词典纠错→审核→烧录。触发词:加字幕、生成字幕、字幕
videocut-self-update
自更新 skills。记录用户反馈,更新方法论和规则。触发词:更新规则、记录反馈、改进skill
videocut-clip
执行视频剪辑。根据确认的删除任务执行FFmpeg剪辑,循环直到零口误,生成字幕。触发词:执行剪辑、开始剪、确认剪辑
videocut-clip-oral
口播视频转录和口误识别。生成审查稿和删除任务清单。触发词:剪口播、处理视频、识别口误
video-subtitle-remover
视频硬字幕/水印去除技能。自动配置基于 YaoFANGUK/video-subtitle-remover 的环境并执行去字幕。当用户要求"去除视频字幕"、"去水印"、"把这个视频的字幕干掉"时触发此技能。
video-stickfigure
火柴人图片生成技能。使用AI生成粉笔画风格火柴人,并用HSV统一背景色。当需要生成火柴人视频素材时触发。
video-creator
视频创作技能。图片+音频合成视频,支持TTS配音、淡入淡出转场、字幕、片尾、BGM。当用户提到「生成视频」「做视频」「教学视频」「图文转视频」「做视频号」「配音视频」「图文结合视频」「古诗视频」「故事视频」时触发。内含生图→配音→合成全流程,无需单独调用image-service。
video-copywriting
短视频文案创作技能。包含爆款公式、黄金结构、三关校验。当需要撰写短视频文案时触发。
uni-agent
统一智能体协议适配层。一套 API 调用所有 Agent 协议(ANP/MCP/A2A/AITP 等)。当用户需要调用 Agent、跨协议通信、连接工具时触发此技能。
story-to-scenes
长文本拆镜批量生图引擎。将故事、课程、连环画脚本智能拆分场景,批量生成风格统一、角色一致的配图。当用户提到「拆镜生图」「故事配图」「批量场景图」「连环画生成」「绘本生成」时使用此技能。
smart-query
智能数据库查询技能。通过SSH隧道连接线上数据库,支持自然语言转SQL、执行查询、表结构探索。当用户需要查询数据库、问数据、看表结构时使用此技能。
skill-creator
Skill 开发指南。当用户需要创建新 Skill 或更新已有 Skill 时触发,提供标准化模板、目录规范和最佳实践。