deep_research

深度研究能力，支持多源搜索、信息聚合、引用回溯、文档上传分析。适用于市场调研、竞品分析、学术研究、技术选型、金融投研等场景。支持上传 PDF/Excel/Word 等文档，自动转换并提取关键信息。

105 stars

byaifinlab

View on GitHub Installation ↓

Best use case

deep_research is best used when you need a repeatable AI agent workflow instead of a one-off prompt.

Teams using deep_research should expect a more consistent output, faster repeated execution, less prompt rewriting.

When to use this skill

You want a reusable workflow that can be run more than once with consistent structure.

When not to use this skill

You only need a quick one-off answer and do not need a reusable workflow.
You cannot install or maintain the underlying files, dependencies, or repository context.

Installation

Claude Code / Cursor / Codex

$curl -o ~/.claude/skills/deep_research/SKILL.md --create-dirs "https://raw.githubusercontent.com/aifinlab/FinClaw/main/skills/deep_research/SKILL.md"

Manual Installation

Download SKILL.md from GitHub
Place it in .claude/skills/deep_research/SKILL.md inside your project
Restart your AI agent — it will auto-discover the skill

How deep_research Compares

Feature / Agent	deep_research	Standard Approach
Platform Support	Not specified	Limited / Varies
Context Awareness	High	Baseline
Installation Complexity	Unknown	N/A

Frequently Asked Questions

What does this skill do?

Where can I find the source code?

You can find the source code on GitHub using the link provided at the top of the page.

SKILL.md Source

## 能力概述

深度研究能力让你能够系统性地调研某个主题，通过多源搜索、信息聚合、交叉验证，生成结构化的研究报告。

**核心特点**：
- 每个结论都标注来源引用，确保可追溯性
- 自动评估来源可信度
- 支持多维度拆解复杂主题
- 交叉验证关键数据
- **支持文档上传**: 自动转换 PDF/Excel/Word 等文件为 Markdown

## 工作流程

### Phase 0: 文档预处理（如有上传）
当用户上传文档时，优先处理：
1. 检测附件类型（PDF/Excel/Word/CSV 等）
2. 使用 `file_converter` 工具转换为 Markdown
3. 提取关键信息并注入 Context
4. 对于财报等结构化数据，自动识别关键指标

> 详见 L3 资源：`resources/document_upload_guide.md`

### Phase 1: 需求澄清
与用户确认研究主题、深度、范围：
- 主题是什么？
- 需要多深入？（概览 / 深度分析）
- 有无特定关注点？
- 输出格式偏好？

### Phase 2: 查询拆解
将主题拆解为多个搜索子查询，确保覆盖：
- **概述**：{topic} overview / 概述
- **市场/规模**：{topic} market size / 市场规模
- **关键玩家**：{topic} key players companies / 主要厂商
- **技术趋势**：{topic} trends 2024 / 发展趋势
- **挑战问题**：{topic} challenges problems / 面临挑战
- **案例研究**：{topic} case studies / 典型案例

### Phase 3: 并行搜索
对每个子查询执行 web_search：
- 每个维度至少获取 3-5 个来源
- 优先选择权威来源
- 记录搜索时间（时效性）

### Phase 4: 内容提取
对搜索结果中的高相关性页面调用 read_url：
- 只读取 Top 相关性页面（避免 Context 爆炸）
- 优先官方网站、权威媒体
- 对长文本先摘要再存储

### Phase 4.5: 浏览器自动化（按需）
当遇到以下情况时，切换到浏览器操作：
- 动态 SPA 应用（read_url 返回空白）
- 需要登录的平台
- 反爬虫保护的网站
- 需要滚动/交互加载的内容

浏览器工作流：
1. `browser_open` 打开目标页面
2. `browser_snapshot` 获取页面结构（compact模式）
3. 根据需要执行 `browser_click`/`browser_fill`
4. `browser_screenshot` 记录关键帧
5. 提取信息后 `browser_close` 释放资源

> 详见 L3 资源：`resources/browser_automation.md`

### Phase 5: 信息聚合
- 去重相同信息
- 识别共识与分歧
- 评估来源可信度
- 整理关键数据点

### Phase 6: 结构化输出
生成研究报告，标注引用

### Phase 7: 用户确认
询问是否需要深入某个方向

## 工具使用

### web_search
**用途**：搜索网页信息

**参数**：
- `query`: 搜索查询（精确、具体）
- `num_results`: 结果数量（建议 5-10）

**最佳实践**：
- 查询要具体，避免泛泛而谈
- 多个维度分别搜索，而非一次搜全部
- 优先使用英文搜索（信息更丰富）
- 对于中文主题，中英文各搜一次

**示例**：
```
web_search(query="AI Agent market size 2024", num_results=5)
web_search(query="AI Agent 市场规模 2024", num_results=5)
```

### read_url
**用途**：提取网页完整内容

**参数**：
- `url`: 目标 URL

**最佳实践**：
- 只读取搜索结果中的高相关性页面
- 优先选择官方网站、权威媒体
- 对于长文本（>2000字），先摘要再存储

**示例**：
```
read_url(url="https://example.com/article")
```

### wechat_article
**用途**：提取微信公众号文章内容

**参数**：
- `url`: 微信公众号文章链接 (mp.weixin.qq.com)
- `format`: 输出格式，"markdown" (默认) 或 "html"
- `include_images`: 是否包含图片引用 (默认 true)

**最佳实践**：
- 当用户提供微信公众号链接时，使用此工具而不是 read_url
- 微信文章通常无法通过通用爬虫抓取
- 输出为干净的 Markdown 格式

**示例**：
```python
wechat_article(url="https://mp.weixin.qq.com/s/xxxxx")
wechat_article(url="https://mp.weixin.qq.com/s/xxxxx", format="html")
```

### create_document
**用途**：创建研究报告

**参数**：
- `title`: 报告标题
- `content`: Markdown 格式内容
- `format`: 输出格式（markdown）

### file_converter
**用途**：将上传文件转换为 Markdown

**参数**：
- `file_path`: 文件路径（绝对或相对）
- `extract_images`: 是否提取图片描述（默认 false）

**支持格式**：
- **办公文档**: PDF, DOCX, PPTX, XLSX, XLS
- **结构化数据**: CSV, JSON, XML
- **文本**: TXT, MD, HTML
- **图片**: JPG, PNG (需 Vision LLM)
- **压缩包**: ZIP (递归处理)

**示例**：
```python
file_converter(file_path="/workspace/uploads/2024Q3_财报.xlsx")
file_converter(file_path="/workspace/uploads/行业报告_2024.pdf")
```

> 详见 L3 资源：`resources/document_upload_guide.md`

### browser_* 系列（浏览器自动化）

基于 agent-browser 的 Snapshot + Refs 机制，相比传统 Playwright 节省 93%+ tokens。

**browser_open**: 打开网页
```python
browser_open(url="https://example.com")
# 返回: {"title": "...", "url": "..."}
```

**browser_snapshot**: 获取页面结构快照（核心）
```python
browser_snapshot(interactive_only=True, compact=True)
# 返回压缩的 Markdown 格式，约 500-2000 tokens
# - @e1 [搜索框] type=input
# - @e2 [按钮] type=button
```

**browser_click**: 点击元素
```python
browser_click(ref="@e1")  # 使用 snapshot 返回的 Ref ID
```

**browser_fill**: 填充输入框
```python
browser_fill(ref="@e1", text="搜索关键词")
```

**browser_screenshot**: 截取关键帧
```python
browser_screenshot(path="/workspace/screenshots/step1.png")
```

**browser_close**: 关闭浏览器
```python
browser_close()
```

> 详细用法参见 L3 资源：`resources/browser_automation.md`

## 最佳实践

### 1. Read-then-Summarize
对于长文本（>2000字）：
1. 先用小模型摘要
2. 摘要放入 Context
3. 原文存储到文件系统

### 2. 引用回溯
每个关键结论必须标注引用：
- 格式：`[1]`、`[2]`
- 在文末列出完整引用信息
- 引用格式：`[编号] 标题 - 来源域名 (可信度)`

### 3. 来源可信度评分
| 来源类型 | 评分 |
|---------|------|
| 官方网站/政府机构 | ★★★★★ |
| 知名媒体/研究机构 | ★★★★ |
| 专业博客/技术文档 | ★★★ |
| 社交媒体/论坛 | ★★ |
| 未知来源 | ★ |

### 4. 交叉验证
- 关键数据至少 2 个来源确认
- 存在分歧时明确标注
- 不同来源的数据范围要说明

### 5. 时效性标注
- 注明搜索日期
- 对于快速变化的领域，提醒用户数据可能过时

## 输出格式

```markdown
# [研究主题] 深度研究报告

> 研究日期：YYYY-MM-DD
> 研究深度：[概览/深度分析]

## 摘要
3-5 句话概括核心发现，包含最重要的数据点。

## 目录
- 1. 概述
- 2. 市场规模与趋势
- 3. 主要玩家
- 4. 技术分析
- 5. 挑战与机遇
- 6. 结论与建议

## 1. 概述
简要介绍主题背景...[1]

## 2. 市场规模与趋势
### 2.1 市场规模
具体数据...[2][3]

### 2.2 增长趋势
分析内容...[4]

## 3. 主要玩家
| 公司 | 产品 | 特点 |
|------|------|------|
| ... | ... | ... |

## 4. 技术分析
技术细节...[5]

## 5. 挑战与机遇
### 5.1 主要挑战
- 挑战1...[6]
- 挑战2...

### 5.2 机遇
- 机遇1...

## 6. 结论与建议
总结性内容...

---

## 参考来源
[1] 标题 - example.com (★★★★)
[2] 标题 - research.org (★★★★★)
[3] 标题 - news.com (★★★★)
...

## 数据说明
- 本报告数据采集于 YYYY-MM-DD
- 部分数据存在来源差异，已在文中标注
- 对于快速变化的领域，建议定期更新
```

## 注意事项

1. **避免 Context 爆炸**
   - 不要一次性搜索太多 query
   - 长文本先摘要
   - 只提取关键信息入 Context

2. **语言策略**
   - 优先使用英文搜索（信息更丰富）
   - 对于中文主题，中英文各搜一次
   - 输出语言与用户输入保持一致

3. **时效性处理**
   - 对于时效性强的内容，注明搜索日期
   - 提醒用户数据可能变化

4. **不确定性处理**
   - 明确标注"据多个来源显示"/"部分来源认为"
   - 存在争议时两方观点都呈现
   - 避免过度断言

5. **隐私与版权**
   - 不搜索个人隐私信息
   - 引用内容要标注来源
   - 大段引用需注明"引自"

Related Skills

fund-market-research

105

from aifinlab/FinClaw

基金市场研究 - 基金市场全景分析与趋势研究工具。当用户需要了解基金市场整体情况、查看市场规模、分析资金流向、追踪热门板块、查看基金发行日历时使用此技能。支持市场规模统计、新发基金追踪、资金流向分析、热门板块追踪、收益分布分析、市场情绪监测。触发关键词：基金市场、市场规模、资金流向、热门板块、基金发行、基金趋势、市场研究。

research-report-draft-junior

105

from aifinlab/FinClaw

研报初稿助手 - 助理研究员版。专为助理研究员/实习生设计，提供结构化研报框架、数据填充指引、基础分析模板，帮助快速完成研报初稿。 **触发场景**： - 用户是助理研究员/实习生，需要写研报初稿 - 用户说"帮我搭个框架"、"写个初稿"、"研报模板" - 需要结构化模板、数据填充指引 - 需要基础分析逻辑、常用表述 **关键词**："助理"、"实习生"、"初稿"、"框架"、"模板"、"研报草稿"、"新手"、"入门"

research-report-draft-institutional

105

from aifinlab/FinClaw

研报初稿助手 - 机构客户版。专为服务机构客户设计，输出专业严谨、数据详实、逻辑严密的深度研报，满足保险、公募、私募等机构投资者需求。 **触发场景**： - 用户需要写面向机构客户的研报 - 用户说"机构版"、"公募"、"保险"、"私募"、"专业版" - 需要专业严谨、数据详实 - 需要逻辑严密、模型完善 **关键词**："机构"、"公募"、"保险"、"私募"、"专业"、"深度"、"严谨"

research-report-draft-analyst

105

from aifinlab/FinClaw

研报初稿助手 - 研究员版。专为成熟研究员设计，提供深度分析框架、差异化观点提炼、复杂模型支持，帮助完成高质量深度研报。 **触发场景**： - 用户是成熟研究员，需要写深度研报 - 用户说"深度报告"、"差异化观点"、"复杂分析" - 需要深度分析框架、差异化视角 - 需要复杂模型支持、敏感性分析 **关键词**："研究员"、"深度报告"、"差异化"、"复杂分析"、"深度研报"、"专业版"

industry-research-real-estate

105

from aifinlab/FinClaw

行业研究助手 - 地产版。专注于房地产行业研究，包括住宅开发、商业地产、物业管理、房地产服务等赛道。 **触发场景**： - 用户研究房地产行业/细分赛道（住宅开发、商业地产、物业、代建） - 分析房企财务指标（三道红线、土储、销售、融资） - 房地产政策影响（限购、限贷、融资政策） - 房企竞品对标、估值分析 - 写房地产行业研报、晨会材料、客户简报 **关键词**："房地产"、"地产"、"房企"、"销售"、"土储"、"三道红线"、"物业"、"商业地产"、"限购"、"房贷"

industry-research-new-energy

105

from aifinlab/FinClaw

行业研究助手 - 新能源版。专注于新能源行业研究，包括光伏、风电、储能、新能源汽车、锂电池、氢能等赛道。 **触发场景**： - 用户研究新能源行业/细分赛道（光伏、风电、储能、锂电、电动车、氢能） - 分析产业链环节（硅料 - 硅片 - 电池 - 组件、正极 - 负极 - 电解液 - 隔膜） - 新能源政策影响（补贴、双碳目标、装机目标） - 新能源公司竞品对标、产能分析、成本曲线 - 写新能源行业研报、晨会材料、客户简报 **关键词**："光伏"、"风电"、"储能"、"锂电"、"电动车"、"新能源"、"硅料"、"电池"、"装机"、"双碳"

industry-research-healthcare

105

from aifinlab/FinClaw

行业研究助手 - 医药版。专注于医药生物行业研究，包括创新药、仿制药、医疗器械、CXO、医疗服务、中药、生物制品等赛道。 **触发场景**： - 用户研究医药行业/细分赛道（创新药、CXO、器械、医疗服务、中药等） - 分析药品/器械产品管线、研发进度、临床数据 - 医药政策影响分析（集采、医保谈判、DRG/DIP 支付改革） - 医药公司竞品对标、估值分析 - 写医药行业研报、晨会材料、客户简报 **关键词**："医药"、"创新药"、"CXO"、"医疗器械"、"集采"、"医保"、"临床"、"药品"、"生物药"、"中药"、"医疗服务"

industry-research-finance

105

from aifinlab/FinClaw

行业研究助手 - 金融版。专注于金融行业研究，包括银行、保险、证券、多元金融、金融科技等赛道。 **触发场景**： - 用户研究金融行业/细分赛道（银行、保险、券商、金融科技） - 分析金融公司财务指标（PB、ROE、不良率、拨备覆盖率） - 金融政策影响（利率、准备金率、监管政策） - 金融公司竞品对标、估值分析 - 写金融行业研报、晨会材料、客户简报 **关键词**："银行"、"保险"、"券商"、"证券"、"金融"、"不良率"、"拨备"、"ROE"、"PB"、"息差"、"保费"

portfolio-attribution-research

105

from aifinlab/FinClaw

面向基金投研分析领域的组合归因任务Skill，围绕「组合归因助手-投研版」场景提供信息抽取、结构化分析与结果输出。

fund-product-health-check-research

105

from aifinlab/FinClaw

面向基金投研分析领域的产品体检任务Skill，围绕「基金产品体检助手-投研版」场景提供信息抽取、结构化分析与结果输出。

company-research-new-listed

105

from aifinlab/FinClaw

公司研究助手 - 次新股版。专注于次新股公司研究，包括上市 1-3 年内的新股、科创板新股、创业板新股。 **触发场景**： - 用户研究次新股（上市 1-3 年内、新股、科创板/创业板新股） - 分析次新股解禁压力、业绩增速、估值消化 - 次新股竞品对标、估值对比（与已上市公司） - 次新股投资策略（何时介入、风险点） - 写次新股研报、新股分析 **关键词**："次新"、"新股"、"上市"、"解禁"、"科创板"、"创业板"、"IPO"、"估值消化"、"破发"

company-research-high-dividend

105

from aifinlab/FinClaw

公司研究助手 - 高股息版。专注于高股息公司研究，包括高分红、高股息率、稳定分红的公司。 **触发场景**： - 用户研究高股息公司（股息率>5%、稳定分红、现金流充沛） - 分析公司分红能力、分红意愿、分红可持续性 - 高股息公司估值分析（股息率、分红率） - 高股息公司竞品对标、收益对比 - 写高股息公司研报、收息投资组合建议 **关键词**："高股息"、"分红"、"股息率"、"收息"、"红利"、"现金流"、"稳定分红"、"银行"、"煤炭"、"公用事业"