Best use case
external-knowledge-source-ingestion is best used when you need a repeatable AI agent workflow instead of a one-off prompt.
用于制度/产品/FAQ库的外部知识源接入原子 skill,适用于通用行业数据接入场景。
Teams using external-knowledge-source-ingestion should expect a more consistent output, faster repeated execution, less prompt rewriting.
When to use this skill
- You want a reusable workflow that can be run more than once with consistent structure.
When not to use this skill
- You only need a quick one-off answer and do not need a reusable workflow.
- You cannot install or maintain the underlying files, dependencies, or repository context.
Installation
Claude Code / Cursor / Codex
Manual Installation
- Download SKILL.md from GitHub
- Place it in
.claude/skills/external-knowledge-source-ingestion/SKILL.mdinside your project - Restart your AI agent — it will auto-discover the skill
How external-knowledge-source-ingestion Compares
| Feature / Agent | external-knowledge-source-ingestion | Standard Approach |
|---|---|---|
| Platform Support | Not specified | Limited / Varies |
| Context Awareness | High | Baseline |
| Installation Complexity | Unknown | N/A |
Frequently Asked Questions
What does this skill do?
用于制度/产品/FAQ库的外部知识源接入原子 skill,适用于通用行业数据接入场景。
Where can I find the source code?
You can find the source code on GitHub using the link provided at the top of the page.
SKILL.md Source
# 外部知识源接入 Skill
## 数据来源
本 Skill 支持多种外部知识源输入格式,核心数据来源包括:
### 1. 知识源类型
- **制度文档**:法律法规、规章制度、政策文件
- **产品文档**:产品说明书、产品手册、产品规范
- **FAQ库**:常见问题库、知识库、问答库
- **其他知识源**:技术文档、培训材料、参考文档
### 2. 知识源格式
- **文档格式**:PDF、Word、HTML等文档格式
- **数据库格式**:知识库数据库、FAQ数据库
- **API格式**:知识API、搜索API
- **文件格式**:JSON、XML、CSV等文件格式
### 3. 数据格式要求
- **知识源连接**:知识源连接信息
- **知识源配置**:知识源配置参数
- **访问权限**:知识源访问权限
- **数据格式**:知识源数据格式
### 4. 知识特征
- **知识类型**:结构化知识、非结构化知识
- **知识规模**:小规模知识库、大规模知识库
- **知识更新**:静态知识、动态知识
- **知识质量**:高质量知识、低质量知识
> 说明:本 Skill 不包含知识源配置功能,需要用户提供知识源连接信息。建议知识源稳定可靠,以便进行准确的知识接入。
---
## 功能
本 Skill 提供全面的外部知识源接入能力,涵盖多种接入功能:
### 1. 知识源连接
- **连接管理**:管理知识源连接
- **连接验证**:验证知识源连接
- **连接监控**:监控知识源状态
- **连接优化**:优化连接性能
### 2. 知识提取
- **文档提取**:从文档中提取知识
- **数据库提取**:从数据库中提取知识
- **API提取**:从API中提取知识
- **批量提取**:批量提取知识内容
### 3. 知识解析
- **结构化解析**:解析结构化知识
- **非结构化解析**:解析非结构化知识
- **知识分类**:对知识进行分类
- **知识标签**:为知识添加标签
### 4. 知识标准化
- **格式标准化**:标准化知识格式
- **内容标准化**:标准化知识内容
- **结构标准化**:标准化知识结构
- **元数据标准化**:标准化知识元数据
### 5. 知识索引
- **全文索引**:建立全文索引
- **关键词索引**:建立关键词索引
- **分类索引**:建立分类索引
- **关联索引**:建立关联索引
### 6. 高级处理功能
- **知识去重**:去除重复知识
- **知识更新**:更新知识内容
- **知识同步**:同步知识源数据
- **接入报告**:生成知识接入报告
---
## 使用示例
### 输出示例
```json
{
"source_info": {
"source_type": "knowledge_base",
"source_name": "financial_regulations",
"source_format": "database",
"knowledge_count": 10000
},
"ingestion_config": {
"extract_full_text": true,
"extract_metadata": true,
"index_content": true,
"categorize": true
},
"ingestion_results": {
"total_knowledge": 10000,
"successful_knowledge": 9800,
"failed_knowledge": 200,
"ingestion_time": "2024-03-15T10:00:00",
"duration": "600s"
},
"knowledge_samples": [
{
"knowledge_id": "KB001",
"title": "证券法相关规定",
"category": "法律法规",
"content": "知识内容...",
"metadata": {
"source": "证券法",
"chapter": "第一章",
"article": "第一条",
"publish_date": "2020-01-01"
},
"tags": ["证券", "法律", "监管"],
"indexed": true
}
],
"statistics": {
"knowledge_ingested": 9800,
"knowledge_indexed": 9800,
"categories": 50,
"tags": 500,
"success_rate": 0.98
}
}
```
---
## 注意事项与限制
### 1. 知识源要求
- 知识源需要稳定可靠
- 连接信息需要准确
- 访问权限需要有效
### 2. 知识提取准确性
- 结构化知识提取准确率较高
- 非结构化知识可能需要特殊处理
- 复杂知识可能需要人工处理
### 3. 知识标准化
- 标准格式知识标准化准确率较高
- 非标准格式可能需要人工处理
- 知识质量影响标准化结果
### 4. 知识索引
- 索引建立需要时间
- 大规模知识库可能需要较长时间
- 需要定期更新索引
### 5. 使用限制
- 本 Skill 不包含知识源管理功能
- 接入结果需要人工复核
- 复杂知识源可能需要特殊处理
---
## 参考资料
- 见 references/ 目录中的相关文档,包括:
- 外部知识源接入方法手册
- 知识源配置指南
- 知识标准化说明
- 性能优化指南Related Skills
return-source-explanation
面向基金投顾与客户服务领域的收益解释任务Skill,围绕「收益来源解释助手」场景提供信息抽取、结构化分析与结果输出。
fund-knowledge-card
面向基金品牌与内容领域的知识卡片任务Skill,围绕「基金知识卡片助手」场景提供信息抽取、结构化分析与结果输出。
finance-news-source
财经新闻数据源,聚合12+中文财经网站的实时快讯和深度报道。提供结构化新闻抓取能力,覆盖快讯(财联社/华尔街见闻/东方财富/雪球)、深度(财新/第一财经/界面/晚点)、宏观政策(央行/证监会/统计局)、港美股(富途/老虎/SeekingAlpha)四大类源。当其他 skill 需要财经新闻数据输入时(如 a-share-morning-note、finance-news-analysis),作为数据源调用。与 cn-stock-data(行情/财务数据)互补,本 skill 专注新闻资讯数据。
unstructured-document-ingestion
用于PDF/Word/邮件接入的非结构化文档接入原子 skill,适用于通用行业数据接入场景。
structured-data-ingestion
用于表/API/DB接入的结构化数据接入原子 skill,适用于通用行业数据接入场景。
semi-structured-data-ingestion
用于Excel/表单接入的半结构化数据接入原子 skill,适用于通用行业数据接入场景。
realtime-stream-ingestion
用于行情/交易/事件流的实时流数据接入原子 skill,适用于通用行业数据接入场景。
multi-source-data-aggregation
用于多系统整合的多源数据聚合原子 skill,适用于通用行业数据接入场景。
global-product-knowledge-retrieval
用于产品知识检索场景。适用于金融工作中的基础任务单元。
global-knowledge-chunking
用于知识分块场景。适用于金融工作中的基础任务单元。
external
⚠️ DEPRECATED - 外部第三方 skill 集成目录,提供 Stock Analysis(雅虎财经/美股)、Tavily 搜索、Firecrawl 网页爬取等安装配置。当需要安装外部数据增强 skill 时使用。
event-stream-ingestion
用于新闻/公告/工单流的事件流接入原子 skill,适用于通用行业数据接入场景。