external-knowledge-source-ingestion

用于制度/产品/FAQ库的外部知识源接入原子 skill,适用于通用行业数据接入场景。

105 stars

Best use case

external-knowledge-source-ingestion is best used when you need a repeatable AI agent workflow instead of a one-off prompt.

用于制度/产品/FAQ库的外部知识源接入原子 skill,适用于通用行业数据接入场景。

Teams using external-knowledge-source-ingestion should expect a more consistent output, faster repeated execution, less prompt rewriting.

When to use this skill

  • You want a reusable workflow that can be run more than once with consistent structure.

When not to use this skill

  • You only need a quick one-off answer and do not need a reusable workflow.
  • You cannot install or maintain the underlying files, dependencies, or repository context.

Installation

Claude Code / Cursor / Codex

$curl -o ~/.claude/skills/external-knowledge-source-ingestion/SKILL.md --create-dirs "https://raw.githubusercontent.com/aifinlab/FinClaw/main/skills/archive/external-knowledge-source-ingestion/SKILL.md"

Manual Installation

  1. Download SKILL.md from GitHub
  2. Place it in .claude/skills/external-knowledge-source-ingestion/SKILL.md inside your project
  3. Restart your AI agent — it will auto-discover the skill

How external-knowledge-source-ingestion Compares

Feature / Agentexternal-knowledge-source-ingestionStandard Approach
Platform SupportNot specifiedLimited / Varies
Context Awareness High Baseline
Installation ComplexityUnknownN/A

Frequently Asked Questions

What does this skill do?

用于制度/产品/FAQ库的外部知识源接入原子 skill,适用于通用行业数据接入场景。

Where can I find the source code?

You can find the source code on GitHub using the link provided at the top of the page.

SKILL.md Source

# 外部知识源接入 Skill

## 数据来源

本 Skill 支持多种外部知识源输入格式,核心数据来源包括:

### 1. 知识源类型
- **制度文档**:法律法规、规章制度、政策文件
- **产品文档**:产品说明书、产品手册、产品规范
- **FAQ库**:常见问题库、知识库、问答库
- **其他知识源**:技术文档、培训材料、参考文档

### 2. 知识源格式
- **文档格式**:PDF、Word、HTML等文档格式
- **数据库格式**:知识库数据库、FAQ数据库
- **API格式**:知识API、搜索API
- **文件格式**:JSON、XML、CSV等文件格式

### 3. 数据格式要求
- **知识源连接**:知识源连接信息
- **知识源配置**:知识源配置参数
- **访问权限**:知识源访问权限
- **数据格式**:知识源数据格式

### 4. 知识特征
- **知识类型**:结构化知识、非结构化知识
- **知识规模**:小规模知识库、大规模知识库
- **知识更新**:静态知识、动态知识
- **知识质量**:高质量知识、低质量知识

> 说明:本 Skill 不包含知识源配置功能,需要用户提供知识源连接信息。建议知识源稳定可靠,以便进行准确的知识接入。

---

## 功能

本 Skill 提供全面的外部知识源接入能力,涵盖多种接入功能:

### 1. 知识源连接
- **连接管理**:管理知识源连接
- **连接验证**:验证知识源连接
- **连接监控**:监控知识源状态
- **连接优化**:优化连接性能

### 2. 知识提取
- **文档提取**:从文档中提取知识
- **数据库提取**:从数据库中提取知识
- **API提取**:从API中提取知识
- **批量提取**:批量提取知识内容

### 3. 知识解析
- **结构化解析**:解析结构化知识
- **非结构化解析**:解析非结构化知识
- **知识分类**:对知识进行分类
- **知识标签**:为知识添加标签

### 4. 知识标准化
- **格式标准化**:标准化知识格式
- **内容标准化**:标准化知识内容
- **结构标准化**:标准化知识结构
- **元数据标准化**:标准化知识元数据

### 5. 知识索引
- **全文索引**:建立全文索引
- **关键词索引**:建立关键词索引
- **分类索引**:建立分类索引
- **关联索引**:建立关联索引

### 6. 高级处理功能
- **知识去重**:去除重复知识
- **知识更新**:更新知识内容
- **知识同步**:同步知识源数据
- **接入报告**:生成知识接入报告

---

## 使用示例

### 输出示例
```json
{
  "source_info": {
    "source_type": "knowledge_base",
    "source_name": "financial_regulations",
    "source_format": "database",
    "knowledge_count": 10000
  },
  "ingestion_config": {
    "extract_full_text": true,
    "extract_metadata": true,
    "index_content": true,
    "categorize": true
  },
  "ingestion_results": {
    "total_knowledge": 10000,
    "successful_knowledge": 9800,
    "failed_knowledge": 200,
    "ingestion_time": "2024-03-15T10:00:00",
    "duration": "600s"
  },
  "knowledge_samples": [
    {
      "knowledge_id": "KB001",
      "title": "证券法相关规定",
      "category": "法律法规",
      "content": "知识内容...",
      "metadata": {
        "source": "证券法",
        "chapter": "第一章",
        "article": "第一条",
        "publish_date": "2020-01-01"
      },
      "tags": ["证券", "法律", "监管"],
      "indexed": true
    }
  ],
  "statistics": {
    "knowledge_ingested": 9800,
    "knowledge_indexed": 9800,
    "categories": 50,
    "tags": 500,
    "success_rate": 0.98
  }
}
```

---

## 注意事项与限制

### 1. 知识源要求
- 知识源需要稳定可靠
- 连接信息需要准确
- 访问权限需要有效

### 2. 知识提取准确性
- 结构化知识提取准确率较高
- 非结构化知识可能需要特殊处理
- 复杂知识可能需要人工处理

### 3. 知识标准化
- 标准格式知识标准化准确率较高
- 非标准格式可能需要人工处理
- 知识质量影响标准化结果

### 4. 知识索引
- 索引建立需要时间
- 大规模知识库可能需要较长时间
- 需要定期更新索引

### 5. 使用限制
- 本 Skill 不包含知识源管理功能
- 接入结果需要人工复核
- 复杂知识源可能需要特殊处理

---

## 参考资料
- 见 references/ 目录中的相关文档,包括:
  - 外部知识源接入方法手册
  - 知识源配置指南
  - 知识标准化说明
  - 性能优化指南

Related Skills

return-source-explanation

105
from aifinlab/FinClaw

面向基金投顾与客户服务领域的收益解释任务Skill,围绕「收益来源解释助手」场景提供信息抽取、结构化分析与结果输出。

fund-knowledge-card

105
from aifinlab/FinClaw

面向基金品牌与内容领域的知识卡片任务Skill,围绕「基金知识卡片助手」场景提供信息抽取、结构化分析与结果输出。

finance-news-source

105
from aifinlab/FinClaw

财经新闻数据源,聚合12+中文财经网站的实时快讯和深度报道。提供结构化新闻抓取能力,覆盖快讯(财联社/华尔街见闻/东方财富/雪球)、深度(财新/第一财经/界面/晚点)、宏观政策(央行/证监会/统计局)、港美股(富途/老虎/SeekingAlpha)四大类源。当其他 skill 需要财经新闻数据输入时(如 a-share-morning-note、finance-news-analysis),作为数据源调用。与 cn-stock-data(行情/财务数据)互补,本 skill 专注新闻资讯数据。

unstructured-document-ingestion

105
from aifinlab/FinClaw

用于PDF/Word/邮件接入的非结构化文档接入原子 skill,适用于通用行业数据接入场景。

structured-data-ingestion

105
from aifinlab/FinClaw

用于表/API/DB接入的结构化数据接入原子 skill,适用于通用行业数据接入场景。

semi-structured-data-ingestion

105
from aifinlab/FinClaw

用于Excel/表单接入的半结构化数据接入原子 skill,适用于通用行业数据接入场景。

realtime-stream-ingestion

105
from aifinlab/FinClaw

用于行情/交易/事件流的实时流数据接入原子 skill,适用于通用行业数据接入场景。

multi-source-data-aggregation

105
from aifinlab/FinClaw

用于多系统整合的多源数据聚合原子 skill,适用于通用行业数据接入场景。

global-product-knowledge-retrieval

105
from aifinlab/FinClaw

用于产品知识检索场景。适用于金融工作中的基础任务单元。

global-knowledge-chunking

105
from aifinlab/FinClaw

用于知识分块场景。适用于金融工作中的基础任务单元。

external

105
from aifinlab/FinClaw

⚠️ DEPRECATED - 外部第三方 skill 集成目录,提供 Stock Analysis(雅虎财经/美股)、Tavily 搜索、Firecrawl 网页爬取等安装配置。当需要安装外部数据增强 skill 时使用。

event-stream-ingestion

105
from aifinlab/FinClaw

用于新闻/公告/工单流的事件流接入原子 skill,适用于通用行业数据接入场景。