Best use case
structured-data-ingestion is best used when you need a repeatable AI agent workflow instead of a one-off prompt.
用于表/API/DB接入的结构化数据接入原子 skill,适用于通用行业数据接入场景。
Teams using structured-data-ingestion should expect a more consistent output, faster repeated execution, less prompt rewriting.
When to use this skill
- You want a reusable workflow that can be run more than once with consistent structure.
When not to use this skill
- You only need a quick one-off answer and do not need a reusable workflow.
- You cannot install or maintain the underlying files, dependencies, or repository context.
Installation
Claude Code / Cursor / Codex
Manual Installation
- Download SKILL.md from GitHub
- Place it in
.claude/skills/structured-data-ingestion/SKILL.mdinside your project - Restart your AI agent — it will auto-discover the skill
How structured-data-ingestion Compares
| Feature / Agent | structured-data-ingestion | Standard Approach |
|---|---|---|
| Platform Support | Not specified | Limited / Varies |
| Context Awareness | High | Baseline |
| Installation Complexity | Unknown | N/A |
Frequently Asked Questions
What does this skill do?
用于表/API/DB接入的结构化数据接入原子 skill,适用于通用行业数据接入场景。
Where can I find the source code?
You can find the source code on GitHub using the link provided at the top of the page.
SKILL.md Source
# 结构化数据接入 Skill
## 数据来源
本 Skill 支持多种结构化数据源输入格式,核心数据来源包括:
### 1. 数据源类型
- **数据库**:MySQL、PostgreSQL、Oracle、SQL Server等关系型数据库
- **API接口**:REST API、GraphQL API、SOAP API
- **表格文件**:CSV文件、Excel文件、TSV文件
- **数据仓库**:数据仓库、数据湖
### 2. 数据结构类型
- **关系型数据**:表结构数据、关系数据
- **键值数据**:键值对数据、字典数据
- **JSON数据**:JSON格式的结构化数据
- **XML数据**:XML格式的结构化数据
### 3. 数据格式要求
- **连接信息**:数据库连接字符串、API端点地址
- **认证信息**:用户名密码、API密钥、Token
- **查询信息**:SQL查询语句、API请求参数
- **数据格式**:数据格式和编码方式
### 4. 数据特征
- **数据规模**:小数据集(<1万条)、大数据集(>100万条)
- **数据更新频率**:实时更新、定时更新、批量更新
- **数据完整性**:完整数据、部分数据
- **数据质量**:高质量数据、低质量数据
> 说明:本 Skill 不包含数据源配置功能,需要用户提供数据源连接信息。建议数据源稳定可靠,以便进行准确的数据接入。
---
## 功能
本 Skill 提供全面的结构化数据接入能力,涵盖多种接入功能:
### 1. 数据源连接
- **数据库连接**:连接各类关系型数据库
- **API连接**:连接各类API接口
- **文件读取**:读取各类表格文件
- **连接管理**:管理数据源连接
### 2. 数据查询
- **SQL查询**:执行SQL查询语句
- **API请求**:发送API请求获取数据
- **文件读取**:读取文件数据
- **查询优化**:优化查询性能
### 3. 数据提取
- **数据提取**:从数据源提取数据
- **增量提取**:增量提取数据
- **全量提取**:全量提取数据
- **批量提取**:批量提取数据
### 4. 数据转换
- **格式转换**:转换数据格式
- **结构转换**:转换数据结构
- **编码转换**:转换数据编码
- **类型转换**:转换数据类型
### 5. 数据验证
- **数据完整性验证**:验证数据的完整性
- **数据准确性验证**:验证数据的准确性
- **数据一致性验证**:验证数据的一致性
- **数据质量评估**:评估数据的质量
### 6. 高级处理功能
- **数据缓存**:缓存数据提高性能
- **数据同步**:同步数据源数据
- **错误处理**:处理数据接入错误
- **接入报告**:生成数据接入报告
---
## 使用示例
### 输出示例
```json
{
"source_info": {
"source_type": "database",
"source_name": "financial_db",
"connection_string": "mysql://user:pass@host:3306/db",
"table_name": "stock_prices"
},
"ingestion_config": {
"extraction_mode": "incremental",
"time_field": "trade_date",
"last_sync_time": "2024-03-14T10:00:00",
"batch_size": 1000
},
"ingestion_results": {
"total_records": 5000,
"new_records": 500,
"updated_records": 4500,
"failed_records": 0,
"ingestion_time": "2024-03-15T10:00:00",
"duration": "30s"
},
"data_sample": [
{
"trade_date": "2024-03-15",
"stock_code": "000001",
"open_price": 10.50,
"close_price": 10.80,
"volume": 1000000
}
],
"data_quality": {
"completeness": 1.0,
"accuracy": 0.99,
"consistency": 0.98,
"overall_score": 0.99
},
"statistics": {
"records_ingested": 5000,
"records_failed": 0,
"ingestion_rate": "166.7 records/s",
"success_rate": 1.0
}
}
```
---
## 注意事项与限制
### 1. 数据源要求
- 数据源需要稳定可靠
- 连接信息需要准确
- 认证信息需要有效
### 2. 数据接入性能
- 大数据量可能影响性能
- 网络延迟可能影响速度
- 需要合理设置批处理大小
### 3. 数据质量
- 数据质量影响接入结果
- 需要验证数据完整性
- 异常数据需要处理
### 4. 错误处理
- 连接错误需要重试机制
- 数据错误需要记录日志
- 需要监控接入状态
### 5. 使用限制
- 本 Skill 不包含数据源管理功能
- 接入结果需要人工复核
- 复杂数据源可能需要特殊处理
---
## 参考资料
- 见 references/ 目录中的相关文档,包括:
- 结构化数据接入方法手册
- 数据源连接配置指南
- 数据转换规则说明
- 性能优化指南Related Skills
zhitu-data
智兔数服数据Skill - 免注册A股/港股/基金实时行情、历史K线、技术指标 via 智兔数服
pysnowball-data
雪球(Snowball)金融数据接口,提供 A 股/港股/美股实时行情、财务报表(资产负债/利润/现金流)、估值指标、资金流向、行业对比、基金净值、可转债、指数数据。当用户需要雪球数据、跨市场行情(A/港/美)、财务报表详情、或雪球独有的业务分析数据时使用此 skill。pysnowball 的独特优势:(1)跨市场覆盖(A/港/美)(2)财务三表完整数据 (3)行业对比分析 (4)机构持仓变动。注意:部分高级接口需要雪球 token,基础行情(quotec)无需 token。
fred-data
美联储 FRED 经济数据库接口,提供美国 GDP、CPI、就业、利率、通胀等核心经济指标。当用户需要查询美国经济数据时使用。
efinance-data
efinance 中国金融市场数据获取工具,封装 A 股行情、资金流向、龙虎榜、十大股东、业绩报表、基金净值持仓、可转债、期货等数据接口。当用户需要获取 A 股实时行情、个股资金流、主力动向、龙虎榜、十大股东变动、业绩数据、基金净值或持仓、可转债或期货行情时使用此 skill。也适用于需要中国金融市场数据来支撑投研分析、个股研究、行业对比、资产配置等场景。与 akshare-finance 互补,efinance 在资金流分层(主力/大单/超大单)和实时行情字段丰富度上更有优势。
ecb-data
欧央行(ECB)经济数据查询,提供欧元区基准利率、CPI、GDP 及主要成员国经济数据。当用户需要查询欧洲经济数据或欧央行政策时使用。
dd-data-gap-alert
用于信托领域项目尽调中的尽调资料缺口提示助手场景。支持结构化输入处理、规则分析与Markdown结果输出。
data-consistency-check
用于信托领域合规与运营中的数据一致性核验助手场景,支持结构化处理与报告输出。
data-cleaner
金融数据清洗与异常检测工具,提供缺失值处理、去重、异常值检测、数据标准化等功能。当用户需要对原始金融数据进行预处理时使用。
cn-stock-data
中国A股/港股/美股统一数据抽象层。屏蔽 akshare/efinance/adata/pysnowball/ashare 五个数据源的 API 差异,提供统一代码格式(SH600519)、统一字段名(英文 snake_case)、智能路由和自动 Fallback。当用户需要获取股票行情、实时报价、资金流向、财务指标、北向资金等金融数据时使用此 skill。
boj-data
日本央行(BOJ)经济数据查询,提供日本基准利率、CPI、GDP、货币政策等宏观数据。当用户需要查询日本经济数据或日央行政策时使用。
bank-t241-transaction-banking-inclusive-finance-data-validation-assistant
当用户需要在银行交易银行与普惠场景下,围绕数据核验进行完整性、一致性、真实性或规则符合性检查时使用本技能。适合输出核验结论、异常项清单、补件要求和升级复核建议。
ashare-data
Ashare 最轻量 A 股行情获取工具(3.2k Stars),基于新浪+腾讯双核心数据源,零依赖(仅需 requests+pandas),无需注册,支持日/周/月线及 1m/5m/15m/30m/60m 分钟级K线。当用户需要快速获取 A 股/指数行情而其他数据源不可用时,Ashare 是最可靠的回退方案——它使用新浪为主、腾讯为备的双核心架构,自动切换,极少出错。