Best use case
metric-field-extraction is best used when you need a repeatable AI agent workflow instead of a one-off prompt.
用于报表指标抽取的指标字段抽取原子 skill,适用于通用行业信息抽取场景。
Teams using metric-field-extraction should expect a more consistent output, faster repeated execution, less prompt rewriting.
When to use this skill
- You want a reusable workflow that can be run more than once with consistent structure.
When not to use this skill
- You only need a quick one-off answer and do not need a reusable workflow.
- You cannot install or maintain the underlying files, dependencies, or repository context.
Installation
Claude Code / Cursor / Codex
Manual Installation
- Download SKILL.md from GitHub
- Place it in
.claude/skills/metric-field-extraction/SKILL.mdinside your project - Restart your AI agent — it will auto-discover the skill
How metric-field-extraction Compares
| Feature / Agent | metric-field-extraction | Standard Approach |
|---|---|---|
| Platform Support | Not specified | Limited / Varies |
| Context Awareness | High | Baseline |
| Installation Complexity | Unknown | N/A |
Frequently Asked Questions
What does this skill do?
用于报表指标抽取的指标字段抽取原子 skill,适用于通用行业信息抽取场景。
Where can I find the source code?
You can find the source code on GitHub using the link provided at the top of the page.
SKILL.md Source
# 指标字段抽取 Skill
## 数据来源
本 Skill 支持多种报表数据输入格式,核心数据来源包括:
### 1. 报表类型
- **业务报表**:业务数据报表、运营报表
- **财务报表**:财务报表、管理报表
- **统计报表**:统计数据报表、分析报表
- **自定义报表**:用户自定义格式报表
### 2. 文档格式
- **PDF格式**:PDF格式的报表
- **Word格式**:Word格式的报表
- **Excel格式**:Excel格式的报表
- **HTML格式**:网页格式的报表
### 3. 数据格式要求
- **文件路径**:本地文件路径或网络文件URL
- **文件编码**:UTF-8、GBK、GB2312等
- **文件权限**:需要读取权限
### 4. 指标类型
- **数值指标**:金额、数量、比例等数值指标
- **文本指标**:状态、描述等文本指标
- **时间指标**:日期、时间等时间指标
- **分类指标**:类别、类型等分类指标
> 说明:本 Skill 不包含数据采集功能,需要用户提供报表文件。建议报表格式规范,以便进行准确的指标抽取。
---
## 功能
本 Skill 提供全面的指标字段抽取能力,涵盖多种抽取功能:
### 1. 指标识别
- **指标名称识别**:识别报表中的指标名称
- **指标类型识别**:识别指标的类型和类别
- **指标位置定位**:定位指标在报表中的位置
- **指标关联识别**:识别指标之间的关联关系
### 2. 指标值抽取
- **数值抽取**:抽取指标的数值
- **文本抽取**:抽取指标的文本值
- **时间抽取**:抽取指标的时间值
- **单位识别**:识别指标的单位
### 3. 指标标准化
- **指标名称标准化**:标准化指标名称
- **指标格式标准化**:标准化指标格式
- **指标单位标准化**:标准化指标单位
- **指标值标准化**:标准化指标值
### 4. 指标验证
- **指标完整性验证**:验证指标的完整性
- **指标准确性验证**:验证指标的准确性
- **指标一致性验证**:验证指标的一致性
- **指标关联性验证**:验证指标之间的关联性
### 5. 指标分类
- **指标分类**:对指标进行分类
- **指标标签**:为指标添加标签
- **指标层级**:建立指标的层级关系
- **指标分组**:对指标进行分组
### 6. 高级处理功能
- **指标映射**:映射不同报表格式的指标
- **指标补全**:补全缺失的指标
- **指标计算**:计算衍生指标
- **指标报告**:生成指标抽取报告
---
## 使用示例
### 输出示例
```json
{
"source_info": {
"document_id": "DOC001",
"document_type": "business_report",
"report_period": "2024-Q1",
"source_file": "business_report.pdf"
},
"metrics": [
{
"metric_id": "MET001",
"metric_name": "营业收入",
"standard_name": "revenue",
"metric_type": "amount",
"value": 1000000000,
"unit": "CNY",
"period": "2024-Q1",
"confidence": 0.98,
"position": {
"page": 3,
"row": 5,
"column": 2
},
"category": "financial",
"tags": ["收入", "财务"],
"related_metrics": ["MET002", "MET003"]
},
{
"metric_id": "MET002",
"metric_name": "同比增长率",
"standard_name": "yoy_growth_rate",
"metric_type": "percentage",
"value": 15.5,
"unit": "%",
"period": "2024-Q1",
"confidence": 0.95,
"position": {
"page": 3,
"row": 5,
"column": 3
},
"category": "growth",
"tags": ["增长率", "同比"],
"related_metrics": ["MET001"]
}
],
"statistics": {
"total_metrics": 50,
"extracted_metrics": 48,
"missing_metrics": 2,
"average_confidence": 0.96
}
}
```
---
## 注意事项与限制
### 1. 报表格式要求
- 标准格式报表抽取准确率较高
- 非标准格式可能影响抽取
- 扫描版报表需要OCR支持
### 2. 指标识别准确性
- 标准指标名称识别准确率较高
- 非标准指标名称可能需要映射
- 复杂指标可能需要人工处理
### 3. 数值提取准确性
- 清晰标注的数值提取准确率较高
- 需要估算的数值可能不够准确
- 单位转换需要正确处理
### 4. 指标完整性
- 标准报表指标完整性较好
- 非标准报表可能缺失指标
- 指标补全可能需要人工处理
### 5. 使用限制
- 本 Skill 不包含报表编辑功能
- 抽取结果需要人工复核
- 复杂报表可能需要人工处理
---
## 参考资料
- 见 references/ 目录中的相关文档,包括:
- 指标字段抽取方法手册
- 指标标准体系
- 指标映射规则指南
- 性能优化指南Related Skills
investment-thesis-extraction
投资逻辑提炼助手。专注于从研报/会议/访谈中提炼核心投资逻辑,输出简洁清晰的投资论点、关键论据、验证方法。 **触发场景**: - 用户需要从长文档中提炼投资逻辑 - 用户说"提炼逻辑"、"投资论点"、"核心逻辑" - 需要简洁清晰、便于转述 - 需要关键论据、验证方法 **关键词**:"投资逻辑"、"提炼"、"论点"、"核心逻辑"、"thesis"、"投资要点"
product-selling-point-extraction
面向基金产品管理领域的卖点提炼任务Skill,围绕「产品卖点提炼助手」场景提供信息抽取、结构化分析与结果输出。
timeline-extraction
用于案件/项目时间线的时间线抽取原子 skill,适用于通用行业信息抽取场景。
relation-extraction
用于主体关系抽取的关系抽取原子 skill,适用于通用行业信息抽取场景。
product-feature-extraction
用于产品属性抽取的产品特征抽取原子 skill,适用于通用行业信息抽取场景。
financial-field-extraction
用于财报字段抽取的财务字段抽取原子 skill,适用于通用行业信息抽取场景。
field-mapping-normalization
用于异构字段统一的字段映射与标准化原子 skill,适用于通用行业数据接入场景。
event-extraction
用于风险/市场事件抽取的事件抽取原子 skill,适用于通用行业信息抽取场景。
clause-field-extraction
用于条款字段抽取的条款字段抽取原子 skill,适用于通用行业信息抽取场景。
business-metrics-attribution
银行经营指标变动归因拆解。当用户要求分析存款下降原因、贷款增长驱动因素、利润变动归因、净息差变动拆解、中间业务收入波动归因、不良率变动成因时使用。按机构/产品/客群/期限等维度多维归因。
trust-valuation-engine
## 描述
trust-risk-manager
## 描述