metric-field-extraction

用于报表指标抽取的指标字段抽取原子 skill,适用于通用行业信息抽取场景。

105 stars

Best use case

metric-field-extraction is best used when you need a repeatable AI agent workflow instead of a one-off prompt.

用于报表指标抽取的指标字段抽取原子 skill,适用于通用行业信息抽取场景。

Teams using metric-field-extraction should expect a more consistent output, faster repeated execution, less prompt rewriting.

When to use this skill

  • You want a reusable workflow that can be run more than once with consistent structure.

When not to use this skill

  • You only need a quick one-off answer and do not need a reusable workflow.
  • You cannot install or maintain the underlying files, dependencies, or repository context.

Installation

Claude Code / Cursor / Codex

$curl -o ~/.claude/skills/metric-field-extraction/SKILL.md --create-dirs "https://raw.githubusercontent.com/aifinlab/FinClaw/main/skills/archive/metric-field-extraction/SKILL.md"

Manual Installation

  1. Download SKILL.md from GitHub
  2. Place it in .claude/skills/metric-field-extraction/SKILL.md inside your project
  3. Restart your AI agent — it will auto-discover the skill

How metric-field-extraction Compares

Feature / Agentmetric-field-extractionStandard Approach
Platform SupportNot specifiedLimited / Varies
Context Awareness High Baseline
Installation ComplexityUnknownN/A

Frequently Asked Questions

What does this skill do?

用于报表指标抽取的指标字段抽取原子 skill,适用于通用行业信息抽取场景。

Where can I find the source code?

You can find the source code on GitHub using the link provided at the top of the page.

SKILL.md Source

# 指标字段抽取 Skill

## 数据来源

本 Skill 支持多种报表数据输入格式,核心数据来源包括:

### 1. 报表类型
- **业务报表**:业务数据报表、运营报表
- **财务报表**:财务报表、管理报表
- **统计报表**:统计数据报表、分析报表
- **自定义报表**:用户自定义格式报表

### 2. 文档格式
- **PDF格式**:PDF格式的报表
- **Word格式**:Word格式的报表
- **Excel格式**:Excel格式的报表
- **HTML格式**:网页格式的报表

### 3. 数据格式要求
- **文件路径**:本地文件路径或网络文件URL
- **文件编码**:UTF-8、GBK、GB2312等
- **文件权限**:需要读取权限

### 4. 指标类型
- **数值指标**:金额、数量、比例等数值指标
- **文本指标**:状态、描述等文本指标
- **时间指标**:日期、时间等时间指标
- **分类指标**:类别、类型等分类指标

> 说明:本 Skill 不包含数据采集功能,需要用户提供报表文件。建议报表格式规范,以便进行准确的指标抽取。

---

## 功能

本 Skill 提供全面的指标字段抽取能力,涵盖多种抽取功能:

### 1. 指标识别
- **指标名称识别**:识别报表中的指标名称
- **指标类型识别**:识别指标的类型和类别
- **指标位置定位**:定位指标在报表中的位置
- **指标关联识别**:识别指标之间的关联关系

### 2. 指标值抽取
- **数值抽取**:抽取指标的数值
- **文本抽取**:抽取指标的文本值
- **时间抽取**:抽取指标的时间值
- **单位识别**:识别指标的单位

### 3. 指标标准化
- **指标名称标准化**:标准化指标名称
- **指标格式标准化**:标准化指标格式
- **指标单位标准化**:标准化指标单位
- **指标值标准化**:标准化指标值

### 4. 指标验证
- **指标完整性验证**:验证指标的完整性
- **指标准确性验证**:验证指标的准确性
- **指标一致性验证**:验证指标的一致性
- **指标关联性验证**:验证指标之间的关联性

### 5. 指标分类
- **指标分类**:对指标进行分类
- **指标标签**:为指标添加标签
- **指标层级**:建立指标的层级关系
- **指标分组**:对指标进行分组

### 6. 高级处理功能
- **指标映射**:映射不同报表格式的指标
- **指标补全**:补全缺失的指标
- **指标计算**:计算衍生指标
- **指标报告**:生成指标抽取报告

---

## 使用示例

### 输出示例
```json
{
  "source_info": {
    "document_id": "DOC001",
    "document_type": "business_report",
    "report_period": "2024-Q1",
    "source_file": "business_report.pdf"
  },
  "metrics": [
    {
      "metric_id": "MET001",
      "metric_name": "营业收入",
      "standard_name": "revenue",
      "metric_type": "amount",
      "value": 1000000000,
      "unit": "CNY",
      "period": "2024-Q1",
      "confidence": 0.98,
      "position": {
        "page": 3,
        "row": 5,
        "column": 2
      },
      "category": "financial",
      "tags": ["收入", "财务"],
      "related_metrics": ["MET002", "MET003"]
    },
    {
      "metric_id": "MET002",
      "metric_name": "同比增长率",
      "standard_name": "yoy_growth_rate",
      "metric_type": "percentage",
      "value": 15.5,
      "unit": "%",
      "period": "2024-Q1",
      "confidence": 0.95,
      "position": {
        "page": 3,
        "row": 5,
        "column": 3
      },
      "category": "growth",
      "tags": ["增长率", "同比"],
      "related_metrics": ["MET001"]
    }
  ],
  "statistics": {
    "total_metrics": 50,
    "extracted_metrics": 48,
    "missing_metrics": 2,
    "average_confidence": 0.96
  }
}
```

---

## 注意事项与限制

### 1. 报表格式要求
- 标准格式报表抽取准确率较高
- 非标准格式可能影响抽取
- 扫描版报表需要OCR支持

### 2. 指标识别准确性
- 标准指标名称识别准确率较高
- 非标准指标名称可能需要映射
- 复杂指标可能需要人工处理

### 3. 数值提取准确性
- 清晰标注的数值提取准确率较高
- 需要估算的数值可能不够准确
- 单位转换需要正确处理

### 4. 指标完整性
- 标准报表指标完整性较好
- 非标准报表可能缺失指标
- 指标补全可能需要人工处理

### 5. 使用限制
- 本 Skill 不包含报表编辑功能
- 抽取结果需要人工复核
- 复杂报表可能需要人工处理

---

## 参考资料
- 见 references/ 目录中的相关文档,包括:
  - 指标字段抽取方法手册
  - 指标标准体系
  - 指标映射规则指南
  - 性能优化指南

Related Skills

investment-thesis-extraction

105
from aifinlab/FinClaw

投资逻辑提炼助手。专注于从研报/会议/访谈中提炼核心投资逻辑,输出简洁清晰的投资论点、关键论据、验证方法。 **触发场景**: - 用户需要从长文档中提炼投资逻辑 - 用户说"提炼逻辑"、"投资论点"、"核心逻辑" - 需要简洁清晰、便于转述 - 需要关键论据、验证方法 **关键词**:"投资逻辑"、"提炼"、"论点"、"核心逻辑"、"thesis"、"投资要点"

product-selling-point-extraction

105
from aifinlab/FinClaw

面向基金产品管理领域的卖点提炼任务Skill,围绕「产品卖点提炼助手」场景提供信息抽取、结构化分析与结果输出。

timeline-extraction

105
from aifinlab/FinClaw

用于案件/项目时间线的时间线抽取原子 skill,适用于通用行业信息抽取场景。

relation-extraction

105
from aifinlab/FinClaw

用于主体关系抽取的关系抽取原子 skill,适用于通用行业信息抽取场景。

product-feature-extraction

105
from aifinlab/FinClaw

用于产品属性抽取的产品特征抽取原子 skill,适用于通用行业信息抽取场景。

financial-field-extraction

105
from aifinlab/FinClaw

用于财报字段抽取的财务字段抽取原子 skill,适用于通用行业信息抽取场景。

field-mapping-normalization

105
from aifinlab/FinClaw

用于异构字段统一的字段映射与标准化原子 skill,适用于通用行业数据接入场景。

event-extraction

105
from aifinlab/FinClaw

用于风险/市场事件抽取的事件抽取原子 skill,适用于通用行业信息抽取场景。

clause-field-extraction

105
from aifinlab/FinClaw

用于条款字段抽取的条款字段抽取原子 skill,适用于通用行业信息抽取场景。

business-metrics-attribution

105
from aifinlab/FinClaw

银行经营指标变动归因拆解。当用户要求分析存款下降原因、贷款增长驱动因素、利润变动归因、净息差变动拆解、中间业务收入波动归因、不良率变动成因时使用。按机构/产品/客群/期限等维度多维归因。

trust-valuation-engine

105
from aifinlab/FinClaw

## 描述

trust-risk-manager

105
from aifinlab/FinClaw

## 描述