financial-field-extraction

用于财报字段抽取的财务字段抽取原子 skill,适用于通用行业信息抽取场景。

105 stars

Best use case

financial-field-extraction is best used when you need a repeatable AI agent workflow instead of a one-off prompt.

用于财报字段抽取的财务字段抽取原子 skill,适用于通用行业信息抽取场景。

Teams using financial-field-extraction should expect a more consistent output, faster repeated execution, less prompt rewriting.

When to use this skill

  • You want a reusable workflow that can be run more than once with consistent structure.

When not to use this skill

  • You only need a quick one-off answer and do not need a reusable workflow.
  • You cannot install or maintain the underlying files, dependencies, or repository context.

Installation

Claude Code / Cursor / Codex

$curl -o ~/.claude/skills/financial-field-extraction/SKILL.md --create-dirs "https://raw.githubusercontent.com/aifinlab/FinClaw/main/skills/archive/financial-field-extraction/SKILL.md"

Manual Installation

  1. Download SKILL.md from GitHub
  2. Place it in .claude/skills/financial-field-extraction/SKILL.md inside your project
  3. Restart your AI agent — it will auto-discover the skill

How financial-field-extraction Compares

Feature / Agentfinancial-field-extractionStandard Approach
Platform SupportNot specifiedLimited / Varies
Context Awareness High Baseline
Installation ComplexityUnknownN/A

Frequently Asked Questions

What does this skill do?

用于财报字段抽取的财务字段抽取原子 skill,适用于通用行业信息抽取场景。

Where can I find the source code?

You can find the source code on GitHub using the link provided at the top of the page.

SKILL.md Source

# 财务字段抽取 Skill

## 数据来源

本 Skill 支持多种财务报表数据输入格式,核心数据来源包括:

### 1. 财务报表类型
- **利润表**:营业收入、营业成本、净利润等字段
- **资产负债表**:资产总额、负债总额、所有者权益等字段
- **现金流量表**:经营活动现金流量、投资活动现金流量等字段
- **财务报表附注**:财务报表的附注和说明

### 2. 文档格式
- **PDF格式**:PDF格式的财务报表
- **Word格式**:Word格式的财务报表
- **Excel格式**:Excel格式的财务报表
- **HTML格式**:网页格式的财务报表

### 3. 数据格式要求
- **文件路径**:本地文件路径或网络文件URL
- **文件编码**:UTF-8、GBK、GB2312等
- **文件权限**:需要读取权限

### 4. 字段类型
- **数值字段**:金额、比例、数量等数值字段
- **文本字段**:项目名称、说明文字等文本字段
- **日期字段**:报告期间、日期等时间字段
- **分类字段**:科目分类、项目分类等分类字段

> 说明:本 Skill 不包含数据采集功能,需要用户提供财务报表文件。建议报表格式规范,以便进行准确的字段抽取。

---

## 功能

本 Skill 提供全面的财务字段抽取能力,涵盖多种抽取功能:

### 1. 利润表字段抽取
- **收入类字段**:营业收入、其他业务收入等
- **成本类字段**:营业成本、销售费用、管理费用等
- **利润类字段**:营业利润、利润总额、净利润等
- **其他字段**:投资收益、营业外收入等

### 2. 资产负债表字段抽取
- **资产类字段**:流动资产、非流动资产、资产总额等
- **负债类字段**:流动负债、非流动负债、负债总额等
- **权益类字段**:实收资本、资本公积、未分配利润等
- **其他字段**:资产减值准备、递延所得税等

### 3. 现金流量表字段抽取
- **经营活动字段**:经营活动现金流入、流出、净额等
- **投资活动字段**:投资活动现金流入、流出、净额等
- **筹资活动字段**:筹资活动现金流入、流出、净额等
- **其他字段**:汇率变动影响、现金及现金等价物等

### 4. 字段标准化
- **字段名称标准化**:标准化字段名称
- **字段格式标准化**:标准化字段格式
- **字段单位标准化**:标准化字段单位
- **字段值标准化**:标准化字段值

### 5. 字段验证
- **字段完整性验证**:验证字段的完整性
- **字段准确性验证**:验证字段的准确性
- **字段一致性验证**:验证字段的一致性
- **字段关联性验证**:验证字段之间的关联性

### 6. 高级处理功能
- **字段映射**:映射不同报表格式的字段
- **字段补全**:补全缺失的字段
- **字段计算**:计算衍生字段
- **字段报告**:生成字段抽取报告

---

## 使用示例

### 输出示例
```json
{
  "source_info": {
    "document_id": "DOC001",
    "document_type": "financial_report",
    "report_type": "annual_report",
    "report_period": "2024",
    "source_file": "financial_report.pdf"
  },
  "income_statement": {
    "fields": [
      {
        "field_name": "营业收入",
        "standard_name": "revenue",
        "field_type": "amount",
        "value": 1000000000,
        "unit": "CNY",
        "period": "2024",
        "confidence": 0.98,
        "position": {
          "page": 5,
          "row": 3,
          "column": 2
        }
      },
      {
        "field_name": "营业成本",
        "standard_name": "cost_of_revenue",
        "field_type": "amount",
        "value": 600000000,
        "unit": "CNY",
        "period": "2024",
        "confidence": 0.97,
        "position": {
          "page": 5,
          "row": 4,
          "column": 2
        }
      },
      {
        "field_name": "净利润",
        "standard_name": "net_income",
        "field_type": "amount",
        "value": 200000000,
        "unit": "CNY",
        "period": "2024",
        "confidence": 0.99,
        "position": {
          "page": 5,
          "row": 15,
          "column": 2
        }
      }
    ]
  },
  "balance_sheet": {
    "fields": [
      {
        "field_name": "资产总额",
        "standard_name": "total_assets",
        "field_type": "amount",
        "value": 5000000000,
        "unit": "CNY",
        "period": "2024",
        "confidence": 0.98,
        "position": {
          "page": 6,
          "row": 20,
          "column": 2
        }
      }
    ]
  },
  "cash_flow_statement": {
    "fields": [
      {
        "field_name": "经营活动产生的现金流量净额",
        "standard_name": "operating_cash_flow",
        "field_type": "amount",
        "value": 300000000,
        "unit": "CNY",
        "period": "2024",
        "confidence": 0.97,
        "position": {
          "page": 7,
          "row": 10,
          "column": 2
        }
      }
    ]
  },
  "statistics": {
    "total_fields": 50,
    "extracted_fields": 48,
    "missing_fields": 2,
    "average_confidence": 0.97
  }
}
```

---

## 注意事项与限制

### 1. 报表格式要求
- 标准格式报表抽取准确率较高
- 非标准格式可能影响抽取
- 扫描版报表需要OCR支持

### 2. 字段识别准确性
- 标准字段名称识别准确率较高
- 非标准字段名称可能需要映射
- 复杂字段可能需要人工处理

### 3. 数值提取准确性
- 清晰标注的数值提取准确率较高
- 需要估算的数值可能不够准确
- 单位转换需要正确处理

### 4. 字段完整性
- 标准报表字段完整性较好
- 非标准报表可能缺失字段
- 字段补全可能需要人工处理

### 5. 使用限制
- 本 Skill 不包含报表编辑功能
- 抽取结果需要人工复核
- 复杂报表可能需要人工处理

---

## 参考资料
- 见 references/ 目录中的相关文档,包括:
  - 财务字段抽取方法手册
  - 财务报表字段标准
  - 字段映射规则指南
  - 性能优化指南

Related Skills

securities-financial-analyzer

105
from aifinlab/FinClaw

券商财务深度分析工具。分析上市券商(如中信证券、华泰证券等)的财务报表,包括资产负债表、利润表、现金流量表核心指标。支持ROE/ROA分析、杠杆率、手续费收入占比、自营收入占比等关键指标计算。使用同花顺iFinD API、Tushare Pro、AkShare获取真实财报数据。适用于券商个股研究、投资决策、财务健康度评估。

financial-futures-analyzer

105
from aifinlab/FinClaw

金融期货专项分析工具。分析股指期货(IF、IC、IH、IM)、国债期货(T、TF、TS)等金融衍生品。获取基差、贴水率、期现价差、持仓结构等。使用AkShare期货数据、中金所数据。适用于对冲策略、期现套利、资产配置。

bank-financial-analyzer

105
from aifinlab/FinClaw

商业银行财务深度分析。分析个股银行(如招商银行、工商银行等)的财务报表,包括资产负债表、利润表、现金流量表核心指标。支持ROE/ROA分析、净息差、手续费收入占比、成本收入比等关键指标计算。使用同花顺iFinD API、Tushare Pro获取真实财报数据。适用于银行个股研究、投资决策、财务健康度评估。

investment-thesis-extraction

105
from aifinlab/FinClaw

投资逻辑提炼助手。专注于从研报/会议/访谈中提炼核心投资逻辑,输出简洁清晰的投资论点、关键论据、验证方法。 **触发场景**: - 用户需要从长文档中提炼投资逻辑 - 用户说"提炼逻辑"、"投资论点"、"核心逻辑" - 需要简洁清晰、便于转述 - 需要关键论据、验证方法 **关键词**:"投资逻辑"、"提炼"、"论点"、"核心逻辑"、"thesis"、"投资要点"

product-selling-point-extraction

105
from aifinlab/FinClaw

面向基金产品管理领域的卖点提炼任务Skill,围绕「产品卖点提炼助手」场景提供信息抽取、结构化分析与结果输出。

financial-health-check

105
from aifinlab/FinClaw

用于信托领域项目尽调中的财务健康诊断助手场景。支持结构化输入处理、规则分析与Markdown结果输出。

enterprise-financial-health-diagnosis

105
from aifinlab/FinClaw

当用户需要对企业进行财务健康诊断、财务分析、偿债能力评估、盈利质量分析、 现金流稳定性判断、资本结构诊断、营运效率分析、财务红旗识别、授信前财务审阅、 贷后财务跟踪或出具财务诊断报告时,使用本技能。 适用于银行对公金融场景,尤其适合授信尽调、授信审查、贷后检查、风险预警、 存量客户复评、重点客户经营监测等任务。 当输入仅为零散财务数据、部分报表字段或口径不完整材料时,也可先输出 “初步财务诊断”,但必须明确口径限制、缺失信息与待核验事项。

financial-ratio-calculation

105
from aifinlab/FinClaw

用于计算企业财务比率的原子技能,包括盈利能力、偿债能力、营运能力和成长性指标。适用于财务报表分析、企业信用评估、投资研究和风险管理等金融场景。

timeline-extraction

105
from aifinlab/FinClaw

用于案件/项目时间线的时间线抽取原子 skill,适用于通用行业信息抽取场景。

relation-extraction

105
from aifinlab/FinClaw

用于主体关系抽取的关系抽取原子 skill,适用于通用行业信息抽取场景。

product-feature-extraction

105
from aifinlab/FinClaw

用于产品属性抽取的产品特征抽取原子 skill,适用于通用行业信息抽取场景。

metric-field-extraction

105
from aifinlab/FinClaw

用于报表指标抽取的指标字段抽取原子 skill,适用于通用行业信息抽取场景。