entity-normalization

用于实体归一的实体标准化原子 skill,适用于通用行业信息抽取场景。

105 stars

Best use case

entity-normalization is best used when you need a repeatable AI agent workflow instead of a one-off prompt.

用于实体归一的实体标准化原子 skill,适用于通用行业信息抽取场景。

Teams using entity-normalization should expect a more consistent output, faster repeated execution, less prompt rewriting.

When to use this skill

  • You want a reusable workflow that can be run more than once with consistent structure.

When not to use this skill

  • You only need a quick one-off answer and do not need a reusable workflow.
  • You cannot install or maintain the underlying files, dependencies, or repository context.

Installation

Claude Code / Cursor / Codex

$curl -o ~/.claude/skills/entity-normalization/SKILL.md --create-dirs "https://raw.githubusercontent.com/aifinlab/FinClaw/main/skills/archive/entity-normalization/SKILL.md"

Manual Installation

  1. Download SKILL.md from GitHub
  2. Place it in .claude/skills/entity-normalization/SKILL.md inside your project
  3. Restart your AI agent — it will auto-discover the skill

How entity-normalization Compares

Feature / Agententity-normalizationStandard Approach
Platform SupportNot specifiedLimited / Varies
Context Awareness High Baseline
Installation ComplexityUnknownN/A

Frequently Asked Questions

What does this skill do?

用于实体归一的实体标准化原子 skill,适用于通用行业信息抽取场景。

Where can I find the source code?

You can find the source code on GitHub using the link provided at the top of the page.

SKILL.md Source

# 实体标准化 Skill

## 数据来源

本 Skill 支持多种实体数据输入格式,核心数据来源包括:

### 1. 实体数据来源
- **实体识别结果**:从文本中识别出的实体
- **实体列表**:已有的实体列表和实体库
- **数据库记录**:数据库中的实体记录
- **API接口数据**:通过API获取的实体数据

### 2. 实体类型
- **公司实体**:公司名称、机构名称
- **人物实体**:人名、职位名称
- **产品实体**:产品名称、服务名称
- **地点实体**:地名、地址

### 3. 数据格式要求
- **JSON格式**:结构化的实体数据
- **CSV格式**:表格格式的实体数据
- **文本格式**:纯文本实体列表
- **数据库连接**:支持SQL数据库直接查询

### 4. 实体特征
- **实体名称**:实体的名称和别名
- **实体类型**:实体的类型和类别
- **实体属性**:实体的相关属性
- **实体上下文**:实体的上下文信息

> 说明:本 Skill 不包含实体识别功能,需要用户提供已识别的实体数据。建议实体数据包含足够的上下文信息,以便进行准确的标准化。

---

## 功能

本 Skill 提供全面的实体标准化能力,涵盖多种标准化功能:

### 1. 实体名称标准化
- **名称归一化**:将不同表述的实体名称统一为标准名称
- **别名识别**:识别实体的别名和简称
- **名称纠错**:纠正实体名称中的错误
- **名称补全**:补全实体名称的缺失部分

### 2. 实体类型标准化
- **类型分类**:对实体进行类型分类
- **类型映射**:将非标准类型映射到标准类型
- **类型验证**:验证实体类型的正确性
- **类型补全**:补全缺失的实体类型

### 3. 实体属性标准化
- **属性提取**:提取实体的标准属性
- **属性映射**:将非标准属性映射到标准属性
- **属性验证**:验证实体属性的正确性
- **属性补全**:补全缺失的实体属性

### 4. 实体消歧
- **同名实体区分**:区分同名但不同的实体
- **实体合并**:合并指向同一实体的不同表述
- **实体链接**:将实体链接到知识库
- **实体验证**:验证实体的唯一性

### 5. 实体匹配
- **相似实体匹配**:匹配相似的实体
- **模糊匹配**:支持模糊实体匹配
- **精确匹配**:支持精确实体匹配
- **匹配评分**:提供匹配评分和置信度

### 6. 高级处理功能
- **批量标准化**:批量处理多个实体
- **增量标准化**:增量更新实体标准化结果
- **标准化规则**:支持自定义标准化规则
- **标准化报告**:生成标准化报告和统计

---

## 使用示例

### 输出示例
```json
{
  "input_entities": [
    {
      "entity_id": "ENT001",
      "original_name": "中国工商银行",
      "entity_type": "bank",
      "context": "公告中提到中国工商银行"
    },
    {
      "entity_id": "ENT002",
      "original_name": "工商银行",
      "entity_type": "bank",
      "context": "工商银行发布公告"
    },
    {
      "entity_id": "ENT003",
      "original_name": "ICBC",
      "entity_type": "bank",
      "context": "ICBC的财务报告"
    }
  ],
  "normalized_entities": [
    {
      "entity_id": "ENT001",
      "original_name": "中国工商银行",
      "normalized_name": "中国工商银行股份有限公司",
      "standard_name": "中国工商银行",
      "aliases": ["工商银行", "ICBC", "工行"],
      "entity_type": "bank",
      "standard_type": "bank",
      "normalized_attributes": {
        "full_name": "中国工商银行股份有限公司",
        "short_name": "工商银行",
        "english_name": "Industrial and Commercial Bank of China",
        "abbreviation": "ICBC",
        "stock_code": "601398"
      },
      "confidence": 0.98,
      "match_method": "exact_match"
    },
    {
      "entity_id": "ENT002",
      "original_name": "工商银行",
      "normalized_name": "中国工商银行股份有限公司",
      "standard_name": "中国工商银行",
      "aliases": ["工商银行", "ICBC", "工行"],
      "entity_type": "bank",
      "standard_type": "bank",
      "normalized_attributes": {
        "full_name": "中国工商银行股份有限公司",
        "short_name": "工商银行",
        "english_name": "Industrial and Commercial Bank of China",
        "abbreviation": "ICBC",
        "stock_code": "601398"
      },
      "confidence": 0.95,
      "match_method": "alias_match"
    },
    {
      "entity_id": "ENT003",
      "original_name": "ICBC",
      "normalized_name": "中国工商银行股份有限公司",
      "standard_name": "中国工商银行",
      "aliases": ["工商银行", "ICBC", "工行"],
      "entity_type": "bank",
      "standard_type": "bank",
      "normalized_attributes": {
        "full_name": "中国工商银行股份有限公司",
        "short_name": "工商银行",
        "english_name": "Industrial and Commercial Bank of China",
        "abbreviation": "ICBC",
        "stock_code": "601398"
      },
      "confidence": 0.92,
      "match_method": "abbreviation_match"
    }
  ],
  "entity_mapping": {
    "ENT001": "NORM001",
    "ENT002": "NORM001",
    "ENT003": "NORM001"
  },
  "statistics": {
    "input_count": 3,
    "normalized_count": 1,
    "merge_count": 2,
    "average_confidence": 0.95
  }
}
```

---

## 注意事项与限制

### 1. 数据质量要求
- 实体数据需要包含足够的上下文信息
- 实体名称需要清晰明确
- 实体类型需要准确

### 2. 标准化准确性
- 标准实体名称标准化准确率较高
- 非标准实体名称可能需要人工处理
- 实体消歧可能需要额外信息

### 3. 实体匹配
- 精确匹配准确率较高
- 模糊匹配可能需要人工复核
- 相似实体匹配可能产生误匹配

### 4. 知识库依赖
- 标准化结果依赖知识库的完整性
- 知识库更新可能影响标准化结果
- 新实体可能需要人工处理

### 5. 使用限制
- 本 Skill 不包含实体识别功能
- 标准化结果需要人工复核
- 复杂实体可能需要人工处理

---

## 参考资料
- 见 references/ 目录中的相关文档,包括:
  - 实体标准化方法手册
  - 实体匹配算法说明
  - 实体消歧指南
  - 性能优化指南

Related Skills

financing-entity-dd-urban-investment

105
from aifinlab/FinClaw

用于信托领域项目尽调中的融资主体尽调助手-城投版场景。支持结构化输入处理、规则分析与Markdown结果输出。

financing-entity-dd-real-estate

105
from aifinlab/FinClaw

用于信托领域项目尽调中的融资主体尽调助手-地产版场景。支持结构化输入处理、规则分析与Markdown结果输出。

financing-entity-dd-equity-investment

105
from aifinlab/FinClaw

用于信托领域项目尽调中的融资主体尽调助手-股权投资版场景。支持结构化输入处理、规则分析与Markdown结果输出。

financing-entity-dd-consumer

105
from aifinlab/FinClaw

用于信托领域项目尽调中的融资主体尽调助手-消费版场景。支持结构化输入处理、规则分析与Markdown结果输出。

financing-entity-dd-assistant

105
from aifinlab/FinClaw

用于融资主体尽调的结构化风险扫描与初判,覆盖财务数据核对、工商信息排查、涉诉执行风险识别、负面舆情关键词扫描。适用于信托/资管项目立项前的主体初筛、尽调底稿整理、投前风控复核等场景。

entity-sentiment-alert

105
from aifinlab/FinClaw

用于信托领域存续期管理中的主体舆情预警助手场景。支持结构化输入处理、规则分析与Markdown结果输出。

entity-profile

105
from aifinlab/FinClaw

用于信托领域项目尽调中的主体画像助手场景。支持结构化输入处理、规则分析与Markdown结果输出。

bank-t208-risk-management-identity-anomaly-assistant

105
from aifinlab/FinClaw

当用户需要在银行风险管理场景下,对客户身份异常与资料变更进行监测、排查与处置建议输出时使用本技能。适合生成身份异常摘要、优先级判断、排查清单与升级路径。

field-mapping-normalization

105
from aifinlab/FinClaw

用于异构字段统一的字段映射与标准化原子 skill,适用于通用行业数据接入场景。

entity-recognition

105
from aifinlab/FinClaw

用于金融文本中实体识别的原子技能,包括公司主体、金融产品、监管机构、关键人物等实体类型的识别和抽取。适用于公告解析、报告分析、风险监控和合规检查等金融场景。

trust-valuation-engine

105
from aifinlab/FinClaw

## 描述

trust-risk-manager

105
from aifinlab/FinClaw

## 描述