data-collection-guide

Chapter 2 데이터 수집 품질 기준 및 검증 방법

18 stars

Best use case

data-collection-guide is best used when you need a repeatable AI agent workflow instead of a one-off prompt.

Chapter 2 데이터 수집 품질 기준 및 검증 방법

Teams using data-collection-guide should expect a more consistent output, faster repeated execution, less prompt rewriting.

When to use this skill

  • You want a reusable workflow that can be run more than once with consistent structure.

When not to use this skill

  • You only need a quick one-off answer and do not need a reusable workflow.
  • You cannot install or maintain the underlying files, dependencies, or repository context.

Installation

Claude Code / Cursor / Codex

$curl -o ~/.claude/skills/data-collection-guide/SKILL.md --create-dirs "https://raw.githubusercontent.com/orientpine/honeypot/main/plugins/isd-generator/skills/data-collection-guide/SKILL.md"

Manual Installation

  1. Download SKILL.md from GitHub
  2. Place it in .claude/skills/data-collection-guide/SKILL.md inside your project
  3. Restart your AI agent — it will auto-discover the skill

How data-collection-guide Compares

Feature / Agentdata-collection-guideStandard Approach
Platform SupportNot specifiedLimited / Varies
Context Awareness High Baseline
Installation ComplexityUnknownN/A

Frequently Asked Questions

What does this skill do?

Chapter 2 데이터 수집 품질 기준 및 검증 방법

Where can I find the source code?

You can find the source code on GitHub using the link provided at the top of the page.

SKILL.md Source

# Chapter 2 데이터 수집 품질 기준

이 문서는 Chapter 2 작성을 위한 데이터 수집의 품질 기준과 검증 방법을 제공한다.

---

## 1. 출처 신빙성 기준

### 1.1 출처 등급 분류

| 등급 | 출처 유형 | 예시 | 신뢰도 |
|------|---------|------|-------|
| A | 글로벌 조사기관 | IDC, Gartner, MarketsandMarkets, Frost & Sullivan | 최상 |
| A | 정부/공공기관 | 특허청, 산업부, 과기부, NTIS | 최상 |
| B | 공인 연구기관 | KISTEP, KIET, KEIT, ETRI | 상 |
| B | 학술 논문 | IEEE, Nature, Science, ACM | 상 |
| C | 기업 공식 자료 | IR 자료, 연례보고서, 보도자료 | 중상 |
| D | 전문 매체 | ZDNet, TechCrunch, 전자신문 | 중 |
| E | 일반 매체 | 종합 일간지, 경제지 | 중하 |
| F | 비공식 자료 | 개인 블로그, 위키 | 사용금지 |

### 1.2 출처별 활용 기준

```yaml
market_data:
  required_grade: "A 또는 B"
  minimum_sources: 2
  note: "시장 규모 데이터는 반드시 글로벌 조사기관 출처 필요"

company_info:
  required_grade: "B 이상"
  minimum_sources: 1
  note: "기업 정보는 공식 자료(C등급) 허용"

technology_trend:
  required_grade: "B 이상"
  minimum_sources: 2
  note: "기술 동향은 연구기관 또는 학술 자료 우선"

patent_data:
  required_grade: "A"
  minimum_sources: 1
  note: "특허 데이터는 공식 특허DB만 사용"
```

---

## 2. 데이터 최신성 기준

### 2.1 연도별 기준

| 데이터 유형 | 권장 연도 | 최대 허용 연도 |
|-----------|---------|--------------|
| 시장 규모 | 2024-2025 | 2023 |
| 기술 동향 | 2024-2025 | 2023 |
| 기업 현황 | 2024-2025 | 2023 |
| 특허 분석 | 2019-2024 (5년간) | 2018-2024 |
| 정책 자료 | 2024-2025 | 2022 |

### 2.2 예외 사항

```
[최신성 예외 허용 케이스]
1. 역사적 기술 발전 설명 시
2. 장기 시장 추세 분석 시
3. 기존 기술 대비 신기술 비교 시
4. 정책 연혁 설명 시
```

---

## 3. 데이터 완결성 기준

### 3.1 시장 데이터 필수 항목

```yaml
domestic_market:
  required:
    - current_size: "현재 시장 규모 (년도, 금액, 단위)"
    - cagr: "연평균 성장률"
    - forecast: "전망 규모 (목표 년도, 금액)"
    - source: "출처 (기관명, 보고서명, 년도)"
  optional:
    - segment_breakdown: "세부 시장 분류"
    - key_players: "주요 기업"

global_market:
  required:
    - current_size: "글로벌 시장 규모"
    - cagr: "연평균 성장률"
    - forecast: "전망 규모"
    - regional_share: "지역별 점유율"
    - source: "출처"
  optional:
    - industry_breakdown: "산업별 분류"
    - country_breakdown: "국가별 분류"
```

### 3.2 기업 데이터 필수 항목

```yaml
company_profile:
  required:
    - name: "기업명"
    - products_services: "주요 제품/서비스"
    - achievement: "성과 또는 특징"
  optional:
    - revenue: "매출"
    - market_share: "시장 점유율"
    - recent_news: "최근 동향"
```

### 3.3 특허 데이터 필수 항목

```yaml
patent_analysis:
  required:
    - yearly_trend: "연도별 출원 동향 (최소 5년)"
    - country_share: "국가별 비중 (최소 4개국)"
    - domestic_key_patents: "국내 핵심 특허 (4-5건)"
    - global_key_patents: "국외 핵심 특허 (10-15건)"
  optional:
    - technology_classification: "기술별 분류"
    - top_applicants: "다출원인 분석"
    - os_matrix: "공백기술 분석"
```

### 3.4 경쟁력 비교표 필수 항목

```yaml
competitiveness_table:
  required:
    - depth1: "영역 (3-5개)"
    - depth2: "기술 (영역당 2-3개)"
    - benchmark_institution: "선진기관명"
    - country: "국가"
    - benchmark_level: "선진기관 기술수준"
    - kimm_current: "KIMM 현재 수준"
    - kimm_target: "KIMM 목표 수준"
```

---

## 4. 데이터 정합성 검증

### 4.1 내부 정합성 체크리스트

```markdown
[시장 데이터 정합성]
- [ ] 시장 규모 단위 일관성 (달러/원화)
- [ ] CAGR 계산 검증 (현재 규모와 전망 규모 일치)
- [ ] 지역별 점유율 합계 100% 확인
- [ ] 산업별 분류 합계 검증

[기업 데이터 정합성]
- [ ] 기업명 표기 일관성 (영문/한글)
- [ ] 성과 데이터 단위 일관성
- [ ] 연도 표기 일관성

[특허 데이터 정합성]
- [ ] 연도별 출원 건수 합계 검증
- [ ] 국가별 비중 합계 100% 확인
- [ ] 핵심 특허 정보 완결성 확인
```

### 4.2 외부 정합성 체크리스트

```markdown
[Chapter 간 정합성]
- [ ] Chapter 3 세부기술 ↔ Chapter 2 기술 동향 일치
- [ ] Chapter 3 최종목표 ↔ Chapter 2 기술개발 방향 연계
- [ ] Chapter 1 정책 부합성 ↔ Chapter 2 시사점 연계
- [ ] Chapter 1 기술분류 ↔ Chapter 2 기술 동향 일치
```

---

## 5. 테이블 작성 기준

### 5.1 기업 동향 테이블

| 항목 | 기준 |
|------|------|
| 국내 기업 | 최소 5개 |
| 글로벌 기업 | 최소 10개 |
| 필수 열 | 기업명, 제품/서비스, 성과 |
| 선택 열 | 매출, 점유율, 특이사항 |

```markdown
[예시]
| 기업명 | 주요 서비스/제품 | 성과 및 전망 |
|--------|-----------------|-------------|
| 삼성SDS | '패브릭스', '브리티 코파일럿' | 2분기 영업이익 2209억원 (전년 대비 7.1% 증가) |
| SK C&C | '솔루어', 'AI 랜딩존' | 2분기 영업이익 전년 대비 13.78% 증가 |
| LG CNS | 'GenAI Text' | 2분기 영업이익 1377억원 (전년 대비 21.0% 증가) |
```

### 5.2 M&A 동향 테이블

| 항목 | 기준 |
|------|------|
| 최소 건수 | 5건 |
| 필수 열 | 인수사, 피인수사, 유형, 기대효과, 시기 |
| 연도 범위 | 최근 3년 (2022-2024) |

```markdown
[예시]
| 회사 | 인수/합병 회사 | 유형 | 기대효과 | 시기 |
|-----|--------------|------|---------|-----|
| 지멘스 | Altair Engineering | 인수 | AI 기반 설계/시뮬레이션 포트폴리오 강화 | 2024 |
| 오토데스크 | Wonder Dynamics | 인수 | 클라우드 기반 AI 콘텐츠 제작 효율화 | 2024 |
```

### 5.3 특허 분석 테이블

| 항목 | 기준 |
|------|------|
| 연도별 동향 | 최소 5년 |
| 국가별 비중 | 최소 4개국 |
| 국내 핵심 특허 | 4-5건 |
| 국외 핵심 특허 | 10-15건 |

```markdown
[예시 - 국가별 비중]
| 국가 | 비중 |
|------|------|
| 미국 | 44% |
| 일본 | 15% |
| 중국 | 12% |
| 한국 | 8% |
| 기타 | 21% |
```

### 5.4 경쟁력 비교표

| 항목 | 기준 |
|------|------|
| 영역(Depth 1) | 3-5개 |
| 기술(Depth 2) | 영역당 2-3개 |
| 기술수준 표기 | TRL 1-9 또는 점수 1-5 |

```markdown
[예시]
| Depth 1 | Depth 2 | 선진기관 | 국가 | 기술수준 | KIMM 현재 | KIMM 목표 |
|---------|---------|---------|-----|---------|----------|----------|
| 설계 기술 | 기계요소부품 설계 | FZG | 독일 | 5 | 2 | 4 |
| | 진동/충격 저감장치 설계 | [대기업A] | 한국 | 5 | 4 | 4 |
| 해석 기술 | 3D 기반 부품 해석기술 | ANSYS | 미국 | 5 | 2 | 4 |
```

---

## 6. 이미지 위치 기준

### 6.1 필수 이미지 목록

| 번호 | 이미지명 | 위치 | 유형 |
|-----|---------|-----|------|
| 1 | 국내 시장 규모 및 전망 | 1. 국내 시장 | 막대/선 그래프 |
| 2 | 국내 주요 기업 동향 | 1. 국내 시장 | 테이블 |
| 3 | 국산 SW/제품 시장 현황 | 1. 국내 시장 | 막대 그래프 |
| 4 | 글로벌 시장 규모 | 2. 국외 시장 | 막대/선 그래프 |
| 5 | 지역별 시장 점유율 | 2. 국외 시장 | 파이 차트 |
| 6 | 연도별 특허 출원 동향 | 2. 국외 시장 | 막대 그래프 |
| 7 | 국가별 특허 비중 | 2. 국외 시장 | 파이 차트 |
| 8 | 기술별 특허 분류 | 2. 국외 시장 | 막대 그래프 |
| 9 | 글로벌 기업 동향 | 2. 국외 시장 | 테이블 |
| 10 | M&A 동향 | 2. 국외 시장 | 테이블 |
| 11 | 연구원 경쟁력 비교표 | 3. 시사점 | 테이블 |

### 6.2 이미지 표기 형식

```markdown
<이미지 설명>

또는 (출처 포함)

<이미지 설명>
> 출처: 기관명, 보고서명, 연도
```

---

## 7. 수치 표기 기준

### 7.1 시장 규모

| 규모 | 표기 형식 |
|------|---------|
| 100억 원 미만 | XX억 원 |
| 100억 원 이상 | X,XXX억 원 |
| 1조 원 이상 | X조 X,XXX억 원 |
| 달러 | XX억 달러 / XX백만 달러 |

### 7.2 성장률

```
CAGR XX% 또는 연평균 XX% 성장
```

### 7.3 점유율

```
XX% (소수점 1자리까지)
```

### 7.4 TRL

```
TRL X (1-9 정수)
```

---

## 8. 검증 절차

### Step 1: 데이터 수집 완료 후

1. 모든 데이터에 출처 확인
2. 출처 등급 확인 (B등급 이상)
3. 데이터 최신성 확인 (2023년 이후)

### Step 2: 테이블 작성 후

1. 필수 항목 완결성 확인
2. 단위 일관성 확인
3. 합계/비율 검증

### Step 3: 문서 작성 후

1. Chapter 간 정합성 확인
2. 이미지 위치 확인
3. 출처 표기 확인

### Step 4: 최종 검토

```markdown
[최종 검증 체크리스트]
- [ ] 모든 수치 데이터에 출처 명시
- [ ] 시장 규모 데이터 최신성 (2023년 이후)
- [ ] 기업 동향 테이블 완결성 (국내 5+, 글로벌 10+)
- [ ] 특허 분석 완결성 (연도별, 국가별, 국내 특허 4-5건, 국외 특허 10-15건)
- [ ] 경쟁력 비교표 완결성 (영역 3-5개, 기술 6-15개)
- [ ] Chapter 1/3과 정합성 확인
- [ ] 강조 표시(**, 이모지) 없음 확인
```

---

## Meta

```yaml
version: "1.0"
created: "2026-01-30"
consumers:
  - chapter2
```

Related Skills

stock-data-verifier

18
from orientpine/honeypot

주식/ETF 데이터 3개 출처 교차검증 프로토콜. 환각 방지 첫 번째 방어선.

ipc-classification-guide

18
from orientpine/honeypot

IPC/CPC 국제특허분류 체계 가이드. 특허 검색 시 IPC 코드 구조 이해, 기술 분야별 코드 탐색, 검색 전략 수립에 활용. Use when: (1) IPC 코드의 의미나 구조를 파악할 때, (2) 특정 기술 분야의 IPC 코드를 찾을 때, (3) 특허 분류 체계 설계 시 IPC 코드 매핑이 필요할 때, (4) 'IPC code', 'patent classification', '특허 분류', 'CPC code' 관련 질문 시.

image-reference-guide

18
from orientpine/honeypot

이미지/도표 수집, 출처 표기, 활용 방법 가이드

figure-guide

18
from orientpine/honeypot

이미지 생성 프롬프트 작성 가이드 - 프롬프트 가이드, 캡션 패턴, 예시 프롬프트 통합

chapter5-guide

18
from orientpine/honeypot

Chapter 5 (기타 참고자료) 작성 가이드 - 템플릿 및 요구사항 통합

chapter4-guide

18
from orientpine/honeypot

Chapter 4 (사업 기대효과) 작성 가이드 - 템플릿 및 요구사항 통합

chapter3-guide

18
from orientpine/honeypot

Chapter 3 (사업 목표 및 추진 전략) 작성 가이드 - 템플릿 및 요구사항 통합

chapter2-guide

18
from orientpine/honeypot

Chapter 2 (국내외 시장 및 기술 동향) 작성 가이드 - 템플릿, 요구사항, 웹검색 전략 통합

chapter1-guide

18
from orientpine/honeypot

Chapter 1 (개발대상 및 필요성) 작성 가이드 - 템플릿, 요구사항, 웹검색 전략 통합

data-updater

18
from orientpine/honeypot

CSV에서 펀드 데이터를 추출하여 fund_data.json, fund_fees.json, fund_classification.json을 생성/업데이트하는 스킬. 예금금리 데이터(deposit_rates.json) 업데이트도 지원한다. 펀드 데이터 업데이트가 필요하거나 CSV 파일을 JSON으로 변환하고 싶을 때 사용한다.

wiki-gen

18
from orientpine/honeypot

>

theme-whatif

18
from orientpine/honeypot

visual-generator whatif 목적 테마(미래 비전 스냅샷). theme=whatif 또는 purpose=whatif일 때 사용. 단일 팔레트 + Future Snapshot/Hero Statement 레이아웃 가이드 + 장면 구성 5요소 + 몰입 기법 포함.