agent-evaluation

Yapılandırılmış süreç, kalite kontrolleri ve sistem entegrasyonu ile bir ajan değerlendirmesi analiz edin ve üretin

247 stars

bykomunite

View on GitHub Installation ↓

Best use case

agent-evaluation is best used when you need a repeatable AI agent workflow instead of a one-off prompt.

Yapılandırılmış süreç, kalite kontrolleri ve sistem entegrasyonu ile bir ajan değerlendirmesi analiz edin ve üretin

Teams using agent-evaluation should expect a more consistent output, faster repeated execution, less prompt rewriting.

When to use this skill

You want a reusable workflow that can be run more than once with consistent structure.

When not to use this skill

You only need a quick one-off answer and do not need a reusable workflow.
You cannot install or maintain the underlying files, dependencies, or repository context.

Installation

Claude Code / Cursor / Codex

$curl -o ~/.claude/skills/agent-evaluation/SKILL.md --create-dirs "https://raw.githubusercontent.com/komunite/kalfa/main/.claude/skills/ai-automation/agent-evaluation/SKILL.md"

Manual Installation

Download SKILL.md from GitHub
Place it in .claude/skills/agent-evaluation/SKILL.md inside your project
Restart your AI agent — it will auto-discover the skill

How agent-evaluation Compares

Feature / Agent	agent-evaluation	Standard Approach
Platform Support	Not specified	Limited / Varies
Context Awareness	High	Baseline
Installation Complexity	Unknown	N/A

Frequently Asked Questions

What does this skill do?

Yapılandırılmış süreç, kalite kontrolleri ve sistem entegrasyonu ile bir ajan değerlendirmesi analiz edin ve üretin

Where can I find the source code?

You can find the source code on GitHub using the link provided at the top of the page.

SKILL.md Source

# Agent Evaluation

## Amaç

Eyleme dönüştürülebilir, ölçülebilir sonuçlar sunan kapsamlı bir ajan değerlendirmesi analiz edin ve üretin. Bu beceri, her seferinde profesyonel düzeyde çıktı sağlayan, kalite doğrulamalı yapılandırılmış bir süreç sunar.

**Kategori**: Yapay Zeka ve Otomasyon

## Girdiler

### Zorunlu
- **Hedef**: Bu çıktı ile neyi başarmak istiyorsunuz
- **Bağlam**: İlgili arka plan bilgileri

### İsteğe Bağlı
- **Kısıtlamalar**: Dikkate alınması gereken sınırlamalar veya gereksinimler
- **Mevcut Çalışma**: Üzerine inşa edilecek önceki belgeler veya veriler

## Sistem Bağlamı

Başlamadan önce:
- Mevcut proje bağlamı ve öncelikleri için `memory.md`'yi oku
- İlgili öğrenilmiş kurallar veya kısıtlamalar için `knowledge-base.md`'yi kontrol et
- Projedeki mevcut ilgili belgeleri gözden geçir
- Bu çıktı ile ilgili `.claude/workspace/TaskBoard.md`'deki aktif görevleri not et

## Süreç

### Adım 1: Bağlam ve Araştırma
- Projedeki mevcut ajan değerlendirmesi belgelerini gözden geçir
- İlgili öğrenilmiş kurallar veya kısıtlamalar için `knowledge-base.md`'yi kontrol et
- Mevcut proje bağlamı ve öncelikleri için `memory.md`'yi kontrol et
- Kilit paydaşları ve gereksinimlerini belirle
- En uygun çerçeveyi seç: AI Readiness Assessment, Automation ROI Calculator, Human-in-the-Loop Design

### Adım 2: Analiz ve Çerçeve Uygulaması
- Ajan değerlendirmesini yapılandırmak için seçilen çerçeveyi uygula
- Boşlukları, fırsatları ve riskleri belirle
- Başarı metriklerini tanımla: Time Saved Per Task, Automation Rate, Error Reduction %, Cost Per AI Operation
- Varsayımları ve bağımlılıkları belgele
- Yaklaşımı sektör en iyi uygulamalarına göre doğrula

### Adım 3: Çıktıyı Oluştur
- Ajan değerlendirmesini aşağıdaki çıktı formatını kullanarak yapılandır
- Genel tavsiyeler değil, spesifik ve eyleme dönüştürülebilir öneriler ekle
- Uygulanabilir yerlerde somut rakamlar, zaman çizelgeleri ve kıyaslamalar ekle
- Tutarlılık için mevcut proje belgeleriyle çapraz referans yap
- Her bölümün değer kattığından emin ol — dolgu içeriği kaldır

### Adım 4: Kalite Doğrulama
- [ ] Tüm zorunlu girdiler ele alındı
- [ ] Öneriler spesifik ve eyleme dönüştürülebilir (belirsiz değil)
- [ ] Rakamlar ve kıyaslamalar gerçekçi ve kaynaklı
- [ ] Çıktı formatı aşağıdaki spesifikasyona uyuyor
- [ ] knowledge-base kurallarıyla çelişki yok
- [ ] En iyi uygulamayı takip ediyor: Yüksek hacimli, düşük riskli görevlerle başla

## Çıktı Formatı

```markdown
# Agent Evaluation

## Yönetici Özeti
[Çıktının ve temel önerilerin 2-3 cümlelik özeti]

## Bağlam ve Hedefler
- **Hedef**: [Bunun neyi başardığı]
- **Hedef Kitle**: [Bunun kime yönelik olduğu]
- **Zaman Çizelgesi**: [Bunun ne zaman geçerli olduğu]

## Analiz
[Seçilen çerçeve kullanılarak yapılandırılmış analiz]

## Öneriler
1. [Beklenen etkisiyle birlikte spesifik, eyleme dönüştürülebilir öneri]
2. [Beklenen etkisiyle birlikte spesifik, eyleme dönüştürülebilir öneri]
3. [Beklenen etkisiyle birlikte spesifik, eyleme dönüştürülebilir öneri]

## Uygulama
| Eylem | Sorumlu | Zaman Çizelgesi | Öncelik |
|-------|---------|-----------------|---------|
| [Eylem maddesi] | [Kim] | [Ne zaman] | [Yüksek/Orta/Düşük] |

## Başarı Metrikleri
| Metrik | Mevcut | Hedef | Ölçüm Yöntemi |
|--------|--------|-------|---------------|
| [KPI] | [Başlangıç] | [Hedef] | [Nasıl ölçülecek] |

## Riskler ve Azaltmalar
| Risk | Olasılık | Etki | Azaltma |
|------|----------|------|---------|
| [Risk] | [Y/O/D] | [Y/O/D] | [Eylem] |

## Sonraki Adımlar
- [ ] [Acil sonraki eylem]
- [ ] [Takip eylemi]
- [ ] [Gözden geçirme tarihi]
```

## Uygulanabilir Çerçeveler
- AI Readiness Assessment
- Automation ROI Calculator
- Human-in-the-Loop Design
- RAG Architecture
- Agent Orchestration Patterns
- Responsible AI Framework

## Temel Metrikler
- Time Saved Per Task
- Automation Rate
- Error Reduction %
- Cost Per AI Operation
- User Adoption Rate
- Output Quality Score

## En İyi Pratikler
- Yüksek hacimli, düşük riskli görevlerle başla
- Kritik çıktılar için her zaman insan incelemesi yap
- Sadece doğruluğu değil, kazanılan zamanı ölç
- Promptları kod gibi sürüm kontrol et
- Sapma ve bozulma için aylık izleme yap

## Tamamlandıktan Sonra

- Bu çıktı proje bağlamını veya önceliklerini değiştiriyorsa `memory.md`'yi güncelle
- Yeniden kullanılabilir öğrenimleri `knowledge-nominations.md`'ye ekle
- Takip eylemleri belirlendiyse, bunları `.claude/workspace/TaskBoard.md`'ye ekle
- Ek çalışma gerekiyorsa ilgili becerileri öner

Related Skills

outsourcing-evaluation

247

from komunite/kalfa

Analyze and produce a outsourcing evaluation with structured process, quality checks, and system integration

martech-evaluation

247

from komunite/kalfa

Analyze and produce a martech evaluation with structured process, quality checks, and system integration

supplier-evaluation

247

from komunite/kalfa

Analyze and produce a supplier evaluation with structured process, quality checks, and system integration

ai-vendor-evaluation

247

from komunite/kalfa

Analyze and produce a ai vendor evaluation with structured process, quality checks, and system integration

trademark-search

247

from komunite/kalfa

Create a trademark search with structured process, quality checks, and system integration

term-sheet-negotiation

247

from komunite/kalfa

Create a term sheet negotiation with structured process, quality checks, and system integration

team-building

247

from komunite/kalfa

Create a team building with structured process, quality checks, and system integration

startup-metrics-dashboard

247

from komunite/kalfa

Analyze and produce a startup metrics dashboard with structured process, quality checks, and system integration

startup-legal-checklist

247

from komunite/kalfa

Analyze and produce a startup legal checklist with structured process, quality checks, and system integration

solopreneur-playbook

247

from komunite/kalfa

Solopreneur isletim kilavuzu — gelir kilometre taslari, haftalik rutin, arac yigini ve 90 gunluk eylem plani

side-project-validation

247

from komunite/kalfa

Create a side project validation with structured process, quality checks, and system integration

revenue-model-design

247

from komunite/kalfa

Create a revenue model design with structured process, quality checks, and system integration