agent-evaluation
Yapılandırılmış süreç, kalite kontrolleri ve sistem entegrasyonu ile bir ajan değerlendirmesi analiz edin ve üretin
Best use case
agent-evaluation is best used when you need a repeatable AI agent workflow instead of a one-off prompt.
Yapılandırılmış süreç, kalite kontrolleri ve sistem entegrasyonu ile bir ajan değerlendirmesi analiz edin ve üretin
Teams using agent-evaluation should expect a more consistent output, faster repeated execution, less prompt rewriting.
When to use this skill
- You want a reusable workflow that can be run more than once with consistent structure.
When not to use this skill
- You only need a quick one-off answer and do not need a reusable workflow.
- You cannot install or maintain the underlying files, dependencies, or repository context.
Installation
Claude Code / Cursor / Codex
Manual Installation
- Download SKILL.md from GitHub
- Place it in
.claude/skills/agent-evaluation/SKILL.mdinside your project - Restart your AI agent — it will auto-discover the skill
How agent-evaluation Compares
| Feature / Agent | agent-evaluation | Standard Approach |
|---|---|---|
| Platform Support | Not specified | Limited / Varies |
| Context Awareness | High | Baseline |
| Installation Complexity | Unknown | N/A |
Frequently Asked Questions
What does this skill do?
Yapılandırılmış süreç, kalite kontrolleri ve sistem entegrasyonu ile bir ajan değerlendirmesi analiz edin ve üretin
Where can I find the source code?
You can find the source code on GitHub using the link provided at the top of the page.
SKILL.md Source
# Agent Evaluation ## Amaç Eyleme dönüştürülebilir, ölçülebilir sonuçlar sunan kapsamlı bir ajan değerlendirmesi analiz edin ve üretin. Bu beceri, her seferinde profesyonel düzeyde çıktı sağlayan, kalite doğrulamalı yapılandırılmış bir süreç sunar. **Kategori**: Yapay Zeka ve Otomasyon ## Girdiler ### Zorunlu - **Hedef**: Bu çıktı ile neyi başarmak istiyorsunuz - **Bağlam**: İlgili arka plan bilgileri ### İsteğe Bağlı - **Kısıtlamalar**: Dikkate alınması gereken sınırlamalar veya gereksinimler - **Mevcut Çalışma**: Üzerine inşa edilecek önceki belgeler veya veriler ## Sistem Bağlamı Başlamadan önce: - Mevcut proje bağlamı ve öncelikleri için `memory.md`'yi oku - İlgili öğrenilmiş kurallar veya kısıtlamalar için `knowledge-base.md`'yi kontrol et - Projedeki mevcut ilgili belgeleri gözden geçir - Bu çıktı ile ilgili `.claude/workspace/TaskBoard.md`'deki aktif görevleri not et ## Süreç ### Adım 1: Bağlam ve Araştırma - Projedeki mevcut ajan değerlendirmesi belgelerini gözden geçir - İlgili öğrenilmiş kurallar veya kısıtlamalar için `knowledge-base.md`'yi kontrol et - Mevcut proje bağlamı ve öncelikleri için `memory.md`'yi kontrol et - Kilit paydaşları ve gereksinimlerini belirle - En uygun çerçeveyi seç: AI Readiness Assessment, Automation ROI Calculator, Human-in-the-Loop Design ### Adım 2: Analiz ve Çerçeve Uygulaması - Ajan değerlendirmesini yapılandırmak için seçilen çerçeveyi uygula - Boşlukları, fırsatları ve riskleri belirle - Başarı metriklerini tanımla: Time Saved Per Task, Automation Rate, Error Reduction %, Cost Per AI Operation - Varsayımları ve bağımlılıkları belgele - Yaklaşımı sektör en iyi uygulamalarına göre doğrula ### Adım 3: Çıktıyı Oluştur - Ajan değerlendirmesini aşağıdaki çıktı formatını kullanarak yapılandır - Genel tavsiyeler değil, spesifik ve eyleme dönüştürülebilir öneriler ekle - Uygulanabilir yerlerde somut rakamlar, zaman çizelgeleri ve kıyaslamalar ekle - Tutarlılık için mevcut proje belgeleriyle çapraz referans yap - Her bölümün değer kattığından emin ol — dolgu içeriği kaldır ### Adım 4: Kalite Doğrulama - [ ] Tüm zorunlu girdiler ele alındı - [ ] Öneriler spesifik ve eyleme dönüştürülebilir (belirsiz değil) - [ ] Rakamlar ve kıyaslamalar gerçekçi ve kaynaklı - [ ] Çıktı formatı aşağıdaki spesifikasyona uyuyor - [ ] knowledge-base kurallarıyla çelişki yok - [ ] En iyi uygulamayı takip ediyor: Yüksek hacimli, düşük riskli görevlerle başla ## Çıktı Formatı ```markdown # Agent Evaluation ## Yönetici Özeti [Çıktının ve temel önerilerin 2-3 cümlelik özeti] ## Bağlam ve Hedefler - **Hedef**: [Bunun neyi başardığı] - **Hedef Kitle**: [Bunun kime yönelik olduğu] - **Zaman Çizelgesi**: [Bunun ne zaman geçerli olduğu] ## Analiz [Seçilen çerçeve kullanılarak yapılandırılmış analiz] ## Öneriler 1. [Beklenen etkisiyle birlikte spesifik, eyleme dönüştürülebilir öneri] 2. [Beklenen etkisiyle birlikte spesifik, eyleme dönüştürülebilir öneri] 3. [Beklenen etkisiyle birlikte spesifik, eyleme dönüştürülebilir öneri] ## Uygulama | Eylem | Sorumlu | Zaman Çizelgesi | Öncelik | |-------|---------|-----------------|---------| | [Eylem maddesi] | [Kim] | [Ne zaman] | [Yüksek/Orta/Düşük] | ## Başarı Metrikleri | Metrik | Mevcut | Hedef | Ölçüm Yöntemi | |--------|--------|-------|---------------| | [KPI] | [Başlangıç] | [Hedef] | [Nasıl ölçülecek] | ## Riskler ve Azaltmalar | Risk | Olasılık | Etki | Azaltma | |------|----------|------|---------| | [Risk] | [Y/O/D] | [Y/O/D] | [Eylem] | ## Sonraki Adımlar - [ ] [Acil sonraki eylem] - [ ] [Takip eylemi] - [ ] [Gözden geçirme tarihi] ``` ## Uygulanabilir Çerçeveler - AI Readiness Assessment - Automation ROI Calculator - Human-in-the-Loop Design - RAG Architecture - Agent Orchestration Patterns - Responsible AI Framework ## Temel Metrikler - Time Saved Per Task - Automation Rate - Error Reduction % - Cost Per AI Operation - User Adoption Rate - Output Quality Score ## En İyi Pratikler - Yüksek hacimli, düşük riskli görevlerle başla - Kritik çıktılar için her zaman insan incelemesi yap - Sadece doğruluğu değil, kazanılan zamanı ölç - Promptları kod gibi sürüm kontrol et - Sapma ve bozulma için aylık izleme yap ## Tamamlandıktan Sonra - Bu çıktı proje bağlamını veya önceliklerini değiştiriyorsa `memory.md`'yi güncelle - Yeniden kullanılabilir öğrenimleri `knowledge-nominations.md`'ye ekle - Takip eylemleri belirlendiyse, bunları `.claude/workspace/TaskBoard.md`'ye ekle - Ek çalışma gerekiyorsa ilgili becerileri öner
Related Skills
outsourcing-evaluation
Analyze and produce a outsourcing evaluation with structured process, quality checks, and system integration
martech-evaluation
Analyze and produce a martech evaluation with structured process, quality checks, and system integration
supplier-evaluation
Analyze and produce a supplier evaluation with structured process, quality checks, and system integration
ai-vendor-evaluation
Analyze and produce a ai vendor evaluation with structured process, quality checks, and system integration
trademark-search
Create a trademark search with structured process, quality checks, and system integration
term-sheet-negotiation
Create a term sheet negotiation with structured process, quality checks, and system integration
team-building
Create a team building with structured process, quality checks, and system integration
startup-metrics-dashboard
Analyze and produce a startup metrics dashboard with structured process, quality checks, and system integration
startup-legal-checklist
Analyze and produce a startup legal checklist with structured process, quality checks, and system integration
solopreneur-playbook
Solopreneur isletim kilavuzu — gelir kilometre taslari, haftalik rutin, arac yigini ve 90 gunluk eylem plani
side-project-validation
Create a side project validation with structured process, quality checks, and system integration
revenue-model-design
Create a revenue model design with structured process, quality checks, and system integration