nanobanana-image
Nano Banana (Google Gemini API) を使って画像を生成・編集するスキル。「画像を生成して」「イラストを作って」「○○の絵を描いて」「画像を作成」「この画像を編集して」「この画像をもとに○○を作って」「generate an image」「create a picture」「edit this image」などの依頼があった場合に使用。テキストからの生成、参照画像からの生成、画像編集、Google検索グラウンディングによる最新情報を反映した画像生成に対応。「最新の○○」「トレンドを反映」「リアルタイム情報」といった依頼にも対応可能。
Best use case
nanobanana-image is best used when you need a repeatable AI agent workflow instead of a one-off prompt.
Nano Banana (Google Gemini API) を使って画像を生成・編集するスキル。「画像を生成して」「イラストを作って」「○○の絵を描いて」「画像を作成」「この画像を編集して」「この画像をもとに○○を作って」「generate an image」「create a picture」「edit this image」などの依頼があった場合に使用。テキストからの生成、参照画像からの生成、画像編集、Google検索グラウンディングによる最新情報を反映した画像生成に対応。「最新の○○」「トレンドを反映」「リアルタイム情報」といった依頼にも対応可能。
Teams using nanobanana-image should expect a more consistent output, faster repeated execution, less prompt rewriting.
When to use this skill
- You want a reusable workflow that can be run more than once with consistent structure.
When not to use this skill
- You only need a quick one-off answer and do not need a reusable workflow.
- You cannot install or maintain the underlying files, dependencies, or repository context.
Installation
Claude Code / Cursor / Codex
Manual Installation
- Download SKILL.md from GitHub
- Place it in
.claude/skills/nanobanana-image/SKILL.mdinside your project - Restart your AI agent — it will auto-discover the skill
How nanobanana-image Compares
| Feature / Agent | nanobanana-image | Standard Approach |
|---|---|---|
| Platform Support | Not specified | Limited / Varies |
| Context Awareness | High | Baseline |
| Installation Complexity | Unknown | N/A |
Frequently Asked Questions
What does this skill do?
Nano Banana (Google Gemini API) を使って画像を生成・編集するスキル。「画像を生成して」「イラストを作って」「○○の絵を描いて」「画像を作成」「この画像を編集して」「この画像をもとに○○を作って」「generate an image」「create a picture」「edit this image」などの依頼があった場合に使用。テキストからの生成、参照画像からの生成、画像編集、Google検索グラウンディングによる最新情報を反映した画像生成に対応。「最新の○○」「トレンドを反映」「リアルタイム情報」といった依頼にも対応可能。
Where can I find the source code?
You can find the source code on GitHub using the link provided at the top of the page.
SKILL.md Source
# Nano Banana Image Generation
Google Gemini APIを使用した画像生成・編集スキル。
## 前提条件
環境変数 `NANOBANANA_SKILL_GOOGLE_API_KEY` が設定されていること。
未設定の場合は以下を案内:
1. [Google AI Studio](https://aistudio.google.com/) でAPIキーを取得
2. `~/.claude/settings.json` に追加:
```json
{
"env": {
"NANOBANANA_SKILL_GOOGLE_API_KEY": "取得したAPIキー"
}
}
```
## モデル
| モデル | ID | 特徴 |
|--------|-----|------|
| ノーマル | `flash` | 高速・効率重視 |
| Nano Banana Pro | `pro` (デフォルト) | 高品質・推論強化・4K対応 |
## ワークフロー
画像生成後は `open` コマンドでプレビューを提案:
```bash
python scripts/generate_image.py "プロンプト" -o image.png && open image.png
```
## 基本コマンド
```bash
# テキストから画像生成
python scripts/generate_image.py "夕焼けのビーチで遊ぶ犬" -o dog.png
# 参照画像から生成(image-to-image)
python scripts/generate_image.py "この画像をアニメ風にして" -i reference.png -o anime.png
# 複数参照画像
python scripts/generate_image.py "これらを組み合わせてロゴを作成" -i logo1.png -i logo2.png -o new_logo.png
# Google検索グラウンディング(最新情報を反映)
python scripts/generate_image.py "2024年の最新ファッショントレンド" --search -o fashion.png
# オプション指定
python scripts/generate_image.py "横長の風景" --aspect 16:9 -o landscape.png
python scripts/generate_image.py "詳細な建築物" --size 4K -o building.png
python scripts/generate_image.py "かわいい猫" -n 3 -o cat.png # → cat_1.png, cat_2.png, cat_3.png
```
## オプション一覧
| オプション | 説明 |
|------------|------|
| `-o, --output` | 出力ファイルパス(デフォルト: output.png) |
| `-m, --model` | モデル選択: `flash` / `pro`(デフォルト: pro) |
| `-i, --input` | 参照画像パス(複数指定可) |
| `-n, --count` | 生成する画像の数 |
| `--aspect` | アスペクト比: 1:1, 16:9, 9:16, 4:3, 3:4 等 |
| `--size` | 画像サイズ: 1K, 2K, 4K |
| `--search` | Google検索グラウンディングを使用(最新情報を反映) |
## プロンプトの基本
- **具体的に**: 「猫」→「窓辺で日向ぼっこする白い猫」
- **スタイル指定**: 「写実的」「アニメ風」「油絵風」「ミニマリスト」
- **構図指定**: 「クローズアップ」「俯瞰」「正面から」
- **編集時**: 「〇〇を追加して」「〇〇を削除して」「〇〇を変更して」
**詳細なプロンプトガイド**: [references/prompt-guide.md](references/prompt-guide.md)
- フォトリアリスティック、イラスト/ステッカー、テキスト含有、商品写真、ミニマルデザインの5パターン
## エラー対応
| エラー | 対処 |
|--------|------|
| 401 Unauthorized | APIキーを確認・再取得 |
| 429 Rate Limit | 少し待って再試行 |
| コンテンツポリシー違反 | プロンプトを修正(暴力・成人向け等を避ける) |
| 画像が生成されない | プロンプトをより具体的に |Related Skills
all-images-ai-automation
Automate All Images AI tasks via Rube MCP (Composio). Always search tools first for current schemas.
ai-image-generator
使用 ModelScope 等平台生成 AI 图像。当用户需要生成图像、设计图标、创建角色立绘,或需要帮助编写 AI 绘画提示词时使用此技能。支持直接生成图像和仅优化提示词两种模式。
xhs-images
Xiaohongshu (Little Red Book) infographic series generator with multiple style options. Breaks down content into 1-10 cartoon-style infographics. Use when user asks to create "小红书图片", "XHS images", or "RedNote infographics".
x-image-cards
Create X/Twitter cards that look like images, not marketing banners. Use when asked to "create OG images", "set up X cards", "make social cards", or "twitter card without text".
wiro-image-fill
Generate missing or placeholder images in a project by calling the Wiro image generation API, saving assets under public/assets generated folders, and producing a JSON mapping. Use when you see empty img src, placeholder.png, or other image gaps that need real assets.
seedream-image-generator
Generate images using the Doubao SeeDream API based on text prompts. Use this skill when users request AI-generated images, artwork, illustrations, or visual content creation. The skill handles API calls, downloads generated images to the project's /pic folder, and supports batch generation of up to 4 sequential images.
placeholder-images
Rule to use placekitten.com for placeholder images in seed data.
og-image-generator
Generate and optimize Open Graph meta images for social media sharing. Use this skill when building web applications that need dynamic OG image generation with support for Vercel's @vercel/og library, pre-generated image storage, and social media optimization (Twitter Cards, Facebook, LinkedIn). Handles dynamic routes, performance optimization, and includes best practices for crawler compatibility and testing.
nanobanana-ppt-skills
AI-powered PPT generation with document analysis and styled images
nano-image-generate
Generate images using Nano Banana (Flash) or Nano Banana Pro. Use 'flash' for speed/efficiency and 'pro' for high quality, text rendering, and complex prompt adherence. Triggers include 'generate image', 'create logo', 'fast image', 'high quality image'.
imagen
AI image generation skill powered by Google Gemini, enabling seamless visual content creation for UI placeholders, documentation, and design assets.
imagekit-io-automation
Automate Imagekit IO tasks via Rube MCP (Composio). Always search tools first for current schemas.