Nano Banana Pro マニュアル
概要
Nano Banana Pro は Google が開発した画像生成AI。Gemini API 経由で利用でき、テキストプロンプトから高品質な画像を生成する。日本語プロンプト対応、テキストレンダリング、キャラクター一貫性維持に強い。
| 項目 | 内容 |
|---|---|
| 開発元 | Google DeepMind |
| API | Gemini API (google-genai SDK) |
| 料金 | 無料枠あり(API使用量による従量課金) |
| 認証 | GEMINI_API_KEY |
利用可能なモデル
| モデル | 特徴 | 最大解像度 | 速度 |
|---|---|---|---|
gemini-2.5-flash-image | 高速生成・量産向け | 標準 | ⚡ 高速 |
gemini-3-pro-image-preview | 高品質・最終成果物向け | 最大4K | 🐢 やや遅い |
できること
✅ 得意なこと
- 日本語テキスト入り画像 — ロゴ、バナー、ポスターに日本語を正確にレンダリング
- キャラクター一貫性 — 同一キャラクターを複数画像で維持(参照画像14枚まで)
- テキストから画像生成 (Text-to-Image) — 自然言語で画像を記述
- 画像編集 (Image Editing) — 既存画像を指示に基づき変更
- マルチターン編集 — 会話形式で段階的に画像を修正
- 4K高解像度出力 — Pro モデルで 2K/4K 出力対応
- Google検索グラウンディング — リアルタイム情報を画像に反映
- 思考プロセス付き生成 — 複雑な指示を論理的に解釈
⚠️ 制限事項
- 音声・動画入力は非対応
- 出力画像枚数の正確な制御が難しい場合あり
- Flash モデルは入力画像3枚まで、Pro は14枚まで
実行コマンド
# Python venv 経由
$py = "C:\ai_work\venv\Scripts\python.exe"
$script = "C:\ai_work\quartz-site\obsidian valut\06_Projects\01_Active\PJ-MultiModal-260226\scripts\generate_image.py"
# 基本(Flash モデル・高速)
& $py $script "猫がコーヒーを飲んでいるイラスト"
# 高品質(Pro モデル)
& $py $script "企業ロゴデザイン" --model pro
# アスペクト比指定
& $py $script "YouTube サムネイル" --aspect 16:9
# 4K出力
& $py $script "壮大な風景写真" --model pro --size 4K
# 画像のみ(テキスト応答なし)
& $py $script "シンプルなアイコン" --image-only
# 出力先指定
& $py $script "商品写真" --output ./my_imagesオプション一覧
| オプション | 短縮 | 値 | デフォルト | 説明 |
|---|---|---|---|---|
--model | -m | flash / pro | flash | モデル選択 |
--aspect | -a | 1:1, 16:9, 9:16, 4:3, 3:4 | なし | アスペクト比 |
--size | -s | 2K, 4K | なし | 画像サイズ(proのみ) |
--output | -o | パス | ./output | 出力ディレクトリ |
--image-only | — | フラグ | OFF | テキスト応答を抑制 |
プロンプトのコツ
- 具体的に記述 — 「猫」→「白い長毛のペルシャ猫がソファの上で寝ている、暖かい照明」
- スタイル指定 — 「水彩画風」「フォトリアリスティック」「ミニマルなフラットデザイン」
- 色・構図を明示 — 「青と白を基調としたロゴ、中央配置、余白多め」
- テキスト入り — 先にテキスト内容を指定 →「“SALE 50% OFF” と書かれたバナー」
対応言語
EN, ar-EG, de-DE, es-MX, fr-FR, hi-IN, id-ID, it-IT, ja-JP, ko-KR, pt-BR, ru-RU, ua-UA, vi-VN, zh-CN
他ツールとの使い分け
Nano Banana Pro / Flash は第一選択だが、以下の場合は他ツールが適する:
| 状況 | 推奨ツール | 理由 |
|---|---|---|
| フォトリアルな人物・商品写真 | Flux 2 Pro | リアルさが業界No.1 |
| テキストが崩れた場合 | Ideogram 3.0 | テキスト精度No.1 |
| LoRA / 特定画風が必要 | ComfyUI / Forge | カスタムモデル対応 |
| 無料で試したい | Google Flow | Nano Banana 2ベース、無料 |
スクリプト:
- Flux:
PJ-MultiModal-260226/scripts/generate_image_flux.py - Ideogram:
PJ-MultiModal-260226/scripts/generate_image_ideogram.py
詳細: .agents/skills/image-generation/SKILL.md
関連リンク
- 公式ドキュメント
- Google AI Studio
- マルチモーダル運用ルール
- スクリプト:
PJ-MultiModal-260226/scripts/generate_image.py