Nano Banana Pro マニュアル

概要

Nano Banana Pro は Google が開発した画像生成AI。Gemini API 経由で利用でき、テキストプロンプトから高品質な画像を生成する。日本語プロンプト対応、テキストレンダリング、キャラクター一貫性維持に強い。

項目内容
開発元Google DeepMind
APIGemini API (google-genai SDK)
料金無料枠あり(API使用量による従量課金)
認証GEMINI_API_KEY

利用可能なモデル

モデル特徴最大解像度速度
gemini-2.5-flash-image高速生成・量産向け標準⚡ 高速
gemini-3-pro-image-preview高品質・最終成果物向け最大4K🐢 やや遅い

できること

✅ 得意なこと

  • 日本語テキスト入り画像 — ロゴ、バナー、ポスターに日本語を正確にレンダリング
  • キャラクター一貫性 — 同一キャラクターを複数画像で維持(参照画像14枚まで)
  • テキストから画像生成 (Text-to-Image) — 自然言語で画像を記述
  • 画像編集 (Image Editing) — 既存画像を指示に基づき変更
  • マルチターン編集 — 会話形式で段階的に画像を修正
  • 4K高解像度出力 — Pro モデルで 2K/4K 出力対応
  • Google検索グラウンディング — リアルタイム情報を画像に反映
  • 思考プロセス付き生成 — 複雑な指示を論理的に解釈

⚠️ 制限事項

  • 音声・動画入力は非対応
  • 出力画像枚数の正確な制御が難しい場合あり
  • Flash モデルは入力画像3枚まで、Pro は14枚まで

実行コマンド

# Python venv 経由
$py = "C:\ai_work\venv\Scripts\python.exe"
$script = "C:\ai_work\quartz-site\obsidian valut\06_Projects\01_Active\PJ-MultiModal-260226\scripts\generate_image.py"
 
# 基本(Flash モデル・高速)
& $py $script "猫がコーヒーを飲んでいるイラスト"
 
# 高品質(Pro モデル)
& $py $script "企業ロゴデザイン" --model pro
 
# アスペクト比指定
& $py $script "YouTube サムネイル" --aspect 16:9
 
# 4K出力
& $py $script "壮大な風景写真" --model pro --size 4K
 
# 画像のみ(テキスト応答なし)
& $py $script "シンプルなアイコン" --image-only
 
# 出力先指定
& $py $script "商品写真" --output ./my_images

オプション一覧

オプション短縮デフォルト説明
--model-mflash / proflashモデル選択
--aspect-a1:1, 16:9, 9:16, 4:3, 3:4なしアスペクト比
--size-s2K, 4Kなし画像サイズ(proのみ)
--output-oパス./output出力ディレクトリ
--image-onlyフラグOFFテキスト応答を抑制

プロンプトのコツ

  1. 具体的に記述 — 「猫」→「白い長毛のペルシャ猫がソファの上で寝ている、暖かい照明」
  2. スタイル指定 — 「水彩画風」「フォトリアリスティック」「ミニマルなフラットデザイン」
  3. 色・構図を明示 — 「青と白を基調としたロゴ、中央配置、余白多め」
  4. テキスト入り — 先にテキスト内容を指定 →「“SALE 50% OFF” と書かれたバナー」

対応言語

EN, ar-EG, de-DE, es-MX, fr-FR, hi-IN, id-ID, it-IT, ja-JP, ko-KR, pt-BR, ru-RU, ua-UA, vi-VN, zh-CN


他ツールとの使い分け

Nano Banana Pro / Flash は第一選択だが、以下の場合は他ツールが適する:

状況推奨ツール理由
フォトリアルな人物・商品写真Flux 2 Proリアルさが業界No.1
テキストが崩れた場合Ideogram 3.0テキスト精度No.1
LoRA / 特定画風が必要ComfyUI / Forgeカスタムモデル対応
無料で試したいGoogle FlowNano Banana 2ベース、無料

スクリプト:

  • Flux: PJ-MultiModal-260226/scripts/generate_image_flux.py
  • Ideogram: PJ-MultiModal-260226/scripts/generate_image_ideogram.py

詳細: .agents/skills/image-generation/SKILL.md


関連リンク