Veo 3.1 マニュアル

概要

Veo 3.1 は Google DeepMind が開発した動画生成AI。テキストプロンプトから実写クオリティの動画をネイティブ音声付きで生成できる。Gemini API 経由で利用。

項目内容
開発元Google DeepMind
APIGemini API (google-genai SDK)
料金Paid Preview(有料プレビュー)
認証GEMINI_API_KEY

利用可能なモデル

モデル特徴解像度長さ
veo-3.1-generate-preview最新・音声付き・最高品質720p〜4K4〜8秒
veo-3.1-fast-generate-preview高速版720p〜1080p4〜8秒
veo-2-generate-001安定版720p〜4K5〜8秒

できること

✅ 得意なこと

  • テキストから動画生成 (Text-to-Video) — 自然言語で動画を記述
  • 画像から動画生成 (Image-to-Video) — 静止画をアニメーション化
  • ネイティブ音声生成 — セリフ・効果音・BGMを自動生成
  • 動画延長 — 既存の動画を自然に延長
  • 高解像度出力 — 720p / 1080p / 4K
  • 物理シミュレーション — リアルな物理挙動を再現
  • 参照画像によるスタイル制御 — 特定のビジュアルスタイルを維持
  • 最初と最後のフレーム指定 — 開始・終了シーンを制御

⚠️ 制限事項

  • 生成は非同期(ポーリングで完了を待つ。数分〜かかる場合あり)
  • 有料プレビュー段階の可能性あり
  • 最大動画長は8秒

実行コマンド

$py = "C:\ai_work\venv\Scripts\python.exe"
$script = "C:\ai_work\quartz-site\obsidian valut\06_Projects\01_Active\PJ-MultiModal-260226\scripts\generate_video.py"
 
# 基本
& $py $script "海辺の夕日のシネマティックな映像"
 
# 1080p + 8秒
& $py $script "都市の夜景タイムラプス" --resolution 1080p --duration 8
 
# 縦型動画(SNS用)
& $py $script "ネコが踊る面白い動画" --aspect 9:16
 
# 高速版モデル
& $py $script "プレビュー用クリップ" --model veo31-fast
 
# 除外プロンプト付き
& $py $script "自然の風景" --negative "人物, テキスト, ロゴ"
 
# 出力先指定
& $py $script "製品紹介" --output ./videos

オプション一覧

オプション短縮デフォルト説明
--model-mveo31 / veo31-fast / veo2veo31モデル
--aspect-a16:9, 9:1616:9アスペクト比
--resolution-r720p, 1080p, 4k720p解像度
--duration-d4, 5, 6, 86動画の長さ(秒)
--person-pallow_all, allow_adult, dont_allowallow_adult人物生成
--negative-nテキストなし除外プロンプト
--output-oパス./output出力ディレクトリ

プロンプトのコツ

  1. シーンを詳細に描写 — カメラアングル、照明、雰囲気を記述
  2. セリフを含める'Hello!' と言う男性 のように引用符でセリフを指定(音声自動生成)
  3. カメラワーク指定 — 「ドリーイン」「パン」「クローズアップ」
  4. ネガティブプロンプト活用 — 不要な要素を --negative で除外

関連リンク