概要
Veo 3.1 は Google DeepMind が開発した動画生成AI。テキストプロンプトから実写クオリティの動画をネイティブ音声付きで生成できる。Gemini API 経由で利用。
| 項目 | 内容 |
|---|
| 開発元 | Google DeepMind |
| API | Gemini API (google-genai SDK) |
| 料金 | Paid Preview(有料プレビュー) |
| 認証 | GEMINI_API_KEY |
利用可能なモデル
| モデル | 特徴 | 解像度 | 長さ |
|---|
veo-3.1-generate-preview | 最新・音声付き・最高品質 | 720p〜4K | 4〜8秒 |
veo-3.1-fast-generate-preview | 高速版 | 720p〜1080p | 4〜8秒 |
veo-2-generate-001 | 安定版 | 720p〜4K | 5〜8秒 |
できること
✅ 得意なこと
- テキストから動画生成 (Text-to-Video) — 自然言語で動画を記述
- 画像から動画生成 (Image-to-Video) — 静止画をアニメーション化
- ネイティブ音声生成 — セリフ・効果音・BGMを自動生成
- 動画延長 — 既存の動画を自然に延長
- 高解像度出力 — 720p / 1080p / 4K
- 物理シミュレーション — リアルな物理挙動を再現
- 参照画像によるスタイル制御 — 特定のビジュアルスタイルを維持
- 最初と最後のフレーム指定 — 開始・終了シーンを制御
⚠️ 制限事項
- 生成は非同期(ポーリングで完了を待つ。数分〜かかる場合あり)
- 有料プレビュー段階の可能性あり
- 最大動画長は8秒
実行コマンド
$py = "C:\ai_work\venv\Scripts\python.exe"
$script = "C:\ai_work\quartz-site\obsidian valut\06_Projects\01_Active\PJ-MultiModal-260226\scripts\generate_video.py"
# 基本
& $py $script "海辺の夕日のシネマティックな映像"
# 1080p + 8秒
& $py $script "都市の夜景タイムラプス" --resolution 1080p --duration 8
# 縦型動画(SNS用)
& $py $script "ネコが踊る面白い動画" --aspect 9:16
# 高速版モデル
& $py $script "プレビュー用クリップ" --model veo31-fast
# 除外プロンプト付き
& $py $script "自然の風景" --negative "人物, テキスト, ロゴ"
# 出力先指定
& $py $script "製品紹介" --output ./videos
オプション一覧
| オプション | 短縮 | 値 | デフォルト | 説明 |
|---|
--model | -m | veo31 / veo31-fast / veo2 | veo31 | モデル |
--aspect | -a | 16:9, 9:16 | 16:9 | アスペクト比 |
--resolution | -r | 720p, 1080p, 4k | 720p | 解像度 |
--duration | -d | 4, 5, 6, 8 | 6 | 動画の長さ(秒) |
--person | -p | allow_all, allow_adult, dont_allow | allow_adult | 人物生成 |
--negative | -n | テキスト | なし | 除外プロンプト |
--output | -o | パス | ./output | 出力ディレクトリ |
プロンプトのコツ
- シーンを詳細に描写 — カメラアングル、照明、雰囲気を記述
- セリフを含める —
'Hello!' と言う男性 のように引用符でセリフを指定(音声自動生成)
- カメラワーク指定 — 「ドリーイン」「パン」「クローズアップ」
- ネガティブプロンプト活用 — 不要な要素を
--negative で除外
関連リンク