概要
pyttsx3 はPython用のオフラインTTS(テキスト読み上げ)ライブラリ。GPU不要で即座に実行可能。Windows では Microsoft の音声エンジン(SAPI5)を使用し、日本語ボイス「Haruka」に対応。
| 項目 | 内容 |
|---|
| ライブラリ | pyttsx3 |
| 料金 | 完全無料 |
| GPU | 不要(CPU のみで動作) |
| 日本語 | ✅ Microsoft Haruka Desktop |
| インストール | pip install pyttsx3 |
できること
✅ 得意なこと
- 即座に音声生成 — インストール後すぐに使える
- GPU完全不要 — CPU のみで高速に動作
- 日本語対応 — Windows 標準の日本語ボイス使用
- 読み上げ速度調整 —
--rate で速度コントロール
- 音量調整 —
--volume で音量コントロール
- ボイス切替 — システムにインストール済みのボイスを選択可能
- WAVファイル出力 — 直接ファイルに保存
- オフライン動作 — ネットワーク接続不要
⚠️ 制限事項
- 音声品質はシステムTTSに依存(AI生成音声ほど自然ではない)
- 感情表現やイントネーション制御は限定的
- 音声クローンは不可
PersonaPlex-7b との使い分け
| 条件 | pyttsx3 | PersonaPlex-7b |
|---|
| GPU不要 | ✅ | ❌(24GB必要) |
| 即座に使える | ✅ | ⚠️(セットアップ要) |
| 音声品質 | 標準 | 高品質 |
| 感情表現 | 限定的 | 豊か |
| リアルタイム対話 | ❌ | ✅ |
| 開発テスト用 | ✅ 最適 | オーバースペック |
| 本番用ナレーション | ⚠️ | ✅ |
実行コマンド
$py = "C:\ai_work\venv\Scripts\python.exe"
$script = "C:\ai_work\quartz-site\obsidian valut\06_Projects\01_Active\PJ-MultiModal-260226\scripts\generate_voice.py"
# 基本(日本語、Windows Haruka ボイス自動検出)
& $py $script "こんにちは、世界!テスト音声です。"
# 読み上げ速度変更(デフォルト: 150)
& $py $script "ゆっくり読み上げ" --rate 100
& $py $script "高速読み上げ" --rate 200
# 出力先指定
& $py $script "ナレーション" --output ./voices
# ボイス一覧表示
& $py $script --list-voices
# eSpeak NG エンジン(要インストール)
& $py $script "テスト" --engine espeak
オプション一覧
| オプション | 短縮 | 値 | デフォルト | 説明 |
|---|
--engine | -e | pyttsx3, espeak, personaplex | pyttsx3 | TTSエンジン |
--output | -o | パス | ./output | 出力ディレクトリ |
--rate | -r | 数値 | 150 | 読み上げ速度 |
--volume | — | 0.0〜1.0 | 1.0 | 音量 |
--list-voices | — | フラグ | — | ボイス一覧表示 |
Windows 日本語ボイスの追加方法
Windows で日本語ボイスが見つからない場合:
- 設定 → 時刻と言語 → 音声認識
- 音声の管理 → 音声の追加
- 日本語 を選択してインストール
- 再起動後、
--list-voices で確認
関連リンク