voicebox-tts マニュアル

概要

pyttsx3 はPython用のオフラインTTS(テキスト読み上げ)ライブラリ。GPU不要で即座に実行可能。Windows では Microsoft の音声エンジン(SAPI5)を使用し、日本語ボイス「Haruka」に対応。

項目内容
ライブラリpyttsx3
料金完全無料
GPU不要(CPU のみで動作)
日本語✅ Microsoft Haruka Desktop
インストールpip install pyttsx3

できること

✅ 得意なこと

  • 即座に音声生成 — インストール後すぐに使える
  • GPU完全不要 — CPU のみで高速に動作
  • 日本語対応 — Windows 標準の日本語ボイス使用
  • 読み上げ速度調整--rate で速度コントロール
  • 音量調整--volume で音量コントロール
  • ボイス切替 — システムにインストール済みのボイスを選択可能
  • WAVファイル出力 — 直接ファイルに保存
  • オフライン動作 — ネットワーク接続不要

⚠️ 制限事項

  • 音声品質はシステムTTSに依存(AI生成音声ほど自然ではない)
  • 感情表現やイントネーション制御は限定的
  • 音声クローンは不可

PersonaPlex-7b との使い分け

条件pyttsx3PersonaPlex-7b
GPU不要❌(24GB必要)
即座に使える⚠️(セットアップ要)
音声品質標準高品質
感情表現限定的豊か
リアルタイム対話
開発テスト用✅ 最適オーバースペック
本番用ナレーション⚠️

実行コマンド

$py = "C:\ai_work\venv\Scripts\python.exe"
$script = "C:\ai_work\quartz-site\obsidian valut\06_Projects\01_Active\PJ-MultiModal-260226\scripts\generate_voice.py"
 
# 基本(日本語、Windows Haruka ボイス自動検出)
& $py $script "こんにちは、世界!テスト音声です。"
 
# 読み上げ速度変更(デフォルト: 150)
& $py $script "ゆっくり読み上げ" --rate 100
& $py $script "高速読み上げ" --rate 200
 
# 出力先指定
& $py $script "ナレーション" --output ./voices
 
# ボイス一覧表示
& $py $script --list-voices
 
# eSpeak NG エンジン(要インストール)
& $py $script "テスト" --engine espeak

オプション一覧

オプション短縮デフォルト説明
--engine-epyttsx3, espeak, personaplexpyttsx3TTSエンジン
--output-oパス./output出力ディレクトリ
--rate-r数値150読み上げ速度
--volume0.0〜1.01.0音量
--list-voicesフラグボイス一覧表示

Windows 日本語ボイスの追加方法

Windows で日本語ボイスが見つからない場合:

  1. 設定時刻と言語音声認識
  2. 音声の管理音声の追加
  3. 日本語 を選択してインストール
  4. 再起動後、--list-voices で確認

関連リンク