voicebox-tts マニュアル

概要

pyttsx3 はPython用のオフラインTTS（テキスト読み上げ）ライブラリ。GPU不要で即座に実行可能。Windows では Microsoft の音声エンジン（SAPI5）を使用し、日本語ボイス「Haruka」に対応。

項目	内容
ライブラリ	`pyttsx3`
料金	完全無料
GPU	不要（CPU のみで動作）
日本語	✅ Microsoft Haruka Desktop
インストール	`pip install pyttsx3`

できること

✅ 得意なこと

即座に音声生成 — インストール後すぐに使える
GPU完全不要 — CPU のみで高速に動作
日本語対応 — Windows 標準の日本語ボイス使用
読み上げ速度調整 — --rate で速度コントロール
音量調整 — --volume で音量コントロール
ボイス切替 — システムにインストール済みのボイスを選択可能
WAVファイル出力 — 直接ファイルに保存
オフライン動作 — ネットワーク接続不要

⚠️ 制限事項

音声品質はシステムTTSに依存（AI生成音声ほど自然ではない）
感情表現やイントネーション制御は限定的
音声クローンは不可

PersonaPlex-7b との使い分け

条件	pyttsx3	PersonaPlex-7b
GPU不要	✅	❌（24GB必要）
即座に使える	✅	⚠️（セットアップ要）
音声品質	標準	高品質
感情表現	限定的	豊か
リアルタイム対話	❌	✅
開発テスト用	✅ 最適	オーバースペック
本番用ナレーション	⚠️	✅

実行コマンド

$py = "C:\ai_work\venv\Scripts\python.exe"
$script = "C:\ai_work\quartz-site\obsidian valut\06_Projects\01_Active\PJ-MultiModal-260226\scripts\generate_voice.py"
 
# 基本（日本語、Windows Haruka ボイス自動検出）
& $py $script "こんにちは、世界！テスト音声です。"
 
# 読み上げ速度変更（デフォルト: 150）
& $py $script "ゆっくり読み上げ" --rate 100
& $py $script "高速読み上げ" --rate 200
 
# 出力先指定
& $py $script "ナレーション" --output ./voices
 
# ボイス一覧表示
& $py $script --list-voices
 
# eSpeak NG エンジン（要インストール）
& $py $script "テスト" --engine espeak

オプション一覧

オプション	短縮	値	デフォルト	説明
`--engine`	`-e`	`pyttsx3`, `espeak`, `personaplex`	`pyttsx3`	TTSエンジン
`--output`	`-o`	パス	`./output`	出力ディレクトリ
`--rate`	`-r`	数値	`150`	読み上げ速度
`--volume`	—	0.0〜1.0	`1.0`	音量
`--list-voices`	—	フラグ	—	ボイス一覧表示

Windows 日本語ボイスの追加方法

Windows で日本語ボイスが見つからない場合:

設定 → 時刻と言語 → 音声認識
音声の管理 → 音声の追加
日本語 を選択してインストール
再起動後、--list-voices で確認

社内ポータル

エクスプローラー

pyttsx3 voicebox-tts マニュアル

voicebox-tts マニュアル

概要

できること

✅ 得意なこと

⚠️ 制限事項

PersonaPlex-7b との使い分け

実行コマンド

オプション一覧

Windows 日本語ボイスの追加方法

関連リンク

グラフビュー

目次

バックリンク