日本語音響モデル(text→mel)。アクセント対応, 24kHz, 女性, JSUT。
バージョンは v<n>/ 配下に置く(現行 v1/model.pth.tar)。
v<n>/
v1/model.pth.tar
from nagi.speech import TTS TTS("jsut_female")("こんにちは。", "out.wav") # 初回に自動ダウンロード
-