offtoung/tsukuyomi-chan-vits

つくよみちゃん音声コーパスでファインチューニングした音声合成モデルです。事前学習にはReazonSpeechデータセットと、みんなで作るJSUTコーパスを用いました。詳しくは、https://zenn.dev/offtoung/articles/034d98bd397527 をご覧ください。下記の利用規約の範囲内でご自由に利用いただけます。 ※独自の日本語トークナイザを利用しているため、実行には ez-chat-llm パッケージ (https://github.com/offtoung/ez-chat-llm) 内の eztts モジュールが必要です。

モデル構造：

VITS (Conditional Variational Autoencoder with Adversarial Learning for End-to-End Text-to-Speech)

https://github.com/jaywalnut310/vits

学習データ:

ReazonSpeechデータセット (https://huggingface.co/datasets/reazon-research/reazonspeech)

みんなで作るJSUTコーパス (https://tyc.rei-yumesaki.net/material/minnade-jsut)

つくよみちゃんコーパス (https://tyc.rei-yumesaki.net/material/corpus/)

利用規約:

つくよみちゃんキャラクターライセンスならびにつくよみちゃんコーパスライセンスに準じます。

https://tyc.rei-yumesaki.net/about/terms/

https://tyc.rei-yumesaki.net/material/corpus/

本音声モデルから生成された音声を用いた動画等を公開する場合は、本モデルの名称あるいは本モデルを含むソフトウェアの名称 (ez-chat-llm) と音声モデル名をクレジットすることが必須です。また、音声合成モデルの改変・再配布を行う場合は、つくよみちゃんコーパスの利用規約 (https://tyc.rei-yumesaki.net/material/corpus/) に従うことが必須です。