NaturalGirlyVoice / README.md
ThePioneer's picture
Update README.md
ccd1338
metadata
license: mit
datasets:
  - ThePioneer/Ver0_voice_dataset
language:
  - en
  - ja
  - zh
tags:
  - music
  - voice

アニメ声のようなわざとらしい声でもなく、ボカロなどのソフトを使ったいかにも合成の音声でもなく、クラスに一人くらいいそうな、自然で親しみやすい美少女の声を…。

本モデルは、そういうコンセプトで開発されたSo-vits-svc 4.0のモデルです。

一次音声は私自身の肉声から合成し、その素材をElevenLabsで1時間程度まで水増しし、水増しした音声データセットを学習させました。

innnky氏がG_0.pth、D_0.pthのあったrepoを削除してしまったようなので、学習用のベースとなったG_0.pthD_0.pthおよびhubertのチェックポイントも同梱しています。

また、推論や学習ができるように、notebookも同梱しています。

サンプル