---
license: mit
datasets:
- ThePioneer/Ver0_voice_dataset
language:
- en
- ja
- zh
tags:
- music
- voice
---

アニメ声のようなわざとらしい声でもなく、ボカロなどのソフトを使ったいかにも合成の音声でもなく、クラスに一人くらいいそうな、自然で親しみやすい美少女の声を…。

本モデルは、そういうコンセプトで開発された[So-vits-svc 4.0](https://github.com/svc-develop-team/so-vits-svc)のモデルです。

一次音声は私自身の肉声から合成し、その素材をElevenLabsで1時間程度まで水増しし、[水増しした音声データセット](https://huggingface.co/datasets/ThePioneer/Ver0_voice_dataset)を学習させました。

innnky氏がG_0.pth、D_0.pthのあったrepoを削除してしまったようなので、学習用のベースとなった[G_0.pth](https://huggingface.co/ThePioneer/NaturalGirlyVoice/blob/main/G_0.pth)、[D_0.pth](https://huggingface.co/ThePioneer/NaturalGirlyVoice/blob/main/D_0.pth)および[hubertのチェックポイント](https://huggingface.co/ThePioneer/NaturalGirlyVoice/blob/main/checkpoint_best_legacy_500.pt)も同梱しています。

また、推論や学習ができるように、[notebook](https://huggingface.co/ThePioneer/NaturalGirlyVoice/blob/main/sovits4_0_for_training_and_inference.ipynb)も同梱しています。

## サンプル