litagin
/

style_bert_vits2_jvnv

Model card Files Files and versions Community

style_bert_vits2_jvnv / README.md

litagin's picture

Update README.md

b8e41aa verified 6 months ago

|

raw history blame

No virus

1.38 kB

	---
	license: cc-by-sa-4.0
	language:
	- ja
	- zh
	- en
	pipeline_tag: text-to-speech
	---
	# このモデルはStyle-Bert-VITS2のver 1.3でのアクセント等の大幅修正前に学習されているので、アクセント等がおかしい場合があります。現在学習し直しています。

	[Style-Bert-VITS2](https://github.com/litagin02/Style-Bert-VITS2)の[JVNVコーパス](https://sites.google.com/site/shinnosuketakamichi/research-topics/jvnv_corpus)で学習したモデルファイル（と音声合成に必要ないくつか）です。

	- スタイル: JVNVコーパスの分類と同じ、Angry, Disgust, Fear, Happy, Sad, Surpriseと、平均のNeutralの7つです(Neutralといいつつかなり入力文章に応じた感情が出ます)。
	- [オンラインデモ](https://huggingface.co/spaces/litagin/Style-Bert-VITS2-JVNV)


	ライセンスはJVNVコーパスのcc-by-sa-4.0を引き継ぎます。

	~~TODO?: JVNVコーパスは非言語発話が冒頭にある場合が多いのが原因で、合成した場合に最初の方の音素長がバグることが多い。非言語発話を削除して学習し直す？かもしれない？~~

	↑非言語を除去したものに置き換えました。音素長は安定したけど笑い声とかは下手になった、がこっちのverのほうが使いやすそうなので置き換えました。