File size: 951 Bytes
163c1f9
 
24debfd
 
 
 
231dd79
163c1f9
24debfd
1ec4625
24debfd
b73b36e
 
24debfd
 
4089f6f
 
 
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
---
license: cc-by-sa-4.0
language:
- ja
- zh
- en
pipeline_tag: text-to-speech
---

[Style-Bert-VITS2](https://github.com/litagin02/Style-Bert-VITS2)の[JVNVコーパス](https://sites.google.com/site/shinnosuketakamichi/research-topics/jvnv_corpus)で学習したモデルファイル(と音声合成に必要ないくつか)です。

- スタイル: JVNVコーパスの分類と同じ、Angry, Disgust, Fear, Happy, Sad, Surpriseと、平均のNeutralの7つです(Neutralといいつつかなり入力文章に応じた感情が出ます)。
- [オンラインデモ](https://huggingface.co/spaces/litagin/Style-Bert-VITS2-JVNV)


ライセンスはJVNVコーパスのcc-by-sa-4.0を引き継ぎます。

TODO?: JVNVコーパスは非言語発話が冒頭にある場合が多いのが原因で、合成した場合に最初の方の音素長がバグることが多い。非言語発話を削除して学習し直す?かもしれない?