litagin commited on
Commit
7af50fb
1 Parent(s): 291528b

Update README.md

Browse files
Files changed (1) hide show
  1. README.md +12 -13
README.md CHANGED
@@ -1,8 +1,8 @@
1
- # Style-Bert-VITS2 あみたろモデル
2
 
3
- - [あみたろの声素材工房](https://amitaro.net/)の[あみたろのライブ配信音声](https://amitaro.net/voice/livevoice/)で公開されているライブ配信音声を利用して学習した、Style-Bert-VITS2のモデルです(ver 2.5.0で学習)
4
- - あみたろ様には事前に許可を得て学習して、公開の許可も頂いております
5
- - スタイルは次の配布時のシリーズ01 ~ 04に応じた4スタイルです
6
 
7
  注: このモデルはlitagin個人が提供するものであり、あみたろの声素材工房公式・あみたろ様本人によって学習されたモデルではありません。
8
 
@@ -20,10 +20,10 @@
20
 
21
  ### クレジット表記
22
 
23
- 生成音声を公開する際は(媒体は問わない)、必ず分かりやすい場所に `あみたろの声素材工房 (https://amitaro.net/)` を含むクレジット表記を記載してください。
24
 
25
  クレジット表記例:
26
- - `Style-BertVITS2モデル: あみたろ、あみたろの声素材工房 (https://amitaro.net/)`
27
 
28
  ### モデルマージ
29
 
@@ -31,12 +31,11 @@
31
  - 本モデルを別モデルとマージできるのは、その別モデル作成の際に学習に使われた声の権利者が許諾している場合に限る
32
  - あみたろの声の特徴が残っている場合(マージの割合が25%以上の場合)は、その利用は[あみたろの声素材工房様の規約](https://amitaro.net/voice/voice_rule/)の範囲内に限定され、そのモデルに関してもこの規約が適応される
33
 
34
-
35
  ## 学習詳細
36
 
37
- - 学習元は[あみたろのライブ配信音声](https://amitaro.net/voice/livevoice/)にて配布されている音声ファイル
38
- - SBV2の内蔵のスライス・書き起こしツールでデータセットを作成(手動ノイズ除去や書き起こし修正はしていません)
39
- - 合計約1万ファイル18時間程度
40
- - 配信音声のうち01シリーズがかなりの割合をしめ、疑問文やつぶやき多めのため、影響を少し抑えるため、最初の50kステップ程度までは01-04で、その後は01を除いた02-04のファイルで学習
41
- - バッチサイズ4にて100エポック161kステップまで学習し、そこからよさそうな46エポック87kステップを選択
42
-
 
1
+ # Style-Bert-VITS2 小春音アミ(CV: あみたろ)モデル
2
 
3
+ - [あみたろの声素材工房](https://amitaro.net/)で公開されているコーパス音源を利用して学習した、Style-Bert-VITS2のモデルです(ver 2.5.0で学習)
4
+ - スタイルは次の6スタイル: Neutral(デフォルト、平均スタイル)・るんるん・ささやきA(無声ささやき)・ささやきB(有声ささやき)・よふかし・ノーマル
5
+ - スタイルの強さに関して敏感なモデルなので、強さは1くらいがよく、大きくしすぎると声が崩壊するので注意ください
6
 
7
  注: このモデルはlitagin個人が提供するものであり、あみたろの声素材工房公式・あみたろ様本人によって学習されたモデルではありません。
8
 
 
20
 
21
  ### クレジット表記
22
 
23
+ 生成音声を公開する際は(媒体は問わない)、必ず分かりやすい場所に `あみたろの声素材工房 (https://amitaro.net/)` の声を元にした音声モデルを使用していることが分かるようなクレジット表記を記載してください。
24
 
25
  クレジット表記例:
26
+ - `Style-BertVITS2モデル: 小春音アミ、あみたろの声素材工房 (https://amitaro.net/)`
27
 
28
  ### モデルマージ
29
 
 
31
  - 本モデルを別モデルとマージできるのは、その別モデル作成の際に学習に使われた声の権利者が許諾している場合に限る
32
  - あみたろの声の特徴が残っている場合(マージの割合が25%以上の場合)は、その利用は[あみたろの声素材工房様の規約](https://amitaro.net/voice/voice_rule/)の範囲内に限定され、そのモデルに関してもこの規約が適応される
33
 
 
34
  ## 学習詳細
35
 
36
+ - [あみたろのコーパス読み上げ音声一覧](https://amitaro.net/voice/corpus-list/)にて配布されている以下の音声ファイルとそのコーパス文を利用
37
+ - ITAコーパス(ノーマル・るんるん・よふかし・ささやきA・ささやきB)
38
+ - MANAコーパス(ノーマル・るんるん・よふかし・ささやきA・ささやきB)
39
+ - あみたろコーパス(ノーマルスタイルへ使用)
40
+ - 合計約2700ファイル2時間半
41
+ - バッチサイズ3にて100エポック学習し、比較して良さげな途中の60エポック54kステップのものを使用