Update README_JP.md
Browse files- README_JP.md +6 -4
README_JP.md
CHANGED
@@ -151,18 +151,20 @@ pip install -r requirements.txt
|
|
151 |
|
152 |
***入力が1回の推論に対して長すぎます。Longform推論機能を使用してください。これは特に、Tsumugi(仮称)チェックポイントでは問題になります。mLSTMレイヤーのコンテキスト長が512に制限されているため、Longform機能を使用しない限り、約10秒以上の音声を生成できません。ただし、他のチェックポイントではこれは問題にはなりません。Longform アルゴリズムのおかげで、出力の長さに理論的な制限はありません。***
|
153 |
|
154 |
-
|
155 |
|
156 |
***2で述べたことがすべて当てはまります。スタイルベクトルが適切かどうかを確認してください。ただし、一般的に非常に短い入力の使用は推奨されません。***
|
157 |
|
158 |
-
|
159 |
|
160 |
***グラジエントが爆発しているのかもしれません。クリッピングを試すか、バッチサイズが大すぎる可能性があります。それでも解決しない場合は、オリジナルのDPスクリプトを使って最初の数エポックを事前訓練することをお勧めします。または、完全にDPを使用してください。***
|
161 |
|
162 |
-
|
|
|
|
|
163 |
***全部ランダムでマッピングされていますので、実際の人物やロールなどとは一切関係していません。***
|
164 |
|
165 |
-
|
166 |
```
|
167 |
saoshiant@protonmail.com
|
168 |
```
|
|
|
151 |
|
152 |
***入力が1回の推論に対して長すぎます。Longform推論機能を使用してください。これは特に、Tsumugi(仮称)チェックポイントでは問題になります。mLSTMレイヤーのコンテキスト長が512に制限されているため、Longform機能を使用しない限り、約10秒以上の音声を生成できません。ただし、他のチェックポイントではこれは問題にはなりません。Longform アルゴリズムのおかげで、出力の長さに理論的な制限はありません。***
|
153 |
|
154 |
+
4. 短い入力が印象的ではない:
|
155 |
|
156 |
***2で述べたことがすべて当てはまります。スタイルベクトルが適切かどうかを確認してください。ただし、一般的に非常に短い入力の使用は推奨されません。***
|
157 |
|
158 |
+
5. 2段階目の訓練でNaNが発生:
|
159 |
|
160 |
***グラジエントが爆発しているのかもしれません。クリッピングを試すか、バッチサイズが大すぎる可能性があります。それでも解決しない場合は、オリジナルのDPスクリプトを使って最初の数エポックを事前訓練することをお勧めします。または、完全にDPを使用してください。***
|
161 |
|
162 |
+
6. Kotodam inferenceにあるスピーカーさんの名前について;
|
163 |
+
|
164 |
+
|
165 |
***全部ランダムでマッピングされていますので、実際の人物やロールなどとは一切関係していません。***
|
166 |
|
167 |
+
7. ご質問があった場合は、遠慮なく教えてください。
|
168 |
```
|
169 |
saoshiant@protonmail.com
|
170 |
```
|