diff --git a/.gitattributes b/.gitattributes new file mode 100644 index 0000000000000000000000000000000000000000..6c7b6cee16e1a52e3dfee16cd4a8b4db2ab8a6ed --- /dev/null +++ b/.gitattributes @@ -0,0 +1,42 @@ +*.7z filter=lfs diff=lfs merge=lfs -text +*.arrow filter=lfs diff=lfs merge=lfs -text +*.bin filter=lfs diff=lfs merge=lfs -text +*.bz2 filter=lfs diff=lfs merge=lfs -text +*.ckpt filter=lfs diff=lfs merge=lfs -text +*.ftz filter=lfs diff=lfs merge=lfs -text +*.gz filter=lfs diff=lfs merge=lfs -text +*.h5 filter=lfs diff=lfs merge=lfs -text +*.joblib filter=lfs diff=lfs merge=lfs -text +*.lfs.* filter=lfs diff=lfs merge=lfs -text +*.mlmodel filter=lfs diff=lfs merge=lfs -text +*.model filter=lfs diff=lfs merge=lfs -text +*.msgpack filter=lfs diff=lfs merge=lfs -text +*.npy filter=lfs diff=lfs merge=lfs -text +*.npz filter=lfs diff=lfs merge=lfs -text +*.onnx filter=lfs diff=lfs merge=lfs -text +*.ot filter=lfs diff=lfs merge=lfs -text +*.parquet filter=lfs diff=lfs merge=lfs -text +*.pb filter=lfs diff=lfs merge=lfs -text +*.pickle filter=lfs diff=lfs merge=lfs -text +*.pkl filter=lfs diff=lfs merge=lfs -text +*.pt filter=lfs diff=lfs merge=lfs -text +*.pth filter=lfs diff=lfs merge=lfs -text +*.rar filter=lfs diff=lfs merge=lfs -text +*.safetensors filter=lfs diff=lfs merge=lfs -text +saved_model/**/* filter=lfs diff=lfs merge=lfs -text +*.tar.* filter=lfs diff=lfs merge=lfs -text +*.tar filter=lfs diff=lfs merge=lfs -text +*.tflite filter=lfs diff=lfs merge=lfs -text +*.tgz filter=lfs diff=lfs merge=lfs -text +*.wasm filter=lfs diff=lfs merge=lfs -text +*.xz filter=lfs diff=lfs merge=lfs -text +*.zip filter=lfs diff=lfs merge=lfs -text +*.zst filter=lfs diff=lfs merge=lfs -text +*tfevents* filter=lfs diff=lfs merge=lfs -text + +# Audio +*.mp3 filter=lfs diff=lfs merge=lfs -text +*.wav filter=lfs diff=lfs merge=lfs -text + +# Index +*.index filter=lfs diff=lfs merge=lfs -text \ No newline at end of file diff --git a/.gitignore b/.gitignore new file mode 100644 index 0000000000000000000000000000000000000000..6f66c74b0e21f83535e723a3886b6d5838811278 --- /dev/null +++ b/.gitignore @@ -0,0 +1 @@ +*.zip \ No newline at end of file diff --git a/README.md b/README.md new file mode 100644 index 0000000000000000000000000000000000000000..4bafc593bec3b5d69c25b69406bf3a14483e769b --- /dev/null +++ b/README.md @@ -0,0 +1,176 @@ +--- +tags: +- rvc +pipeline_tag: audio-to-audio +license: creativeml-openrail-m +language: +- ja +--- + +# RVC okiba (随時モデルを追加しています: More models are uploaded regularly) + +しばらく忙しいので更新停止中です(I'm busy now, so currently update is stopped.) + +[人気投票・アンケートへご協力ください (Please participate in the popularity poll and survey.)](https://docs.google.com/forms/d/e/1FAIpQLSdUTaFcpNErkSs58e7zO9MtlC9F1LElI-ODjOX5LZEtYoMAIg/viewform?usp=sf_link) + +
+English + +[**Text-to-Speech Demo here!**](https://huggingface.co/spaces/litagin/rvc_okiba_TTS) + +[Update History](https://huggingface.co/litagin/rvc_okiba/commits/main) + +A collection of [RVC v2](https://github.com/RVC-Project/Retrieval-based-Voice-Conversion-WebUI) models (with index files) trained using approximately 1 hour (per model) of high-quality Japanese voice data of *moe* characters. + +**Samples can be found in the table below.** ([*Japanese voice-change samples here*](vc-samples.md)) +- There are currently **63** girl voice models (A-K3) and 6 male voice models (man-A - man-F) (Will be updated regularly, and often epochs are updated to better version) +- The model names are unordered and do not carry any meaning. +- Epochs are adjusted for voice-changing purpose, but singing is maybe possible as samples at some quality. + +*Please use the data provided by this model at your own risk.* + +--- +
+ +# RVC置き場 + +[モデルのダウンロードはこちらから](https://huggingface.co/litagin/rvc_okiba/tree/main/models) + +[Text-to-Speech(テキストからの音声合成)のデモはこちら](https://huggingface.co/spaces/litagin/rvc_okiba_TTS) + +[更新履歴](https://huggingface.co/litagin/rvc_okiba/commits/main) + +[RVC v2](https://github.com/RVC-Project/Retrieval-based-Voice-Conversion-WebUI)のモデル集(index付き)。 +[**ボイチェンで実際に使用したサンプル(男声から変換)はこちらから**](vc-samples.md)、また**通常サンプルは下の表から聴けます**。 + +- 現在女性**63**モデル(A-K3)に男性6モデル(man-A - man-F)(随時更新します、またエポック数をたまにより良いバージョンに置き換えることもあります) +- モデル名は順不同で意味はありません +- 主にボイチェン用途を想定にエポックの調整をしています(が歌唱もサンプルの通りある程度はできると思われます) + +
+学習詳細 + +- 学習データ: 高品質な日本語発話データ、歌は無し。1ファイルの長さは4秒以上~多くても10数秒程度、無音カットやらの前処理はしていません。 +- データセット量: 1モデルにつき基本は合計60分弱、素材が足りなかったときは30分~ +- エポック数: 100-300エポックあたりから良さそうなものを選んだもの +
+ +## 注意事項 +使用は自己責任でお願いします。 + +## 出力サンプルと雑感 (Samples and comments) + +[**ボイチェンで実際に使用したサンプル(男声から変換)は別ページにまとめてあります。**](vc-samples.md) + +
+変換前音声 (Input data) + +- 発話 (Japanese speech) +
+ +
+出力設定 + +[RVC v2](https://github.com/RVC-Project/Retrieval-based-Voice-Conversion-WebUI)の推論タブでの変換 +- ピッチ抽出: harvest +- ピッチ調整: 発話は[jvs-samples](https://huggingface.co/litagin/rvc_okiba/tree/main/jvs-samples)のファイル名に記載(記載なしはピッチ0)、歌唱は女性モデルは+12、男性モデルは0で統一 +- index使用率: 発話は1、歌唱は0.75 +- 何か保護するアレ: 0.33(デフォルト値のまま) +
+ +### 女性モデル (Girl models) + +- ~正直声のコメントの語彙が尽きてきた~ +- 「高め」「低め」は、(学習データの声の高さが高め・低めなので、)「高い声(ピッチ)と相性がいい」「低い声と相性がいい」程度の意味です。 +- 正確な声質や詳しい個人的な感想・5段階評価は[ボイチェンサンプル音声](vc-samples.md)のページをご覧ください。 + +|Name| Speech |Song|Comment | +|----| ---- |----|---- | +|A|