|
--- |
|
language: |
|
- ru |
|
--- |
|
|
|
✅ Этот проект заброшен и больше не будет обновляться |
|
|
|
--- |
|
# ПОЖАЛУЙСТА ПРОЧИТАЙТЕ ЭТОТ РАЗДЕЛ! ТУТ ВАЖНАЯ ИНФОРМАЦИЯ, ОТ КОТОРОЙ ЗАВИСИТ РАБОТА RVC! |
|
это mangio_rvc-v2 с easygui, tensorboard, с тренировкой, realtime gui, и все это работает из коробки. |
|
# это строго для пользователей Nvidia серии 10xx и выше. |
|
|
|
# ВНИМАНИЕ! ПУТЬ К ПРОГРАММЕ ДОЛЖЕН БЫТЬ НА АНГЛИСКОМ ЯЗЫКЕ!! ИМЯ КОМПЬЮТЕРА ТОЖЕ СТРОГО НА АНГЛИЙСКОМ |
|
|
|
А так же, не используйте поиск Windows для поиска файлов, иначе у вас могут быть непонятные ошибки. |
|
____ |
|
|
|
# Как это использовать |
|
|
|
Зависит от того что вам требуется. |
|
|
|
[Замена голоса в аудиокомпозиции](#заменяем-голос-в-аудиокомпозиции) |
|
|
|
[Тренировка модели на своем ПК](#тренировка-голосовых-моделей-на-своем-пк) |
|
|
|
[Подмена голоса в реальном временем (Voice changer)](#оглавление) |
|
|
|
[Исправление ошибок (траблшутинг)](#исправление-проблем) |
|
###### Текст чуть выше кликакабельный. |
|
|
|
____ |
|
|
|
# Подготовка |
|
|
|
1. [Скачиваем zip архив отсюда](https://huggingface.co/drafthost/rvc_v2_completed/resolve/main/rvc_v2.zip) |
|
2. Распаковываем в папку (по возможности в корень диска C:\) |
|
3. Запускаем !rvc_v2_preloader.exe и выбираем папку куда мы распаковали rvc. |
|
4. Нажимаем на кнопку "Запуск RVC EasyGUI" |
|
5. Ждем пару минут и у нас откроется браузер. |
|
6. Поздравляю. Если у вас в браузере что-то появилось, то всё работает. |
|
7. Вы можете добавить модели [нажав сюда](#добавляем-голосовые-модели-в-rvc) |
|
|
|
Если что-то не так то жду вас в [решение проблем](#решение-проблем) |
|
|
|
____ |
|
# Добавляем голосовые модели в rvc |
|
1. Большинство моделей можно найти тут:[AiHub (Discord)](https://discord.gg/aihub) |
|
2. Заходим в канал voice-models |
|
3. Практически все модели подходят к нашей программе. Пишем в поиск нужную (Желательно по англиски) и скачиваем |
|
4. После того как скачали, в архиве должно быть 2 файла, это .pth и .index |
|
5. Перемещаем .pth в папку "weights". Эта та самая папка, куда вы распаковали саму rvc. |
|
![пример папки](https://cdn.discordapp.com/attachments/1121884700521283756/1151461083404582953/image.png) |
|
6. Дальше, заходим в папку logs, создаем папку с названием модели которую мы скачали, и перемещаем туда .index |
|
![пример папки2](https://cdn.discordapp.com/attachments/1121884700521283756/1151463869642969148/image.png) |
|
7. Возвращаемся в браузер, убеждаемся что вы во вкладке "Inference", затем нажимаем "Refresh" которая находится у "1.Choose your Model." |
|
8. Модель появилась? Ура. Если не появилась, то [нажмите сюда](#исправление-проблем) |
|
9. Не забудьте выбрать свой .index в "Index Settings" он должен совпадать по названию с ".pth", не обязательно слово в слово. |
|
____ |
|
|
|
# Заменяем голос в аудиокомпозиции |
|
|
|
|
|
1. Выполяем все шаги [тут](#подготовка) |
|
2. |
|
|
|
____ |
|
|
|
|
|
# Тренировка голосовых моделей на своем ПК |
|
1. Выполяем все шаги [тут](#подготовка) |
|
2. дальше мне лень писать |
|
3. |
|
|
|
требования к нормальному датасету: |
|
1. отсутствие шумов, кликов мыши/клавиатуры, тишины и прочего |
|
2. примерная длина всех аудио от 1 до 30 минут, оптимальное от 3 до 10 |
|
3. для удобства советую разделить на файлы, можно и произвольной длины |
|
|
|
*датасет - набор данных для тренироки. |
|
|
|
требования к тренировке: |
|
1. не допускать перетренировки |
|
2. не допускать слабого обучения |
|
3. смотреть на графики tensorboard, чтобы найти идеальное количество эпох |
|
|
|
____ |
|
|
|
# Изменяем голос в реальном времени |
|
1. Выполяем все шаги [тут](#подготовка) |
|
2. Скачиваем и устанавливаем VAC (Virtual Audio Cable) --> [тут](https://huggingface.co/drafthost/rvc_v2_completed/resolve/main/VBCABLE_Driver_Pack43.zip) |
|
3. Открываем VBCABLE_Setup_x64.exe и устанавливаем. |
|
4. Нас попросят перезагрузить ПК, но мы не будем. |
|
5. |
|
|
|
____ |
|
# Исправление проблем |
|
|
|
а |
|
|
|
____ |
|
|
|
# Структура папок/файлов модели RVC v2 выглядит следующим образом: |
|
|
|
папка eval - используется для хранения оценок для tensorboard, если они поддерживаются в данном случае |
|
|
|
файл fevents - это файл тензорборда / графика |
|
|
|
некоторые файлы журналов .txt и config - журналы и конфигурации |
|
|
|
G_xxxxx.pth файл ( генератор ) |
|
|
|
D_xxxxx.pth файл ( дискриминатор ) |
|
|
|
fea.npy (большой файл, содержащий характеристики модели / голоса) |
|
|
|
trained index (файл, который мы больше не используем) |
|
|