rvc_v2_completed / README.md
Usagi Godness
Update README.md
289207b
|
raw
history blame
No virus
4.13 kB
metadata
language:
  - ru

это rvc v2 с easygui, tensorboard, с тренировкой, realtime gui, и все это работает из коробки.

это строго для пользователей Nvidia с CUDA!

ВНИМАНИЕ! ПУТЬ К ПРОГРАММЕ ДОЛЖЕН БЫТЬ НА АНГЛИСКОМ ЯЗЫКЕ!! ИМЯ КОМПЬЮТЕРА ТОЖЕ СТРОГО НА АНГЛИЙСКОМ

А так же, не используйте поиск Windows для поиска файлов, иначе у вас могут быть непонятные ошибки.

*RVC - та ИИ при помощи делают каверы, но через нее можно и создавать модели.

гайд в процессе написания, и может быть не полным, или не точным.

Как это использовать

Зависит от того что вам требуется.

Подготовка

Замена голоса в аудиокомпозиции

Тренировка модели на своем ПК

Подмена голоса в реальном временем (Voice changer)

Исправление ошибок (траблшутинг)

Текст чуть выше кликакабельный.

Подготовка

Перед налом у вас должен быть установлен "Python 3.10.11", если он не установлен, то скачать можно тут

Если Python уже установлен, убедитесь что у вас версия "3.10.11". Если что-то не работает, установите Python по ссылке чуть выше.
  1. Скачиваем zip архив отсюда
  2. Распаковываем в папку (по возможности в корень диска C:)
  3. Запускаем install_easyGUI.bat и ждем
  4. После того как установилось, открываем run_easiergui.bat
  5. Ждем пару минут и у нас откроется браузер.
  6. Поздравляю. Если у вас в браузере что-то появилось, то всё работает.

Если что-то не так то жду вас в решение проблем


Заменяем голос в аудиокомпозиции

  1. Выполяем все шаги тут
  2. дальше мне лень писать

Тренировка голосовых моделей на своем ПК

  1. Выполяем все шаги тут
  2. дальше мне лень писать

требования к нормальному датасету:

  1. отсутствие шумов, кликов мыши/клавиатуры, тишины и прочего
  2. примерная длина всех аудио от 1 до 30 минут, оптимальное от 3 до 10
  3. для удобства советую разделить на файлы, можно и произвольной длины

*датасет - набор данных для тренироки.

требования к тренировке:

  1. не допускать перетренировки
  2. не допускать слабого обучения
  3. смотреть на графики tensorboard, чтобы найти идеальное количество эпох

Изменяем голос в реальном времени

  1. Выполяем все шаги тут
  2. дальше мне лень писать