metadata
language:
- ru
это rvc v2 с easygui, tensorboard, с тренировкой, realtime gui, и все это работает из коробки.
это строго для пользователей Nvidia с CUDA!
ВНИМАНИЕ! ПУТЬ К ПРОГРАММЕ ДОЛЖЕН БЫТЬ НА АНГЛИСКОМ ЯЗЫКЕ!! ИМЯ КОМПЬЮТЕРА ТОЖЕ СТРОГО НА АНГЛИЙСКОМ
А так же, не используйте поиск Windows для поиска файлов, иначе у вас могут быть непонятные ошибки.
*RVC - та ИИ при помощи делают каверы, но через нее можно и создавать модели.
гайд в процессе написания, и может быть не полным, или не точным.
Как это использовать
Зависит от того что вам требуется.
Замена голоса в аудиокомпозиции
Подмена голоса в реальном временем (Voice changer)
Исправление ошибок (траблшутинг)
Текст чуть выше кликакабельный.
Подготовка
Перед налом у вас должен быть установлен "Python 3.10.11", если он не установлен, то скачать можно тут
Если Python уже установлен, убедитесь что у вас версия "3.10.11". Если что-то не работает, установите Python по ссылке чуть выше.
- Скачиваем zip архив отсюда
- Распаковываем в папку (по возможности в корень диска C:)
- Запускаем install_easyGUI.bat и ждем
- После того как установилось, открываем run_easiergui.bat
- Ждем пару минут и у нас откроется браузер.
- Поздравляю. Если у вас в браузере что-то появилось, то всё работает.
Если что-то не так то жду вас в решение проблем
Заменяем голос в аудиокомпозиции
- Выполяем все шаги тут
- дальше мне лень писать
Тренировка голосовых моделей на своем ПК
- Выполяем все шаги тут
- дальше мне лень писать
требования к нормальному датасету:
- отсутствие шумов, кликов мыши/клавиатуры, тишины и прочего
- примерная длина всех аудио от 1 до 30 минут, оптимальное от 3 до 10
- для удобства советую разделить на файлы, можно и произвольной длины
*датасет - набор данных для тренироки.
требования к тренировке:
- не допускать перетренировки
- не допускать слабого обучения
- смотреть на графики tensorboard, чтобы найти идеальное количество эпох
Изменяем голос в реальном времени
- Выполяем все шаги тут
- дальше мне лень писать