--- language: - ru --- # это rvc v2 с easygui, tensorboard, с тренировкой, realtime gui, и все это работает из коробки. # это строго для пользователей Nvidia с CUDA! ВНИМАНИЕ! ПУТЬ К ПРОГРАММЕ ДОЛЖЕН БЫТЬ НА АНГЛИСКОМ ЯЗЫКЕ!! ИМЯ КОМПЬЮТЕРА ТОЖЕ СТРОГО НА АНГЛИЙСКОМ А так же, не используйте поиск Windows для поиска файлов, иначе у вас могут быть непонятные ошибки. *RVC - та ИИ при помощи делают каверы, но через нее можно и создавать модели. ###### гайд в процессе написания, и может быть не полным, или не точным. ____ # Как это использовать Зависит от того что вам требуется. [Подготовка](#подготовка) [Замена голоса в аудиокомпозиции](#заменяем-голос-в-аудиокомпозиции) [Тренировка модели на своем ПК](#тренировка-голосовых-моделей-на-своем-ПК) [Подмена голоса в реальном временем (Voice changer)](#оглавление) [Исправление ошибок (траблшутинг)](#исправление-проблем) ###### Текст чуть выше кликакабельный. ____ # Подготовка Перед налом у вас должен быть установлен "Python 3.10.11", если он не установлен, [то скачать можно тут](https://huggingface.co/drafthost/rvc_v2_completed/resolve/main/python-3.10.11-amd64.exe) ###### Если Python уже установлен, убедитесь что у вас версия "3.10.11". Если что-то не работает, установите Python по ссылке чуть выше. 1. [Скачиваем zip архив отсюда](https://huggingface.co/drafthost/rvc_v2_completed/resolve/main/rvc_v2.zip) 2. Распаковываем в папку (по возможности в корень диска C:\) 3. Запускаем install_easyGUI.bat и ждем 4. После того как установилось, открываем run_easiergui.bat 5. Ждем пару минут и у нас откроется браузер. 6. Поздравляю. Если у вас в браузере что-то появилось, то всё работает. Если что-то не так то жду вас в [решение проблем](#решение-проблем) ____ # Заменяем голос в аудиокомпозиции 1. Выполяем все шаги [тут](#подготовка) 2. дальше мне лень писать ____ # Тренировка голосовых моделей на своем ПК 1. Выполяем все шаги [тут](#подготовка) 2. дальше мне лень писать 3. требования к нормальному датасету: 1. отсутствие шумов, кликов мыши/клавиатуры, тишины и прочего 2. примерная длина всех аудио от 1 до 30 минут, оптимальное от 3 до 10 3. для удобства советую разделить на файлы, можно и произвольной длины *датасет - набор данных для тренироки. требования к тренировке: 1. не допускать перетренировки 2. не допускать слабого обучения 3. смотреть на графики tensorboard, чтобы найти идеальное количество эпох ____ # Изменяем голос в реальном времени 1. Выполяем все шаги [тут](#подготовка) 2. дальше мне лень писать