rvc_v2_completed / README.md

dh2fun

Update README.md

21dab78 11 months ago

preview code

raw

history blame contribute delete

No virus

6.56 kB

	---
	language:
	- ru
	---

	✅ Этот проект заброшен и больше не будет обновляться

	---
	# ПОЖАЛУЙСТА ПРОЧИТАЙТЕ ЭТОТ РАЗДЕЛ! ТУТ ВАЖНАЯ ИНФОРМАЦИЯ, ОТ КОТОРОЙ ЗАВИСИТ РАБОТА RVC!
	это mangio_rvc-v2 с easygui, tensorboard, с тренировкой, realtime gui, и все это работает из коробки.
	# это строго для пользователей Nvidia серии 10xx и выше.

	# ВНИМАНИЕ! ПУТЬ К ПРОГРАММЕ ДОЛЖЕН БЫТЬ НА АНГЛИСКОМ ЯЗЫКЕ!! ИМЯ КОМПЬЮТЕРА ТОЖЕ СТРОГО НА АНГЛИЙСКОМ

	А так же, не используйте поиск Windows для поиска файлов, иначе у вас могут быть непонятные ошибки.
	____

	# Как это использовать

	Зависит от того что вам требуется.

	[Замена голоса в аудиокомпозиции](#заменяем-голос-в-аудиокомпозиции)

	[Тренировка модели на своем ПК](#тренировка-голосовых-моделей-на-своем-пк)

	[Подмена голоса в реальном временем (Voice changer)](#оглавление)

	[Исправление ошибок (траблшутинг)](#исправление-проблем)
	###### Текст чуть выше кликакабельный.

	____

	# Подготовка

	1. [Скачиваем zip архив отсюда](https://huggingface.co/drafthost/rvc_v2_completed/resolve/main/rvc_v2.zip)
	2. Распаковываем в папку (по возможности в корень диска C:\)
	3. Запускаем !rvc_v2_preloader.exe и выбираем папку куда мы распаковали rvc.
	4. Нажимаем на кнопку "Запуск RVC EasyGUI"
	5. Ждем пару минут и у нас откроется браузер.
	6. Поздравляю. Если у вас в браузере что-то появилось, то всё работает.
	7. Вы можете добавить модели [нажав сюда](#добавляем-голосовые-модели-в-rvc)

	Если что-то не так то жду вас в [решение проблем](#решение-проблем)

	____
	# Добавляем голосовые модели в rvc
	1. Большинство моделей можно найти тут:[AiHub (Discord)](https://discord.gg/aihub)
	2. Заходим в канал voice-models
	3. Практически все модели подходят к нашей программе. Пишем в поиск нужную (Желательно по англиски) и скачиваем
	4. После того как скачали, в архиве должно быть 2 файла, это .pth и .index
	5. Перемещаем .pth в папку "weights". Эта та самая папка, куда вы распаковали саму rvc.
	![пример папки](https://cdn.discordapp.com/attachments/1121884700521283756/1151461083404582953/image.png)
	6. Дальше, заходим в папку logs, создаем папку с названием модели которую мы скачали, и перемещаем туда .index
	![пример папки2](https://cdn.discordapp.com/attachments/1121884700521283756/1151463869642969148/image.png)
	7. Возвращаемся в браузер, убеждаемся что вы во вкладке "Inference", затем нажимаем "Refresh" которая находится у "1.Choose your Model."
	8. Модель появилась? Ура. Если не появилась, то [нажмите сюда](#исправление-проблем)
	9. Не забудьте выбрать свой .index в "Index Settings" он должен совпадать по названию с ".pth", не обязательно слово в слово.
	____

	# Заменяем голос в аудиокомпозиции


	1. Выполяем все шаги [тут](#подготовка)
	2.

	____


	# Тренировка голосовых моделей на своем ПК
	1. Выполяем все шаги [тут](#подготовка)
	2. дальше мне лень писать
	3.

	требования к нормальному датасету:
	1. отсутствие шумов, кликов мыши/клавиатуры, тишины и прочего
	2. примерная длина всех аудио от 1 до 30 минут, оптимальное от 3 до 10
	3. для удобства советую разделить на файлы, можно и произвольной длины

	*датасет - набор данных для тренироки.

	требования к тренировке:
	1. не допускать перетренировки
	2. не допускать слабого обучения
	3. смотреть на графики tensorboard, чтобы найти идеальное количество эпох

	____

	# Изменяем голос в реальном времени
	1. Выполяем все шаги [тут](#подготовка)
	2. Скачиваем и устанавливаем VAC (Virtual Audio Cable) --> [тут](https://huggingface.co/drafthost/rvc_v2_completed/resolve/main/VBCABLE_Driver_Pack43.zip)
	3. Открываем VBCABLE_Setup_x64.exe и устанавливаем.
	4. Нас попросят перезагрузить ПК, но мы не будем.
	5.

	____
	# Исправление проблем

	а

	____

	# Структура папок/файлов модели RVC v2 выглядит следующим образом:

	папка eval - используется для хранения оценок для tensorboard, если они поддерживаются в данном случае

	файл fevents - это файл тензорборда / графика

	некоторые файлы журналов .txt и config - журналы и конфигурации

	G_xxxxx.pth файл ( генератор )

	D_xxxxx.pth файл ( дискриминатор )

	fea.npy (большой файл, содержащий характеристики модели / голоса)

	trained index (файл, который мы больше не используем)