rvc_v2_completed / README.md

Usagi Godness

Update README.md

289207b 11 months ago

No virus

4.13 kB

	---
	language:
	- ru
	---
	# это rvc v2 с easygui, tensorboard, с тренировкой, realtime gui, и все это работает из коробки.
	# это строго для пользователей Nvidia с CUDA!

	ВНИМАНИЕ! ПУТЬ К ПРОГРАММЕ ДОЛЖЕН БЫТЬ НА АНГЛИСКОМ ЯЗЫКЕ!! ИМЯ КОМПЬЮТЕРА ТОЖЕ СТРОГО НА АНГЛИЙСКОМ

	А так же, не используйте поиск Windows для поиска файлов, иначе у вас могут быть непонятные ошибки.

	*RVC - та ИИ при помощи делают каверы, но через нее можно и создавать модели.

	###### гайд в процессе написания, и может быть не полным, или не точным.
	____

	# Как это использовать

	Зависит от того что вам требуется.

	[Подготовка](#подготовка)

	[Замена голоса в аудиокомпозиции](#заменяем-голос-в-аудиокомпозиции)

	[Тренировка модели на своем ПК](#тренировка-голосовых-моделей-на-своем-ПК)

	[Подмена голоса в реальном временем (Voice changer)](#оглавление)

	[Исправление ошибок (траблшутинг)](#исправление-проблем)
	###### Текст чуть выше кликакабельный.

	____

	# Подготовка

	Перед налом у вас должен быть установлен "Python 3.10.11", если он не установлен, [то скачать можно тут](https://huggingface.co/drafthost/rvc_v2_completed/resolve/main/python-3.10.11-amd64.exe)
	###### Если Python уже установлен, убедитесь что у вас версия "3.10.11". Если что-то не работает, установите Python по ссылке чуть выше.

	1. [Скачиваем zip архив отсюда](https://huggingface.co/drafthost/rvc_v2_completed/resolve/main/rvc_v2.zip)
	2. Распаковываем в папку (по возможности в корень диска C:\)
	3. Запускаем install_easyGUI.bat и ждем
	4. После того как установилось, открываем run_easiergui.bat
	5. Ждем пару минут и у нас откроется браузер.
	6. Поздравляю. Если у вас в браузере что-то появилось, то всё работает.

	Если что-то не так то жду вас в [решение проблем](#решение-проблем)

	____

	# Заменяем голос в аудиокомпозиции



	1. Выполяем все шаги [тут](#подготовка)
	2. дальше мне лень писать

	____


	# Тренировка голосовых моделей на своем ПК
	1. Выполяем все шаги [тут](#подготовка)
	2. дальше мне лень писать
	3.

	требования к нормальному датасету:
	1. отсутствие шумов, кликов мыши/клавиатуры, тишины и прочего
	2. примерная длина всех аудио от 1 до 30 минут, оптимальное от 3 до 10
	3. для удобства советую разделить на файлы, можно и произвольной длины

	*датасет - набор данных для тренироки.

	требования к тренировке:
	1. не допускать перетренировки
	2. не допускать слабого обучения
	3. смотреть на графики tensorboard, чтобы найти идеальное количество эпох

	____

	# Изменяем голос в реальном времени
	1. Выполяем все шаги [тут](#подготовка)
	2. дальше мне лень писать