Ударения?
Попробовал модель. В целом, неплохо работает, но ударения ставятся как попало. Есть ли способ вручную их ставить? Ставил плюс или заглавную букву -- не помогает. Для справки: есть "Простой расстановщик ударений с обработкой омографов" https://github.com/Den4ikAI/ruaccent
Насколько я понял, в модели нет функционала ручной расстановки ударений. Я буду пробовать увеличить датасет, может поможет
Около 60% слов не просто неверные ударения, но такие, которых в словах вовсе не бывает. Ещё постоянно окает, например "тОбой" именно так и говорит, с ударным О.
Читая эту статью https://github.com/SWivid/F5-TTS/issues/382?ysclid=m5rtvm2ssv342066901 и путем экспериментов обнаружил, что О@чень, о@чень рекоменду@ю - расставляет ударения.
Действительно, @ работает для указания ударения. Примерное в 50% случаях все прямо отлично получается. Спасибо за находку.
Действительно, @ работает для указания ударения. Примерное в 50% случаях все прямо отлично получается. Спасибо за находку.
А ты ударения проверял при обучении или когда тестил модель? Когда надо ставить ударение: после обучения модели или до?
А ты ударения проверял при обучении или когда тестил модель?
При использовании модели. Т.е. голос генерируется с нормальными ударениями при использовании тех файлов (модели), что выложены в этом репо.
На вкладке Batched TTS указал Custom модель: rus_model_last.safetensors и rus_vocab.txt. Загрузил образец русской речи в Reference Audio, в Text to Generate указал текст "О@чень, о@чень рекоменду@ю " - и всё. Но оказалось, что расстановка ударений зависит от образца голоса - сменил образец и снова ударения неправильные.
В некоторых случаях помогало удвоение ударной гласной. Но думаю, что надо обучать использую расширенный словарь звуков типа 'а и просто а