Audio Course documentation

Дополнительные материалы и ресурсы

Hugging Face's logo
Join the Hugging Face community

and get access to the augmented documentation experience

to get started

Дополнительные материалы и ресурсы

В этом разделе объединены многие компоненты из предыдущих разделов, представлены задачи перевода речи в речь, голосовые помощники и диаризация диктора. Для удобства чтения дополнительный материал разбит на эти три новые задачи:

Перевод речи в речь:

Голосовой ассистент:

Транскрипция встреч:

  • pyannote.audio Технический отчет Эрве Бредин: в этом докладе описываются основные принципы, лежащие в основе конвейера диаризации дикторов `pyannote.audio
  • Whisper X by Max Bain et al.: усовершенствованный подход к вычислению временных меток на уровне слов с использованием модели Whisper