Audio Course documentation

Ejercicio práctico

Hugging Face's logo
Join the Hugging Face community

and get access to the augmented documentation experience

to get started

Ejercicio práctico

Este ejericio no es calificable y esta pensado para ayudarte a familiarizar con las herramientas y librerias que estaras usando a traves del curso. Si ya tienes experiencia al usar Google Colab, 🤗 Datasets, librosa y 🤗 Transformers, puedes saltar este ejercicio.

  1. Crea un cuaderno de Google Colab
  2. Usa para descargar la partición train de facebook/voxpopuli dataset en el idioma de tu elección usando el modo de transmisión(streaming).
  3. Obten el tercer ejemplo del subconjunto train y exploralo. Dadas las caracteristicas que tiene este ejemplo, ¿En cuales tareas de audio puedes usar este dataset?
  4. Gráfica la forma de onda y el espectrograma.
  5. Ve al 🤗 Hub, y explora modelos pre-entrenados que puedan ser usados para el reconocimiento automático de la voz en el idioma de tu elección.
  6. Compara la transcripción que obtienes de la pipeline con la transcripción original.

Si tienes problemas completando este ejercicio, puedes mirar la solución. ¿Has descubierto algo interesante? ¿Encontraste un buen modelo? ¿Obtuviste un bello espectrograma? Comparte tus descubrimientos en Twitter.

En el siguiente capitulo aprenderás mas acerca de las arquitecturas para audio de transformers y entrenaras tu propio modelo