Ejercicio práctico
Este ejericio no es calificable y esta pensado para ayudarte a familiarizar con las herramientas y librerias que estaras usando a traves del curso. Si ya tienes experiencia al usar Google Colab, 🤗 Datasets, librosa y 🤗 Transformers, puedes saltar este ejercicio.
- Crea un cuaderno de Google Colab
- Usa para descargar la partición train de
facebook/voxpopuli
dataset en el idioma de tu elección usando el modo de transmisión(streaming). - Obten el tercer ejemplo del subconjunto
train
y exploralo. Dadas las caracteristicas que tiene este ejemplo, ¿En cuales tareas de audio puedes usar este dataset? - Gráfica la forma de onda y el espectrograma.
- Ve al 🤗 Hub, y explora modelos pre-entrenados que puedan ser usados para el reconocimiento automático de la voz en el idioma de tu elección.
- Compara la transcripción que obtienes de la pipeline con la transcripción original.
Si tienes problemas completando este ejercicio, puedes mirar la solución. ¿Has descubierto algo interesante? ¿Encontraste un buen modelo? ¿Obtuviste un bello espectrograma? Comparte tus descubrimientos en Twitter.
En el siguiente capitulo aprenderás mas acerca de las arquitecturas para audio de transformers y entrenaras tu propio modelo
< > Update on GitHub