Whisper Medium Spanish-NATI - Ivan MH

This model is a fine-tuned version of openai/whisper-medium on the NATI_audio dataset. It achieves the following results on the evaluation set:

This project is for the Instituto Interamericano para Discapacidad y Desarrollo Inclusivo (iiDi).

Model results examples

Transcripción manual (objetivo)	Transcripción obtenida por whisper	Transcripción de whisper adaptado
Mi nombre es Natalia,	y no me nada	Mi nombre es Natalia.
soy de Uruguay del iiDi.	Soy de Uruguay.	Soy de Uruguay, de Lili.
viene por el lado, de algo que trabajamos durante toda la semana,	por el lado de algo que trabajamos durante todas las semanas.	En el por el lado de algo que trabajamos durante todas las semanas.
Uno es Danceability	una enganchabilidad	Una en danzability?
Hola Iván, mirá, vamos en camino. Voy con Eliana también. Llegaremos... Eli, ahora te cuento, es una compañera que me está apoyando. Llegaremos y cuarto, por ahí, perdón la demora. Beso.	Hola, ya miraba más el camino Voy con Eliana también Cerótimo, Eliana de Cuantos es una compañía larga metaforsana, ella misma Cerótimo y Cuantos por ahí, para donde mola el reto	Hola Jan, miraba más el camino, voy con Eliana también. Seguiremos el i ahora te cuento, es una compañera que me está apoyando. Seguiremos i cuarto por ahí, para donde mola verse.

The model is fine-tuned for use on target speaker Natalia F.

It is intended for research purposes, neither this model nor the dataset should be used without explicit permission from iiDi or Natalia.

10 minutos aprox. de audio transcripto
- A partir de transcripción manual de audios de whatsapp
5 minutos aprox.
- A partir de videos subtitulados por el iidi

The following hyperparameters were used during training:

Training Loss	Epoch	Step	Validation Loss	Wer
2.1185	1.5385	20	5.2113	70.2194
1.101	3.0769	40	3.4953	67.3981
0.2713	4.6154	60	2.8417	64.5768
0.0238	6.1538	80	2.0258	66.4577
0.0189	7.6923	100	2.2078	72.4138
0.0012	9.2308	120	2.2116	67.3981
0.0113	10.7692	140	2.2311	66.4577
0.0004	12.3077	160	2.2437	67.7116
0.0003	13.8462	180	2.2415	66.7712
0.0003	15.3846	200	2.2439	66.7712