Macedonian-ASR
/

wav2vec2-aed-macedonian-asr

Automatic Speech Recognition

Model card Files Files and versions Community

Porjaz commited on Sep 27, 2024

Commit

b46e348

·

verified ·

1 Parent(s): 402e90c

Update README.md

Files changed (1) hide show

README.md +26 -16

README.md CHANGED Viewed

@@ -7,22 +7,32 @@ metrics:
 - wer
 - cer
 pipeline_tag: automatic-speech-recognition
 ---
 Authors:
-1. Дејан Порјазовски
-2. Илина Јакимовска
-3. Ордан Чукалиев
-4. Никола Стиков
-Оваа колаборација е дел од активностите на Центарот за напредни интердисциплинарни истражувања (ЦеНИИс) при УКИМ.
-The training data was provided by:
-    Дигитален архив за етнолошки и антрополошки ресурси (ДАЕАР) при Институтот за етнологија и антропологија, Природно-математички факултет при УКИМ.
-Во тренирањето на овој модел се употребени податоци од:
-1. Дигитален архив за етнолошки и антрополошки ресурси (ДАЕАР) при Институтот за етнологија и антропологија, Природно-математички факултет при УКИМ.
-2. Аудио верзија на меѓународното списание „ЕтноАнтропоЗум“ на Институтот за етнологија и антропологија, Природно-математички факултет при УКИМ.
-3. Подкастот „Обични луѓе“ на Илина Јакимовска
-4. Научните видеа од серијалот „Наука за деца“, фондација КАНТАРОТ
-5. Македонска верзија на Mozilla Common Voice

 - wer
 - cer
 pipeline_tag: automatic-speech-recognition
+base_model:
+- jonatasgrosman/wav2vec2-large-xlsr-53-russian
 ---
+# Fine-tuned xlsr-53-russian large model for speech recognition in Macedonian
+Fine-tuned [wav2vec2-large-xlsr-53-russian](jonatasgrosman/wav2vec2-large-xlsr-53-russian)
 Authors:
+1. Dejan Porjazovski
+2. Ilina Jakimovska
+3. Ordan Chukaliev
+4. Nikola Stikov
+This collaboration is part of the activities of the Center for Advanced Interdisciplinary Research (CAIR) at UKIM.
+## Data used for training
+In training of the model, we used the following data sources:
+1. Digital Archive for Ethnological and Anthropological Resources (DAEAR) at the Institutе of Ethnology and Anthropology, PMF, UKIM.
+2. Audio version of the international journal "EthnoAnthropoZoom" at the Institutе of Ethnology and Anthropology, PMF, UKIM.
+3. The podcast "Обични луѓе" by Ilina Jakimovska.
+4. The scientific videos from the series "Наука за деца", foundation KANTAROT.
+5. Macedonian version of the Mozilla Common Voice (version 18).
+## Usage
+When using this model, make sure that your speech input is sampled at 16kHz.