catsOfpeople
/

speecht5_soome-V2

Generated from Trainer

Inference Endpoints

Model card Files Files and versions Metrics Training metrics Community

catsOfpeople commited on Oct 29, 2024

Commit

2b1a10f

·

verified ·

1 Parent(s): 4f3f586

Update tokenizer_config.json

Files changed (1) hide show

tokenizer_config.json +1 -55

tokenizer_config.json CHANGED Viewed

@@ -1,64 +1,10 @@
 {
-  "added_tokens_decoder": {
-    "0": {
-      "content": "<s>",
-      "lstrip": false,
-      "normalized": false,
-      "rstrip": false,
-      "single_word": false,
-      "special": true,
-      "model_max_length": 1000000000000000019884624838656
-    },
-    "1": {
-      "content": "<pad>",
-      "lstrip": false,
-      "normalized": false,
-      "rstrip": false,
-      "single_word": false,
-      "special": true
-    },
-    "2": {
-      "content": "</s>",
-      "lstrip": false,
-      "normalized": false,
-      "rstrip": false,
-      "single_word": false,
-      "special": true
-    },
-    "3": {
-      "content": "<unk>",
-      "lstrip": false,
-      "normalized": false,
-      "rstrip": false,
-      "single_word": false,
-      "special": true
-    },
-    "79": {
-      "content": "<mask>",
-      "lstrip": true,
-      "normalized": true,
-      "rstrip": false,
-      "single_word": false,
-      "special": true
-    },
-    "80": {
-      "content": "<ctc_blank>",
-      "lstrip": false,
-      "normalized": true,
-      "rstrip": false,
-      "single_word": false,
-      "special": false
-    }
-  },
   "bos_token": "<s>",
-  "clean_up_tokenization_spaces": true,
   "eos_token": "</s>",
-  "mask_token": "<mask>",
   "model_max_length": 600,
-  "normalize": false,
   "pad_token": "<pad>",
   "processor_class": "SpeechT5Processor",
   "sp_model_kwargs": {},
   "tokenizer_class": "SpeechT5Tokenizer",
   "unk_token": "<unk>"
-}

 {
   "bos_token": "<s>",
   "eos_token": "</s>",
   "model_max_length": 600,
   "pad_token": "<pad>",
   "processor_class": "SpeechT5Processor",
   "sp_model_kwargs": {},
   "tokenizer_class": "SpeechT5Tokenizer",
   "unk_token": "<unk>"
+}