Update tokenizer_config.json

Files changed (1) hide show

tokenizer_config.json CHANGED Viewed

@@ -2051,6 +2051,7 @@
   },
   "bos_token": "<|begin_of_text|>",
   "chat_template": "{{bos_token}}{% for message in messages %}{{'<|im_start|>' + message['role'] + '\n' + message['content'] + '<|im_end|>' + '\n'}}{% endfor %}{% if add_generation_prompt %}{{ '<|im_start|>assistant\n' }}{% endif %}",
   "eos_token": "<|im_end|>",
   "model_input_names": [
     "input_ids",
@@ -2059,4 +2060,4 @@
   "model_max_length": 131072,
   "pad_token": "<|end_of_text|>",
   "tokenizer_class": "PreTrainedTokenizerFast"
-}

   },
   "bos_token": "<|begin_of_text|>",
   "chat_template": "{{bos_token}}{% for message in messages %}{{'<|im_start|>' + message['role'] + '\n' + message['content'] + '<|im_end|>' + '\n'}}{% endfor %}{% if add_generation_prompt %}{{ '<|im_start|>assistant\n' }}{% endif %}",
+  "clean_up_tokenization_spaces": true,
   "eos_token": "<|im_end|>",
   "model_input_names": [
     "input_ids",
   "model_max_length": 131072,
   "pad_token": "<|end_of_text|>",
   "tokenizer_class": "PreTrainedTokenizerFast"
+}