Trained with Unsloth

Files changed (7) hide show

README.md CHANGED Viewed

@@ -1,6 +1,9 @@
 ---
 library_name: transformers
-tags: []
 ---
 # Model Card for Model ID

 ---
 library_name: transformers
+tags:
+- unsloth
+- trl
+- sft
 ---
 # Model Card for Model ID

config.json CHANGED Viewed

@@ -1,11 +1,11 @@
 {
-  "_name_or_path": "/kaggle/working/BMO-7B-Instruct",
   "architectures": [
     "MistralForCausalLM"
   ],
   "attention_dropout": 0.0,
   "bos_token_id": 1,
-  "eos_token_id": 32000,
   "hidden_act": "silu",
   "hidden_size": 4096,
   "initializer_range": 0.02,
@@ -17,11 +17,11 @@
   "num_key_value_heads": 8,
   "rms_norm_eps": 1e-05,
   "rope_theta": 10000.0,
-  "sliding_window": 4096,
   "tie_word_embeddings": false,
-  "torch_dtype": "float16",
-  "transformers_version": "4.39.0.dev0",
-  "unsloth_version": "2024.3",
   "use_cache": false,
-  "vocab_size": 32002
 }

 {
+  "_name_or_path": "cognitivecomputations/dolphin-2.6-mistral-7b",
   "architectures": [
     "MistralForCausalLM"
   ],
   "attention_dropout": 0.0,
   "bos_token_id": 1,
+  "eos_token_id": 2,
   "hidden_act": "silu",
   "hidden_size": 4096,
   "initializer_range": 0.02,
   "num_key_value_heads": 8,
   "rms_norm_eps": 1e-05,
   "rope_theta": 10000.0,
+  "sliding_window": null,
   "tie_word_embeddings": false,
+  "torch_dtype": "bfloat16",
+  "transformers_version": "4.40.1",
+  "unsloth_version": "2024.4",
   "use_cache": false,
+  "vocab_size": 32001
 }

generation_config.json CHANGED Viewed

@@ -1,6 +1,6 @@
 {
   "_from_model_config": true,
   "bos_token_id": 1,
-  "eos_token_id": 32000,
-  "transformers_version": "4.39.0.dev0"
 }

 {
   "_from_model_config": true,
   "bos_token_id": 1,
+  "eos_token_id": 2,
+  "transformers_version": "4.40.1"
 }

model-00001-of-00003.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:f03253df2a2bb422963caea59ff6aa04f6626558770ed295f209fcfee41566ed
-size 4943178624

 version https://git-lfs.github.com/spec/v1
+oid sha256:8770bd8a33c92e6d072539055af37adad65392bafe333f4322db10c11671825e
+size 4943170528

model-00002-of-00003.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:555e47c9750cd1c865c8321cdb68be2b6c0507f13f6903c2d73e35d95335b7d0
-size 4999819232

 version https://git-lfs.github.com/spec/v1
+oid sha256:d6fcd3385ed1bb776f5c6871d5f34eb1b85716a4f3e969ce0a9a1244624de870
+size 4999819336

model-00003-of-00003.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:f8b72b82bf0b6fd84d8324fbd03070a07467e90fc0e593eb2d8edd7dea541942
-size 4540532640

 version https://git-lfs.github.com/spec/v1
+oid sha256:4df32caf350d20d669dac0ed82750c417eaa2cd7430acc6d7ff4435e187b974f
+size 4540524536

model.safetensors.index.json CHANGED Viewed

@@ -1,6 +1,6 @@
 {
   "metadata": {
-    "total_size": 14483496960
   },
   "weight_map": {
     "lm_head.weight": "model-00003-of-00003.safetensors",

 {
   "metadata": {
+    "total_size": 14483480576
   },
   "weight_map": {
     "lm_head.weight": "model-00003-of-00003.safetensors",