End of training

Browse files

Files changed (6) hide show

README.md +41 -41
config.json +2 -2
model.safetensors +2 -2
runs/Mar04_14-00-51_d8c8da50ec4e/events.out.tfevents.1709560851.d8c8da50ec4e.409.2 +3 -0
tokenizer.json +146 -54
training_args.bin +1 -1

README.md CHANGED Viewed

@@ -13,7 +13,7 @@ should probably proofread and complete it, then remove this comment. -->
 This model is a fine-tuned version of [](https://huggingface.co/) on the None dataset.
 It achieves the following results on the evaluation set:
-- Loss: 0.2014
 ## Model description
@@ -44,46 +44,46 @@ The following hyperparameters were used during training:
 | Training Loss | Epoch | Step | Validation Loss |
 |:-------------:|:-----:|:----:|:---------------:|
-| 2.947         | 1.0   | 6    | 2.2690          |
-| 2.0301        | 2.0   | 12   | 1.7402          |
-| 1.5419        | 3.0   | 18   | 1.2929          |
-| 1.2143        | 4.0   | 24   | 1.0901          |
-| 1.0259        | 5.0   | 30   | 0.9702          |
-| 0.9007        | 6.0   | 36   | 0.8471          |
-| 0.7925        | 7.0   | 42   | 0.8145          |
-| 0.7608        | 8.0   | 48   | 0.7531          |
-| 0.7152        | 9.0   | 54   | 0.6772          |
-| 0.6579        | 10.0  | 60   | 0.6378          |
-| 0.6218        | 11.0  | 66   | 0.5797          |
-| 0.5697        | 12.0  | 72   | 0.5534          |
-| 0.5604        | 13.0  | 78   | 0.5225          |
-| 0.5172        | 14.0  | 84   | 0.4961          |
-| 0.4936        | 15.0  | 90   | 0.4773          |
-| 0.4897        | 16.0  | 96   | 0.5122          |
-| 0.499         | 17.0  | 102  | 0.4710          |
-| 0.4578        | 18.0  | 108  | 0.4763          |
-| 0.4455        | 19.0  | 114  | 0.4437          |
-| 0.4382        | 20.0  | 120  | 0.4259          |
-| 0.407         | 21.0  | 126  | 0.4043          |
-| 0.3937        | 22.0  | 132  | 0.3824          |
-| 0.3753        | 23.0  | 138  | 0.3754          |
-| 0.3795        | 24.0  | 144  | 0.3496          |
-| 0.3553        | 25.0  | 150  | 0.3459          |
-| 0.3454        | 26.0  | 156  | 0.3359          |
-| 0.3391        | 27.0  | 162  | 0.3221          |
-| 0.3182        | 28.0  | 168  | 0.3027          |
-| 0.3087        | 29.0  | 174  | 0.2958          |
-| 0.288         | 30.0  | 180  | 0.2732          |
-| 0.288         | 31.0  | 186  | 0.2607          |
-| 0.2705        | 32.0  | 192  | 0.2444          |
-| 0.2637        | 33.0  | 198  | 0.2393          |
-| 0.2507        | 34.0  | 204  | 0.2264          |
-| 0.2331        | 35.0  | 210  | 0.2193          |
-| 0.2292        | 36.0  | 216  | 0.2118          |
-| 0.2238        | 37.0  | 222  | 0.2089          |
-| 0.2252        | 38.0  | 228  | 0.2051          |
-| 0.2131        | 39.0  | 234  | 0.2043          |
-| 0.2168        | 40.0  | 240  | 0.2014          |
 ### Framework versions

 This model is a fine-tuned version of [](https://huggingface.co/) on the None dataset.
 It achieves the following results on the evaluation set:
+- Loss: 0.0943
 ## Model description
 | Training Loss | Epoch | Step | Validation Loss |
 |:-------------:|:-----:|:----:|:---------------:|
+| 3.0793        | 1.0   | 12   | 2.2430          |
+| 1.9376        | 2.0   | 24   | 1.5349          |
+| 1.3941        | 3.0   | 36   | 1.2003          |
+| 1.1127        | 4.0   | 48   | 1.0107          |
+| 0.9531        | 5.0   | 60   | 0.8533          |
+| 0.84          | 6.0   | 72   | 0.7840          |
+| 0.7753        | 7.0   | 84   | 0.7185          |
+| 0.7678        | 8.0   | 96   | 0.7171          |
+| 0.724         | 9.0   | 108  | 0.6569          |
+| 0.6601        | 10.0  | 120  | 0.6202          |
+| 0.6235        | 11.0  | 132  | 0.5901          |
+| 0.5875        | 12.0  | 144  | 0.5537          |
+| 0.5707        | 13.0  | 156  | 0.5714          |
+| 0.5528        | 14.0  | 168  | 0.5239          |
+| 0.5327        | 15.0  | 180  | 0.5050          |
+| 0.5042        | 16.0  | 192  | 0.4515          |
+| 0.4587        | 17.0  | 204  | 0.4170          |
+| 0.4317        | 18.0  | 216  | 0.3874          |
+| 0.4012        | 19.0  | 228  | 0.3570          |
+| 0.3729        | 20.0  | 240  | 0.3287          |
+| 0.3486        | 21.0  | 252  | 0.3186          |
+| 0.3391        | 22.0  | 264  | 0.2798          |
+| 0.2975        | 23.0  | 276  | 0.2586          |
+| 0.2832        | 24.0  | 288  | 0.2426          |
+| 0.2641        | 25.0  | 300  | 0.2202          |
+| 0.2427        | 26.0  | 312  | 0.2055          |
+| 0.2315        | 27.0  | 324  | 0.1902          |
+| 0.2149        | 28.0  | 336  | 0.1758          |
+| 0.1983        | 29.0  | 348  | 0.1705          |
+| 0.1865        | 30.0  | 360  | 0.1524          |
+| 0.1732        | 31.0  | 372  | 0.1406          |
+| 0.1611        | 32.0  | 384  | 0.1336          |
+| 0.1514        | 33.0  | 396  | 0.1309          |
+| 0.1443        | 34.0  | 408  | 0.1202          |
+| 0.1374        | 35.0  | 420  | 0.1127          |
+| 0.1302        | 36.0  | 432  | 0.1050          |
+| 0.1247        | 37.0  | 444  | 0.1050          |
+| 0.12          | 38.0  | 456  | 0.0985          |
+| 0.1159        | 39.0  | 468  | 0.0960          |
+| 0.1144        | 40.0  | 480  | 0.0943          |
 ### Framework versions

config.json CHANGED Viewed

@@ -78,7 +78,7 @@
     "typical_p": 1.0,
     "use_bfloat16": false,
     "use_cache": true,
-    "vocab_size": 53
   },
   "decoder_start_token_id": 2,
   "encoder": {
@@ -157,7 +157,7 @@
     "typical_p": 1.0,
     "use_bfloat16": false,
     "use_cache": true,
-    "vocab_size": 53
   },
   "eos_token_id": 0,
   "is_encoder_decoder": true,

     "typical_p": 1.0,
     "use_bfloat16": false,
     "use_cache": true,
+    "vocab_size": 99
   },
   "decoder_start_token_id": 2,
   "encoder": {
     "typical_p": 1.0,
     "use_bfloat16": false,
     "use_cache": true,
+    "vocab_size": 99
   },
   "eos_token_id": 0,
   "is_encoder_decoder": true,

model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:f1718e7b86e2847840f6c60a23032d116ce48f66e5c61b46aed03617e0ddab03
-size 31207604

 version https://git-lfs.github.com/spec/v1
+oid sha256:ef070266d38568680a80d34762c0f65f401fce8618045f620bd8527c7fe04619
+size 31301996

runs/Mar04_14-00-51_d8c8da50ec4e/events.out.tfevents.1709560851.d8c8da50ec4e.409.2 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:e9705e0a62d2ef54ca7f2fde513e665e3a3f3726b7922fb965147bc304319c0a
+size 28096

tokenizer.json CHANGED Viewed

@@ -114,79 +114,171 @@
       "9": 15,
       "=": 16,
       "10": 17,
-      "99": 18,
-      "11": 19,
-      "98": 20,
       "12": 21,
-      "97": 22,
-      "13": 23,
-      "96": 24,
-      "95": 25,
-      "14": 26,
-      "15": 27,
-      "94": 28,
-      "16": 29,
-      "93": 30,
-      "17": 31,
-      "92": 32,
-      "18": 33,
-      "91": 34,
-      "19": 35,
-      "90": 36,
-      "20": 37,
-      "89": 38,
-      "88": 39,
-      "21": 40,
-      "22": 41,
-      "87": 42,
-      "23": 43,
-      "86": 44,
-      "24": 45,
-      "85": 46,
-      "84": 47,
-      "25": 48,
-      "26": 49,
-      "83": 50,
-      "27": 51,
-      "82": 52
     },
     "merges": [
       "1 0",
-      "9 9",
       "1 1",
-      "9 8",
       "1 2",
       "9 7",
-      "1 3",
-      "9 6",
       "9 5",
-      "1 4",
-      "1 5",
       "9 4",
-      "1 6",
       "9 3",
-      "1 7",
       "9 2",
-      "1 8",
       "9 1",
-      "1 9",
       "9 0",
-      "2 0",
       "8 9",
       "8 8",
-      "2 1",
-      "2 2",
       "8 7",
-      "2 3",
       "8 6",
-      "2 4",
       "8 5",
-      "8 4",
-      "2 5",
-      "2 6",
       "8 3",
-      "2 7",
-      "8 2"
     ]
   }
 }

       "9": 15,
       "=": 16,
       "10": 17,
+      "11": 18,
+      "13": 19,
+      "19": 20,
       "12": 21,
+      "15": 22,
+      "14": 23,
+      "16": 24,
+      "17": 25,
+      "18": 26,
+      "20": 27,
+      "97": 28,
+      "99": 29,
+      "98": 30,
+      "21": 31,
+      "24": 32,
+      "22": 33,
+      "23": 34,
+      "95": 35,
+      "96": 36,
+      "25": 37,
+      "26": 38,
+      "94": 39,
+      "93": 40,
+      "27": 41,
+      "92": 42,
+      "91": 43,
+      "28": 44,
+      "90": 45,
+      "29": 46,
+      "89": 47,
+      "88": 48,
+      "32": 49,
+      "31": 50,
+      "30": 51,
+      "87": 52,
+      "33": 53,
+      "34": 54,
+      "86": 55,
+      "35": 56,
+      "85": 57,
+      "36": 58,
+      "83": 59,
+      "84": 60,
+      "37": 61,
+      "82": 62,
+      "81": 63,
+      "38": 64,
+      "39": 65,
+      "40": 66,
+      "80": 67,
+      "41": 68,
+      "79": 69,
+      "78": 70,
+      "43": 71,
+      "45": 72,
+      "76": 73,
+      "42": 74,
+      "77": 75,
+      "44": 76,
+      "75": 77,
+      "46": 78,
+      "47": 79,
+      "73": 80,
+      "71": 81,
+      "72": 82,
+      "74": 83,
+      "50": 84,
+      "49": 85,
+      "70": 86,
+      "48": 87,
+      "68": 88,
+      "51": 89,
+      "52": 90,
+      "69": 91,
+      "67": 92,
+      "65": 93,
+      "53": 94,
+      "54": 95,
+      "55": 96,
+      "66": 97,
+      "56": 98
     },
     "merges": [
       "1 0",
       "1 1",
+      "1 3",
+      "1 9",
       "1 2",
+      "1 5",
+      "1 4",
+      "1 6",
+      "1 7",
+      "1 8",
+      "2 0",
       "9 7",
+      "9 9",
+      "9 8",
+      "2 1",
+      "2 4",
+      "2 2",
+      "2 3",
       "9 5",
+      "9 6",
+      "2 5",
+      "2 6",
       "9 4",
       "9 3",
+      "2 7",
       "9 2",
       "9 1",
+      "2 8",
       "9 0",
+      "2 9",
       "8 9",
       "8 8",
+      "3 2",
+      "3 1",
+      "3 0",
       "8 7",
+      "3 3",
+      "3 4",
       "8 6",
+      "3 5",
       "8 5",
+      "3 6",
       "8 3",
+      "8 4",
+      "3 7",
+      "8 2",
+      "8 1",
+      "3 8",
+      "3 9",
+      "4 0",
+      "8 0",
+      "4 1",
+      "7 9",
+      "7 8",
+      "4 3",
+      "4 5",
+      "7 6",
+      "4 2",
+      "7 7",
+      "4 4",
+      "7 5",
+      "4 6",
+      "4 7",
+      "7 3",
+      "7 1",
+      "7 2",
+      "7 4",
+      "5 0",
+      "4 9",
+      "7 0",
+      "4 8",
+      "6 8",
+      "5 1",
+      "5 2",
+      "6 9",
+      "6 7",
+      "6 5",
+      "5 3",
+      "5 4",
+      "5 5",
+      "6 6",
+      "5 6"
     ]
   }
 }

training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:ac7ad0845eaad54b53a1cc4f9a14b90eecd2370ffb4954a8c0a67c31b5e464ae
 size 5112

 version https://git-lfs.github.com/spec/v1
+oid sha256:f60299a6ccf7de1e094eb15269b535f3bb4b8176d7eb4c126608ea557871b5d3
 size 5112