JEdward7777
/

delivery_truck_classification

@@ -1,13 +1,13 @@
 {
-    "epoch": 39.8,
-    "eval_accuracy": 0.9714285714285714,
-    "eval_loss": 0.1382756382226944,
-    "eval_runtime": 6.6641,
-    "eval_samples_per_second": 5.252,
-    "eval_steps_per_second": 0.3,
-    "total_flos": 3.088453228308726e+17,
-    "train_loss": 0.15159874260425568,
-    "train_runtime": 6474.8036,
-    "train_samples_per_second": 1.927,
-    "train_steps_per_second": 0.012
 }

 {
+    "epoch": 39.73,
+    "eval_accuracy": 1.0,
+    "eval_loss": 0.0415542908012867,
+    "eval_runtime": 7.8769,
+    "eval_samples_per_second": 4.697,
+    "eval_steps_per_second": 0.254,
+    "total_flos": 3.262961773565706e+17,
+    "train_loss": 0.18748833239078522,
+    "train_runtime": 7500.5041,
+    "train_samples_per_second": 1.76,
+    "train_steps_per_second": 0.011
 }

eval_results.json CHANGED Viewed

@@ -1,8 +1,8 @@
 {
-    "epoch": 39.8,
-    "eval_accuracy": 0.9714285714285714,
-    "eval_loss": 0.1382756382226944,
-    "eval_runtime": 6.6641,
-    "eval_samples_per_second": 5.252,
-    "eval_steps_per_second": 0.3
 }

 {
+    "epoch": 39.73,
+    "eval_accuracy": 1.0,
+    "eval_loss": 0.0415542908012867,
+    "eval_runtime": 7.8769,
+    "eval_samples_per_second": 4.697,
+    "eval_steps_per_second": 0.254
 }

train_results.json CHANGED Viewed

@@ -1,8 +1,8 @@
 {
-    "epoch": 39.8,
-    "total_flos": 3.088453228308726e+17,
-    "train_loss": 0.15159874260425568,
-    "train_runtime": 6474.8036,
-    "train_samples_per_second": 1.927,
-    "train_steps_per_second": 0.012
 }

 {
+    "epoch": 39.73,
+    "total_flos": 3.262961773565706e+17,
+    "train_loss": 0.18748833239078522,
+    "train_runtime": 7500.5041,
+    "train_samples_per_second": 1.76,
+    "train_steps_per_second": 0.011
 }

trainer_state.json CHANGED Viewed

@@ -1,409 +1,409 @@
 {
-  "best_metric": 0.9714285714285714,
-  "best_model_checkpoint": "delivery_truck_classification\\checkpoint-4",
-  "epoch": 39.8,
   "global_step": 80,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
   "log_history": [
     {
-      "epoch": 0.8,
-      "eval_accuracy": 0.9428571428571428,
-      "eval_loss": 0.19194960594177246,
-      "eval_runtime": 8.8411,
-      "eval_samples_per_second": 3.959,
-      "eval_steps_per_second": 0.226,
       "step": 2
     },
     {
-      "epoch": 1.8,
-      "eval_accuracy": 0.9714285714285714,
-      "eval_loss": 0.1382756382226944,
-      "eval_runtime": 7.2367,
-      "eval_samples_per_second": 4.836,
-      "eval_steps_per_second": 0.276,
       "step": 4
     },
     {
-      "epoch": 2.8,
-      "eval_accuracy": 0.9142857142857143,
-      "eval_loss": 0.19303296506404877,
-      "eval_runtime": 7.0677,
-      "eval_samples_per_second": 4.952,
-      "eval_steps_per_second": 0.283,
       "step": 6
     },
     {
-      "epoch": 3.8,
-      "eval_accuracy": 0.9714285714285714,
-      "eval_loss": 0.1462627798318863,
-      "eval_runtime": 7.1631,
-      "eval_samples_per_second": 4.886,
-      "eval_steps_per_second": 0.279,
       "step": 8
     },
     {
-      "epoch": 4.8,
-      "eval_accuracy": 0.9714285714285714,
-      "eval_loss": 0.1735035479068756,
-      "eval_runtime": 6.91,
-      "eval_samples_per_second": 5.065,
-      "eval_steps_per_second": 0.289,
       "step": 10
     },
     {
-      "epoch": 5.8,
-      "eval_accuracy": 0.9714285714285714,
-      "eval_loss": 0.1692284345626831,
-      "eval_runtime": 6.8605,
-      "eval_samples_per_second": 5.102,
-      "eval_steps_per_second": 0.292,
       "step": 12
     },
     {
-      "epoch": 6.8,
-      "eval_accuracy": 0.9714285714285714,
-      "eval_loss": 0.1626075655221939,
-      "eval_runtime": 6.8284,
-      "eval_samples_per_second": 5.126,
-      "eval_steps_per_second": 0.293,
       "step": 14
     },
     {
-      "epoch": 7.8,
-      "eval_accuracy": 0.9714285714285714,
-      "eval_loss": 0.16586509346961975,
-      "eval_runtime": 6.3075,
-      "eval_samples_per_second": 5.549,
-      "eval_steps_per_second": 0.317,
       "step": 16
     },
     {
-      "epoch": 8.8,
-      "eval_accuracy": 0.9714285714285714,
-      "eval_loss": 0.1622493714094162,
-      "eval_runtime": 6.8493,
-      "eval_samples_per_second": 5.11,
-      "eval_steps_per_second": 0.292,
       "step": 18
     },
     {
-      "epoch": 9.8,
       "learning_rate": 4.166666666666667e-05,
-      "loss": 0.2046,
       "step": 20
     },
     {
-      "epoch": 9.8,
-      "eval_accuracy": 0.9714285714285714,
-      "eval_loss": 0.1598205715417862,
-      "eval_runtime": 6.8584,
-      "eval_samples_per_second": 5.103,
-      "eval_steps_per_second": 0.292,
       "step": 20
     },
     {
-      "epoch": 10.8,
-      "eval_accuracy": 0.9714285714285714,
-      "eval_loss": 0.16681121289730072,
-      "eval_runtime": 7.2746,
-      "eval_samples_per_second": 4.811,
-      "eval_steps_per_second": 0.275,
       "step": 22
     },
     {
-      "epoch": 11.8,
-      "eval_accuracy": 0.9714285714285714,
-      "eval_loss": 0.1746995747089386,
-      "eval_runtime": 7.1258,
-      "eval_samples_per_second": 4.912,
-      "eval_steps_per_second": 0.281,
       "step": 24
     },
     {
-      "epoch": 12.8,
-      "eval_accuracy": 0.9714285714285714,
-      "eval_loss": 0.18037545680999756,
-      "eval_runtime": 6.9863,
-      "eval_samples_per_second": 5.01,
-      "eval_steps_per_second": 0.286,
       "step": 26
     },
     {
-      "epoch": 13.8,
-      "eval_accuracy": 0.9714285714285714,
-      "eval_loss": 0.18370455503463745,
-      "eval_runtime": 6.1139,
-      "eval_samples_per_second": 5.725,
-      "eval_steps_per_second": 0.327,
       "step": 28
     },
     {
-      "epoch": 14.8,
-      "eval_accuracy": 0.9714285714285714,
-      "eval_loss": 0.1837157905101776,
-      "eval_runtime": 6.7444,
-      "eval_samples_per_second": 5.189,
-      "eval_steps_per_second": 0.297,
       "step": 30
     },
     {
-      "epoch": 15.8,
-      "eval_accuracy": 0.9714285714285714,
-      "eval_loss": 0.18111634254455566,
-      "eval_runtime": 7.0847,
-      "eval_samples_per_second": 4.94,
-      "eval_steps_per_second": 0.282,
       "step": 32
     },
     {
-      "epoch": 16.8,
-      "eval_accuracy": 0.9714285714285714,
-      "eval_loss": 0.18009454011917114,
-      "eval_runtime": 6.8211,
-      "eval_samples_per_second": 5.131,
-      "eval_steps_per_second": 0.293,
       "step": 34
     },
     {
-      "epoch": 17.8,
-      "eval_accuracy": 0.9714285714285714,
-      "eval_loss": 0.18408751487731934,
-      "eval_runtime": 6.9341,
-      "eval_samples_per_second": 5.048,
-      "eval_steps_per_second": 0.288,
       "step": 36
     },
     {
-      "epoch": 18.8,
-      "eval_accuracy": 0.9714285714285714,
-      "eval_loss": 0.1899442970752716,
-      "eval_runtime": 7.0358,
-      "eval_samples_per_second": 4.975,
-      "eval_steps_per_second": 0.284,
       "step": 38
     },
     {
-      "epoch": 19.8,
       "learning_rate": 2.777777777777778e-05,
-      "loss": 0.1657,
       "step": 40
     },
     {
-      "epoch": 19.8,
-      "eval_accuracy": 0.9714285714285714,
-      "eval_loss": 0.19598019123077393,
-      "eval_runtime": 7.9601,
-      "eval_samples_per_second": 4.397,
-      "eval_steps_per_second": 0.251,
       "step": 40
     },
     {
-      "epoch": 20.8,
-      "eval_accuracy": 0.9714285714285714,
-      "eval_loss": 0.19925238192081451,
-      "eval_runtime": 7.4131,
-      "eval_samples_per_second": 4.721,
-      "eval_steps_per_second": 0.27,
       "step": 42
     },
     {
-      "epoch": 21.8,
-      "eval_accuracy": 0.9714285714285714,
-      "eval_loss": 0.20172713696956635,
-      "eval_runtime": 6.7891,
-      "eval_samples_per_second": 5.155,
-      "eval_steps_per_second": 0.295,
       "step": 44
     },
     {
-      "epoch": 22.8,
-      "eval_accuracy": 0.9714285714285714,
-      "eval_loss": 0.2004331350326538,
-      "eval_runtime": 6.2296,
-      "eval_samples_per_second": 5.618,
-      "eval_steps_per_second": 0.321,
       "step": 46
     },
     {
-      "epoch": 23.8,
-      "eval_accuracy": 0.9714285714285714,
-      "eval_loss": 0.19216616451740265,
-      "eval_runtime": 7.0857,
-      "eval_samples_per_second": 4.94,
-      "eval_steps_per_second": 0.282,
       "step": 48
     },
     {
-      "epoch": 24.8,
-      "eval_accuracy": 0.9714285714285714,
-      "eval_loss": 0.18559373915195465,
-      "eval_runtime": 7.3612,
-      "eval_samples_per_second": 4.755,
-      "eval_steps_per_second": 0.272,
       "step": 50
     },
     {
-      "epoch": 25.8,
-      "eval_accuracy": 0.9714285714285714,
-      "eval_loss": 0.18343603610992432,
-      "eval_runtime": 6.8088,
-      "eval_samples_per_second": 5.14,
-      "eval_steps_per_second": 0.294,
       "step": 52
     },
     {
-      "epoch": 26.8,
-      "eval_accuracy": 0.9714285714285714,
-      "eval_loss": 0.18461596965789795,
-      "eval_runtime": 6.6873,
-      "eval_samples_per_second": 5.234,
-      "eval_steps_per_second": 0.299,
       "step": 54
     },
     {
-      "epoch": 27.8,
-      "eval_accuracy": 0.9714285714285714,
-      "eval_loss": 0.18977026641368866,
-      "eval_runtime": 6.826,
-      "eval_samples_per_second": 5.127,
-      "eval_steps_per_second": 0.293,
       "step": 56
     },
     {
-      "epoch": 28.8,
-      "eval_accuracy": 0.9714285714285714,
-      "eval_loss": 0.1951347291469574,
-      "eval_runtime": 6.8913,
-      "eval_samples_per_second": 5.079,
-      "eval_steps_per_second": 0.29,
       "step": 58
     },
     {
-      "epoch": 29.8,
       "learning_rate": 1.388888888888889e-05,
-      "loss": 0.1308,
       "step": 60
     },
     {
-      "epoch": 29.8,
-      "eval_accuracy": 0.9714285714285714,
-      "eval_loss": 0.20185869932174683,
-      "eval_runtime": 6.8601,
-      "eval_samples_per_second": 5.102,
-      "eval_steps_per_second": 0.292,
       "step": 60
     },
     {
-      "epoch": 30.8,
-      "eval_accuracy": 0.9714285714285714,
-      "eval_loss": 0.2095019370317459,
-      "eval_runtime": 7.2055,
-      "eval_samples_per_second": 4.857,
-      "eval_steps_per_second": 0.278,
       "step": 62
     },
     {
-      "epoch": 31.8,
-      "eval_accuracy": 0.9714285714285714,
-      "eval_loss": 0.21445579826831818,
-      "eval_runtime": 7.4924,
-      "eval_samples_per_second": 4.671,
-      "eval_steps_per_second": 0.267,
       "step": 64
     },
     {
-      "epoch": 32.8,
-      "eval_accuracy": 0.9714285714285714,
-      "eval_loss": 0.21541449427604675,
-      "eval_runtime": 6.8812,
-      "eval_samples_per_second": 5.086,
-      "eval_steps_per_second": 0.291,
       "step": 66
     },
     {
-      "epoch": 33.8,
-      "eval_accuracy": 0.9714285714285714,
-      "eval_loss": 0.21372175216674805,
-      "eval_runtime": 6.9147,
-      "eval_samples_per_second": 5.062,
-      "eval_steps_per_second": 0.289,
       "step": 68
     },
     {
-      "epoch": 34.8,
-      "eval_accuracy": 0.9714285714285714,
-      "eval_loss": 0.2116171419620514,
-      "eval_runtime": 7.0628,
-      "eval_samples_per_second": 4.956,
-      "eval_steps_per_second": 0.283,
       "step": 70
     },
     {
-      "epoch": 35.8,
-      "eval_accuracy": 0.9714285714285714,
-      "eval_loss": 0.20960116386413574,
-      "eval_runtime": 7.1202,
-      "eval_samples_per_second": 4.916,
-      "eval_steps_per_second": 0.281,
       "step": 72
     },
     {
-      "epoch": 36.8,
-      "eval_accuracy": 0.9714285714285714,
-      "eval_loss": 0.20841823518276215,
-      "eval_runtime": 7.1749,
-      "eval_samples_per_second": 4.878,
-      "eval_steps_per_second": 0.279,
       "step": 74
     },
     {
-      "epoch": 37.8,
-      "eval_accuracy": 0.9714285714285714,
-      "eval_loss": 0.20780029892921448,
-      "eval_runtime": 6.9083,
-      "eval_samples_per_second": 5.066,
-      "eval_steps_per_second": 0.29,
       "step": 76
     },
     {
-      "epoch": 38.8,
-      "eval_accuracy": 0.9714285714285714,
-      "eval_loss": 0.2074960172176361,
-      "eval_runtime": 6.9495,
-      "eval_samples_per_second": 5.036,
-      "eval_steps_per_second": 0.288,
       "step": 78
     },
     {
-      "epoch": 39.8,
       "learning_rate": 0.0,
-      "loss": 0.1053,
       "step": 80
     },
     {
-      "epoch": 39.8,
-      "eval_accuracy": 0.9714285714285714,
-      "eval_loss": 0.20739802718162537,
-      "eval_runtime": 6.9547,
-      "eval_samples_per_second": 5.033,
-      "eval_steps_per_second": 0.288,
       "step": 80
     },
     {
-      "epoch": 39.8,
       "step": 80,
-      "total_flos": 3.088453228308726e+17,
-      "train_loss": 0.15159874260425568,
-      "train_runtime": 6474.8036,
-      "train_samples_per_second": 1.927,
-      "train_steps_per_second": 0.012
     }
   ],
   "max_steps": 80,
   "num_train_epochs": 40,
-  "total_flos": 3.088453228308726e+17,
   "trial_name": null,
   "trial_params": null
 }

 {
+  "best_metric": 1.0,
+  "best_model_checkpoint": "delivery_truck_classification\\checkpoint-2",
+  "epoch": 39.72727272727273,
   "global_step": 80,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
   "log_history": [
     {
+      "epoch": 0.73,
+      "eval_accuracy": 1.0,
+      "eval_loss": 0.0415542908012867,
+      "eval_runtime": 7.7969,
+      "eval_samples_per_second": 4.745,
+      "eval_steps_per_second": 0.257,
       "step": 2
     },
     {
+      "epoch": 1.73,
+      "eval_accuracy": 1.0,
+      "eval_loss": 0.03460519760847092,
+      "eval_runtime": 9.6408,
+      "eval_samples_per_second": 3.838,
+      "eval_steps_per_second": 0.207,
       "step": 4
     },
     {
+      "epoch": 2.73,
+      "eval_accuracy": 1.0,
+      "eval_loss": 0.029270131140947342,
+      "eval_runtime": 11.5968,
+      "eval_samples_per_second": 3.191,
+      "eval_steps_per_second": 0.172,
       "step": 6
     },
     {
+      "epoch": 3.73,
+      "eval_accuracy": 1.0,
+      "eval_loss": 0.01861225999891758,
+      "eval_runtime": 8.4881,
+      "eval_samples_per_second": 4.359,
+      "eval_steps_per_second": 0.236,
       "step": 8
     },
     {
+      "epoch": 4.73,
+      "eval_accuracy": 1.0,
+      "eval_loss": 0.020498055964708328,
+      "eval_runtime": 9.9982,
+      "eval_samples_per_second": 3.701,
+      "eval_steps_per_second": 0.2,
       "step": 10
     },
     {
+      "epoch": 5.73,
+      "eval_accuracy": 0.972972972972973,
+      "eval_loss": 0.06043216958642006,
+      "eval_runtime": 8.9914,
+      "eval_samples_per_second": 4.115,
+      "eval_steps_per_second": 0.222,
       "step": 12
     },
     {
+      "epoch": 6.73,
+      "eval_accuracy": 1.0,
+      "eval_loss": 0.0332246832549572,
+      "eval_runtime": 8.8254,
+      "eval_samples_per_second": 4.192,
+      "eval_steps_per_second": 0.227,
       "step": 14
     },
     {
+      "epoch": 7.73,
+      "eval_accuracy": 1.0,
+      "eval_loss": 0.025004582479596138,
+      "eval_runtime": 11.8616,
+      "eval_samples_per_second": 3.119,
+      "eval_steps_per_second": 0.169,
       "step": 16
     },
     {
+      "epoch": 8.73,
+      "eval_accuracy": 1.0,
+      "eval_loss": 0.03864024579524994,
+      "eval_runtime": 8.8843,
+      "eval_samples_per_second": 4.165,
+      "eval_steps_per_second": 0.225,
       "step": 18
     },
     {
+      "epoch": 9.73,
       "learning_rate": 4.166666666666667e-05,
+      "loss": 0.2483,
       "step": 20
     },
     {
+      "epoch": 9.73,
+      "eval_accuracy": 1.0,
+      "eval_loss": 0.04379289597272873,
+      "eval_runtime": 8.6752,
+      "eval_samples_per_second": 4.265,
+      "eval_steps_per_second": 0.231,
       "step": 20
     },
     {
+      "epoch": 10.73,
+      "eval_accuracy": 1.0,
+      "eval_loss": 0.04468226432800293,
+      "eval_runtime": 8.2704,
+      "eval_samples_per_second": 4.474,
+      "eval_steps_per_second": 0.242,
       "step": 22
     },
     {
+      "epoch": 11.73,
+      "eval_accuracy": 0.972972972972973,
+      "eval_loss": 0.06756877154111862,
+      "eval_runtime": 8.2231,
+      "eval_samples_per_second": 4.5,
+      "eval_steps_per_second": 0.243,
       "step": 24
     },
     {
+      "epoch": 12.73,
+      "eval_accuracy": 0.972972972972973,
+      "eval_loss": 0.07861027866601944,
+      "eval_runtime": 8.9079,
+      "eval_samples_per_second": 4.154,
+      "eval_steps_per_second": 0.225,
       "step": 26
     },
     {
+      "epoch": 13.73,
+      "eval_accuracy": 1.0,
+      "eval_loss": 0.03886393457651138,
+      "eval_runtime": 7.4091,
+      "eval_samples_per_second": 4.994,
+      "eval_steps_per_second": 0.27,
       "step": 28
     },
     {
+      "epoch": 14.73,
+      "eval_accuracy": 1.0,
+      "eval_loss": 0.02784094214439392,
+      "eval_runtime": 9.7376,
+      "eval_samples_per_second": 3.8,
+      "eval_steps_per_second": 0.205,
       "step": 30
     },
     {
+      "epoch": 15.73,
+      "eval_accuracy": 1.0,
+      "eval_loss": 0.02497038058936596,
+      "eval_runtime": 7.3256,
+      "eval_samples_per_second": 5.051,
+      "eval_steps_per_second": 0.273,
       "step": 32
     },
     {
+      "epoch": 16.73,
+      "eval_accuracy": 1.0,
+      "eval_loss": 0.02828327752649784,
+      "eval_runtime": 11.0099,
+      "eval_samples_per_second": 3.361,
+      "eval_steps_per_second": 0.182,
       "step": 34
     },
     {
+      "epoch": 17.73,
+      "eval_accuracy": 0.972972972972973,
+      "eval_loss": 0.05021832138299942,
+      "eval_runtime": 9.5468,
+      "eval_samples_per_second": 3.876,
+      "eval_steps_per_second": 0.209,
       "step": 36
     },
     {
+      "epoch": 18.73,
+      "eval_accuracy": 0.972972972972973,
+      "eval_loss": 0.07113233208656311,
+      "eval_runtime": 7.5069,
+      "eval_samples_per_second": 4.929,
+      "eval_steps_per_second": 0.266,
       "step": 38
     },
     {
+      "epoch": 19.73,
       "learning_rate": 2.777777777777778e-05,
+      "loss": 0.1759,
       "step": 40
     },
     {
+      "epoch": 19.73,
+      "eval_accuracy": 0.972972972972973,
+      "eval_loss": 0.06368651241064072,
+      "eval_runtime": 10.8688,
+      "eval_samples_per_second": 3.404,
+      "eval_steps_per_second": 0.184,
       "step": 40
     },
     {
+      "epoch": 20.73,
+      "eval_accuracy": 1.0,
+      "eval_loss": 0.04590895399451256,
+      "eval_runtime": 7.36,
+      "eval_samples_per_second": 5.027,
+      "eval_steps_per_second": 0.272,
       "step": 42
     },
     {
+      "epoch": 21.73,
+      "eval_accuracy": 1.0,
+      "eval_loss": 0.03937483951449394,
+      "eval_runtime": 7.6664,
+      "eval_samples_per_second": 4.826,
+      "eval_steps_per_second": 0.261,
       "step": 44
     },
     {
+      "epoch": 22.73,
+      "eval_accuracy": 1.0,
+      "eval_loss": 0.04189879819750786,
+      "eval_runtime": 7.6918,
+      "eval_samples_per_second": 4.81,
+      "eval_steps_per_second": 0.26,
       "step": 46
     },
     {
+      "epoch": 23.73,
+      "eval_accuracy": 1.0,
+      "eval_loss": 0.042252812534570694,
+      "eval_runtime": 9.2536,
+      "eval_samples_per_second": 3.998,
+      "eval_steps_per_second": 0.216,
       "step": 48
     },
     {
+      "epoch": 24.73,
+      "eval_accuracy": 0.972972972972973,
+      "eval_loss": 0.046256761997938156,
+      "eval_runtime": 8.404,
+      "eval_samples_per_second": 4.403,
+      "eval_steps_per_second": 0.238,
       "step": 50
     },
     {
+      "epoch": 25.73,
+      "eval_accuracy": 0.972972972972973,
+      "eval_loss": 0.050322916358709335,
+      "eval_runtime": 7.2832,
+      "eval_samples_per_second": 5.08,
+      "eval_steps_per_second": 0.275,
       "step": 52
     },
     {
+      "epoch": 26.73,
+      "eval_accuracy": 0.972972972972973,
+      "eval_loss": 0.061594847589731216,
+      "eval_runtime": 7.736,
+      "eval_samples_per_second": 4.783,
+      "eval_steps_per_second": 0.259,
       "step": 54
     },
     {
+      "epoch": 27.73,
+      "eval_accuracy": 0.972972972972973,
+      "eval_loss": 0.0641237199306488,
+      "eval_runtime": 8.3429,
+      "eval_samples_per_second": 4.435,
+      "eval_steps_per_second": 0.24,
       "step": 56
     },
     {
+      "epoch": 28.73,
+      "eval_accuracy": 0.972972972972973,
+      "eval_loss": 0.05289805307984352,
+      "eval_runtime": 6.6939,
+      "eval_samples_per_second": 5.527,
+      "eval_steps_per_second": 0.299,
       "step": 58
     },
     {
+      "epoch": 29.73,
       "learning_rate": 1.388888888888889e-05,
+      "loss": 0.1669,
       "step": 60
     },
     {
+      "epoch": 29.73,
+      "eval_accuracy": 0.972972972972973,
+      "eval_loss": 0.048487674444913864,
+      "eval_runtime": 8.2178,
+      "eval_samples_per_second": 4.502,
+      "eval_steps_per_second": 0.243,
       "step": 60
     },
     {
+      "epoch": 30.73,
+      "eval_accuracy": 0.972972972972973,
+      "eval_loss": 0.04654627665877342,
+      "eval_runtime": 9.0621,
+      "eval_samples_per_second": 4.083,
+      "eval_steps_per_second": 0.221,
       "step": 62
     },
     {
+      "epoch": 31.73,
+      "eval_accuracy": 0.972972972972973,
+      "eval_loss": 0.045613404363393784,
+      "eval_runtime": 7.5057,
+      "eval_samples_per_second": 4.93,
+      "eval_steps_per_second": 0.266,
       "step": 64
     },
     {
+      "epoch": 32.73,
+      "eval_accuracy": 0.972972972972973,
+      "eval_loss": 0.047752730548381805,
+      "eval_runtime": 7.6794,
+      "eval_samples_per_second": 4.818,
+      "eval_steps_per_second": 0.26,
       "step": 66
     },
     {
+      "epoch": 33.73,
+      "eval_accuracy": 0.972972972972973,
+      "eval_loss": 0.0467178151011467,
+      "eval_runtime": 7.7621,
+      "eval_samples_per_second": 4.767,
+      "eval_steps_per_second": 0.258,
       "step": 68
     },
     {
+      "epoch": 34.73,
+      "eval_accuracy": 0.972972972972973,
+      "eval_loss": 0.04733948037028313,
+      "eval_runtime": 8.0246,
+      "eval_samples_per_second": 4.611,
+      "eval_steps_per_second": 0.249,
       "step": 70
     },
     {
+      "epoch": 35.73,
+      "eval_accuracy": 0.972972972972973,
+      "eval_loss": 0.048583876341581345,
+      "eval_runtime": 8.5589,
+      "eval_samples_per_second": 4.323,
+      "eval_steps_per_second": 0.234,
       "step": 72
     },
     {
+      "epoch": 36.73,
+      "eval_accuracy": 0.972972972972973,
+      "eval_loss": 0.05004884675145149,
+      "eval_runtime": 7.4868,
+      "eval_samples_per_second": 4.942,
+      "eval_steps_per_second": 0.267,
       "step": 74
     },
     {
+      "epoch": 37.73,
+      "eval_accuracy": 0.972972972972973,
+      "eval_loss": 0.0501551553606987,
+      "eval_runtime": 8.2774,
+      "eval_samples_per_second": 4.47,
+      "eval_steps_per_second": 0.242,
       "step": 76
     },
     {
+      "epoch": 38.73,
+      "eval_accuracy": 0.972972972972973,
+      "eval_loss": 0.05001495033502579,
+      "eval_runtime": 7.8563,
+      "eval_samples_per_second": 4.71,
+      "eval_steps_per_second": 0.255,
       "step": 78
     },
     {
+      "epoch": 39.73,
       "learning_rate": 0.0,
+      "loss": 0.1589,
       "step": 80
     },
     {
+      "epoch": 39.73,
+      "eval_accuracy": 0.972972972972973,
+      "eval_loss": 0.04929113760590553,
+      "eval_runtime": 8.4253,
+      "eval_samples_per_second": 4.392,
+      "eval_steps_per_second": 0.237,
       "step": 80
     },
     {
+      "epoch": 39.73,
       "step": 80,
+      "total_flos": 3.262961773565706e+17,
+      "train_loss": 0.18748833239078522,
+      "train_runtime": 7500.5041,
+      "train_samples_per_second": 1.76,
+      "train_steps_per_second": 0.011
     }
   ],
   "max_steps": 80,
   "num_train_epochs": 40,
+  "total_flos": 3.262961773565706e+17,
   "trial_name": null,
   "trial_params": null
 }