End of training

Browse files

Files changed (5) hide show

all_results.json +8 -8
eval_results.json +4 -4
runs/Dec16_15-39-46_129-146-104-29/events.out.tfevents.1671207700.129-146-104-29.131763.2 +3 -0
train_results.json +5 -5
trainer_state.json +322 -12

all_results.json CHANGED Viewed

@@ -1,15 +1,15 @@
 {
-    "epoch": 56.96,
     "eval_cer": 0.1969102547256584,
     "eval_loss": 0.9162458181381226,
-    "eval_runtime": 45.5404,
     "eval_samples": 481,
-    "eval_samples_per_second": 10.562,
-    "eval_steps_per_second": 1.339,
     "eval_wer": 0.5156036834924966,
-    "train_loss": 0.06285779211256239,
-    "train_runtime": 2146.9018,
     "train_samples": 2528,
-    "train_samples_per_second": 67.073,
-    "train_steps_per_second": 2.096
 }

 {
+    "epoch": 63.29,
     "eval_cer": 0.1969102547256584,
     "eval_loss": 0.9162458181381226,
+    "eval_runtime": 44.5084,
     "eval_samples": 481,
+    "eval_samples_per_second": 10.807,
+    "eval_steps_per_second": 1.371,
     "eval_wer": 0.5156036834924966,
+    "train_loss": 0.05515483856201172,
+    "train_runtime": 2237.6776,
     "train_samples": 2528,
+    "train_samples_per_second": 71.503,
+    "train_steps_per_second": 2.234
 }

eval_results.json CHANGED Viewed

@@ -1,10 +1,10 @@
 {
-    "epoch": 56.96,
     "eval_cer": 0.1969102547256584,
     "eval_loss": 0.9162458181381226,
-    "eval_runtime": 45.5404,
     "eval_samples": 481,
-    "eval_samples_per_second": 10.562,
-    "eval_steps_per_second": 1.339,
     "eval_wer": 0.5156036834924966
 }

 {
+    "epoch": 63.29,
     "eval_cer": 0.1969102547256584,
     "eval_loss": 0.9162458181381226,
+    "eval_runtime": 44.5084,
     "eval_samples": 481,
+    "eval_samples_per_second": 10.807,
+    "eval_steps_per_second": 1.371,
     "eval_wer": 0.5156036834924966
 }

runs/Dec16_15-39-46_129-146-104-29/events.out.tfevents.1671207700.129-146-104-29.131763.2 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:f83a25a085a2175f629e030fb53b3c3b594db36c16ed1ac8ad53615b96a60088
+size 405

train_results.json CHANGED Viewed

@@ -1,8 +1,8 @@
 {
-    "epoch": 56.96,
-    "train_loss": 0.06285779211256239,
-    "train_runtime": 2146.9018,
     "train_samples": 2528,
-    "train_samples_per_second": 67.073,
-    "train_steps_per_second": 2.096
 }

 {
+    "epoch": 63.29,
+    "train_loss": 0.05515483856201172,
+    "train_runtime": 2237.6776,
     "train_samples": 2528,
+    "train_samples_per_second": 71.503,
+    "train_steps_per_second": 2.234
 }

trainer_state.json CHANGED Viewed

@@ -1,8 +1,8 @@
 {
   "best_metric": 0.9162458181381226,
   "best_model_checkpoint": "./checkpoint-4000",
-  "epoch": 56.962025316455694,
-  "global_step": 4500,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
@@ -2798,18 +2798,328 @@
       "step": 4500
     },
     {
-      "epoch": 56.96,
-      "step": 4500,
-      "total_flos": 5.1775250042658095e+19,
-      "train_loss": 0.06285779211256239,
-      "train_runtime": 2146.9018,
-      "train_samples_per_second": 67.073,
-      "train_steps_per_second": 2.096
     }
   ],
-  "max_steps": 4500,
-  "num_train_epochs": 57,
-  "total_flos": 5.1775250042658095e+19,
   "trial_name": null,
   "trial_params": null
 }

 {
   "best_metric": 0.9162458181381226,
   "best_model_checkpoint": "./checkpoint-4000",
+  "epoch": 63.29113924050633,
+  "global_step": 5000,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
       "step": 4500
     },
     {
+      "epoch": 57.09,
+      "learning_rate": 1.2299999999999999e-05,
+      "loss": 0.5852,
+      "step": 4510
+    },
+    {
+      "epoch": 57.22,
+      "learning_rate": 1.205e-05,
+      "loss": 0.5752,
+      "step": 4520
+    },
+    {
+      "epoch": 57.34,
+      "learning_rate": 1.1799999999999999e-05,
+      "loss": 0.5433,
+      "step": 4530
+    },
+    {
+      "epoch": 57.47,
+      "learning_rate": 1.155e-05,
+      "loss": 0.5648,
+      "step": 4540
+    },
+    {
+      "epoch": 57.59,
+      "learning_rate": 1.1299999999999999e-05,
+      "loss": 0.5704,
+      "step": 4550
+    },
+    {
+      "epoch": 57.72,
+      "learning_rate": 1.105e-05,
+      "loss": 0.5216,
+      "step": 4560
+    },
+    {
+      "epoch": 57.85,
+      "learning_rate": 1.0799999999999998e-05,
+      "loss": 0.5998,
+      "step": 4570
+    },
+    {
+      "epoch": 57.97,
+      "learning_rate": 1.0549999999999999e-05,
+      "loss": 0.5439,
+      "step": 4580
+    },
+    {
+      "epoch": 58.1,
+      "learning_rate": 1.03e-05,
+      "loss": 0.5679,
+      "step": 4590
+    },
+    {
+      "epoch": 58.23,
+      "learning_rate": 1.005e-05,
+      "loss": 0.5621,
+      "step": 4600
+    },
+    {
+      "epoch": 58.35,
+      "learning_rate": 9.799999999999998e-06,
+      "loss": 0.5557,
+      "step": 4610
+    },
+    {
+      "epoch": 58.48,
+      "learning_rate": 9.549999999999998e-06,
+      "loss": 0.5525,
+      "step": 4620
+    },
+    {
+      "epoch": 58.61,
+      "learning_rate": 9.299999999999999e-06,
+      "loss": 0.6033,
+      "step": 4630
+    },
+    {
+      "epoch": 58.73,
+      "learning_rate": 9.05e-06,
+      "loss": 0.5059,
+      "step": 4640
+    },
+    {
+      "epoch": 58.86,
+      "learning_rate": 8.799999999999999e-06,
+      "loss": 0.5362,
+      "step": 4650
+    },
+    {
+      "epoch": 58.99,
+      "learning_rate": 8.55e-06,
+      "loss": 0.535,
+      "step": 4660
+    },
+    {
+      "epoch": 59.11,
+      "learning_rate": 8.299999999999998e-06,
+      "loss": 0.586,
+      "step": 4670
+    },
+    {
+      "epoch": 59.24,
+      "learning_rate": 8.05e-06,
+      "loss": 0.55,
+      "step": 4680
+    },
+    {
+      "epoch": 59.37,
+      "learning_rate": 7.799999999999998e-06,
+      "loss": 0.582,
+      "step": 4690
+    },
+    {
+      "epoch": 59.49,
+      "learning_rate": 7.55e-06,
+      "loss": 0.5065,
+      "step": 4700
+    },
+    {
+      "epoch": 59.62,
+      "learning_rate": 7.299999999999999e-06,
+      "loss": 0.5715,
+      "step": 4710
+    },
+    {
+      "epoch": 59.75,
+      "learning_rate": 7.049999999999999e-06,
+      "loss": 0.5359,
+      "step": 4720
+    },
+    {
+      "epoch": 59.87,
+      "learning_rate": 6.8e-06,
+      "loss": 0.5535,
+      "step": 4730
+    },
+    {
+      "epoch": 60.0,
+      "learning_rate": 6.549999999999999e-06,
+      "loss": 0.5256,
+      "step": 4740
+    },
+    {
+      "epoch": 60.13,
+      "learning_rate": 6.3e-06,
+      "loss": 0.5869,
+      "step": 4750
+    },
+    {
+      "epoch": 60.25,
+      "learning_rate": 6.05e-06,
+      "loss": 0.4978,
+      "step": 4760
+    },
+    {
+      "epoch": 60.38,
+      "learning_rate": 5.7999999999999995e-06,
+      "loss": 0.5402,
+      "step": 4770
+    },
+    {
+      "epoch": 60.51,
+      "learning_rate": 5.549999999999999e-06,
+      "loss": 0.5607,
+      "step": 4780
+    },
+    {
+      "epoch": 60.63,
+      "learning_rate": 5.3e-06,
+      "loss": 0.5583,
+      "step": 4790
+    },
+    {
+      "epoch": 60.76,
+      "learning_rate": 5.049999999999999e-06,
+      "loss": 0.5382,
+      "step": 4800
+    },
+    {
+      "epoch": 60.89,
+      "learning_rate": 4.8e-06,
+      "loss": 0.5498,
+      "step": 4810
+    },
+    {
+      "epoch": 61.01,
+      "learning_rate": 4.55e-06,
+      "loss": 0.5443,
+      "step": 4820
+    },
+    {
+      "epoch": 61.14,
+      "learning_rate": 4.2999999999999995e-06,
+      "loss": 0.5579,
+      "step": 4830
+    },
+    {
+      "epoch": 61.27,
+      "learning_rate": 4.049999999999999e-06,
+      "loss": 0.517,
+      "step": 4840
+    },
+    {
+      "epoch": 61.39,
+      "learning_rate": 3.7999999999999996e-06,
+      "loss": 0.566,
+      "step": 4850
+    },
+    {
+      "epoch": 61.52,
+      "learning_rate": 3.5499999999999995e-06,
+      "loss": 0.572,
+      "step": 4860
+    },
+    {
+      "epoch": 61.65,
+      "learning_rate": 3.2999999999999993e-06,
+      "loss": 0.5425,
+      "step": 4870
+    },
+    {
+      "epoch": 61.77,
+      "learning_rate": 3.0499999999999996e-06,
+      "loss": 0.5617,
+      "step": 4880
+    },
+    {
+      "epoch": 61.9,
+      "learning_rate": 2.8e-06,
+      "loss": 0.5352,
+      "step": 4890
+    },
+    {
+      "epoch": 62.03,
+      "learning_rate": 2.55e-06,
+      "loss": 0.5328,
+      "step": 4900
+    },
+    {
+      "epoch": 62.15,
+      "learning_rate": 2.2999999999999996e-06,
+      "loss": 0.567,
+      "step": 4910
+    },
+    {
+      "epoch": 62.28,
+      "learning_rate": 2.05e-06,
+      "loss": 0.554,
+      "step": 4920
+    },
+    {
+      "epoch": 62.41,
+      "learning_rate": 1.8e-06,
+      "loss": 0.5846,
+      "step": 4930
+    },
+    {
+      "epoch": 62.53,
+      "learning_rate": 1.5499999999999998e-06,
+      "loss": 0.5451,
+      "step": 4940
+    },
+    {
+      "epoch": 62.66,
+      "learning_rate": 1.2999999999999998e-06,
+      "loss": 0.5251,
+      "step": 4950
+    },
+    {
+      "epoch": 62.78,
+      "learning_rate": 1.05e-06,
+      "loss": 0.5373,
+      "step": 4960
+    },
+    {
+      "epoch": 62.91,
+      "learning_rate": 7.999999999999999e-07,
+      "loss": 0.5245,
+      "step": 4970
+    },
+    {
+      "epoch": 63.04,
+      "learning_rate": 5.499999999999999e-07,
+      "loss": 0.5535,
+      "step": 4980
+    },
+    {
+      "epoch": 63.16,
+      "learning_rate": 3e-07,
+      "loss": 0.545,
+      "step": 4990
+    },
+    {
+      "epoch": 63.29,
+      "learning_rate": 4.999999999999999e-08,
+      "loss": 0.5462,
+      "step": 5000
+    },
+    {
+      "epoch": 63.29,
+      "eval_cer": 0.19739830683460666,
+      "eval_loss": 0.9370450973510742,
+      "eval_runtime": 45.0983,
+      "eval_samples_per_second": 10.666,
+      "eval_steps_per_second": 1.353,
+      "eval_wer": 0.5138130968622101,
+      "step": 5000
+    },
+    {
+      "epoch": 63.29,
+      "step": 5000,
+      "total_flos": 5.7547597013827174e+19,
+      "train_loss": 0.05515483856201172,
+      "train_runtime": 2237.6776,
+      "train_samples_per_second": 71.503,
+      "train_steps_per_second": 2.234
     }
   ],
+  "max_steps": 5000,
+  "num_train_epochs": 64,
+  "total_flos": 5.7547597013827174e+19,
   "trial_name": null,
   "trial_params": null
 }