Training in progress, step 17500

Browse files

Files changed (7) hide show

last-checkpoint/optimizer.pt +1 -1
last-checkpoint/pytorch_model.bin +1 -1
last-checkpoint/rng_state.pth +2 -2
last-checkpoint/scheduler.pt +1 -1
last-checkpoint/trainer_state.json +153 -3
pytorch_model.bin +1 -1
runs/Jan03_01-47-25_21bb7eba274c/events.out.tfevents.1672710460.21bb7eba274c.23.0 +2 -2

last-checkpoint/optimizer.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:0abc3bbcb33f1b104a034878ea65a810881545bc5791a855d5351ca104d35090
 size 1115513717

 version https://git-lfs.github.com/spec/v1
+oid sha256:3f389a14bfd58c27a83a27a7df40ecea82e8ea9846f9a754fe15ef3baf218cda
 size 1115513717

last-checkpoint/pytorch_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:2cf5eb3b818e6cd78b758f5e03fb1f8f3add5c14dfabe0bcca7c806070d48d8f
 size 557969145

 version https://git-lfs.github.com/spec/v1
+oid sha256:6ac15d1c531a2537f2ed5a5ca9b2c15212a32f681269a48c059475929253d03c
 size 557969145

last-checkpoint/rng_state.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:d352999c7df11b9e94f1fd8a7375a3e73dafb109da22a6956122e5dc1a4f2bf1
-size 15523

 version https://git-lfs.github.com/spec/v1
+oid sha256:4d1f1f98d1a485fc2aa7583bef37396f966ba1263ca57a87f7bb243165c4d1d2
+size 15459

last-checkpoint/scheduler.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:21c769e63ec1de81b68aee725d82a5604ab67099a79974f6a735c0ba6a65445c
 size 623

 version https://git-lfs.github.com/spec/v1
+oid sha256:8ddc9e3439f89ace0e8635bf051f23ef8d0f8b0f8a1af21d876b1c7c16844d24
 size 623

last-checkpoint/trainer_state.json CHANGED Viewed

@@ -1,8 +1,8 @@
 {
   "best_metric": null,
   "best_model_checkpoint": null,
-  "epoch": 0.8408071748878924,
-  "global_step": 15000,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
@@ -906,11 +906,161 @@
       "learning_rate": 3.2635774788241163e-06,
       "loss": 0.625,
       "step": 15000
     }
   ],
   "max_steps": 32112,
   "num_train_epochs": 2,
-  "total_flos": 6.927185891598336e+16,
   "trial_name": null,
   "trial_params": null
 }

 {
   "best_metric": null,
   "best_model_checkpoint": null,
+  "epoch": 0.9809417040358744,
+  "global_step": 17500,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
       "learning_rate": 3.2635774788241163e-06,
       "loss": 0.625,
       "step": 15000
+    },
+    {
+      "epoch": 0.85,
+      "learning_rate": 2.952167414050822e-06,
+      "loss": 0.8014,
+      "step": 15100
+    },
+    {
+      "epoch": 0.85,
+      "learning_rate": 2.6407573492775286e-06,
+      "loss": 0.7089,
+      "step": 15200
+    },
+    {
+      "epoch": 0.86,
+      "learning_rate": 2.329347284504235e-06,
+      "loss": 0.74,
+      "step": 15300
+    },
+    {
+      "epoch": 0.86,
+      "learning_rate": 2.0179372197309418e-06,
+      "loss": 0.7056,
+      "step": 15400
+    },
+    {
+      "epoch": 0.87,
+      "learning_rate": 1.7065271549576482e-06,
+      "loss": 0.7139,
+      "step": 15500
+    },
+    {
+      "epoch": 0.87,
+      "learning_rate": 1.395117090184355e-06,
+      "loss": 0.7094,
+      "step": 15600
+    },
+    {
+      "epoch": 0.88,
+      "learning_rate": 1.0837070254110613e-06,
+      "loss": 0.7352,
+      "step": 15700
+    },
+    {
+      "epoch": 0.89,
+      "learning_rate": 7.722969606377678e-07,
+      "loss": 0.6215,
+      "step": 15800
+    },
+    {
+      "epoch": 0.89,
+      "learning_rate": 4.608868958644744e-07,
+      "loss": 0.72,
+      "step": 15900
+    },
+    {
+      "epoch": 0.9,
+      "learning_rate": 1.4947683109118088e-07,
+      "loss": 0.844,
+      "step": 16000
+    },
+    {
+      "epoch": 0.9,
+      "learning_rate": 0.0,
+      "loss": 0.7329,
+      "step": 16100
+    },
+    {
+      "epoch": 0.91,
+      "learning_rate": 0.0,
+      "loss": 0.7173,
+      "step": 16200
+    },
+    {
+      "epoch": 0.91,
+      "learning_rate": 0.0,
+      "loss": 0.7362,
+      "step": 16300
+    },
+    {
+      "epoch": 0.92,
+      "learning_rate": 0.0,
+      "loss": 0.7832,
+      "step": 16400
+    },
+    {
+      "epoch": 0.92,
+      "learning_rate": 0.0,
+      "loss": 0.6208,
+      "step": 16500
+    },
+    {
+      "epoch": 0.93,
+      "learning_rate": 0.0,
+      "loss": 0.7005,
+      "step": 16600
+    },
+    {
+      "epoch": 0.94,
+      "learning_rate": 0.0,
+      "loss": 0.6966,
+      "step": 16700
+    },
+    {
+      "epoch": 0.94,
+      "learning_rate": 0.0,
+      "loss": 0.7328,
+      "step": 16800
+    },
+    {
+      "epoch": 0.95,
+      "learning_rate": 0.0,
+      "loss": 0.7344,
+      "step": 16900
+    },
+    {
+      "epoch": 0.95,
+      "learning_rate": 0.0,
+      "loss": 0.6683,
+      "step": 17000
+    },
+    {
+      "epoch": 0.96,
+      "learning_rate": 0.0,
+      "loss": 0.7593,
+      "step": 17100
+    },
+    {
+      "epoch": 0.96,
+      "learning_rate": 0.0,
+      "loss": 0.6735,
+      "step": 17200
+    },
+    {
+      "epoch": 0.97,
+      "learning_rate": 0.0,
+      "loss": 0.6199,
+      "step": 17300
+    },
+    {
+      "epoch": 0.98,
+      "learning_rate": 0.0,
+      "loss": 0.7717,
+      "step": 17400
+    },
+    {
+      "epoch": 0.98,
+      "learning_rate": 0.0,
+      "loss": 0.7252,
+      "step": 17500
     }
   ],
   "max_steps": 32112,
   "num_train_epochs": 2,
+  "total_flos": 8.078058692960256e+16,
   "trial_name": null,
   "trial_params": null
 }

pytorch_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:2cf5eb3b818e6cd78b758f5e03fb1f8f3add5c14dfabe0bcca7c806070d48d8f
 size 557969145

 version https://git-lfs.github.com/spec/v1
+oid sha256:6ac15d1c531a2537f2ed5a5ca9b2c15212a32f681269a48c059475929253d03c
 size 557969145

runs/Jan03_01-47-25_21bb7eba274c/events.out.tfevents.1672710460.21bb7eba274c.23.0 CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:a1ece1914909553e95eacd390102f6cf8f09e0b33baa54894afe1eb11854cdb7
-size 33189

 version https://git-lfs.github.com/spec/v1
+oid sha256:0059104b5702024e249689bb568e96d0d4a72ee12fe8dd97c0dd035660f85968
+size 37150