Training in progress, step 10000

Browse files

Files changed (7) hide show

last-checkpoint/optimizer.pt +1 -1
last-checkpoint/pytorch_model.bin +1 -1
last-checkpoint/rng_state.pth +1 -1
last-checkpoint/scheduler.pt +1 -1
last-checkpoint/trainer_state.json +153 -3
pytorch_model.bin +1 -1
runs/Jan01_04-28-26_6ea5fb75c867/events.out.tfevents.1672547319.6ea5fb75c867.24.0 +2 -2

last-checkpoint/optimizer.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:f7993740ed5e437b04353de4ecb526bd9918a96a4e9eaf258d67af6f961bd6cf
 size 1115513717

 version https://git-lfs.github.com/spec/v1
+oid sha256:695ea22c16d59b8f8e7d8bcd0620d0c0f0cb7c3578a0fb43c564437f3ba1279f
 size 1115513717

last-checkpoint/pytorch_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:97db51ff697a7e7e17772ffa00db91d65d9b5000341e4cb4899d26c9fe90c8e2
 size 557969145

 version https://git-lfs.github.com/spec/v1
+oid sha256:73a52c17999eaef626df679c5f03ad9c53b61713db7706f9c3432222c1b6c6a3
 size 557969145

last-checkpoint/rng_state.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:faec401c00d51234b05bffba3c32fc98159e150f1de70dde51eaeeef3f15563a
 size 15523

 version https://git-lfs.github.com/spec/v1
+oid sha256:9e5f8f9f68a550cc99dfdaed2042005f3b6ddc4eafa0827c34c6b5a1e335d304
 size 15523

last-checkpoint/scheduler.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:f22490afe27492170ee18653712e55a82f1d2a2adbc61025e6296be8d30c2663
 size 623

 version https://git-lfs.github.com/spec/v1
+oid sha256:8d52951fc965683e697127d8227f41545dee9b14abb397312476c1d018a09dfd
 size 623

last-checkpoint/trainer_state.json CHANGED Viewed

@@ -1,8 +1,8 @@
 {
   "best_metric": null,
   "best_model_checkpoint": null,
-  "epoch": 0.8617718028266115,
-  "global_step": 7500,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
@@ -456,11 +456,161 @@
       "learning_rate": 2.6062811183454615e-05,
       "loss": 2.5496,
       "step": 7500
     }
   ],
   "max_steps": 15666,
   "num_train_epochs": 2,
-  "total_flos": 2.963322045186048e+16,
   "trial_name": null,
   "trial_params": null
 }

 {
   "best_metric": null,
   "best_model_checkpoint": null,
+  "epoch": 1.149029070435482,
+  "global_step": 10000,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
       "learning_rate": 2.6062811183454615e-05,
       "loss": 2.5496,
       "step": 7500
+    },
+    {
+      "epoch": 0.87,
+      "learning_rate": 2.5743648665900677e-05,
+      "loss": 2.4191,
+      "step": 7600
+    },
+    {
+      "epoch": 0.88,
+      "learning_rate": 2.5424486148346737e-05,
+      "loss": 2.4895,
+      "step": 7700
+    },
+    {
+      "epoch": 0.9,
+      "learning_rate": 2.51053236307928e-05,
+      "loss": 2.4726,
+      "step": 7800
+    },
+    {
+      "epoch": 0.91,
+      "learning_rate": 2.4786161113238862e-05,
+      "loss": 2.3287,
+      "step": 7900
+    },
+    {
+      "epoch": 0.92,
+      "learning_rate": 2.446699859568492e-05,
+      "loss": 2.4278,
+      "step": 8000
+    },
+    {
+      "epoch": 0.93,
+      "learning_rate": 2.4147836078130988e-05,
+      "loss": 2.4548,
+      "step": 8100
+    },
+    {
+      "epoch": 0.94,
+      "learning_rate": 2.3828673560577047e-05,
+      "loss": 2.5173,
+      "step": 8200
+    },
+    {
+      "epoch": 0.95,
+      "learning_rate": 2.3509511043023107e-05,
+      "loss": 2.4883,
+      "step": 8300
+    },
+    {
+      "epoch": 0.97,
+      "learning_rate": 2.319034852546917e-05,
+      "loss": 2.4435,
+      "step": 8400
+    },
+    {
+      "epoch": 0.98,
+      "learning_rate": 2.2871186007915232e-05,
+      "loss": 2.4825,
+      "step": 8500
+    },
+    {
+      "epoch": 0.99,
+      "learning_rate": 2.2552023490361295e-05,
+      "loss": 2.4539,
+      "step": 8600
+    },
+    {
+      "epoch": 1.0,
+      "learning_rate": 2.2232860972807354e-05,
+      "loss": 2.4115,
+      "step": 8700
+    },
+    {
+      "epoch": 1.01,
+      "learning_rate": 2.1913698455253417e-05,
+      "loss": 2.3452,
+      "step": 8800
+    },
+    {
+      "epoch": 1.02,
+      "learning_rate": 2.159453593769948e-05,
+      "loss": 2.3799,
+      "step": 8900
+    },
+    {
+      "epoch": 1.03,
+      "learning_rate": 2.127537342014554e-05,
+      "loss": 2.4019,
+      "step": 9000
+    },
+    {
+      "epoch": 1.05,
+      "learning_rate": 2.09562109025916e-05,
+      "loss": 2.3678,
+      "step": 9100
+    },
+    {
+      "epoch": 1.06,
+      "learning_rate": 2.0637048385037665e-05,
+      "loss": 2.3711,
+      "step": 9200
+    },
+    {
+      "epoch": 1.07,
+      "learning_rate": 2.0317885867483724e-05,
+      "loss": 2.2767,
+      "step": 9300
+    },
+    {
+      "epoch": 1.08,
+      "learning_rate": 1.9998723349929783e-05,
+      "loss": 2.3761,
+      "step": 9400
+    },
+    {
+      "epoch": 1.09,
+      "learning_rate": 1.9679560832375846e-05,
+      "loss": 2.3392,
+      "step": 9500
+    },
+    {
+      "epoch": 1.1,
+      "learning_rate": 1.936039831482191e-05,
+      "loss": 2.3232,
+      "step": 9600
+    },
+    {
+      "epoch": 1.11,
+      "learning_rate": 1.904123579726797e-05,
+      "loss": 2.355,
+      "step": 9700
+    },
+    {
+      "epoch": 1.13,
+      "learning_rate": 1.872207327971403e-05,
+      "loss": 2.3613,
+      "step": 9800
+    },
+    {
+      "epoch": 1.14,
+      "learning_rate": 1.840291076216009e-05,
+      "loss": 2.3475,
+      "step": 9900
+    },
+    {
+      "epoch": 1.15,
+      "learning_rate": 1.8083748244606157e-05,
+      "loss": 2.3654,
+      "step": 10000
     }
   ],
   "max_steps": 15666,
   "num_train_epochs": 2,
+  "total_flos": 3.953048407805952e+16,
   "trial_name": null,
   "trial_params": null
 }

pytorch_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:97db51ff697a7e7e17772ffa00db91d65d9b5000341e4cb4899d26c9fe90c8e2
 size 557969145

 version https://git-lfs.github.com/spec/v1
+oid sha256:73a52c17999eaef626df679c5f03ad9c53b61713db7706f9c3432222c1b6c6a3
 size 557969145

runs/Jan01_04-28-26_6ea5fb75c867/events.out.tfevents.1672547319.6ea5fb75c867.24.0 CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:6c102e25ecb6796a1e93092de6658a83da616eed41abb3c0f7da8764fe5c465e
-size 16610

 version https://git-lfs.github.com/spec/v1
+oid sha256:f511a742a4b5f180697e41094bff1017383d78f0e31e1610835895acb5b91dcc
+size 20535