End of training

Browse files

Files changed (10) hide show

README.md +40 -41
all_results.json +10 -10
eval_results.json +6 -6
model.safetensors +1 -1
runs/Dec01_16-28-33_DESKTOP-SKBE9FB/events.out.tfevents.1733092119.DESKTOP-SKBE9FB.15724.0 +3 -0
runs/Dec01_16-34-25_DESKTOP-SKBE9FB/events.out.tfevents.1733092466.DESKTOP-SKBE9FB.3856.0 +3 -0
runs/Dec01_16-34-25_DESKTOP-SKBE9FB/events.out.tfevents.1733093058.DESKTOP-SKBE9FB.3856.1 +3 -0
train_results.json +5 -5
trainer_state.json +308 -341
training_args.bin +1 -1

README.md CHANGED Viewed

@@ -17,12 +17,12 @@ model-index:
       name: imagefolder
       type: imagefolder
       config: default
-      split: train
       args: default
     metrics:
     - name: Accuracy
       type: accuracy
-      value: 0.9516129032258065
 ---
 <!-- This model card has been generated automatically according to the information the Trainer had access to. You
@@ -32,8 +32,8 @@ should probably proofread and complete it, then remove this comment. -->
 This model is a fine-tuned version of [microsoft/beit-base-patch16-224](https://huggingface.co/microsoft/beit-base-patch16-224) on the imagefolder dataset.
 It achieves the following results on the evaluation set:
-- Loss: 0.3612
-- Accuracy: 0.9516
 ## Model description
@@ -67,43 +67,42 @@ The following hyperparameters were used during training:
 | Training Loss | Epoch | Step | Validation Loss | Accuracy |
 |:-------------:|:-----:|:----:|:---------------:|:--------:|
-| No log        | 0.91  | 5    | 1.3762          | 0.4677   |
-| 1.3741        | 2.0   | 11   | 1.3227          | 0.4516   |
-| 1.3741        | 2.91  | 16   | 1.2451          | 0.4516   |
-| 1.2883        | 4.0   | 22   | 1.1303          | 0.5484   |
-| 1.2883        | 4.91  | 27   | 1.0044          | 0.7419   |
-| 1.1053        | 6.0   | 33   | 0.8687          | 0.7581   |
-| 1.1053        | 6.91  | 38   | 0.7694          | 0.8387   |
-| 0.917         | 8.0   | 44   | 0.6563          | 0.8065   |
-| 0.917         | 8.91  | 49   | 0.5870          | 0.8710   |
-| 0.7172        | 10.0  | 55   | 0.5842          | 0.7903   |
-| 0.5924        | 10.91 | 60   | 0.4820          | 0.8710   |
-| 0.5924        | 12.0  | 66   | 0.5346          | 0.8065   |
-| 0.5272        | 12.91 | 71   | 0.3612          | 0.9516   |
-| 0.5272        | 14.0  | 77   | 0.3838          | 0.9194   |
-| 0.4901        | 14.91 | 82   | 0.4009          | 0.9032   |
-| 0.4901        | 16.0  | 88   | 0.3721          | 0.8548   |
-| 0.47          | 16.91 | 93   | 0.4358          | 0.8710   |
-| 0.47          | 18.0  | 99   | 0.3734          | 0.8710   |
-| 0.4714        | 18.91 | 104  | 0.4338          | 0.8548   |
-| 0.3805        | 20.0  | 110  | 0.4152          | 0.8548   |
-| 0.3805        | 20.91 | 115  | 0.3676          | 0.9194   |
-| 0.388         | 22.0  | 121  | 0.3727          | 0.8871   |
-| 0.388         | 22.91 | 126  | 0.3751          | 0.8871   |
-| 0.3868        | 24.0  | 132  | 0.4173          | 0.8548   |
-| 0.3868        | 24.91 | 137  | 0.3992          | 0.8710   |
-| 0.3399        | 26.0  | 143  | 0.3749          | 0.8871   |
-| 0.3399        | 26.91 | 148  | 0.4060          | 0.8548   |
-| 0.3271        | 28.0  | 154  | 0.3926          | 0.9032   |
-| 0.3271        | 28.91 | 159  | 0.3731          | 0.8710   |
-| 0.3299        | 30.0  | 165  | 0.3836          | 0.8710   |
-| 0.3114        | 30.91 | 170  | 0.4074          | 0.8871   |
-| 0.3114        | 32.0  | 176  | 0.4274          | 0.8548   |
-| 0.2738        | 32.91 | 181  | 0.3812          | 0.8710   |
-| 0.2738        | 34.0  | 187  | 0.3795          | 0.8710   |
-| 0.2906        | 34.91 | 192  | 0.3813          | 0.8710   |
-| 0.2906        | 36.0  | 198  | 0.3886          | 0.8710   |
-| 0.2623        | 36.36 | 200  | 0.3893          | 0.8710   |
 ### Framework versions

       name: imagefolder
       type: imagefolder
       config: default
+      split: validation
       args: default
     metrics:
     - name: Accuracy
       type: accuracy
+      value: 0.8709677419354839
 ---
 <!-- This model card has been generated automatically according to the information the Trainer had access to. You
 This model is a fine-tuned version of [microsoft/beit-base-patch16-224](https://huggingface.co/microsoft/beit-base-patch16-224) on the imagefolder dataset.
 It achieves the following results on the evaluation set:
+- Loss: 0.4334
+- Accuracy: 0.8710
 ## Model description
 | Training Loss | Epoch | Step | Validation Loss | Accuracy |
 |:-------------:|:-----:|:----:|:---------------:|:--------:|
+| No log        | 0.89  | 4    | 1.3799          | 0.5      |
+| No log        | 2.0   | 9    | 1.3424          | 0.4516   |
+| 1.3727        | 2.89  | 13   | 1.2846          | 0.4516   |
+| 1.3727        | 4.0   | 18   | 1.1867          | 0.4516   |
+| 1.262         | 4.89  | 22   | 1.1083          | 0.4516   |
+| 1.262         | 6.0   | 27   | 1.0096          | 0.7419   |
+| 1.0651        | 6.89  | 31   | 0.9655          | 0.6290   |
+| 1.0651        | 8.0   | 36   | 0.7953          | 0.8065   |
+| 0.8729        | 8.89  | 40   | 0.8145          | 0.7742   |
+| 0.8729        | 10.0  | 45   | 0.6767          | 0.7903   |
+| 0.8729        | 10.89 | 49   | 0.6978          | 0.7419   |
+| 0.7206        | 12.0  | 54   | 0.7585          | 0.6935   |
+| 0.7206        | 12.89 | 58   | 0.5204          | 0.8387   |
+| 0.5783        | 14.0  | 63   | 0.6260          | 0.7903   |
+| 0.5783        | 14.89 | 67   | 0.4707          | 0.8387   |
+| 0.4827        | 16.0  | 72   | 0.6392          | 0.8065   |
+| 0.4827        | 16.89 | 76   | 0.4334          | 0.8710   |
+| 0.4465        | 18.0  | 81   | 0.5769          | 0.7903   |
+| 0.4465        | 18.89 | 85   | 0.5047          | 0.8226   |
+| 0.4166        | 20.0  | 90   | 0.5191          | 0.8710   |
+| 0.4166        | 20.89 | 94   | 0.5115          | 0.8226   |
+| 0.4166        | 22.0  | 99   | 0.6454          | 0.7419   |
+| 0.4209        | 22.89 | 103  | 0.5939          | 0.7742   |
+| 0.4209        | 24.0  | 108  | 0.4799          | 0.8710   |
+| 0.3429        | 24.89 | 112  | 0.5511          | 0.8065   |
+| 0.3429        | 26.0  | 117  | 0.4977          | 0.8065   |
+| 0.3344        | 26.89 | 121  | 0.4180          | 0.8710   |
+| 0.3344        | 28.0  | 126  | 0.5254          | 0.8226   |
+| 0.3301        | 28.89 | 130  | 0.5396          | 0.8226   |
+| 0.3301        | 30.0  | 135  | 0.5654          | 0.7903   |
+| 0.3301        | 30.89 | 139  | 0.5932          | 0.8065   |
+| 0.3262        | 32.0  | 144  | 0.5630          | 0.8065   |
+| 0.3262        | 32.89 | 148  | 0.5434          | 0.8065   |
+| 0.2997        | 34.0  | 153  | 0.5314          | 0.8065   |
+| 0.2997        | 34.89 | 157  | 0.5195          | 0.8065   |
+| 0.2891        | 35.56 | 160  | 0.5155          | 0.8065   |
 ### Framework versions

all_results.json CHANGED Viewed

@@ -1,12 +1,12 @@
 {
-    "epoch": 36.36,
-    "eval_accuracy": 0.9516129032258065,
-    "eval_loss": 0.3612264096736908,
-    "eval_runtime": 2.3956,
-    "eval_samples_per_second": 25.881,
-    "eval_steps_per_second": 1.67,
-    "train_loss": 0.5621715986728668,
-    "train_runtime": 710.3552,
-    "train_samples_per_second": 19.708,
-    "train_steps_per_second": 0.282
 }

 {
+    "epoch": 35.56,
+    "eval_accuracy": 0.8709677419354839,
+    "eval_loss": 0.43338534235954285,
+    "eval_runtime": 2.5246,
+    "eval_samples_per_second": 24.559,
+    "eval_steps_per_second": 1.584,
+    "train_loss": 0.5975452944636345,
+    "train_runtime": 588.8758,
+    "train_samples_per_second": 19.563,
+    "train_steps_per_second": 0.272
 }

eval_results.json CHANGED Viewed

@@ -1,8 +1,8 @@
 {
-    "epoch": 36.36,
-    "eval_accuracy": 0.9516129032258065,
-    "eval_loss": 0.3612264096736908,
-    "eval_runtime": 2.3956,
-    "eval_samples_per_second": 25.881,
-    "eval_steps_per_second": 1.67
 }

 {
+    "epoch": 35.56,
+    "eval_accuracy": 0.8709677419354839,
+    "eval_loss": 0.43338534235954285,
+    "eval_runtime": 2.5246,
+    "eval_samples_per_second": 24.559,
+    "eval_steps_per_second": 1.584
 }

model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:23220a29cc3b4446a2dcd735efa89fcef1b29bc9e721cd6ddaf860cf1880ecd4
 size 343086480

 version https://git-lfs.github.com/spec/v1
+oid sha256:9461d3c4b7148ad7928d9f22de8764e8b5e4a05aca1aba6bff0b3200b36d426b
 size 343086480

runs/Dec01_16-28-33_DESKTOP-SKBE9FB/events.out.tfevents.1733092119.DESKTOP-SKBE9FB.15724.0 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:b7da310f272f8d7cfdbe1551cdd4e61cf82d3cac652bc2312b7a5f0187aa8c6d
+size 12259

runs/Dec01_16-34-25_DESKTOP-SKBE9FB/events.out.tfevents.1733092466.DESKTOP-SKBE9FB.3856.0 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:abf62d50b1797eb837982840b548d62200aa0b17339f5eb8037fb4ecf791eb92
+size 19611

runs/Dec01_16-34-25_DESKTOP-SKBE9FB/events.out.tfevents.1733093058.DESKTOP-SKBE9FB.3856.1 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:36f22657f56ca9309c07907391173190b955b6ecfda37e8abdc5725d85f950c4
+size 411

train_results.json CHANGED Viewed

@@ -1,7 +1,7 @@
 {
-    "epoch": 36.36,
-    "train_loss": 0.5621715986728668,
-    "train_runtime": 710.3552,
-    "train_samples_per_second": 19.708,
-    "train_steps_per_second": 0.282
 }

 {
+    "epoch": 35.56,
+    "train_loss": 0.5975452944636345,
+    "train_runtime": 588.8758,
+    "train_samples_per_second": 19.563,
+    "train_steps_per_second": 0.272
 }

trainer_state.json CHANGED Viewed

@@ -1,482 +1,449 @@
 {
-  "best_metric": 0.9516129032258065,
-  "best_model_checkpoint": "beit-base-patch16-224-OT\\checkpoint-71",
-  "epoch": 36.36363636363637,
   "eval_steps": 500,
-  "global_step": 200,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
   "log_history": [
     {
-      "epoch": 0.91,
-      "eval_accuracy": 0.46774193548387094,
-      "eval_loss": 1.3762497901916504,
-      "eval_runtime": 2.8175,
-      "eval_samples_per_second": 22.005,
-      "eval_steps_per_second": 1.42,
-      "step": 5
     },
     {
-      "epoch": 1.82,
-      "learning_rate": 2.5e-05,
-      "loss": 1.3741,
       "step": 10
     },
     {
-      "epoch": 2.0,
       "eval_accuracy": 0.45161290322580644,
-      "eval_loss": 1.3226698637008667,
-      "eval_runtime": 2.2236,
-      "eval_samples_per_second": 27.883,
-      "eval_steps_per_second": 1.799,
-      "step": 11
     },
     {
-      "epoch": 2.91,
       "eval_accuracy": 0.45161290322580644,
-      "eval_loss": 1.24508798122406,
-      "eval_runtime": 2.225,
-      "eval_samples_per_second": 27.865,
-      "eval_steps_per_second": 1.798,
-      "step": 16
     },
     {
-      "epoch": 3.64,
-      "learning_rate": 5e-05,
-      "loss": 1.2883,
       "step": 20
     },
     {
-      "epoch": 4.0,
-      "eval_accuracy": 0.5483870967741935,
-      "eval_loss": 1.130311131477356,
-      "eval_runtime": 2.234,
-      "eval_samples_per_second": 27.753,
-      "eval_steps_per_second": 1.79,
       "step": 22
     },
     {
-      "epoch": 4.91,
       "eval_accuracy": 0.7419354838709677,
-      "eval_loss": 1.0044282674789429,
-      "eval_runtime": 2.195,
-      "eval_samples_per_second": 28.246,
-      "eval_steps_per_second": 1.822,
       "step": 27
     },
     {
-      "epoch": 5.45,
-      "learning_rate": 4.722222222222222e-05,
-      "loss": 1.1053,
       "step": 30
     },
     {
-      "epoch": 6.0,
-      "eval_accuracy": 0.7580645161290323,
-      "eval_loss": 0.8687154054641724,
-      "eval_runtime": 2.2426,
-      "eval_samples_per_second": 27.647,
-      "eval_steps_per_second": 1.784,
-      "step": 33
-    },
-    {
-      "epoch": 6.91,
-      "eval_accuracy": 0.8387096774193549,
-      "eval_loss": 0.7693949937820435,
-      "eval_runtime": 2.2431,
-      "eval_samples_per_second": 27.641,
-      "eval_steps_per_second": 1.783,
-      "step": 38
-    },
-    {
-      "epoch": 7.27,
-      "learning_rate": 4.4444444444444447e-05,
-      "loss": 0.917,
-      "step": 40
     },
     {
       "epoch": 8.0,
       "eval_accuracy": 0.8064516129032258,
-      "eval_loss": 0.6563238501548767,
-      "eval_runtime": 2.2236,
-      "eval_samples_per_second": 27.883,
-      "eval_steps_per_second": 1.799,
-      "step": 44
     },
     {
-      "epoch": 8.91,
-      "eval_accuracy": 0.8709677419354839,
-      "eval_loss": 0.5869693756103516,
-      "eval_runtime": 2.3196,
-      "eval_samples_per_second": 26.729,
-      "eval_steps_per_second": 1.724,
-      "step": 49
     },
     {
-      "epoch": 9.09,
-      "learning_rate": 4.166666666666667e-05,
-      "loss": 0.7172,
-      "step": 50
     },
     {
       "epoch": 10.0,
       "eval_accuracy": 0.7903225806451613,
-      "eval_loss": 0.584214448928833,
-      "eval_runtime": 2.3149,
-      "eval_samples_per_second": 26.783,
-      "eval_steps_per_second": 1.728,
-      "step": 55
     },
     {
-      "epoch": 10.91,
-      "learning_rate": 3.888888888888889e-05,
-      "loss": 0.5924,
-      "step": 60
     },
     {
-      "epoch": 10.91,
-      "eval_accuracy": 0.8709677419354839,
-      "eval_loss": 0.48196569085121155,
-      "eval_runtime": 2.3395,
-      "eval_samples_per_second": 26.502,
-      "eval_steps_per_second": 1.71,
-      "step": 60
     },
     {
       "epoch": 12.0,
-      "eval_accuracy": 0.8064516129032258,
-      "eval_loss": 0.5345528721809387,
-      "eval_runtime": 2.3902,
-      "eval_samples_per_second": 25.939,
-      "eval_steps_per_second": 1.673,
-      "step": 66
     },
     {
-      "epoch": 12.73,
-      "learning_rate": 3.611111111111111e-05,
-      "loss": 0.5272,
-      "step": 70
     },
     {
-      "epoch": 12.91,
-      "eval_accuracy": 0.9516129032258065,
-      "eval_loss": 0.3612264096736908,
-      "eval_runtime": 2.3361,
-      "eval_samples_per_second": 26.54,
-      "eval_steps_per_second": 1.712,
-      "step": 71
     },
     {
       "epoch": 14.0,
-      "eval_accuracy": 0.9193548387096774,
-      "eval_loss": 0.3838379383087158,
-      "eval_runtime": 2.2534,
-      "eval_samples_per_second": 27.514,
-      "eval_steps_per_second": 1.775,
-      "step": 77
     },
     {
-      "epoch": 14.55,
-      "learning_rate": 3.3333333333333335e-05,
-      "loss": 0.4901,
-      "step": 80
     },
     {
-      "epoch": 14.91,
-      "eval_accuracy": 0.9032258064516129,
-      "eval_loss": 0.4009224772453308,
-      "eval_runtime": 2.2625,
-      "eval_samples_per_second": 27.403,
-      "eval_steps_per_second": 1.768,
-      "step": 82
     },
     {
       "epoch": 16.0,
-      "eval_accuracy": 0.8548387096774194,
-      "eval_loss": 0.37214234471321106,
-      "eval_runtime": 2.4086,
-      "eval_samples_per_second": 25.741,
-      "eval_steps_per_second": 1.661,
-      "step": 88
-    },
-    {
-      "epoch": 16.36,
-      "learning_rate": 3.055555555555556e-05,
-      "loss": 0.47,
-      "step": 90
-    },
-    {
-      "epoch": 16.91,
-      "eval_accuracy": 0.8709677419354839,
-      "eval_loss": 0.4357836842536926,
-      "eval_runtime": 2.5957,
-      "eval_samples_per_second": 23.886,
-      "eval_steps_per_second": 1.541,
-      "step": 93
     },
     {
-      "epoch": 18.0,
       "eval_accuracy": 0.8709677419354839,
-      "eval_loss": 0.37337055802345276,
-      "eval_runtime": 2.4276,
-      "eval_samples_per_second": 25.54,
-      "eval_steps_per_second": 1.648,
-      "step": 99
     },
     {
-      "epoch": 18.18,
       "learning_rate": 2.777777777777778e-05,
-      "loss": 0.4714,
-      "step": 100
     },
     {
-      "epoch": 18.91,
-      "eval_accuracy": 0.8548387096774194,
-      "eval_loss": 0.433827668428421,
-      "eval_runtime": 2.4386,
-      "eval_samples_per_second": 25.425,
-      "eval_steps_per_second": 1.64,
-      "step": 104
     },
     {
       "epoch": 20.0,
-      "learning_rate": 2.5e-05,
-      "loss": 0.3805,
-      "step": 110
     },
     {
       "epoch": 20.0,
-      "eval_accuracy": 0.8548387096774194,
-      "eval_loss": 0.4151618480682373,
-      "eval_runtime": 2.4116,
-      "eval_samples_per_second": 25.709,
-      "eval_steps_per_second": 1.659,
-      "step": 110
-    },
-    {
-      "epoch": 20.91,
-      "eval_accuracy": 0.9193548387096774,
-      "eval_loss": 0.3676328957080841,
-      "eval_runtime": 2.4661,
-      "eval_samples_per_second": 25.141,
-      "eval_steps_per_second": 1.622,
-      "step": 115
     },
     {
-      "epoch": 21.82,
-      "learning_rate": 2.2222222222222223e-05,
-      "loss": 0.388,
-      "step": 120
     },
     {
       "epoch": 22.0,
-      "eval_accuracy": 0.8870967741935484,
-      "eval_loss": 0.37274670600891113,
-      "eval_runtime": 2.2672,
-      "eval_samples_per_second": 27.346,
-      "eval_steps_per_second": 1.764,
-      "step": 121
     },
     {
-      "epoch": 22.91,
-      "eval_accuracy": 0.8870967741935484,
-      "eval_loss": 0.3750571012496948,
-      "eval_runtime": 2.2295,
-      "eval_samples_per_second": 27.809,
-      "eval_steps_per_second": 1.794,
-      "step": 126
     },
     {
-      "epoch": 23.64,
-      "learning_rate": 1.9444444444444445e-05,
-      "loss": 0.3868,
-      "step": 130
     },
     {
       "epoch": 24.0,
-      "eval_accuracy": 0.8548387096774194,
-      "eval_loss": 0.41731569170951843,
-      "eval_runtime": 2.2686,
-      "eval_samples_per_second": 27.33,
-      "eval_steps_per_second": 1.763,
-      "step": 132
     },
     {
-      "epoch": 24.91,
-      "eval_accuracy": 0.8709677419354839,
-      "eval_loss": 0.39922547340393066,
-      "eval_runtime": 2.2725,
-      "eval_samples_per_second": 27.282,
-      "eval_steps_per_second": 1.76,
-      "step": 137
     },
     {
-      "epoch": 25.45,
-      "learning_rate": 1.6666666666666667e-05,
-      "loss": 0.3399,
-      "step": 140
     },
     {
       "epoch": 26.0,
-      "eval_accuracy": 0.8870967741935484,
-      "eval_loss": 0.37487953901290894,
-      "eval_runtime": 2.3296,
-      "eval_samples_per_second": 26.614,
-      "eval_steps_per_second": 1.717,
-      "step": 143
-    },
-    {
-      "epoch": 26.91,
-      "eval_accuracy": 0.8548387096774194,
-      "eval_loss": 0.405973881483078,
-      "eval_runtime": 2.3056,
-      "eval_samples_per_second": 26.892,
-      "eval_steps_per_second": 1.735,
-      "step": 148
     },
     {
-      "epoch": 27.27,
       "learning_rate": 1.388888888888889e-05,
-      "loss": 0.3271,
-      "step": 150
     },
     {
       "epoch": 28.0,
-      "eval_accuracy": 0.9032258064516129,
-      "eval_loss": 0.3926439583301544,
-      "eval_runtime": 2.2655,
-      "eval_samples_per_second": 27.367,
-      "eval_steps_per_second": 1.766,
-      "step": 154
     },
     {
-      "epoch": 28.91,
-      "eval_accuracy": 0.8709677419354839,
-      "eval_loss": 0.37314102053642273,
-      "eval_runtime": 2.3972,
-      "eval_samples_per_second": 25.864,
-      "eval_steps_per_second": 1.669,
-      "step": 159
     },
     {
-      "epoch": 29.09,
-      "learning_rate": 1.1111111111111112e-05,
-      "loss": 0.3299,
-      "step": 160
     },
     {
       "epoch": 30.0,
-      "eval_accuracy": 0.8709677419354839,
-      "eval_loss": 0.3835797905921936,
-      "eval_runtime": 2.233,
-      "eval_samples_per_second": 27.765,
-      "eval_steps_per_second": 1.791,
-      "step": 165
     },
     {
-      "epoch": 30.91,
-      "learning_rate": 8.333333333333334e-06,
-      "loss": 0.3114,
-      "step": 170
     },
     {
-      "epoch": 30.91,
-      "eval_accuracy": 0.8870967741935484,
-      "eval_loss": 0.4074338376522064,
-      "eval_runtime": 2.241,
-      "eval_samples_per_second": 27.666,
-      "eval_steps_per_second": 1.785,
-      "step": 170
     },
     {
       "epoch": 32.0,
-      "eval_accuracy": 0.8548387096774194,
-      "eval_loss": 0.42735350131988525,
-      "eval_runtime": 2.228,
-      "eval_samples_per_second": 27.827,
-      "eval_steps_per_second": 1.795,
-      "step": 176
     },
     {
-      "epoch": 32.73,
-      "learning_rate": 5.555555555555556e-06,
-      "loss": 0.2738,
-      "step": 180
     },
     {
-      "epoch": 32.91,
-      "eval_accuracy": 0.8709677419354839,
-      "eval_loss": 0.38117459416389465,
-      "eval_runtime": 2.2701,
-      "eval_samples_per_second": 27.312,
-      "eval_steps_per_second": 1.762,
-      "step": 181
     },
     {
       "epoch": 34.0,
-      "eval_accuracy": 0.8709677419354839,
-      "eval_loss": 0.3795369863510132,
-      "eval_runtime": 2.4211,
-      "eval_samples_per_second": 25.608,
-      "eval_steps_per_second": 1.652,
-      "step": 187
-    },
-    {
-      "epoch": 34.55,
-      "learning_rate": 2.777777777777778e-06,
-      "loss": 0.2906,
-      "step": 190
     },
     {
-      "epoch": 34.91,
-      "eval_accuracy": 0.8709677419354839,
-      "eval_loss": 0.3813425898551941,
-      "eval_runtime": 2.193,
-      "eval_samples_per_second": 28.271,
-      "eval_steps_per_second": 1.824,
-      "step": 192
     },
     {
-      "epoch": 36.0,
-      "eval_accuracy": 0.8709677419354839,
-      "eval_loss": 0.3886435031890869,
-      "eval_runtime": 2.16,
-      "eval_samples_per_second": 28.703,
-      "eval_steps_per_second": 1.852,
-      "step": 198
     },
     {
-      "epoch": 36.36,
-      "learning_rate": 0.0,
-      "loss": 0.2623,
-      "step": 200
     },
     {
-      "epoch": 36.36,
-      "eval_accuracy": 0.8709677419354839,
-      "eval_loss": 0.38933122158050537,
-      "eval_runtime": 2.292,
-      "eval_samples_per_second": 27.05,
-      "eval_steps_per_second": 1.745,
-      "step": 200
-    },
-    {
-      "epoch": 36.36,
-      "step": 200,
-      "total_flos": 9.859141601338982e+17,
-      "train_loss": 0.5621715986728668,
-      "train_runtime": 710.3552,
-      "train_samples_per_second": 19.708,
-      "train_steps_per_second": 0.282
     }
   ],
   "logging_steps": 10,
-  "max_steps": 200,
   "num_input_tokens_seen": 0,
   "num_train_epochs": 40,
   "save_steps": 500,
-  "total_flos": 9.859141601338982e+17,
   "train_batch_size": 16,
   "trial_name": null,
   "trial_params": null

 {
+  "best_metric": 0.8709677419354839,
+  "best_model_checkpoint": "beit-base-patch16-224-OT\\checkpoint-76",
+  "epoch": 35.55555555555556,
   "eval_steps": 500,
+  "global_step": 160,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
   "log_history": [
     {
+      "epoch": 0.89,
+      "eval_accuracy": 0.5,
+      "eval_loss": 1.379904866218567,
+      "eval_runtime": 2.315,
+      "eval_samples_per_second": 26.782,
+      "eval_steps_per_second": 1.728,
+      "step": 4
     },
     {
+      "epoch": 2.0,
+      "eval_accuracy": 0.45161290322580644,
+      "eval_loss": 1.3424019813537598,
+      "eval_runtime": 2.1675,
+      "eval_samples_per_second": 28.604,
+      "eval_steps_per_second": 1.845,
+      "step": 9
+    },
+    {
+      "epoch": 2.22,
+      "learning_rate": 3.125e-05,
+      "loss": 1.3727,
       "step": 10
     },
     {
+      "epoch": 2.89,
       "eval_accuracy": 0.45161290322580644,
+      "eval_loss": 1.2845711708068848,
+      "eval_runtime": 2.2255,
+      "eval_samples_per_second": 27.858,
+      "eval_steps_per_second": 1.797,
+      "step": 13
     },
     {
+      "epoch": 4.0,
       "eval_accuracy": 0.45161290322580644,
+      "eval_loss": 1.186702847480774,
+      "eval_runtime": 2.174,
+      "eval_samples_per_second": 28.519,
+      "eval_steps_per_second": 1.84,
+      "step": 18
     },
     {
+      "epoch": 4.44,
+      "learning_rate": 4.8611111111111115e-05,
+      "loss": 1.262,
       "step": 20
     },
     {
+      "epoch": 4.89,
+      "eval_accuracy": 0.45161290322580644,
+      "eval_loss": 1.1083455085754395,
+      "eval_runtime": 2.2285,
+      "eval_samples_per_second": 27.821,
+      "eval_steps_per_second": 1.795,
       "step": 22
     },
     {
+      "epoch": 6.0,
       "eval_accuracy": 0.7419354838709677,
+      "eval_loss": 1.0096312761306763,
+      "eval_runtime": 2.3886,
+      "eval_samples_per_second": 25.957,
+      "eval_steps_per_second": 1.675,
       "step": 27
     },
     {
+      "epoch": 6.67,
+      "learning_rate": 4.5138888888888894e-05,
+      "loss": 1.0651,
       "step": 30
     },
     {
+      "epoch": 6.89,
+      "eval_accuracy": 0.6290322580645161,
+      "eval_loss": 0.965541660785675,
+      "eval_runtime": 2.1775,
+      "eval_samples_per_second": 28.473,
+      "eval_steps_per_second": 1.837,
+      "step": 31
     },
     {
       "epoch": 8.0,
       "eval_accuracy": 0.8064516129032258,
+      "eval_loss": 0.7952606678009033,
+      "eval_runtime": 2.2276,
+      "eval_samples_per_second": 27.833,
+      "eval_steps_per_second": 1.796,
+      "step": 36
     },
     {
+      "epoch": 8.89,
+      "learning_rate": 4.166666666666667e-05,
+      "loss": 0.8729,
+      "step": 40
     },
     {
+      "epoch": 8.89,
+      "eval_accuracy": 0.7741935483870968,
+      "eval_loss": 0.8145327568054199,
+      "eval_runtime": 2.2085,
+      "eval_samples_per_second": 28.073,
+      "eval_steps_per_second": 1.811,
+      "step": 40
     },
     {
       "epoch": 10.0,
       "eval_accuracy": 0.7903225806451613,
+      "eval_loss": 0.6766544580459595,
+      "eval_runtime": 2.6727,
+      "eval_samples_per_second": 23.198,
+      "eval_steps_per_second": 1.497,
+      "step": 45
     },
     {
+      "epoch": 10.89,
+      "eval_accuracy": 0.7419354838709677,
+      "eval_loss": 0.6978453993797302,
+      "eval_runtime": 2.1745,
+      "eval_samples_per_second": 28.512,
+      "eval_steps_per_second": 1.839,
+      "step": 49
     },
     {
+      "epoch": 11.11,
+      "learning_rate": 3.8194444444444444e-05,
+      "loss": 0.7206,
+      "step": 50
     },
     {
       "epoch": 12.0,
+      "eval_accuracy": 0.6935483870967742,
+      "eval_loss": 0.7585192918777466,
+      "eval_runtime": 2.1875,
+      "eval_samples_per_second": 28.342,
+      "eval_steps_per_second": 1.829,
+      "step": 54
     },
     {
+      "epoch": 12.89,
+      "eval_accuracy": 0.8387096774193549,
+      "eval_loss": 0.5204325318336487,
+      "eval_runtime": 2.2877,
+      "eval_samples_per_second": 27.101,
+      "eval_steps_per_second": 1.748,
+      "step": 58
     },
     {
+      "epoch": 13.33,
+      "learning_rate": 3.472222222222222e-05,
+      "loss": 0.5783,
+      "step": 60
     },
     {
       "epoch": 14.0,
+      "eval_accuracy": 0.7903225806451613,
+      "eval_loss": 0.6260057687759399,
+      "eval_runtime": 2.148,
+      "eval_samples_per_second": 28.864,
+      "eval_steps_per_second": 1.862,
+      "step": 63
     },
     {
+      "epoch": 14.89,
+      "eval_accuracy": 0.8387096774193549,
+      "eval_loss": 0.47068876028060913,
+      "eval_runtime": 2.2305,
+      "eval_samples_per_second": 27.796,
+      "eval_steps_per_second": 1.793,
+      "step": 67
     },
     {
+      "epoch": 15.56,
+      "learning_rate": 3.125e-05,
+      "loss": 0.4827,
+      "step": 70
     },
     {
       "epoch": 16.0,
+      "eval_accuracy": 0.8064516129032258,
+      "eval_loss": 0.6392358541488647,
+      "eval_runtime": 2.274,
+      "eval_samples_per_second": 27.264,
+      "eval_steps_per_second": 1.759,
+      "step": 72
     },
     {
+      "epoch": 16.89,
       "eval_accuracy": 0.8709677419354839,
+      "eval_loss": 0.43338534235954285,
+      "eval_runtime": 2.2445,
+      "eval_samples_per_second": 27.623,
+      "eval_steps_per_second": 1.782,
+      "step": 76
     },
     {
+      "epoch": 17.78,
       "learning_rate": 2.777777777777778e-05,
+      "loss": 0.4465,
+      "step": 80
     },
     {
+      "epoch": 18.0,
+      "eval_accuracy": 0.7903225806451613,
+      "eval_loss": 0.5768514275550842,
+      "eval_runtime": 2.222,
+      "eval_samples_per_second": 27.902,
+      "eval_steps_per_second": 1.8,
+      "step": 81
+    },
+    {
+      "epoch": 18.89,
+      "eval_accuracy": 0.8225806451612904,
+      "eval_loss": 0.5046879053115845,
+      "eval_runtime": 2.2336,
+      "eval_samples_per_second": 27.758,
+      "eval_steps_per_second": 1.791,
+      "step": 85
     },
     {
       "epoch": 20.0,
+      "learning_rate": 2.4305555555555558e-05,
+      "loss": 0.4166,
+      "step": 90
     },
     {
       "epoch": 20.0,
+      "eval_accuracy": 0.8709677419354839,
+      "eval_loss": 0.5190597772598267,
+      "eval_runtime": 2.2074,
+      "eval_samples_per_second": 28.087,
+      "eval_steps_per_second": 1.812,
+      "step": 90
     },
     {
+      "epoch": 20.89,
+      "eval_accuracy": 0.8225806451612904,
+      "eval_loss": 0.5115006566047668,
+      "eval_runtime": 2.1835,
+      "eval_samples_per_second": 28.395,
+      "eval_steps_per_second": 1.832,
+      "step": 94
     },
     {
       "epoch": 22.0,
+      "eval_accuracy": 0.7419354838709677,
+      "eval_loss": 0.6454288959503174,
+      "eval_runtime": 2.19,
+      "eval_samples_per_second": 28.31,
+      "eval_steps_per_second": 1.826,
+      "step": 99
     },
     {
+      "epoch": 22.22,
+      "learning_rate": 2.0833333333333336e-05,
+      "loss": 0.4209,
+      "step": 100
     },
     {
+      "epoch": 22.89,
+      "eval_accuracy": 0.7741935483870968,
+      "eval_loss": 0.5938693881034851,
+      "eval_runtime": 2.135,
+      "eval_samples_per_second": 29.04,
+      "eval_steps_per_second": 1.874,
+      "step": 103
     },
     {
       "epoch": 24.0,
+      "eval_accuracy": 0.8709677419354839,
+      "eval_loss": 0.4799472391605377,
+      "eval_runtime": 2.2005,
+      "eval_samples_per_second": 28.175,
+      "eval_steps_per_second": 1.818,
+      "step": 108
     },
     {
+      "epoch": 24.44,
+      "learning_rate": 1.736111111111111e-05,
+      "loss": 0.3429,
+      "step": 110
     },
     {
+      "epoch": 24.89,
+      "eval_accuracy": 0.8064516129032258,
+      "eval_loss": 0.5510820150375366,
+      "eval_runtime": 2.216,
+      "eval_samples_per_second": 27.978,
+      "eval_steps_per_second": 1.805,
+      "step": 112
     },
     {
       "epoch": 26.0,
+      "eval_accuracy": 0.8064516129032258,
+      "eval_loss": 0.4977356493473053,
+      "eval_runtime": 2.1565,
+      "eval_samples_per_second": 28.75,
+      "eval_steps_per_second": 1.855,
+      "step": 117
     },
     {
+      "epoch": 26.67,
       "learning_rate": 1.388888888888889e-05,
+      "loss": 0.3344,
+      "step": 120
+    },
+    {
+      "epoch": 26.89,
+      "eval_accuracy": 0.8709677419354839,
+      "eval_loss": 0.41801995038986206,
+      "eval_runtime": 2.357,
+      "eval_samples_per_second": 26.304,
+      "eval_steps_per_second": 1.697,
+      "step": 121
     },
     {
       "epoch": 28.0,
+      "eval_accuracy": 0.8225806451612904,
+      "eval_loss": 0.5254219770431519,
+      "eval_runtime": 2.3326,
+      "eval_samples_per_second": 26.58,
+      "eval_steps_per_second": 1.715,
+      "step": 126
     },
     {
+      "epoch": 28.89,
+      "learning_rate": 1.0416666666666668e-05,
+      "loss": 0.3301,
+      "step": 130
     },
     {
+      "epoch": 28.89,
+      "eval_accuracy": 0.8225806451612904,
+      "eval_loss": 0.5396197438240051,
+      "eval_runtime": 2.0979,
+      "eval_samples_per_second": 29.553,
+      "eval_steps_per_second": 1.907,
+      "step": 130
     },
     {
       "epoch": 30.0,
+      "eval_accuracy": 0.7903225806451613,
+      "eval_loss": 0.5654030442237854,
+      "eval_runtime": 2.3721,
+      "eval_samples_per_second": 26.138,
+      "eval_steps_per_second": 1.686,
+      "step": 135
     },
     {
+      "epoch": 30.89,
+      "eval_accuracy": 0.8064516129032258,
+      "eval_loss": 0.5931597948074341,
+      "eval_runtime": 2.252,
+      "eval_samples_per_second": 27.531,
+      "eval_steps_per_second": 1.776,
+      "step": 139
     },
     {
+      "epoch": 31.11,
+      "learning_rate": 6.944444444444445e-06,
+      "loss": 0.3262,
+      "step": 140
     },
     {
       "epoch": 32.0,
+      "eval_accuracy": 0.8064516129032258,
+      "eval_loss": 0.5630321502685547,
+      "eval_runtime": 2.111,
+      "eval_samples_per_second": 29.37,
+      "eval_steps_per_second": 1.895,
+      "step": 144
     },
     {
+      "epoch": 32.89,
+      "eval_accuracy": 0.8064516129032258,
+      "eval_loss": 0.5433912873268127,
+      "eval_runtime": 2.2255,
+      "eval_samples_per_second": 27.858,
+      "eval_steps_per_second": 1.797,
+      "step": 148
     },
     {
+      "epoch": 33.33,
+      "learning_rate": 3.4722222222222224e-06,
+      "loss": 0.2997,
+      "step": 150
     },
     {
       "epoch": 34.0,
+      "eval_accuracy": 0.8064516129032258,
+      "eval_loss": 0.5314125418663025,
+      "eval_runtime": 2.275,
+      "eval_samples_per_second": 27.252,
+      "eval_steps_per_second": 1.758,
+      "step": 153
     },
     {
+      "epoch": 34.89,
+      "eval_accuracy": 0.8064516129032258,
+      "eval_loss": 0.5194743275642395,
+      "eval_runtime": 2.1655,
+      "eval_samples_per_second": 28.631,
+      "eval_steps_per_second": 1.847,
+      "step": 157
     },
     {
+      "epoch": 35.56,
+      "learning_rate": 0.0,
+      "loss": 0.2891,
+      "step": 160
     },
     {
+      "epoch": 35.56,
+      "eval_accuracy": 0.8064516129032258,
+      "eval_loss": 0.5155302286148071,
+      "eval_runtime": 2.3866,
+      "eval_samples_per_second": 25.979,
+      "eval_steps_per_second": 1.676,
+      "step": 160
     },
     {
+      "epoch": 35.56,
+      "step": 160,
+      "total_flos": 7.931930389512192e+17,
+      "train_loss": 0.5975452944636345,
+      "train_runtime": 588.8758,
+      "train_samples_per_second": 19.563,
+      "train_steps_per_second": 0.272
     }
   ],
   "logging_steps": 10,
+  "max_steps": 160,
   "num_input_tokens_seen": 0,
   "num_train_epochs": 40,
   "save_steps": 500,
+  "total_flos": 7.931930389512192e+17,
   "train_batch_size": 16,
   "trial_name": null,
   "trial_params": null

training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:eae6eb305d4a1fc3c2e6aed49550e5bc84aa5e9c875af70f1e0b8abb96e87781
 size 4728

 version https://git-lfs.github.com/spec/v1
+oid sha256:492f9fd8b047d1211e7f0f6292ed08cde5c5098394b987a9a0ea2f84aaed7e54
 size 4728