End of training

Browse files

Files changed (13) hide show

README.md +39 -43
all_results.json +10 -10
config.json +8 -4
eval_results.json +6 -6
model.safetensors +2 -2
runs/Dec01_17-09-38_DESKTOP-SKBE9FB/events.out.tfevents.1733094579.DESKTOP-SKBE9FB.18044.0 +3 -0
runs/Dec01_17-53-11_DESKTOP-SKBE9FB/events.out.tfevents.1733097193.DESKTOP-SKBE9FB.15124.0 +3 -0
runs/Dec01_18-02-46_DESKTOP-SKBE9FB/events.out.tfevents.1733097768.DESKTOP-SKBE9FB.2668.0 +3 -0
runs/Dec01_18-10-08_DESKTOP-SKBE9FB/events.out.tfevents.1733098210.DESKTOP-SKBE9FB.2796.0 +3 -0
runs/Dec01_18-10-08_DESKTOP-SKBE9FB/events.out.tfevents.1733098802.DESKTOP-SKBE9FB.2796.1 +3 -0
train_results.json +5 -5
trainer_state.json +309 -441
training_args.bin +1 -1

README.md CHANGED Viewed

@@ -22,7 +22,7 @@ model-index:
     metrics:
     - name: Accuracy
       type: accuracy
-      value: 0.8317757009345794
 ---
 <!-- This model card has been generated automatically according to the information the Trainer had access to. You
@@ -32,8 +32,8 @@ should probably proofread and complete it, then remove this comment. -->
 This model is a fine-tuned version of [microsoft/beit-base-patch16-224](https://huggingface.co/microsoft/beit-base-patch16-224) on the imagefolder dataset.
 It achieves the following results on the evaluation set:
-- Loss: 0.5393
-- Accuracy: 0.8318
 ## Model description
@@ -67,46 +67,42 @@ The following hyperparameters were used during training:
 | Training Loss | Epoch | Step | Validation Loss | Accuracy |
 |:-------------:|:-----:|:----:|:---------------:|:--------:|
-| No log        | 1.0   | 8    | 0.6887          | 0.5888   |
-| 0.692         | 2.0   | 16   | 0.6782          | 0.5888   |
-| 0.6801        | 3.0   | 24   | 0.6669          | 0.5888   |
-| 0.6696        | 4.0   | 32   | 0.6644          | 0.5888   |
-| 0.6607        | 5.0   | 40   | 0.6661          | 0.6636   |
-| 0.6607        | 6.0   | 48   | 0.6241          | 0.6542   |
-| 0.6341        | 7.0   | 56   | 0.6235          | 0.6542   |
-| 0.6089        | 8.0   | 64   | 0.6088          | 0.6916   |
-| 0.6095        | 9.0   | 72   | 0.5912          | 0.6916   |
-| 0.5632        | 10.0  | 80   | 0.6607          | 0.6355   |
-| 0.5632        | 11.0  | 88   | 0.5793          | 0.7009   |
-| 0.5418        | 12.0  | 96   | 0.5953          | 0.6822   |
-| 0.5336        | 13.0  | 104  | 0.5793          | 0.7103   |
-| 0.5102        | 14.0  | 112  | 0.5292          | 0.7196   |
-| 0.4762        | 15.0  | 120  | 0.6558          | 0.7009   |
-| 0.4762        | 16.0  | 128  | 0.5371          | 0.7103   |
-| 0.544         | 17.0  | 136  | 0.5401          | 0.7570   |
-| 0.4256        | 18.0  | 144  | 0.4927          | 0.7944   |
-| 0.4082        | 19.0  | 152  | 0.5801          | 0.7383   |
-| 0.4014        | 20.0  | 160  | 0.5823          | 0.7383   |
-| 0.4014        | 21.0  | 168  | 0.5393          | 0.7757   |
-| 0.3483        | 22.0  | 176  | 0.5941          | 0.7103   |
-| 0.3121        | 23.0  | 184  | 0.5569          | 0.7383   |
-| 0.3484        | 24.0  | 192  | 0.5975          | 0.7664   |
-| 0.263         | 25.0  | 200  | 0.6544          | 0.7570   |
-| 0.263         | 26.0  | 208  | 0.5744          | 0.7757   |
-| 0.2633        | 27.0  | 216  | 0.6095          | 0.7664   |
-| 0.2935        | 28.0  | 224  | 0.5286          | 0.7664   |
-| 0.2332        | 29.0  | 232  | 0.6028          | 0.7850   |
-| 0.2314        | 30.0  | 240  | 0.5935          | 0.7944   |
-| 0.2314        | 31.0  | 248  | 0.5393          | 0.8318   |
-| 0.202         | 32.0  | 256  | 0.5556          | 0.8224   |
-| 0.2127        | 33.0  | 264  | 0.5913          | 0.8037   |
-| 0.2035        | 34.0  | 272  | 0.5337          | 0.8037   |
-| 0.2618        | 35.0  | 280  | 0.6221          | 0.8037   |
-| 0.2618        | 36.0  | 288  | 0.5090          | 0.8318   |
-| 0.217         | 37.0  | 296  | 0.5649          | 0.8224   |
-| 0.2111        | 38.0  | 304  | 0.5683          | 0.8131   |
-| 0.2085        | 39.0  | 312  | 0.5398          | 0.8224   |
-| 0.1912        | 40.0  | 320  | 0.5548          | 0.8224   |
 ### Framework versions

     metrics:
     - name: Accuracy
       type: accuracy
+      value: 0.8225806451612904
 ---
 <!-- This model card has been generated automatically according to the information the Trainer had access to. You
 This model is a fine-tuned version of [microsoft/beit-base-patch16-224](https://huggingface.co/microsoft/beit-base-patch16-224) on the imagefolder dataset.
 It achieves the following results on the evaluation set:
+- Loss: 0.4801
+- Accuracy: 0.8226
 ## Model description
 | Training Loss | Epoch | Step | Validation Loss | Accuracy |
 |:-------------:|:-----:|:----:|:---------------:|:--------:|
+| No log        | 0.89  | 4    | 1.7603          | 0.1452   |
+| No log        | 2.0   | 9    | 1.6852          | 0.1452   |
+| 1.7571        | 2.89  | 13   | 1.5655          | 0.1452   |
+| 1.7571        | 4.0   | 18   | 1.3816          | 0.1452   |
+| 1.5255        | 4.89  | 22   | 1.2599          | 0.3226   |
+| 1.5255        | 6.0   | 27   | 1.1534          | 0.4839   |
+| 1.2245        | 6.89  | 31   | 1.0641          | 0.4839   |
+| 1.2245        | 8.0   | 36   | 1.0372          | 0.4355   |
+| 1.0438        | 8.89  | 40   | 0.9988          | 0.4355   |
+| 1.0438        | 10.0  | 45   | 0.9260          | 0.5161   |
+| 1.0438        | 10.89 | 49   | 0.9085          | 0.7097   |
+| 0.9727        | 12.0  | 54   | 0.8433          | 0.7258   |
+| 0.9727        | 12.89 | 58   | 0.7529          | 0.7742   |
+| 0.8469        | 14.0  | 63   | 0.7187          | 0.7581   |
+| 0.8469        | 14.89 | 67   | 0.6806          | 0.7258   |
+| 0.6908        | 16.0  | 72   | 0.6576          | 0.7581   |
+| 0.6908        | 16.89 | 76   | 0.5742          | 0.7903   |
+| 0.6064        | 18.0  | 81   | 0.6447          | 0.7581   |
+| 0.6064        | 18.89 | 85   | 0.5602          | 0.7742   |
+| 0.5303        | 20.0  | 90   | 0.4943          | 0.7903   |
+| 0.5303        | 20.89 | 94   | 0.5304          | 0.7903   |
+| 0.5303        | 22.0  | 99   | 0.4801          | 0.8226   |
+| 0.4903        | 22.89 | 103  | 0.4849          | 0.8226   |
+| 0.4903        | 24.0  | 108  | 0.5710          | 0.7742   |
+| 0.4261        | 24.89 | 112  | 0.4803          | 0.7903   |
+| 0.4261        | 26.0  | 117  | 0.5671          | 0.7258   |
+| 0.4122        | 26.89 | 121  | 0.4585          | 0.8065   |
+| 0.4122        | 28.0  | 126  | 0.5910          | 0.7097   |
+| 0.3739        | 28.89 | 130  | 0.5821          | 0.7581   |
+| 0.3739        | 30.0  | 135  | 0.5329          | 0.7742   |
+| 0.3739        | 30.89 | 139  | 0.4423          | 0.8226   |
+| 0.3896        | 32.0  | 144  | 0.4716          | 0.7581   |
+| 0.3896        | 32.89 | 148  | 0.4786          | 0.7903   |
+| 0.3472        | 34.0  | 153  | 0.4538          | 0.7903   |
+| 0.3472        | 34.89 | 157  | 0.4553          | 0.7903   |
+| 0.3349        | 35.56 | 160  | 0.4528          | 0.7903   |
 ### Framework versions

all_results.json CHANGED Viewed

@@ -1,12 +1,12 @@
 {
-    "epoch": 40.0,
-    "eval_accuracy": 0.8317757009345794,
-    "eval_loss": 0.5392867922782898,
-    "eval_runtime": 2.3105,
-    "eval_samples_per_second": 46.31,
-    "eval_steps_per_second": 3.03,
-    "train_loss": 0.4049976162612438,
-    "train_runtime": 701.3243,
-    "train_samples_per_second": 28.403,
-    "train_steps_per_second": 0.456
 }

 {
+    "epoch": 35.56,
+    "eval_accuracy": 0.8225806451612904,
+    "eval_loss": 0.48010584712028503,
+    "eval_runtime": 2.5596,
+    "eval_samples_per_second": 24.223,
+    "eval_steps_per_second": 1.563,
+    "train_loss": 0.7482577681541442,
+    "train_runtime": 589.7762,
+    "train_samples_per_second": 19.533,
+    "train_steps_per_second": 0.271
 }

config.json CHANGED Viewed

@@ -14,15 +14,19 @@
   "hidden_dropout_prob": 0.0,
   "hidden_size": 768,
   "id2label": {
-    "0": "HR",
-    "1": "No HR"
   },
   "image_size": 224,
   "initializer_range": 0.02,
   "intermediate_size": 3072,
   "label2id": {
-    "HR": 0,
-    "No HR": 1
   },
   "layer_norm_eps": 1e-12,
   "layer_scale_init_value": 0.1,

   "hidden_dropout_prob": 0.0,
   "hidden_size": 768,
   "id2label": {
+    "0": "active",
+    "1": "active-inactive",
+    "2": "healthy",
+    "3": "inactive"
   },
   "image_size": 224,
   "initializer_range": 0.02,
   "intermediate_size": 3072,
   "label2id": {
+    "active": 0,
+    "active-inactive": 1,
+    "healthy": 2,
+    "inactive": 3
   },
   "layer_norm_eps": 1e-12,
   "layer_scale_init_value": 0.1,

eval_results.json CHANGED Viewed

@@ -1,8 +1,8 @@
 {
-    "epoch": 40.0,
-    "eval_accuracy": 0.8317757009345794,
-    "eval_loss": 0.5392867922782898,
-    "eval_runtime": 2.3105,
-    "eval_samples_per_second": 46.31,
-    "eval_steps_per_second": 3.03
 }

 {
+    "epoch": 35.56,
+    "eval_accuracy": 0.8225806451612904,
+    "eval_loss": 0.48010584712028503,
+    "eval_runtime": 2.5596,
+    "eval_samples_per_second": 24.223,
+    "eval_steps_per_second": 1.563
 }

model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:3eeea300ff3a120329583ab7e00d190047c17c87c67ed1e5a5799d0b845cb144
-size 343080328

 version https://git-lfs.github.com/spec/v1
+oid sha256:d2e0354dd3875d2a95e10cb59e09081044efc892a545ff863b0aaa18b051efa6
+size 343086480

runs/Dec01_17-09-38_DESKTOP-SKBE9FB/events.out.tfevents.1733094579.DESKTOP-SKBE9FB.18044.0 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:c90a088556944c18e49c91b9047a211812a0ae629235b3b9577acedb47130633
+size 8146

runs/Dec01_17-53-11_DESKTOP-SKBE9FB/events.out.tfevents.1733097193.DESKTOP-SKBE9FB.15124.0 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:3129a7fb381f5a5b5536bb13a15331b4a1d56416073bcd6536b696503b67e472
+size 17651

runs/Dec01_18-02-46_DESKTOP-SKBE9FB/events.out.tfevents.1733097768.DESKTOP-SKBE9FB.2668.0 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:bb3c6fd85e0cd85df68369e4dbfb4a09ba174302b615b80037cd450200187de3
+size 14469

runs/Dec01_18-10-08_DESKTOP-SKBE9FB/events.out.tfevents.1733098210.DESKTOP-SKBE9FB.2796.0 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:8a9e884b466dce56ecf87f1ddb8372d84339ad4da748a8b8c73aea615a584ad6
+size 19611

runs/Dec01_18-10-08_DESKTOP-SKBE9FB/events.out.tfevents.1733098802.DESKTOP-SKBE9FB.2796.1 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:fc1f54208f94aab9d58c8a1f6921b72cd15fb82aa5c029bf45826f5593eb5cab
+size 411

train_results.json CHANGED Viewed

@@ -1,7 +1,7 @@
 {
-    "epoch": 40.0,
-    "train_loss": 0.4049976162612438,
-    "train_runtime": 701.3243,
-    "train_samples_per_second": 28.403,
-    "train_steps_per_second": 0.456
 }

 {
+    "epoch": 35.56,
+    "train_loss": 0.7482577681541442,
+    "train_runtime": 589.7762,
+    "train_samples_per_second": 19.533,
+    "train_steps_per_second": 0.271
 }

trainer_state.json CHANGED Viewed

@@ -1,581 +1,449 @@
 {
-  "best_metric": 0.8317757009345794,
-  "best_model_checkpoint": "beit-base-patch16-224-OT\\checkpoint-248",
-  "epoch": 40.0,
   "eval_steps": 500,
-  "global_step": 320,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
   "log_history": [
     {
-      "epoch": 1.0,
-      "eval_accuracy": 0.5887850467289719,
-      "eval_loss": 0.6887365579605103,
-      "eval_runtime": 2.8498,
-      "eval_samples_per_second": 37.546,
-      "eval_steps_per_second": 2.456,
-      "step": 8
-    },
-    {
-      "epoch": 1.25,
-      "learning_rate": 1.5625e-05,
-      "loss": 0.692,
-      "step": 10
     },
     {
       "epoch": 2.0,
-      "eval_accuracy": 0.5887850467289719,
-      "eval_loss": 0.678210437297821,
-      "eval_runtime": 1.9785,
-      "eval_samples_per_second": 54.082,
-      "eval_steps_per_second": 3.538,
-      "step": 16
     },
     {
-      "epoch": 2.5,
       "learning_rate": 3.125e-05,
-      "loss": 0.6801,
-      "step": 20
-    },
-    {
-      "epoch": 3.0,
-      "eval_accuracy": 0.5887850467289719,
-      "eval_loss": 0.6668981313705444,
-      "eval_runtime": 2.0656,
-      "eval_samples_per_second": 51.802,
-      "eval_steps_per_second": 3.389,
-      "step": 24
     },
     {
-      "epoch": 3.75,
-      "learning_rate": 4.6875e-05,
-      "loss": 0.6696,
-      "step": 30
     },
     {
       "epoch": 4.0,
-      "eval_accuracy": 0.5887850467289719,
-      "eval_loss": 0.6644209623336792,
-      "eval_runtime": 2.1267,
-      "eval_samples_per_second": 50.313,
-      "eval_steps_per_second": 3.291,
-      "step": 32
     },
     {
-      "epoch": 5.0,
       "learning_rate": 4.8611111111111115e-05,
-      "loss": 0.6607,
-      "step": 40
     },
     {
-      "epoch": 5.0,
-      "eval_accuracy": 0.6635514018691588,
-      "eval_loss": 0.6661449074745178,
-      "eval_runtime": 1.995,
-      "eval_samples_per_second": 53.635,
-      "eval_steps_per_second": 3.509,
-      "step": 40
     },
     {
       "epoch": 6.0,
-      "eval_accuracy": 0.6542056074766355,
-      "eval_loss": 0.6241438388824463,
-      "eval_runtime": 2.0189,
-      "eval_samples_per_second": 52.999,
-      "eval_steps_per_second": 3.467,
-      "step": 48
-    },
-    {
-      "epoch": 6.25,
-      "learning_rate": 4.6875e-05,
-      "loss": 0.6341,
-      "step": 50
     },
     {
-      "epoch": 7.0,
-      "eval_accuracy": 0.6542056074766355,
-      "eval_loss": 0.6234968900680542,
-      "eval_runtime": 1.9955,
-      "eval_samples_per_second": 53.622,
-      "eval_steps_per_second": 3.508,
-      "step": 56
-    },
-    {
-      "epoch": 7.5,
       "learning_rate": 4.5138888888888894e-05,
-      "loss": 0.6089,
-      "step": 60
     },
     {
-      "epoch": 8.0,
-      "eval_accuracy": 0.6915887850467289,
-      "eval_loss": 0.6088296175003052,
-      "eval_runtime": 2.06,
-      "eval_samples_per_second": 51.942,
-      "eval_steps_per_second": 3.398,
-      "step": 64
     },
     {
-      "epoch": 8.75,
-      "learning_rate": 4.340277777777778e-05,
-      "loss": 0.6095,
-      "step": 70
     },
     {
-      "epoch": 9.0,
-      "eval_accuracy": 0.6915887850467289,
-      "eval_loss": 0.5911644101142883,
-      "eval_runtime": 2.01,
-      "eval_samples_per_second": 53.235,
-      "eval_steps_per_second": 3.483,
-      "step": 72
     },
     {
-      "epoch": 10.0,
-      "learning_rate": 4.166666666666667e-05,
-      "loss": 0.5632,
-      "step": 80
     },
     {
       "epoch": 10.0,
-      "eval_accuracy": 0.6355140186915887,
-      "eval_loss": 0.660692036151886,
-      "eval_runtime": 2.126,
-      "eval_samples_per_second": 50.329,
-      "eval_steps_per_second": 3.293,
-      "step": 80
     },
     {
-      "epoch": 11.0,
-      "eval_accuracy": 0.7009345794392523,
-      "eval_loss": 0.5792553424835205,
-      "eval_runtime": 1.972,
-      "eval_samples_per_second": 54.261,
-      "eval_steps_per_second": 3.55,
-      "step": 88
     },
     {
-      "epoch": 11.25,
-      "learning_rate": 3.993055555555556e-05,
-      "loss": 0.5418,
-      "step": 90
     },
     {
       "epoch": 12.0,
-      "eval_accuracy": 0.6822429906542056,
-      "eval_loss": 0.5953279733657837,
-      "eval_runtime": 2.2228,
-      "eval_samples_per_second": 48.137,
-      "eval_steps_per_second": 3.149,
-      "step": 96
-    },
-    {
-      "epoch": 12.5,
-      "learning_rate": 3.8194444444444444e-05,
-      "loss": 0.5336,
-      "step": 100
     },
     {
-      "epoch": 13.0,
-      "eval_accuracy": 0.7102803738317757,
-      "eval_loss": 0.5792534947395325,
-      "eval_runtime": 1.991,
-      "eval_samples_per_second": 53.742,
-      "eval_steps_per_second": 3.516,
-      "step": 104
     },
     {
-      "epoch": 13.75,
-      "learning_rate": 3.6458333333333336e-05,
-      "loss": 0.5102,
-      "step": 110
     },
     {
       "epoch": 14.0,
-      "eval_accuracy": 0.719626168224299,
-      "eval_loss": 0.5291872024536133,
-      "eval_runtime": 2.0585,
-      "eval_samples_per_second": 51.98,
-      "eval_steps_per_second": 3.401,
-      "step": 112
     },
     {
-      "epoch": 15.0,
-      "learning_rate": 3.472222222222222e-05,
-      "loss": 0.4762,
-      "step": 120
     },
     {
-      "epoch": 15.0,
-      "eval_accuracy": 0.7009345794392523,
-      "eval_loss": 0.6557727456092834,
-      "eval_runtime": 1.9985,
-      "eval_samples_per_second": 53.541,
-      "eval_steps_per_second": 3.503,
-      "step": 120
     },
     {
       "epoch": 16.0,
-      "eval_accuracy": 0.7102803738317757,
-      "eval_loss": 0.5371208786964417,
-      "eval_runtime": 1.971,
-      "eval_samples_per_second": 54.288,
-      "eval_steps_per_second": 3.552,
-      "step": 128
-    },
-    {
-      "epoch": 16.25,
-      "learning_rate": 3.2986111111111115e-05,
-      "loss": 0.544,
-      "step": 130
     },
     {
-      "epoch": 17.0,
-      "eval_accuracy": 0.7570093457943925,
-      "eval_loss": 0.5400705337524414,
-      "eval_runtime": 1.981,
-      "eval_samples_per_second": 54.014,
-      "eval_steps_per_second": 3.534,
-      "step": 136
     },
     {
-      "epoch": 17.5,
-      "learning_rate": 3.125e-05,
-      "loss": 0.4256,
-      "step": 140
     },
     {
       "epoch": 18.0,
-      "eval_accuracy": 0.794392523364486,
-      "eval_loss": 0.49267861247062683,
-      "eval_runtime": 1.9622,
-      "eval_samples_per_second": 54.531,
-      "eval_steps_per_second": 3.567,
-      "step": 144
-    },
-    {
-      "epoch": 18.75,
-      "learning_rate": 2.951388888888889e-05,
-      "loss": 0.4082,
-      "step": 150
     },
     {
-      "epoch": 19.0,
-      "eval_accuracy": 0.7383177570093458,
-      "eval_loss": 0.5800967216491699,
-      "eval_runtime": 1.9825,
-      "eval_samples_per_second": 53.973,
-      "eval_steps_per_second": 3.531,
-      "step": 152
     },
     {
       "epoch": 20.0,
-      "learning_rate": 2.777777777777778e-05,
-      "loss": 0.4014,
-      "step": 160
     },
     {
       "epoch": 20.0,
-      "eval_accuracy": 0.7383177570093458,
-      "eval_loss": 0.5822688937187195,
-      "eval_runtime": 1.985,
-      "eval_samples_per_second": 53.905,
-      "eval_steps_per_second": 3.526,
-      "step": 160
-    },
-    {
-      "epoch": 21.0,
-      "eval_accuracy": 0.7757009345794392,
-      "eval_loss": 0.5392723083496094,
-      "eval_runtime": 2.117,
-      "eval_samples_per_second": 50.542,
-      "eval_steps_per_second": 3.306,
-      "step": 168
     },
     {
-      "epoch": 21.25,
-      "learning_rate": 2.604166666666667e-05,
-      "loss": 0.3483,
-      "step": 170
     },
     {
       "epoch": 22.0,
-      "eval_accuracy": 0.7102803738317757,
-      "eval_loss": 0.5940819382667542,
-      "eval_runtime": 1.9765,
-      "eval_samples_per_second": 54.137,
-      "eval_steps_per_second": 3.542,
-      "step": 176
     },
     {
-      "epoch": 22.5,
-      "learning_rate": 2.4305555555555558e-05,
-      "loss": 0.3121,
-      "step": 180
-    },
-    {
-      "epoch": 23.0,
-      "eval_accuracy": 0.7383177570093458,
-      "eval_loss": 0.5568514466285706,
-      "eval_runtime": 2.1005,
-      "eval_samples_per_second": 50.94,
-      "eval_steps_per_second": 3.333,
-      "step": 184
     },
     {
-      "epoch": 23.75,
-      "learning_rate": 2.2569444444444447e-05,
-      "loss": 0.3484,
-      "step": 190
     },
     {
       "epoch": 24.0,
-      "eval_accuracy": 0.7663551401869159,
-      "eval_loss": 0.5975044369697571,
-      "eval_runtime": 1.97,
-      "eval_samples_per_second": 54.316,
-      "eval_steps_per_second": 3.553,
-      "step": 192
     },
     {
-      "epoch": 25.0,
-      "learning_rate": 2.0833333333333336e-05,
-      "loss": 0.263,
-      "step": 200
     },
     {
-      "epoch": 25.0,
-      "eval_accuracy": 0.7570093457943925,
-      "eval_loss": 0.6544022560119629,
-      "eval_runtime": 2.3716,
-      "eval_samples_per_second": 45.118,
-      "eval_steps_per_second": 2.952,
-      "step": 200
     },
     {
       "epoch": 26.0,
-      "eval_accuracy": 0.7757009345794392,
-      "eval_loss": 0.5743973851203918,
-      "eval_runtime": 2.0105,
-      "eval_samples_per_second": 53.221,
-      "eval_steps_per_second": 3.482,
-      "step": 208
     },
     {
-      "epoch": 26.25,
-      "learning_rate": 1.9097222222222222e-05,
-      "loss": 0.2633,
-      "step": 210
-    },
-    {
-      "epoch": 27.0,
-      "eval_accuracy": 0.7663551401869159,
-      "eval_loss": 0.6095036864280701,
-      "eval_runtime": 1.9725,
-      "eval_samples_per_second": 54.247,
-      "eval_steps_per_second": 3.549,
-      "step": 216
     },
     {
-      "epoch": 27.5,
-      "learning_rate": 1.736111111111111e-05,
-      "loss": 0.2935,
-      "step": 220
     },
     {
       "epoch": 28.0,
-      "eval_accuracy": 0.7663551401869159,
-      "eval_loss": 0.528620719909668,
-      "eval_runtime": 2.0605,
-      "eval_samples_per_second": 51.929,
-      "eval_steps_per_second": 3.397,
-      "step": 224
-    },
-    {
-      "epoch": 28.75,
-      "learning_rate": 1.5625e-05,
-      "loss": 0.2332,
-      "step": 230
     },
     {
-      "epoch": 29.0,
-      "eval_accuracy": 0.7850467289719626,
-      "eval_loss": 0.6027860045433044,
-      "eval_runtime": 1.9665,
-      "eval_samples_per_second": 54.412,
-      "eval_steps_per_second": 3.56,
-      "step": 232
     },
     {
-      "epoch": 30.0,
-      "learning_rate": 1.388888888888889e-05,
-      "loss": 0.2314,
-      "step": 240
     },
     {
       "epoch": 30.0,
-      "eval_accuracy": 0.794392523364486,
-      "eval_loss": 0.5935384631156921,
-      "eval_runtime": 1.962,
-      "eval_samples_per_second": 54.537,
-      "eval_steps_per_second": 3.568,
-      "step": 240
     },
     {
-      "epoch": 31.0,
-      "eval_accuracy": 0.8317757009345794,
-      "eval_loss": 0.5392867922782898,
-      "eval_runtime": 1.969,
-      "eval_samples_per_second": 54.343,
-      "eval_steps_per_second": 3.555,
-      "step": 248
     },
     {
-      "epoch": 31.25,
-      "learning_rate": 1.2152777777777779e-05,
-      "loss": 0.202,
-      "step": 250
     },
     {
       "epoch": 32.0,
-      "eval_accuracy": 0.822429906542056,
-      "eval_loss": 0.5556337833404541,
-      "eval_runtime": 2.012,
-      "eval_samples_per_second": 53.182,
-      "eval_steps_per_second": 3.479,
-      "step": 256
-    },
-    {
-      "epoch": 32.5,
-      "learning_rate": 1.0416666666666668e-05,
-      "loss": 0.2127,
-      "step": 260
     },
     {
-      "epoch": 33.0,
-      "eval_accuracy": 0.8037383177570093,
-      "eval_loss": 0.5912833213806152,
-      "eval_runtime": 1.98,
-      "eval_samples_per_second": 54.041,
-      "eval_steps_per_second": 3.535,
-      "step": 264
     },
     {
-      "epoch": 33.75,
-      "learning_rate": 8.680555555555556e-06,
-      "loss": 0.2035,
-      "step": 270
     },
     {
       "epoch": 34.0,
-      "eval_accuracy": 0.8037383177570093,
-      "eval_loss": 0.5337203741073608,
-      "eval_runtime": 1.9834,
-      "eval_samples_per_second": 53.947,
-      "eval_steps_per_second": 3.529,
-      "step": 272
-    },
-    {
-      "epoch": 35.0,
-      "learning_rate": 6.944444444444445e-06,
-      "loss": 0.2618,
-      "step": 280
-    },
-    {
-      "epoch": 35.0,
-      "eval_accuracy": 0.8037383177570093,
-      "eval_loss": 0.622107982635498,
-      "eval_runtime": 2.0025,
-      "eval_samples_per_second": 53.434,
-      "eval_steps_per_second": 3.496,
-      "step": 280
-    },
-    {
-      "epoch": 36.0,
-      "eval_accuracy": 0.8317757009345794,
-      "eval_loss": 0.5089600682258606,
-      "eval_runtime": 1.9755,
-      "eval_samples_per_second": 54.164,
-      "eval_steps_per_second": 3.543,
-      "step": 288
-    },
-    {
-      "epoch": 36.25,
-      "learning_rate": 5.208333333333334e-06,
-      "loss": 0.217,
-      "step": 290
-    },
-    {
-      "epoch": 37.0,
-      "eval_accuracy": 0.822429906542056,
-      "eval_loss": 0.5649047493934631,
-      "eval_runtime": 1.991,
-      "eval_samples_per_second": 53.743,
-      "eval_steps_per_second": 3.516,
-      "step": 296
     },
     {
-      "epoch": 37.5,
-      "learning_rate": 3.4722222222222224e-06,
-      "loss": 0.2111,
-      "step": 300
-    },
-    {
-      "epoch": 38.0,
-      "eval_accuracy": 0.8130841121495327,
-      "eval_loss": 0.568317174911499,
-      "eval_runtime": 2.0365,
-      "eval_samples_per_second": 52.542,
-      "eval_steps_per_second": 3.437,
-      "step": 304
     },
     {
-      "epoch": 38.75,
-      "learning_rate": 1.7361111111111112e-06,
-      "loss": 0.2085,
-      "step": 310
     },
     {
-      "epoch": 39.0,
-      "eval_accuracy": 0.822429906542056,
-      "eval_loss": 0.5397838950157166,
-      "eval_runtime": 1.9935,
-      "eval_samples_per_second": 53.675,
-      "eval_steps_per_second": 3.511,
-      "step": 312
     },
     {
-      "epoch": 40.0,
-      "learning_rate": 0.0,
-      "loss": 0.1912,
-      "step": 320
-    },
-    {
-      "epoch": 40.0,
-      "eval_accuracy": 0.822429906542056,
-      "eval_loss": 0.5548034310340881,
-      "eval_runtime": 1.978,
-      "eval_samples_per_second": 54.096,
-      "eval_steps_per_second": 3.539,
-      "step": 320
-    },
-    {
-      "epoch": 40.0,
-      "step": 320,
-      "total_flos": 1.5429806632629043e+18,
-      "train_loss": 0.4049976162612438,
-      "train_runtime": 701.3243,
-      "train_samples_per_second": 28.403,
-      "train_steps_per_second": 0.456
     }
   ],
   "logging_steps": 10,
-  "max_steps": 320,
   "num_input_tokens_seen": 0,
   "num_train_epochs": 40,
   "save_steps": 500,
-  "total_flos": 1.5429806632629043e+18,
   "train_batch_size": 16,
   "trial_name": null,
   "trial_params": null

 {
+  "best_metric": 0.8225806451612904,
+  "best_model_checkpoint": "beit-base-patch16-224-OT\\checkpoint-99",
+  "epoch": 35.55555555555556,
   "eval_steps": 500,
+  "global_step": 160,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
   "log_history": [
     {
+      "epoch": 0.89,
+      "eval_accuracy": 0.14516129032258066,
+      "eval_loss": 1.7602994441986084,
+      "eval_runtime": 2.148,
+      "eval_samples_per_second": 28.864,
+      "eval_steps_per_second": 1.862,
+      "step": 4
     },
     {
       "epoch": 2.0,
+      "eval_accuracy": 0.14516129032258066,
+      "eval_loss": 1.685233473777771,
+      "eval_runtime": 2.219,
+      "eval_samples_per_second": 27.94,
+      "eval_steps_per_second": 1.803,
+      "step": 9
     },
     {
+      "epoch": 2.22,
       "learning_rate": 3.125e-05,
+      "loss": 1.7571,
+      "step": 10
     },
     {
+      "epoch": 2.89,
+      "eval_accuracy": 0.14516129032258066,
+      "eval_loss": 1.5655227899551392,
+      "eval_runtime": 2.222,
+      "eval_samples_per_second": 27.903,
+      "eval_steps_per_second": 1.8,
+      "step": 13
     },
     {
       "epoch": 4.0,
+      "eval_accuracy": 0.14516129032258066,
+      "eval_loss": 1.3815577030181885,
+      "eval_runtime": 2.3696,
+      "eval_samples_per_second": 26.165,
+      "eval_steps_per_second": 1.688,
+      "step": 18
     },
     {
+      "epoch": 4.44,
       "learning_rate": 4.8611111111111115e-05,
+      "loss": 1.5255,
+      "step": 20
     },
     {
+      "epoch": 4.89,
+      "eval_accuracy": 0.3225806451612903,
+      "eval_loss": 1.2598901987075806,
+      "eval_runtime": 2.178,
+      "eval_samples_per_second": 28.466,
+      "eval_steps_per_second": 1.837,
+      "step": 22
     },
     {
       "epoch": 6.0,
+      "eval_accuracy": 0.4838709677419355,
+      "eval_loss": 1.153410792350769,
+      "eval_runtime": 2.227,
+      "eval_samples_per_second": 27.84,
+      "eval_steps_per_second": 1.796,
+      "step": 27
     },
     {
+      "epoch": 6.67,
       "learning_rate": 4.5138888888888894e-05,
+      "loss": 1.2245,
+      "step": 30
     },
     {
+      "epoch": 6.89,
+      "eval_accuracy": 0.4838709677419355,
+      "eval_loss": 1.0641188621520996,
+      "eval_runtime": 2.203,
+      "eval_samples_per_second": 28.143,
+      "eval_steps_per_second": 1.816,
+      "step": 31
     },
     {
+      "epoch": 8.0,
+      "eval_accuracy": 0.43548387096774194,
+      "eval_loss": 1.0371758937835693,
+      "eval_runtime": 2.2355,
+      "eval_samples_per_second": 27.734,
+      "eval_steps_per_second": 1.789,
+      "step": 36
     },
     {
+      "epoch": 8.89,
+      "learning_rate": 4.166666666666667e-05,
+      "loss": 1.0438,
+      "step": 40
     },
     {
+      "epoch": 8.89,
+      "eval_accuracy": 0.43548387096774194,
+      "eval_loss": 0.9987961649894714,
+      "eval_runtime": 2.3086,
+      "eval_samples_per_second": 26.857,
+      "eval_steps_per_second": 1.733,
+      "step": 40
     },
     {
       "epoch": 10.0,
+      "eval_accuracy": 0.5161290322580645,
+      "eval_loss": 0.9259945154190063,
+      "eval_runtime": 2.2905,
+      "eval_samples_per_second": 27.068,
+      "eval_steps_per_second": 1.746,
+      "step": 45
     },
     {
+      "epoch": 10.89,
+      "eval_accuracy": 0.7096774193548387,
+      "eval_loss": 0.9084866046905518,
+      "eval_runtime": 2.2545,
+      "eval_samples_per_second": 27.5,
+      "eval_steps_per_second": 1.774,
+      "step": 49
     },
     {
+      "epoch": 11.11,
+      "learning_rate": 3.8194444444444444e-05,
+      "loss": 0.9727,
+      "step": 50
     },
     {
       "epoch": 12.0,
+      "eval_accuracy": 0.7258064516129032,
+      "eval_loss": 0.843325674533844,
+      "eval_runtime": 2.1865,
+      "eval_samples_per_second": 28.355,
+      "eval_steps_per_second": 1.829,
+      "step": 54
     },
     {
+      "epoch": 12.89,
+      "eval_accuracy": 0.7741935483870968,
+      "eval_loss": 0.7529016137123108,
+      "eval_runtime": 2.1995,
+      "eval_samples_per_second": 28.188,
+      "eval_steps_per_second": 1.819,
+      "step": 58
     },
     {
+      "epoch": 13.33,
+      "learning_rate": 3.472222222222222e-05,
+      "loss": 0.8469,
+      "step": 60
     },
     {
       "epoch": 14.0,
+      "eval_accuracy": 0.7580645161290323,
+      "eval_loss": 0.7186572551727295,
+      "eval_runtime": 2.2225,
+      "eval_samples_per_second": 27.896,
+      "eval_steps_per_second": 1.8,
+      "step": 63
     },
     {
+      "epoch": 14.89,
+      "eval_accuracy": 0.7258064516129032,
+      "eval_loss": 0.6805762648582458,
+      "eval_runtime": 2.1855,
+      "eval_samples_per_second": 28.369,
+      "eval_steps_per_second": 1.83,
+      "step": 67
     },
     {
+      "epoch": 15.56,
+      "learning_rate": 3.125e-05,
+      "loss": 0.6908,
+      "step": 70
     },
     {
       "epoch": 16.0,
+      "eval_accuracy": 0.7580645161290323,
+      "eval_loss": 0.6575707197189331,
+      "eval_runtime": 2.2315,
+      "eval_samples_per_second": 27.784,
+      "eval_steps_per_second": 1.792,
+      "step": 72
     },
     {
+      "epoch": 16.89,
+      "eval_accuracy": 0.7903225806451613,
+      "eval_loss": 0.5742202997207642,
+      "eval_runtime": 2.261,
+      "eval_samples_per_second": 27.421,
+      "eval_steps_per_second": 1.769,
+      "step": 76
     },
     {
+      "epoch": 17.78,
+      "learning_rate": 2.777777777777778e-05,
+      "loss": 0.6064,
+      "step": 80
     },
     {
       "epoch": 18.0,
+      "eval_accuracy": 0.7580645161290323,
+      "eval_loss": 0.6446634531021118,
+      "eval_runtime": 2.3311,
+      "eval_samples_per_second": 26.597,
+      "eval_steps_per_second": 1.716,
+      "step": 81
     },
     {
+      "epoch": 18.89,
+      "eval_accuracy": 0.7741935483870968,
+      "eval_loss": 0.5602142810821533,
+      "eval_runtime": 2.1895,
+      "eval_samples_per_second": 28.317,
+      "eval_steps_per_second": 1.827,
+      "step": 85
     },
     {
       "epoch": 20.0,
+      "learning_rate": 2.4305555555555558e-05,
+      "loss": 0.5303,
+      "step": 90
     },
     {
       "epoch": 20.0,
+      "eval_accuracy": 0.7903225806451613,
+      "eval_loss": 0.49427932500839233,
+      "eval_runtime": 2.2745,
+      "eval_samples_per_second": 27.258,
+      "eval_steps_per_second": 1.759,
+      "step": 90
     },
     {
+      "epoch": 20.89,
+      "eval_accuracy": 0.7903225806451613,
+      "eval_loss": 0.530381441116333,
+      "eval_runtime": 2.142,
+      "eval_samples_per_second": 28.945,
+      "eval_steps_per_second": 1.867,
+      "step": 94
     },
     {
       "epoch": 22.0,
+      "eval_accuracy": 0.8225806451612904,
+      "eval_loss": 0.48010584712028503,
+      "eval_runtime": 2.3616,
+      "eval_samples_per_second": 26.254,
+      "eval_steps_per_second": 1.694,
+      "step": 99
     },
     {
+      "epoch": 22.22,
+      "learning_rate": 2.0833333333333336e-05,
+      "loss": 0.4903,
+      "step": 100
     },
     {
+      "epoch": 22.89,
+      "eval_accuracy": 0.8225806451612904,
+      "eval_loss": 0.4848884344100952,
+      "eval_runtime": 2.16,
+      "eval_samples_per_second": 28.703,
+      "eval_steps_per_second": 1.852,
+      "step": 103
     },
     {
       "epoch": 24.0,
+      "eval_accuracy": 0.7741935483870968,
+      "eval_loss": 0.5709980726242065,
+      "eval_runtime": 2.1685,
+      "eval_samples_per_second": 28.591,
+      "eval_steps_per_second": 1.845,
+      "step": 108
     },
     {
+      "epoch": 24.44,
+      "learning_rate": 1.736111111111111e-05,
+      "loss": 0.4261,
+      "step": 110
     },
     {
+      "epoch": 24.89,
+      "eval_accuracy": 0.7903225806451613,
+      "eval_loss": 0.4803168475627899,
+      "eval_runtime": 2.2145,
+      "eval_samples_per_second": 27.997,
+      "eval_steps_per_second": 1.806,
+      "step": 112
     },
     {
       "epoch": 26.0,
+      "eval_accuracy": 0.7258064516129032,
+      "eval_loss": 0.5670634508132935,
+      "eval_runtime": 2.1993,
+      "eval_samples_per_second": 28.191,
+      "eval_steps_per_second": 1.819,
+      "step": 117
     },
     {
+      "epoch": 26.67,
+      "learning_rate": 1.388888888888889e-05,
+      "loss": 0.4122,
+      "step": 120
     },
     {
+      "epoch": 26.89,
+      "eval_accuracy": 0.8064516129032258,
+      "eval_loss": 0.4585064947605133,
+      "eval_runtime": 2.2065,
+      "eval_samples_per_second": 28.098,
+      "eval_steps_per_second": 1.813,
+      "step": 121
     },
     {
       "epoch": 28.0,
+      "eval_accuracy": 0.7096774193548387,
+      "eval_loss": 0.5910329222679138,
+      "eval_runtime": 2.23,
+      "eval_samples_per_second": 27.802,
+      "eval_steps_per_second": 1.794,
+      "step": 126
     },
     {
+      "epoch": 28.89,
+      "learning_rate": 1.0416666666666668e-05,
+      "loss": 0.3739,
+      "step": 130
     },
     {
+      "epoch": 28.89,
+      "eval_accuracy": 0.7580645161290323,
+      "eval_loss": 0.5821260213851929,
+      "eval_runtime": 2.2145,
+      "eval_samples_per_second": 27.997,
+      "eval_steps_per_second": 1.806,
+      "step": 130
     },
     {
       "epoch": 30.0,
+      "eval_accuracy": 0.7741935483870968,
+      "eval_loss": 0.5329306125640869,
+      "eval_runtime": 2.3526,
+      "eval_samples_per_second": 26.354,
+      "eval_steps_per_second": 1.7,
+      "step": 135
     },
     {
+      "epoch": 30.89,
+      "eval_accuracy": 0.8225806451612904,
+      "eval_loss": 0.4422537386417389,
+      "eval_runtime": 2.1625,
+      "eval_samples_per_second": 28.67,
+      "eval_steps_per_second": 1.85,
+      "step": 139
     },
     {
+      "epoch": 31.11,
+      "learning_rate": 6.944444444444445e-06,
+      "loss": 0.3896,
+      "step": 140
     },
     {
       "epoch": 32.0,
+      "eval_accuracy": 0.7580645161290323,
+      "eval_loss": 0.47155243158340454,
+      "eval_runtime": 2.1865,
+      "eval_samples_per_second": 28.356,
+      "eval_steps_per_second": 1.829,
+      "step": 144
     },
     {
+      "epoch": 32.89,
+      "eval_accuracy": 0.7903225806451613,
+      "eval_loss": 0.4785827100276947,
+      "eval_runtime": 2.232,
+      "eval_samples_per_second": 27.777,
+      "eval_steps_per_second": 1.792,
+      "step": 148
     },
     {
+      "epoch": 33.33,
+      "learning_rate": 3.4722222222222224e-06,
+      "loss": 0.3472,
+      "step": 150
     },
     {
       "epoch": 34.0,
+      "eval_accuracy": 0.7903225806451613,
+      "eval_loss": 0.45382845401763916,
+      "eval_runtime": 2.19,
+      "eval_samples_per_second": 28.31,
+      "eval_steps_per_second": 1.826,
+      "step": 153
     },
     {
+      "epoch": 34.89,
+      "eval_accuracy": 0.7903225806451613,
+      "eval_loss": 0.455282062292099,
+      "eval_runtime": 2.2165,
+      "eval_samples_per_second": 27.972,
+      "eval_steps_per_second": 1.805,
+      "step": 157
     },
     {
+      "epoch": 35.56,
+      "learning_rate": 0.0,
+      "loss": 0.3349,
+      "step": 160
     },
     {
+      "epoch": 35.56,
+      "eval_accuracy": 0.7903225806451613,
+      "eval_loss": 0.45279815793037415,
+      "eval_runtime": 2.4931,
+      "eval_samples_per_second": 24.869,
+      "eval_steps_per_second": 1.604,
+      "step": 160
     },
     {
+      "epoch": 35.56,
+      "step": 160,
+      "total_flos": 7.931930389512192e+17,
+      "train_loss": 0.7482577681541442,
+      "train_runtime": 589.7762,
+      "train_samples_per_second": 19.533,
+      "train_steps_per_second": 0.271
     }
   ],
   "logging_steps": 10,
+  "max_steps": 160,
   "num_input_tokens_seen": 0,
   "num_train_epochs": 40,
   "save_steps": 500,
+  "total_flos": 7.931930389512192e+17,
   "train_batch_size": 16,
   "trial_name": null,
   "trial_params": null

training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:289be5ea4287de61c05dc38506ba40eb212d6de2c0bca319801e20a96f6874c0
 size 4728

 version https://git-lfs.github.com/spec/v1
+oid sha256:70281fb12f068732959d20071bec1711ddb5ad7a6484dbe72999c1aab81491a0
 size 4728