End of training

Browse files

Files changed (10) hide show

README.md +43 -39
all_results.json +10 -10
config.json +4 -8
eval_results.json +6 -6
model.safetensors +2 -2
runs/Dec01_16-47-09_DESKTOP-SKBE9FB/events.out.tfevents.1733093230.DESKTOP-SKBE9FB.8952.0 +3 -0
runs/Dec01_16-47-09_DESKTOP-SKBE9FB/events.out.tfevents.1733093934.DESKTOP-SKBE9FB.8952.1 +3 -0
train_results.json +5 -5
trainer_state.json +441 -309
training_args.bin +1 -1

README.md CHANGED Viewed

@@ -22,7 +22,7 @@ model-index:
     metrics:
     - name: Accuracy
       type: accuracy
-      value: 0.8709677419354839
 ---
 <!-- This model card has been generated automatically according to the information the Trainer had access to. You
@@ -32,8 +32,8 @@ should probably proofread and complete it, then remove this comment. -->
 This model is a fine-tuned version of [microsoft/beit-base-patch16-224](https://huggingface.co/microsoft/beit-base-patch16-224) on the imagefolder dataset.
 It achieves the following results on the evaluation set:
-- Loss: 0.4334
-- Accuracy: 0.8710
 ## Model description
@@ -67,42 +67,46 @@ The following hyperparameters were used during training:
 | Training Loss | Epoch | Step | Validation Loss | Accuracy |
 |:-------------:|:-----:|:----:|:---------------:|:--------:|
-| No log        | 0.89  | 4    | 1.3799          | 0.5      |
-| No log        | 2.0   | 9    | 1.3424          | 0.4516   |
-| 1.3727        | 2.89  | 13   | 1.2846          | 0.4516   |
-| 1.3727        | 4.0   | 18   | 1.1867          | 0.4516   |
-| 1.262         | 4.89  | 22   | 1.1083          | 0.4516   |
-| 1.262         | 6.0   | 27   | 1.0096          | 0.7419   |
-| 1.0651        | 6.89  | 31   | 0.9655          | 0.6290   |
-| 1.0651        | 8.0   | 36   | 0.7953          | 0.8065   |
-| 0.8729        | 8.89  | 40   | 0.8145          | 0.7742   |
-| 0.8729        | 10.0  | 45   | 0.6767          | 0.7903   |
-| 0.8729        | 10.89 | 49   | 0.6978          | 0.7419   |
-| 0.7206        | 12.0  | 54   | 0.7585          | 0.6935   |
-| 0.7206        | 12.89 | 58   | 0.5204          | 0.8387   |
-| 0.5783        | 14.0  | 63   | 0.6260          | 0.7903   |
-| 0.5783        | 14.89 | 67   | 0.4707          | 0.8387   |
-| 0.4827        | 16.0  | 72   | 0.6392          | 0.8065   |
-| 0.4827        | 16.89 | 76   | 0.4334          | 0.8710   |
-| 0.4465        | 18.0  | 81   | 0.5769          | 0.7903   |
-| 0.4465        | 18.89 | 85   | 0.5047          | 0.8226   |
-| 0.4166        | 20.0  | 90   | 0.5191          | 0.8710   |
-| 0.4166        | 20.89 | 94   | 0.5115          | 0.8226   |
-| 0.4166        | 22.0  | 99   | 0.6454          | 0.7419   |
-| 0.4209        | 22.89 | 103  | 0.5939          | 0.7742   |
-| 0.4209        | 24.0  | 108  | 0.4799          | 0.8710   |
-| 0.3429        | 24.89 | 112  | 0.5511          | 0.8065   |
-| 0.3429        | 26.0  | 117  | 0.4977          | 0.8065   |
-| 0.3344        | 26.89 | 121  | 0.4180          | 0.8710   |
-| 0.3344        | 28.0  | 126  | 0.5254          | 0.8226   |
-| 0.3301        | 28.89 | 130  | 0.5396          | 0.8226   |
-| 0.3301        | 30.0  | 135  | 0.5654          | 0.7903   |
-| 0.3301        | 30.89 | 139  | 0.5932          | 0.8065   |
-| 0.3262        | 32.0  | 144  | 0.5630          | 0.8065   |
-| 0.3262        | 32.89 | 148  | 0.5434          | 0.8065   |
-| 0.2997        | 34.0  | 153  | 0.5314          | 0.8065   |
-| 0.2997        | 34.89 | 157  | 0.5195          | 0.8065   |
-| 0.2891        | 35.56 | 160  | 0.5155          | 0.8065   |
 ### Framework versions

     metrics:
     - name: Accuracy
       type: accuracy
+      value: 0.8317757009345794
 ---
 <!-- This model card has been generated automatically according to the information the Trainer had access to. You
 This model is a fine-tuned version of [microsoft/beit-base-patch16-224](https://huggingface.co/microsoft/beit-base-patch16-224) on the imagefolder dataset.
 It achieves the following results on the evaluation set:
+- Loss: 0.5393
+- Accuracy: 0.8318
 ## Model description
 | Training Loss | Epoch | Step | Validation Loss | Accuracy |
 |:-------------:|:-----:|:----:|:---------------:|:--------:|
+| No log        | 1.0   | 8    | 0.6887          | 0.5888   |
+| 0.692         | 2.0   | 16   | 0.6782          | 0.5888   |
+| 0.6801        | 3.0   | 24   | 0.6669          | 0.5888   |
+| 0.6696        | 4.0   | 32   | 0.6644          | 0.5888   |
+| 0.6607        | 5.0   | 40   | 0.6661          | 0.6636   |
+| 0.6607        | 6.0   | 48   | 0.6241          | 0.6542   |
+| 0.6341        | 7.0   | 56   | 0.6235          | 0.6542   |
+| 0.6089        | 8.0   | 64   | 0.6088          | 0.6916   |
+| 0.6095        | 9.0   | 72   | 0.5912          | 0.6916   |
+| 0.5632        | 10.0  | 80   | 0.6607          | 0.6355   |
+| 0.5632        | 11.0  | 88   | 0.5793          | 0.7009   |
+| 0.5418        | 12.0  | 96   | 0.5953          | 0.6822   |
+| 0.5336        | 13.0  | 104  | 0.5793          | 0.7103   |
+| 0.5102        | 14.0  | 112  | 0.5292          | 0.7196   |
+| 0.4762        | 15.0  | 120  | 0.6558          | 0.7009   |
+| 0.4762        | 16.0  | 128  | 0.5371          | 0.7103   |
+| 0.544         | 17.0  | 136  | 0.5401          | 0.7570   |
+| 0.4256        | 18.0  | 144  | 0.4927          | 0.7944   |
+| 0.4082        | 19.0  | 152  | 0.5801          | 0.7383   |
+| 0.4014        | 20.0  | 160  | 0.5823          | 0.7383   |
+| 0.4014        | 21.0  | 168  | 0.5393          | 0.7757   |
+| 0.3483        | 22.0  | 176  | 0.5941          | 0.7103   |
+| 0.3121        | 23.0  | 184  | 0.5569          | 0.7383   |
+| 0.3484        | 24.0  | 192  | 0.5975          | 0.7664   |
+| 0.263         | 25.0  | 200  | 0.6544          | 0.7570   |
+| 0.263         | 26.0  | 208  | 0.5744          | 0.7757   |
+| 0.2633        | 27.0  | 216  | 0.6095          | 0.7664   |
+| 0.2935        | 28.0  | 224  | 0.5286          | 0.7664   |
+| 0.2332        | 29.0  | 232  | 0.6028          | 0.7850   |
+| 0.2314        | 30.0  | 240  | 0.5935          | 0.7944   |
+| 0.2314        | 31.0  | 248  | 0.5393          | 0.8318   |
+| 0.202         | 32.0  | 256  | 0.5556          | 0.8224   |
+| 0.2127        | 33.0  | 264  | 0.5913          | 0.8037   |
+| 0.2035        | 34.0  | 272  | 0.5337          | 0.8037   |
+| 0.2618        | 35.0  | 280  | 0.6221          | 0.8037   |
+| 0.2618        | 36.0  | 288  | 0.5090          | 0.8318   |
+| 0.217         | 37.0  | 296  | 0.5649          | 0.8224   |
+| 0.2111        | 38.0  | 304  | 0.5683          | 0.8131   |
+| 0.2085        | 39.0  | 312  | 0.5398          | 0.8224   |
+| 0.1912        | 40.0  | 320  | 0.5548          | 0.8224   |
 ### Framework versions

all_results.json CHANGED Viewed

@@ -1,12 +1,12 @@
 {
-    "epoch": 35.56,
-    "eval_accuracy": 0.8709677419354839,
-    "eval_loss": 0.43338534235954285,
-    "eval_runtime": 2.5246,
-    "eval_samples_per_second": 24.559,
-    "eval_steps_per_second": 1.584,
-    "train_loss": 0.5975452944636345,
-    "train_runtime": 588.8758,
-    "train_samples_per_second": 19.563,
-    "train_steps_per_second": 0.272
 }

 {
+    "epoch": 40.0,
+    "eval_accuracy": 0.8317757009345794,
+    "eval_loss": 0.5392867922782898,
+    "eval_runtime": 2.3105,
+    "eval_samples_per_second": 46.31,
+    "eval_steps_per_second": 3.03,
+    "train_loss": 0.4049976162612438,
+    "train_runtime": 701.3243,
+    "train_samples_per_second": 28.403,
+    "train_steps_per_second": 0.456
 }

config.json CHANGED Viewed

@@ -14,19 +14,15 @@
   "hidden_dropout_prob": 0.0,
   "hidden_size": 768,
   "id2label": {
-    "0": "active",
-    "1": "active-inactive",
-    "2": "healthy",
-    "3": "inactive"
   },
   "image_size": 224,
   "initializer_range": 0.02,
   "intermediate_size": 3072,
   "label2id": {
-    "active": 0,
-    "active-inactive": 1,
-    "healthy": 2,
-    "inactive": 3
   },
   "layer_norm_eps": 1e-12,
   "layer_scale_init_value": 0.1,

   "hidden_dropout_prob": 0.0,
   "hidden_size": 768,
   "id2label": {
+    "0": "HR",
+    "1": "No HR"
   },
   "image_size": 224,
   "initializer_range": 0.02,
   "intermediate_size": 3072,
   "label2id": {
+    "HR": 0,
+    "No HR": 1
   },
   "layer_norm_eps": 1e-12,
   "layer_scale_init_value": 0.1,

eval_results.json CHANGED Viewed

@@ -1,8 +1,8 @@
 {
-    "epoch": 35.56,
-    "eval_accuracy": 0.8709677419354839,
-    "eval_loss": 0.43338534235954285,
-    "eval_runtime": 2.5246,
-    "eval_samples_per_second": 24.559,
-    "eval_steps_per_second": 1.584
 }

 {
+    "epoch": 40.0,
+    "eval_accuracy": 0.8317757009345794,
+    "eval_loss": 0.5392867922782898,
+    "eval_runtime": 2.3105,
+    "eval_samples_per_second": 46.31,
+    "eval_steps_per_second": 3.03
 }

model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:9461d3c4b7148ad7928d9f22de8764e8b5e4a05aca1aba6bff0b3200b36d426b
-size 343086480

 version https://git-lfs.github.com/spec/v1
+oid sha256:3eeea300ff3a120329583ab7e00d190047c17c87c67ed1e5a5799d0b845cb144
+size 343080328

runs/Dec01_16-47-09_DESKTOP-SKBE9FB/events.out.tfevents.1733093230.DESKTOP-SKBE9FB.8952.0 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:4fb6a8e9bdb89b40f494bf6bdd8f1d6f93f6462b0ae0cbc600c2b435833c9375
+size 23387

runs/Dec01_16-47-09_DESKTOP-SKBE9FB/events.out.tfevents.1733093934.DESKTOP-SKBE9FB.8952.1 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:a7b161fffc86cb516b20ac597456df212892f3a4f8d5f9685c06b4258273bb69
+size 411

train_results.json CHANGED Viewed

@@ -1,7 +1,7 @@
 {
-    "epoch": 35.56,
-    "train_loss": 0.5975452944636345,
-    "train_runtime": 588.8758,
-    "train_samples_per_second": 19.563,
-    "train_steps_per_second": 0.272
 }

 {
+    "epoch": 40.0,
+    "train_loss": 0.4049976162612438,
+    "train_runtime": 701.3243,
+    "train_samples_per_second": 28.403,
+    "train_steps_per_second": 0.456
 }

trainer_state.json CHANGED Viewed

@@ -1,449 +1,581 @@
 {
-  "best_metric": 0.8709677419354839,
-  "best_model_checkpoint": "beit-base-patch16-224-OT\\checkpoint-76",
-  "epoch": 35.55555555555556,
   "eval_steps": 500,
-  "global_step": 160,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
   "log_history": [
     {
-      "epoch": 0.89,
-      "eval_accuracy": 0.5,
-      "eval_loss": 1.379904866218567,
-      "eval_runtime": 2.315,
-      "eval_samples_per_second": 26.782,
-      "eval_steps_per_second": 1.728,
-      "step": 4
     },
     {
       "epoch": 2.0,
-      "eval_accuracy": 0.45161290322580644,
-      "eval_loss": 1.3424019813537598,
-      "eval_runtime": 2.1675,
-      "eval_samples_per_second": 28.604,
-      "eval_steps_per_second": 1.845,
-      "step": 9
     },
     {
-      "epoch": 2.22,
       "learning_rate": 3.125e-05,
-      "loss": 1.3727,
-      "step": 10
     },
     {
-      "epoch": 2.89,
-      "eval_accuracy": 0.45161290322580644,
-      "eval_loss": 1.2845711708068848,
-      "eval_runtime": 2.2255,
-      "eval_samples_per_second": 27.858,
-      "eval_steps_per_second": 1.797,
-      "step": 13
     },
     {
       "epoch": 4.0,
-      "eval_accuracy": 0.45161290322580644,
-      "eval_loss": 1.186702847480774,
-      "eval_runtime": 2.174,
-      "eval_samples_per_second": 28.519,
-      "eval_steps_per_second": 1.84,
-      "step": 18
     },
     {
-      "epoch": 4.44,
       "learning_rate": 4.8611111111111115e-05,
-      "loss": 1.262,
-      "step": 20
     },
     {
-      "epoch": 4.89,
-      "eval_accuracy": 0.45161290322580644,
-      "eval_loss": 1.1083455085754395,
-      "eval_runtime": 2.2285,
-      "eval_samples_per_second": 27.821,
-      "eval_steps_per_second": 1.795,
-      "step": 22
     },
     {
       "epoch": 6.0,
-      "eval_accuracy": 0.7419354838709677,
-      "eval_loss": 1.0096312761306763,
-      "eval_runtime": 2.3886,
-      "eval_samples_per_second": 25.957,
-      "eval_steps_per_second": 1.675,
-      "step": 27
     },
     {
-      "epoch": 6.67,
-      "learning_rate": 4.5138888888888894e-05,
-      "loss": 1.0651,
-      "step": 30
     },
     {
-      "epoch": 6.89,
-      "eval_accuracy": 0.6290322580645161,
-      "eval_loss": 0.965541660785675,
-      "eval_runtime": 2.1775,
-      "eval_samples_per_second": 28.473,
-      "eval_steps_per_second": 1.837,
-      "step": 31
     },
     {
       "epoch": 8.0,
-      "eval_accuracy": 0.8064516129032258,
-      "eval_loss": 0.7952606678009033,
-      "eval_runtime": 2.2276,
-      "eval_samples_per_second": 27.833,
-      "eval_steps_per_second": 1.796,
-      "step": 36
     },
     {
-      "epoch": 8.89,
-      "learning_rate": 4.166666666666667e-05,
-      "loss": 0.8729,
-      "step": 40
     },
     {
-      "epoch": 8.89,
-      "eval_accuracy": 0.7741935483870968,
-      "eval_loss": 0.8145327568054199,
-      "eval_runtime": 2.2085,
-      "eval_samples_per_second": 28.073,
-      "eval_steps_per_second": 1.811,
-      "step": 40
     },
     {
       "epoch": 10.0,
-      "eval_accuracy": 0.7903225806451613,
-      "eval_loss": 0.6766544580459595,
-      "eval_runtime": 2.6727,
-      "eval_samples_per_second": 23.198,
-      "eval_steps_per_second": 1.497,
-      "step": 45
     },
     {
-      "epoch": 10.89,
-      "eval_accuracy": 0.7419354838709677,
-      "eval_loss": 0.6978453993797302,
-      "eval_runtime": 2.1745,
-      "eval_samples_per_second": 28.512,
-      "eval_steps_per_second": 1.839,
-      "step": 49
     },
     {
-      "epoch": 11.11,
-      "learning_rate": 3.8194444444444444e-05,
-      "loss": 0.7206,
-      "step": 50
     },
     {
       "epoch": 12.0,
-      "eval_accuracy": 0.6935483870967742,
-      "eval_loss": 0.7585192918777466,
-      "eval_runtime": 2.1875,
-      "eval_samples_per_second": 28.342,
-      "eval_steps_per_second": 1.829,
-      "step": 54
     },
     {
-      "epoch": 12.89,
-      "eval_accuracy": 0.8387096774193549,
-      "eval_loss": 0.5204325318336487,
-      "eval_runtime": 2.2877,
-      "eval_samples_per_second": 27.101,
-      "eval_steps_per_second": 1.748,
-      "step": 58
     },
     {
-      "epoch": 13.33,
-      "learning_rate": 3.472222222222222e-05,
-      "loss": 0.5783,
-      "step": 60
     },
     {
       "epoch": 14.0,
-      "eval_accuracy": 0.7903225806451613,
-      "eval_loss": 0.6260057687759399,
-      "eval_runtime": 2.148,
-      "eval_samples_per_second": 28.864,
-      "eval_steps_per_second": 1.862,
-      "step": 63
     },
     {
-      "epoch": 14.89,
-      "eval_accuracy": 0.8387096774193549,
-      "eval_loss": 0.47068876028060913,
-      "eval_runtime": 2.2305,
-      "eval_samples_per_second": 27.796,
-      "eval_steps_per_second": 1.793,
-      "step": 67
     },
     {
-      "epoch": 15.56,
-      "learning_rate": 3.125e-05,
-      "loss": 0.4827,
-      "step": 70
     },
     {
       "epoch": 16.0,
-      "eval_accuracy": 0.8064516129032258,
-      "eval_loss": 0.6392358541488647,
-      "eval_runtime": 2.274,
-      "eval_samples_per_second": 27.264,
-      "eval_steps_per_second": 1.759,
-      "step": 72
     },
     {
-      "epoch": 16.89,
-      "eval_accuracy": 0.8709677419354839,
-      "eval_loss": 0.43338534235954285,
-      "eval_runtime": 2.2445,
-      "eval_samples_per_second": 27.623,
-      "eval_steps_per_second": 1.782,
-      "step": 76
     },
     {
-      "epoch": 17.78,
-      "learning_rate": 2.777777777777778e-05,
-      "loss": 0.4465,
-      "step": 80
     },
     {
       "epoch": 18.0,
-      "eval_accuracy": 0.7903225806451613,
-      "eval_loss": 0.5768514275550842,
-      "eval_runtime": 2.222,
-      "eval_samples_per_second": 27.902,
-      "eval_steps_per_second": 1.8,
-      "step": 81
     },
     {
-      "epoch": 18.89,
-      "eval_accuracy": 0.8225806451612904,
-      "eval_loss": 0.5046879053115845,
-      "eval_runtime": 2.2336,
-      "eval_samples_per_second": 27.758,
-      "eval_steps_per_second": 1.791,
-      "step": 85
     },
     {
       "epoch": 20.0,
-      "learning_rate": 2.4305555555555558e-05,
-      "loss": 0.4166,
-      "step": 90
     },
     {
       "epoch": 20.0,
-      "eval_accuracy": 0.8709677419354839,
-      "eval_loss": 0.5190597772598267,
-      "eval_runtime": 2.2074,
-      "eval_samples_per_second": 28.087,
-      "eval_steps_per_second": 1.812,
-      "step": 90
     },
     {
-      "epoch": 20.89,
-      "eval_accuracy": 0.8225806451612904,
-      "eval_loss": 0.5115006566047668,
-      "eval_runtime": 2.1835,
-      "eval_samples_per_second": 28.395,
-      "eval_steps_per_second": 1.832,
-      "step": 94
     },
     {
       "epoch": 22.0,
-      "eval_accuracy": 0.7419354838709677,
-      "eval_loss": 0.6454288959503174,
-      "eval_runtime": 2.19,
-      "eval_samples_per_second": 28.31,
-      "eval_steps_per_second": 1.826,
-      "step": 99
     },
     {
-      "epoch": 22.22,
-      "learning_rate": 2.0833333333333336e-05,
-      "loss": 0.4209,
-      "step": 100
     },
     {
-      "epoch": 22.89,
-      "eval_accuracy": 0.7741935483870968,
-      "eval_loss": 0.5938693881034851,
-      "eval_runtime": 2.135,
-      "eval_samples_per_second": 29.04,
-      "eval_steps_per_second": 1.874,
-      "step": 103
     },
     {
       "epoch": 24.0,
-      "eval_accuracy": 0.8709677419354839,
-      "eval_loss": 0.4799472391605377,
-      "eval_runtime": 2.2005,
-      "eval_samples_per_second": 28.175,
-      "eval_steps_per_second": 1.818,
-      "step": 108
     },
     {
-      "epoch": 24.44,
-      "learning_rate": 1.736111111111111e-05,
-      "loss": 0.3429,
-      "step": 110
     },
     {
-      "epoch": 24.89,
-      "eval_accuracy": 0.8064516129032258,
-      "eval_loss": 0.5510820150375366,
-      "eval_runtime": 2.216,
-      "eval_samples_per_second": 27.978,
-      "eval_steps_per_second": 1.805,
-      "step": 112
     },
     {
       "epoch": 26.0,
-      "eval_accuracy": 0.8064516129032258,
-      "eval_loss": 0.4977356493473053,
-      "eval_runtime": 2.1565,
-      "eval_samples_per_second": 28.75,
-      "eval_steps_per_second": 1.855,
-      "step": 117
     },
     {
-      "epoch": 26.67,
-      "learning_rate": 1.388888888888889e-05,
-      "loss": 0.3344,
-      "step": 120
     },
     {
-      "epoch": 26.89,
-      "eval_accuracy": 0.8709677419354839,
-      "eval_loss": 0.41801995038986206,
-      "eval_runtime": 2.357,
-      "eval_samples_per_second": 26.304,
-      "eval_steps_per_second": 1.697,
-      "step": 121
     },
     {
       "epoch": 28.0,
-      "eval_accuracy": 0.8225806451612904,
-      "eval_loss": 0.5254219770431519,
-      "eval_runtime": 2.3326,
-      "eval_samples_per_second": 26.58,
-      "eval_steps_per_second": 1.715,
-      "step": 126
     },
     {
-      "epoch": 28.89,
-      "learning_rate": 1.0416666666666668e-05,
-      "loss": 0.3301,
-      "step": 130
     },
     {
-      "epoch": 28.89,
-      "eval_accuracy": 0.8225806451612904,
-      "eval_loss": 0.5396197438240051,
-      "eval_runtime": 2.0979,
-      "eval_samples_per_second": 29.553,
-      "eval_steps_per_second": 1.907,
-      "step": 130
     },
     {
       "epoch": 30.0,
-      "eval_accuracy": 0.7903225806451613,
-      "eval_loss": 0.5654030442237854,
-      "eval_runtime": 2.3721,
-      "eval_samples_per_second": 26.138,
-      "eval_steps_per_second": 1.686,
-      "step": 135
     },
     {
-      "epoch": 30.89,
-      "eval_accuracy": 0.8064516129032258,
-      "eval_loss": 0.5931597948074341,
-      "eval_runtime": 2.252,
-      "eval_samples_per_second": 27.531,
-      "eval_steps_per_second": 1.776,
-      "step": 139
     },
     {
-      "epoch": 31.11,
-      "learning_rate": 6.944444444444445e-06,
-      "loss": 0.3262,
-      "step": 140
     },
     {
       "epoch": 32.0,
-      "eval_accuracy": 0.8064516129032258,
-      "eval_loss": 0.5630321502685547,
-      "eval_runtime": 2.111,
-      "eval_samples_per_second": 29.37,
-      "eval_steps_per_second": 1.895,
-      "step": 144
     },
     {
-      "epoch": 32.89,
-      "eval_accuracy": 0.8064516129032258,
-      "eval_loss": 0.5433912873268127,
-      "eval_runtime": 2.2255,
-      "eval_samples_per_second": 27.858,
-      "eval_steps_per_second": 1.797,
-      "step": 148
     },
     {
-      "epoch": 33.33,
-      "learning_rate": 3.4722222222222224e-06,
-      "loss": 0.2997,
-      "step": 150
     },
     {
       "epoch": 34.0,
-      "eval_accuracy": 0.8064516129032258,
-      "eval_loss": 0.5314125418663025,
-      "eval_runtime": 2.275,
-      "eval_samples_per_second": 27.252,
-      "eval_steps_per_second": 1.758,
-      "step": 153
     },
     {
-      "epoch": 34.89,
-      "eval_accuracy": 0.8064516129032258,
-      "eval_loss": 0.5194743275642395,
-      "eval_runtime": 2.1655,
-      "eval_samples_per_second": 28.631,
-      "eval_steps_per_second": 1.847,
-      "step": 157
     },
     {
-      "epoch": 35.56,
-      "learning_rate": 0.0,
-      "loss": 0.2891,
-      "step": 160
     },
     {
-      "epoch": 35.56,
-      "eval_accuracy": 0.8064516129032258,
-      "eval_loss": 0.5155302286148071,
-      "eval_runtime": 2.3866,
-      "eval_samples_per_second": 25.979,
-      "eval_steps_per_second": 1.676,
-      "step": 160
     },
     {
-      "epoch": 35.56,
-      "step": 160,
-      "total_flos": 7.931930389512192e+17,
-      "train_loss": 0.5975452944636345,
-      "train_runtime": 588.8758,
-      "train_samples_per_second": 19.563,
-      "train_steps_per_second": 0.272
     }
   ],
   "logging_steps": 10,
-  "max_steps": 160,
   "num_input_tokens_seen": 0,
   "num_train_epochs": 40,
   "save_steps": 500,
-  "total_flos": 7.931930389512192e+17,
   "train_batch_size": 16,
   "trial_name": null,
   "trial_params": null

 {
+  "best_metric": 0.8317757009345794,
+  "best_model_checkpoint": "beit-base-patch16-224-OT\\checkpoint-248",
+  "epoch": 40.0,
   "eval_steps": 500,
+  "global_step": 320,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
   "log_history": [
     {
+      "epoch": 1.0,
+      "eval_accuracy": 0.5887850467289719,
+      "eval_loss": 0.6887365579605103,
+      "eval_runtime": 2.8498,
+      "eval_samples_per_second": 37.546,
+      "eval_steps_per_second": 2.456,
+      "step": 8
+    },
+    {
+      "epoch": 1.25,
+      "learning_rate": 1.5625e-05,
+      "loss": 0.692,
+      "step": 10
     },
     {
       "epoch": 2.0,
+      "eval_accuracy": 0.5887850467289719,
+      "eval_loss": 0.678210437297821,
+      "eval_runtime": 1.9785,
+      "eval_samples_per_second": 54.082,
+      "eval_steps_per_second": 3.538,
+      "step": 16
     },
     {
+      "epoch": 2.5,
       "learning_rate": 3.125e-05,
+      "loss": 0.6801,
+      "step": 20
+    },
+    {
+      "epoch": 3.0,
+      "eval_accuracy": 0.5887850467289719,
+      "eval_loss": 0.6668981313705444,
+      "eval_runtime": 2.0656,
+      "eval_samples_per_second": 51.802,
+      "eval_steps_per_second": 3.389,
+      "step": 24
     },
     {
+      "epoch": 3.75,
+      "learning_rate": 4.6875e-05,
+      "loss": 0.6696,
+      "step": 30
     },
     {
       "epoch": 4.0,
+      "eval_accuracy": 0.5887850467289719,
+      "eval_loss": 0.6644209623336792,
+      "eval_runtime": 2.1267,
+      "eval_samples_per_second": 50.313,
+      "eval_steps_per_second": 3.291,
+      "step": 32
     },
     {
+      "epoch": 5.0,
       "learning_rate": 4.8611111111111115e-05,
+      "loss": 0.6607,
+      "step": 40
     },
     {
+      "epoch": 5.0,
+      "eval_accuracy": 0.6635514018691588,
+      "eval_loss": 0.6661449074745178,
+      "eval_runtime": 1.995,
+      "eval_samples_per_second": 53.635,
+      "eval_steps_per_second": 3.509,
+      "step": 40
     },
     {
       "epoch": 6.0,
+      "eval_accuracy": 0.6542056074766355,
+      "eval_loss": 0.6241438388824463,
+      "eval_runtime": 2.0189,
+      "eval_samples_per_second": 52.999,
+      "eval_steps_per_second": 3.467,
+      "step": 48
     },
     {
+      "epoch": 6.25,
+      "learning_rate": 4.6875e-05,
+      "loss": 0.6341,
+      "step": 50
     },
     {
+      "epoch": 7.0,
+      "eval_accuracy": 0.6542056074766355,
+      "eval_loss": 0.6234968900680542,
+      "eval_runtime": 1.9955,
+      "eval_samples_per_second": 53.622,
+      "eval_steps_per_second": 3.508,
+      "step": 56
+    },
+    {
+      "epoch": 7.5,
+      "learning_rate": 4.5138888888888894e-05,
+      "loss": 0.6089,
+      "step": 60
     },
     {
       "epoch": 8.0,
+      "eval_accuracy": 0.6915887850467289,
+      "eval_loss": 0.6088296175003052,
+      "eval_runtime": 2.06,
+      "eval_samples_per_second": 51.942,
+      "eval_steps_per_second": 3.398,
+      "step": 64
     },
     {
+      "epoch": 8.75,
+      "learning_rate": 4.340277777777778e-05,
+      "loss": 0.6095,
+      "step": 70
     },
     {
+      "epoch": 9.0,
+      "eval_accuracy": 0.6915887850467289,
+      "eval_loss": 0.5911644101142883,
+      "eval_runtime": 2.01,
+      "eval_samples_per_second": 53.235,
+      "eval_steps_per_second": 3.483,
+      "step": 72
     },
     {
       "epoch": 10.0,
+      "learning_rate": 4.166666666666667e-05,
+      "loss": 0.5632,
+      "step": 80
     },
     {
+      "epoch": 10.0,
+      "eval_accuracy": 0.6355140186915887,
+      "eval_loss": 0.660692036151886,
+      "eval_runtime": 2.126,
+      "eval_samples_per_second": 50.329,
+      "eval_steps_per_second": 3.293,
+      "step": 80
     },
     {
+      "epoch": 11.0,
+      "eval_accuracy": 0.7009345794392523,
+      "eval_loss": 0.5792553424835205,
+      "eval_runtime": 1.972,
+      "eval_samples_per_second": 54.261,
+      "eval_steps_per_second": 3.55,
+      "step": 88
+    },
+    {
+      "epoch": 11.25,
+      "learning_rate": 3.993055555555556e-05,
+      "loss": 0.5418,
+      "step": 90
     },
     {
       "epoch": 12.0,
+      "eval_accuracy": 0.6822429906542056,
+      "eval_loss": 0.5953279733657837,
+      "eval_runtime": 2.2228,
+      "eval_samples_per_second": 48.137,
+      "eval_steps_per_second": 3.149,
+      "step": 96
     },
     {
+      "epoch": 12.5,
+      "learning_rate": 3.8194444444444444e-05,
+      "loss": 0.5336,
+      "step": 100
     },
     {
+      "epoch": 13.0,
+      "eval_accuracy": 0.7102803738317757,
+      "eval_loss": 0.5792534947395325,
+      "eval_runtime": 1.991,
+      "eval_samples_per_second": 53.742,
+      "eval_steps_per_second": 3.516,
+      "step": 104
+    },
+    {
+      "epoch": 13.75,
+      "learning_rate": 3.6458333333333336e-05,
+      "loss": 0.5102,
+      "step": 110
     },
     {
       "epoch": 14.0,
+      "eval_accuracy": 0.719626168224299,
+      "eval_loss": 0.5291872024536133,
+      "eval_runtime": 2.0585,
+      "eval_samples_per_second": 51.98,
+      "eval_steps_per_second": 3.401,
+      "step": 112
     },
     {
+      "epoch": 15.0,
+      "learning_rate": 3.472222222222222e-05,
+      "loss": 0.4762,
+      "step": 120
     },
     {
+      "epoch": 15.0,
+      "eval_accuracy": 0.7009345794392523,
+      "eval_loss": 0.6557727456092834,
+      "eval_runtime": 1.9985,
+      "eval_samples_per_second": 53.541,
+      "eval_steps_per_second": 3.503,
+      "step": 120
     },
     {
       "epoch": 16.0,
+      "eval_accuracy": 0.7102803738317757,
+      "eval_loss": 0.5371208786964417,
+      "eval_runtime": 1.971,
+      "eval_samples_per_second": 54.288,
+      "eval_steps_per_second": 3.552,
+      "step": 128
     },
     {
+      "epoch": 16.25,
+      "learning_rate": 3.2986111111111115e-05,
+      "loss": 0.544,
+      "step": 130
     },
     {
+      "epoch": 17.0,
+      "eval_accuracy": 0.7570093457943925,
+      "eval_loss": 0.5400705337524414,
+      "eval_runtime": 1.981,
+      "eval_samples_per_second": 54.014,
+      "eval_steps_per_second": 3.534,
+      "step": 136
+    },
+    {
+      "epoch": 17.5,
+      "learning_rate": 3.125e-05,
+      "loss": 0.4256,
+      "step": 140
     },
     {
       "epoch": 18.0,
+      "eval_accuracy": 0.794392523364486,
+      "eval_loss": 0.49267861247062683,
+      "eval_runtime": 1.9622,
+      "eval_samples_per_second": 54.531,
+      "eval_steps_per_second": 3.567,
+      "step": 144
+    },
+    {
+      "epoch": 18.75,
+      "learning_rate": 2.951388888888889e-05,
+      "loss": 0.4082,
+      "step": 150
     },
     {
+      "epoch": 19.0,
+      "eval_accuracy": 0.7383177570093458,
+      "eval_loss": 0.5800967216491699,
+      "eval_runtime": 1.9825,
+      "eval_samples_per_second": 53.973,
+      "eval_steps_per_second": 3.531,
+      "step": 152
     },
     {
       "epoch": 20.0,
+      "learning_rate": 2.777777777777778e-05,
+      "loss": 0.4014,
+      "step": 160
     },
     {
       "epoch": 20.0,
+      "eval_accuracy": 0.7383177570093458,
+      "eval_loss": 0.5822688937187195,
+      "eval_runtime": 1.985,
+      "eval_samples_per_second": 53.905,
+      "eval_steps_per_second": 3.526,
+      "step": 160
     },
     {
+      "epoch": 21.0,
+      "eval_accuracy": 0.7757009345794392,
+      "eval_loss": 0.5392723083496094,
+      "eval_runtime": 2.117,
+      "eval_samples_per_second": 50.542,
+      "eval_steps_per_second": 3.306,
+      "step": 168
+    },
+    {
+      "epoch": 21.25,
+      "learning_rate": 2.604166666666667e-05,
+      "loss": 0.3483,
+      "step": 170
     },
     {
       "epoch": 22.0,
+      "eval_accuracy": 0.7102803738317757,
+      "eval_loss": 0.5940819382667542,
+      "eval_runtime": 1.9765,
+      "eval_samples_per_second": 54.137,
+      "eval_steps_per_second": 3.542,
+      "step": 176
     },
     {
+      "epoch": 22.5,
+      "learning_rate": 2.4305555555555558e-05,
+      "loss": 0.3121,
+      "step": 180
+    },
+    {
+      "epoch": 23.0,
+      "eval_accuracy": 0.7383177570093458,
+      "eval_loss": 0.5568514466285706,
+      "eval_runtime": 2.1005,
+      "eval_samples_per_second": 50.94,
+      "eval_steps_per_second": 3.333,
+      "step": 184
     },
     {
+      "epoch": 23.75,
+      "learning_rate": 2.2569444444444447e-05,
+      "loss": 0.3484,
+      "step": 190
     },
     {
       "epoch": 24.0,
+      "eval_accuracy": 0.7663551401869159,
+      "eval_loss": 0.5975044369697571,
+      "eval_runtime": 1.97,
+      "eval_samples_per_second": 54.316,
+      "eval_steps_per_second": 3.553,
+      "step": 192
     },
     {
+      "epoch": 25.0,
+      "learning_rate": 2.0833333333333336e-05,
+      "loss": 0.263,
+      "step": 200
     },
     {
+      "epoch": 25.0,
+      "eval_accuracy": 0.7570093457943925,
+      "eval_loss": 0.6544022560119629,
+      "eval_runtime": 2.3716,
+      "eval_samples_per_second": 45.118,
+      "eval_steps_per_second": 2.952,
+      "step": 200
     },
     {
       "epoch": 26.0,
+      "eval_accuracy": 0.7757009345794392,
+      "eval_loss": 0.5743973851203918,
+      "eval_runtime": 2.0105,
+      "eval_samples_per_second": 53.221,
+      "eval_steps_per_second": 3.482,
+      "step": 208
     },
     {
+      "epoch": 26.25,
+      "learning_rate": 1.9097222222222222e-05,
+      "loss": 0.2633,
+      "step": 210
+    },
+    {
+      "epoch": 27.0,
+      "eval_accuracy": 0.7663551401869159,
+      "eval_loss": 0.6095036864280701,
+      "eval_runtime": 1.9725,
+      "eval_samples_per_second": 54.247,
+      "eval_steps_per_second": 3.549,
+      "step": 216
     },
     {
+      "epoch": 27.5,
+      "learning_rate": 1.736111111111111e-05,
+      "loss": 0.2935,
+      "step": 220
     },
     {
       "epoch": 28.0,
+      "eval_accuracy": 0.7663551401869159,
+      "eval_loss": 0.528620719909668,
+      "eval_runtime": 2.0605,
+      "eval_samples_per_second": 51.929,
+      "eval_steps_per_second": 3.397,
+      "step": 224
     },
     {
+      "epoch": 28.75,
+      "learning_rate": 1.5625e-05,
+      "loss": 0.2332,
+      "step": 230
     },
     {
+      "epoch": 29.0,
+      "eval_accuracy": 0.7850467289719626,
+      "eval_loss": 0.6027860045433044,
+      "eval_runtime": 1.9665,
+      "eval_samples_per_second": 54.412,
+      "eval_steps_per_second": 3.56,
+      "step": 232
+    },
+    {
+      "epoch": 30.0,
+      "learning_rate": 1.388888888888889e-05,
+      "loss": 0.2314,
+      "step": 240
     },
     {
       "epoch": 30.0,
+      "eval_accuracy": 0.794392523364486,
+      "eval_loss": 0.5935384631156921,
+      "eval_runtime": 1.962,
+      "eval_samples_per_second": 54.537,
+      "eval_steps_per_second": 3.568,
+      "step": 240
     },
     {
+      "epoch": 31.0,
+      "eval_accuracy": 0.8317757009345794,
+      "eval_loss": 0.5392867922782898,
+      "eval_runtime": 1.969,
+      "eval_samples_per_second": 54.343,
+      "eval_steps_per_second": 3.555,
+      "step": 248
     },
     {
+      "epoch": 31.25,
+      "learning_rate": 1.2152777777777779e-05,
+      "loss": 0.202,
+      "step": 250
     },
     {
       "epoch": 32.0,
+      "eval_accuracy": 0.822429906542056,
+      "eval_loss": 0.5556337833404541,
+      "eval_runtime": 2.012,
+      "eval_samples_per_second": 53.182,
+      "eval_steps_per_second": 3.479,
+      "step": 256
     },
     {
+      "epoch": 32.5,
+      "learning_rate": 1.0416666666666668e-05,
+      "loss": 0.2127,
+      "step": 260
     },
     {
+      "epoch": 33.0,
+      "eval_accuracy": 0.8037383177570093,
+      "eval_loss": 0.5912833213806152,
+      "eval_runtime": 1.98,
+      "eval_samples_per_second": 54.041,
+      "eval_steps_per_second": 3.535,
+      "step": 264
+    },
+    {
+      "epoch": 33.75,
+      "learning_rate": 8.680555555555556e-06,
+      "loss": 0.2035,
+      "step": 270
     },
     {
       "epoch": 34.0,
+      "eval_accuracy": 0.8037383177570093,
+      "eval_loss": 0.5337203741073608,
+      "eval_runtime": 1.9834,
+      "eval_samples_per_second": 53.947,
+      "eval_steps_per_second": 3.529,
+      "step": 272
     },
     {
+      "epoch": 35.0,
+      "learning_rate": 6.944444444444445e-06,
+      "loss": 0.2618,
+      "step": 280
     },
     {
+      "epoch": 35.0,
+      "eval_accuracy": 0.8037383177570093,
+      "eval_loss": 0.622107982635498,
+      "eval_runtime": 2.0025,
+      "eval_samples_per_second": 53.434,
+      "eval_steps_per_second": 3.496,
+      "step": 280
     },
     {
+      "epoch": 36.0,
+      "eval_accuracy": 0.8317757009345794,
+      "eval_loss": 0.5089600682258606,
+      "eval_runtime": 1.9755,
+      "eval_samples_per_second": 54.164,
+      "eval_steps_per_second": 3.543,
+      "step": 288
     },
     {
+      "epoch": 36.25,
+      "learning_rate": 5.208333333333334e-06,
+      "loss": 0.217,
+      "step": 290
+    },
+    {
+      "epoch": 37.0,
+      "eval_accuracy": 0.822429906542056,
+      "eval_loss": 0.5649047493934631,
+      "eval_runtime": 1.991,
+      "eval_samples_per_second": 53.743,
+      "eval_steps_per_second": 3.516,
+      "step": 296
+    },
+    {
+      "epoch": 37.5,
+      "learning_rate": 3.4722222222222224e-06,
+      "loss": 0.2111,
+      "step": 300
+    },
+    {
+      "epoch": 38.0,
+      "eval_accuracy": 0.8130841121495327,
+      "eval_loss": 0.568317174911499,
+      "eval_runtime": 2.0365,
+      "eval_samples_per_second": 52.542,
+      "eval_steps_per_second": 3.437,
+      "step": 304
+    },
+    {
+      "epoch": 38.75,
+      "learning_rate": 1.7361111111111112e-06,
+      "loss": 0.2085,
+      "step": 310
+    },
+    {
+      "epoch": 39.0,
+      "eval_accuracy": 0.822429906542056,
+      "eval_loss": 0.5397838950157166,
+      "eval_runtime": 1.9935,
+      "eval_samples_per_second": 53.675,
+      "eval_steps_per_second": 3.511,
+      "step": 312
+    },
+    {
+      "epoch": 40.0,
+      "learning_rate": 0.0,
+      "loss": 0.1912,
+      "step": 320
+    },
+    {
+      "epoch": 40.0,
+      "eval_accuracy": 0.822429906542056,
+      "eval_loss": 0.5548034310340881,
+      "eval_runtime": 1.978,
+      "eval_samples_per_second": 54.096,
+      "eval_steps_per_second": 3.539,
+      "step": 320
+    },
+    {
+      "epoch": 40.0,
+      "step": 320,
+      "total_flos": 1.5429806632629043e+18,
+      "train_loss": 0.4049976162612438,
+      "train_runtime": 701.3243,
+      "train_samples_per_second": 28.403,
+      "train_steps_per_second": 0.456
     }
   ],
   "logging_steps": 10,
+  "max_steps": 320,
   "num_input_tokens_seen": 0,
   "num_train_epochs": 40,
   "save_steps": 500,
+  "total_flos": 1.5429806632629043e+18,
   "train_batch_size": 16,
   "trial_name": null,
   "trial_params": null

training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:492f9fd8b047d1211e7f0f6292ed08cde5c5098394b987a9a0ea2f84aaed7e54
 size 4728

 version https://git-lfs.github.com/spec/v1
+oid sha256:289be5ea4287de61c05dc38506ba40eb212d6de2c0bca319801e20a96f6874c0
 size 4728