Training in progress, epoch 0

Browse files

Files changed (7) hide show

all_results.json +5 -5
config.json +16 -14
model.safetensors +2 -2
runs/Dec15_01-14-35_ef188d9b7084/events.out.tfevents.1734225287.ef188d9b7084.405.1 +3 -0
train_results.json +6 -6
trainer_state.json +79 -372
training_args.bin +1 -1

all_results.json CHANGED Viewed

@@ -1,8 +1,8 @@
 {
     "epoch": 6.666666666666667,
-    "eval_accuracy": 0.2857142857142857,
-    "eval_loss": 1.9166103601455688,
-    "eval_runtime": 1.8725,
-    "eval_samples_per_second": 11.215,
-    "eval_steps_per_second": 0.534
 }

 {
     "epoch": 6.666666666666667,
+    "total_flos": 3.032854323351552e+16,
+    "train_loss": 1.8625539779663085,
+    "train_runtime": 349.1269,
+    "train_samples_per_second": 5.213,
+    "train_steps_per_second": 0.029
 }

config.json CHANGED Viewed

@@ -17,24 +17,26 @@
   "hidden_dropout_prob": 0.0,
   "hidden_size": 768,
   "id2label": {
-    "0": "Angry",
-    "1": "Disgust",
-    "2": "Fear",
-    "3": "Happy",
-    "4": "Neutral",
-    "5": "Sad",
-    "6": "Surprise"
   },
   "image_size": 224,
   "initializer_range": 0.02,
   "label2id": {
-    "Angry": 0,
-    "Disgust": 1,
-    "Fear": 2,
-    "Happy": 3,
-    "Neutral": 4,
-    "Sad": 5,
-    "Surprise": 6
   },
   "layer_norm_eps": 1e-05,
   "mlp_ratio": 4.0,

   "hidden_dropout_prob": 0.0,
   "hidden_size": 768,
   "id2label": {
+    "0": "anger",
+    "1": "surprise",
+    "2": "contempt",
+    "3": "happy",
+    "4": "neutral",
+    "5": "fear",
+    "6": "sad",
+    "7": "disgust"
   },
   "image_size": 224,
   "initializer_range": 0.02,
   "label2id": {
+    "anger": 0,
+    "contempt": 2,
+    "disgust": 7,
+    "fear": 5,
+    "happy": 3,
+    "neutral": 4,
+    "sad": 6,
+    "surprise": 1
   },
   "layer_norm_eps": 1e-05,
   "mlp_ratio": 4.0,

model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:9d38d9611ef31094553af5575d1da14182032c9c7f6710a53f45d40d5533d553
-size 110358212

 version https://git-lfs.github.com/spec/v1
+oid sha256:a5100a5639b8a67ad81543bb7a1e7e67fdb516e892031d70e1ca0733c7d4e639
+size 110361288

runs/Dec15_01-14-35_ef188d9b7084/events.out.tfevents.1734225287.ef188d9b7084.405.1 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:7e00bbc475c5b43bcea30e74677d45159a7fce14cc826295142b660eb69436f4
+size 9389

train_results.json CHANGED Viewed

@@ -1,8 +1,8 @@
 {
-    "epoch": 2.99388379204893,
-    "total_flos": 1.5560468970586767e+18,
-    "train_loss": 1.1774282864997723,
-    "train_runtime": 1319.6364,
-    "train_samples_per_second": 47.534,
-    "train_steps_per_second": 0.371
 }

 {
+    "epoch": 6.666666666666667,
+    "total_flos": 3.032854323351552e+16,
+    "train_loss": 1.8625539779663085,
+    "train_runtime": 349.1269,
+    "train_samples_per_second": 5.213,
+    "train_steps_per_second": 0.029
 }

trainer_state.json CHANGED Viewed

@@ -1,390 +1,97 @@
 {
-  "best_metric": 0.6587779690189329,
-  "best_model_checkpoint": "swin-tiny-patch4-window7-224-finetuned-eurosat/checkpoint-489",
-  "epoch": 2.99388379204893,
   "eval_steps": 500,
-  "global_step": 489,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
   "log_history": [
     {
-      "epoch": 0.06116207951070336,
-      "grad_norm": 15.902920722961426,
-      "learning_rate": 1.0204081632653061e-05,
-      "loss": 2.118,
       "step": 10
     },
     {
-      "epoch": 0.12232415902140673,
-      "grad_norm": 15.299479484558105,
-      "learning_rate": 2.0408163265306123e-05,
-      "loss": 2.0253,
-      "step": 20
-    },
-    {
-      "epoch": 0.1834862385321101,
-      "grad_norm": 15.808608055114746,
-      "learning_rate": 3.061224489795919e-05,
-      "loss": 1.9515,
-      "step": 30
-    },
-    {
-      "epoch": 0.24464831804281345,
-      "grad_norm": 23.111419677734375,
-      "learning_rate": 4.0816326530612245e-05,
-      "loss": 1.7452,
-      "step": 40
-    },
-    {
-      "epoch": 0.3058103975535168,
-      "grad_norm": 24.703895568847656,
-      "learning_rate": 4.988636363636364e-05,
-      "loss": 1.5294,
-      "step": 50
-    },
-    {
-      "epoch": 0.3669724770642202,
-      "grad_norm": 26.341184616088867,
-      "learning_rate": 4.875e-05,
-      "loss": 1.4046,
-      "step": 60
-    },
-    {
-      "epoch": 0.42813455657492355,
-      "grad_norm": 23.89405059814453,
-      "learning_rate": 4.7613636363636367e-05,
-      "loss": 1.3451,
-      "step": 70
-    },
-    {
-      "epoch": 0.4892966360856269,
-      "grad_norm": 22.658981323242188,
-      "learning_rate": 4.647727272727273e-05,
-      "loss": 1.315,
-      "step": 80
-    },
-    {
-      "epoch": 0.5504587155963303,
-      "grad_norm": 32.74925231933594,
-      "learning_rate": 4.5340909090909095e-05,
-      "loss": 1.3286,
-      "step": 90
-    },
-    {
-      "epoch": 0.6116207951070336,
-      "grad_norm": 34.46269607543945,
-      "learning_rate": 4.4204545454545455e-05,
-      "loss": 1.253,
-      "step": 100
-    },
-    {
-      "epoch": 0.672782874617737,
-      "grad_norm": 20.414508819580078,
-      "learning_rate": 4.3068181818181816e-05,
-      "loss": 1.2188,
-      "step": 110
-    },
-    {
-      "epoch": 0.7339449541284404,
-      "grad_norm": 22.735107421875,
-      "learning_rate": 4.193181818181818e-05,
-      "loss": 1.246,
-      "step": 120
-    },
-    {
-      "epoch": 0.7951070336391437,
-      "grad_norm": 23.86024284362793,
-      "learning_rate": 4.079545454545455e-05,
-      "loss": 1.1803,
-      "step": 130
-    },
-    {
-      "epoch": 0.8562691131498471,
-      "grad_norm": 34.048885345458984,
-      "learning_rate": 3.965909090909091e-05,
-      "loss": 1.1822,
-      "step": 140
-    },
-    {
-      "epoch": 0.9174311926605505,
-      "grad_norm": 27.799007415771484,
-      "learning_rate": 3.852272727272728e-05,
-      "loss": 1.1625,
-      "step": 150
-    },
-    {
-      "epoch": 0.9785932721712538,
-      "grad_norm": 27.95413589477539,
-      "learning_rate": 3.738636363636363e-05,
-      "loss": 1.1631,
-      "step": 160
-    },
-    {
-      "epoch": 0.9969418960244648,
-      "eval_accuracy": 0.5851979345955249,
-      "eval_loss": 1.0535521507263184,
-      "eval_runtime": 15.0707,
-      "eval_samples_per_second": 154.206,
-      "eval_steps_per_second": 4.844,
-      "step": 163
-    },
-    {
-      "epoch": 1.0412844036697249,
-      "grad_norm": 24.71836280822754,
-      "learning_rate": 3.625e-05,
-      "loss": 1.1357,
-      "step": 170
-    },
-    {
-      "epoch": 1.1024464831804281,
-      "grad_norm": 22.25391387939453,
-      "learning_rate": 3.511363636363637e-05,
-      "loss": 1.1481,
-      "step": 180
-    },
-    {
-      "epoch": 1.1636085626911314,
-      "grad_norm": 22.642160415649414,
-      "learning_rate": 3.397727272727273e-05,
-      "loss": 1.1071,
-      "step": 190
-    },
-    {
-      "epoch": 1.224770642201835,
-      "grad_norm": 23.1135311126709,
-      "learning_rate": 3.2840909090909096e-05,
-      "loss": 1.1349,
-      "step": 200
-    },
-    {
-      "epoch": 1.2859327217125383,
-      "grad_norm": 19.403104782104492,
-      "learning_rate": 3.1704545454545456e-05,
-      "loss": 1.1109,
-      "step": 210
-    },
-    {
-      "epoch": 1.3470948012232415,
-      "grad_norm": 29.44010353088379,
-      "learning_rate": 3.056818181818182e-05,
-      "loss": 1.1196,
-      "step": 220
-    },
-    {
-      "epoch": 1.408256880733945,
-      "grad_norm": 29.79566764831543,
-      "learning_rate": 2.943181818181818e-05,
-      "loss": 1.0698,
-      "step": 230
-    },
-    {
-      "epoch": 1.4694189602446484,
-      "grad_norm": 28.45584487915039,
-      "learning_rate": 2.829545454545455e-05,
-      "loss": 1.0802,
-      "step": 240
-    },
-    {
-      "epoch": 1.5305810397553516,
-      "grad_norm": 22.51582145690918,
-      "learning_rate": 2.7159090909090913e-05,
-      "loss": 1.1015,
-      "step": 250
-    },
-    {
-      "epoch": 1.591743119266055,
-      "grad_norm": 21.58193016052246,
-      "learning_rate": 2.6022727272727277e-05,
-      "loss": 1.0757,
-      "step": 260
-    },
-    {
-      "epoch": 1.6529051987767585,
-      "grad_norm": 17.50481605529785,
-      "learning_rate": 2.4886363636363637e-05,
-      "loss": 1.0788,
-      "step": 270
-    },
-    {
-      "epoch": 1.7140672782874617,
-      "grad_norm": 22.194198608398438,
-      "learning_rate": 2.375e-05,
-      "loss": 1.0431,
-      "step": 280
-    },
-    {
-      "epoch": 1.7752293577981653,
-      "grad_norm": 28.903148651123047,
-      "learning_rate": 2.2613636363636365e-05,
-      "loss": 1.051,
-      "step": 290
-    },
-    {
-      "epoch": 1.8363914373088686,
-      "grad_norm": 19.929737091064453,
-      "learning_rate": 2.147727272727273e-05,
-      "loss": 1.0269,
-      "step": 300
-    },
-    {
-      "epoch": 1.8975535168195719,
-      "grad_norm": 23.347131729125977,
-      "learning_rate": 2.034090909090909e-05,
-      "loss": 1.0226,
-      "step": 310
-    },
-    {
-      "epoch": 1.9587155963302751,
-      "grad_norm": 22.177705764770508,
-      "learning_rate": 1.9204545454545454e-05,
-      "loss": 1.096,
-      "step": 320
-    },
-    {
-      "epoch": 1.9954128440366974,
-      "eval_accuracy": 0.641566265060241,
-      "eval_loss": 0.9225364327430725,
-      "eval_runtime": 15.4942,
-      "eval_samples_per_second": 149.992,
-      "eval_steps_per_second": 4.711,
-      "step": 326
-    },
-    {
-      "epoch": 2.021406727828746,
-      "grad_norm": 24.717140197753906,
-      "learning_rate": 1.806818181818182e-05,
-      "loss": 0.9788,
-      "step": 330
-    },
-    {
-      "epoch": 2.0825688073394497,
-      "grad_norm": 30.048473358154297,
-      "learning_rate": 1.6931818181818182e-05,
-      "loss": 1.0206,
-      "step": 340
-    },
-    {
-      "epoch": 2.143730886850153,
-      "grad_norm": 24.10106086730957,
-      "learning_rate": 1.5795454545454546e-05,
-      "loss": 0.963,
-      "step": 350
-    },
-    {
-      "epoch": 2.2048929663608563,
-      "grad_norm": 26.799161911010742,
-      "learning_rate": 1.4659090909090909e-05,
-      "loss": 1.0239,
-      "step": 360
-    },
-    {
-      "epoch": 2.2660550458715596,
-      "grad_norm": 24.41145896911621,
-      "learning_rate": 1.3522727272727273e-05,
-      "loss": 0.9914,
-      "step": 370
-    },
-    {
-      "epoch": 2.327217125382263,
-      "grad_norm": 25.299041748046875,
-      "learning_rate": 1.2386363636363638e-05,
-      "loss": 1.0049,
-      "step": 380
-    },
-    {
-      "epoch": 2.388379204892966,
-      "grad_norm": 20.791305541992188,
-      "learning_rate": 1.125e-05,
-      "loss": 1.0156,
-      "step": 390
-    },
-    {
-      "epoch": 2.44954128440367,
-      "grad_norm": 27.16722297668457,
-      "learning_rate": 1.0113636363636365e-05,
-      "loss": 1.059,
-      "step": 400
-    },
-    {
-      "epoch": 2.510703363914373,
-      "grad_norm": 23.442485809326172,
-      "learning_rate": 8.977272727272727e-06,
-      "loss": 0.9931,
-      "step": 410
-    },
-    {
-      "epoch": 2.5718654434250765,
-      "grad_norm": 26.62813377380371,
-      "learning_rate": 7.840909090909091e-06,
-      "loss": 1.0159,
-      "step": 420
-    },
-    {
-      "epoch": 2.63302752293578,
-      "grad_norm": 19.204635620117188,
-      "learning_rate": 6.704545454545455e-06,
-      "loss": 1.0279,
-      "step": 430
-    },
-    {
-      "epoch": 2.694189602446483,
-      "grad_norm": 23.251445770263672,
-      "learning_rate": 5.568181818181818e-06,
-      "loss": 0.9971,
-      "step": 440
-    },
-    {
-      "epoch": 2.7553516819571864,
-      "grad_norm": 25.26046371459961,
-      "learning_rate": 4.4318181818181824e-06,
-      "loss": 1.0267,
-      "step": 450
-    },
-    {
-      "epoch": 2.81651376146789,
-      "grad_norm": 19.80088233947754,
-      "learning_rate": 3.295454545454545e-06,
-      "loss": 0.9795,
-      "step": 460
-    },
-    {
-      "epoch": 2.8776758409785934,
-      "grad_norm": 23.87816047668457,
-      "learning_rate": 2.1590909090909092e-06,
-      "loss": 1.0087,
-      "step": 470
-    },
-    {
-      "epoch": 2.9388379204892967,
-      "grad_norm": 21.836708068847656,
-      "learning_rate": 1.0227272727272729e-06,
-      "loss": 0.9571,
-      "step": 480
-    },
-    {
-      "epoch": 2.99388379204893,
-      "eval_accuracy": 0.6587779690189329,
-      "eval_loss": 0.8806350827217102,
-      "eval_runtime": 16.023,
-      "eval_samples_per_second": 145.041,
-      "eval_steps_per_second": 4.556,
-      "step": 489
     },
     {
-      "epoch": 2.99388379204893,
-      "step": 489,
-      "total_flos": 1.5560468970586767e+18,
-      "train_loss": 1.1774282864997723,
-      "train_runtime": 1319.6364,
-      "train_samples_per_second": 47.534,
-      "train_steps_per_second": 0.371
     }
   ],
   "logging_steps": 10,
-  "max_steps": 489,
   "num_input_tokens_seen": 0,
-  "num_train_epochs": 3,
   "save_steps": 500,
   "stateful_callbacks": {
     "TrainerControl": {
@@ -398,7 +105,7 @@
       "attributes": {}
     }
   },
-  "total_flos": 1.5560468970586767e+18,
   "train_batch_size": 32,
   "trial_name": null,
   "trial_params": null

 {
+  "best_metric": 0.2857142857142857,
+  "best_model_checkpoint": "swin-tiny-patch4-window7-224-finetuned-eurosat/checkpoint-10",
+  "epoch": 6.666666666666667,
   "eval_steps": 500,
+  "global_step": 10,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
   "log_history": [
     {
+      "epoch": 0.6666666666666666,
+      "eval_accuracy": 0.09523809523809523,
+      "eval_loss": 1.8175530433654785,
+      "eval_runtime": 18.3681,
+      "eval_samples_per_second": 1.143,
+      "eval_steps_per_second": 0.054,
+      "step": 1
+    },
+    {
+      "epoch": 2.0,
+      "eval_accuracy": 0.14285714285714285,
+      "eval_loss": 1.8961031436920166,
+      "eval_runtime": 0.9567,
+      "eval_samples_per_second": 21.951,
+      "eval_steps_per_second": 1.045,
+      "step": 3
+    },
+    {
+      "epoch": 2.6666666666666665,
+      "eval_accuracy": 0.14285714285714285,
+      "eval_loss": 1.9159153699874878,
+      "eval_runtime": 0.9471,
+      "eval_samples_per_second": 22.173,
+      "eval_steps_per_second": 1.056,
+      "step": 4
+    },
+    {
+      "epoch": 4.0,
+      "eval_accuracy": 0.19047619047619047,
+      "eval_loss": 1.8906145095825195,
+      "eval_runtime": 0.9581,
+      "eval_samples_per_second": 21.919,
+      "eval_steps_per_second": 1.044,
+      "step": 6
+    },
+    {
+      "epoch": 4.666666666666667,
+      "eval_accuracy": 0.19047619047619047,
+      "eval_loss": 1.8720425367355347,
+      "eval_runtime": 1.0672,
+      "eval_samples_per_second": 19.678,
+      "eval_steps_per_second": 0.937,
+      "step": 7
+    },
+    {
+      "epoch": 6.0,
+      "eval_accuracy": 0.19047619047619047,
+      "eval_loss": 1.8452097177505493,
+      "eval_runtime": 1.0316,
+      "eval_samples_per_second": 20.357,
+      "eval_steps_per_second": 0.969,
+      "step": 9
+    },
+    {
+      "epoch": 6.666666666666667,
+      "grad_norm": 13.042926788330078,
+      "learning_rate": 0.0,
+      "loss": 1.8626,
       "step": 10
     },
     {
+      "epoch": 6.666666666666667,
+      "eval_accuracy": 0.2857142857142857,
+      "eval_loss": 1.8388439416885376,
+      "eval_runtime": 1.2038,
+      "eval_samples_per_second": 17.445,
+      "eval_steps_per_second": 0.831,
+      "step": 10
     },
     {
+      "epoch": 6.666666666666667,
+      "step": 10,
+      "total_flos": 3.032854323351552e+16,
+      "train_loss": 1.8625539779663085,
+      "train_runtime": 349.1269,
+      "train_samples_per_second": 5.213,
+      "train_steps_per_second": 0.029
     }
   ],
   "logging_steps": 10,
+  "max_steps": 10,
   "num_input_tokens_seen": 0,
+  "num_train_epochs": 10,
   "save_steps": 500,
   "stateful_callbacks": {
     "TrainerControl": {
       "attributes": {}
     }
   },
+  "total_flos": 3.032854323351552e+16,
   "train_batch_size": 32,
   "trial_name": null,
   "trial_params": null

training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:056918aa1b6849b752eb9cb7a84e900476d40514926035a7b22c7218385953ff
 size 5368

 version https://git-lfs.github.com/spec/v1
+oid sha256:53581cdaaa08f2df72a2c1a9225fbf542987cceb74268d020c6a0047c0fe6214
 size 5368