polejowska
/

detr-r50-mist1-bg-8ah-4l

+---
+license: apache-2.0
+base_model: facebook/detr-resnet-50
+tags:
+- generated_from_trainer
+model-index:
+- name: detr-r50-mist1-bg-8ah-4l
+  results: []
+---
+<!-- This model card has been generated automatically according to the information the Trainer had access to. You
+should probably proofread and complete it, then remove this comment. -->
+# detr-r50-mist1-bg-8ah-4l
+This model is a fine-tuned version of [facebook/detr-resnet-50](https://huggingface.co/facebook/detr-resnet-50) on an unknown dataset.
+It achieves the following results on the evaluation set:
+- Loss: 2.9274
+## Model description
+More information needed
+## Intended uses & limitations
+More information needed
+## Training and evaluation data
+More information needed
+## Training procedure
+### Training hyperparameters
+The following hyperparameters were used during training:
+- learning_rate: 1e-05
+- train_batch_size: 4
+- eval_batch_size: 8
+- seed: 42
+- optimizer: Adam with betas=(0.9,0.999) and epsilon=1e-08
+- lr_scheduler_type: linear
+- num_epochs: 25
+- mixed_precision_training: Native AMP
+### Training results
+| Training Loss | Epoch | Step | Validation Loss |
+|:-------------:|:-----:|:----:|:---------------:|
+| 4.4466        | 1.0   | 115  | 3.8127          |
+| 3.85          | 2.0   | 230  | 3.8636          |
+| 3.8198        | 3.0   | 345  | 3.6179          |
+| 3.6799        | 4.0   | 460  | 3.4558          |
+| 3.5806        | 5.0   | 575  | 3.2328          |
+| 3.4958        | 6.0   | 690  | 3.3407          |
+| 3.4662        | 7.0   | 805  | 3.1567          |
+| 3.4295        | 8.0   | 920  | 3.0499          |
+| 3.3977        | 9.0   | 1035 | 3.0460          |
+| 3.3853        | 10.0  | 1150 | 3.0481          |
+| 3.3608        | 11.0  | 1265 | 3.0337          |
+| 3.2873        | 12.0  | 1380 | 3.0535          |
+| 3.3164        | 13.0  | 1495 | 3.0140          |
+| 3.2745        | 14.0  | 1610 | 3.0667          |
+| 3.2691        | 15.0  | 1725 | 3.0134          |
+| 3.2735        | 16.0  | 1840 | 3.0207          |
+| 3.2718        | 17.0  | 1955 | 3.0004          |
+| 3.2504        | 18.0  | 2070 | 3.1082          |
+| 3.243         | 19.0  | 2185 | 2.9369          |
+| 3.1669        | 20.0  | 2300 | 2.9596          |
+| 3.1844        | 21.0  | 2415 | 2.9170          |
+| 3.1979        | 22.0  | 2530 | 2.9344          |
+| 3.1702        | 23.0  | 2645 | 2.9262          |
+| 3.1738        | 24.0  | 2760 | 2.9251          |
+| 3.1606        | 25.0  | 2875 | 2.9274          |
+### Framework versions
+- Transformers 4.35.0
+- Pytorch 2.0.0
+- Datasets 2.1.0
+- Tokenizers 0.14.1

model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:bd0ad255211d03660dde45aba12f8516f7c257854aef36671ad939ff6b29f47a
 size 143334512

 version https://git-lfs.github.com/spec/v1
+oid sha256:cf70862562fc320bb521279b4ecc33422147d71f34e60addaa8dbc7e05001825
 size 143334512

trainer_state.json ADDED Viewed

	@@ -0,0 +1,378 @@

+{
+  "best_metric": 2.917006731033325,
+  "best_model_checkpoint": "detr-r50-mist1-bg-8ah-4l/checkpoint-2415",
+  "epoch": 25.0,
+  "eval_steps": 500,
+  "global_step": 2875,
+  "is_hyper_param_search": false,
+  "is_local_process_zero": true,
+  "is_world_process_zero": true,
+  "log_history": [
+    {
+      "epoch": 1.0,
+      "learning_rate": 9.624347826086956e-06,
+      "loss": 4.4466,
+      "step": 115
+    },
+    {
+      "epoch": 1.0,
+      "eval_loss": 3.812701463699341,
+      "eval_runtime": 5.8935,
+      "eval_samples_per_second": 6.787,
+      "eval_steps_per_second": 0.848,
+      "step": 115
+    },
+    {
+      "epoch": 2.0,
+      "learning_rate": 9.224347826086957e-06,
+      "loss": 3.85,
+      "step": 230
+    },
+    {
+      "epoch": 2.0,
+      "eval_loss": 3.863551378250122,
+      "eval_runtime": 5.9222,
+      "eval_samples_per_second": 6.754,
+      "eval_steps_per_second": 0.844,
+      "step": 230
+    },
+    {
+      "epoch": 3.0,
+      "learning_rate": 8.824347826086957e-06,
+      "loss": 3.8198,
+      "step": 345
+    },
+    {
+      "epoch": 3.0,
+      "eval_loss": 3.617934465408325,
+      "eval_runtime": 5.9064,
+      "eval_samples_per_second": 6.772,
+      "eval_steps_per_second": 0.847,
+      "step": 345
+    },
+    {
+      "epoch": 4.0,
+      "learning_rate": 8.427826086956521e-06,
+      "loss": 3.6799,
+      "step": 460
+    },
+    {
+      "epoch": 4.0,
+      "eval_loss": 3.455796003341675,
+      "eval_runtime": 6.041,
+      "eval_samples_per_second": 6.621,
+      "eval_steps_per_second": 0.828,
+      "step": 460
+    },
+    {
+      "epoch": 5.0,
+      "learning_rate": 8.027826086956523e-06,
+      "loss": 3.5806,
+      "step": 575
+    },
+    {
+      "epoch": 5.0,
+      "eval_loss": 3.2327613830566406,
+      "eval_runtime": 5.9282,
+      "eval_samples_per_second": 6.747,
+      "eval_steps_per_second": 0.843,
+      "step": 575
+    },
+    {
+      "epoch": 6.0,
+      "learning_rate": 7.631304347826087e-06,
+      "loss": 3.4958,
+      "step": 690
+    },
+    {
+      "epoch": 6.0,
+      "eval_loss": 3.340712070465088,
+      "eval_runtime": 5.9472,
+      "eval_samples_per_second": 6.726,
+      "eval_steps_per_second": 0.841,
+      "step": 690
+    },
+    {
+      "epoch": 7.0,
+      "learning_rate": 7.231304347826088e-06,
+      "loss": 3.4662,
+      "step": 805
+    },
+    {
+      "epoch": 7.0,
+      "eval_loss": 3.156733989715576,
+      "eval_runtime": 5.8659,
+      "eval_samples_per_second": 6.819,
+      "eval_steps_per_second": 0.852,
+      "step": 805
+    },
+    {
+      "epoch": 8.0,
+      "learning_rate": 6.8313043478260874e-06,
+      "loss": 3.4295,
+      "step": 920
+    },
+    {
+      "epoch": 8.0,
+      "eval_loss": 3.049887180328369,
+      "eval_runtime": 5.8059,
+      "eval_samples_per_second": 6.89,
+      "eval_steps_per_second": 0.861,
+      "step": 920
+    },
+    {
+      "epoch": 9.0,
+      "learning_rate": 6.431304347826087e-06,
+      "loss": 3.3977,
+      "step": 1035
+    },
+    {
+      "epoch": 9.0,
+      "eval_loss": 3.0459601879119873,
+      "eval_runtime": 5.876,
+      "eval_samples_per_second": 6.807,
+      "eval_steps_per_second": 0.851,
+      "step": 1035
+    },
+    {
+      "epoch": 10.0,
+      "learning_rate": 6.031304347826088e-06,
+      "loss": 3.3853,
+      "step": 1150
+    },
+    {
+      "epoch": 10.0,
+      "eval_loss": 3.048147678375244,
+      "eval_runtime": 5.737,
+      "eval_samples_per_second": 6.972,
+      "eval_steps_per_second": 0.872,
+      "step": 1150
+    },
+    {
+      "epoch": 11.0,
+      "learning_rate": 5.631304347826088e-06,
+      "loss": 3.3608,
+      "step": 1265
+    },
+    {
+      "epoch": 11.0,
+      "eval_loss": 3.033698558807373,
+      "eval_runtime": 5.8795,
+      "eval_samples_per_second": 6.803,
+      "eval_steps_per_second": 0.85,
+      "step": 1265
+    },
+    {
+      "epoch": 12.0,
+      "learning_rate": 5.2313043478260875e-06,
+      "loss": 3.2873,
+      "step": 1380
+    },
+    {
+      "epoch": 12.0,
+      "eval_loss": 3.053478479385376,
+      "eval_runtime": 5.7373,
+      "eval_samples_per_second": 6.972,
+      "eval_steps_per_second": 0.871,
+      "step": 1380
+    },
+    {
+      "epoch": 13.0,
+      "learning_rate": 4.831304347826087e-06,
+      "loss": 3.3164,
+      "step": 1495
+    },
+    {
+      "epoch": 13.0,
+      "eval_loss": 3.0139570236206055,
+      "eval_runtime": 5.7591,
+      "eval_samples_per_second": 6.945,
+      "eval_steps_per_second": 0.868,
+      "step": 1495
+    },
+    {
+      "epoch": 14.0,
+      "learning_rate": 4.4313043478260875e-06,
+      "loss": 3.2745,
+      "step": 1610
+    },
+    {
+      "epoch": 14.0,
+      "eval_loss": 3.0666890144348145,
+      "eval_runtime": 5.6397,
+      "eval_samples_per_second": 7.093,
+      "eval_steps_per_second": 0.887,
+      "step": 1610
+    },
+    {
+      "epoch": 15.0,
+      "learning_rate": 4.031304347826087e-06,
+      "loss": 3.2691,
+      "step": 1725
+    },
+    {
+      "epoch": 15.0,
+      "eval_loss": 3.013432264328003,
+      "eval_runtime": 5.7704,
+      "eval_samples_per_second": 6.932,
+      "eval_steps_per_second": 0.866,
+      "step": 1725
+    },
+    {
+      "epoch": 16.0,
+      "learning_rate": 3.631304347826087e-06,
+      "loss": 3.2735,
+      "step": 1840
+    },
+    {
+      "epoch": 16.0,
+      "eval_loss": 3.020738124847412,
+      "eval_runtime": 5.8757,
+      "eval_samples_per_second": 6.808,
+      "eval_steps_per_second": 0.851,
+      "step": 1840
+    },
+    {
+      "epoch": 17.0,
+      "learning_rate": 3.2313043478260876e-06,
+      "loss": 3.2718,
+      "step": 1955
+    },
+    {
+      "epoch": 17.0,
+      "eval_loss": 3.0004284381866455,
+      "eval_runtime": 5.6729,
+      "eval_samples_per_second": 7.051,
+      "eval_steps_per_second": 0.881,
+      "step": 1955
+    },
+    {
+      "epoch": 18.0,
+      "learning_rate": 2.831304347826087e-06,
+      "loss": 3.2504,
+      "step": 2070
+    },
+    {
+      "epoch": 18.0,
+      "eval_loss": 3.1082119941711426,
+      "eval_runtime": 5.6759,
+      "eval_samples_per_second": 7.047,
+      "eval_steps_per_second": 0.881,
+      "step": 2070
+    },
+    {
+      "epoch": 19.0,
+      "learning_rate": 2.431304347826087e-06,
+      "loss": 3.243,
+      "step": 2185
+    },
+    {
+      "epoch": 19.0,
+      "eval_loss": 2.9369025230407715,
+      "eval_runtime": 5.8335,
+      "eval_samples_per_second": 6.857,
+      "eval_steps_per_second": 0.857,
+      "step": 2185
+    },
+    {
+      "epoch": 20.0,
+      "learning_rate": 2.0313043478260872e-06,
+      "loss": 3.1669,
+      "step": 2300
+    },
+    {
+      "epoch": 20.0,
+      "eval_loss": 2.9595999717712402,
+      "eval_runtime": 5.8209,
+      "eval_samples_per_second": 6.872,
+      "eval_steps_per_second": 0.859,
+      "step": 2300
+    },
+    {
+      "epoch": 21.0,
+      "learning_rate": 1.6347826086956523e-06,
+      "loss": 3.1844,
+      "step": 2415
+    },
+    {
+      "epoch": 21.0,
+      "eval_loss": 2.917006731033325,
+      "eval_runtime": 5.8161,
+      "eval_samples_per_second": 6.877,
+      "eval_steps_per_second": 0.86,
+      "step": 2415
+    },
+    {
+      "epoch": 22.0,
+      "learning_rate": 1.2347826086956523e-06,
+      "loss": 3.1979,
+      "step": 2530
+    },
+    {
+      "epoch": 22.0,
+      "eval_loss": 2.934359073638916,
+      "eval_runtime": 5.7645,
+      "eval_samples_per_second": 6.939,
+      "eval_steps_per_second": 0.867,
+      "step": 2530
+    },
+    {
+      "epoch": 23.0,
+      "learning_rate": 8.347826086956523e-07,
+      "loss": 3.1702,
+      "step": 2645
+    },
+    {
+      "epoch": 23.0,
+      "eval_loss": 2.9261698722839355,
+      "eval_runtime": 5.8376,
+      "eval_samples_per_second": 6.852,
+      "eval_steps_per_second": 0.857,
+      "step": 2645
+    },
+    {
+      "epoch": 24.0,
+      "learning_rate": 4.347826086956522e-07,
+      "loss": 3.1738,
+      "step": 2760
+    },
+    {
+      "epoch": 24.0,
+      "eval_loss": 2.925136089324951,
+      "eval_runtime": 5.7559,
+      "eval_samples_per_second": 6.949,
+      "eval_steps_per_second": 0.869,
+      "step": 2760
+    },
+    {
+      "epoch": 25.0,
+      "learning_rate": 3.478260869565218e-08,
+      "loss": 3.1606,
+      "step": 2875
+    },
+    {
+      "epoch": 25.0,
+      "eval_loss": 2.9274065494537354,
+      "eval_runtime": 5.8001,
+      "eval_samples_per_second": 6.896,
+      "eval_steps_per_second": 0.862,
+      "step": 2875
+    },
+    {
+      "epoch": 25.0,
+      "step": 2875,
+      "total_flos": 4.7279979072e+18,
+      "train_loss": 3.4060823072350543,
+      "train_runtime": 2285.4543,
+      "train_samples_per_second": 5.032,
+      "train_steps_per_second": 1.258
+    }
+  ],
+  "logging_steps": 500,
+  "max_steps": 2875,
+  "num_train_epochs": 25,
+  "save_steps": 500,
+  "total_flos": 4.7279979072e+18,
+  "trial_name": null,
+  "trial_params": null
+}