End of training

Files changed (3) hide show

README.md CHANGED Viewed

@@ -15,7 +15,7 @@ should probably proofread and complete it, then remove this comment. -->
 This model is a fine-tuned version of [HuggingFaceM4/idefics2-8b](https://huggingface.co/HuggingFaceM4/idefics2-8b) on an unknown dataset.
 It achieves the following results on the evaluation set:
-- Loss: 0.8436
 ## Model description
@@ -34,28 +34,28 @@ More information needed
 ### Training hyperparameters
 The following hyperparameters were used during training:
-- learning_rate: 0.0001
 - train_batch_size: 8
 - eval_batch_size: 8
 - seed: 42
-- gradient_accumulation_steps: 20
-- total_train_batch_size: 160
 - optimizer: Adam with betas=(0.9,0.999) and epsilon=1e-08
 - lr_scheduler_type: linear
 - lr_scheduler_warmup_steps: 50
-- num_epochs: 4
 ### Training results
 | Training Loss | Epoch  | Step | Validation Loss |
 |:-------------:|:------:|:----:|:---------------:|
-| 1.0128        | 0.5263 | 100  | 0.7555          |
-| 0.6991        | 1.0526 | 200  | 0.7485          |
-| 0.5676        | 1.5789 | 300  | 0.7307          |
-| 0.5392        | 2.1053 | 400  | 0.7591          |
-| 0.4329        | 2.6316 | 500  | 0.7673          |
-| 0.4115        | 3.1579 | 600  | 0.8394          |
-| 0.3468        | 3.6842 | 700  | 0.8436          |
 ### Framework versions

 This model is a fine-tuned version of [HuggingFaceM4/idefics2-8b](https://huggingface.co/HuggingFaceM4/idefics2-8b) on an unknown dataset.
 It achieves the following results on the evaluation set:
+- Loss: 0.7025
 ## Model description
 ### Training hyperparameters
 The following hyperparameters were used during training:
+- learning_rate: 5e-05
 - train_batch_size: 8
 - eval_batch_size: 8
 - seed: 42
+- gradient_accumulation_steps: 10
+- total_train_batch_size: 80
 - optimizer: Adam with betas=(0.9,0.999) and epsilon=1e-08
 - lr_scheduler_type: linear
 - lr_scheduler_warmup_steps: 50
+- num_epochs: 2
 ### Training results
 | Training Loss | Epoch  | Step | Validation Loss |
 |:-------------:|:------:|:----:|:---------------:|
+| 1.1149        | 0.2632 | 100  | 0.7762          |
+| 0.7216        | 0.5263 | 200  | 0.7406          |
+| 0.7044        | 0.7895 | 300  | 0.7175          |
+| 0.6617        | 1.0526 | 400  | 0.7204          |
+| 0.5562        | 1.3158 | 500  | 0.7129          |
+| 0.5614        | 1.5789 | 600  | 0.7067          |
+| 0.5483        | 1.8421 | 700  | 0.7025          |
 ### Framework versions

adapter_model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:222133dc6826cfa7840d853b55ae3269e003153bd46df1df306a7b37bec0d79c
 size 49840864

 version https://git-lfs.github.com/spec/v1
+oid sha256:66488d3caa314b493b981149cce15df2a1cf4028be19f4af36e7edd5aa804e74
 size 49840864

training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:8c753ee3e6218ac056e93017f10a8af1ea46ffbd7e6d0eb87f331a1308430ff4
 size 4731

 version https://git-lfs.github.com/spec/v1
+oid sha256:35f2f00eec80dbaddab6dae14a41bf3f87048361c8b13acd27dccbd15f87186a
 size 4731