Tim-05369
/

results

@@ -17,18 +17,18 @@ should probably proofread and complete it, then remove this comment. -->
 This model is a fine-tuned version of [TinyLlama/TinyLlama-1.1B-Chat-v1.0](https://huggingface.co/TinyLlama/TinyLlama-1.1B-Chat-v1.0) on the None dataset.
 It achieves the following results on the evaluation set:
-- Loss: 2.2772
-- Rewards/chosen: -0.1134
-- Rewards/rejected: -0.0902
 - Rewards/accuracies: 0.6667
-- Rewards/margins: -0.0232
-- Logps/rejected: -1.8039
-- Logps/chosen: -2.2683
-- Logits/rejected: -2.3984
-- Logits/chosen: -2.3109
-- Nll Loss: 2.2241
-- Log Odds Ratio: -1.0632
-- Log Odds Chosen: -0.4972
 ## Model description
@@ -48,8 +48,8 @@ More information needed
 The following hyperparameters were used during training:
 - learning_rate: 5e-05
-- train_batch_size: 32
-- eval_batch_size: 32
 - seed: 42
 - optimizer: Adam with betas=(0.9,0.999) and epsilon=1e-08
 - lr_scheduler_type: linear

 This model is a fine-tuned version of [TinyLlama/TinyLlama-1.1B-Chat-v1.0](https://huggingface.co/TinyLlama/TinyLlama-1.1B-Chat-v1.0) on the None dataset.
 It achieves the following results on the evaluation set:
+- Loss: 2.4477
+- Rewards/chosen: -0.1131
+- Rewards/rejected: -0.0946
 - Rewards/accuracies: 0.6667
+- Rewards/margins: -0.0185
+- Logps/rejected: -1.8929
+- Logps/chosen: -2.2621
+- Logits/rejected: -2.5533
+- Logits/chosen: -2.5157
+- Nll Loss: 2.3980
+- Log Odds Ratio: -0.9931
+- Log Odds Chosen: -0.3878
 ## Model description
 The following hyperparameters were used during training:
 - learning_rate: 5e-05
+- train_batch_size: 8
+- eval_batch_size: 8
 - seed: 42
 - optimizer: Adam with betas=(0.9,0.999) and epsilon=1e-08
 - lr_scheduler_type: linear

model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:e342c4848f6e6352a74f56ba62320f875186805671cf32b49f37cd80bca8d59c
 size 4400216536

 version https://git-lfs.github.com/spec/v1
+oid sha256:d2a84ef621a9eedfa7f6f2b9b19ae685a5a721a37f0322c2134504785dacdc2c
 size 4400216536

training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:e59fa5bdfb1ef5d310d364528550c13174df64b6cdcd5d935757d10e0bc07d39
 size 5496

 version https://git-lfs.github.com/spec/v1
+oid sha256:80166eae19da31ec096daf9e9ce36d5183712c11eda667881be34bf3390581aa
 size 5496