hZzy
/

qwen2.5-0.5b-expo-DPO-EXPERIMENT-1-5e6

alignment-handbook

Generated from Trainer

Model card Files Files and versions Community

qwen2.5-0.5b-expo-DPO-EXPERIMENT-1-5e6

Commit History

End of training

f21a2de
verified

hZzy commited on Nov 27, 2024

Model save

0b77d10
verified

hZzy commited on Nov 27, 2024

initial commit

75340c8
verified

hZzy commited on Nov 27, 2024