RLHF-And-Friends
/

Llama-3.1-8B-Instruct-Reward-Ultrafeedback

Generated from Trainer

Inference Endpoints

Model card Files Files and versions Community

Llama-3.1-8B-Instruct-Reward-Ultrafeedback

Commit History

Update README.md

c648f03
verified

arqa39 commited on 22 days ago

End of training

6530abc
verified

arqa39 commited on 23 days ago

initial commit

d09b0c8
verified

arqa39 commited on 23 days ago