RLHF-And-Friends
/

RM-UltrafeedbackBinarized-Llama-3.1-8B-Instruct-Q4-LoRA8-Batch-16-Tok-1024

Generated from Trainer

Inference Endpoints

Model card Files Files and versions Community

RM-UltrafeedbackBinarized-Llama-3.1-8B-Instruct-Q4-LoRA8-Batch-16-Tok-1024 / README.md

Commit History

End of training

33e3bcc
verified

arqa39 commited on 2 days ago