RLHF-And-Friends
/

RM-UltrafeedbackBinarized-Llama-3.1-8B-Instruct-Q4-LoRA8-Batch-16-Tok-1024

Generated from Trainer

Inference Endpoints

Model card Files Files and versions Community

RM-UltrafeedbackBinarized-Llama-3.1-8B-Instruct-Q4-LoRA8-Batch-16-Tok-1024

1 contributor

History: 1 commit

arqa39's picture

initial commit

ae246f0 verified 14 days ago

.gitattributes

1.52 kB

initial commit 14 days ago