zhou-xl
/

xpo-lla-3-8b-instruct

Model card Files Files and versions Community

xpo-lla-3-8b-instruct / README.md

zhou-xl's picture

Update README.md

8246343 verified about 1 month ago

|

history blame contribute delete

186 Bytes

	---
	base_model:
	- meta-llama/Meta-Llama-3-8B-Instruct
	datasets:
	- princeton-nlp/llama3-ultrafeedback
	license: mit
	---


	a simpo-like DPO method, trained on simpo data
	AlpacaEval:44.8(+2)