DebateLabKIT
/

Llama-3.1-Argunaut-1-8B-SFT

Text Generation

critical-thinking

argument-mapping

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

ggbetz commited on 23 days ago

Commit

e9d7396

·

verified ·

1 Parent(s): e4eee79

Update README.md

Files changed (1) hide show

README.md +6 -6

README.md CHANGED Viewed

@@ -36,16 +36,16 @@ print(output["generated_text"])
 ## Evals
-LM Eval Harness results (local compoletions/vllm):
-<iframe src="https://wandb.ai/ggbetz/argunauts-training/reports/DebateLabKIT-Llama-3-1-Argunaut-1-8B-SFT--VmlldzoxMDc2ODAwOQ" style="border:none;height:1024px;width:100%">
 Pinning `Llama-3.1-Argunaut-1-8B-SFT` against top-performing LLama-8B models from [Open LLM Leaderboard](https://huggingface.co/spaces/open-llm-leaderboard/open_llm_leaderboard#/):
-|Model|BBH|MATH|GPQA|MMLU_Pro|
 |:--------|:---:|:---:|:---:|:---:|
-| gg | 44.6% | 9.0% | 32.1% | 34.5% |
-| ll | 44.6% | 9.0% | 32.1% | 34.5% |
 ## SFT dataset mixture

 ## Evals
+LM Eval Harness results (local completions/vllm): [wandb report](https://api.wandb.ai/links/ggbetz/3bwr0ou6)
 Pinning `Llama-3.1-Argunaut-1-8B-SFT` against top-performing LLama-8B models from [Open LLM Leaderboard](https://huggingface.co/spaces/open-llm-leaderboard/open_llm_leaderboard#/):
+|Model|BBH|MATH|GPQA|MMLU Pro|
 |:--------|:---:|:---:|:---:|:---:|
+| **Llama-3.1-Argunaut-1-8B-SFT** | 44.6% | 9.0% | 32.1% | 34.5% |
+| meta-llama/Meta-Llama-3.1-8B-Instruct | 29.9% | 19.3% | 2.6% | 30.7% |
+| arcee-ai/Llama-3.1-SuperNova-Lite | 31.6% | 17.4% | 7.5% | 32.0% |
+| allenai/Llama-3.1-Tulu-3-8B-SFT | 13.9% | 11.4% | 3.7% | 20.1% |
 ## SFT dataset mixture