starble-dev
/

mini-magnum-12b-v1.1-GGUF

@@ -25,13 +25,13 @@ PPL = Perplexity, lower is better<br>
 Comparisons are done as Q?_? Llama-3-8B against FP16 Llama-3-8B, recommended as a guideline and not as fact.
 | Quant Type | Note | Size |
 | ---- | ---- | ---- |
-| [Q2_K](https://huggingface.co/starble-dev/mini-magnum-12b-v1.1-GGUF/blob/main/mini-magnum-12b-v1.1-Q2_K.gguf) | +3.5199 ppl @ Llama-3-8B | ? GB |
-| [Q3_K_S](https://huggingface.co/starble-dev/mini-magnum-12b-v1.1-GGUF/blob/main/mini-magnum-12b-v1.1-Q3_K_S.gguf) | +1.6321 ppl @ Llama-3-8B | ? GB |
-| [Q3_K_M](https://huggingface.co/starble-dev/mini-magnum-12b-v1.1-GGUF/blob/main/mini-magnum-12b-v1.1-Q3_K_M.gguf) | +0.6569 ppl @ Llama-3-8B | ? GB |
-| [Q3_K_L](https://huggingface.co/starble-dev/mini-magnum-12b-v1.1-GGUF/blob/main/mini-magnum-12b-v1.1-Q3_K_L.gguf) | +0.5562 ppl @ Llama-3-8B | ? GB |
-| [Q4_K_S](https://huggingface.co/starble-dev/mini-magnum-12b-v1.1-GGUF/blob/main/mini-magnum-12b-v1.1-Q4_K_S.gguf) | +0.5562 ppl @ Llama-3-8B | ? GB |
-| [Q4_K_M](https://huggingface.co/starble-dev/mini-magnum-12b-v1.1-GGUF/blob/main/mini-magnum-12b-v1.1-Q4_K_M.gguf) | +0.1754 ppl @ Llama-3-8B | ? GB |
-| [Q5_K_S](https://huggingface.co/starble-dev/mini-magnum-12b-v1.1-GGUF/blob/main/mini-magnum-12b-v1.1-Q5_K_S.gguf) | +0.1049 ppl @ Llama-3-8B | ? GB |
-| [Q5_K_M](https://huggingface.co/starble-dev/mini-magnum-12b-v1.1-GGUF/blob/main/mini-magnum-12b-v1.1-Q5_K_M.gguf) | +0.0569 ppl @ Llama-3-8B | ? GB |
-| [Q6_K](https://huggingface.co/starble-dev/mini-magnum-12b-v1.1-GGUF/blob/main/mini-magnum-12b-v1.1-Q6_K.gguf) | +0.0217 ppl @ Llama-3-8B | ? GB |
-| [Q8_0](https://huggingface.co/starble-dev/mini-magnum-12b-v1.1-GGUF/blob/main/mini-magnum-12b-v1.1-Q8_0.gguf) | +0.0026 ppl @ Llama-3-8B | ? GB |

 Comparisons are done as Q?_? Llama-3-8B against FP16 Llama-3-8B, recommended as a guideline and not as fact.
 | Quant Type | Note | Size |
 | ---- | ---- | ---- |
+| [Q2_K](https://huggingface.co/starble-dev/mini-magnum-12b-v1.1-GGUF/blob/main/Mini-Magnum-12B-v1.1-Q2_K.gguf) | +3.5199 ppl @ Llama-3-8B | 4.79 GB |
+| [Q3_K_S](https://huggingface.co/starble-dev/mini-magnum-12b-v1.1-GGUF/blob/main/Mini-Magnum-12B-v1.1-Q3_K_S.gguf) | +1.6321 ppl @ Llama-3-8B | 5.53 GB |
+| [Q3_K_M](https://huggingface.co/starble-dev/mini-magnum-12b-v1.1-GGUF/blob/main/Mini-Magnum-12B-v1.1-Q3_K_M.gguf) | +0.6569 ppl @ Llama-3-8B | 6.08 GB |
+| [Q3_K_L](https://huggingface.co/starble-dev/mini-magnum-12b-v1.1-GGUF/blob/main/Mini-Magnum-12B-v1.1-Q3_K_L.gguf) | +0.5562 ppl @ Llama-3-8B | 6.56 GB |
+| [Q4_K_S](https://huggingface.co/starble-dev/mini-magnum-12b-v1.1-GGUF/blob/main/Mini-Magnum-12B-v1.1-Q4_K_S.gguf) | +0.5562 ppl @ Llama-3-8B | 7.12 GB |
+| [Q4_K_M](https://huggingface.co/starble-dev/mini-magnum-12b-v1.1-GGUF/blob/main/Mini-Magnum-12B-v1.1-Q4_K_M.gguf) | +0.1754 ppl @ Llama-3-8B | 7.48 GB |
+| [Q5_K_S](https://huggingface.co/starble-dev/mini-magnum-12b-v1.1-GGUF/blob/main/Mini-Magnum-12B-v1.1-Q5_K_S.gguf) | +0.1049 ppl @ Llama-3-8B | 8.52 GB |
+| [Q5_K_M](https://huggingface.co/starble-dev/mini-magnum-12b-v1.1-GGUF/blob/main/Mini-Magnum-12B-v1.1-Q5_K_M.gguf) | +0.0569 ppl @ Llama-3-8B | 8.73 GB |
+| [Q6_K](https://huggingface.co/starble-dev/mini-magnum-12b-v1.1-GGUF/blob/main/Mini-Magnum-12B-v1.1-Q6_K.gguf) | +0.0217 ppl @ Llama-3-8B | 10.1 GB |
+| [Q8_0](https://huggingface.co/starble-dev/mini-magnum-12b-v1.1-GGUF/blob/main/Mini-Magnum-12B-v1.1-Q8_0.gguf) | +0.0026 ppl @ Llama-3-8B | 13.00 GB |