Supa-AI
/

llama-7b-hf-32768-fpf-gguf

Inference Endpoints

Model card Files Files and versions Community

llama-7b-hf-32768-fpf-gguf / README.md

Supa-AI's picture

Upload README.md with huggingface_hub

231a547 verified about 2 months ago

|

1.51 kB

	---
	language:
	- ms
	tags:
	- llama-cpp
	- gguf
	- quantized
	- llm
	- llama
	- ollama
	base_model: mesolitica/llama-7b-hf-32768-fpf
	---

	# Supa-AI/llama-7b-hf-32768-fpf-gguf
	This model was converted to GGUF format from [`mesolitica/llama-7b-hf-32768-fpf`](https://huggingface.co/mesolitica/llama-7b-hf-32768-fpf) using llama.cpp.
	Refer to the [original model card](https://huggingface.co/mesolitica/llama-7b-hf-32768-fpf) for more details on the model.

	## Available Versions
	- `llama-7b-hf-32768-fpf.q4_0.gguf` (q4_0)
	- `llama-7b-hf-32768-fpf.q4_1.gguf` (q4_1)
	- `llama-7b-hf-32768-fpf.q5_0.gguf` (q5_0)
	- `llama-7b-hf-32768-fpf.q5_1.gguf` (q5_1)
	- `llama-7b-hf-32768-fpf.q8_0.gguf` (q8_0)
	- `llama-7b-hf-32768-fpf.q3_k_s.gguf` (q3_K_S)
	- `llama-7b-hf-32768-fpf.q3_k_m.gguf` (q3_K_M)
	- `llama-7b-hf-32768-fpf.q3_k_l.gguf` (q3_K_L)
	- `llama-7b-hf-32768-fpf.q4_k_s.gguf` (q4_K_S)
	- `llama-7b-hf-32768-fpf.q4_k_m.gguf` (q4_K_M)
	- `llama-7b-hf-32768-fpf.q5_k_s.gguf` (q5_K_S)
	- `llama-7b-hf-32768-fpf.q5_k_m.gguf` (q5_K_M)
	- `llama-7b-hf-32768-fpf.q6_k.gguf` (q6_K)

	## Use with llama.cpp
	Replace `FILENAME` with one of the above filenames.

	### CLI:
	```bash
	llama-cli --hf-repo Supa-AI/llama-7b-hf-32768-fpf-gguf --hf-file FILENAME -p "Your prompt here"
	```

	### Server:
	```bash
	llama-server --hf-repo Supa-AI/llama-7b-hf-32768-fpf-gguf --hf-file FILENAME -c 2048
	```

	## Model Details
	- Original Model: [mesolitica/llama-7b-hf-32768-fpf](https://huggingface.co/mesolitica/llama-7b-hf-32768-fpf)
	- Format: GGUF