Edit Models filters

Inference status

Misc

arxiv: 2408.11796

Inference Endpoints

AutoTrain Compatible

text-generation-inference

4-bit precision

Misc with no match

8-bit precision

text-embeddings-inference

Carbon Emissions

Mixture of Experts

Models

10

Full-text search

Active filters: 2408.11796

nvidia/Mistral-NeMo-Minitron-8B-Base

Text Generation • Updated Aug 22, 2024 • 10k • 168

nvidia/Llama-3.1-Minitron-4B-Width-Base

Updated Aug 22, 2024 • 17 • 187

nvidia/Llama-3.1-Minitron-4B-Depth-Base

Updated Aug 22, 2024 • 3 • 20

RichardErkhov/nvidia_-_Mistral-NeMo-Minitron-8B-Base-gguf

Updated Aug 23, 2024 • 7.35k • 1

denkijin/Llama-3.1-Minitron-4B-Width-Base

Updated Aug 23, 2024 • 2

QuantFactory/Llama-3.1-Minitron-4B-Width-Base-GGUF

Updated Aug 24, 2024 • 132 • 1

TitanML/Mistral-NeMo-Minitron-8B-Base

Text Generation • Updated Sep 9, 2024 • 7

mylesgoose/Llama-3.1-Minitron-4B-Width-Base

Updated Sep 26, 2024 • 1

mav23/Mistral-NeMo-Minitron-8B-Base-GGUF

Updated Nov 5, 2024 • 11

da-fr/Mistral-NeMo-Minitron-8B-ARChitects-Full-bnb-4bit

Updated Dec 3, 2024 • 4 • 2