Edit Models filters

Inference status

Misc

arxiv: 2407.14679

Inference Endpoints

AutoTrain Compatible

text-generation-inference

4-bit precision

Misc with no match

8-bit precision

text-embeddings-inference

Carbon Emissions

Mixture of Experts

Models

30

Full-text search

Active filters: 2407.14679

nvidia/Minitron-4B-Base

Updated Aug 22, 2024 • 33 • 127

nvidia/Llama-3.1-Minitron-4B-Width-Base

Updated Aug 22, 2024 • 11 • 187

nvidia/Llama-3.1-Minitron-4B-Depth-Base

Updated Aug 22, 2024 • 3 • 20

IntervitensInc/Llama-3.1-Minitron-4B-Width-Base-chatml

Updated Aug 26, 2024 • 227 • 2

RichardErkhov/nvidia_-_Mistral-NeMo-Minitron-8B-Base-gguf

Updated Aug 23, 2024 • 4.46k • 1

nvidia/Nemotron-Mini-4B-Instruct

Updated Sep 23, 2024 • 30 • 138

nvidia/Mistral-NeMo-Minitron-8B-Instruct

Text Generation • Updated Oct 9, 2024 • 2.88k • 71

da-fr/Mistral-NeMo-Minitron-8B-ARChitects-Full-bnb-4bit

Updated Dec 3, 2024 • 14 • 2

nvidia/Minitron-8B-Base

Updated Aug 20, 2024 • 18 • 63

mgoin/Minitron-8B-Base-FP8

Text Generation • Updated Jul 26, 2024 • 24 • 3

mgoin/Nemotron-4-340B-Base-hf

Text Generation • Updated Aug 8, 2024 • 20 • 1

mgoin/Nemotron-4-340B-Base-hf-FP8

Text Generation • Updated Aug 8, 2024 • 38 • 2

ThomasBaruzier/Llama-3.1-Minitron-4B-Width-Base-GGUF

Updated Aug 27, 2024 • 228 • 3

nvidia/Mistral-NeMo-Minitron-8B-Base

Text Generation • Updated Aug 22, 2024 • 8.06k • 165

QuantFactory/Mistral-NeMo-Minitron-8B-Base-GGUF

Updated Aug 21, 2024 • 284 • 5

QuantFactory/Llama-3.1-Minitron-4B-Depth-Base-GGUF

Updated Aug 22, 2024 • 60 • 1

denkijin/Llama-3.1-Minitron-4B-Width-Base

Updated Aug 23, 2024 • 1

QuantFactory/Llama-3.1-Minitron-4B-Width-Base-GGUF

Updated Aug 24, 2024 • 113 • 1

QuantFactory/Minitron-4B-Base-GGUF

Updated Aug 24, 2024 • 52 • 1

QuantFactory/Minitron-8B-Base-GGUF

Updated Aug 24, 2024 • 116 • 1

TitanML/Mistral-NeMo-Minitron-8B-Base

Text Generation • Updated Sep 9, 2024 • 9

abiks/Nemotron-Mini-4B-Instruct-GGUF-Q8

Updated Sep 14, 2024 • 9 • 3

mylesgoose/Llama-3.1-Minitron-4B-Width-Base

Updated Sep 26, 2024 • 1

QuantFactory/Nemotron-Mini-4B-Instruct-GGUF

Updated Sep 24, 2024 • 243 • 2

QuantFactory/Mistral-NeMo-Minitron-8B-Instruct-GGUF

Updated Oct 4, 2024 • 166 • 5

lucyknada/nvidia_Mistral-NeMo-Minitron-8B-Instruct-v3-exl2

Updated Oct 4, 2024

mav23/Mistral-NeMo-Minitron-8B-Instruct-GGUF

Updated Oct 7, 2024 • 42 • 1

mav23/Mistral-NeMo-Minitron-8B-Base-GGUF

Updated Nov 5, 2024 • 32

duyntnet/Nemotron-Mini-4B-Instruct-imatrix-GGUF

Text Generation • Updated Dec 5, 2024 • 390

duyntnet/Mistral-NeMo-Minitron-8B-Instruct-imatrix-GGUF

Text Generation • Updated 25 days ago • 979