Edit Models filters

Apps

Docker Model Runner

Inference Providers

OVHcloud AI Endpoints

HF Inference API

Misc

Inference Endpoints

text-generation-inference

Eval Results (legacy)

text-embeddings-inference

4-bit precision

8-bit precision

Mixture of Experts

Carbon Emissions

Models

1,235

Full-text search

Active filters: nvidia

nvidia/NVIDIA-Nemotron-3-Nano-30B-A3B-NVFP4

Text Generation • 18B • Updated 4 days ago • 31.8k • 55

nvidia/NVIDIA-Nemotron-3-Nano-30B-A3B-BF16

Text Generation • 32B • Updated 16 days ago • 553k • 609

nvidia/Cosmos-Reason2-8B

Image-Text-to-Text • 9B • Updated 3 days ago • 89k • 98

nvidia/Qwen3-8B-DMS-8x

8B • Updated 11 days ago • 1.08k • 32

nvidia/NVIDIA-Nemotron-3-Nano-30B-A3B-FP8

Text Generation • 32B • Updated 4 days ago • 687k • • 272

unsloth/Nemotron-3-Nano-30B-A3B-GGUF

Text Generation • 32B • Updated Dec 31, 2025 • 94.4k • 242

nvidia/NVIDIA-Nemotron-Parse-v1.1

Image-Text-to-Text • Updated 6 days ago • 112k • 137

nvidia/Cosmos-Reason2-2B

Image-Text-to-Text • Updated 3 days ago • 77.2k • 33

mlx-community/NVIDIA-Nemotron-3-Nano-30B-A3B-NVFP4

Text Generation • 32B • Updated 5 days ago • 203 • 6

nvidia/Nemotron-Cascade-14B-Thinking

Text Generation • 15B • Updated Jan 1 • 7.45k • 73

unsloth/NVIDIA-Nemotron-3-Nano-30B-A3B-NVFP4

Text Generation • 18B • Updated 5 days ago • 57 • 5

nvidia/NVIDIA-Nemotron-Nano-9B-v2

Text Generation • 9B • Updated 25 days ago • 117k • 472

nvidia/gliner-PII

Token Classification • Updated Dec 7, 2025 • 2.87k • 64

TheStageAI/thewhisper-large-v3-turbo

Automatic Speech Recognition • 0.8B • Updated 10 days ago • 1.91k • 18

nvidia/Qwen3-Next-80B-A3B-Instruct-NVFP4

Text Generation • Updated 21 days ago • 14.7k • 19

nvidia/Qwen3-Next-80B-A3B-Thinking-NVFP4

Text Generation • Updated 21 days ago • 12.9k • 25

Ex0bit/Elbaz-NVIDIA-Nemotron-3-Nano-30B-A3B-PRISM

Text Generation • 32B • Updated 10 days ago • 2.92k • 16

nvidia/Cosmos-Predict2-2B-Video2World

Image-to-Video • Updated Jul 23, 2025 • 3.63k • 40

nvidia/gpt-oss-120b-Eagle3-long-context

Text Generation • 0.2B • Updated 7 days ago • 3.76k • 57

nvidia/NVIDIA-Nemotron-Nano-12B-v2-VL-NVFP4-QAD

Image-Text-to-Text • 8B • Updated Nov 13, 2025 • 35.7k • 17

nvidia/Qwen3-30B-A3B-NVFP4

Text Generation • 16B • Updated Sep 10, 2025 • 26.8k • 23

nvidia/Cosmos-Predict2.5-2B

Updated Dec 18, 2025 • 29.2k • 62

nvidia/Cosmos-Predict2.5-14B

Updated Dec 5, 2025 • 8.1k • 17

nvidia/Qwen2.5-VL-7B-Instruct-NVFP4

Text Generation • 5B • Updated Dec 6, 2025 • 3.99k • 13

nvidia/gpt-oss-120b-Eagle3-short-context

Text Generation • Updated 7 days ago • 3.68k • 14

nvidia/NVIDIA-Nemotron-Nano-9B-v2-NVFP4

Text Generation • 6B • Updated 25 days ago • 11.2k • 17

nvidia/NV-Reason-CXR-3B

Image-Text-to-Text • 4B • Updated Oct 27, 2025 • 1.01k • 23

nvidia/NVIDIA-Nemotron-3-Nano-30B-A3B-Base-BF16

Text Generation • 32B • Updated 11 days ago • 39.8k • 101

mradermacher/Huihui-NVIDIA-Nemotron-Nano-9B-v2-abliterated-i1-GGUF

9B • Updated 29 days ago • 3.72k • 8

nvidia/Mistral-NeMo-12B-Base

Updated Jul 18, 2024 • 41 • 42