Edit Models filters

Apps

Docker Model Runner

Inference Providers

OVHcloud AI Endpoints

HF Inference API

Misc

Inference Endpoints

text-generation-inference

Eval Results (legacy)

text-embeddings-inference

4-bit precision

8-bit precision

Mixture of Experts

Carbon Emissions

Models

42,940

Full-text search

Active filters: 4-bit

z-lab/Qwen3.5-9B-PARO

Image-Text-to-Text • 3B • Updated about 4 hours ago • 1.22k • 31

mlx-community/Qwen3.5-9B-MLX-4bit

2B • Updated 11 days ago • 73.8k • 42

mlx-community/Qwen3.5-27B-Claude-4.6-Opus-Distilled-MLX-4bit

27B • Updated 7 days ago • 9.05k • 23

Qwen/Qwen3.5-35B-A3B-GPTQ-Int4

Image-Text-to-Text • 36B • Updated 10 days ago • 200k • 46

Intel/Qwen3.5-9B-int4-AutoRound

4B • Updated 8 days ago • 11.4k • 17

z-lab/Qwen3.5-4B-PARO

Image-Text-to-Text • 1B • Updated about 4 hours ago • 850 • 12

mlx-community/Qwen3.5-27B-4bit

Image-Text-to-Text • 5B • Updated 17 days ago • 36.1k • 32

QuantTrio/Qwen3.5-27B-AWQ

Image-Text-to-Text • 28B • Updated 11 days ago • 176k • 18

mlx-community/Qwen3.5-35B-A3B-4bit

Image-Text-to-Text • 6B • Updated 17 days ago • 32.8k • 22

Qwen/Qwen3.5-27B-GPTQ-Int4

Image-Text-to-Text • 28B • Updated 10 days ago • 125k • 24

mlx-community/Qwen3.5-9B-OptiQ-4bit

Text Generation • 9B • Updated 8 days ago • 3.68k • 12

Intel/Qwen3-Coder-Next-int4-AutoRound

Text Generation • 12B • Updated Feb 10 • 11.4k • 18

QuantTrio/Qwen3.5-122B-A10B-AWQ

Image-Text-to-Text • 125B • Updated 15 days ago • 32.1k • 16

Kbenkhaled/Qwen3.5-27B-NVFP4

Image-Text-to-Text • 17B • Updated 14 days ago • 16.9k • 15

mlx-community/Qwen3.5-4B-OptiQ-4bit

Text Generation • 0.8B • Updated 9 days ago • 2.52k • 6

Intel/Qwen3.5-122B-A10B-int4-AutoRound

20B • Updated about 2 hours ago • 39.1k • 15

Intel/Step-3.5-Flash-int4-mixed-AutoRound

Text Generation • 28B • Updated 1 day ago • 114 • 5

TheCluster/Qwen3.5-35B-A3B-Heretic-MLX-4bit

Image-Text-to-Text • 35B • Updated 10 days ago • 1.77k • 4

saricles/MiniMax-M2.5-REAP-172B-A10B-NVFP4-GB10

Text Generation • 98B • Updated 12 days ago • 675 • 4

Jackrong/MLX-Qwen3.5-27B-Claude-4.6-Opus-Reasoning-Distilled-4bit

Text Generation • 27B • Updated 9 days ago • 1.68k • 4

Intel/Qwen3.5-27B-int4-AutoRound

7B • Updated 8 days ago • 2.96k • 5

neuralnets/sarvam-30b-4bit

32B • Updated 5 days ago • 70 • 4

mlx-community/gpt-oss-20b-MXFP4-Q8

Text Generation • Updated Aug 29, 2025 • 539k • 37

mlx-community/Qwen3.5-122B-A10B-4bit

Image-Text-to-Text • 20B • Updated 17 days ago • 11.1k • 7

Intel/Qwen3.5-35B-A3B-int4-AutoRound

6B • Updated about 2 hours ago • 9.78k • 21

inferencerlabs/Qwen3.5-27B-MLX-4.5bit

Text Generation • 27B • Updated 13 days ago • 941 • 3

Qwen/Qwen3.5-122B-A10B-GPTQ-Int4

Image-Text-to-Text • 125B • Updated 10 days ago • 77.7k • 21

baicai1145/s2-pro-w4a16

Text-to-Speech • 5B • Updated 3 days ago • 95 • 3

openbmb/MiniCPM-Llama3-V-2_5-int4

Visual Question Answering • 9B • Updated Feb 27, 2025 • 686 • 78

unsloth/Qwen2.5-Math-1.5B-bnb-4bit

Text Generation • 2B • Updated Nov 12, 2024 • 2.53k • 3