Edit Models filters

Apps

Docker Model Runner

Inference Providers

OVHcloud AI Endpoints

HF Inference API

Misc

Inference Endpoints

text-generation-inference

Eval Results (legacy)

text-embeddings-inference

4-bit precision

8-bit precision

Mixture of Experts

Carbon Emissions

Models

191

Full-text search

Active filters: modelopt

nvidia/Qwen3.5-397B-A17B-NVFP4

Text Generation • Updated 9 days ago • 65.2k • 55

lukealonso/MiniMax-M2.5-REAP-139B-A10B-NVFP4

80B • Updated 5 days ago • 12.3k • 20

nvidia/Kimi-K2.5-NVFP4

Text Generation • Updated 23 days ago • 86.4k • 55

lukealonso/MiniMax-M2.5-NVFP4

130B • Updated 11 days ago • 64.9k • 34

nvidia/Qwen3-Next-80B-A3B-Instruct-NVFP4

Text Generation • Updated 19 days ago • 39.7k • 32

lukealonso/GLM-5-NVFP4

425B • Updated 11 days ago • 21.2k • 9

txn545/Qwen3.5-122B-A10B-NVFP4

Text Generation • 64B • Updated 3 days ago • 6.55k • 5

nvidia/Qwen3-Next-80B-A3B-Thinking-NVFP4

Text Generation • Updated 19 days ago • 77.6k • 50

nvidia/Qwen3-32B-NVFP4

Text Generation • 17B • Updated Sep 9, 2025 • 21.9k • 8

NVFP4/Qwen3-Coder-30B-A3B-Instruct-FP4

Text Generation • 16B • Updated Aug 5, 2025 • 24.7k • 9

shanjiaz/gpt-oss-120b-nvfp4-modelopt

59B • Updated Sep 24, 2025 • 10.2k • 4

vincentzed-hf/Qwen3-Coder-Next-NVFP4

Text Generation • Updated 12 days ago • 7.23k • 7

vincentzed-hf/Qwen3.5-397B-A17B-NVFP4

Image-Text-to-Text • Updated 11 days ago • 21.1k • 10

txn545/Qwen3.5-35B-A3B-NVFP4

Text Generation • Updated 3 days ago • 16.2k • 2

osoleve/Qwen3.5-27B-NVFP4-MTP

Text Generation • Updated about 18 hours ago • 213 • 2

nvidia/Qwen3-30B-A3B-NVFP4

Text Generation • 16B • Updated Sep 10, 2025 • 60.5k • 24

NVFP4/Qwen3-30B-A3B-Instruct-2507-FP4

Text Generation • 16B • Updated Aug 1, 2025 • 1.47k • 12

nvidia/Qwen3-8B-FP8

Text Generation • 8B • Updated Sep 9, 2025 • 5.89k • 4

nvidia/Llama-3.1-Nemotron-Nano-VL-8B-V1-FP4-QAD

Image-Text-to-Text • Updated Oct 9, 2025 • 417 • 13

DataSnake/Muse-12B-NVFP4

Text Generation • 7B • Updated Dec 25, 2025 • 29 • 1

DataSnake/Wayfarer-12B-NVFP4

Text Generation • 7B • Updated Dec 25, 2025 • 3 • 1

DataSnake/Wayfarer-2-12B-NVFP4

Text Generation • 7B • Updated Dec 25, 2025 • 1 • 1

nvidia/Kimi-K2-Thinking-NVFP4

Text Generation • Updated 18 days ago • 122k • 28

nvidia/Qwen3-235B-A22B-Thinking-2507-NVFP4

Text Generation • Updated 28 days ago • 797 • 5

tiiuae/Falcon-H1R-7B-FP8

Text Generation • 8B • Updated 17 days ago • 524 • 5

baseten-admin/Kimi-2.5-text-nvfp4-v3

Updated 25 days ago • 779 • 1

Cirrascale/Qwen3-Coder-Next-NVFP4

Text Generation • Updated 16 days ago • 802 • 2

nvidia/Llama-4-Scout-17B-16E-Instruct-NVFP4

56B • Updated Dec 12, 2025 • 15.5k • 21

nvidia/Llama-4-Maverick-17B-128E-Instruct-FP8

402B • Updated Jul 29, 2025 • 643 • 12

nvidia/Llama-4-Scout-17B-16E-Instruct-FP8

109B • Updated Dec 12, 2025 • 43.3k • 11