-
-
-
-
-
-
Inference Providers
Active filters: sglang
Image-Text-to-Text
• 7B • Updated
• 23.8k
• 4
AxionML/Qwen3.5-27B-NVFP4
Image-Text-to-Text
• 17B • Updated
• 721
• 2
bullpoint/Qwen3-Coder-Next-AWQ-4bit
Text Generation
• 14B • Updated
• 1.37M
• 15
AxionML/Qwen3.5-122B-A10B-NVFP4
Image-Text-to-Text
• 62B • Updated
• 371
• 1
SurfaceData/llava-v1.6-mistral-7b-sglang
Image-Text-to-Text
• 8B • Updated
• 1
• 9
SurfaceData/llava-v1.6-vicuna-7b-sglang
Image-Text-to-Text
• 7B • Updated
• 2
• 1
tclf90/qwen2.5-72b-instruct-gptq-int4
Text Generation
• 73B • Updated
• 79
• 2
tclf90/qwen2.5-72b-instruct-gptq-int3
Text Generation
• 69B • Updated
• 109
alvarobartt/grok-2-tokenizer
Text Generation
• Updated
• 35
• 4
VibeStudio/MiniMax-M2-THRIFT
173B • Updated
• 1.95k
• 35
mradermacher/MiniMax-M2-THRIFT-GGUF
JasmineBBB/Kimi-Linear-48B-A3B-Instruct-bnb-4bit
Text Generation
• 49B • Updated
• 10
• 1
mradermacher/MiniMax-M2-THRIFT-i1-GGUF
173B • Updated
• 179
• 10
bartowski/VibeStudio_MiniMax-M2-THRIFT-GGUF
Text Generation
• 173B • Updated
• 274
• 8
VibeStudio/MiniMax-M2-THRIFT-55
106B • Updated
• 168
• 5
JinnP/SGLang-EAGLE3-Qwen3-Coder-30B-A3B-Instruct
Text Generation
• 0.2B • Updated
• 134
• 1
mradermacher/MiniMax-M2-THRIFT-55-GGUF
106B • Updated
• 29
• 2
mradermacher/MiniMax-M2-THRIFT-55-i1-GGUF
106B • Updated
• 399
• 2
VibeStudio/MiniMax-M2-THRIFT-55-MLX-4bit
106B • Updated
• 128
• 2
VibeStudio/MiniMax-M2-THRIFT-55-MLX-6bit
106B • Updated
• 83
Doradus-AI/MiroThinker-v1.0-30B-FP8
Text Generation
• 31B • Updated
• 36
• 4
Doradus-AI/Hermes-4.3-36B-FP8
Text Generation
• 36B • Updated
• 38
• 2
Doradus-AI/RnJ-1-Instruct-FP8
Text Generation
• 9B • Updated
• 4
• 4
Image-Text-to-Text
• 138B • Updated
• 16.7k
• 1
QuantTrio/Qwen3-Coder-Next-E336
Text Generation
• 53B • Updated
• 72
• 1
QuantTrio/Qwen3-Coder-Next-E400
Text Generation
• 63B • Updated
• 2.23k
• 2
elon-trump/pixtral-12b-2409-w4a16-gptq
3B • Updated
• 10
Text Generation
• Updated
• 12
AxionML/Qwen3.5-0.8B-Base-NVFP4
Image-Text-to-Text
• 0.7B • Updated
• 30