Edit Models filters

Inference Providers

HF Inference API

Misc

4-bit precision

Misc with no match

Inference Endpoints

AutoTrain Compatible

text-generation-inference

8-bit precision

text-embeddings-inference

Carbon Emissions

Mixture of Experts

Models

4

Full-text search

Active filters: sglang

SurfaceData/llava-v1.6-mistral-7b-sglang

Image-Text-to-Text • Updated Mar 7, 2024 • 94 • 9

SurfaceData/llava-v1.6-vicuna-7b-sglang

Image-Text-to-Text • Updated Mar 7, 2024 • 11 • 1

tclf90/qwen2.5-72b-instruct-gptq-int4

Text Generation • Updated Nov 4, 2024 • 34

tclf90/qwen2.5-72b-instruct-gptq-int3

Text Generation • Updated Nov 4, 2024 • 37