Edit Models filters

Inference Providers

HF Inference API

Misc

efficient-inference

Inference Endpoints

text-generation-inference

4-bit precision

8-bit precision

text-embeddings-inference

Mixture of Experts

Carbon Emissions

Models

7

Full-text search

Active filters: efficient-inference

vhab10/llama_3.1_8b_Q4_K_M-gguf

Text Generation • 8B • Updated Oct 6, 2024 • 19

AdvRahul/Axion-1.5B-Reasoning

Text Generation • 2B • Updated Feb 26 • 6

saytes/SoT_DistilBERT

Text Classification • 0.1B • Updated Mar 11 • 20.5k • • 5

stiger1000/TC-MoE

Text Generation • 2B • Updated Jul 25 • 8 • 1

agentlans/Qwen3-4B-multilingual-sft-GGUF

Text Generation • 4B • Updated Jun 29 • 14

sudeshmu/fine_tune

Text Generation • Updated 22 days ago • 97 • 7

weathermanj/Nemotron-nano-9b-fp8

Text Generation • 9B • Updated 20 days ago • 1.14k • 6