Edit Models filters

Inference Providers

Nebius AI Studio

HF Inference API

Misc

compressed-tensors

Inference Endpoints

AutoTrain Compatible

text-generation-inference

8-bit precision

Misc with no match

4-bit precision

text-embeddings-inference

Carbon Emissions

Mixture of Experts

Models

892

Full-text search

Active filters: compressed-tensors

Imran1/Llama-3.1-Tulu-3-70B-Fp8

Updated Nov 26, 2024 • 179

janhq/llama3-s-instruct-v0.4-vllm-fp8

Updated Nov 26, 2024 • 20 • 1

speakleash/Bielik-11B-v2.3-Instruct-W8A8-INT

Updated Nov 26, 2024 • 8

speakleash/Bielik-11B-v2.3-Instruct-W4A16

Updated Nov 26, 2024 • 37

neuralmagic/Qwen2.5-0.5B-FP8-dynamic

Text Generation • Updated Dec 3, 2024 • 61

neuralmagic/Qwen2.5-1.5B-FP8-dynamic

Text Generation • Updated Dec 3, 2024 • 40

neuralmagic/Qwen2.5-3B-FP8-dynamic

Text Generation • Updated Dec 3, 2024 • 54

neuralmagic/Qwen2.5-7B-FP8-dynamic

Text Generation • Updated Dec 3, 2024 • 52

CalamitousFelicitousness/Qwen2.5-32B-ArliAI-RPMax-v1.3-FP8-Dynamic

Updated Nov 28, 2024 • 5

neuralmagic/Qwen2.5-72B-FP8-dynamic

Text Generation • Updated Dec 3, 2024 • 29

alpindale/magnum-v4-12b-fp8

Updated Dec 23, 2024 • 20

reinforce20001/SakuraLLM.Sakura-14B-Qwen2.5-v1.0-W8A8-Int8

Updated Nov 28, 2024 • 4 • 1

espressor/meta-llama.Llama-3.2-1B-Instruct_W4A16

Text Generation • Updated Nov 28, 2024 • 4

espressor/meta-llama.Llama-3.2-1B-Instruct_W8A8_FP8

Text Generation • Updated Nov 28, 2024 • 5

espressor/meta-llama.Llama-3.2-3B-Instruct_W8A8_FP8

Text Generation • Updated Nov 28, 2024 • 5

espressor/meta-llama.Llama-3.2-1B-Instruct_W8A8_int8

Text Generation • Updated Nov 28, 2024 • 77

espressor/meta-llama.Llama-3.2-3B-Instruct_W4A16

Text Generation • Updated Nov 28, 2024 • 52

espressor/meta-llama.Llama-3.1-8B-Instruct_W8A8_FP8

Text Generation • Updated Nov 28, 2024 • 9

espressor/meta-llama.Llama-3.2-3B-Instruct_W8A8_int8

Text Generation • Updated Nov 28, 2024 • 9

espressor/meta-llama.Llama-3.1-8B-Instruct_W4A16

Text Generation • Updated Nov 28, 2024 • 9

espressor/meta-llama.Meta-Llama-3-8B-Instruct_W8A8_FP8

Text Generation • Updated Nov 28, 2024 • 3

espressor/meta-llama.Llama-3.1-8B-Instruct_W8A8_int8

Text Generation • Updated Nov 28, 2024 • 16

espressor/meta-llama.Meta-Llama-3-8B-Instruct_W4A16

Text Generation • Updated Nov 28, 2024 • 6

espressor/meta-llama.Llama-2-7b-chat-hf_W8A8_FP8

Text Generation • Updated Nov 28, 2024 • 10

espressor/meta-llama.Meta-Llama-3-8B-Instruct_W8A8_int8

Text Generation • Updated Nov 28, 2024 • 19

espressor/meta-llama.Llama-2-7b-chat-hf_W4A16

Text Generation • Updated Nov 28, 2024 • 6

espressor/meta-llama.Llama-2-7b-chat-hf_W8A8_int8

Text Generation • Updated Nov 28, 2024 • 3

espressor/meta-llama.Llama-2-13b-chat-hf_W8A8_FP8

Text Generation • Updated Nov 28, 2024 • 7

espressor/meta-llama.Llama-3.1-70B-Instruct_W8A8_FP8

Text Generation • Updated Nov 28, 2024 • 6

BigHuggyD/MarsupialAI_Monstral-123B-FP8-Dynamic-test

Updated Nov 28, 2024 • 4