Edit Models filters

Inference status

Misc

Inference Endpoints

AutoTrain Compatible

text-generation-inference

4-bit precision

8-bit precision

Misc with no match

text-embeddings-inference

Carbon Emissions

Mixture of Experts

Models

5,185

Full-text search

Active filters: pruna-ai

PrunaAI/rinna-youri-7b-QUANTO-int2bit-smashed

Updated Aug 2 • 2

PrunaAI/rinna-youri-7b-QUANTO-int4bit-smashed

PrunaAI/rinna-youri-7b-QUANTO-float8bit-smashed

PrunaAI/rinna-youri-7b-QUANTO-int8bit-smashed

Updated Aug 2 • 1

PrunaAI/galatolo-cerbero-7b-QUANTO-float8bit-smashed

PrunaAI/galatolo-cerbero-7b-QUANTO-int2bit-smashed

PrunaAI/galatolo-cerbero-7b-QUANTO-int4bit-smashed

PrunaAI/galatolo-cerbero-7b-QUANTO-int8bit-smashed

PrunaAI/cognitivecomputations-dolphin-2.1-mistral-7b-QUANTO-int2bit-smashed

PrunaAI/totally-not-an-llm-EverythingLM-13b-16k-QUANTO-int8bit-smashed

PrunaAI/totally-not-an-llm-EverythingLM-13b-16k-QUANTO-float8bit-smashed

PrunaAI/totally-not-an-llm-EverythingLM-13b-16k-QUANTO-int4bit-smashed

Updated Aug 2 • 2

PrunaAI/totally-not-an-llm-EverythingLM-13b-16k-QUANTO-int2bit-smashed

Updated Aug 2 • 1

PrunaAI/cognitivecomputations-dolphin-2.1-mistral-7b-QUANTO-int4bit-smashed

PrunaAI/cognitivecomputations-dolphin-2.1-mistral-7b-QUANTO-int8bit-smashed

PrunaAI/cognitivecomputations-dolphin-2.1-mistral-7b-QUANTO-float8bit-smashed

PrunaAI/AdaptLLM-finance-chat-QUANTO-int2bit-smashed

PrunaAI/AdaptLLM-finance-chat-QUANTO-float8bit-smashed

Updated Aug 2 • 1

PrunaAI/AdaptLLM-finance-chat-QUANTO-int4bit-smashed

PrunaAI/AdaptLLM-finance-chat-QUANTO-int8bit-smashed

PrunaAI/pankajmathur-orca_mini_3b-QUANTO-int2bit-smashed

Updated Aug 2 • 2

PrunaAI/pankajmathur-orca_mini_3b-QUANTO-int4bit-smashed

Updated Aug 2 • 3

PrunaAI/pankajmathur-orca_mini_3b-QUANTO-int8bit-smashed

Updated Aug 2 • 10

PrunaAI/pankajmathur-orca_mini_3b-QUANTO-float8bit-smashed

Updated Aug 2 • 6

PrunaAI/nvidia-Llama3-ChatQA-1.5-8B-QUANTO-int2bit-smashed

Updated Aug 2 • 2

PrunaAI/allbyai-ToRoLaMa-7b-v1.0-QUANTO-float8bit-smashed

Updated Aug 2 • 3

PrunaAI/allbyai-ToRoLaMa-7b-v1.0-QUANTO-int2bit-smashed

Updated Aug 2 • 1

PrunaAI/allbyai-ToRoLaMa-7b-v1.0-QUANTO-int4bit-smashed

Updated Aug 2 • 1

PrunaAI/allbyai-ToRoLaMa-7b-v1.0-QUANTO-int8bit-smashed

Updated Aug 2 • 3

PrunaAI/nvidia-Llama3-ChatQA-1.5-8B-QUANTO-float8bit-smashed

Updated Aug 2 • 2