maitreyaz
/

Llama-3-8B-AWQ-4bit

Text Generation

Inference Endpoints

text-generation-inference

4-bit precision

Model card Files Files and versions Community

Edit model card

Llama 3 8B AWQ 4-bit Quantized

This is an AWQ 4-bit Quantized version of Meta's Llama 3 8B.

Downloads last month: 13

Safetensors

Model size

1.98B params

Tensor type

I32

·

FP16

·