akjindal53244
/

Llama-2-7b-hf-gptq-4bit

Text Generation

Inference Endpoints

text-generation-inference

4-bit precision

Model card Files Files and versions Community

Edit model card

This model is GPTQ 4 bit quantized version of meta-llama/Llama-2-7b-hf.

Downloads last month: 8