hoang1123
/

Llama-2-7b-chat-4bit-gptq

Text Generation

text-generation-inference

Inference Endpoints

4-bit precision

Model card Files Files and versions Community

Llama-2-7b-chat-4bit-gptq

1 contributor

History: 3 commits

hoang1123's picture

Upload of AutoGPTQ quantized model

f33f3da verified 5 months ago