hoang1123
/

Llama-2-7b-chat-4bit-gptq

Text Generation

Inference Endpoints

4-bit precision

Model card Files Files and versions Community

Llama-2-7b-chat-4bit-gptq / gptq_model-4bit-128g.safetensors

Commit History

Upload of AutoGPTQ quantized model

f33f3da
verified

hoang1123 commited on May 2