parsawar
/

Llama2_quantize_4bit

Text Generation

text-generation-inference

Inference Endpoints

4-bit precision

Model card Files Files and versions Community

Llama2_quantize_4bit

1 contributor

History: 3 commits

parsawar's picture

Upload model.safetensors

e485d0c verified 6 months ago