parsawar
/

Llama2_quantize_4bit

Text Generation

Inference Endpoints

text-generation-inference

4-bit precision

Model card Files Files and versions Community

Llama2_quantize_4bit

1 contributor

History: 4 commits

parsawar's picture

Update README.md

173ee1b verified 18 days ago