ISTA-DASLab
/

Llama-2-70b-AQLM-2Bit-2x8-hf

Text Generation

text-generation-inference

Inference Endpoints

8-bit precision

Model card Files Files and versions Community

Llama-2-70b-AQLM-2Bit-2x8-hf

3 contributors

History: 5 commits

BlackSamorez's picture

new dispatch + tokenizer

38e03c1 11 months ago