ISTA-DASLab
/

Llama-2-13b-AQLM-2Bit-2x8-hf

Text Generation

text-generation-inference

Inference Endpoints

8-bit precision

Model card Files Files and versions Community

Llama-2-13b-AQLM-2Bit-2x8-hf

1 contributor

History: 4 commits

SpiridonSunRotator's picture

SpiridonSunRotator

Fixed table

5a363b7 verified 7 months ago

.gitattributes

1.52 kB

initial commit 7 months ago
README.md

528 Bytes

Fixed table 7 months ago
config.json

5.2 kB

Uploaded Llama-2-13b with AQLM 2x8 quantization 7 months ago
generation_config.json

116 Bytes

Uploaded Llama-2-13b with AQLM 2x8 quantization 7 months ago
model.safetensors

3.83 GB
LFS

Uploaded Llama-2-13b with AQLM 2x8 quantization 7 months ago
special_tokens_map.json

414 Bytes

Uploaded Llama-2-13b with AQLM 2x8 quantization 7 months ago
tokenizer.json

1.84 MB

Uploaded Llama-2-13b with AQLM 2x8 quantization 7 months ago
tokenizer.model

500 kB
LFS

Uploaded Llama-2-13b with AQLM 2x8 quantization 7 months ago
tokenizer_config.json

918 Bytes

Uploaded Llama-2-13b with AQLM 2x8 quantization 7 months ago