ISTA-DASLab
/

Meta-Llama-3-8B-Instruct-AQLM-2Bit-1x16

Text Generation

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

Meta-Llama-3-8B-Instruct-AQLM-2Bit-1x16

3 contributors

History: 9 commits

SpiridonSunRotator's picture

SpiridonSunRotator

Update README.md

ffdffd6 verified 8 months ago

.gitattributes

1.52 kB

initial commit 8 months ago
README.md

825 Bytes

Update README.md 8 months ago
config.json

4.34 kB

Uploaded improved version of quantized model 8 months ago
generation_config.json

126 Bytes

Uploaded Meta-Llama-3-8B-Instruct with AQLM 1x16 quantization 8 months ago
model.safetensors

4.08 GB
LFS

Uploaded improved version of quantized model 8 months ago
special_tokens_map.json

73 Bytes

Uploaded Meta-Llama-3-8B-Instruct with AQLM 1x16 quantization 8 months ago
tokenizer.json

9.08 MB

Uploaded Meta-Llama-3-8B-Instruct with AQLM 1x16 quantization 8 months ago
tokenizer_config.json

50.6 kB

Uploaded Meta-Llama-3-8B-Instruct with AQLM 1x16 quantization 8 months ago