compressa-ai
/

Llama-3-70B-Instruct-OmniQuant

Text Generation

text-generation-inference

Inference Endpoints

4-bit precision

Model card Files Files and versions Community

Llama-3-70B-Instruct-OmniQuant / quant_config.json

Vasily Alexeev

add model

1f3dc6b 7 months ago

63 Bytes

{"wbits": 4, "abits": 16, "group_size": 128, "symmetric": true}