compressa-ai
/

Llama-3-8B-Instruct-OmniQuant

Text Generation

text-generation-inference

Inference Endpoints

4-bit precision

Model card Files Files and versions Community

Llama-3-8B-Instruct-OmniQuant / config.json

Commit History

add asymm quantized model, add two eos in code sample

6758e8a

Vasily Alexeev commited on Apr 24

add model weights and stuff

1a27dec

Vasily Alexeev commited on Apr 23