compressa-ai
/

Llama-3-8B-Instruct-OmniQuant

Text Generation

text-generation-inference

Inference Endpoints

4-bit precision

Model card Files Files and versions Community

Llama-3-8B-Instruct-OmniQuant / README.md

Commit History

add asymm quantized model, add two eos in code sample

6758e8a

Vasily Alexeev commited on Apr 24

refine table titles

7807999

Vasily Alexeev commited on Apr 23

add metrics and examples in readme

f7750ae

Vasily Alexeev commited on Apr 23

initial commit

98e482b
verified

Alvant commited on Apr 23