neuralmagic-ent
/

Llama-3.1-8B-Instruct-quantized.w4a16

Text Generation

4-bit precision

Model card Files Files and versions Community

Llama-3.1-8B-Instruct-quantized.w4a16

1 contributor

History: 2 commits

nm-research's picture

Upload folder using huggingface_hub

4d14217 verified 8 days ago