xmadai
/

Llama-3.1-Nemotron-70B-Instruct-xMADai-INT4

Text Generation

Inference Endpoints

4-bit precision

Model card Files Files and versions Community

Llama-3.1-Nemotron-70B-Instruct-xMADai-INT4 / gptq_model-4bit-128g.safetensors

Commit History

Upload of AutoGPTQ quantized model

8ff407d
verified

onebitquantized commited on 24 days ago