joshmiller656
/

Llama-3.1-Nemotron-70B-Instruct-AWQ-INT4

Text Generation

text-generation-inference

Inference Endpoints

4-bit precision

Model card Files Files and versions Community

Llama-3.1-Nemotron-70B-Instruct-AWQ-INT4 / model-00008-of-00009.safetensors

Commit History

Upload folder using huggingface_hub

372de0b
verified

joshmiller656 commited on 23 days ago