HRuiii
/

Meta-Llama-3-8B-Instruct-GPTQ-4bit

Text Generation

Inference Endpoints

4-bit precision

Model card Files Files and versions Community

Meta-Llama-3-8B-Instruct-GPTQ-4bit / quantize_config.json

Commit History

AutoGPTQ model for meta-llama/Meta-Llama-3-8B-Instruct: 4bits, gr128, desc_act=True

502546c
verified

HRuiii commited on Jul 11