Maximofn
/

Llama-3-8B-Instruct-GPTQ-3bits

Text Generation

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

Llama-3-8B-Instruct-GPTQ-3bits / generation_config.json

Maximofn's picture

AutoGPTQ model for meta-llama/Meta-Llama-3-8B-Instruct: 3bits, gr128, desc_act=False

422fd94 verified 4 months ago

194 Bytes

	{
	"bos_token_id": 128000,
	"do_sample": true,
	"eos_token_id": [
	128001,
	128009
	],
	"max_length": 4096,
	"temperature": 0.6,
	"top_p": 0.9,
	"transformers_version": "4.42.4"
	}