nvidia
/

Llama-3.1-405B-Instruct-FP8

Model card Files Files and versions Community

Llama-3.1-405B-Instruct-FP8 / hf_quant_config.json

Zhiyu Cheng

add model checkpoints and config files

b2cbce0 4 months ago

history blame contribute delete

178 Bytes

	{
	"producer": {
	"name": "modelopt",
	"version": "0.17.0"
	},
	"quantization": {
	"quant_algo": "FP8",
	"kv_cache_quant_algo": null
	}
	}