neuralmagic-ent
/

Phi-3-mini-128k-instruct-quantized.w8a8

Upload folder using huggingface_hub

d5fc659 verified 8 days ago

381 Bytes

	quant_stage:
	quant_modifiers:
	GPTQModifier:
	sequential_update: false
	dampening_frac: 0.01
	ignore: [lm_head]
	config_groups:
	group_0:
	targets: [Linear]
	weights: {num_bits: 8, type: int, symmetric: true, strategy: channel}
	input_activations: {num_bits: 8, type: int, symmetric: true, dynamic: true, strategy: token}