laszlokiss27
/

fixmygrammar

Text2Text Generation

grammar-correction

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

fixmygrammar / quantifiy.py

laszlokiss27's picture

update

46e0b62 4 months ago

383 Bytes

	import onnx
	from onnxruntime.quantization import quantize_dynamic, QuantType

	# Load the original init_decoder_model
	model_path = "decoder_model.onnx"
	quantized_model_path = "decoder_quantized.onnx"

	# Perform dynamic quantization on the model
	quantize_dynamic(model_path, quantized_model_path, weight_type=QuantType.QInt8)

	print(f"Quantized model saved to {quantized_model_path}")