{ "per_channel": false, "reduce_range": false, "per_model_config": { "decoder_with_past_model": { "op_types": [ "ConstantOfShape", "Unsqueeze", "Mul", "Div", "Where", "Expand", "Cast", "Constant", "Max", "Sqrt", "CumSum", "Relu", "MatMul", "Add", "Squeeze", "Pow", "Identity", "Sub", "ReduceMean", "Softmax", "Gemm", "Gather", "Slice", "Reshape", "Concat", "Equal", "Transpose", "Shape" ], "weight_type": "QInt8" }, "decoder_model_merged": { "op_types": [ "ConstantOfShape", "Unsqueeze", "Mul", "Div", "Cast", "Where", "Expand", "Constant", "Max", "Sqrt", "CumSum", "Relu", "MatMul", "Squeeze", "Add", "Pow", "Identity", "Sub", "ReduceMean", "Softmax", "Gemm", "Gather", "Slice", "Reshape", "If", "Concat", "Less", "Equal", "Transpose", "Shape", "Range" ], "weight_type": "QInt8" }, "decoder_model": { "op_types": [ "ConstantOfShape", "Unsqueeze", "Mul", "Div", "Cast", "Where", "Expand", "Constant", "Max", "Sqrt", "CumSum", "Relu", "MatMul", "Squeeze", "Add", "Pow", "Identity", "Sub", "ReduceMean", "Softmax", "Gemm", "Gather", "Slice", "Reshape", "Concat", "Less", "Equal", "Transpose", "Shape", "Range" ], "weight_type": "QInt8" } } }