add model

Browse files

Files changed (4) hide show

README.md +14 -0
eval_results.json +3 -0
model.onnx +3 -0
ort_config.json +190 -0

README.md CHANGED Viewed

@@ -1,3 +1,17 @@
 ---
 license: apache-2.0
 ---

 ---
 license: apache-2.0
+datasets:
+- sst2
+- glue
 ---
+This model is a fork of https://huggingface.co/distilbert-base-uncased-finetuned-sst-2-english , quantized using static Post-Training Quantization (PTQ) with ONNX Runtime and 🤗 Optimum library.
+It achieves 0.901 on the validation set.
+To load this model:
+```python
+from optimum.onnxruntime import ORTModelForSequenceClassification
+model = ORTModelForSequenceClassification.from_pretrained("fxmarty/distilbert-base-uncased-finetuned-sst-2-english-int8-static")
+```

eval_results.json ADDED Viewed

	@@ -0,0 +1,3 @@

+{
+    "accuracy": 0.8944954128440367
+}

model.onnx ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:d5c9b729a25e79ed70c1f885f6a0d04c5499370267159ee7b13ee4160d11a619
+size 140444595

ort_config.json ADDED Viewed

	@@ -0,0 +1,190 @@

+{
+  "opset": null,
+  "optimization": {},
+  "optimum_version": "1.4.1.dev0",
+  "quantization": {
+    "activations_dtype": "QInt8",
+    "activations_symmetric": false,
+    "format": "QDQ",
+    "is_static": true,
+    "mode": "QLinearOps",
+    "nodes_to_exclude": [
+      "Mul_503",
+      "Div_238",
+      "Mul_257",
+      "Add_316",
+      "ReduceMean_252",
+      "Add_575",
+      "Sqrt_91",
+      "Add_476",
+      "Mul_175",
+      "Pow_497",
+      "Mul_561",
+      "Mul_151",
+      "Pow_333",
+      "ReduceMean_416",
+      "Sub_85",
+      "Add_340",
+      "Erf_239",
+      "Add_387",
+      "Div_256",
+      "Add_487",
+      "Add_230",
+      "Pow_555",
+      "Add_411",
+      "Sqrt_231",
+      "Div_338",
+      "Add_312",
+      "Pow_169",
+      "Sub_471",
+      "Erf_321",
+      "Add_405",
+      "Add_159",
+      "Mul_488",
+      "Sqrt_313",
+      "Div_484",
+      "ReduceMean_170",
+      "ReduceMean_248",
+      "Mul_242",
+      "Add_247",
+      "Mul_572",
+      "Div_402",
+      "Add_493",
+      "ReduceMean_498",
+      "ReduceMean_494",
+      "ReduceMean_224",
+      "Div_150",
+      "Pow_145",
+      "ReduceMean_412",
+      "Sqrt_395",
+      "Mul_93",
+      "Add_223",
+      "Sqrt_149",
+      "Div_566",
+      "Sqrt_559",
+      "Add_394",
+      "Sqrt_477",
+      "Mul_160",
+      "Pow_251",
+      "Add_562",
+      "Add_569",
+      "Sub_143",
+      "Div_396",
+      "Mul_233",
+      "Mul_324",
+      "Erf_403",
+      "ReduceMean_580",
+      "Sub_331",
+      "Pow_87",
+      "Erf_485",
+      "Add_234",
+      "Sub_389",
+      "ReduceMean_330",
+      "Div_92",
+      "Sqrt_255",
+      "ReduceMean_228",
+      "Mul_315",
+      "Sub_167",
+      "Add_336",
+      "Add_172",
+      "Pow_473",
+      "ReduceMean_310",
+      "Mul_162",
+      "Mul_339",
+      "Add_551",
+      "Add_422",
+      "Sub_553",
+      "Mul_479",
+      "ReduceMean_306",
+      "Div_502",
+      "Pow_579",
+      "Add_582",
+      "Div_420",
+      "ReduceMean_166",
+      "Add_418",
+      "ReduceMean_142",
+      "Div_478",
+      "ReduceMean_470",
+      "Add_241",
+      "Mul_326",
+      "Mul_397",
+      "ReduceMean_88",
+      "Div_174",
+      "ReduceMean_556",
+      "Sub_577",
+      "Add_258",
+      "Sqrt_419",
+      "Div_560",
+      "ReduceMean_576",
+      "ReduceMean_388",
+      "ReduceMean_146",
+      "Sub_249",
+      "Pow_309",
+      "Sub_495",
+      "Sqrt_501",
+      "Add_152",
+      "Add_504",
+      "Sub_413",
+      "ReduceMean_552",
+      "Mul_408",
+      "Add_148",
+      "Sqrt_173",
+      "Sub_225",
+      "Add_254",
+      "Add_500",
+      "Add_398",
+      "Add_558",
+      "Sqrt_583",
+      "Add_83",
+      "Erf_567",
+      "Sqrt_337",
+      "Mul_490",
+      "Sub_307",
+      "Add_329",
+      "Div_314",
+      "Add_165",
+      "ReduceMean_392",
+      "Add_480",
+      "Pow_227",
+      "ReduceMean_334",
+      "ReduceMean_474",
+      "Add_141",
+      "Mul_406",
+      "Add_323",
+      "Add_469",
+      "Mul_585",
+      "Div_320",
+      "Div_232",
+      "Mul_421",
+      "Add_176",
+      "Mul_244",
+      "Add_586",
+      "Mul_570",
+      "Add_94",
+      "Pow_391",
+      "ReduceMean_84",
+      "Pow_415",
+      "Add_305",
+      "Div_584",
+      "Erf_157",
+      "Div_156",
+      "Add_90"
+    ],
+    "nodes_to_quantize": [],
+    "operators_to_quantize": [
+      "MatMul",
+      "Add"
+    ],
+    "per_channel": false,
+    "qdq_add_pair_to_weight": false,
+    "qdq_dedicated_pair": false,
+    "qdq_op_type_per_channel_support_to_axis": {
+      "MatMul": 1
+    },
+    "reduce_range": false,
+    "weights_dtype": "QInt8",
+    "weights_symmetric": true
+  },
+  "transformers_version": "4.23.0.dev0",
+  "use_external_data_format": false
+}