Upload folder using huggingface_hub

Browse files

Files changed (8) hide show

config.json +1 -2
generation_config.json +1 -1
onnx/decoder_model_merged.onnx +1 -1
onnx/decoder_model_merged_quantized.onnx +2 -2
onnx/decoder_model_quantized.onnx +2 -2
onnx/decoder_with_past_model_quantized.onnx +2 -2
onnx/encoder_model_quantized.onnx +2 -2
quant_config.json +89 -0

config.json CHANGED Viewed

@@ -145,8 +145,7 @@
     50361,
     50362
   ],
-  "torch_dtype": "float32",
-  "transformers_version": "4.29.2",
   "use_cache": true,
   "use_weighted_layer_sum": false,
   "vocab_size": 51865

     50361,
     50362
   ],
+  "transformers_version": "4.30.2",
   "use_cache": true,
   "use_weighted_layer_sum": false,
   "vocab_size": 51865

generation_config.json CHANGED Viewed

@@ -216,5 +216,5 @@
     "transcribe": 50359,
     "translate": 50358
   },
-  "transformers_version": "4.29.2"
 }

     "transcribe": 50359,
     "translate": 50358
   },
+  "transformers_version": "4.30.2"
 }

onnx/decoder_model_merged.onnx CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:c00671545310903db57ce48f52ec5d987345cc5fc7d8dc0e5e878c0cd0a690f2
 size 1926573

 version https://git-lfs.github.com/spec/v1
+oid sha256:6f82a91e07ab23f138384c1d6aba1f20b3437ccb6beb3eaa21b4ef74cdc292ed
 size 1926573

onnx/decoder_model_merged_quantized.onnx CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:6c1ad5fdbcaa035099dfde799684204d373cbb0881f1d9618b21a1f158316405
-size 517265480

 version https://git-lfs.github.com/spec/v1
+oid sha256:0bdb36b4facd9a224dde4533588f876ab0fb3599001bde4869a39e014594ce13
+size 515407456

onnx/decoder_model_quantized.onnx CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:87c69b1d58197c44ab1959c8e8ea0138786a112c38e042a4a072717f51af64ee
-size 515877306

 version https://git-lfs.github.com/spec/v1
+oid sha256:bf74fbc6d746531b96673d35e8bd455bb049a4f570847b925e9685fe426bc5a0
+size 514019282

onnx/decoder_with_past_model_quantized.onnx CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:09aa8d19794ec32742feecd63248bbe732cfba54136bcea917ba29a21f140463
-size 464952727

 version https://git-lfs.github.com/spec/v1
+oid sha256:e81dd3275a51a8fd1a41247b7cfb4bba5df7d10b3814640c7920579bcca19ba6
+size 463340703

onnx/encoder_model_quantized.onnx CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:75d4b610e4852847ad7bca994733d4ae0526853d240ee51aed631817410e6832
-size 314503795

 version https://git-lfs.github.com/spec/v1
+oid sha256:5d01068c82a2d3e963ffe9047b5cb802539a4f26980434c00f844d431a794ff1
+size 313397176

quant_config.json ADDED Viewed

	@@ -0,0 +1,89 @@

+{
+    "per_channel": false,
+    "reduce_range": false,
+    "per_model_config": {
+        "encoder_model": {
+            "op_types": [
+                "Sqrt",
+                "Conv",
+                "Shape",
+                "Gather",
+                "Transpose",
+                "ReduceMean",
+                "Constant",
+                "Mul",
+                "Sub",
+                "Add",
+                "Erf",
+                "Concat",
+                "Softmax",
+                "Div",
+                "Pow",
+                "MatMul",
+                "Unsqueeze",
+                "Reshape"
+            ],
+            "weight_type": "QUInt8"
+        },
+        "decoder_model": {
+            "op_types": [
+                "Gather",
+                "Expand",
+                "Slice",
+                "ReduceMean",
+                "Unsqueeze",
+                "Pow",
+                "Cast",
+                "Sqrt",
+                "Equal",
+                "Range",
+                "Erf",
+                "Reshape",
+                "Shape",
+                "ConstantOfShape",
+                "Transpose",
+                "Constant",
+                "Less",
+                "Concat",
+                "Add",
+                "Div",
+                "Squeeze",
+                "Where",
+                "Mul",
+                "Sub",
+                "Softmax",
+                "MatMul"
+            ],
+            "weight_type": "QInt8"
+        },
+        "decoder_model_merged": {
+            "op_types": [
+                "If"
+            ],
+            "weight_type": "QInt8"
+        },
+        "decoder_with_past_model": {
+            "op_types": [
+                "Sqrt",
+                "Gather",
+                "Shape",
+                "Transpose",
+                "Slice",
+                "ReduceMean",
+                "Constant",
+                "Mul",
+                "Sub",
+                "Concat",
+                "Add",
+                "Softmax",
+                "Erf",
+                "Unsqueeze",
+                "Pow",
+                "Div",
+                "MatMul",
+                "Reshape"
+            ],
+            "weight_type": "QInt8"
+        }
+    }
+}