Upload folder using huggingface_hub

Browse files

Files changed (8) hide show

config.json +1 -2
generation_config.json +1 -1
onnx/decoder_model_merged.onnx +1 -1
onnx/decoder_model_merged_quantized.onnx +2 -2
onnx/decoder_model_quantized.onnx +2 -2
onnx/decoder_with_past_model_quantized.onnx +2 -2
onnx/encoder_model_quantized.onnx +2 -2
quant_config.json +89 -0

config.json CHANGED Viewed

@@ -145,8 +145,7 @@
     50361,
     50362
   ],
-  "torch_dtype": "float32",
-  "transformers_version": "4.29.2",
   "use_cache": true,
   "use_weighted_layer_sum": false,
   "vocab_size": 51865

     50361,
     50362
   ],
+  "transformers_version": "4.30.2",
   "use_cache": true,
   "use_weighted_layer_sum": false,
   "vocab_size": 51865

generation_config.json CHANGED Viewed

@@ -217,5 +217,5 @@
     "transcribe": 50359,
     "translate": 50358
   },
-  "transformers_version": "4.29.2"
 }

     "transcribe": 50359,
     "translate": 50358
   },
+  "transformers_version": "4.30.2"
 }

onnx/decoder_model_merged.onnx CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:eef3d2a0334f304e241c1cc0b222b0a47052c3563b1d717dbf9d5227b9235867
 size 314710581

 version https://git-lfs.github.com/spec/v1
+oid sha256:17eeff2508a474685cec5b46587c13eb7d0d28f921ce64d08b8ef3e7a9c2938e
 size 314710581

onnx/decoder_model_merged_quantized.onnx CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:fc5af04192733a84ff10daebcdc47de39bb91c68c679ad5aa0f13ae4565b113e
-size 80632020

 version https://git-lfs.github.com/spec/v1
+oid sha256:edccc6c79bf0f9b46a99770172cf3160154734640795f84c6fc516932b7b87b9
+size 80172704

onnx/decoder_model_quantized.onnx CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:b0feb436e0ec14bf2f277bcbd6c198cc996e4535997cc3f14c36f18baa7399d9
-size 80282184

 version https://git-lfs.github.com/spec/v1
+oid sha256:d0302f2ff47b04e6715e5812a1313084d404cbdeff4a55fdab22e4c5f7c00aa2
+size 79822868

onnx/decoder_with_past_model_quantized.onnx CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:37806369274d0c13448c8024571d4be15c28a6adcda9887655f222d518206ad3
-size 77025486

 version https://git-lfs.github.com/spec/v1
+oid sha256:54d7fad0e7189431eab05cc42fb488f7d8b8011070c70e49aa9d833cb4a917c2
+size 76596950

onnx/encoder_model_quantized.onnx CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:589ca79a883dd2dfae23acd7f801df018d3ffef9ed3eaa63eecfacff6bd18a6d
-size 23321703

 version https://git-lfs.github.com/spec/v1
+oid sha256:e360d86928a0232eb6100f2a36fa4a358c101e0a6a39763e5eefe139dca5fe71
+size 23183300

quant_config.json ADDED Viewed

	@@ -0,0 +1,89 @@

+{
+    "per_channel": false,
+    "reduce_range": false,
+    "per_model_config": {
+        "encoder_model": {
+            "op_types": [
+                "Pow",
+                "Gather",
+                "Mul",
+                "ReduceMean",
+                "Conv",
+                "Erf",
+                "MatMul",
+                "Concat",
+                "Sqrt",
+                "Add",
+                "Constant",
+                "Sub",
+                "Softmax",
+                "Reshape",
+                "Unsqueeze",
+                "Transpose",
+                "Shape",
+                "Div"
+            ],
+            "weight_type": "QUInt8"
+        },
+        "decoder_model": {
+            "op_types": [
+                "Pow",
+                "Expand",
+                "Concat",
+                "Less",
+                "Sqrt",
+                "Add",
+                "Unsqueeze",
+                "Transpose",
+                "Shape",
+                "Gather",
+                "Mul",
+                "ReduceMean",
+                "Erf",
+                "MatMul",
+                "ConstantOfShape",
+                "Constant",
+                "Softmax",
+                "Range",
+                "Reshape",
+                "Cast",
+                "Div",
+                "Where",
+                "Slice",
+                "Sub",
+                "Equal",
+                "Squeeze"
+            ],
+            "weight_type": "QInt8"
+        },
+        "decoder_model_merged": {
+            "op_types": [
+                "If"
+            ],
+            "weight_type": "QInt8"
+        },
+        "decoder_with_past_model": {
+            "op_types": [
+                "Gather",
+                "Pow",
+                "Mul",
+                "ReduceMean",
+                "Concat",
+                "Slice",
+                "MatMul",
+                "Erf",
+                "Sqrt",
+                "Add",
+                "Constant",
+                "Sub",
+                "Softmax",
+                "Reshape",
+                "Unsqueeze",
+                "Transpose",
+                "Shape",
+                "Div"
+            ],
+            "weight_type": "QInt8"
+        }
+    }
+}