Upload folder using huggingface_hub

Browse files

Files changed (10) hide show

onnx/decoder_model.onnx +2 -2
onnx/decoder_model.onnx_data +2 -2
onnx/decoder_model_merged.onnx +2 -2
onnx/decoder_model_merged.onnx_data +2 -2
onnx/decoder_model_merged_quantized.onnx +2 -2
onnx/decoder_model_quantized.onnx +2 -2
onnx/decoder_with_past_model.onnx +2 -2
onnx/decoder_with_past_model.onnx_data +2 -2
onnx/decoder_with_past_model_quantized.onnx +2 -2
quantize_config.json +59 -59

onnx/decoder_model.onnx CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:116f7dcda1e9ce5987be193cfbfefa85aeae2e80e03aca39d4602c5463046e5d
-size 1686022

 version https://git-lfs.github.com/spec/v1
+oid sha256:24a162d9454daa1ef7eadfbc5c498aa8da370fa5d6f14b9091acb758f8d4eaa3
+size 1687965

onnx/decoder_model.onnx_data CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:a3394a58afd855308a1fdcce769c724bfc860c0ae99b5570e8f966a40f3e7e30
-size 3891630080

 version https://git-lfs.github.com/spec/v1
+oid sha256:37d8047bdced9c506618c73a628a6ffc4fe5bc22b0afb025ec0a5df6d6796e76
+size 3626081280

onnx/decoder_model_merged.onnx CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:70edcd042c2650a52039b9df8968f312929cd8e44ec0b0e7c9f02b5d3af643fe
-size 3145904

 version https://git-lfs.github.com/spec/v1
+oid sha256:9299eda8d2dde4396ec7de893d00c09c4d2dba6c433a41e08e0f9e1763f6ac73
+size 3151825

onnx/decoder_model_merged.onnx_data CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:a3394a58afd855308a1fdcce769c724bfc860c0ae99b5570e8f966a40f3e7e30
-size 3891630080

 version https://git-lfs.github.com/spec/v1
+oid sha256:37d8047bdced9c506618c73a628a6ffc4fe5bc22b0afb025ec0a5df6d6796e76
+size 3626081280

onnx/decoder_model_merged_quantized.onnx CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:2b55b394d6fcb18d270e5945aee4450ef00b8d794e3c0af24fe5a33973dc8247
-size 981440477

 version https://git-lfs.github.com/spec/v1
+oid sha256:f986f262778ead3a379ae1d275415c962116d540896406d34318cb2260803d9e
+size 915058317

onnx/decoder_model_quantized.onnx CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:6413d07da7c6ecb6b1d906c83cf1982afd0415c401d45acb2faa5399c7b61f72
-size 979237768

 version https://git-lfs.github.com/spec/v1
+oid sha256:1f33d8dc7bdd76e8b2fda4f838ec001ce93e789c2e6dcf30d339f67c8dcf19b9
+size 912852053

onnx/decoder_with_past_model.onnx CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:8d417e0b0b6c7055fbf02d66068b782e7564f7476f5b0ab8a8c5e04aaa302292
-size 1491660

 version https://git-lfs.github.com/spec/v1
+oid sha256:2fae8c640318528967efdb8711676c66fa3b3d3e847d8fc983cbd249a1182f53
+size 1493595

onnx/decoder_with_past_model.onnx_data CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:1b4fc3e889a584a43decef7ab17c43d0b06aca46af29cc65e9e4924d10210625
-size 3472035840

 version https://git-lfs.github.com/spec/v1
+oid sha256:68879149602e86721091496311b82611c9bd3101e71a35f4754a05b9487c2df2
+size 3206487040

onnx/decoder_with_past_model_quantized.onnx CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:d4631fc793b86e93f1c965a722754da5ecd7d766e5b1b0556dcf8e1990a568b8
-size 873894992

 version https://git-lfs.github.com/spec/v1
+oid sha256:76b872bba83eb2fabcedc7fb29b2b37cf3783a6ac9e8480f935a4b28cd41646d
+size 807509283

quantize_config.json CHANGED Viewed

@@ -2,112 +2,112 @@
     "per_channel": false,
     "reduce_range": false,
     "per_model_config": {
-        "decoder_model_merged": {
             "op_types": [
-                "Squeeze",
-                "Cast",
-                "Transpose",
                 "Where",
-                "Softmax",
-                "Equal",
-                "Expand",
                 "Slice",
                 "Unsqueeze",
                 "Constant",
-                "Less",
                 "Shape",
-                "MatMul",
-                "Concat",
-                "Erf",
-                "If",
-                "Gather",
-                "Pow",
                 "Sub",
                 "Add",
                 "ReduceMean",
                 "Reshape",
-                "ConstantOfShape",
-                "Div",
-                "Sqrt",
                 "Range",
-                "Mul"
             ],
             "weight_type": "QInt8"
         },
-        "decoder_model": {
             "op_types": [
-                "Squeeze",
-                "Cast",
-                "Transpose",
                 "Where",
-                "Softmax",
-                "Equal",
-                "Expand",
                 "Slice",
                 "Unsqueeze",
                 "Constant",
-                "Less",
                 "Shape",
-                "MatMul",
-                "Concat",
-                "Erf",
-                "Gather",
-                "Pow",
                 "Sub",
                 "Add",
                 "ReduceMean",
                 "Reshape",
-                "ConstantOfShape",
-                "Div",
-                "Sqrt",
                 "Range",
-                "Mul"
             ],
             "weight_type": "QInt8"
         },
         "decoder_with_past_model": {
             "op_types": [
-                "Concat",
-                "Erf",
-                "Gather",
-                "Slice",
-                "Div",
                 "MatMul",
-                "Pow",
-                "Unsqueeze",
-                "Transpose",
                 "Sub",
                 "Sqrt",
-                "Softmax",
                 "Add",
                 "ReduceMean",
-                "Constant",
-                "Shape",
                 "Reshape",
-                "Mul"
             ],
             "weight_type": "QInt8"
         },
         "encoder_model": {
             "op_types": [
-                "Concat",
-                "Erf",
-                "Conv",
-                "Div",
-                "Transpose",
-                "Gather",
                 "MatMul",
-                "Pow",
-                "Unsqueeze",
                 "Sub",
                 "Sqrt",
-                "Softmax",
                 "Add",
                 "ReduceMean",
-                "Constant",
-                "Shape",
                 "Reshape",
-                "Mul"
             ],
             "weight_type": "QUInt8"
         }

     "per_channel": false,
     "reduce_range": false,
     "per_model_config": {
+        "decoder_model": {
             "op_types": [
                 "Where",
+                "Sqrt",
+                "Cast",
+                "ConstantOfShape",
                 "Slice",
+                "Erf",
+                "MatMul",
+                "Div",
+                "Softmax",
                 "Unsqueeze",
                 "Constant",
                 "Shape",
                 "Sub",
+                "Pow",
                 "Add",
                 "ReduceMean",
                 "Reshape",
                 "Range",
+                "Expand",
+                "Equal",
+                "Gather",
+                "Transpose",
+                "Squeeze",
+                "Concat",
+                "Mul",
+                "Less"
             ],
             "weight_type": "QInt8"
         },
+        "decoder_model_merged": {
             "op_types": [
                 "Where",
+                "Sqrt",
+                "Cast",
+                "ConstantOfShape",
                 "Slice",
+                "Erf",
+                "If",
+                "MatMul",
+                "Div",
+                "Softmax",
                 "Unsqueeze",
                 "Constant",
                 "Shape",
                 "Sub",
+                "Pow",
                 "Add",
                 "ReduceMean",
                 "Reshape",
                 "Range",
+                "Expand",
+                "Equal",
+                "Gather",
+                "Transpose",
+                "Squeeze",
+                "Concat",
+                "Mul",
+                "Less"
             ],
             "weight_type": "QInt8"
         },
         "decoder_with_past_model": {
             "op_types": [
                 "MatMul",
                 "Sub",
+                "Unsqueeze",
+                "Gather",
                 "Sqrt",
+                "Transpose",
+                "Pow",
                 "Add",
                 "ReduceMean",
+                "Div",
+                "Concat",
                 "Reshape",
+                "Mul",
+                "Softmax",
+                "Slice",
+                "Constant",
+                "Erf",
+                "Shape"
             ],
             "weight_type": "QInt8"
         },
         "encoder_model": {
             "op_types": [
                 "MatMul",
                 "Sub",
+                "Unsqueeze",
+                "Transpose",
                 "Sqrt",
+                "Gather",
+                "Pow",
                 "Add",
                 "ReduceMean",
+                "Div",
+                "Concat",
+                "Mul",
                 "Reshape",
+                "Softmax",
+                "Conv",
+                "Constant",
+                "Erf",
+                "Shape"
             ],
             "weight_type": "QUInt8"
         }