Upload folder using huggingface_hub

Browse files

Files changed (15) hide show

config.json +1 -2
generation_config.json +1 -1
onnx/decoder_model.onnx +2 -2
onnx/decoder_model.onnx_data +2 -2
onnx/decoder_model_merged.onnx +2 -2
onnx/decoder_model_merged.onnx_data +2 -2
onnx/decoder_model_merged_quantized.onnx +2 -2
onnx/decoder_model_quantized.onnx +2 -2
onnx/decoder_with_past_model.onnx +2 -2
onnx/decoder_with_past_model.onnx_data +2 -2
onnx/decoder_with_past_model_quantized.onnx +2 -2
onnx/encoder_model.onnx +2 -2
onnx/encoder_model.onnx_data +2 -2
onnx/encoder_model_quantized.onnx +2 -2
quant_config.json +89 -0

config.json CHANGED Viewed

@@ -145,8 +145,7 @@
     50361,
     50362
   ],
-  "torch_dtype": "float32",
-  "transformers_version": "4.29.2",
   "use_cache": true,
   "use_weighted_layer_sum": false,
   "vocab_size": 51865

     50361,
     50362
   ],
+  "transformers_version": "4.30.2",
   "use_cache": true,
   "use_weighted_layer_sum": false,
   "vocab_size": 51865

generation_config.json CHANGED Viewed

@@ -217,5 +217,5 @@
     "transcribe": 50359,
     "translate": 50358
   },
-  "transformers_version": "4.29.2"
 }

     "transcribe": 50359,
     "translate": 50358
   },
+  "transformers_version": "4.30.2"
 }

onnx/decoder_model.onnx CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:03d1c8736b387f84d94f0ceccdcdabddc0c9c953ff4b22a2f41304f341f96c03
-size 1507102

 version https://git-lfs.github.com/spec/v1
+oid sha256:d1c0a21faf8ba940db5fcc29bdc0e66412d05fd80cf8dcfac8c92d23ba166d01
+size 1506542

onnx/decoder_model.onnx_data CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:3a57a63ddaabbaf0aab0f2d8ba3487d70962296033347b82c1bf60221b00fd3e
-size 7783260160

 version https://git-lfs.github.com/spec/v1
+oid sha256:d580f467fb53b33bbfdc1010bffc8b46a79e74ff5c4f19f7bf1516ec7767327d
+size 3891630080

onnx/decoder_model_merged.onnx CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:5b1a1b7a899882f3bfdd5f6a0de29fcc1bb220e61f91293058a7c3f398d42aff
-size 2762394

 version https://git-lfs.github.com/spec/v1
+oid sha256:b6386da420526f0323712dfe66e02004259ef44377e927624ab1e5d5953fa73c
+size 2761864

onnx/decoder_model_merged.onnx_data CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:3a57a63ddaabbaf0aab0f2d8ba3487d70962296033347b82c1bf60221b00fd3e
-size 7783260160

 version https://git-lfs.github.com/spec/v1
+oid sha256:d580f467fb53b33bbfdc1010bffc8b46a79e74ff5c4f19f7bf1516ec7767327d
+size 3891630080

onnx/decoder_model_merged_quantized.onnx CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:5af419cb35af4dd563b859d54761c1865edcf8a7b0c5b7cce3b666c734b8c053
-size 983867549

 version https://git-lfs.github.com/spec/v1
+oid sha256:2ca3d44b85d0dd8442ce7e4a168265d0678fa01d8f239d3aeee0ade5c51e88d1
+size 980944149

onnx/decoder_model_quantized.onnx CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:b963e09c97852775c27b568ec224fbb41696d4f6271cbbf1c6c371e8ddc67730
-size 981928446

 version https://git-lfs.github.com/spec/v1
+oid sha256:318d59d78c33a872b843347a7ca309003d6cde6cd972e250407cb502ecbba730
+size 979005046

onnx/decoder_with_past_model.onnx CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:d0ff014c984ac4a2689ceaf336eab6212c244cc11fe0783dc813f9fa367411bc
-size 1294069

 version https://git-lfs.github.com/spec/v1
+oid sha256:564c4dd801433b3ccf607b947ec8dac4c6cb6538edb72b6cc0cf0217141ba289
+size 1293576

onnx/decoder_with_past_model.onnx_data CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:f4ec656bc837a275fac9d4f26cc3255b0eb19760f61e4442999a79bce265d8bb
-size 6944071680

 version https://git-lfs.github.com/spec/v1
+oid sha256:8293518c6d66788e5020c694e1a317b744db62a0c918f6ff574bdbed8e23f99e
+size 3472035840

onnx/decoder_with_past_model_quantized.onnx CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:2f768b48810f303b1750eea573d941b4e8e2816e76288aaaf1e6129594784e44
-size 876151256

 version https://git-lfs.github.com/spec/v1
+oid sha256:912d66d239bac2b85e77b116aa92d68a1e45a0b9b164b3a2c044c33d35427a56
+size 873637776

onnx/encoder_model.onnx CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:550015511f42e017e3f38d809ec5c0b6ab6013a203c8cab7fe5535a4e885e921
-size 602752

 version https://git-lfs.github.com/spec/v1
+oid sha256:c34e862d089a0c6a33d9d63620882927f2bf41872a257807e81cdc4ddae5a85c
+size 602071

onnx/encoder_model.onnx_data CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:ab1b99d6696bc44ac1a2bb072ed1e73233d522fac325498b374fe4778394b191
-size 5094277120

 version https://git-lfs.github.com/spec/v1
+oid sha256:c869922c76d760a49fbffeff93e93e7a99f016a28af0a854c1454785666070ad
+size 2547138560

onnx/encoder_model_quantized.onnx CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:7339d32967d4ce44d856bf98f216eed4a6f3847e70a7228f52094a59cd8eaebb
-size 646822577

 version https://git-lfs.github.com/spec/v1
+oid sha256:5dcb8d36c86031fb95287fdef2e1aa43f46e13f79028577923c5c76652c2597b
+size 644978442

quant_config.json ADDED Viewed

	@@ -0,0 +1,89 @@

+{
+    "per_channel": false,
+    "reduce_range": false,
+    "per_model_config": {
+        "encoder_model": {
+            "op_types": [
+                "Div",
+                "Erf",
+                "Gather",
+                "MatMul",
+                "Conv",
+                "ReduceMean",
+                "Pow",
+                "Softmax",
+                "Sub",
+                "Constant",
+                "Add",
+                "Transpose",
+                "Mul",
+                "Unsqueeze",
+                "Shape",
+                "Sqrt",
+                "Reshape",
+                "Concat"
+            ],
+            "weight_type": "QUInt8"
+        },
+        "decoder_model": {
+            "op_types": [
+                "Cast",
+                "Squeeze",
+                "Slice",
+                "Less",
+                "Sub",
+                "Div",
+                "Expand",
+                "Gather",
+                "Range",
+                "ConstantOfShape",
+                "Mul",
+                "Shape",
+                "Sqrt",
+                "Reshape",
+                "ReduceMean",
+                "Pow",
+                "Constant",
+                "Add",
+                "Unsqueeze",
+                "Concat",
+                "Equal",
+                "MatMul",
+                "Erf",
+                "Softmax",
+                "Where",
+                "Transpose"
+            ],
+            "weight_type": "QInt8"
+        },
+        "decoder_model_merged": {
+            "op_types": [
+                "If"
+            ],
+            "weight_type": "QInt8"
+        },
+        "decoder_with_past_model": {
+            "op_types": [
+                "Div",
+                "Gather",
+                "MatMul",
+                "Erf",
+                "ReduceMean",
+                "Pow",
+                "Softmax",
+                "Slice",
+                "Sub",
+                "Constant",
+                "Add",
+                "Transpose",
+                "Mul",
+                "Unsqueeze",
+                "Shape",
+                "Sqrt",
+                "Reshape",
+                "Concat"
+            ],
+            "weight_type": "QInt8"
+        }
+    }
+}