Upload folder using huggingface_hub

Browse files

Files changed (15) hide show

.gitattributes +1 -0
_model_decoder_embed_positions_Constant_5_attr__value +3 -0
config.json +1 -1
generation_config.json +1 -1
onnx/decoder_model.onnx +2 -2
onnx/decoder_model.onnx_data +2 -2
onnx/decoder_model_merged.onnx +2 -2
onnx/decoder_model_merged_quantized.onnx +2 -2
onnx/decoder_model_quantized.onnx +2 -2
onnx/decoder_with_past_model.onnx +2 -2
onnx/decoder_with_past_model.onnx_data +2 -2
onnx/decoder_with_past_model_quantized.onnx +2 -2
onnx/encoder_model.onnx +2 -2
onnx/encoder_model_quantized.onnx +2 -2
quantize_config.json +131 -0

.gitattributes CHANGED Viewed

@@ -36,3 +36,4 @@ tokenizer.json filter=lfs diff=lfs merge=lfs -text
 onnx/decoder_model.onnx_data filter=lfs diff=lfs merge=lfs -text
 onnx/decoder_model_merged.onnx_data filter=lfs diff=lfs merge=lfs -text
 onnx/decoder_with_past_model.onnx_data filter=lfs diff=lfs merge=lfs -text

 onnx/decoder_model.onnx_data filter=lfs diff=lfs merge=lfs -text
 onnx/decoder_model_merged.onnx_data filter=lfs diff=lfs merge=lfs -text
 onnx/decoder_with_past_model.onnx_data filter=lfs diff=lfs merge=lfs -text
+_model_decoder_embed_positions_Constant_5_attr__value filter=lfs diff=lfs merge=lfs -text

_model_decoder_embed_positions_Constant_5_attr__value ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:613daf130d7105e6e63c6f721a4946bd2f7df255e79255ac886b600cdaa34dbe
+size 4202496

config.json CHANGED Viewed

@@ -28,7 +28,7 @@
   "pad_token_id": 1,
   "scale_embedding": true,
   "tokenizer_class": "NllbTokenizer",
-  "transformers_version": "4.29.2",
   "use_cache": true,
   "vocab_size": 256206
 }

   "pad_token_id": 1,
   "scale_embedding": true,
   "tokenizer_class": "NllbTokenizer",
+  "transformers_version": "4.33.0.dev0",
   "use_cache": true,
   "vocab_size": 256206
 }

generation_config.json CHANGED Viewed

@@ -5,5 +5,5 @@
   "eos_token_id": 2,
   "max_length": 200,
   "pad_token_id": 1,
-  "transformers_version": "4.29.2"
 }

   "eos_token_id": 2,
   "max_length": 200,
   "pad_token_id": 1,
+  "transformers_version": "4.33.0.dev0"
 }

onnx/decoder_model.onnx CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:fdeccfd3ba96e8aee7dd045f83182507cba589ca5410642b13b23d3b685041ff
-size 562636

 version https://git-lfs.github.com/spec/v1
+oid sha256:fb0e0eba116a5f6491686c5902f41df9ab5919c33a93c2ca088df6091de8856e
+size 1860454885

onnx/decoder_model.onnx_data CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:a09a3713a8de670fe3d587c7faf36e8d3fad471d2ca87f6029476e6ec74dc811
-size 2909290496

 version https://git-lfs.github.com/spec/v1
+oid sha256:66d476d102b3db1819e99a96c154afde049273728e6aaaab6ee5adf0e427f102
+size 2905088000

onnx/decoder_model_merged.onnx CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:b5acdac6829a5027d64d687b61339522a6d220f171e282889b8a1181a92e199a
-size 1022212

 version https://git-lfs.github.com/spec/v1
+oid sha256:004adde69878c3ef0a3fdeea9d4972d901deebeb8f45373f8b2f9abcd15204e9
+size 1865158686

onnx/decoder_model_merged_quantized.onnx CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:83bfebbaf034e9c0d64b567a2a601ed5d3dac4904e9cf69e7684db6b9ee103d8
-size 731672253

 version https://git-lfs.github.com/spec/v1
+oid sha256:dd66608c2a4194e78f95548fa0e64f24302303698c5b09fa8e1f9e16ec00676b
+size 475505771

onnx/decoder_model_quantized.onnx CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:f66977eeb9c38d7146c7a9c2ff99b98d447080c8184b70485cb0f2e48c8098fd
-size 730959620

 version https://git-lfs.github.com/spec/v1
+oid sha256:ddea619b640379609719becf91a488c5e6ce4c4b2052efbb5388edaed465a552
+size 470533055

onnx/decoder_with_past_model.onnx CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:94d5dfbf3bf2c016442dd34e44438007cd42eb8f9b40103f4eb3d34a42a5d9e2
-size 475281

 version https://git-lfs.github.com/spec/v1
+oid sha256:a786f1fd7c4e961dabd49077f071373ed6f93771ce3bbdd5af6d1fda779522b4
+size 1759606543

onnx/decoder_with_past_model.onnx_data CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:b0427f278d242d85a0bfd7ba91eb2f8b7d4f077d956a9a800962e7bf81010ec7
-size 2808528896

 version https://git-lfs.github.com/spec/v1
+oid sha256:ab3deb104bebee00493919111f377566301e2b00ca37168252f9155ef6953c06
+size 2804326400

onnx/decoder_with_past_model_quantized.onnx CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:6978ddd13eae91cedf4eaa101101976a1e50cc7b13f1f254996c66217854b0d1
-size 705433687

 version https://git-lfs.github.com/spec/v1
+oid sha256:374293cb4bb59cd29810851a7cfbc568accb8efdc1a953ac04722e30adaf2d0b
+size 445006987

onnx/encoder_model.onnx CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:eec9001dfa16b09cc0bed3a35904827675a3f0506d23cbf7683e1deb43184d3e
-size 1658468857

 version https://git-lfs.github.com/spec/v1
+oid sha256:d3d9f99355917d6cce7423456645e13a3a2a9f1301bfc000548d5c8960407714
+size 1658468942

onnx/encoder_model_quantized.onnx CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:56f9138d4d64c187216a562bc3c78b1373cbfceaefb8f20b686e55484ab78eec
-size 415968804

 version https://git-lfs.github.com/spec/v1
+oid sha256:5cde664eacba07a62f198857ec6c06e09572b1ebb77c8137f1fa99ac604a3a28
+size 419120483

quantize_config.json ADDED Viewed

	@@ -0,0 +1,131 @@

+{
+    "per_channel": true,
+    "reduce_range": true,
+    "per_model_config": {
+        "decoder_model": {
+            "op_types": [
+                "Less",
+                "Where",
+                "ReduceMean",
+                "Relu",
+                "Slice",
+                "ConstantOfShape",
+                "CumSum",
+                "Range",
+                "MatMul",
+                "Concat",
+                "Pow",
+                "Gather",
+                "Not",
+                "Constant",
+                "Unsqueeze",
+                "Div",
+                "Transpose",
+                "Softmax",
+                "Reshape",
+                "Mul",
+                "Equal",
+                "Squeeze",
+                "Cast",
+                "Expand",
+                "Sub",
+                "Shape",
+                "Sqrt",
+                "Add"
+            ],
+            "weight_type": "QInt8"
+        },
+        "encoder_model": {
+            "op_types": [
+                "ReduceMean",
+                "Where",
+                "Relu",
+                "CumSum",
+                "ConstantOfShape",
+                "MatMul",
+                "Concat",
+                "Pow",
+                "Gather",
+                "Not",
+                "Constant",
+                "Unsqueeze",
+                "Div",
+                "Transpose",
+                "Softmax",
+                "Reshape",
+                "Mul",
+                "Equal",
+                "Cast",
+                "Expand",
+                "Sub",
+                "Sqrt",
+                "Shape",
+                "Add"
+            ],
+            "weight_type": "QInt8"
+        },
+        "decoder_model_merged": {
+            "op_types": [
+                "Less",
+                "Where",
+                "ReduceMean",
+                "Relu",
+                "Slice",
+                "ConstantOfShape",
+                "CumSum",
+                "Range",
+                "MatMul",
+                "Concat",
+                "Pow",
+                "Gather",
+                "Not",
+                "Constant",
+                "Unsqueeze",
+                "Div",
+                "Transpose",
+                "Softmax",
+                "Reshape",
+                "Mul",
+                "Equal",
+                "Squeeze",
+                "Cast",
+                "Expand",
+                "Sub",
+                "If",
+                "Shape",
+                "Sqrt",
+                "Add"
+            ],
+            "weight_type": "QInt8"
+        },
+        "decoder_with_past_model": {
+            "op_types": [
+                "ReduceMean",
+                "Where",
+                "Relu",
+                "ConstantOfShape",
+                "CumSum",
+                "MatMul",
+                "Concat",
+                "Pow",
+                "Gather",
+                "Not",
+                "Constant",
+                "Unsqueeze",
+                "Div",
+                "Transpose",
+                "Softmax",
+                "Reshape",
+                "Mul",
+                "Equal",
+                "Cast",
+                "Expand",
+                "Sub",
+                "Sqrt",
+                "Shape",
+                "Add"
+            ],
+            "weight_type": "QInt8"
+        }
+    }
+}