Upload 16 files

Browse files

Files changed (12) hide show

config.json +1 -1
generation_config.json +1 -1
onnx/decoder_model.onnx +3 -0
onnx/decoder_model_merged.onnx +3 -0
onnx/decoder_model_merged_quantized.onnx +3 -0
onnx/decoder_model_quantized.onnx +3 -0
onnx/decoder_with_past_model.onnx +3 -0
onnx/decoder_with_past_model_quantized.onnx +3 -0
onnx/encoder_model.onnx +3 -0
onnx/encoder_model_quantized.onnx +3 -0
quantize_config.json +125 -0
tokenizer_config.json +0 -10

config.json CHANGED Viewed

@@ -181,5 +181,5 @@
   "model_type": "vision-encoder-decoder",
   "pad_token_id": 50256,
   "tie_word_embeddings": false,
-  "transformers_version": "4.35.0"
 }

   "model_type": "vision-encoder-decoder",
   "pad_token_id": 50256,
   "tie_word_embeddings": false,
+  "transformers_version": "4.33.2"
 }

generation_config.json CHANGED Viewed

@@ -4,5 +4,5 @@
   "decoder_start_token_id": 50256,
   "eos_token_id": 50256,
   "pad_token_id": 50256,
-  "transformers_version": "4.35.0"
 }

   "decoder_start_token_id": 50256,
   "eos_token_id": 50256,
   "pad_token_id": 50256,
+  "transformers_version": "4.33.2"
 }

onnx/decoder_model.onnx ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:9ee134eb4fae915ae6b8fa9b7ece5a8413fd9327fc67631e8dd1b6ad462f611e
+size 613129811

onnx/decoder_model_merged.onnx ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:93414b5764f4827c724b1322f161ba7f1f3bceb7ebf8a7a640dcb204becc4e42
+size 615025088

onnx/decoder_model_merged_quantized.onnx ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:5a77f15821d7e404019baf7ef18846fea48dd0aa39038671e0012eb5c7843e5b
+size 158000536

onnx/decoder_model_quantized.onnx ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:fc4a92027f301ea63859420de31b1d815646d15dd1af309b1a099c87b1c9d92d
+size 155678727

onnx/decoder_with_past_model.onnx ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:ba4c6f85d6ef778d5fceb5217191a660747e912471182ce772a95ae7ad179df2
+size 613127119

onnx/decoder_with_past_model_quantized.onnx ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:c97917f85b46734eb6da5a1ded2e9ac30161f0168a54fe761c7fedb60e55d3df
+size 155670590

onnx/encoder_model.onnx ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:7724bf28e2fdd680119c2ed0fdcdd612b0ce5543b77f20f2ff046fe797e5f756
+size 343440632

onnx/encoder_model_quantized.onnx ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:e34da798dfce2b4daaa5b1bf595fa7a67046a1848054565a4ff36056e227d801
+size 87038171

quantize_config.json ADDED Viewed

	@@ -0,0 +1,125 @@

+{
+    "per_channel": false,
+    "reduce_range": false,
+    "per_model_config": {
+        "decoder_with_past_model": {
+            "op_types": [
+                "Squeeze",
+                "Gemm",
+                "Softmax",
+                "Unsqueeze",
+                "ConstantOfShape",
+                "Mul",
+                "Slice",
+                "Div",
+                "Where",
+                "Tanh",
+                "Sub",
+                "Cast",
+                "Constant",
+                "Add",
+                "Transpose",
+                "MatMul",
+                "Shape",
+                "Pow",
+                "Concat",
+                "Sqrt",
+                "Range",
+                "Gather",
+                "Split",
+                "ReduceMean",
+                "Reshape"
+            ],
+            "weight_type": "QInt8"
+        },
+        "decoder_model": {
+            "op_types": [
+                "Squeeze",
+                "Gemm",
+                "Softmax",
+                "Unsqueeze",
+                "ConstantOfShape",
+                "Mul",
+                "Slice",
+                "Div",
+                "Where",
+                "Tanh",
+                "Sub",
+                "Cast",
+                "Constant",
+                "Add",
+                "Transpose",
+                "MatMul",
+                "Shape",
+                "Pow",
+                "Concat",
+                "Sqrt",
+                "Range",
+                "Gather",
+                "Split",
+                "ReduceMean",
+                "Reshape"
+            ],
+            "weight_type": "QInt8"
+        },
+        "encoder_model": {
+            "op_types": [
+                "Erf",
+                "Softmax",
+                "Unsqueeze",
+                "ConstantOfShape",
+                "Mul",
+                "Slice",
+                "Expand",
+                "Div",
+                "Where",
+                "Sub",
+                "Constant",
+                "Transpose",
+                "Add",
+                "MatMul",
+                "Shape",
+                "Equal",
+                "Pow",
+                "Concat",
+                "Sqrt",
+                "Conv",
+                "Gather",
+                "ReduceMean",
+                "Reshape"
+            ],
+            "weight_type": "QUInt8"
+        },
+        "decoder_model_merged": {
+            "op_types": [
+                "Squeeze",
+                "Gemm",
+                "Softmax",
+                "If",
+                "Unsqueeze",
+                "ConstantOfShape",
+                "Mul",
+                "Slice",
+                "Div",
+                "Where",
+                "Tanh",
+                "Sub",
+                "Cast",
+                "Constant",
+                "Add",
+                "Transpose",
+                "MatMul",
+                "Shape",
+                "Pow",
+                "Concat",
+                "Sqrt",
+                "Range",
+                "Gather",
+                "Split",
+                "ReduceMean",
+                "Reshape"
+            ],
+            "weight_type": "QInt8"
+        }
+    }
+}

tokenizer_config.json CHANGED Viewed

@@ -1,15 +1,5 @@
 {
   "add_prefix_space": false,
-  "added_tokens_decoder": {
-    "50256": {
-      "content": "<|endoftext|>",
-      "lstrip": false,
-      "normalized": false,
-      "rstrip": false,
-      "single_word": false,
-      "special": true
-    }
-  },
   "bos_token": "<|endoftext|>",
   "clean_up_tokenization_spaces": true,
   "eos_token": "<|endoftext|>",

 {
   "add_prefix_space": false,
   "bos_token": "<|endoftext|>",
   "clean_up_tokenization_spaces": true,
   "eos_token": "<|endoftext|>",