update

Files changed (5) hide show

README.md CHANGED Viewed

@@ -14,10 +14,6 @@ More detail: https://arxiv.org/abs/1907.12412
 ## Released Model Info
-|Model Name|Language|Model Structure|
-|:---:|:---:|:---:|
-|ernie-2.0-en| English |Layer:12, Hidden:768, Heads:12|
 This released pytorch model is converted from the officially released PaddlePaddle ERNIE model and
 a series of experiments have been conducted to check the accuracy of the conversion.
@@ -27,8 +23,8 @@ a series of experiments have been conducted to check the accuracy of the convers
 ## How to use
 ```Python
 from transformers import AutoTokenizer, AutoModel
-tokenizer = AutoTokenizer.from_pretrained("nghuyong/ernie-2.0-en")
-model = AutoModel.from_pretrained("nghuyong/ernie-2.0-en")
 ```
 ## Citation

 ## Released Model Info
 This released pytorch model is converted from the officially released PaddlePaddle ERNIE model and
 a series of experiments have been conducted to check the accuracy of the conversion.
 ## How to use
 ```Python
 from transformers import AutoTokenizer, AutoModel
+tokenizer = AutoTokenizer.from_pretrained("nghuyong/ernie-2.0-base-en")
+model = AutoModel.from_pretrained("nghuyong/ernie-2.0-base-en")
 ```
 ## Citation

config.json CHANGED Viewed

@@ -1,19 +1,20 @@
 {
-  "attention_probs_dropout_prob": 0.1,
-  "gradient_checkpointing": false,
-  "hidden_act": "gelu",
-  "hidden_dropout_prob": 0.1,
-  "hidden_size": 768,
-  "initializer_range": 0.02,
-  "intermediate_size": 3072,
-  "layer_norm_eps": 1e-05,
-  "max_position_embeddings": 512,
-  "model_type": "bert",
-  "num_attention_heads": 12,
-  "num_hidden_layers": 12,
-  "pad_token_id": 0,
-  "sent_type_vocab_size": 4,
-  "task_type_vocab_size": 16,
-  "type_vocab_size": 4,
-  "vocab_size": 30522
-}

 {
+    "attention_probs_dropout_prob": 0.1,
+    "hidden_act": "gelu",
+    "hidden_dropout_prob": 0.1,
+    "hidden_size": 768,
+    "initializer_range": 0.02,
+    "max_position_embeddings": 512,
+    "num_attention_heads": 12,
+    "num_hidden_layers": 12,
+    "sent_type_vocab_size": 4,
+    "task_type_vocab_size": 16,
+    "vocab_size": 30522,
+    "layer_norm_eps": 1e-05,
+    "model_type": "bert",
+    "architectures": [
+        "BertModel"
+    ],
+    "type_vocab_size": 4,
+    "intermediate_size": 3072
+}

flax_model.msgpack DELETED Viewed

@@ -1,3 +0,0 @@
-version https://git-lfs.github.com/spec/v1
-oid sha256:ffcabfa5529fb2fea013bef416d2ab352044d0541c58906adfb4840e957be377
-size 437942253

pytorch_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:af27705a979a8c5ad867fca358b911297a823def39a2727dd7c7aaa855cdd49e
-size 440474579

 version https://git-lfs.github.com/spec/v1
+oid sha256:4b797c4dea488b04b589a1a44f4695208ee901c4a07114fd2adbe6f2b0935039
+size 437998259

tf_model.h5 DELETED Viewed

@@ -1,3 +0,0 @@
-version https://git-lfs.github.com/spec/v1
-oid sha256:bc80a39d3be74ea21a8fc5ba7c8347c81f4c2775afd5ab0f87f503284c164f33
-size 536061752