chars, wiki, comments v0.1

Files changed (5) hide show

README.md CHANGED Viewed

@@ -2,6 +2,11 @@
 We will release a better one soon:)
 <br><br>
 ## HeBERT: Pre-trained BERT for Polarity Analysis and Emotion Recognition
 HeBERT is a Hebrew pretrained language model. It is based on Google's BERT architecture and it is BERT-Base config [(Devlin et al. 2018)](https://arxiv.org/abs/1810.04805). <br>

 We will release a better one soon:)
 <br><br>
+## train details:
+**token**: char based (1000K vocab) <br>
+**lm dataset**: wiki <br>
+**sentiment dataset**: comments on news
 ## HeBERT: Pre-trained BERT for Polarity Analysis and Emotion Recognition
 HeBERT is a Hebrew pretrained language model. It is based on Google's BERT architecture and it is BERT-Base config [(Devlin et al. 2018)](https://arxiv.org/abs/1810.04805). <br>

config.json CHANGED Viewed

@@ -7,15 +7,25 @@
   "hidden_act": "gelu",
   "hidden_dropout_prob": 0.1,
   "hidden_size": 768,
   "initializer_range": 0.02,
   "intermediate_size": 3072,
   "layer_norm_eps": 1e-12,
   "max_position_embeddings": 514,
   "model_type": "bert",
   "num_attention_heads": 12,
   "num_hidden_layers": 6,
   "pad_token_id": 0,
-  "total_flos": 3118796722622472192,
   "type_vocab_size": 1,
   "vocab_size": 52000
 }

   "hidden_act": "gelu",
   "hidden_dropout_prob": 0.1,
   "hidden_size": 768,
+  "id2label": {
+    "0": "natural",
+    "1": "possitive",
+    "2": "negetive"
+  },
   "initializer_range": 0.02,
   "intermediate_size": 3072,
+  "label2id": {
+    "natural": 0,
+    "negetive": 2,
+    "possitive": 1
+  },
   "layer_norm_eps": 1e-12,
   "max_position_embeddings": 514,
   "model_type": "bert",
   "num_attention_heads": 12,
   "num_hidden_layers": 6,
   "pad_token_id": 0,
+  "total_flos": 451483328659341312,
   "type_vocab_size": 1,
   "vocab_size": 52000
 }

pytorch_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:f8c18b6c74323cc1d85483e93c48b66f6ad0a456bfc427e0ce74a1e667fe2825
-size 333858111

 version https://git-lfs.github.com/spec/v1
+oid sha256:9f325bb655098baf107564cb827f5c8f96c69e0af542e04883fd3625dc5457fc
+size 333861183

training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:7f50e8cde1db05799ace5177491a0b663684c58e0226b05be15789d636ce053e
 size 1839

 version https://git-lfs.github.com/spec/v1
+oid sha256:ab1d77889f7695c8eb2f2631c8e21f7f2461cb9d9df43a8f982bb3674bfa2fee
 size 1839

vocab.txt CHANGED Viewed

The diff for this file is too large to render. See raw diff