Training in progress, step 500

Files changed (5) hide show

added_tokens.json CHANGED Viewed

@@ -1,3 +1,7 @@
 {
-  "<mask>": 64000
 }

 {
+  "</s>": 2,
+  "<mask>": 64000,
+  "<pad>": 1,
+  "<s>": 0,
+  "<unk>": 3
 }

config.json CHANGED Viewed

@@ -22,7 +22,7 @@
   "position_embedding_type": "absolute",
   "tokenizer_class": "PhobertTokenizer",
   "torch_dtype": "float32",
-  "transformers_version": "4.33.0",
   "type_vocab_size": 1,
   "use_cache": true,
   "vocab_size": 64001

   "position_embedding_type": "absolute",
   "tokenizer_class": "PhobertTokenizer",
   "torch_dtype": "float32",
+  "transformers_version": "4.34.0",
   "type_vocab_size": 1,
   "use_cache": true,
   "vocab_size": 64001

pytorch_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:5caf32001d1d1cd8b9874e7e8fd5053925534fca17a2c0425958f3ac3e5e1f66
 size 1476792753

 version https://git-lfs.github.com/spec/v1
+oid sha256:e5a0cc051f2f2c6b6236802df56691992d9bb7aaefa006303431397a755d2622
 size 1476792753

tokenizer_config.json CHANGED Viewed

@@ -1,4 +1,47 @@
 {
   "bos_token": "<s>",
   "clean_up_tokenization_spaces": true,
   "cls_token": "<s>",
@@ -8,5 +51,6 @@
   "pad_token": "<pad>",
   "sep_token": "</s>",
   "tokenizer_class": "PhobertTokenizer",
   "unk_token": "<unk>"
 }

 {
+  "added_tokens_decoder": {
+    "0": {
+      "content": "<s>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "1": {
+      "content": "<pad>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "2": {
+      "content": "</s>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "3": {
+      "content": "<unk>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "64000": {
+      "content": "<mask>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    }
+  },
+  "additional_special_tokens": [],
   "bos_token": "<s>",
   "clean_up_tokenization_spaces": true,
   "cls_token": "<s>",
   "pad_token": "<pad>",
   "sep_token": "</s>",
   "tokenizer_class": "PhobertTokenizer",
+  "tokenizer_file": "/root/.cache/huggingface/hub/models--vinai--phobert-large/snapshots/9ce4eafcd8e601d798295b17c75c5f5f1b1509b9/tokenizer.json",
   "unk_token": "<unk>"
 }

training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:2981b281b0f84a334f5f790ba5a5f4ba4fd6ca36d7fee46e04d3b33f8c9a751c
-size 4027

 version https://git-lfs.github.com/spec/v1
+oid sha256:15ac3b45921ec710b69a186e83ca7a397b947760c3735b6e69c874ac831ee39e
+size 4091