pytorch model with new tokenizer!

Files changed (7) hide show

backup/tokenizer.json ADDED Viewed

The diff for this file is too large to render. See raw diff

backup/tokenizer_config.json ADDED Viewed

	@@ -0,0 +1 @@


1	+ {"unk_token": "<unk>", "bos_token": "<s>", "eos_token": "</s>", "add_prefix_space": false, "errors": "replace", "sep_token": "</s>", "cls_token": "<s>", "pad_token": "<pad>", "mask_token": "<mask>", "trim_offsets": true, "special_tokens_map_file": null, "name_or_path": "NbAiLab/nb-roberta-base", "tokenizer_class": "RobertaTokenizer"}

backup/vocab.json ADDED Viewed

The diff for this file is too large to render. See raw diff

config.json CHANGED Viewed

@@ -1,5 +1,5 @@
 {
-  "_name_or_path": "roberta-base",
   "architectures": [
     "RobertaForMaskedLM"
   ],
@@ -19,6 +19,7 @@
   "num_hidden_layers": 12,
   "pad_token_id": 1,
   "position_embedding_type": "absolute",
   "transformers_version": "4.15.0.dev0",
   "type_vocab_size": 1,
   "use_cache": true,

 {
+  "_name_or_path": ".",
   "architectures": [
     "RobertaForMaskedLM"
   ],
   "num_hidden_layers": 12,
   "pad_token_id": 1,
   "position_embedding_type": "absolute",
+  "torch_dtype": "float32",
   "transformers_version": "4.15.0.dev0",
   "type_vocab_size": 1,
   "use_cache": true,

pytorch_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:6c7aad3f5456d976b109a957126cbf69ce5c4dcf0ebfd6017269e8ce8a0f9696
 size 498872555

 version https://git-lfs.github.com/spec/v1
+oid sha256:2339152ebda3efe25aec50315e3e266109f11c72d5c182477bfe5b6352c1179a
 size 498872555

tokenizer.json CHANGED Viewed

The diff for this file is too large to render. See raw diff

tokenizer_config.json CHANGED Viewed

	@@ -1 +1 @@
1	- {"unk_token": "<unk>", "bos_token": "<s>", "eos_token": "</s>", "add_prefix_space": false, "errors": "replace", "sep_token": "</s>", "cls_token": "<s>", "pad_token": "<pad>", "mask_token": "<mask>", "~~trim_offsets": true, "~~special_tokens_map_file": null, "name_or_path": "~~NbAiLab/nb-roberta-base~~", "tokenizer_class": "RobertaTokenizer"}


1	+ {"unk_token": "<unk>", "bos_token": "<s>", "eos_token": "</s>", "add_prefix_space": false, "errors": "replace", "sep_token": "</s>", "cls_token": "<s>", "pad_token": "<pad>", "mask_token": "<mask>", "special_tokens_map_file": null, "name_or_path": ".", "tokenizer_class": "RobertaTokenizer"}