tugstugi
/

bert-base-mongolian-uncased

Inference Endpoints

Model card Files Files and versions Community

tugstugi commited on Mar 17, 2021

Commit

3ad751d

•

1 Parent(s): ee9a2fb

update README

Files changed (2) hide show

README.md +9 -3
config.json +1 -2

README.md CHANGED Viewed

@@ -19,10 +19,10 @@ This repository is based on the following open source projects: [google-research
 #### How to use
 ```python
-from transformers import pipeline, AutoTokenizer, BertForMaskedLM
-tokenizer = AutoTokenizer.from_pretrained('tugstugi/bert-base-mongolian-uncased')
-model = BertForMaskedLM.from_pretrained('tugstugi/bert-base-mongolian-uncased')
 ## declare task ##
 pipe = pipeline(task="fill-mask", model=model, tokenizer=tokenizer)
@@ -34,6 +34,12 @@ output_ = pipe(input_)
 for i in range(len(output_)):
     print(output_[i])
 ```

 #### How to use
 ```python
+from transformers import pipeline, AutoTokenizer, AutoModelForMaskedLM
+tokenizer = AutoTokenizer.from_pretrained('tugstugi/bert-base-mongolian-uncased', use_fast=False)
+model = AutoModelForMaskedLM.from_pretrained('tugstugi/bert-base-mongolian-uncased')
 ## declare task ##
 pipe = pipeline(task="fill-mask", model=model, tokenizer=tokenizer)
 for i in range(len(output_)):
     print(output_[i])
+## output ##
+#{'sequence': 'миний хувьд хоол идэх нь тун чухал.', 'score': 0.7889143824577332, 'token': 126, 'token_str': 'хувьд'}
+#{'sequence': 'миний бодлоор хоол идэх нь тун чухал.', 'score': 0.18616807460784912, 'token': 6106, 'token_str': 'бодлоор'}
+#{'sequence': 'миний зүгээс хоол идэх нь тун чухал.', 'score': 0.004825591575354338, 'token': 761, 'token_str': 'зүгээс'}
+#{'sequence': 'миний биед хоол идэх нь тун чухал.', 'score': 0.0015743684489279985, 'token': 3010, 'token_str': 'биед'}
+#{'sequence': 'миний тухайд хоол идэх нь тун чухал.', 'score': 0.0014919431414455175, 'token': 1712, 'token_str': 'тухайд'}
 ```

config.json CHANGED Viewed

@@ -17,6 +17,5 @@
   "pad_token_id": 0,
   "type_vocab_size": 2,
   "vocab_size": 32000,
-  "tokenizer_class": "AlbertTokenizer",
-  "transformers_version": "3.5.1"
 }

   "pad_token_id": 0,
   "type_vocab_size": 2,
   "vocab_size": 32000,
+  "tokenizer_class": "AlbertTokenizer"
 }