ken11
/

albert-base-japanese-v1-with-japanese-tokenizer

Inference Endpoints

Model card Files Files and versions Community

ken11 commited on Apr 20, 2022

Commit

e1d6e47

·

1 Parent(s): 635ac3a

update README

Files changed (1) hide show

README.md +20 -0

README.md CHANGED Viewed

@@ -43,6 +43,26 @@ _, result = predict[0, mask_index].topk(5)
 print(tokenizer.convert_ids_to_tokens(result.tolist()))
 ```
 ## Training Data
 学習には
 - [日本語Wikipediaの全文](https://ja.wikipedia.org/wiki/Wikipedia:%E3%83%87%E3%83%BC%E3%82%BF%E3%83%99%E3%83%BC%E3%82%B9%E3%83%80%E3%82%A6%E3%83%B3%E3%83%AD%E3%83%BC%E3%83%89)

 print(tokenizer.convert_ids_to_tokens(result.tolist()))
 ```
+#### for TensorFlow
+```py
+from transformers import (
+    TFAutoModelForMaskedLM, AutoTokenizer
+)
+import tensorflow as tf
+tokenizer = AutoTokenizer.from_pretrained("ken11/albert-base-japanese-v1-with-japanese-tokenizer")
+model = TFAutoModelForMaskedLM.from_pretrained("ken11/albert-base-japanese-v1-with-japanese-tokenizer")
+text = "明日は明日の[MASK]が吹く"
+tokens = tokenizer(text, return_tensors="tf")
+mask_index = tokens["input_ids"][0].numpy().tolist().index(tokenizer.mask_token_id)
+predict = model(**tokens)[0]
+result = tf.math.top_k(predict[0, mask_index], k=5)
+print(tokenizer.convert_ids_to_tokens(result.indices.numpy()))
+```
 ## Training Data
 学習には
 - [日本語Wikipediaの全文](https://ja.wikipedia.org/wiki/Wikipedia:%E3%83%87%E3%83%BC%E3%82%BF%E3%83%99%E3%83%BC%E3%82%B9%E3%83%80%E3%82%A6%E3%83%B3%E3%83%AD%E3%83%BC%E3%83%89)