Update README.md
Browse files
README.md
CHANGED
@@ -9,7 +9,9 @@ datasets:
|
|
9 |
- wikipedia
|
10 |
mask_token: "[MASK]"
|
11 |
widget:
|
|
|
12 |
- text: "[MASK] 大学 で 自然 言語 処理 を 専攻 する 。"
|
|
|
13 |
---
|
14 |
|
15 |
# ku-accms/bert-base-japanese-ssuw
|
@@ -25,27 +27,27 @@ You can use this model directly with a pipeline for masked language modeling:
|
|
25 |
```python
|
26 |
>>> from transformers import pipeline
|
27 |
>>> unmasker = pipeline('fill-mask', model='ku-accms/bert-base-japanese-ssuw')
|
28 |
-
>>> unmasker("
|
29 |
-
[{'sequence': '
|
30 |
-
'score': 0.
|
31 |
-
'token':
|
32 |
-
'token_str': '
|
33 |
-
{'sequence': '
|
34 |
-
'score': 0.
|
35 |
-
'token':
|
36 |
-
'token_str': '
|
37 |
-
{'sequence': '
|
38 |
-
'score': 0.
|
39 |
-
'token':
|
40 |
-
'token_str': '
|
41 |
-
{'sequence': '
|
42 |
-
'score': 0.
|
43 |
-
'token':
|
44 |
-
'token_str': '
|
45 |
-
{'sequence': '
|
46 |
-
'score': 0.
|
47 |
-
'token':
|
48 |
-
'token_str': '
|
49 |
```
|
50 |
|
51 |
Here is how to use this model to get the features of a given text in PyTorch:
|
|
|
9 |
- wikipedia
|
10 |
mask_token: "[MASK]"
|
11 |
widget:
|
12 |
+
- text: "京都 大学 で [MASK] を 勉強 する 。"
|
13 |
- text: "[MASK] 大学 で 自然 言語 処理 を 専攻 する 。"
|
14 |
+
- text: "カフェ で [MASK] を 注文 する 。"
|
15 |
---
|
16 |
|
17 |
# ku-accms/bert-base-japanese-ssuw
|
|
|
27 |
```python
|
28 |
>>> from transformers import pipeline
|
29 |
>>> unmasker = pipeline('fill-mask', model='ku-accms/bert-base-japanese-ssuw')
|
30 |
+
>>> unmasker("京都 大学 で [MASK] を 勉強 する 。")
|
31 |
+
[{'sequence': '京都 大学 で 演劇 を 勉強 する 。',
|
32 |
+
'score': '0.0607224702835083',
|
33 |
+
'token': '16772',
|
34 |
+
'token_str': '演劇'}
|
35 |
+
{'sequence': '京都 大学 で 歴史 を 勉強 する 。',
|
36 |
+
'score': '0.04331592842936516',
|
37 |
+
'token': '14046',
|
38 |
+
'token_str': '歴史'}
|
39 |
+
{'sequence': '京都 大学 で 英語 を 勉強 する 。',
|
40 |
+
'score': '0.03882499784231186',
|
41 |
+
'token': '14592',
|
42 |
+
'token_str': '英語'}
|
43 |
+
{'sequence': '京都 大学 で 音楽 を 勉強 する 。',
|
44 |
+
'score': '0.03706944361329079',
|
45 |
+
'token': '14084',
|
46 |
+
'token_str': '音楽'}
|
47 |
+
{'sequence': '京都 大学 で 文学 を 勉強 する 。',
|
48 |
+
'score': '0.03688089922070503',
|
49 |
+
'token': '14603',
|
50 |
+
'token_str': '文学'}
|
51 |
```
|
52 |
|
53 |
Here is how to use this model to get the features of a given text in PyTorch:
|