kz commited on
Commit
e9ce2f4
1 Parent(s): 98664e1

Update README.md

Browse files
Files changed (1) hide show
  1. README.md +7 -4
README.md CHANGED
@@ -10,18 +10,20 @@ Google's mt5-base fine-tuned in Japanese to solve error detection and correction
10
  #日本語誤り訂正
11
 
12
  - "吾輩をは猫である。名前えはまだない。"→"吾輩は猫である。名前はまだない。"
13
- - "-small" has been trained on 20,000 text pairs.
14
- - dataset: [link](http://nlp.ist.i.kyoto-u.ac.jp/?%E6%97%A5%E6%9C%AC%E8%AA%9EWikipedia%E5%85%A5%E5%8A%9B%E8%AA%A4%E3%82%8A%E3%83%87%E3%83%BC%E3%82%BF%E3%82%BB%E3%83%83%E3%83%88) *use only first 20,000 text pairs.
15
  - prefix: "correction: " (notice: single task trained.)
16
 
17
  ##参考
18
 
19
  - "東北大学でMASKが研究をしています。"→"東北大学でMASKの研究をしています。" ジム・キャリーを主語とした唯一のガ格が消され、ジム・キャリーは研究対象となった。易読化のために用いられる主語と動詞を近づける記法は誤り扱い?
20
- - "東北大学でマスクが研究をしています。"→"東北大学でマスクの研究をしています。"、"東北大学でイーロン・マスクが研究をしています。"→"東北大学でイーロン・マスクが研究をしています。"、"東北大学で「イーロン・マスク」が研究をしています。"→"東北大学で「イーロン・マスク」の研究をしています。" 単語の意味も考慮されている?
 
 
21
  - "東北大学でイマスクが研究をしています。"→"東北大学でイマスクの研究をしています。"
22
  - "東北大学でクが研究をしています。"→"東北大学でコンピューターが研究をしています。" それはちょっと待って。
23
 
24
- ##参考 extra_idを用い探索
25
 
26
  - "東北大学で <extra_id_0> の研究をしています。"→"東北大学で化学の研究をしています。"
27
  - "東北大学で <extra_id_0> が研究をしています。"→"東北大学で工学が研究をしています。" 工学さん。
@@ -36,6 +38,7 @@ Google's mt5-base fine-tuned in Japanese to solve error detection and correction
36
  - "あなたは女性で猫です。彼は犬です。ライオンは <extra_id_0>"→"あなたは女性で猫です。彼は犬です。ライオンは猫です。"
37
  - "あなたがは女性で猫です。彼はが犬です。ライオンが <extra_id_0>"→"あなたが女性で猫です。彼は犬です。ライオンが犬です。"
38
  - "Aは11、Bは9。Aは <extra_id_0> 。Bは <extra_id_1> 。"→"Aは11、Bは9。Aは11。Bは9。"
 
39
 
40
  **check in progress**
41
 
 
10
  #日本語誤り訂正
11
 
12
  - "吾輩をは猫である。名前えはまだない。"→"吾輩は猫である。名前はまだない。"
13
+ - "-small" has been trained on 20,000 text pairs only.
14
+ - dataset: [link](http://nlp.ist.i.kyoto-u.ac.jp/?%E6%97%A5%E6%9C%AC%E8%AA%9EWikipedia%E5%85%A5%E5%8A%9B%E8%AA%A4%E3%82%8A%E3%83%87%E3%83%BC%E3%82%BF%E3%82%BB%E3%83%83%E3%83%88) *used only first 20,000 text pairs.
15
  - prefix: "correction: " (notice: single task trained.)
16
 
17
  ##参考
18
 
19
  - "東北大学でMASKが研究をしています。"→"東北大学でMASKの研究をしています。" ジム・キャリーを主語とした唯一のガ格が消され、ジム・キャリーは研究対象となった。易読化のために用いられる主語と動詞を近づける記法は誤り扱い?
20
+ - "東北大学でマスクが研究をしています。"→"東北大学でマスクの研究をしています。"
21
+ - "東北大学でイーロン・マスクが研究をしています。"→"東北大学でイーロン・マスクが研究をしています。"
22
+ - "東北大学で「イーロン・マスク」が研究をしています。"→"東北大学で「イーロン・マスク」の研究をしています。" 単語の意味も考慮されている?
23
  - "東北大学でイマスクが研究をしています。"→"東北大学でイマスクの研究をしています。"
24
  - "東北大学でクが研究をしています。"→"東北大学でコンピューターが研究をしています。" それはちょっと待って。
25
 
26
+ ##参考 extra_idを用い探索*<>は半角に変更してください
27
 
28
  - "東北大学で <extra_id_0> の研究をしています。"→"東北大学で化学の研究をしています。"
29
  - "東北大学で <extra_id_0> が研究をしています。"→"東北大学で工学が研究をしています。" 工学さん。
 
38
  - "あなたは女性で猫です。彼は犬です。ライオンは <extra_id_0>"→"あなたは女性で猫です。彼は犬です。ライオンは猫です。"
39
  - "あなたがは女性で猫です。彼はが犬です。ライオンが <extra_id_0>"→"あなたが女性で猫です。彼は犬です。ライオンが犬です。"
40
  - "Aは11、Bは9。Aは <extra_id_0> 。Bは <extra_id_1> 。"→"Aは11、Bは9。Aは11。Bは9。"
41
+ - "彼の名前はallenです。彼のnameは <extra_id_0>"→"彼の名前はallenです。彼の名前は英語です。"
42
 
43
  **check in progress**
44