File size: 4,143 Bytes
46e30fc
 
 
 
 
 
 
 
 
 
 
38978e2
 
 
1241b9e
dfb8eb5
1241b9e
6fa69d0
f76dbcd
84c4184
98be5cf
66b22fc
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
46e30fc
 
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
---
language: "ja"
---

Google's mt5-base fine-tuned in Japanese to solve error detection and correction.

#日本語誤り訂正

- "吾輩をは猫である。名前えはまだない。"→"吾輩は猫である。名前はまだない。"
- "-small" has been trained on 20,000 text pairs.
- prefix: "correction: " (notice: single task trained.)

##参考

- "東北大学でMASKが研究をしています。"→"東北大学でMASKの研究をしています。" ジム・キャリーを主語とした唯一のガ格が消された。易読化のために用いられる、主語と動詞を近づける記法は誤り扱い?
- "東北大学でマスクが研究をしています。"→"東北大学でマスクの研究をしています。"、"東北大学でイーロン・マスクが研究をしています。"→"東北大学でイーロン・マスクが研究をしています。"、"東北大学で「イーロン・マスク」が研究をしています。"→"東北大学で「イーロン・マスク」の研究をしています。" 単語の意味も考慮されている?
- "東北大学でイマスクが研究をしています。"→"東北大学でイマスクの研究をしています。" サブワード?
- "東北大学でクが研究をしています。"→"東北大学でコンピューターが研究をしています。" それはちょっと待って。
- "東北大学で <extra_id_0> の研究をしています。"→"東北大学で化学の研究をしています。"
- "東北大学で <extra_id_0> が研究をしています。"→"東北大学で工学が研究をしています。" 工学さん。
- "吾輩は <extra_id_0> である。"→"吾輩は吾輩である。"、"答えは猫です。吾輩は <extra_id_0> である。"→"答えは猫です。吾輩は猫である。" 「は」を=とみなし演算をしているかのようなふるまい。
- "Aは11、Bは9。Aは <extra_id_0> 。Bは <extra_id_1ge: "ja"
---

Google's mt5-base fine-tuned in Japanese to solve error detection and correction.

#日本語誤り訂正

- "吾輩をは猫である。名前えはまだない。"→"吾輩は猫である。名前はまだない。"
- "-small" has been trained on 20,000 text pairs.
- prefix: "correction: " (notice: single task trained.)

##参考

- "東北大学でMASKが研究をしています。"→"東北大学でMASKの研究をしています。" ジム・キャリーを主語とした唯一のガ格が消された。易読化のために用いられる、主語と動詞を近づける記法は誤り扱い?
- "東北大学でマスクが研究をしています。"→"東北大学でマスクの研究をしています。"、"東北大学でイーロン・マスクが研究をしています。"→"東北大学でイーロン・マスクが研究をしています。"、"東北大学で「イーロン・マスク」が研究をしています。"→"東北大学で「イーロン・マスク」の研究をしています。" 単語の意味も考慮されている?
- "東北大学でイマスクが研究をしています。"→"東北大学でイマスクの研究をしています。" サブワード?
- "東北大学でクが研究をしています。"→"東北大学でコンピューターが研究をしています。" それはちょっと待って。
- "東北大学で <extra_id_0> の研究をしています。"→"東北大学で化学の研究をしています。"
- "東北大学で <extra_id_0> が研究をしています。"→"東北大学で工学が研究をしています。" 工学さん。
- "吾輩は <extra_id_0> である。"→"吾輩は吾輩である。"、"答えは猫です。吾輩は <extra_id_0> である。"→"答えは猫です。吾輩は猫である。" 「は」を=とみなし演算をしているかのようなふるまい。
- "Aは11、Bは9。Aは <extra_id_0> 。Bは <extra_id_1> 。"→"Aは11、Bは9。Aは11。Bは9。" 代入はできる。演算はできなかった。
**check in progress**