sonoisa commited on
Commit
11cc901
1 Parent(s): d8dbb61

Add corpus size

Browse files
Files changed (1) hide show
  1. README.md +1 -1
README.md CHANGED
@@ -14,7 +14,7 @@ datasets:
14
 
15
  This is a T5 (Text-to-Text Transfer Transformer) model pretrained on Japanese corpus.
16
 
17
- 次の日本語コーパスを用いて事前学習を行ったT5 (Text-to-Text Transfer Transformer) モデルです。
18
 
19
  * [Wikipedia](https://ja.wikipedia.org)の日本語ダンプデータ (2020年7月6日時点のもの)
20
  * [mC4](https://github.com/allenai/allennlp/discussions/5056)の日本語コーパス(正確にはc4/multilingualのjaスプリット)
14
 
15
  This is a T5 (Text-to-Text Transfer Transformer) model pretrained on Japanese corpus.
16
 
17
+ 次の日本語コーパス(約890GB)を用いて事前学習を行ったT5 (Text-to-Text Transfer Transformer) モデルです。
18
 
19
  * [Wikipedia](https://ja.wikipedia.org)の日本語ダンプデータ (2020年7月6日時点のもの)
20
  * [mC4](https://github.com/allenai/allennlp/discussions/5056)の日本語コーパス(正確にはc4/multilingualのjaスプリット)