t5-base-japanese / README.md
sonoisa's picture
Add metadata
46b7a78
|
raw
history blame
No virus
857 Bytes
metadata
language: ja
tags:
  - t5
  - text2text-generation
  - seq2seq
license: cc-by-sa-3.0
datasets:
  - wikipedia
  - oscar

日本語T5事前学習済みモデル

This is a T5 (Text-to-Text Transfer Transformer) model pretrained on Japanese corpus.

次のコーパスを用いて事前学習を行ったT5 (Text-to-Text Transfer Transformer) モデルです。
このモデルは事前学習のみを行なったものであり、特定のタスクに利用するにはファインチューニングする必要があります。
事前学習には次のデータを用いました。

  • Wikipediaの日本語ダンプデータ (2020年7月6日時点のもの)
  • OSCARの日本語コーパス

ライセンス

CC-BY SA 3.0