metadata

license: cc-by-4.0
metrics:
  - bleu4
  - meteor
  - rouge-l
  - bertscore
  - moverscore
language: ja
datasets:
  - lmqg/qg_jaquad
pipeline_tag: text2text-generation
tags:
  - question answering
widget:
  - text: >-
      question: 新型車両として6000系が構想されたのは、製造費用のほか、どんな費用を抑えるためだったの?, context:
      三多摩地区開発による沿線人口の増加、相模原線延伸による多摩ニュータウン乗り入れ、都営地下鉄10号線(現都営地下鉄新宿線、以下新宿線と表記する)乗入構想により、京王線の利用客増加が見込まれ、相当数の車両を準備する必要に迫られるなか、製造費用、保守費用を抑えた新型車両として6000系が構想された。新宿線建設に際してはすでに1号線(後の浅草線)を1,435mm軌間で開業させていた東京都は京成電鉄と1号線との乗り入れにあたり京成電鉄の路線を1,372mmから1,435mmに改軌させた事例や、1,372mm軌間の特殊性から運輸省(当時、2001年から国土交通省)と共に京王にも改軌を求めたが、改軌工事中の輸送力確保が困難なことを理由に改軌しないことで決着している。
    example_title: Question Answering Example 1
  - text: >-
      question: 1968年に開催されたオリンピックの名前は何ですか?, context:
      オリンピックが世界的大イベントに成長するに従って政治に左右されるようになると、1968年のメキシコシティ大会では黒人差別を訴える場と化し、1972年のミュンヘン大会ではアラブのゲリラによるイスラエル選手に対するテロ事件まで起きた(ミュンヘンオリンピック事件)。1976年のモントリオール大会になると、ニュージーランドのラグビーチームの南アフリカ遠征に反対してアフリカの諸国22ヶ国がボイコットを行った。そして、1980年のモスクワ大会ではソ連のアフガニスタン侵攻に反発したアメリカ・西ドイツ・日本などの西側諸国が相次いでボイコットを行った。1984年ロサンゼルス大会ではソ連と東側諸国が報復ボイコットを行ない、参加したのはソ連と対立していた中国とルーマニアだけだった。中でも、イラン革命後のイラン・イスラム共和国はモスクワとロサンゼルス双方のオリンピックをボイコットしている。オリンピックが巨大化するに従って財政負担の増大が大きな問題となり、1976年の夏季大会では大幅な赤字を出し、その後夏季・冬季とも立候補都市が1〜2都市だけという状態が続いた。
    example_title: Question Answering Example 2
model-index:
  - name: lmqg/mt5-small-jaquad-qa
    results:
      - task:
          name: Text2text Generation
          type: text2text-generation
        dataset:
          name: lmqg/qg_jaquad
          type: default
          args: default
        metrics:
          - name: BLEU4 (Question Answering)
            type: bleu4_question_answering
            value: 0
          - name: ROUGE-L (Question Answering)
            type: rouge_l_question_answering
            value: 63.77
          - name: METEOR (Question Answering)
            type: meteor_question_answering
            value: 49.75
          - name: BERTScore (Question Answering)
            type: bertscore_question_answering
            value: 96.29
          - name: MoverScore (Question Answering)
            type: moverscore_question_answering
            value: 88.92
          - name: AnswerF1Score (Question Answering)
            type: answer_f1_score__question_answering
            value: 65.7
          - name: AnswerExactMatch (Question Answering)
            type: answer_exact_match_question_answering
            value: 65.7

Model Card of `lmqg/mt5-small-jaquad-qa`

This model is fine-tuned version of google/mt5-small for question answering task on the lmqg/qg_jaquad (dataset_name: default) via lmqg.

Overview

Language model: google/mt5-small
Language: ja
Training data: lmqg/qg_jaquad (default)
Online Demo: https://autoqg.net/
Repository: https://github.com/asahi417/lm-question-generation
Paper: https://arxiv.org/abs/2210.03992

Usage

With lmqg

from lmqg import TransformersQG

# initialize model
model = TransformersQG(language="ja", model="lmqg/mt5-small-jaquad-qa")

# model prediction
answers = model.answer_q(list_question="新型車両として6000系が構想されたのは、製造費用のほか、どんな費用を抑えるためだったの?", list_context=" 三多摩地区開発による沿線人口の増加、相模原線延伸による多摩ニュータウン乗り入れ、都営地下鉄10号線(現都営地下鉄新宿線、以下新宿線と表記する)乗入構想により、京王線の利用客増加が見込まれ、相当数の車両を準備する必要に迫られるなか、製造費用、保守費用を抑えた新型車両として6000系が構想された。新宿線建設に際してはすでに1号線(後の浅草線)を1,435mm軌間で開業させていた東京都は京成電鉄と1号線との乗り入れにあたり京成電鉄の路線を1,372mmから1,435mmに改軌させた事例や、1,372mm軌間の特殊性から運輸省(当時、2001年から国土交通省)と共に京王にも改軌を求めたが、改軌工事中の輸送力確保が困難なことを理由に改軌しないことで決着している。")

With transformers

from transformers import pipeline

pipe = pipeline("text2text-generation", "lmqg/mt5-small-jaquad-qa")
output = pipe("question: 新型車両として6000系が構想されたのは、製造費用のほか、どんな費用を抑えるためだったの?, context: 三多摩地区開発による沿線人口の増加、相模原線延伸による多摩ニュータウン乗り入れ、都営地下鉄10号線(現都営地下鉄新宿線、以下新宿線と表記する)乗入構想により、京王線の利用客増加が見込まれ、相当数の車両を準備する必要に迫られるなか、製造費用、保守費用を抑えた新型車両として6000系が構想された。新宿線建設に際してはすでに1号線(後の浅草線)を1,435mm軌間で開業させていた東京都は京成電鉄と1号線との乗り入れにあたり京成電鉄の路線を1,372mmから1,435mmに改軌させた事例や、1,372mm軌間の特殊性から運輸省(当時、2001年から国土交通省)と共に京王にも改軌を求めたが、改軌工事中の輸送力確保が困難なことを理由に改軌しないことで決着している。")

Evaluation

Metric (Question Answering): raw metric file

	Score	Type	Dataset
AnswerExactMatch	65.7	default	lmqg/qg_jaquad
AnswerF1Score	65.7	default	lmqg/qg_jaquad
BERTScore	96.29	default	lmqg/qg_jaquad
Bleu_1	61.42	default	lmqg/qg_jaquad
Bleu_2	0	default	lmqg/qg_jaquad
Bleu_3	0	default	lmqg/qg_jaquad
Bleu_4	0	default	lmqg/qg_jaquad
METEOR	49.75	default	lmqg/qg_jaquad
MoverScore	88.92	default	lmqg/qg_jaquad
ROUGE_L	63.77	default	lmqg/qg_jaquad

Training hyperparameters

The following hyperparameters were used during fine-tuning:

dataset_path: lmqg/qg_jaquad
dataset_name: default
input_types: ['paragraph_question']
output_types: ['answer']
prefix_types: None
model: google/mt5-small
max_length: 512
max_length_output: 32
epoch: 14
batch: 16
lr: 0.0006
fp16: False
random_seed: 1
gradient_accumulation_steps: 4
label_smoothing: 0.15

The full configuration can be found at fine-tuning config file.

Citation

@inproceedings{ushio-etal-2022-generative,
    title = "{G}enerative {L}anguage {M}odels for {P}aragraph-{L}evel {Q}uestion {G}eneration",
    author = "Ushio, Asahi  and
        Alva-Manchego, Fernando  and
        Camacho-Collados, Jose",
    booktitle = "Proceedings of the 2022 Conference on Empirical Methods in Natural Language Processing",
    month = dec,
    year = "2022",
    address = "Abu Dhabi, U.A.E.",
    publisher = "Association for Computational Linguistics",
}