lmqg
/

mt5-small-ruquad-qg-ae

@@ -21,12 +21,12 @@ widget:
   example_title: "Question Generation Example 2"
 - text: "generate question: Классическим примером международного синдиката XX века была группа компаний <hl> Де Бирс <hl> , которая в 1980-е годы контролировала до 90 % мировой торговли алмазами."
   example_title: "Question Generation Example 3"
-- text: "<hl> в английском языке в нарицательном смысле применяется термин rapid transit (скоростной городской транспорт), однако употребляется он только тогда, когда по смыслу невозможно ограничиться названием одной конкретной системы метрополитена. <hl> в остальных случаях используются индивидуальные названия: в лондоне — london underground, в нью-йорке — new york subway, в ливерпуле — merseyrail, в вашингтоне — washington metrorail, в сан-франциско — bart и т. п. в некоторых городах применяется название метро (англ. metro) для систем, по своему характеру близких к метро, или для всего городского транспорта (собственно метро и наземный пассажирский транспорт (в том числе автобусы и трамваи)) в совокупности."
   example_title: "Answer Extraction Example 1"
-- text: "Вопреки ожиданиям, объединение денежных систем республик не привело к уменьшению инфляции. Напротив, закдензнаки стали невероятно быстро обесцениваться, особенно в 1924 году. Для обеспечения денежного рынка приходилось увеличивать эмиссию закдензнаков и выпускать в оборот купюры невероятно больших номиналов. <hl> Так, в период с 1 января по 20 марта 1924 года были введены в оборот купюры достоинством 25 000 000 рублей, затем — 250 000 000 рублей. <hl> И, наконец, в апреле 1924 года были выпущены купюры миллиардного достоинства (в просторечии лимард)."
   example_title: "Answer Extraction Example 2"
 model-index:
-- name: lmqg/mt5-small-ruquad-multitask
   results:
   - task:
       name: Text2text Generation
@@ -36,63 +36,44 @@ model-index:
       type: default
       args: default
     metrics:
-    - name: BLEU4
-      type: bleu4
-      value: 0.18064142309448245
-    - name: ROUGE-L
-      type: rouge-l
-      value: 0.33780523556447417
-    - name: METEOR
-      type: meteor
-      value: 0.289216348958004
-    - name: BERTScore
-      type: bertscore
-      value: 0.8628808111702687
-    - name: MoverScore
-      type: moverscore
-      value: 0.6501855498621383
-    - name: QAAlignedF1Score (BERTScore)
-      type: qa_aligned_f1_score_bertscore
-      value: 0.7973821321725308
-    - name: QAAlignedRecall (BERTScore)
-      type: qa_aligned_recall_bertscore
-      value: 0.8383368717732346
-    - name: QAAlignedPrecision (BERTScore)
-      type: qa_aligned_precision_bertscore
-      value: 0.7615392588632003
-    - name: QAAlignedF1Score (MoverScore)
-      type: qa_aligned_f1_score_moverscore
-      value: 0.5668638524057164
-    - name: QAAlignedRecall (MoverScore)
-      type: qa_aligned_recall_moverscore
-      value: 0.5979098322311048
-    - name: QAAlignedPrecision (MoverScore)
-      type: qa_aligned_precision_moverscore
-      value: 0.5410917350743871
 ---
-# Model Card of `lmqg/mt5-small-ruquad-multitask`
-This model is fine-tuned version of [google/mt5-small](https://huggingface.co/google/mt5-small) for question generation task on the
-[lmqg/qg_ruquad](https://huggingface.co/datasets/lmqg/qg_ruquad) (dataset_name: default) via [`lmqg`](https://github.com/asahi417/lm-question-generation).
-This model is fine-tuned on the answer extraction task as well as the question generation.
-Please cite our paper if you use the model ([https://arxiv.org/abs/2210.03992](https://arxiv.org/abs/2210.03992)).
-```
-@inproceedings{ushio-etal-2022-generative,
-    title = "{G}enerative {L}anguage {M}odels for {P}aragraph-{L}evel {Q}uestion {G}eneration",
-    author = "Ushio, Asahi  and
-        Alva-Manchego, Fernando  and
-        Camacho-Collados, Jose",
-    booktitle = "Proceedings of the 2022 Conference on Empirical Methods in Natural Language Processing",
-    month = dec,
-    year = "2022",
-    address = "Abu Dhabi, U.A.E.",
-    publisher = "Association for Computational Linguistics",
-}
-```
 ### Overview
 - **Language model:** [google/mt5-small](https://huggingface.co/google/mt5-small)
@@ -105,44 +86,57 @@ Please cite our paper if you use the model ([https://arxiv.org/abs/2210.03992](h
 ### Usage
 - With [`lmqg`](https://github.com/asahi417/lm-question-generation#lmqg-language-model-for-question-generation-)
 ```python
 from lmqg import TransformersQG
 # initialize model
-model = TransformersQG(language='ru', model='lmqg/mt5-small-ruquad-multitask')
 # model prediction
-question_answer = model.generate_qa("Нелишним будет отметить, что, развивая это направление, Д. И. Менделеев, поначалу априорно выдвинув идею о температуре, при которой высота мениска будет нулевой, в мае 1860 года провёл серию опытов.")
 ```
 - With `transformers`
 ```python
 from transformers import pipeline
-# initialize model
-pipe = pipeline("text2text-generation", 'lmqg/mt5-small-ruquad-multitask')
 # answer extraction
-answer = pipe('extract answers: <hl> в английском языке в нарицательном смысле применяется термин rapid transit (скоростной городской транспорт), однако употребляется он только тогда, когда по смыслу невозможно ограничиться названием одной конкретной системы метрополитена. <hl> в остальных случаях используются индивидуальные названия: в лондоне — london underground, в нью-йорке — new york subway, в ливерпуле — merseyrail, в вашингтоне — washington metrorail, в сан-франциско — bart и т. п. в некоторых городах применяется название метро (англ. metro) для систем, по своему характеру близких к метро, или для всего городского транспорта (собственно метро и наземный пассажирский транспорт (в том числе автобусы и трамваи)) в совокупности.')
 # question generation
-question = pipe('generate question: Нелишним будет отметить, что, развивая это направление, Д. И. Менделеев, поначалу априорно выдвинув идею о температуре, при которой высота мениска будет нулевой, <hl> в мае 1860 года <hl> провёл серию опытов.')
 ```
-## Evaluation Metrics
-### Metrics
-| Dataset | Type | BLEU4 | ROUGE-L | METEOR | BERTScore | MoverScore | Link |
-|:--------|:-----|------:|--------:|-------:|----------:|-----------:|-----:|
-| [lmqg/qg_ruquad](https://huggingface.co/datasets/lmqg/qg_ruquad) | default | 0.181 | 0.338 | 0.289 | 0.863 | 0.65 | [link](https://huggingface.co/lmqg/mt5-small-ruquad-multitask/raw/main/eval/metric.first.sentence.paragraph_answer.question.lmqg_qg_ruquad.default.json) |
-### Metrics (QAG)
-| Dataset | Type | QA Aligned F1 Score (BERTScore) | QA Aligned F1 Score (MoverScore) | Link |
-|:--------|:-----|--------------------------------:|---------------------------------:|-----:|
-| [lmqg/qg_ruquad](https://huggingface.co/datasets/lmqg/qg_ruquad) | default | 0.797 | 0.567 | [link](https://huggingface.co/lmqg/mt5-small-ruquad-multitask/raw/main/eval/metric.first.answer.paragraph.questions_answers.lmqg_qg_ruquad.default.json) |
@@ -165,11 +159,10 @@ The following hyperparameters were used during fine-tuning:
  - gradient_accumulation_steps: 4
  - label_smoothing: 0.15
-The full configuration can be found at [fine-tuning config file](https://huggingface.co/lmqg/mt5-small-ruquad-multitask/raw/main/trainer_config.json).
 ## Citation
 ```
 @inproceedings{ushio-etal-2022-generative,
     title = "{G}enerative {L}anguage {M}odels for {P}aragraph-{L}evel {Q}uestion {G}eneration",
     author = "Ushio, Asahi  and

   example_title: "Question Generation Example 2"
 - text: "generate question: Классическим примером международного синдиката XX века была группа компаний <hl> Де Бирс <hl> , которая в 1980-е годы контролировала до 90 % мировой торговли алмазами."
   example_title: "Question Generation Example 3"
+- text: "extract answers: <hl> в английском языке в нарицательном смысле применяется термин rapid transit (скоростной городской транспорт), однако употребляется он только тогда, когда по смыслу невозможно ограничиться названием одной конкретной системы метрополитена. <hl> в остальных случаях используются индивидуальные названия: в лондоне — london underground, в нью-йорке — new york subway, в ливерпуле — merseyrail, в вашингтоне — washington metrorail, в сан-франциско — bart и т. п. в некоторых городах применяется название метро (англ. metro) для систем, по своему характеру близких к метро, или для всего городского транспорта (собственно метро и наземный пассажирский транспорт (в том числе автобусы и трамваи)) в совокупности."
   example_title: "Answer Extraction Example 1"
+- text: "extract answers: Вопреки ожиданиям, объединение денежных систем республик не привело к уменьшению инфляции. Напротив, закдензнаки стали невероятно быстро обесцениваться, особенно в 1924 году. Для обеспечения денежного рынка приходилось увеличивать эмиссию закдензнаков и выпускать в оборот купюры невероятно больших номиналов. <hl> Так, в период с 1 января по 20 марта 1924 года были введены в оборот купюры достоинством 25 000 000 рублей, затем — 250 000 000 рублей. <hl> И, наконец, в апреле 1924 года были выпущены купюры миллиардного достоинства (в просторечии лимард)."
   example_title: "Answer Extraction Example 2"
 model-index:
+- name: lmqg/mt5-small-ruquad-qg-ae
   results:
   - task:
       name: Text2text Generation
       type: default
       args: default
     metrics:
+    - name: BLEU4 (Question Generation)
+      type: bleu4_question_generation
+      value: 18.06
+    - name: ROUGE-L (Question Generation)
+      type: rouge_l_question_generation
+      value: 33.78
+    - name: METEOR (Question Generation)
+      type: meteor_question_generation
+      value: 28.92
+    - name: BERTScore (Question Generation)
+      type: bertscore_question_generation
+      value: 86.29
+    - name: MoverScore (Question Generation)
+      type: moverscore_question_generation
+      value: 65.02
+    - name: QAAlignedF1Score-BERTScore (Question & Answer Generation)
+      type: qa_aligned_f1_score_bertscore_question_answer_generation
+      value: 79.74
+    - name: QAAlignedRecall-BERTScore (Question & Answer Generation)
+      type: qa_aligned_recall_bertscore_question_answer_generation
+      value: 83.83
+    - name: QAAlignedPrecision-BERTScore (Question & Answer Generation)
+      type: qa_aligned_precision_bertscore_question_answer_generation
+      value: 76.15
+    - name: QAAlignedF1Score-MoverScore (Question & Answer Generation)
+      type: qa_aligned_f1_score_moverscore_question_answer_generation
+      value: 56.69
+    - name: QAAlignedRecall-MoverScore (Question & Answer Generation)
+      type: qa_aligned_recall_moverscore_question_answer_generation
+      value: 59.79
+    - name: QAAlignedPrecision-MoverScore (Question & Answer Generation)
+      type: qa_aligned_precision_moverscore_question_answer_generation
+      value: 54.11
 ---
+# Model Card of `lmqg/mt5-small-ruquad-qg-ae`
+This model is fine-tuned version of [google/mt5-small](https://huggingface.co/google/mt5-small) for question generation and answer extraction jointly on the [lmqg/qg_ruquad](https://huggingface.co/datasets/lmqg/qg_ruquad) (dataset_name: default) via [`lmqg`](https://github.com/asahi417/lm-question-generation).
 ### Overview
 - **Language model:** [google/mt5-small](https://huggingface.co/google/mt5-small)
 ### Usage
 - With [`lmqg`](https://github.com/asahi417/lm-question-generation#lmqg-language-model-for-question-generation-)
 ```python
 from lmqg import TransformersQG
 # initialize model
+model = TransformersQG(language="ru", model="lmqg/mt5-small-ruquad-qg-ae")
 # model prediction
+question_answer_pairs = model.generate_qa("Нелишним будет отметить, что, развивая это направление, Д. И. Менделеев, поначалу априорно выдвинув идею о температуре, при которой высота мениска будет нулевой, в мае 1860 года провёл серию опытов.")
 ```
 - With `transformers`
 ```python
 from transformers import pipeline
+pipe = pipeline("text2text-generation", "lmqg/mt5-small-ruquad-qg-ae")
 # answer extraction
+answer = pipe("generate question: Нелишним будет отметить, что, развивая это направление, Д. И. Менделеев, поначалу априорно выдвинув идею о температуре, при которой высота мениска будет нулевой, <hl> в мае 1860 года <hl> провёл серию опытов.")
 # question generation
+question = pipe("extract answers: <hl> в английском языке в нарицательном смысле применяется термин rapid transit (скоростной городской транспорт), однако употребляется он только тогда, когда по смыслу невозможно ограничиться названием одной конкретной системы метрополитена. <hl> в остальных случаях используются индивидуальные названия: в лондоне — london underground, в нью-йорке — new york subway, в ливерпуле — merseyrail, в вашингтоне — washington metrorail, в сан-франциско — bart и т. п. в некоторых городах применяется название метро (англ. metro) для систем, по своему характеру близких к метро, или для всего городского транспорта (собственно метро и наземный пассажирский транспорт (в том числе автобусы и трамваи)) в совокупности.")
 ```
+## Evaluation
+- ***Metric (Question Generation)***: [raw metric file](https://huggingface.co/lmqg/mt5-small-ruquad-qg-ae/raw/main/eval/metric.first.sentence.paragraph_answer.question.lmqg_qg_ruquad.default.json)
+|            |   Score | Type    | Dataset                                                          |
+|:-----------|--------:|:--------|:-----------------------------------------------------------------|
+| BERTScore  |   86.29 | default | [lmqg/qg_ruquad](https://huggingface.co/datasets/lmqg/qg_ruquad) |
+| Bleu_1     |   34.11 | default | [lmqg/qg_ruquad](https://huggingface.co/datasets/lmqg/qg_ruquad) |
+| Bleu_2     |   27.17 | default | [lmqg/qg_ruquad](https://huggingface.co/datasets/lmqg/qg_ruquad) |
+| Bleu_3     |   22.06 | default | [lmqg/qg_ruquad](https://huggingface.co/datasets/lmqg/qg_ruquad) |
+| Bleu_4     |   18.06 | default | [lmqg/qg_ruquad](https://huggingface.co/datasets/lmqg/qg_ruquad) |
+| METEOR     |   28.92 | default | [lmqg/qg_ruquad](https://huggingface.co/datasets/lmqg/qg_ruquad) |
+| MoverScore |   65.02 | default | [lmqg/qg_ruquad](https://huggingface.co/datasets/lmqg/qg_ruquad) |
+| ROUGE_L    |   33.78 | default | [lmqg/qg_ruquad](https://huggingface.co/datasets/lmqg/qg_ruquad) |
+- ***Metric (Question & Answer Generation)***:  [raw metric file](https://huggingface.co/lmqg/mt5-small-ruquad-qg-ae/raw/main/eval/metric.first.answer.paragraph.questions_answers.lmqg_qg_ruquad.default.json)
+|                                 |   Score | Type    | Dataset                                                          |
+|:--------------------------------|--------:|:--------|:-----------------------------------------------------------------|
+| QAAlignedF1Score (BERTScore)    |   79.74 | default | [lmqg/qg_ruquad](https://huggingface.co/datasets/lmqg/qg_ruquad) |
+| QAAlignedF1Score (MoverScore)   |   56.69 | default | [lmqg/qg_ruquad](https://huggingface.co/datasets/lmqg/qg_ruquad) |
+| QAAlignedPrecision (BERTScore)  |   76.15 | default | [lmqg/qg_ruquad](https://huggingface.co/datasets/lmqg/qg_ruquad) |
+| QAAlignedPrecision (MoverScore) |   54.11 | default | [lmqg/qg_ruquad](https://huggingface.co/datasets/lmqg/qg_ruquad) |
+| QAAlignedRecall (BERTScore)     |   83.83 | default | [lmqg/qg_ruquad](https://huggingface.co/datasets/lmqg/qg_ruquad) |
+| QAAlignedRecall (MoverScore)    |   59.79 | default | [lmqg/qg_ruquad](https://huggingface.co/datasets/lmqg/qg_ruquad) |
  - gradient_accumulation_steps: 4
  - label_smoothing: 0.15
+The full configuration can be found at [fine-tuning config file](https://huggingface.co/lmqg/mt5-small-ruquad-qg-ae/raw/main/trainer_config.json).
 ## Citation
 ```
 @inproceedings{ushio-etal-2022-generative,
     title = "{G}enerative {L}anguage {M}odels for {P}aragraph-{L}evel {Q}uestion {G}eneration",
     author = "Ushio, Asahi  and