Add evaluation results on the default config of xsum

Beep boop, I am a bot from Hugging Face's automatic model evaluator 👋!\
Your model has been evaluated on the default config of the [xsum](https://huggingface.co/datasets/xsum) dataset by

@sysresearch101

, using the predictions stored [here](https://huggingface.co/datasets/autoevaluate/autoeval-staging-eval-project-xsum-d7ddcd7b-12845710).\
Accept this pull request to see the results displayed on the [Hub leaderboard](https://huggingface.co/spaces/autoevaluate/leaderboards?dataset=xsum).\
Evaluate your model on more datasets [here](https://huggingface.co/spaces/autoevaluate/model-evaluator?dataset=xsum).

Files changed (1) hide show

README.md +34 -1

README.md CHANGED Viewed

@@ -14,7 +14,7 @@ model-index:
       type: summarization
       name: Summarization
     dataset:
-      name: xsum & cnn_dailymail
       type: xsum & cnn_dailymail
       config: 3.0.0
       split: train
@@ -43,6 +43,39 @@ model-index:
       type: gen_len
       value: <TODO>
       verified: true
 ---
 # T5-large Summarization Model Trained on the combined XSUM-CNN Daily Mail Dataset

       type: summarization
       name: Summarization
     dataset:
+      name: xsum & cnn_dailymail
       type: xsum & cnn_dailymail
       config: 3.0.0
       split: train
       type: gen_len
       value: <TODO>
       verified: true
+  - task:
+      type: summarization
+      name: Summarization
+    dataset:
+      name: xsum
+      type: xsum
+      config: default
+      split: test
+    metrics:
+    - name: ROUGE-1
+      type: rouge
+      value: 36.7656
+      verified: true
+    - name: ROUGE-2
+      type: rouge
+      value: 14.6898
+      verified: true
+    - name: ROUGE-L
+      type: rouge
+      value: 30.0646
+      verified: true
+    - name: ROUGE-LSUM
+      type: rouge
+      value: 30.0563
+      verified: true
+    - name: loss
+      type: loss
+      value: 1.6373405456542969
+      verified: true
+    - name: gen_len
+      type: gen_len
+      value: 18.6054
+      verified: true
 ---
 # T5-large Summarization Model Trained on the combined XSUM-CNN Daily Mail Dataset