Add evaluation results on samsum dataset

Beep boop, I am a bot from Hugging Face's automatic model evaluator 👋!\
Your model has been evaluated on the [samsum](https://huggingface.co/datasets/samsum) dataset by

@lewtun

, using the predictions stored [here](https://huggingface.co/datasets/autoevaluate/autoeval-staging-eval-project-6fbfec76-7855041).\
Accept this pull request to see the results displayed on the [Hub leaderboard](https://huggingface.co/spaces/autoevaluate/leaderboards?dataset=samsum).\
Evaluate your model on more datasets [here](https://huggingface.co/spaces/autoevaluate/model-evaluator?dataset=samsum).

Files changed (1) hide show

README.md +58 -34

README.md CHANGED Viewed

@@ -8,48 +8,72 @@ license: apache-2.0
 datasets:
 - samsum
 widget:
-- text: |
-    Hannah: Hey, do you have Betty's number?
-    Amanda: Lemme check
-    Amanda: Sorry, can't find it.
-    Amanda: Ask Larry
-    Amanda: He called her last time we were at the park together
-    Hannah: I don't know him well
-    Amanda: Don't be shy, he's very nice
-    Hannah: If you say so..
-    Hannah: I'd rather you texted him
-    Amanda: Just text him 🙂
-    Hannah: Urgh.. Alright
-    Hannah: Bye
-    Amanda: Bye bye
 model-index:
 - name: bart-large-xsum-samsum
   results:
-  - task:
       name: Abstractive Text Summarization
       type: abstractive-text-summarization
     dataset:
-      name: "SAMSum Corpus: A Human-annotated Dialogue Dataset for Abstractive Summarization"
       type: samsum
     metrics:
-       - name: Validation ROGUE-1
-         type: rogue-1
-         value: 54.3921
-       - name: Validation ROGUE-2
-         type: rogue-2
-         value: 29.8078
-       - name: Validation ROGUE-L
-         type: rogue-l
-         value: 45.1543
-       - name: Test ROGUE-1
-         type: rogue-1
-         value: 53.3059
-       - name: Test ROGUE-2
-         type: rogue-2
-         value: 28.355
-       - name: Test ROGUE-L
-         type: rogue-l
-         value: 44.0953
 ---
 ## `bart-large-xsum-samsum`
 This model was obtained by fine-tuning `facebook/bart-large-xsum` on [Samsum](https://huggingface.co/datasets/samsum) dataset.

 datasets:
 - samsum
 widget:
+- text: "Hannah: Hey, do you have Betty's number?\nAmanda: Lemme check\nAmanda: Sorry,\
+    \ can't find it.\nAmanda: Ask Larry\nAmanda: He called her last time we were at\
+    \ the park together\nHannah: I don't know him well\nAmanda: Don't be shy, he's\
+    \ very nice\nHannah: If you say so..\nHannah: I'd rather you texted him\nAmanda:\
+    \ Just text him \U0001F642\nHannah: Urgh.. Alright\nHannah: Bye\nAmanda: Bye bye\n"
 model-index:
 - name: bart-large-xsum-samsum
   results:
+  - task:
       name: Abstractive Text Summarization
       type: abstractive-text-summarization
     dataset:
+      name: 'SAMSum Corpus: A Human-annotated Dialogue Dataset for Abstractive Summarization'
       type: samsum
     metrics:
+    - name: Validation ROGUE-1
+      type: rogue-1
+      value: 54.3921
+    - name: Validation ROGUE-2
+      type: rogue-2
+      value: 29.8078
+    - name: Validation ROGUE-L
+      type: rogue-l
+      value: 45.1543
+    - name: Test ROGUE-1
+      type: rogue-1
+      value: 53.3059
+    - name: Test ROGUE-2
+      type: rogue-2
+      value: 28.355
+    - name: Test ROGUE-L
+      type: rogue-l
+      value: 44.0953
+  - task:
+      type: summarization
+      name: Summarization
+    dataset:
+      name: samsum
+      type: samsum
+      config: samsum
+      split: test
+    metrics:
+    - name: ROUGE-1
+      type: rouge
+      value: 46.4965
+      verified: true
+    - name: ROUGE-2
+      type: rouge
+      value: 20.7785
+      verified: true
+    - name: ROUGE-L
+      type: rouge
+      value: 37.378
+      verified: true
+    - name: ROUGE-LSUM
+      type: rouge
+      value: 42.0645
+      verified: true
+    - name: loss
+      type: loss
+      value: 1.6920803785324097
+      verified: true
+    - name: gen_len
+      type: gen_len
+      value: 23.6911
+      verified: true
 ---
 ## `bart-large-xsum-samsum`
 This model was obtained by fine-tuning `facebook/bart-large-xsum` on [Samsum](https://huggingface.co/datasets/samsum) dataset.