lincoln
/

mbart-mlsum-automatic-summarization

text2text-generation

Inference Endpoints

Model card Files Files and versions Community

ahm commited on Sep 7, 2021

Commit

87bc1c2

•

1 Parent(s): f3f350d

updating model card

Files changed (2) hide show

README.md +19 -1
assets/novelty.png +0 -0

README.md CHANGED Viewed

@@ -18,7 +18,25 @@ tags:
 - bart
 ---
-# TODO
 ## Utilisation

 - bart
 ---
+# Résumé automatique d'article de presses
+Ce modèles est basé sur le modèle [`facebook/mbart-large-50`](https://huggingface.co/facebook/mbart-large-50) et été fine-tuné en utilisant des articles de presse issus de la base de données MLSUM. L'hypothèse à été faite que les chapeau des articles faisaient de bon résumé.
+## Entrainement
+Nous avons testé deux architecture de modèles (T5 et BART) avec des textes en entrée de 512 ou 1024 tokens. Finallement c'est le modèle BART avec 512 tokens qui à été retenu.
+Il a été entrainé sur 2 epochs (~700K articles) sur une Tesla V100 (32 heures d'entrainement).
+## Résultats
+![Score de novelty](assets/novelty.png)
+Nous avons comparé notre modèle à deux références:
+ * MBERT qui correspond aux performances du modèle entrainé par l'équipe à l'origine de la base d'articles MLSUM
+ * Barthez qui est un autre modèle basé sur des articles de presses issus de la base de données OrangeSum
+ On voit que le score de novelty (cf papier MLSUM) de notre modèle n'est pas encore comparable à ces deux références et encore moins à une production humaine néanmoins les résumés générés sont dans l'ensemble de bonne qualité.
 ## Utilisation

assets/novelty.png ADDED Viewed