Spaces:

Chemsseddine
/

summarisation

Sleeping

App Files Files Community

Chemsseddine commited on Jun 24, 2022

Commit

7643074

1 Parent(s): 5d366da

Update app.py

Browse files

Files changed (1) hide show

app.py +23 -7

app.py CHANGED Viewed

@@ -2,19 +2,23 @@ from transformers import RobertaTokenizerFast, EncoderDecoderModel
 import torch
 #initialisation de tokenizer
 device = "cuda" if torch.cuda.is_available() else "cpu"
-tokenizer = RobertaTokenizerFast.from_pretrained("Chemsseddine/bert2gpt2SUMM-finetuned-mlsum-finetuned-mlorange_sum")
 #aider les token special
 tokenizer.bos_token = tokenizer.cls_token
 tokenizer.eos_token = tokenizer.sep_token
 #initialisation du modele
-model = EncoderDecoderModel.from_pretrained("Chemsseddine/bert2gpt2SUMM-finetuned-mlsum-finetuned-mlorange_sum").to(device)
 #tf.random.set_seed(0)
 # generate summary
 def generateSumm(input_texte,max,min):
   # encoder le texte entrée
-  input_ids = tokenizer.encode(input_texte, return_tensors='pt')
-  #generation de resume a l'aide de texte encodé
-  summary_ids = model.generate(input_ids,#le texte encodé
             max_length=max,#la longuer maximale du sequence de sortie
             min_length=min,#la longuer minimum du sequence de sortie
@@ -30,8 +34,20 @@ def generateSumm(input_texte,max,min):
             top_k = 50,
             top_p = 0.95)
   #decodé la sequence de generé par le modele
-  summary_text = tokenizer.decode(summary_ids[0], skip_special_tokens=True)
-  return summary_text
 from difflib import Differ
 import gradio as gr

 import torch
 #initialisation de tokenizer
 device = "cuda" if torch.cuda.is_available() else "cpu"
+tokenizer = RobertaTokenizerFast.from_pretrained("Chemsseddine/bert2gpt2SUMM-finetuned-mlsum")
 #aider les token special
 tokenizer.bos_token = tokenizer.cls_token
 tokenizer.eos_token = tokenizer.sep_token
 #initialisation du modele
+model = EncoderDecoderModel.from_pretrained("Chemsseddine/bert2gpt2SUMM-finetuned-mlsum").to(device)
 #tf.random.set_seed(0)
 # generate summary
 def generateSumm(input_texte,max,min):
   # encoder le texte entrée
+  if input_texte and input_texte.strip():
+    if min<len(input_texte):
+      if max>min:
+        input_ids = tokenizer.encode(input_texte, return_tensors='pt')
+    #generation de resume a l'aide de texte encodé
+        summary_ids = model.generate(input_ids,#le texte encodé
             max_length=max,#la longuer maximale du sequence de sortie
             min_length=min,#la longuer minimum du sequence de sortie
             top_k = 50,
             top_p = 0.95)
   #decodé la sequence de generé par le modele
+        summary_text = tokenizer.decode(summary_ids[0], skip_special_tokens=True)
+        return summary_text
+      else:
+        summary_text="La longueur minimale est grande que la maximale"
+        return summary_text
+    else:
+      summary_text="La longueur de texte entré est inferieur que la minimale que vous avez choisis"
+      return summary_text
+  else :
+    summary_text="Entrer votre Texte S'il vous plait"
+    return summary_text
 from difflib import Differ
 import gradio as gr