Spaces:

minnehwg
/

youtube-summarizer

Running

minnehwg commited on Jun 3

Commit

f319a7d

•

1 Parent(s): 9a1b6f5

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -1,8 +1,8 @@
-from util import load_model
-from util import pipeline
 import gradio as gr
-cp_aug = 'minnehwg/finetune-newwiki-summarization-ver-augmented2'
 def get_model(cp):
@@ -11,10 +11,26 @@ def get_model(cp):
     return tokenizer, model
 tokenizer, model = get_model(cp_aug)
 def generate_summary(url):
-    results = pipeline(url, model, tokenizer)
     summary = "\n".join(results)
     return summary

+from util import *
 import gradio as gr
+from deepmultilingualpunctuation import PunctuationModel
+cp_aug = 'minnehwg/finetune-newwiki-summarization-ver-augmented'
 def get_model(cp):
     return tokenizer, model
 tokenizer, model = get_model(cp_aug)
+restore_model = PunctuationModel()
+def execute_func(url, model, tokenizer, punc_model):
+    trans, sub = get_subtitles(url)
+    sub = restore_punctuation(sub, punc_model)
+    vie_sub = translate_long(sub)
+    vie_sub = processed(vie_sub)
+    chunks = split_into_chunks(vie_sub, 700, 2)
+    sum_para = []
+    for i in chunks:
+        tmp = summarize(i, model, tokenizer, num_beams=3)
+        sum_para.append(tmp)
+    suma = ''.join(sum_para)
+    del sub, vie_sub, sum_para, chunks
+    suma = post_processing(suma)
+    re = display(suma)
+    return re
 def generate_summary(url):
+    results = execute_func(url, model, tokenizer, restore_model)
     summary = "\n".join(results)
     return summary