Spaces:

Geethanjali
/

YouTube_Transcript_Summarizer

Runtime error

App Files Files

xet

Community

Geethanjali commited on Jul 19, 2022

Commit

a6534c8

1 Parent(s): ba5a468

Update app.py

Browse files

Files changed (1) hide show

app.py +23 -8

app.py CHANGED Viewed

@@ -1,7 +1,10 @@
 from transformers import pipeline
 from youtube_transcript_api import YouTubeTranscriptApi
 import gradio as gr
-from gradio.mix import Series
 def summarize_transcript(url):
     video_id = url.split("=")[1]
@@ -11,7 +14,6 @@ def summarize_transcript(url):
     result = ""
     for i in transcript:
         result += ' ' + i['text']
-    print(len(result))
     summarizer = pipeline('summarization')
@@ -21,22 +23,35 @@ def summarize_transcript(url):
       start = 0
       start = i * 1000
       end = (i + 1) * 1000
-      print("input text \n" + result[start:end])
       out = summarizer(result[start:end])
       out = out[0]
       out = out['summary_text']
-      print("Summarized text\n"+out)
       summarized_text.append(out)
       summ = str(summarized_text)
       print(summ)
-    return summ
 gradio_ui = gr.Interface(fn = summarize_transcript,
-                  inputs = gr.inputs.Textbox(label = "Enter the YouTube URL below:"),
-                  outputs = gr.outputs.Textbox(label = "Transcript Summary"),
                   title = "YouTube Transcript Summarizer",
                   theme = "grass",
-                  description = "Here You can see the summary of the you tube video you want to watch")
 gradio_ui.launch(inline = False)

 from transformers import pipeline
 from youtube_transcript_api import YouTubeTranscriptApi
+from keybert import KeyBERT
 import gradio as gr
+from keyphrase_vectorizers import KeyphraseCountVectorizer
+import requests
+from bs4 import BeautifulSoup
 def summarize_transcript(url):
     video_id = url.split("=")[1]
     result = ""
     for i in transcript:
         result += ' ' + i['text']
     summarizer = pipeline('summarization')
       start = 0
       start = i * 1000
       end = (i + 1) * 1000
       out = summarizer(result[start:end])
       out = out[0]
       out = out['summary_text']
       summarized_text.append(out)
       summ = str(summarized_text)
       print(summ)
+      #keywords
+      words = []
+      kw_model = KeyBERT()
+      keywords = kw_model.extract_keywords(summ)
+      w = kw_model.extract_keywords(summ, vectorizer=KeyphraseCountVectorizer())
+      for s in w:
+        words.append(s[0])
+      #tags
+      request = requests.get(url)
+      html = BeautifulSoup(request.content,"html.parser")
+      tags = html.find_all("meta",property = "og:video:tag")
+      lst = []
+      for tag in tags:
+        lst.append(tag['content'])
+    return (summ,words,lst)
 gradio_ui = gr.Interface(fn = summarize_transcript,
+                  inputs = [gr.inputs.Textbox(label = "Enter the YouTube URL below:")],
+                  outputs = [gr.outputs.Textbox(label = "Transcript Summary"),gr.outputs.Textbox(label = "Keywords"),gr.outputs.Textbox(label = "Hash Tags")],
                   title = "YouTube Transcript Summarizer",
                   theme = "grass",
+                  description = "Here You can see the SUMMARY,KEYWORDS and HASHTAGS of the YouTube video you want to watch")
 gradio_ui.launch(inline = False)