ytdlp-whisper

Sleeping

App Files Files Community

lanbogao commited on Apr 3, 2023

Commit

d839cfe

•

1 Parent(s): 0aaeff7

Update app.py

Browse files

Files changed (1) hide show

app.py +50 -5

app.py CHANGED Viewed

@@ -1,19 +1,67 @@
 import gradio as gr
 import whisper
 from pytube import YouTube
 def get_audio(url):
     yt = YouTube(url)
     return yt.streams.filter(only_audio=True)[0].download(filename="tmp.mp4")
 def get_transcript(url, model_size, lang, format):
     model = whisper.load_model(model_size)
     if lang == "None":
         lang = None
-    result = model.transcribe(get_audio(url), fp16=False, language=lang)
     if format == "None":
         return result["text"]
@@ -36,9 +84,6 @@ def format_timestamp(t):
     return f"{int(hh):02d}:{int(mm):02d}:{int(ss):02d},{int(mi):03d}"
-langs = ["None"] + sorted(list(whisper.tokenizer.LANGUAGES.values()))
-model_size = list(whisper._MODELS.keys())
 with gr.Blocks() as demo:
     with gr.Row():

 import gradio as gr
 import whisper
 from pytube import YouTube
+from fastapi import FastAPI, Response, Request
+import yt_dlp
+langs = ["None"] + sorted(list(whisper.tokenizer.LANGUAGES.values()))
+model_size = list(whisper._MODELS.keys())
+def get_subtitles(url， langs=['en']):
+    # Download subtitles if available
+    ydl_opts = {
+        'writesubtitles': True,
+        'outtmpl': '%(id)s.%(ext)s',
+        'subtitleslangs': langs,
+        'skip_download': True,
+    }
+    with yt_dlp.YoutubeDL(ydl_opts) as ydl:
+        info_dict = ydl.extract_info(url, download=False)
+        subtitles = result.get("subtitles")
+        if subtitles and len(subtitles):
+            return subtitles
+    return None
+def download_audio(video_url, quality: str = '128', speed: float = None):
+    ydl_opts = {
+        'format': 'bestaudio/best',
+        'outtmpl': '%(title)s.%(ext)s',
+        'quiet': True,
+        'postprocessors': [{
+            'key': 'FFmpegExtractAudio',
+            'preferredcodec': 'mp3', #'opus',
+            'preferredquality': quality,
+        }]
+    }
+    if speed:
+        ydl_opts['postprocessors'].append({
+            'key': 'FFmpegFilter',
+            'filter_complex': f"atempo={speed}"
+        })
+    with yt_dlp.YoutubeDL(ydl_opts) as ydl:
+        ydl.download([video_url])
+        audio_file = ydl.prepare_filename(ydl.extract_info(video_url, download=False))
+        return audio_file
 def get_audio(url):
     yt = YouTube(url)
     return yt.streams.filter(only_audio=True)[0].download(filename="tmp.mp4")
 def get_transcript(url, model_size, lang, format):
+    subtitles = get_subtitles(url, langs)
+    if(subtitles){
+        print(subtitles)
+        return subtitles.get(lang)
+    }
     model = whisper.load_model(model_size)
     if lang == "None":
         lang = None
+    result = model.transcribe(download_audio(url), fp16=False, language=lang)
     if format == "None":
         return result["text"]
     return f"{int(hh):02d}:{int(mm):02d}:{int(ss):02d},{int(mi):03d}"
 with gr.Blocks() as demo:
     with gr.Row():