youtube-whisper-04

Sleeping

App Files Files Community

lanbogao

kazuk commited on Mar 27, 2023

Commit

9127a22

•

0 Parent(s):

Duplicate from kazuk/youtube-whisper-04

Browse files

Co-authored-by: Kazuki Nakayashiki <kazuk@users.noreply.huggingface.co>

Files changed (4) hide show

.gitattributes +34 -0
README.md +14 -0
app.py +66 -0
requirements.txt +3 -0

.gitattributes ADDED Viewed

	@@ -0,0 +1,34 @@

+*.7z filter=lfs diff=lfs merge=lfs -text
+*.arrow filter=lfs diff=lfs merge=lfs -text
+*.bin filter=lfs diff=lfs merge=lfs -text
+*.bz2 filter=lfs diff=lfs merge=lfs -text
+*.ckpt filter=lfs diff=lfs merge=lfs -text
+*.ftz filter=lfs diff=lfs merge=lfs -text
+*.gz filter=lfs diff=lfs merge=lfs -text
+*.h5 filter=lfs diff=lfs merge=lfs -text
+*.joblib filter=lfs diff=lfs merge=lfs -text
+*.lfs.* filter=lfs diff=lfs merge=lfs -text
+*.mlmodel filter=lfs diff=lfs merge=lfs -text
+*.model filter=lfs diff=lfs merge=lfs -text
+*.msgpack filter=lfs diff=lfs merge=lfs -text
+*.npy filter=lfs diff=lfs merge=lfs -text
+*.npz filter=lfs diff=lfs merge=lfs -text
+*.onnx filter=lfs diff=lfs merge=lfs -text
+*.ot filter=lfs diff=lfs merge=lfs -text
+*.parquet filter=lfs diff=lfs merge=lfs -text
+*.pb filter=lfs diff=lfs merge=lfs -text
+*.pickle filter=lfs diff=lfs merge=lfs -text
+*.pkl filter=lfs diff=lfs merge=lfs -text
+*.pt filter=lfs diff=lfs merge=lfs -text
+*.pth filter=lfs diff=lfs merge=lfs -text
+*.rar filter=lfs diff=lfs merge=lfs -text
+*.safetensors filter=lfs diff=lfs merge=lfs -text
+saved_model/**/* filter=lfs diff=lfs merge=lfs -text
+*.tar.* filter=lfs diff=lfs merge=lfs -text
+*.tflite filter=lfs diff=lfs merge=lfs -text
+*.tgz filter=lfs diff=lfs merge=lfs -text
+*.wasm filter=lfs diff=lfs merge=lfs -text
+*.xz filter=lfs diff=lfs merge=lfs -text
+*.zip filter=lfs diff=lfs merge=lfs -text
+*.zst filter=lfs diff=lfs merge=lfs -text
+*tfevents* filter=lfs diff=lfs merge=lfs -text

README.md ADDED Viewed

	@@ -0,0 +1,14 @@

+---
+title: Youtube Whisper
+emoji: ⚡
+colorFrom: green
+colorTo: red
+sdk: gradio
+sdk_version: 3.16.2
+app_file: app.py
+pinned: false
+license: unknown
+duplicated_from: kazuk/youtube-whisper-04
+---
+Check out the configuration reference at https://huggingface.co/docs/hub/spaces-config-reference

app.py ADDED Viewed

	@@ -0,0 +1,66 @@

+import gradio as gr
+import whisper
+from pytube import YouTube
+def get_audio(url):
+    yt = YouTube(url)
+    return yt.streams.filter(only_audio=True)[0].download(filename="tmp.mp4")
+def get_transcript(url, model_size, lang, format):
+    model = whisper.load_model(model_size)
+    if lang == "None":
+        lang = None
+    result = model.transcribe(get_audio(url), fp16=False, language=lang)
+    if format == "None":
+        return result["text"]
+    elif format == ".srt":
+        return format_to_srt(result["segments"])
+def format_to_srt(segments):
+    output = ""
+    for i, segment in enumerate(segments):
+        output += f"{i + 1}\n"
+        output += f"{format_timestamp(segment['start'])} --> {format_timestamp(segment['end'])}\n"
+        output += f"{segment['text']}\n\n"
+    return output
+def format_timestamp(t):
+    hh = t//3600
+    mm = (t - hh*3600)//60
+    ss = t - hh*3600 - mm*60
+    mi = (t - int(t))*1000
+    return f"{int(hh):02d}:{int(mm):02d}:{int(ss):02d},{int(mi):03d}"
+langs = ["None"] + sorted(list(whisper.tokenizer.LANGUAGES.values()))
+model_size = list(whisper._MODELS.keys())
+with gr.Blocks() as demo:
+    with gr.Row():
+        with gr.Column():
+            with gr.Row():
+                url = gr.Textbox(placeholder='Youtube video URL', label='URL')
+            with gr.Row():
+                model_size = gr.Dropdown(choices=model_size, value='tiny', label="Model")
+                lang = gr.Dropdown(choices=langs, value="None", label="Language (Optional)")
+                format = gr.Dropdown(choices=["None", ".srt"], value="None", label="Timestamps? (Optional)")
+            with gr.Row():
+                gr.Markdown("Larger models are more accurate, but slower. For 1min video, it'll take ~30s (tiny), ~1min (base), ~3min (small), ~5min (medium), etc.")
+                transcribe_btn = gr.Button('Transcribe')
+        with gr.Column():
+            outputs = gr.Textbox(placeholder='Transcription of the video', label='Transcription')
+    transcribe_btn.click(get_transcript, inputs=[url, model_size, lang, format], outputs=outputs)
+demo.launch(debug=True)

requirements.txt ADDED Viewed

	@@ -0,0 +1,3 @@

+transformers
+pytube
+git+https://github.com/openai/whisper.git