Spaces:

jpdiazpardo
/

jpdiazpardo-whisper-tiny-metal

Runtime error

jpdiazpardo commited on Jul 14, 2023

Commit

accb4e2

•

1 Parent(s): 7034aab

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -19,36 +19,38 @@ def transcribe(file, task, return_timestamps):
     outputs = pipe(file, batch_size=BATCH_SIZE, generate_kwargs={"task": task}, return_timestamps=True)
     text = outputs["text"]
     timestamps = outputs["chunks"]
     if return_timestamps==True:
       timestamps = [f"[{format_timestamp(chunk['timestamp'][0])} -> {format_timestamp(chunk['timestamp'][1])}] {chunk['text']}" for chunk in timestamps]
     else:
       timestamps = [f"{chunk['text']}" for chunk in timestamps]
-    text = "\n".join(str(feature) for feature in timestamps)
-    return text
 file_transcribe = gr.Interface(
     fn=transcribe,
     inputs=[
-        gr.inputs.Audio(source="upload", optional=True, label="Audio file", type="filepath"),
-        gr.inputs.Radio(["transcribe"], label="Task", default="transcribe"),
-        gr.inputs.Checkbox(default=False, label="Return timestamps"),
     ],
-    outputs="text",
-    layout="horizontal",
-    theme="huggingface",
     title="Whisper Demo: Transcribe Audio",
     description=(
         "Transcribe long-form microphone or audio inputs with the click of a button! Demo uses the"
         f" checkpoint [{MODEL_NAME}](https://huggingface.co/{MODEL_NAME}) and 🤗 Transformers to transcribe audio files"
         " of arbitrary length."
     ),
     cache_examples=True,
     allow_flagging="never",
 )
-file_transcribe.launch(enable_queue=True, debug = True)

     outputs = pipe(file, batch_size=BATCH_SIZE, generate_kwargs={"task": task}, return_timestamps=True)
     text = outputs["text"]
     timestamps = outputs["chunks"]
     if return_timestamps==True:
       timestamps = [f"[{format_timestamp(chunk['timestamp'][0])} -> {format_timestamp(chunk['timestamp'][1])}] {chunk['text']}" for chunk in timestamps]
     else:
       timestamps = [f"{chunk['text']}" for chunk in timestamps]
+    text = "<br>".join(str(feature) for feature in timestamps)
+    text = f"<h4>Transcription</h4><div style='overflow-y: scroll; height: 400px;'>{text}</div>"
+    return file, text
 file_transcribe = gr.Interface(
     fn=transcribe,
     inputs=[
+        gr.Audio(source="upload", label="Audio file", type="filepath"),
+        gr.Radio(["transcribe"], label="Task", value="transcribe"),
+        gr.Checkbox(value=True, label="Return timestamps"),
     ],
+    outputs= [gr.Audio(label="Processed Audio", type="filepath"),
+        gr.outputs.HTML("text")
+        ],
     title="Whisper Demo: Transcribe Audio",
     description=(
         "Transcribe long-form microphone or audio inputs with the click of a button! Demo uses the"
         f" checkpoint [{MODEL_NAME}](https://huggingface.co/{MODEL_NAME}) and 🤗 Transformers to transcribe audio files"
         " of arbitrary length."
     ),
     cache_examples=True,
     allow_flagging="never",
 )
+file_transcribe.queue(concurrency_count=3)
+file_transcribe.launch(share=True, debug = True)