Spaces:

MaximilianChen
/

Casper

Sleeping

File size: 684 Bytes

9d3afd7
b004a55
3a6c9ee
 
c6c4c19
644d6d7
9d3afd7
36bd290
 
 
 
 
 
 
b004a55
36bd290
9d3afd7
36bd290
 
 
9d3afd7
36bd290
 
 
9d3afd7
36bd290

from transformers import pipeline
from transformers import  WhisperProcessor, WhisperForConditionalGeneration
import gradio as gr


asr = pipeline(model="MaximilianChen/Casper")

def transcribe_audio(mic=None, file=None):
    if mic is not None:
        audio = mic
    elif file is not None:
        audio = file
    else:
        return "You must either provide a mic recording or a file"
    transcription = asr(audio)["text"]
    return transcription


gr.Interface(
    fn=transcribe_audio,
    inputs=[
        gr.Audio(source="microphone", type="filepath", optional=True),
        gr.Audio(source="upload", type="filepath", optional=True),
    ],
    outputs="text",
).launch()