Spaces:
Sleeping
Sleeping
File size: 945 Bytes
c774838 cc130eb 8c530de 21e01d6 6f8abd8 21e01d6 cc130eb 2af9ecc 21e01d6 cc130eb c774838 |
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 |
import gradio as gr
from transformers import pipeline
pipe = pipeline("automatic-speech-recognition",model="LudvigDoeser/swedish_asr_model_training") # change to "your-username/the-name-you-picked"
description = """
<center><img src="https://raw.githubusercontent.com/ludvigdoeser/ML_transformers/main/images/voice_search.png" width=400px></center>
Taligenkänning är ett program som översätter tal till text. Det innebär att du kan använda din röst för att producera text istället för att skriva med tangentbordet! Testa här genom att starta inspelningen. När du pratat klart, tryck på avsluta inspelning och sen 'submit'.
"""
def transcribe(audio):
text = pipe(audio)["text"]
return text
iface = gr.Interface(
fn=transcribe,
inputs=gr.Audio(source="microphone", type="filepath"),
outputs="text",
title="Svensk Taligenkänning baserad på Whisper Model",
description=description,
)
iface.launch()
|