papasega's picture
Update app.py
fe9b085 verified
raw
history blame
1.53 kB
# # from speechbrain.inference.ASR import EncoderASR
# # import gradio as gr
# # model = EncoderASR.from_hparams("speechbrain/asr-wav2vec2-dvoice-wolof")
# # def transcribe(audio):
# # return model.transcribe_file(audio.name)
# # demo = gr.Interface(fn=transcribe, inputs="file", outputs="text",
# # title="Transcription automatique du wolof",
# # description="Ce modèle transcrit un fichier audio en wolof en texte en utilisant l'alphabet latin.",
# # input_label="Audio en wolof",
# # output_label="Transcription alphabet latin"
# # )
# # demo.launch()
from speechbrain.inference.ASR import EncoderASR
import gradio as gr
import numpy as np
# Charger le modèle pré-entraîné
model = EncoderASR.from_hparams("speechbrain/asr-wav2vec2-dvoice-wolof")
# # Définir la fonction de transcription
# def transcribe(audio):
# sr, y = audio
# y = y.astype(np.float32)
# y /= np.max(np.abs(y))
# # Utiliser le modèle pour transcrire l'audio
# return model.transcribe({"sampling_rate": sr, "raw": y})["text"]
def transcribe(audio):
return model.transcribe_file(audio.name)
# Créer l'interface Gradio avec le microphone et le téléchargement de fichier comme options d'entrée
asrdemo = gr.Interface(
title="Transcription audio en wolof latin by Papa Sega",
fn=transcribe,
inputs=gr.Audio(sources=["microphone", "upload"]),
outputs="text",
)
# Lancer l'application Gradio
asrdemo.launch()