# # from speechbrain.inference.ASR import EncoderASR # # import gradio as gr # # model = EncoderASR.from_hparams("speechbrain/asr-wav2vec2-dvoice-wolof") # # def transcribe(audio): # # return model.transcribe_file(audio.name) # # demo = gr.Interface(fn=transcribe, inputs="file", outputs="text", # # title="Transcription automatique du wolof", # # description="Ce modèle transcrit un fichier audio en wolof en texte en utilisant l'alphabet latin.", # # input_label="Audio en wolof", # # output_label="Transcription alphabet latin" # # ) # # demo.launch() from speechbrain.inference.ASR import EncoderASR import gradio as gr import numpy as np # Charger le modèle pré-entraîné model = EncoderASR.from_hparams("speechbrain/asr-wav2vec2-dvoice-wolof") # Définir la fonction de transcription def transcribe(audio): sr, y = audio y = y.astype(np.float32) y /= np.max(np.abs(y)) # Utiliser le modèle pour transcrire l'audio return model.transcribe({"sampling_rate": sr, "raw": y})["text"] # Créer l'interface Gradio avec le microphone et le téléchargement de fichier comme options d'entrée asrdemo = gr.Interface( title="Transcription audio en wolof latin by Papa Sega", fn=transcribe, inputs=gr.Audio(sources=["microphone", "upload"]), outputs="text", ) # Lancer l'application Gradio asrdemo.launch()