Spaces:
Sleeping
Sleeping
# # from speechbrain.inference.ASR import EncoderASR | |
# # import gradio as gr | |
# # model = EncoderASR.from_hparams("speechbrain/asr-wav2vec2-dvoice-wolof") | |
# # def transcribe(audio): | |
# # return model.transcribe_file(audio.name) | |
# # demo = gr.Interface(fn=transcribe, inputs="file", outputs="text", | |
# # title="Transcription automatique du wolof", | |
# # description="Ce modèle transcrit un fichier audio en wolof en texte en utilisant l'alphabet latin.", | |
# # input_label="Audio en wolof", | |
# # output_label="Transcription alphabet latin" | |
# # ) | |
# # demo.launch() | |
from speechbrain.inference.ASR import EncoderASR | |
import gradio as gr | |
import numpy as np | |
# Charger le modèle pré-entraîné | |
model = EncoderASR.from_hparams("speechbrain/asr-wav2vec2-dvoice-wolof") | |
# # Définir la fonction de transcription | |
# def transcribe(audio): | |
# sr, y = audio | |
# y = y.astype(np.float32) | |
# y /= np.max(np.abs(y)) | |
# # Utiliser le modèle pour transcrire l'audio | |
# return model.transcribe({"sampling_rate": sr, "raw": y})["text"] | |
def transcribe(audio): | |
return model.transcribe_file(audio.name) | |
# Créer l'interface Gradio avec le microphone et le téléchargement de fichier comme options d'entrée | |
asrdemo = gr.Interface( | |
title="Transcription audio en wolof latin by Papa Sega", | |
fn=transcribe, | |
inputs=gr.Audio(sources=["microphone", "upload"]), | |
outputs="text", | |
) | |
# Lancer l'application Gradio | |
asrdemo.launch() | |