Spaces:

papasega
/

transcriptionWolof

Sleeping

File size: 1,452 Bytes

# # from speechbrain.inference.ASR import EncoderASR
# # import gradio as gr

# # model = EncoderASR.from_hparams("speechbrain/asr-wav2vec2-dvoice-wolof")

# # def transcribe(audio):
# #   return model.transcribe_file(audio.name)


# # demo = gr.Interface(fn=transcribe, inputs="file", outputs="text", 
# #                    title="Transcription automatique du wolof", 
# #              description="Ce modèle transcrit un fichier audio en wolof en texte en utilisant l'alphabet latin.",              
# #              input_label="Audio en wolof", 
# #              output_label="Transcription alphabet latin"
# #                    )

# # demo.launch()


from speechbrain.inference.ASR import EncoderASR
import gradio as gr
import numpy as np

# Charger le modèle pré-entraîné
model = EncoderASR.from_hparams("speechbrain/asr-wav2vec2-dvoice-wolof")

# Définir la fonction de transcription
def transcribe(audio):
    sr, y = audio
    y = y.astype(np.float32)
    y /= np.max(np.abs(y))

    # Utiliser le modèle pour transcrire l'audio
    return model.transcribe({"sampling_rate": sr, "raw": y})["text"]

# Créer l'interface Gradio avec le microphone et le téléchargement de fichier comme options d'entrée
asrdemo = gr.Interface(
    title="Transcription audio en wolof latin by Papa Sega",
    fn=transcribe,
    inputs=gr.Audio(sources=["microphone", "upload"]),
    outputs="text",
)

# Lancer l'application Gradio
asrdemo.launch()