Spaces:

papasega
/

transcriptionWolof

Running

papasega commited on Apr 23, 2024

Commit

b691b31

verified ·

1 Parent(s): 3febd1a

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -1,41 +1,46 @@
-# from speechbrain.inference.ASR import EncoderASR
-# import gradio as gr
-# model = EncoderASR.from_hparams("speechbrain/asr-wav2vec2-dvoice-wolof")
-# def transcribe(audio):
-#   return model.transcribe_file(audio.name)
-# demo = gr.Interface(fn=transcribe, inputs="file", outputs="text",
-#                    title="Transcription automatique du wolof",
-#              description="Ce modèle transcrit un fichier audio en wolof en texte en utilisant l'alphabet latin.",
-#              input_label="Audio en wolof",
-#              output_label="Transcription alphabet latin"
-#                    )
-# demo.launch()
 from speechbrain.inference.ASR import EncoderASR
 import gradio as gr
 import numpy as np
 model = EncoderASR.from_hparams("speechbrain/asr-wav2vec2-dvoice-wolof")
 def transcribe(audio):
     sr, y = audio
     y = y.astype(np.float32)
     y /= np.max(np.abs(y))
-    return transcriber({"sampling_rate": sr, "raw": y})["text"]
-demo = gr.Interface(
-    transcribe,
-    gr.Audio(sources=["microphone"]),
-    "text",
 )
-demo.launch()

+# # from speechbrain.inference.ASR import EncoderASR
+# # import gradio as gr
+# # model = EncoderASR.from_hparams("speechbrain/asr-wav2vec2-dvoice-wolof")
+# # def transcribe(audio):
+# #   return model.transcribe_file(audio.name)
+# # demo = gr.Interface(fn=transcribe, inputs="file", outputs="text",
+# #                    title="Transcription automatique du wolof",
+# #              description="Ce modèle transcrit un fichier audio en wolof en texte en utilisant l'alphabet latin.",
+# #              input_label="Audio en wolof",
+# #              output_label="Transcription alphabet latin"
+# #                    )
+# # demo.launch()
 from speechbrain.inference.ASR import EncoderASR
 import gradio as gr
 import numpy as np
+# Charger le modèle pré-entraîné
 model = EncoderASR.from_hparams("speechbrain/asr-wav2vec2-dvoice-wolof")
+# Définir la fonction de transcription
 def transcribe(audio):
     sr, y = audio
     y = y.astype(np.float32)
     y /= np.max(np.abs(y))
+    # Utiliser le modèle pour transcrire l'audio
+    return model.transcribe({"sampling_rate": sr, "raw": y})["text"]
+# Créer l'interface Gradio avec le microphone et le téléchargement de fichier comme options d'entrée
+asrdemo = gr.Interface(
+    title="Transcription audio en wolof latin by Papa Sega",
+    fn=transcribe,
+    inputs=gr.Audio(sources=["microphone", "upload"]),
+    outputs="text",
 )
+# Lancer l'application Gradio
+asrdemo.launch()