Spaces:

papasega
/

transcriptionWolof

Sleeping

transcriptionWolof / app.py

Update app.py

fe9b085 verified 7 months ago

1.53 kB

	# # from speechbrain.inference.ASR import EncoderASR
	# # import gradio as gr

	# # model = EncoderASR.from_hparams("speechbrain/asr-wav2vec2-dvoice-wolof")

	# # def transcribe(audio):
	# # return model.transcribe_file(audio.name)


	# # demo = gr.Interface(fn=transcribe, inputs="file", outputs="text",
	# # title="Transcription automatique du wolof",
	# # description="Ce modèle transcrit un fichier audio en wolof en texte en utilisant l'alphabet latin.",
	# # input_label="Audio en wolof",
	# # output_label="Transcription alphabet latin"
	# # )

	# # demo.launch()


	from speechbrain.inference.ASR import EncoderASR
	import gradio as gr
	import numpy as np

	# Charger le modèle pré-entraîné
	model = EncoderASR.from_hparams("speechbrain/asr-wav2vec2-dvoice-wolof")

	# # Définir la fonction de transcription
	# def transcribe(audio):
	# sr, y = audio
	# y = y.astype(np.float32)
	# y /= np.max(np.abs(y))

	# # Utiliser le modèle pour transcrire l'audio
	# return model.transcribe({"sampling_rate": sr, "raw": y})["text"]

	def transcribe(audio):
	return model.transcribe_file(audio.name)


	# Créer l'interface Gradio avec le microphone et le téléchargement de fichier comme options d'entrée
	asrdemo = gr.Interface(
	title="Transcription audio en wolof latin by Papa Sega",
	fn=transcribe,
	inputs=gr.Audio(sources=["microphone", "upload"]),
	outputs="text",
	)

	# Lancer l'application Gradio
	asrdemo.launch()