Soft_dub / app.py
Socaroo's picture
Update app.py
edc3fac verified
raw
history blame contribute delete
No virus
1.48 kB
import gradio as gr
import torchaudio
from transformers import pipeline
# تحميل نموذج تحويل الصوت إلى نص (ASR) ونموذج الترجمة
asr_model = pipeline("automatic-speech-recognition", model="facebook/wav2vec2-large-xlsr-53-arabic")
translation_model = pipeline("translation", model="Helsinki-NLP/opus-mt-ar-en")
def process_audio(audio_path):
# تحويل الصوت إلى نص باللغة العربية
result = asr_model(audio_path)
arabic_text = result["text"]
# ترجمة النص إلى الإنجليزية
translated_text = translation_model(arabic_text)[0]['translation_text']
# هنا يجب عليك استخدام نموذج TTS يمكنه استنساخ الصوت. هذا مجرد مكان مؤقت.
# استخدام نموذج TTS مناسب لإنتاج الصوت.
# ولإدراج هذا، عليك تدريب نموذج TTS على بيانات صوتية لمغني معين.
return translated_text # قم بإرجاع النص المترجم
# إعداد واجهة Gradio
iface = gr.Interface(
fn=process_audio,
inputs=gr.Audio(type="filepath", label="Upload Audio"),
outputs="text",
title="Arabic to English Speech Translation with Voice Cloning",
description="Upload an Arabic audio file to translate it to English while maintaining the singer's voice."
)
# تشغيل واجهة المستخدم
if __name__ == "__main__":
iface.launch()