import gradio as gr import torchaudio from transformers import pipeline # تحميل نموذج تحويل الصوت إلى نص (ASR) ونموذج الترجمة asr_model = pipeline("automatic-speech-recognition", model="facebook/wav2vec2-large-xlsr-53-arabic") translation_model = pipeline("translation", model="Helsinki-NLP/opus-mt-ar-en") def process_audio(audio_path): # تحويل الصوت إلى نص باللغة العربية result = asr_model(audio_path) arabic_text = result["text"] # ترجمة النص إلى الإنجليزية translated_text = translation_model(arabic_text)[0]['translation_text'] # هنا يجب عليك استخدام نموذج TTS يمكنه استنساخ الصوت. هذا مجرد مكان مؤقت. # استخدام نموذج TTS مناسب لإنتاج الصوت. # ولإدراج هذا، عليك تدريب نموذج TTS على بيانات صوتية لمغني معين. return translated_text # قم بإرجاع النص المترجم # إعداد واجهة Gradio iface = gr.Interface( fn=process_audio, inputs=gr.Audio(type="filepath", label="Upload Audio"), outputs="text", title="Arabic to English Speech Translation with Voice Cloning", description="Upload an Arabic audio file to translate it to English while maintaining the singer's voice." ) # تشغيل واجهة المستخدم if __name__ == "__main__": iface.launch()