Socaroo commited on
Commit
edc3fac
1 Parent(s): 24b1212

Update app.py

Browse files
Files changed (1) hide show
  1. app.py +20 -19
app.py CHANGED
@@ -1,31 +1,32 @@
1
  import gradio as gr
2
- import torch
3
  from transformers import pipeline
4
 
5
- # تحميل نموذج التعرف على الكلام
6
- def load_model():
7
- if torch.cuda.is_available():
8
- model = pipeline("automatic-speech-recognition", model="facebook/wav2vec2-base-960h", device=0)
9
- else:
10
- model = pipeline("automatic-speech-recognition", model="facebook/wav2vec2-base-960h", device=-1)
11
- return model
12
 
13
- # تحديد نموذج التعرف على الكلام
14
- transcriber = load_model()
15
-
16
- def transcribe_audio(audio_path):
17
- # تحويل الصوت إلى نص
18
- result = transcriber(audio_path)
19
- transcribed_text = result["text"]
20
- return transcribed_text
 
 
 
 
 
21
 
22
  # إعداد واجهة Gradio
23
  iface = gr.Interface(
24
- fn=transcribe_audio,
25
  inputs=gr.Audio(type="filepath", label="Upload Audio"),
26
  outputs="text",
27
- title="Speech to Text Transcription",
28
- description="Upload an audio file to transcribe it into text."
29
  )
30
 
31
  # تشغيل واجهة المستخدم
 
1
  import gradio as gr
2
+ import torchaudio
3
  from transformers import pipeline
4
 
5
+ # تحميل نموذج تحويل الصوت إلى نص (ASR) ونموذج الترجمة
6
+ asr_model = pipeline("automatic-speech-recognition", model="facebook/wav2vec2-large-xlsr-53-arabic")
7
+ translation_model = pipeline("translation", model="Helsinki-NLP/opus-mt-ar-en")
 
 
 
 
8
 
9
+ def process_audio(audio_path):
10
+ # تحويل الصوت إلى نص باللغة العربية
11
+ result = asr_model(audio_path)
12
+ arabic_text = result["text"]
13
+
14
+ # ترجمة النص إلى الإنجليزية
15
+ translated_text = translation_model(arabic_text)[0]['translation_text']
16
+
17
+ # هنا يجب عليك استخدام نموذج TTS يمكنه استنساخ الصوت. هذا مجرد مكان مؤقت.
18
+ # استخدام نموذج TTS مناسب لإنتاج الصوت.
19
+ # ولإدراج هذا، عليك تدريب نموذج TTS على بيانات صوتية لمغني معين.
20
+
21
+ return translated_text # قم بإرجاع النص المترجم
22
 
23
  # إعداد واجهة Gradio
24
  iface = gr.Interface(
25
+ fn=process_audio,
26
  inputs=gr.Audio(type="filepath", label="Upload Audio"),
27
  outputs="text",
28
+ title="Arabic to English Speech Translation with Voice Cloning",
29
+ description="Upload an Arabic audio file to translate it to English while maintaining the singer's voice."
30
  )
31
 
32
  # تشغيل واجهة المستخدم