Spaces:

Seicas
/

VoiceToWrite

Sleeping

App Files Files Community

Seicas commited on Jun 18

Commit

f76769c

verified ·

1 Parent(s): f9b22e5

Update app.py

Browse files

Files changed (1) hide show

app.py +19 -7

app.py CHANGED Viewed

@@ -11,6 +11,7 @@ from diarization import diarize_segments
 from privacy import MedicalPrivacyProcessor
 from config import settings
 from typing import Tuple, Dict
 # HuggingFace token'ını ayarla
 HF_TOKEN = os.getenv("HF_TOKEN", "")
@@ -80,35 +81,46 @@ def process_audio(
         Tuple[str, Dict]: (Transkripsiyon metni, JSON sonuç)
     """
     if not audio_path:
-        return "Lütfen bir ses dosyası yükleyin.", {}
     try:
-        # Ses dosyasını yükle
-        audio = Audio.from_file(audio_path)
         # Ses iyileştirme
         if do_enhance:
             audio = enhance_audio(audio)
         # Konuşmacı ayrımı
         if do_diarize:
-            diarization = diarize_speakers(audio)
         else:
             diarization = None
         # Transkripsiyon
-        result = transcribe_audio(audio, diarization)
         # Anonimleştirme
         if do_anonymize:
             result = anonymize_personal_info(result)
-        return result["text"], result
     except Exception as e:
         error_msg = f"İşlem sırasında bir hata oluştu: {str(e)}"
         print(error_msg)
-        return error_msg, {}
 # Ana arayüz
 with gr.Blocks(theme=gr.themes.Soft(primary_hue="indigo", secondary_hue="blue"), css=css) as demo:

 from privacy import MedicalPrivacyProcessor
 from config import settings
 from typing import Tuple, Dict
+from pydub import AudioSegment
 # HuggingFace token'ını ayarla
 HF_TOKEN = os.getenv("HF_TOKEN", "")
         Tuple[str, Dict]: (Transkripsiyon metni, JSON sonuç)
     """
     if not audio_path:
+        return "Lütfen bir ses dosyası yükleyin.", {"error": "Dosya yüklenmedi"}
     try:
+        # Ses dosyasını WAV formatına çevir
+        base, ext = os.path.splitext(audio_path)
+        wav_path = base + ".wav"
+        audio = AudioSegment.from_file(audio_path)
         # Ses iyileştirme
         if do_enhance:
             audio = enhance_audio(audio)
+            audio.export(wav_path, format="wav")
         # Konuşmacı ayrımı
         if do_diarize:
+            diarization = diarize_speakers(wav_path)
         else:
             diarization = None
         # Transkripsiyon
+        result = transcribe_audio(wav_path, diarization)
         # Anonimleştirme
         if do_anonymize:
             result = anonymize_personal_info(result)
+        # JSON çıktısını hazırla
+        json_result = {
+            "transcript": result["text"],
+            "diarization": diarization,
+            "enhanced_audio": wav_path if do_enhance else None,
+            "anonymized": do_anonymize
+        }
+        return result["text"], json_result
     except Exception as e:
         error_msg = f"İşlem sırasında bir hata oluştu: {str(e)}"
         print(error_msg)
+        return error_msg, {"error": str(e)}
 # Ana arayüz
 with gr.Blocks(theme=gr.themes.Soft(primary_hue="indigo", secondary_hue="blue"), css=css) as demo: