Spaces:

Woziii
/

scribe

Running

App Files Files Community

Woziii commited on Aug 21, 2024

Commit

4ab4a99

verified ·

1 Parent(s): 7b3e32e

Update app.py

Browse files

Files changed (1) hide show

app.py +9 -8

app.py CHANGED Viewed

@@ -101,16 +101,13 @@ def process_transcription(*args):
         pass  # Consommer le générateur jusqu'à la fin
     simplified_diarization = simplify_diarization_output(speaker_transcription)
     num_speakers = count_unique_speakers(speaker_transcription)
-    # Modifier cette ligne pour créer une liste de listes au lieu d'une liste de dictionnaires
     speaker_names = [[f"SPEAKER_{i:02d}", f"SPEAKER_{i:02d}"] for i in range(num_speakers)]
     return progress_message, raw_text, simplified_diarization, num_speakers, speaker_names
-# Faire la même modification dans process_yt_transcription
 def process_yt_transcription(*args):
     html_embed, raw_text, speaker_transcription = yt_transcribe(*args)
     simplified_diarization = simplify_diarization_output(speaker_transcription)
     num_speakers = count_unique_speakers(speaker_transcription)
-    # Modifier cette ligne de la même manière
     speaker_names = [[f"SPEAKER_{i:02d}", f"SPEAKER_{i:02d}"] for i in range(num_speakers)]
     return html_embed, raw_text, simplified_diarization, num_speakers, speaker_names
@@ -190,10 +187,14 @@ def format_to_markdown(transcription_text, speaker_transcription, audio_duration
         "Contexte": context if context else "[non spécifié]"
     }
-    # Modifier cette partie pour traiter la nouvelle structure de speaker_names
     if speaker_names is not None:
-        for speaker_id, custom_name in speaker_names:
-            metadata[speaker_id] = custom_name
     metadata_text = "\n".join([f"- **{key}** : '{value}'" for key, value in metadata.items()])
@@ -204,7 +205,7 @@ def format_to_markdown(transcription_text, speaker_transcription, audio_duration
         if isinstance(speaker_transcription, list) and all(isinstance(item, tuple) and len(item) == 2 for item in speaker_transcription):
             formatted_transcription = []
             for speaker, text in speaker_transcription:
-                custom_name = next((row["Nom personnalisé"] for row in speaker_names if row["Speaker ID"] == speaker), speaker)
                 formatted_transcription.append(f"**{custom_name}**: {text}")
             transcription_text = "\n\n".join(formatted_transcription)
         else:
@@ -223,7 +224,7 @@ def format_to_markdown(transcription_text, speaker_transcription, audio_duration
 {transcription_text}
 """
     return formatted_output
 def _return_yt_html_embed(yt_url):
     video_id = yt_url.split("?v=")[-1]
     HTML_str = (

         pass  # Consommer le générateur jusqu'à la fin
     simplified_diarization = simplify_diarization_output(speaker_transcription)
     num_speakers = count_unique_speakers(speaker_transcription)
     speaker_names = [[f"SPEAKER_{i:02d}", f"SPEAKER_{i:02d}"] for i in range(num_speakers)]
     return progress_message, raw_text, simplified_diarization, num_speakers, speaker_names
 def process_yt_transcription(*args):
     html_embed, raw_text, speaker_transcription = yt_transcribe(*args)
     simplified_diarization = simplify_diarization_output(speaker_transcription)
     num_speakers = count_unique_speakers(speaker_transcription)
     speaker_names = [[f"SPEAKER_{i:02d}", f"SPEAKER_{i:02d}"] for i in range(num_speakers)]
     return html_embed, raw_text, simplified_diarization, num_speakers, speaker_names
         "Contexte": context if context else "[non spécifié]"
     }
+    # Gestion plus robuste de speaker_names
     if speaker_names is not None:
+        if isinstance(speaker_names, list):
+            for item in speaker_names:
+                if isinstance(item, (list, tuple)) and len(item) == 2:
+                    metadata[item[0]] = item[1]
+                elif isinstance(item, dict) and "Speaker ID" in item and "Nom personnalisé" in item:
+                    metadata[item["Speaker ID"]] = item["Nom personnalisé"]
     metadata_text = "\n".join([f"- **{key}** : '{value}'" for key, value in metadata.items()])
         if isinstance(speaker_transcription, list) and all(isinstance(item, tuple) and len(item) == 2 for item in speaker_transcription):
             formatted_transcription = []
             for speaker, text in speaker_transcription:
+                custom_name = next((item[1] for item in speaker_names if item[0] == speaker), speaker) if isinstance(speaker_names, list) else speaker
                 formatted_transcription.append(f"**{custom_name}**: {text}")
             transcription_text = "\n\n".join(formatted_transcription)
         else:
 {transcription_text}
 """
     return formatted_output
 def _return_yt_html_embed(yt_url):
     video_id = yt_url.split("?v=")[-1]
     HTML_str = (