Spaces:

ImPolymath
/

demorrha

Paused

App Files Files Community

rick commited on Oct 4, 2024

Commit

092f860

unverified ·

1 Parent(s): 107cd6a

bug fixed now... not done...

Browse files

Files changed (1) hide show

pages/main.py +73 -102

pages/main.py CHANGED Viewed

@@ -323,10 +323,10 @@ def concatenate_audio_files(audio_list: List[Tuple[bytes, float]]) -> Optional[b
 def process_message(
     message: str,
-    operation_prompt: str = "",
-    tts_enabled: bool = False,
-    system_prompt: Optional[str]=""
-) -> str:
     """
     Traite les messages des utilisateurs et génère une réponse.
@@ -336,9 +336,9 @@ def process_message(
         tts_enabled (bool, optional): Si la synthèse vocale est activée. Par défaut False.
     """
-    payload_content = f'{operation_prompt} :\n"""\n{message}\n"""'
     st.session_state.messages = [
-        {"role": "system", "content": system_prompt},
         {"role": "user", "content": payload_content}
     ]
     st.session_state["full_response"] = ""
@@ -353,8 +353,7 @@ def process_message(
         # Utiliser regex pour supprimer les trois premiers et derniers guillemets doubles
         st.session_state.full_response = re.sub(r'^"{3}|"{3}$', '', st.session_state.full_response.strip())
-        st.session_state.messages = [] #.append({"role": "assistant", "content": full_response})
-        ###st.session_state.full_response = full_response
         return st.session_state.full_response
     except Exception as e:
         st.error(f"Une erreur s'est produite lors de la génération de la réponse : {e}")
@@ -362,8 +361,8 @@ def process_message(
 def process_tts_message(text_response: str) -> Tuple[Optional[bytes], Optional[float]]:
     try:
-        tts_audio, tts_duration = text_to_speech(text_response)
-        return tts_audio, tts_duration
     except Exception as e:
         st.error(f"Une erreur s'est produite lors de la conversion texte-parole : {e}")
         return None, None
@@ -401,9 +400,9 @@ def set_translation_mode(from_lang: str, dest_lang: str) -> Tuple[str, str]:
     Returns:
         Tuple[str, str]: Un tuple contenant le prompt système et le prompt d'opération.
     """
-    system_prompt = GlobalSystemPrompts.linguascribe()
-    operation_prompt = f"Translate({from_lang} to {dest_lang})"
-    return system_prompt, operation_prompt
 # List of languages supported by the application
 SUPPORTED_LANGUAGES = [
@@ -565,7 +564,6 @@ def main_page():
     if "interface_language_select" not in st.session_state:
         st.session_state.interface_language_select = "English"  # Langue par défaut
-    #system_prompt, operation_prompt = init_process_mode()
     # Initialisation de l'historique des messages avec le prompt système
     if "messages" not in st.session_state:
@@ -597,7 +595,7 @@ def main_page():
                     input_text=user_input, temperature=0.01
                 )
-            audio_list = []
             for cursor_selected_lang in st.session_state.selected_languages:
                 st.session_state.target_language = cursor_selected_lang["iso-639-1"]
@@ -608,7 +606,7 @@ def main_page():
                 st.session_state.full_response = ""
                 # Initialisation du mode de traitement pour la langue cible actuelle
-                system_prompt, operation_prompt = init_process_mode(from_lang=
                     (
                         st.session_state.language_detected if "language_detected" in st.session_state.language_detected else convert_language_name_to_iso6391(
                             st.session_state.interface_language
@@ -616,8 +614,8 @@ def main_page():
                     ),
                     to_lang=st.session_state.target_language
                 )
-                # display error with st.error ; if (system_prompt, operation_prompt) is "", "" or None, None, and raise error
-                if not system_prompt or not operation_prompt:
                     st.error("Erreur : Les prompts système ou d'opération sont vides.")
                     raise ValueError("Les prompts système ou d'opération ne peuvent pas être vides.")
@@ -625,30 +623,29 @@ def main_page():
                 with st.status(f'({target_language_name}) - {get_translation("traduction_en_cours")}', expanded=True) as response_status:
                     with st.chat_message("assistant", avatar="👻"):
                         message_placeholder = st.empty()
-                        response_generator = process_message(
-                            user_input, operation_prompt,
                             st.session_state.enable_tts_for_input_from_text_field,
-                            system_prompt=system_prompt
                         )
                         response_status.update(label=f'({target_language_name}) - {get_translation("traduction_en_cours")}', state="running", expanded=True)
-                        for response_chunk in response_generator:
                             message_placeholder.markdown(response_chunk)
-                        end_response = response_generator.close()  # Obtenir la réponse complète à la fin
                         if st.session_state.full_response != "":
                             message_placeholder.markdown(st.session_state.full_response)
                             if st.session_state.enable_tts_for_input_from_text_field:
                                 response_status.update(label=f'({target_language_name}) - {get_translation("traduction_terminee")} ; {get_translation("synthese_vocale_en_cours")}', state="running", expanded=False)
-                                tts_audio, tts_duration = process_tts_message(st.session_state.full_response)
                                 del st.session_state.full_response
-                                if tts_audio:
-                                    st.audio(tts_audio, format="audio/mp3", autoplay=False)
-                                    audio_list.append((tts_audio, tts_duration))
-                                    del tts_audio
-                                    del tts_duration
                                     response_status.update(label=f'({target_language_name}) - {get_translation("traduction_terminee")} ; {get_translation("synthese_vocale_terminee")}', state="complete", expanded=False)
                                 else:
                                     response_status.update(label=f'({target_language_name}) - {get_translation("erreur_synthese_vocale")}', state="error", expanded=False)
@@ -660,29 +657,29 @@ def main_page():
                             response_status.update(label=f'({target_language_name}) - {get_translation("erreur_traduction")}', state="error", expanded=False)
-            if audio_list:
                 with st.status(f"{get_translation('concatenation_audio_en_cours')}", expanded=False) as audio_status:
                     audio_status.update(label=f"{get_translation('concatenation_audio_en_cours')}", state="running", expanded=False)
                     try:
-                        final_audio = concatenate_audio_files(audio_list)
                         with st.container(border=True):
                             # Générer un nom de fichier unique
-                            timestamp = time.strftime("%Y%m%d-%H%M%S")
-                            langues = "_".join([lang["iso-639-1"] for lang in st.session_state.selected_languages])
-                            nom_fichier = f"reponse_audio_{langues}_{timestamp}.mp3"
-                            st.audio(final_audio, format="audio/mp3", autoplay=st.session_state.autoplay_tts)
                             st.download_button(
                                 label=f"📥 {get_translation('telecharger_audio')}",
-                                data=final_audio,
-                                file_name=nom_fichier,
                                 mime="audio/mp3",
                                 use_container_width=True,
                                 type="primary",
-                                key=f"download_button_{langues}_{timestamp}",
                             )
                             # ##
@@ -704,11 +701,11 @@ def main_page():
                     st.write(f"Frame rate: {audio.frame_rate}, Frame width: {audio.frame_width}, Duration: {audio.duration_seconds} seconds")
                     # Transcrire l'audio en texte
-                    transcription = transcribe_audio(temp_audio, language=st.session_state.language_detected)
                 # Detecter la langue du texte transcrit (si la langue source n'est pas détectée)
                 if st.session_state.language_detected is None:
                     st.session_state.language_detected = detect_language(
-                        input_text=transcription, temperature=0.01
                     )
                     st.markdown(
                         f"- {get_translation('langue_detectee')}".format(
@@ -718,18 +715,18 @@ def main_page():
                 st.markdown(
                     f"🎤 {get_translation('transcription_audio')}".format(
-                        f"{transcription}"
                     )
                 )
-                audio_list = []
                 for cursor_selected_lang in st.session_state.selected_languages:
                     st.session_state.target_language = cursor_selected_lang["iso-639-1"]
                     st.session_state.full_response = ""
                     # Initialisation du mode de traitement pour la langue cible actuelle
-                    system_prompt, operation_prompt = init_process_mode(from_lang=
                         (
                             st.session_state.language_detected if "language_detected" in st.session_state.language_detected else convert_language_name_to_iso6391(
                                 st.session_state.interface_language
@@ -740,89 +737,63 @@ def main_page():
                     with st.chat_message("assistant", avatar="👻"):
                         message_placeholder = st.empty()
-                        response_generator = process_message(
-                            transcription, operation_prompt, st.session_state.enable_tts_for_input_from_audio_record,
-                            system_prompt=system_prompt
                         )
-                        for response_chunk in response_generator:
                             message_placeholder.markdown(response_chunk)
-                        end_response = response_generator.close()
                         if st.session_state.full_response != "":
                             message_placeholder.markdown(st.session_state.full_response)
                             if st.session_state.enable_tts_for_input_from_audio_record:
-                                tts_audio, tts_duration = process_tts_message(st.session_state.full_response)
-                                if tts_audio:
-                                    audio_list.append((tts_audio, tts_duration))
                             else:
                                 pass
-                if audio_list:
-                    final_audio = concatenate_audio_files(audio_list)
                     with st.container(border=True):
                         # Générer un nom de fichier unique
-                        timestamp = time.strftime("%Y%m%d-%H%M%S")
-                        langues = "_".join([lang["iso-639-1"] for lang in st.session_state.selected_languages])
-                        nom_fichier = f"reponse_audio_{langues}_{timestamp}.mp3"
-                        st.audio(final_audio, format="audio/mp3", autoplay=st.session_state.autoplay_tts)
                         st.download_button(
                             label=f"📥 {get_translation('telecharger_audio')}",
-                            data=final_audio,
-                            file_name=nom_fichier,
                             mime="audio/mp3",
                             use_container_width=True,
                             type="primary",
-                            key=f"download_button_{langues}_{timestamp}",
                         )
-    # check if `final_audio` var exists , if exists delete final_audio
-    #if 'final_audio' in locals():
-    #    del final_audio
-    #if 'audio_list' in locals():
-    #    del audio_list
-    #if 'system_prompt' in locals():
-    #    del system_prompt
-    #if 'operation_prompt' in locals():
-    #    del operation_prompt
-    #if 'user_input' in locals():
-    #    del user_input
-    def clear_inputs_garbages():
-        if 'transcription' in locals():
-            del transcription
-        if 'operation_prompt' in locals():
-            del operation_prompt
-        if 'system_prompt' in locals():
-            del system_prompt
-        if 'audio_list' in locals():
-            del audio_list
-        if "full_response" in st.session_state:
-            del st.session_state["full_response"]
-        if "tts_audio" in locals():
-            del tts_audio
-        if 'tts_duration' in locals():
-            del tts_duration
-        if 'timestamp' in locals():
-            del timestamp
-        if 'langues' in locals():
-            del langues
-        if 'nom_fichier' in locals():
-            del nom_fichier
-        if 'final_audio' in locals():
-            del final_audio
-        if 'response_generator' in locals():
-            del response_generator
-        if 'end_response' in locals():
-            del end_response
-        if "messages" in st.session_state:
-            del st.session_state["messages"]
     clear_inputs_garbages()

 def process_message(
     message: str,
+    operation_prompt_: Optional[str] = "",
+    tts_enabled: Optional[bool] = False,
+    system_prompt_: Optional[str] = ""
+):
     """
     Traite les messages des utilisateurs et génère une réponse.
         tts_enabled (bool, optional): Si la synthèse vocale est activée. Par défaut False.
     """
+    payload_content = f'{operation_prompt_} :\n"""\n{message}\n"""'
     st.session_state.messages = [
+        {"role": "system", "content": system_prompt_},
         {"role": "user", "content": payload_content}
     ]
     st.session_state["full_response"] = ""
         # Utiliser regex pour supprimer les trois premiers et derniers guillemets doubles
         st.session_state.full_response = re.sub(r'^"{3}|"{3}$', '', st.session_state.full_response.strip())
+        st.session_state.messages = []
         return st.session_state.full_response
     except Exception as e:
         st.error(f"Une erreur s'est produite lors de la génération de la réponse : {e}")
 def process_tts_message(text_response: str) -> Tuple[Optional[bytes], Optional[float]]:
     try:
+        tts_audio_, tts_duration_ = text_to_speech(text_response)
+        return tts_audio_, tts_duration_
     except Exception as e:
         st.error(f"Une erreur s'est produite lors de la conversion texte-parole : {e}")
         return None, None
     Returns:
         Tuple[str, str]: Un tuple contenant le prompt système et le prompt d'opération.
     """
+    system_prompt_ = GlobalSystemPrompts.linguascribe()
+    operation_prompt_ = f"Translate({from_lang} to {dest_lang})"
+    return system_prompt_, operation_prompt_
 # List of languages supported by the application
 SUPPORTED_LANGUAGES = [
     if "interface_language_select" not in st.session_state:
         st.session_state.interface_language_select = "English"  # Langue par défaut
     # Initialisation de l'historique des messages avec le prompt système
     if "messages" not in st.session_state:
                     input_text=user_input, temperature=0.01
                 )
+            st.session_state.audio_list = []
             for cursor_selected_lang in st.session_state.selected_languages:
                 st.session_state.target_language = cursor_selected_lang["iso-639-1"]
                 st.session_state.full_response = ""
                 # Initialisation du mode de traitement pour la langue cible actuelle
+                st.session_state.system_prompt, st.session_state.operation_prompt = init_process_mode(from_lang=
                     (
                         st.session_state.language_detected if "language_detected" in st.session_state.language_detected else convert_language_name_to_iso6391(
                             st.session_state.interface_language
                     ),
                     to_lang=st.session_state.target_language
                 )
+                # display error with st.error ; if (st.session_state.system_prompt, st.session_state.operation_prompt) is "", "" or None, None, and raise error
+                if (not st.session_state.system_prompt) or (not st.session_state.operation_prompt):
                     st.error("Erreur : Les prompts système ou d'opération sont vides.")
                     raise ValueError("Les prompts système ou d'opération ne peuvent pas être vides.")
                 with st.status(f'({target_language_name}) - {get_translation("traduction_en_cours")}', expanded=True) as response_status:
                     with st.chat_message("assistant", avatar="👻"):
                         message_placeholder = st.empty()
+                        st.session_state.response_generator = process_message(
+                            user_input,
+                            st.session_state.operation_prompt,
                             st.session_state.enable_tts_for_input_from_text_field,
+                            st.session_state.system_prompt
                         )
                         response_status.update(label=f'({target_language_name}) - {get_translation("traduction_en_cours")}', state="running", expanded=True)
+                        for response_chunk in st.session_state.response_generator:
                             message_placeholder.markdown(response_chunk)
+                        st.session_state.end_response = st.session_state.response_generator.close()  # Obtenir la réponse complète à la fin
                         if st.session_state.full_response != "":
                             message_placeholder.markdown(st.session_state.full_response)
                             if st.session_state.enable_tts_for_input_from_text_field:
                                 response_status.update(label=f'({target_language_name}) - {get_translation("traduction_terminee")} ; {get_translation("synthese_vocale_en_cours")}', state="running", expanded=False)
+                                st.session_state.tts_audio, st.session_state.tts_duration = process_tts_message(st.session_state.full_response)
                                 del st.session_state.full_response
+                                if st.session_state.tts_audio:
+                                    st.audio(st.session_state.tts_audio, format="audio/mp3", autoplay=False)
+                                    st.session_state.audio_list.append((st.session_state.tts_audio, st.session_state.tts_duration))
                                     response_status.update(label=f'({target_language_name}) - {get_translation("traduction_terminee")} ; {get_translation("synthese_vocale_terminee")}', state="complete", expanded=False)
                                 else:
                                     response_status.update(label=f'({target_language_name}) - {get_translation("erreur_synthese_vocale")}', state="error", expanded=False)
                             response_status.update(label=f'({target_language_name}) - {get_translation("erreur_traduction")}', state="error", expanded=False)
+            if st.session_state.audio_list:
                 with st.status(f"{get_translation('concatenation_audio_en_cours')}", expanded=False) as audio_status:
                     audio_status.update(label=f"{get_translation('concatenation_audio_en_cours')}", state="running", expanded=False)
                     try:
+                        st.session_state.final_audio = concatenate_audio_files(st.session_state.audio_list)
                         with st.container(border=True):
                             # Générer un nom de fichier unique
+                            st.session_state.timestamp = time.strftime("%Y%m%d-%H%M%S")
+                            st.session_state.langues = "_".join([lang["iso-639-1"] for lang in st.session_state.selected_languages])
+                            st.session_state.nom_fichier = f"reponse_audio_{st.session_state.langues}_{st.session_state.timestamp}.mp3"
+                            st.audio(st.session_state.final_audio, format="audio/mp3", autoplay=st.session_state.autoplay_tts)
                             st.download_button(
                                 label=f"📥 {get_translation('telecharger_audio')}",
+                                data=st.session_state.final_audio,
+                                file_name=st.session_state.nom_fichier,
                                 mime="audio/mp3",
                                 use_container_width=True,
                                 type="primary",
+                                key=f"download_button_{st.session_state.langues}_{st.session_state.timestamp}",
                             )
                             # ##
                     st.write(f"Frame rate: {audio.frame_rate}, Frame width: {audio.frame_width}, Duration: {audio.duration_seconds} seconds")
                     # Transcrire l'audio en texte
+                    st.session_state.transcription = transcribe_audio(temp_audio, language=st.session_state.language_detected)
                 # Detecter la langue du texte transcrit (si la langue source n'est pas détectée)
                 if st.session_state.language_detected is None:
                     st.session_state.language_detected = detect_language(
+                        input_text=st.session_state.transcription, temperature=0.01
                     )
                     st.markdown(
                         f"- {get_translation('langue_detectee')}".format(
                 st.markdown(
                     f"🎤 {get_translation('transcription_audio')}".format(
+                        f"{st.session_state.transcription}"
                     )
                 )
+                st.session_state.audio_list = []
                 for cursor_selected_lang in st.session_state.selected_languages:
                     st.session_state.target_language = cursor_selected_lang["iso-639-1"]
                     st.session_state.full_response = ""
                     # Initialisation du mode de traitement pour la langue cible actuelle
+                    st.session_state.system_prompt, st.session_state.operation_prompt = init_process_mode(from_lang=
                         (
                             st.session_state.language_detected if "language_detected" in st.session_state.language_detected else convert_language_name_to_iso6391(
                                 st.session_state.interface_language
                     with st.chat_message("assistant", avatar="👻"):
                         message_placeholder = st.empty()
+                        st.session_state.response_generator = process_message(
+                            st.session_state.transcription,
+                            st.session_state.operation_prompt,
+                            st.session_state.enable_tts_for_input_from_audio_record,
+                            st.session_state.system_prompt
                         )
+                        for response_chunk in st.session_state.response_generator:
                             message_placeholder.markdown(response_chunk)
+                        st.session_state.end_response = st.session_state.response_generator.close()
                         if st.session_state.full_response != "":
                             message_placeholder.markdown(st.session_state.full_response)
                             if st.session_state.enable_tts_for_input_from_audio_record:
+                                st.session_state.tts_audio, st.session_state.tts_duration = process_tts_message(st.session_state.full_response)
+                                if st.session_state.tts_audio:
+                                    st.session_state.audio_list.append((st.session_state.tts_audio, st.session_state.tts_duration))
                             else:
                                 pass
+                if st.session_state.audio_list:
+                    st.session_state.final_audio = concatenate_audio_files(st.session_state.audio_list)
                     with st.container(border=True):
                         # Générer un nom de fichier unique
+                        st.session_state.timestamp = time.strftime("%Y%m%d-%H%M%S")
+                        st.session_state.langues = "_".join([lang["iso-639-1"] for lang in st.session_state.selected_languages])
+                        st.session_state.nom_fichier = f"reponse_audio_{st.session_state.langues}_{st.session_state.timestamp}.mp3"
+                        st.audio(st.session_state.final_audio, format="audio/mp3", autoplay=st.session_state.autoplay_tts)
                         st.download_button(
                             label=f"📥 {get_translation('telecharger_audio')}",
+                            data=st.session_state.final_audio,
+                            file_name=st.session_state.nom_fichier,
                             mime="audio/mp3",
                             use_container_width=True,
                             type="primary",
+                            key=f"download_button_{st.session_state.langues}_{st.session_state.timestamp}",
                         )
+    def clear_inputs_garbages(sessions_state_list: Optional[list] =
+        [ 'transcription', 'operation_prompt', 'system_prompt',
+        'audio_list', 'full_response', 'tts_audio',
+        'tts_duration', 'timestamp', 'langues',
+        'nom_fichier', 'final_audio', 'response_generator',
+        'end_response', 'messages' ]
+        ):
+        def delete_session_state_var(var_name: str):
+            if f"{var_name}" in st.session_state:
+                del st.session_state[f"{var_name}"]
+        for it_var_name in sessions_state_list:
+            delete_session_state_var(it_var_name)
     clear_inputs_garbages()