AGENT_ANALYSE_RAG_dev

Running

Ilyas KHIAT commited on Sep 6, 2024

Commit

18b9dfc

1 Parent(s): 4e5c47b

texte graph debug

Files changed (3) hide show

audit_page/audit.py CHANGED Viewed

@@ -174,7 +174,8 @@ def handle_audit(uploaded_file,type:str):
         audit_simplified = {
             "type de fichier": type,
             "Nombre de tokens": audit["number_of_tokens"],
-            "Nombre de mots": audit["number_of_words"]
         }
         st.session_state.audit_simplified = audit_simplified

         audit_simplified = {
             "type de fichier": type,
             "Nombre de tokens": audit["number_of_tokens"],
+            "Nombre de mots": audit["number_of_words"],
+            "Mots clés": audit["key_words"]
         }
         st.session_state.audit_simplified = audit_simplified

audit_page/dialogue_doc.py CHANGED Viewed

@@ -106,9 +106,9 @@ def doc_dialog_main():
         text = get_text_from_content_for_doc(content)
     elif audit["type de fichier"] == "audio":
         text = get_text_from_content_for_audio(content)
-    elif audit["type de fichier"] == "texte":
         text = content
     prompt_cr = dedent(f'''
                 À partir du document ci-dessous, générez un compte rendu détaillé contenant les sections suivantes :

         text = get_text_from_content_for_doc(content)
     elif audit["type de fichier"] == "audio":
         text = get_text_from_content_for_audio(content)
+    elif audit["type de fichier"] == "text":
         text = content
     prompt_cr = dedent(f'''
                 À partir du document ci-dessous, générez un compte rendu détaillé contenant les sections suivantes :

utils/audit/audit_doc.py CHANGED Viewed

@@ -189,11 +189,24 @@ def audit_descriptif_pdf(file,max_img_width) -> dict:
     return global_audit
 def audit_text(text: str) -> dict:
     audit_dict = {
         "number_of_tokens": count_tokens(text),
         "number_of_words": len(text.split()),
     }
     global_audit = {
         "audit": audit_dict,
         "content": text

     return global_audit
 def audit_text(text: str) -> dict:
+    prompt = f'''Voici le document:
+        - {text}
+        Veuillez extraire les cinq mots clés les plus pertinents de cette liste. Chaque mot clé doit contenir au maximum deux mots.
+        TA REPONSE DOIT RESPECTER LE FORMAT SUIVANT :
+        key_word1, key_word2, key_word3, key_word4, key_word5
+    '''
+    key_words_extracted = extract_relevant_keywords(prompt)
     audit_dict = {
         "number_of_tokens": count_tokens(text),
         "number_of_words": len(text.split()),
     }
+    audit_dict["key_words"] = "\n" + key_words_extracted
     global_audit = {
         "audit": audit_dict,
         "content": text