Spaces:

MathJake
/

PrubasPy

Sleeping

App Files Files Community

MathJake commited on 23 days ago

Commit

f572bf3

verified ·

1 Parent(s): 7a2ea7b

Upload 2 files

Browse files

Files changed (2) hide show

pages/insertardocumentos.py +34 -0
pages/resumen_word.py +56 -0

pages/insertardocumentos.py ADDED Viewed

	@@ -0,0 +1,34 @@

+import streamlit as st
+from sentence_transformers import SentenceTransformer
+from Rag_milvus import pdfachunk,split_chunks,generaremben,insertarenqdra
+from Llm_local import generarPages
+col1, col2 = st.columns([1, 4])
+with col1:
+    st.image("Procuradurialogo.jpg", width=600)
+with col2:
+    st.markdown("""
+        <div style='display: flex; align-items: center; height: 100%;'>
+            <h1 style='margin: 0; text-align: center;'>ProcurIA</h1>
+        </div>
+    """, unsafe_allow_html=True)
+st.sidebar.title("Menú de Funciones")
+generarPages()
+model = SentenceTransformer("all-MiniLM-L6-v2")
+archivo = st.file_uploader("📂 Sube tus documentos PDF para chatear con ellos", type=["pdf", "txt"], accept_multiple_files=True)
+if archivo:
+    for file in archivo:
+        nombre_coleccion = f"coleccion_{file.name.replace('.pdf', '').replace(' ', '_')}"
+        pdf_chunks = pdfachunk(file)
+        split_docs = split_chunks(pdf_chunks)
+        texts = [doc.page_content for doc in split_docs]
+        embeddings = generaremben(model, texts)
+        insertarenqdra(embeddings, texts, nombre_coleccion)
+    st.success("Archivos subidos en la base vectorial con éxito!")

pages/resumen_word.py ADDED Viewed

	@@ -0,0 +1,56 @@

+import streamlit as st
+from sentence_transformers import SentenceTransformer
+from Llm_local import generarPages, informes_mistral,extraer_texto, extraer_texto_word, generar_docx, generar_pdf
+col1, col2 = st.columns([1, 4])
+with col1:
+    st.image("Procuradurialogo.jpg", width=600)
+with col2:
+    st.markdown("""
+        <div style='display: flex; align-items: center; height: 100%;'>
+            <h1 style='margin: 0; text-align: center;'>ProcurIA</h1>
+        </div>
+    """, unsafe_allow_html=True)
+st.sidebar.title("Menú de Funciones")
+generarPages()
+if "messages" not in st.session_state:
+    st.session_state.messages = [{"role": "assistant", "content": "Hola!, en qué puedo ayudarte?"}]
+model = SentenceTransformer("all-MiniLM-L6-v2")
+archivo = st.file_uploader("📂 Sube tus documentos PDF o WORD ¡Para hacer un informe!", type=["pdf", "txt"], accept_multiple_files=True)
+if archivo:
+    texto_total = ""
+    for archivo_item in archivo:
+        contenido = ""
+        if archivo_item.name.endswith(".pdf"):
+            contenido = extraer_texto(archivo_item)
+        elif archivo_item.name.endswith(".docx"):
+            contenido = extraer_texto_word(archivo_item)
+        if contenido.strip():
+            texto_total += f"\n---\nDOCUMENTO: {archivo_item.name}\n{contenido.strip()}\n"
+    if texto_total.strip():
+        resumen_completo = [""]
+        #st.write(texto_total)
+        def resumen_streaming():
+            for palabra in informes_mistral(texto_total):
+                resumen_completo[0] += palabra
+                yield palabra
+        st.subheader("📄 Informe de todos los documentos:")
+        st.write_stream(resumen_streaming())
+        pdf_bytes = generar_pdf(resumen_completo[0])
+        st.download_button("📄 Descargar Informe en PDF", data=pdf_bytes, file_name="resumen_global.pdf", mime="application/pdf")
+        docx_buffer = generar_docx(resumen_completo[0])
+        st.download_button("📝 Descargar Informe en Word", data=docx_buffer, file_name="resumen_global.docx",
+                        mime="application/vnd.openxmlformats-officedocument.wordprocessingml.document")