Spaces:

jorge-henao
/

ask2democracycol

Runtime error

App Files Files Community

Jorge Henao commited on Mar 21, 2023

Commit

ed37333

1 Parent(s): be70809

page description updates

Browse files

Files changed (3) hide show

about.py +3 -4
hallazgos.py +5 -9
reformas.py +6 -9

about.py CHANGED Viewed

@@ -23,16 +23,15 @@ def about_ask2democracy():
     Uno de los objetivos es contribuir a la inteligencia artificial abierta y en español, con la construcción de un dataset y el entrenamiento de un modelo de lenguaje  adaptado para las discuciones ciudadanas.
     Algo útil para elevar la calidad del debate en todos los países de habla hispana.
     <h2>¿Cómo utilizar este espacio?</h2>
-Selecciona el texto sobre el que quieres buscar en el panel de la izquierda. Luego puedes escribir preguntas concretas como “¿cantidad de víctimas en la masacre de bojayá?”. No se trata de un sistema de búsquedas basado en palabras clave, por el contrario, puedes redactar preguntas más extensas y elaboradas. Cuanto más contexto le des a la pregunta, mejor funciona.
     <h2>Ask2Democracy v 1.2</h2>
     Esta version usa sentence transformers, Cosine similarity, <a href= "https://github.com/deepset-ai/haystack">Haystack framework</a> y una base de dactos vectorial Pinecone para mejorar la precision en las respuestas.
     Los modelos transformers de lenguaje utilizados son:
     <code>
 sentence-transformers/multi-qa-MiniLM-L6-cos-v1
 deepset/xlm-roberta-base-squad2-distilled
-<code>
-<a href= "https://github.com/jorge-henao/ask_to_democracy"> repo en github con FastAPI</a>
-    </code>
     <h2>Beta disclaimer</h2>
     Las respuestas que arroja el sistema no han sido pregrabadas ni basadas en opiniones. Todas son respuestas extraídas de fuentes oficiales, como el Informe final de la CEV.
     Este explorador usa modelos de lenguaje (sentence transformers, bert, otros ) para entender el lenguaje español, sin embargo, necesita de un mayor entrenamiento por lo que, en ocasiones, puede ser confuso y no tan preciso.

     Uno de los objetivos es contribuir a la inteligencia artificial abierta y en español, con la construcción de un dataset y el entrenamiento de un modelo de lenguaje  adaptado para las discuciones ciudadanas.
     Algo útil para elevar la calidad del debate en todos los países de habla hispana.
     <h2>¿Cómo utilizar este espacio?</h2>
+Selecciona el texto sobre el que quieres buscar en el panel de la izquierda y escribe preguntas. No se trata de un sistema de búsquedas basado en palabras clave, por el contrario, puedes redactar preguntas más extensas y elaboradas. Cuanto más contexto le des a la pregunta, mejor funciona.
     <h2>Ask2Democracy v 1.2</h2>
     Esta version usa sentence transformers, Cosine similarity, <a href= "https://github.com/deepset-ai/haystack">Haystack framework</a> y una base de dactos vectorial Pinecone para mejorar la precision en las respuestas.
     Los modelos transformers de lenguaje utilizados son:
     <code>
 sentence-transformers/multi-qa-MiniLM-L6-cos-v1
 deepset/xlm-roberta-base-squad2-distilled
+</code>
+<a href= "https://github.com/jorge-henao/ask_to_democracy"> repo en github con FastAPI</a>
     <h2>Beta disclaimer</h2>
     Las respuestas que arroja el sistema no han sido pregrabadas ni basadas en opiniones. Todas son respuestas extraídas de fuentes oficiales, como el Informe final de la CEV.
     Este explorador usa modelos de lenguaje (sentence transformers, bert, otros ) para entender el lenguaje español, sin embargo, necesita de un mayor entrenamiento por lo que, en ocasiones, puede ser confuso y no tan preciso.

hallazgos.py CHANGED Viewed

@@ -25,7 +25,7 @@ def hallazgos_comision_verdad_2022():
     Ask2Democracy 🇨🇴 - Hallazgos y recomendaciones de la comisión de la verdad
     </h1>
     <p>
-    El 28 de junio del 2022, la Comisión de la Verdad en Colombia liberó su informe final. Fue el resultado de más de 3 años de investigación sobre el conflicto armado interno durante los últimos 60 años. Apoyándose en modelos de lenguaje (sentence transformers, bert, ver más aquí). Este espacio pretende ayudar a explorar las más de 6000 páginas que conforman más de 10 libros del Informe, comenzando por el de Hallazgos y recomendaciones.
   """
     st.markdown(title, unsafe_allow_html=True)
     st.markdown("""<div align="right">
@@ -63,8 +63,9 @@ def hallazgos_comision_verdad_2022():
         result = []
         for i in range(0, len(query_result)):
             item = query_result[i]
-            result.append([[i+1], item.answer, item.context[:200],
-                        item.meta['title'], item.meta['source_title'], int(item.meta['page'])])
             #result.append([[i+1], item.answer, item.context[:200], item.meta['title']])
         return result
@@ -86,12 +87,7 @@ def hallazgos_comision_verdad_2022():
             st.subheader(f"{answer[1]}")
             # cropped answer
             doc = answer[2][:250] + "..."
-            # and url to the full answer
-            #url = f"https://www.comisiondelaverdad.co/sites/default/files/descargables/2022-06/Informe%20Final%20capi%CC%81tulo%20Hallazgos%20y%20recomendaciones.pdf#page={answer[5]+1}"
-            url = f"https://petro.presidencia.gov.co/Documents/230213-Reforma-salud.pdf"
-            # then we display it
-            #st.markdown(f'{doc}\n<br>Fuente: {answer[4]}\n<br>Capítulo: {answer[3]}\n<br>Página: {answer[5]}\n[**Lee más aquí**]({url})\n', unsafe_allow_html=True)
-            st.markdown(f"{doc}[**Lee más aquí**]({url})")
             st.caption(f"Fuente: {answer[4]} - Capítulo: {answer[3]} - Página: {answer[5]}")
         st.markdown("---")

     Ask2Democracy 🇨🇴 - Hallazgos y recomendaciones de la comisión de la verdad
     </h1>
     <p>
+    El 28 de junio del 2022, la Comisión de la Verdad en Colombia liberó su informe final. Fue el resultado de más de 3 años de investigación sobre el conflicto armado interno durante los últimos 60 años. Apoyándose en modelos de lenguaje, este espacio pretende ayudar a explorar las más de 6000 páginas que conforman más de 10 libros del Informe, comenzando por el de Hallazgos y recomendaciones.
   """
     st.markdown(title, unsafe_allow_html=True)
     st.markdown("""<div align="right">
         result = []
         for i in range(0, len(query_result)):
             item = query_result[i]
+            result.append([[i+1], item.answer.replace("\n",""), item.context[:200],
+                        item.meta['title'], item.meta['source_title'],
+                        int(item.meta['page']), item.meta['source_url']])
             #result.append([[i+1], item.answer, item.context[:200], item.meta['title']])
         return result
             st.subheader(f"{answer[1]}")
             # cropped answer
             doc = answer[2][:250] + "..."
+            st.markdown(f"{doc}[**Lee más aquí**]({answer[6]})")
             st.caption(f"Fuente: {answer[4]} - Capítulo: {answer[3]} - Página: {answer[5]}")
         st.markdown("---")

reformas.py CHANGED Viewed

@@ -30,7 +30,8 @@ def reforma_salud_febrero_2023():
     Creado por Jorge Henao 🇨🇴 <a href="https://twitter.com/jhenaotw" target='_blank'>Twitter</a> <a     href="https://www.linkedin.com/in/henaojorge" target='_blank'/>LinkedIn</a>    </div>
         """, unsafe_allow_html=True)
-    question_samples_str = """¿Cuándo se implementará el Sistema de Salud?
 ¿Cómo se implementará el Sistema de Salud?
 ¿Qué es principio de interpretación y fundamento de la transición en relación al Sistema de Salud?
 ¿Qué se garantiza en todo momento con el nuevo Sistema de Salud?
@@ -81,8 +82,9 @@ def reforma_salud_febrero_2023():
         result = []
         for i in range(0, len(query_result)):
             item = query_result[i]
-            result.append([[i+1], item.answer, item.context[:200],
-                        item.meta['title'], item.meta['source_title'], int(item.meta['page'])])
             #result.append([[i+1], item.answer, item.context[:200], item.meta['title']])
         return result
@@ -104,12 +106,7 @@ def reforma_salud_febrero_2023():
             st.subheader(f"{answer[1]}")
             # cropped answer
             doc = answer[2][:250] + "..."
-            # and url to the full answer
-            #url = f"https://www.comisiondelaverdad.co/sites/default/files/descargables/2022-06/Informe%20Final%20capi%CC%81tulo%20Hallazgos%20y%20recomendaciones.pdf#page={answer[5]+1}"
-            url = f"https://petro.presidencia.gov.co/Documents/230213-Reforma-salud.pdf"
-            # then we display it
-            #st.markdown(f'{doc}\n<br>Fuente: {answer[4]}\n<br>Capítulo: {answer[3]}\n<br>Página: {answer[5]}\n[**Lee más aquí**]({url})\n', unsafe_allow_html=True)
-            st.markdown(f"{doc}[**Lee más aquí**]({url})")
             st.caption(f"Fuente: {answer[4]} - Capítulo: {answer[3]} - Página: {answer[5]}")
         st.markdown("---")

     Creado por Jorge Henao 🇨🇴 <a href="https://twitter.com/jhenaotw" target='_blank'>Twitter</a> <a     href="https://www.linkedin.com/in/henaojorge" target='_blank'/>LinkedIn</a>    </div>
         """, unsafe_allow_html=True)
+    question_samples_str = """¿Que es el ADRES?
+¿Cuándo se implementará el Sistema de Salud?
 ¿Cómo se implementará el Sistema de Salud?
 ¿Qué es principio de interpretación y fundamento de la transición en relación al Sistema de Salud?
 ¿Qué se garantiza en todo momento con el nuevo Sistema de Salud?
         result = []
         for i in range(0, len(query_result)):
             item = query_result[i]
+            result.append([[i+1], item.answer.replace("\n",""), item.context[:200],
+                        item.meta['title'], item.meta['source_title'],
+                        int(item.meta['page']), item.meta['source_url']])
             #result.append([[i+1], item.answer, item.context[:200], item.meta['title']])
         return result
             st.subheader(f"{answer[1]}")
             # cropped answer
             doc = answer[2][:250] + "..."
+            st.markdown(f"{doc}[**Lee más aquí**]({answer[6]})")
             st.caption(f"Fuente: {answer[4]} - Capítulo: {answer[3]} - Página: {answer[5]}")
         st.markdown("---")