ask2democracycol / about.py
Jorge Henao
pinecone refactor
92361bf
raw
history blame
No virus
3.8 kB
from pinecone_quieries import PineconeProposalQueries
import streamlit as st
def show_about_ask2democracy():
description = """
<h2>Sobre esta iniciativa</h2>
<p>Muchas de las discusiones que ocurren en Colombia generalmente están sustentadas en artículos o pdfs que salvo pocas excepciones, casi nadie lee.
Este sistema ha indexado algunos textos relevantes para la discución pública que suelen estar dispersos y poco accesibles, además, apoyandose en modelos de lenguaje Transformers (abajo más detalles) puede entender preguntas elaboradas.
Algunos de los textos indexados: las propuestas presidenciales del 22, los hallazgos de la comisión de la verdad, los textos de las reformas, entre otros.
<div align="right">
Creado por Jorge Henao 🇨🇴 <a href="https://twitter.com/jhenaotw" target='_blank'>Twitter</a> <a href="https://www.linkedin.com/in/henaojorge" target='_blank'/>LinkedIn</a>
</div>
<p>
<h2>¿Cómo utilizar este espacio?</h2>
Selecciona la colección de documentos sobre la que quieres buscar en el panel de la izquierda y escribe preguntas.
No se trata de un sistema de búsquedas basado en palabras clave, por el contrario, puedes redactar preguntas más extensas y elaboradas. Cuanto más contexto le des a la pregunta mejores resultados se obtienen.
<h2>Integración opcional con OpenAI</h2>
Este espacio usa recursos de computo de Hugging Face y y una base de datos vectorial Pinecone sin costo para el usuario. De manera opcional, si tienes una cuenta en OpenAI también puedes activar la integración copiando tu API key en el panel de la izquierda.
Una vez ingreses el api key, cada vez que preguntes el sistema la usará para generar una respuesta a partir de los resultados de búsqueda obtenidos.
También puedes configurar la temperatura y la cantidad de tokens.
<p><p><b>Nota:El sistema no guarda tu API key, la utiliza para aumentar tus consultas mientras lo uses.</b>
<h2>Inteligencia artificial y democracia</h2>
Pretende ayudar a construir democracia participativa apaloncándose en el estado del arte de la inteligencia artificial.
Siendo una herramienta que aporta a la discución pública, empoderando al ciudadano del común para ser partícipe del debate público mientras hace preguntas en su propio lenguaje, y llegando a sus propias conclusiones.
<p>
Uno de los objetivos es contribuir a la inteligencia artificial abierta y en español, con la construcción de un dataset y el entrenamiento de un modelo de lenguaje adaptado para las discuciones ciudadanas.
Algo útil para elevar la calidad del debate en todos los países de habla hispana.
<h2>Ask2Democracy v 1.2</h2>
Esta version usa sentence transformers, Cosine similarity, <a href= "https://github.com/deepset-ai/haystack">Haystack framework</a> y una base de dactos vectorial Pinecone para mejorar la precision en las respuestas.
Los modelos transformers de lenguaje utilizados son:
<code>
sentence-transformers/multi-qa-MiniLM-L6-cos-v1
deepset/xlm-roberta-base-squad2-distilled
</code>
<a href= "https://github.com/jorge-henao/ask_to_democracy"> repo en github con FastAPI</a>
<h2>Beta disclaimer</h2>
Las respuestas que arroja el sistema no han sido pregrabadas ni basadas en opiniones. Todas son respuestas extraídas de fuentes oficiales, como el Informe final de la CEV.
Este explorador usa modelos de lenguaje para entender el lenguaje español, sin embargo, necesita de un mayor entrenamiento por lo que, en ocasiones, puede ser confuso y no tan preciso.
Si quieres apoyar escríbeme a <a href="mailto:jorge.henao@diezonce.co">jorge.henao@diezonce.co</a>
</p>
"""
st.markdown(description, unsafe_allow_html=True)