Spaces:

morenomp
/

Python-Huggingface

Sleeping

App Files Files Community

morenomp commited on 15 days ago

Commit

0a227d1

0 Parent(s):

HF - PARTE 0

Browse files

Files changed (6) hide show

app.py +29 -0
documents.json +7 -0
rag_engine.py +53 -0
requirements.txt +14 -0
test/test-api-space.py +13 -0
test/test_api.py +0 -0

app.py ADDED Viewed

	@@ -0,0 +1,29 @@

+# ENUNCIADO
+# app.py
+#
+# Este archivo construirá la interfaz web con Gradio.
+# Función principal ask:
+# Se debe definir una función ask(query, top_k, umbral) que:
+#   • Reciba:
+#       o query (str): la pregunta del usuario.
+#       o top_k (int): número de documentos a recuperar.
+#       o umbral (float): umbral de similitud.
+# • Utilice las funciones del módulo rag_engine para obtener los documentos
+#   relevantes y la respuesta generada.
+# • Formatee los documentos recuperados para mostrarlos de forma legible (por
+#   ejemplo, uniendo los textos con separadores como \n\n---\n\n).
+# • Retorne (respuesta, docs_formateados).
+#
+# Interfaz Gradio
+# • Utilizar gr.Blocks con un título y descripción.
+# • Tiene:
+#   o Un gr.Textbox para la pregunta (con placeholder).
+#   o Un gr.Slider para top_k (valores de 1 a 5, valor por defecto 5, paso 1).
+#   o Un gr.Slider para umbral (valores de 0.0 a 1.0, valor por defecto 0.55,
+#     paso 0.05).
+#   o Un gr.Textbox para mostrar la respuesta (de 3 líneas).
+#   o Un gr.Textbox para mostrar los documentos recuperados (de 6 líneas,
+#     máximo 15).
+#   o Un botón Enviar que al hacer clic ejecute la función ask con los valores
+#     de entrada y actualice las salidas.
+# • Por último, lanzar la interfaz con .launch().

documents.json ADDED Viewed

	@@ -0,0 +1,7 @@

+{
+    "doc1": "Hospital contact details: You can contact the hospital at email testing@gmail.com, phone +911234567890, or visit us at xyz, abc, 1234, Nepal.",
+    "doc2": "Hospital's working hours: The hospital's working hours are 7:00 AM - 8:00 PM daily.",
+    "doc3": "Official email address: The official email address to contact the hospital is testing@gmail.com.",
+    "doc4": "Main services: We provide comprehensive healthcare services including emergency care, diagnostic testing, surgical procedures, maternity services, and specialized treatments.",
+    "doc5": "Hospital location: The hospital is located at xyz, abc, 1234, Nepal."
+}

rag_engine.py ADDED Viewed

	@@ -0,0 +1,53 @@

+# ENUNCIADO
+# rag_engine.py
+#
+# Este archivo contendrá toda la lógica del motor RAG. Se deben
+# implementar obligatoriamente las siguientes funciones (con los nombres y parámetros
+# exactos que se indican).
+# Al inicio del script se deben cargar:
+#   • El modelo de embeddings: SentenceTransformer("MongoDB/mdbr-leaf-ir")
+#   • El modelo de lenguaje: PleIAs/Pleias-RAG350M (usando AutoTokenizer y AutoModelForCausalLM de transformers).
+#   • Los documentos desde documents.json.
+# Función recuperar_documentos(consulta, top_k=2, umbral=0.4)
+# Dada una consulta en inglés, recupera los documentos más relevantes de la base de conocimiento.
+#   • Parámetros:
+#       o consulta (str): pregunta del usuario.
+#       o top_k (int): número máximo de documentos a retornar.
+#       o umbral (float): valor mínimo de similitud (coseno) para considerar un
+#         documento relevante. Los documentos con similitud inferior a este
+#         umbral se descartan.
+#   • Proceso:
+#       1. Calcular el embedding de la consulta y de todos los documentos
+#          (preferiblemente una sola vez al cargar el script y almacenarlos para
+#          evitar recalcular).
+#       2. Calcular la similitud del coseno entre el embedding de la consulta y los
+#          embeddings de los documentos.
+#       3. Ordenar los documentos de mayor a menor similitud.
+#       4. Recorrer en ese orden y seleccionar aquellos cuya similitud sea mayor o
+#          igual al umbral, hasta un máximo de top_k documentos.
+#   • Retorno: Lista con los textos de los documentos seleccionados.
+# Función generar_respuesta(consulta, documentos_recuperados)
+# Genera una respuesta usando el modelo de lenguaje, inyectando los documentos
+# recuperados como contexto.
+# Parámetros:
+#   o consulta (str): pregunta original del usuario.
+#   o documentos_recuperados (list): lista de textos con los documentos
+# relevantes.
+# Proceso:
+#   1. Se concatenan todos los documentos en un solo string (por ejemplo,
+#   separados por espacios).
+#   2. Se construye un prompt con el siguiente formato:
+#   “””
+#   Answer the question based only on the context provided
+#   Context: <" ".join(documentos_recuperados)>
+#   Question: <consulta>
+#   Answer:
+#   “””
+#   3. Se genera la respuesta con el modelo
+# Retorno: Cadena con la respuesta generada.
+# Función preguntar(consulta, top_k=2, umbral=0.4)
+#   • Descripción:
+#       o Función de alto nivel que une la lógica de recuperar_documentos y
+#         generar_respuestas
+#   • Parámetros: los mismos que recuperar_documentos.
+#   • Retorno: La respuesta generada (cadena).

requirements.txt ADDED Viewed

	@@ -0,0 +1,14 @@

+# ENUNCIADO
+# documents.json y requirements.txt (ya vienen dados)
+#
+# documents.json contendrá un conjunto de documentos en inglés que servirán como base
+# de conocimiento para el chatbot.
+torch
+transformers
+sentence-transformers
+scikit-learn
+fastapi
+uvicorn
+gradio
+pydantic

test/test-api-space.py ADDED Viewed

	@@ -0,0 +1,13 @@

+# Una vez hemos hecho el deploy en Hugging Face, podemos probar la API de Gradio
+# usando el cliente de Gradio (https://github.com/gradio-app/gradio-client)
+from gradio_client import Client
+client = Client("manuell01/practica-chat")
+result = client.predict(
+	query="Where is the hospital located!!",
+	top_k=5,
+	umbral=0.55,
+	api_name="/ask"
+)
+print(result[0])

test/test_api.py ADDED Viewed

File without changes