metadata

language: es
license: apache-2.0
datasets:
  - vmunozf/dataset
metrics:
  - accuracy
tags:
  - nlp
  - qa
  - spanish
model_type: llama
pipeline_tag: question-answering
library_name: transformers
widget:
  - text: >-
      ¿Cuál es la principal causa de la crisis hídrica en América Latina según
      los estudios mencionados?

Dataset: vmunozf/dataset

Este dataset está diseñado para entrenar y probar modelos de lenguaje con enfoque en preguntas y respuestas en español. La información contenida está estructurada para facilitar su uso en tareas de procesamiento de lenguaje natural (NLP).

Estructura del Dataset

El archivo contiene dos columnas principales:

Pregunta: Incluye preguntas formuladas en español relacionadas con temas de interés.
Respuesta: Proporciona la respuesta correspondiente a cada pregunta.

Ejemplo de datos:

Pregunta	Respuesta
¿Qué porcentaje de los recursos hídricos renovables del mundo se encuentra en América Latina y el Caribe?	35%.
¿Cuál es la principal causa de la crisis hídrica en América Latina según los estudios mencionados?	La mala gestión de los recursos hídricos.

Uso

Este dataset puede ser utilizado para:

Entrenamiento y fine-tuning de modelos de lenguaje (por ejemplo, LLaMA, GPT, BERT).
Pruebas de inferencia en sistemas de preguntas y respuestas.
Evaluación de modelos en tareas de comprensión y generación de texto en español.

Ejemplo de uso:

from transformers import pipeline

qa_pipeline = pipeline("question-answering", model="vmunozf/llama", tokenizer="vmunozf/llama")

result = qa_pipeline({
    "question": "¿Cuál es la principal causa de la crisis hídrica en América Latina según los estudios mencionados?",
    "context": "Según los estudios, la mala gestión de los recursos hídricos es la principal causa."
})

print(result)