File size: 2,098 Bytes
34c8b88
 
 
 
 
 
 
 
 
 
 
 
04d1e08
34c8b88
 
 
 
 
dff68c7
 
 
 
 
 
 
 
 
 
04d1e08
dff68c7
 
 
 
 
 
 
 
 
 
 
 
04d1e08
 
 
dff68c7
04d1e08
dff68c7
04d1e08
 
 
 
dff68c7
04d1e08
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
---
language: es
license: apache-2.0
datasets:
- vmunozf/dataset
metrics:
- accuracy
tags:
- nlp
- qa
- spanish
model_type: llama
pipeline_tag: question-answering
library_name: transformers
widget:
- text: "¿Cuál es la principal causa de la crisis hídrica en América Latina según los estudios mencionados?"
---

# Dataset: vmunozf/dataset

Este dataset está diseñado para entrenar y probar modelos de lenguaje con enfoque en preguntas y respuestas en español. La información contenida está estructurada para facilitar su uso en tareas de procesamiento de lenguaje natural (NLP).

## Estructura del Dataset

El archivo contiene dos columnas principales:
- **Pregunta**: Incluye preguntas formuladas en español relacionadas con temas de interés.
- **Respuesta**: Proporciona la respuesta correspondiente a cada pregunta.

### Ejemplo de datos:
| Pregunta                                                        | Respuesta                               |
|-----------------------------------------------------------------|----------------------------------------|
| ¿Qué porcentaje de los recursos hídricos renovables del mundo se encuentra en América Latina y el Caribe? | 35%.                                  |
| ¿Cuál es la principal causa de la crisis hídrica en América Latina según los estudios mencionados? | La mala gestión de los recursos hídricos. |

## Uso

Este dataset puede ser utilizado para:
1. Entrenamiento y fine-tuning de modelos de lenguaje (por ejemplo, LLaMA, GPT, BERT).
2. Pruebas de inferencia en sistemas de preguntas y respuestas.
3. Evaluación de modelos en tareas de comprensión y generación de texto en español.

### Ejemplo de uso:
```python
from transformers import pipeline

qa_pipeline = pipeline("question-answering", model="vmunozf/llama", tokenizer="vmunozf/llama")

result = qa_pipeline({
    "question": "¿Cuál es la principal causa de la crisis hídrica en América Latina según los estudios mencionados?",
    "context": "Según los estudios, la mala gestión de los recursos hídricos es la principal causa."
})

print(result)