File size: 2,481 Bytes
1ca9ff1
 
 
 
 
 
 
 
 
 
 
7b8a562
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1ca9ff1
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
---
title: Multimodal Network Designer
emoji: 🐠
colorFrom: red
colorTo: yellow
sdk: gradio
sdk_version: 5.16.0
app_file: app.py
pinned: false
---

# Multimodal Neural Network Designer & Dataset Generator

![Hugging Face Spaces](https://img.shields.io/badge/Hugging%20Face-Spaces-blue)  
![License](https://img.shields.io/badge/license-MIT-green)

---

## Descripción
Este Space permite diseñar encabezados de datasets multimodales y generar CSVs combinando datasets públicos de HuggingFace.  
Soporta tareas de NLP, Visión, Audio, RAG y más, con una interfaz en español y lógica automatizada.

---

## Características Principales
1. **Selección de Tareas**:
   - Elige entre tareas multimodales (ej. "Clasificación de texto", "Detección de objetos").
   - Las opciones se actualizan automáticamente desde [HuggingFace Datasets](https://huggingface.co/datasets).

2. **Generación Inteligente de Encabezados**:
   - Crea encabezados de CSV basados en las tareas seleccionadas.
   - Ejemplo: `id,text_input,text_output,label`.

3. **Búsqueda de Datasets**:
   - Encuentra datasets compatibles con tus tareas (ej. `imdb` para clasificación de texto).
   - Filtra por licencia (MIT, Apache) y tamaño (small, medium, large).

4. **Generación de CSV**:
   - Combina datos de múltiples datasets en un solo CSV.
   - Paginación para manejar grandes volúmenes de datos.

5. **Actualización Automática**:
   - Refresca `modalidades_tareas.json` con tareas y columnas reales de HuggingFace.

---

## Requisitos
- Python 3.8+
- Dependencias:
  ```bash
  pip install -r requirements.txt


## Flujo de Trabajo Técnico
- modalidades_tareas.json :
    Define tareas en inglés (ej. text-classification) y sus columnas asociadas.
    Nombres en español se mapean automáticamente usando un diccionario interno.
- Búsqueda en HuggingFace :
    Usa tags oficiales (ej. task:text-classification) para encontrar datasets.
- Mapeo de Columnas :
    Si un dataset no tiene una columna requerida, se rellena con valor_default.


## Problemas Conocidos
  - JSON Corrupto : Si modalidades_tareas.json no existe, pulsa "Actualizar Modalidades desde HuggingFace".
  - Datasets Incompatibles : Algunos datasets pueden no tener columnas esperadas (ej. image en lugar de imagen_path).
  - API Key : No es necesaria para datasets públicos, pero podría requerirse para modelos premium.


Check out the configuration reference at https://huggingface.co/docs/hub/spaces-config-reference