File size: 2,481 Bytes
1ca9ff1 7b8a562 1ca9ff1 |
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 |
---
title: Multimodal Network Designer
emoji: 🐠
colorFrom: red
colorTo: yellow
sdk: gradio
sdk_version: 5.16.0
app_file: app.py
pinned: false
---
# Multimodal Neural Network Designer & Dataset Generator


---
## Descripción
Este Space permite diseñar encabezados de datasets multimodales y generar CSVs combinando datasets públicos de HuggingFace.
Soporta tareas de NLP, Visión, Audio, RAG y más, con una interfaz en español y lógica automatizada.
---
## Características Principales
1. **Selección de Tareas**:
- Elige entre tareas multimodales (ej. "Clasificación de texto", "Detección de objetos").
- Las opciones se actualizan automáticamente desde [HuggingFace Datasets](https://huggingface.co/datasets).
2. **Generación Inteligente de Encabezados**:
- Crea encabezados de CSV basados en las tareas seleccionadas.
- Ejemplo: `id,text_input,text_output,label`.
3. **Búsqueda de Datasets**:
- Encuentra datasets compatibles con tus tareas (ej. `imdb` para clasificación de texto).
- Filtra por licencia (MIT, Apache) y tamaño (small, medium, large).
4. **Generación de CSV**:
- Combina datos de múltiples datasets en un solo CSV.
- Paginación para manejar grandes volúmenes de datos.
5. **Actualización Automática**:
- Refresca `modalidades_tareas.json` con tareas y columnas reales de HuggingFace.
---
## Requisitos
- Python 3.8+
- Dependencias:
```bash
pip install -r requirements.txt
## Flujo de Trabajo Técnico
- modalidades_tareas.json :
Define tareas en inglés (ej. text-classification) y sus columnas asociadas.
Nombres en español se mapean automáticamente usando un diccionario interno.
- Búsqueda en HuggingFace :
Usa tags oficiales (ej. task:text-classification) para encontrar datasets.
- Mapeo de Columnas :
Si un dataset no tiene una columna requerida, se rellena con valor_default.
## Problemas Conocidos
- JSON Corrupto : Si modalidades_tareas.json no existe, pulsa "Actualizar Modalidades desde HuggingFace".
- Datasets Incompatibles : Algunos datasets pueden no tener columnas esperadas (ej. image en lugar de imagen_path).
- API Key : No es necesaria para datasets públicos, pero podría requerirse para modelos premium.
Check out the configuration reference at https://huggingface.co/docs/hub/spaces-config-reference
|