SergioSCA's picture
Update README.md
7b8a562 verified

A newer version of the Gradio SDK is available: 5.44.1

Upgrade
metadata
title: Multimodal Network Designer
emoji: 🐠
colorFrom: red
colorTo: yellow
sdk: gradio
sdk_version: 5.16.0
app_file: app.py
pinned: false

Multimodal Neural Network Designer & Dataset Generator

Hugging Face Spaces
License


Descripción

Este Space permite diseñar encabezados de datasets multimodales y generar CSVs combinando datasets públicos de HuggingFace.
Soporta tareas de NLP, Visión, Audio, RAG y más, con una interfaz en español y lógica automatizada.


Características Principales

  1. Selección de Tareas:

    • Elige entre tareas multimodales (ej. "Clasificación de texto", "Detección de objetos").
    • Las opciones se actualizan automáticamente desde HuggingFace Datasets.
  2. Generación Inteligente de Encabezados:

    • Crea encabezados de CSV basados en las tareas seleccionadas.
    • Ejemplo: id,text_input,text_output,label.
  3. Búsqueda de Datasets:

    • Encuentra datasets compatibles con tus tareas (ej. imdb para clasificación de texto).
    • Filtra por licencia (MIT, Apache) y tamaño (small, medium, large).
  4. Generación de CSV:

    • Combina datos de múltiples datasets en un solo CSV.
    • Paginación para manejar grandes volúmenes de datos.
  5. Actualización Automática:

    • Refresca modalidades_tareas.json con tareas y columnas reales de HuggingFace.

Requisitos

  • Python 3.8+
  • Dependencias:
    pip install -r requirements.txt
    

Flujo de Trabajo Técnico

  • modalidades_tareas.json : Define tareas en inglés (ej. text-classification) y sus columnas asociadas. Nombres en español se mapean automáticamente usando un diccionario interno.
  • Búsqueda en HuggingFace : Usa tags oficiales (ej. task:text-classification) para encontrar datasets.
  • Mapeo de Columnas : Si un dataset no tiene una columna requerida, se rellena con valor_default.

Problemas Conocidos

  • JSON Corrupto : Si modalidades_tareas.json no existe, pulsa "Actualizar Modalidades desde HuggingFace".
  • Datasets Incompatibles : Algunos datasets pueden no tener columnas esperadas (ej. image en lugar de imagen_path).
  • API Key : No es necesaria para datasets públicos, pero podría requerirse para modelos premium.

Check out the configuration reference at https://huggingface.co/docs/hub/spaces-config-reference