metadata
language:
- en
- es
tags:
- image-to-text
- computer-vision
- captioning
pipeline_tag: image-to-text
license: apache-2.0
widget:
- src: >-
https://huggingface.co/datasets/your-username/your-dataset/resolve/main/example-image.jpg
Modelo de Imagen a Texto
Este modelo toma una imagen como entrada y genera una descripci贸n en texto como salida. Es ideal para tareas de captioning (creaci贸n de subt铆tulos) en im谩genes y puede usarse en aplicaciones como accesibilidad visual o para agregar descripciones a im谩genes autom谩ticamente.
Uso
Para utilizar este modelo, simplemente proporciona una imagen como entrada. El modelo devolver谩 una descripci贸n en texto.
Ejemplo de c贸digo
Puedes utilizar el siguiente c贸digo en Python con la biblioteca transformers
y Pillow
para realizar inferencias:
from transformers import pipeline
from PIL import Image
# Cargar el pipeline para imagen a texto
image_to_text = pipeline("image-to-text", model="your-username/your-model-name")
# Cargar una imagen
image = Image.open("path/to/your-image.jpg")
# Obtener el texto de salida
caption = image_to_text(image)
print("Descripci贸n generada:", caption[0]['generated_text'])