Edit Models filters

Tasks

Text Generation

Image-Text-to-Text

Parameters

Libraries

Transformers.js

Apps

Inference Providers

Models

6,343

Full-text search

Active filters: image-text-to-text

microsoft/Florence-2-base-ft

Image-Text-to-Text • 0.2B • Updated Aug 4 • 44k • 130

HuggingFaceM4/Florence-2-DocVQA

Image-Text-to-Text • 0.8B • Updated Oct 30, 2024 • 1.93k • 61

OpenGVLab/InternVL2-8B

Image-Text-to-Text • 8B • Updated Mar 25 • 34.1k • 177

OpenGVLab/InternVL2-40B

Image-Text-to-Text • 40B • Updated Mar 25 • 12.4k • 94

llava-hf/llava-onevision-qwen2-7b-ov-hf

Image-Text-to-Text • 8B • Updated Jun 18 • 86.8k • 34

microsoft/Phi-3.5-vision-instruct

Image-Text-to-Text • 4B • Updated Sep 26, 2024 • 519k • 704

ContactDoctor/Bio-Medical-MultiModal-Llama-3-8B-V1

Image-Text-to-Text • 9B • Updated May 28 • 63 • 141

TheFinAI/FinLLaVA

Image-Text-to-Text • 8B • Updated Aug 28, 2024 • 175 • 19

Qwen/Qwen2-VL-2B

Image-Text-to-Text • 2B • Updated Dec 6, 2024 • 5.06k • 53

meta-llama/Llama-3.2-90B-Vision-Instruct

Image-Text-to-Text • 89B • Updated Mar 4 • 17.2k • • 342

allenai/MolmoE-1B-0924

Image-Text-to-Text • Updated Apr 24 • 2.07k • 153

allenai/Molmo-7B-D-0924

Image-Text-to-Text • 8B • Updated Apr 4 • 21.8k • 545

allenai/Molmo-72B-0924

Image-Text-to-Text • 73B • Updated Jun 19 • 4.59k • 291

rhymes-ai/Aria

Image-Text-to-Text • 25B • Updated Apr 23 • 56.6k • 634

microsoft/OmniParser

Image-Text-to-Text • Updated Dec 2, 2024 • 1.66k • 1.69k

PULSE-ECG/PULSE-7B

Image-Text-to-Text • 7B • Updated Oct 28, 2024 • 1.02k • 25

NCSOFT/VARCO-VISION-14B

Image-Text-to-Text • 15B • Updated Jul 16 • 7.18k • 34

bartowski/Qwen2-VL-7B-Instruct-GGUF

Image-Text-to-Text • 8B • Updated Dec 17, 2024 • 1.31k • 40

prithivMLmods/Qwen2-VL-OCR-2B-Instruct

Image-Text-to-Text • 2B • Updated May 2 • 3.6k • 96

prince-canuma/deepseek-vl2

Image-Text-to-Text • 27B • Updated Dec 22, 2024 • 2 • 1

Qwen/QVQ-72B-Preview

Image-Text-to-Text • 73B • Updated Jan 12 • 42.2k • 608

MBZUAI/AIN

Image-Text-to-Text • 8B • Updated Mar 13 • 5.02k • 11

nvidia/Eagle2-9B

Image-Text-to-Text • 9B • Updated Jan 28 • 376 • 61

HuggingFaceTB/SmolVLM-256M-Instruct

Image-Text-to-Text • 0.3B • Updated Apr 8 • 242k • 281

ByteDance-Seed/UI-TARS-2B-SFT

Image-Text-to-Text • 2B • Updated Jan 25 • 14.7k • 26

ByteDance-Seed/UI-TARS-72B-DPO

Image-Text-to-Text • 73B • Updated Jan 25 • 3.52k • 142

krutrim-ai-labs/Chitrarth

Image-Text-to-Text • 8B • Updated Mar 26 • 38.9k • 15

Qwen/Qwen2.5-VL-72B-Instruct-AWQ

Image-Text-to-Text • 13B • Updated Mar 7 • 47.6k • 64

Qwen/Qwen2.5-VL-7B-Instruct-AWQ

Image-Text-to-Text • 3B • Updated Apr 6 • 550k • 85

google/gemma-3-27b-pt

Image-Text-to-Text • 27B • Updated Mar 21 • 14.6k • 107