Wu Chengyue's picture

Wu Chengyue

WuChengyue

·

AI & ML interests

None yet

Organizations

WuChengyue's activity

upvoted a paper 17 days ago

What matters when building vision-language models?

Paper • 2405.02246 • Published about 1 month ago • 87

upvoted a paper 20 days ago

Plot2Code: A Comprehensive Benchmark for Evaluating Multi-modal Large Language Models in Code Generation from Scientific Plots

Paper • 2405.07990 • Published 20 days ago • 15

upvoted a paper about 2 months ago

Adapting LLaMA Decoder to Vision Transformer

Paper • 2404.06773 • Published Apr 10 • 13

upvoted a paper 3 months ago

Unlocking the conversion of Web Screenshots into HTML Code with the WebSight Dataset

Paper • 2403.09029 • Published Mar 14 • 53

upvoted a collection 3 months ago

AnyLLM-Pro

6 items • Updated Feb 27 • 4

upvoted 2 papers 3 months ago

FiT: Flexible Vision Transformer for Diffusion Model

Paper • 2402.12376 • Published Feb 19 • 46

Synthetic Data (Almost) from Scratch: Generalized Instruction Tuning for Language Models

Paper • 2402.13064 • Published Feb 20 • 45