12 19 7

Henry Hengyuan Zhao

hhenryz

https://zhaohengyuan1.github.io/

ZHHHYuan
zhaohengyuan1

AI & ML interests

Multimodal Reasoning, Human-AI Interaction, GUI Automation

Recent Activity

upvoted a paper 7 days ago

UI-Vision: A Desktop-centric GUI Benchmark for Visual Perception and Interaction

upvoted a paper 10 days ago

Long-Context Autoregressive Video Modeling with Next-Frame Prediction

upvoted a paper 10 days ago

Feather-SQL: A Lightweight NL2SQL Framework with Dual-Model Collaboration Paradigm for Small Language Models

View all activity

Organizations

Collections 1

Papers 4

models 1

hhenryz/LOVA3-llava-v1.5-7b

Image-Text-to-Text • Updated Feb 24 • 28 • 1

datasets 2

hhenryz/Mixed_VQA_GenQA_EvalQA_1.5M

Preview • Updated Feb 24 • 128 • 1

hhenryz/EvalQABench

Preview • Updated Feb 24 • 145

Henry Hengyuan Zhao

AI & ML interests

Recent Activity

Organizations

Collections 1

MLGym: A New Framework and Benchmark for Advancing AI Research Agents

Can MLLMs Reason in Multimodality? EMMA: An Enhanced MultiModal ReAsoning Benchmark

Multimodal RewardBench: Holistic Evaluation of Reward Models for Vision Language Models

CodeCriticBench: A Holistic Code Critique Benchmark for Large Language Models

Papers 4

models 1

hhenryz/LOVA3-llava-v1.5-7b

datasets 2

hhenryz/Mixed_VQA_GenQA_EvalQA_1.5M

hhenryz/EvalQABench

Henry Hengyuan Zhao

AI & ML interests

Recent Activity

Organizations

Collections 1

Papers 4

models 1

datasets 2 Sort: Recently updated

datasets 2