Wenxuan Huang's picture

1 2 2

Wenxuan Huang

Osilly

·

Osilly

AI & ML interests

None yet

Recent Activity

authored a paper 6 days ago

Dynamic-LLaVA: Efficient Multimodal Large Language Models via Dynamic Vision-language Context Sparsification

authored a paper 6 days ago

Vision-R1: Incentivizing Reasoning Capability in Multimodal Large Language Models

liked a model 11 days ago

Osilly/Vision-R1-7B

View all activity

Organizations

Osilly's activity

upvoted 2 papers 13 days ago

Vision-R1: Incentivizing Reasoning Capability in Multimodal Large Language Models

Paper • 2503.06749 • Published Mar 9 • 29

VCR-Bench: A Comprehensive Evaluation Framework for Video Chain-of-Thought Reasoning

Paper • 2504.07956 • Published 14 days ago • 45