20 80 133

Weiyun Wang

Weiyun1025

Weiyun1025

AI & ML interests

None yet

Recent Activity

upvoted a paper about 8 hours ago

VisuLogic: A Benchmark for Evaluating Visual Reasoning in Multi-modal Large Language Models

authored a paper about 12 hours ago

VisuLogic: A Benchmark for Evaluating Visual Reasoning in Multi-modal Large Language Models

liked a model about 22 hours ago

Qwen/Qwen2.5-7B

View all activity

Organizations

Weiyun1025's activity

upvoted a paper about 8 hours ago

VisuLogic: A Benchmark for Evaluating Visual Reasoning in Multi-modal Large Language Models

Paper • 2504.15279 • Published 3 days ago • 54

upvoted a paper 1 day ago

Kimi-VL Technical Report

Paper • 2504.07491 • Published 15 days ago • 121

upvoted a paper 2 days ago

Eagle 2.5: Boosting Long-Context Post-Training for Frontier Vision-Language Models

Paper • 2504.15271 • Published 3 days ago • 60

upvoted a paper 4 days ago

SmolVLM: Redefining small and efficient multimodal models

Paper • 2504.05299 • Published 17 days ago • 171

upvoted a paper 7 days ago

ColorBench: Can VLMs See and Understand the Colorful World? A Comprehensive Benchmark for Color Perception, Reasoning, and Robustness

Paper • 2504.10514 • Published 14 days ago • 45

upvoted a paper 10 days ago

InternVL3: Exploring Advanced Training and Test-Time Recipes for Open-Source Multimodal Models

Paper • 2504.10479 • Published 10 days ago • 239

upvoted a collection 14 days ago

InternVL3

Collection

34 items • Updated 5 days ago • 55

upvoted a paper 21 days ago

Envisioning Beyond the Pixels: Benchmarking Reasoning-Informed Visual Editing

Paper • 2504.02826 • Published 21 days ago • 67

upvoted a paper 29 days ago

Dita: Scaling Diffusion Transformer for Generalist Vision-Language-Action Policy

Paper • 2503.19757 • Published about 1 month ago • 50

upvoted a collection about 1 month ago

VisualPRM

Collection

5 items • Updated 5 days ago • 2

upvoted a paper about 1 month ago

VisualPRM: An Effective Process Reward Model for Multimodal Reasoning

Paper • 2503.10291 • Published Mar 13 • 36

upvoted 7 papers about 2 months ago

PipeOffload: Improving Scalability of Pipeline Parallelism with Memory Optimization

Paper • 2503.01328 • Published Mar 3 • 16

SigLIP 2: Multilingual Vision-Language Encoders with Improved Semantic Understanding, Localization, and Dense Features

Paper • 2502.14786 • Published Feb 20 • 143

upvoted a paper 2 months ago

Qwen2.5-VL Technical Report

Paper • 2502.13923 • Published Feb 19 • 182

upvoted a collection 2 months ago

SYNTHETIC-1

Collection

A collection of tasks & verifiers for reasoning datasets • 9 items • Updated Feb 20 • 51