wongyukim's picture

wongyukim

wongyukim

·

kimwongyuda

AI & ML interests

None yet

Recent Activity

upvoted a paper about 13 hours ago

Why Reasoning Matters? A Survey of Advancements in Multimodal Reasoning (v1)

upvoted a paper about 13 hours ago

T1: Tool-integrated Self-verification for Test-time Compute Scaling in Small Language Models

upvoted a paper about 13 hours ago

Rethinking Reflection in Pre-Training

View all activity

Organizations

None yet

wongyukim's activity

upvoted 4 papers about 13 hours ago

Why Reasoning Matters? A Survey of Advancements in Multimodal Reasoning (v1)

Paper • 2504.03151 • Published 6 days ago • 9

T1: Tool-integrated Self-verification for Test-time Compute Scaling in Small Language Models

Paper • 2504.04718 • Published 3 days ago • 33

Rethinking Reflection in Pre-Training

Paper • 2504.04022 • Published 5 days ago • 67

One-Minute Video Generation with Test-Time Training

Paper • 2504.05298 • Published 2 days ago • 75

upvoted 3 papers 1 day ago

Slow-Fast Architecture for Video Multi-Modal Large Language Models

Paper • 2504.01328 • Published 8 days ago • 6

MME-Unify: A Comprehensive Benchmark for Unified Multimodal Understanding and Generation Models

Paper • 2504.03641 • Published 5 days ago • 12

Multi-SWE-bench: A Multilingual Benchmark for Issue Resolving

Paper • 2504.02605 • Published 6 days ago • 39

upvoted 3 papers 5 days ago

ShortV: Efficient Multimodal Large Language Models by Freezing Visual Tokens in Ineffective Layers

Paper • 2504.00502 • Published 8 days ago • 21

GPT-ImgEval: A Comprehensive Benchmark for Diagnosing GPT4o in Image Generation

Paper • 2504.02782 • Published 6 days ago • 54

PaperBench: Evaluating AI's Ability to Replicate AI Research

Paper • 2504.01848 • Published 7 days ago • 34

upvoted a paper 6 days ago

Exploring the Effect of Reinforcement Learning on Video Understanding: Insights from SEED-Bench-R1

Paper • 2503.24376 • Published 9 days ago • 36

upvoted a paper 8 days ago

OThink-MR1: Stimulating multimodal generalized reasoning capabilities via dynamic reinforcement learning

Paper • 2503.16081 • Published 20 days ago • 26

upvoted 2 papers 11 days ago

Embodied-Reasoner: Synergizing Visual Search, Reasoning, and Action for Embodied Interactive Tasks

Paper • 2503.21696 • Published 13 days ago • 21

Large Language Model Agent: A Survey on Methodology, Applications and Challenges

Paper • 2503.21460 • Published 13 days ago • 71

upvoted 6 papers 13 days ago

Video-R1: Reinforcing Video Reasoning in MLLMs

Paper • 2503.21776 • Published 13 days ago • 76

Gemma 3 Technical Report

Paper • 2503.19786 • Published 15 days ago • 43

Gemini Robotics: Bringing AI into the Physical World

Paper • 2503.20020 • Published 15 days ago • 23

LEGO-Puzzles: How Good Are MLLMs at Multi-Step Spatial Reasoning?

Paper • 2503.19990 • Published 15 days ago • 33

Wan: Open and Advanced Large-Scale Video Generative Models

Paper • 2503.20314 • Published 14 days ago • 47

Qwen2.5-Omni Technical Report

Paper • 2503.20215 • Published 15 days ago • 129