Zikun Li

zikun-li

AI & ML interests

None yet

Recent Activity

upvoted a paper 26 days ago

Large Language Model Agent: A Survey on Methodology, Applications and Challenges

upvoted a paper 26 days ago

Challenging the Boundaries of Reasoning: An Olympiad-Level Math Benchmark for Large Language Models

upvoted a paper 26 days ago

Video-R1: Reinforcing Video Reasoning in MLLMs

View all activity

Organizations

None yet

zikun-li's activity

upvoted 3 papers 26 days ago

Large Language Model Agent: A Survey on Methodology, Applications and Challenges

Paper • 2503.21460 • Published 27 days ago • 76

Challenging the Boundaries of Reasoning: An Olympiad-Level Math Benchmark for Large Language Models

Paper • 2503.21380 • Published 27 days ago • 37

Video-R1: Reinforcing Video Reasoning in MLLMs

Paper • 2503.21776 • Published 27 days ago • 78

upvoted 10 papers 27 days ago

Vision-R1: Evolving Human-Free Alignment in Large Vision-Language Models via Vision-Guided Reinforcement Learning

Paper • 2503.18013 • Published Mar 23 • 19

SimpleRL-Zoo: Investigating and Taming Zero Reinforcement Learning for Open Base Models in the Wild

Paper • 2503.18892 • Published about 1 month ago • 30

Video-T1: Test-Time Scaling for Video Generation

Paper • 2503.18942 • Published about 1 month ago • 88

Think Twice: Enhancing LLM Reasoning by Scaling Multi-round Test-time Thinking

Paper • 2503.19855 • Published 29 days ago • 26

Long-Context Autoregressive Video Modeling with Next-Frame Prediction

Paper • 2503.19325 • Published 30 days ago • 72

Dita: Scaling Diffusion Transformer for Generalist Vision-Language-Action Policy

Paper • 2503.19757 • Published 29 days ago • 50

Qwen2.5-Omni Technical Report

Paper • 2503.20215 • Published 29 days ago • 140

upvoted 7 papers about 1 month ago

DiffMoE: Dynamic Token Selection for Scalable Diffusion Transformers

Paper • 2503.14487 • Published Mar 18 • 27

Survey on Evaluation of LLM-based Agents

Paper • 2503.16416 • Published Mar 20 • 88

Stop Overthinking: A Survey on Efficient Reasoning for Large Language Models

Paper • 2503.16419 • Published Mar 20 • 71

Small Models Struggle to Learn from Strong Reasoners

Paper • 2502.12143 • Published Feb 17 • 35

Aligning Multimodal LLM with Human Preference: A Survey

Paper • 2503.14504 • Published Mar 18 • 23

Multimodal Chain-of-Thought Reasoning: A Comprehensive Survey

Paper • 2503.12605 • Published Mar 16 • 34

R1-VL: Learning to Reason with Multimodal Large Language Models via Step-wise Group Relative Policy Optimization

Paper • 2503.12937 • Published Mar 17 • 28