Yu Cheng's picture

13 4

Yu Cheng

ych133

·

https://ych133.github.io/

ych133

AI & ML interests

None yet

Recent Activity

authored a paper 15 minutes ago

Learning to Reason under Off-Policy Guidance

upvoted a collection 1 day ago

upvoted a paper 1 day ago

Learning to Reason under Off-Policy Guidance

View all activity

Organizations

None yet

ych133's activity

upvoted a collection 1 day ago

LUFFY-RL

6 items • Updated about 1 hour ago • 4

upvoted a paper 1 day ago

Learning to Reason under Off-Policy Guidance

Paper • 2504.14945 • Published 2 days ago • 61

upvoted a paper 4 days ago

Can MLLMs Reason in Multimodality? EMMA: An Enhanced MultiModal ReAsoning Benchmark

Paper • 2501.05444 • Published Jan 9 • 1

upvoted a paper 13 days ago

Skywork R1V: Pioneering Multimodal Reasoning with Chain-of-Thought

Paper • 2504.05599 • Published 15 days ago • 81

upvoted 2 papers 2 months ago

MoM: Linear Sequence Modeling with Mixture-of-Memories

Paper • 2502.13685 • Published Feb 19 • 35

Test-Time Preference Optimization: On-the-Fly Alignment via Iterative Textual Feedback

Paper • 2501.12895 • Published Jan 22 • 61

upvoted 3 papers 3 months ago

Process Reinforcement through Implicit Rewards

Paper • 2502.01456 • Published Feb 3 • 60

MiniMax-01: Scaling Foundation Models with Lightning Attention

Paper • 2501.08313 • Published Jan 14 • 286

PRMBench: A Fine-grained and Challenging Benchmark for Process-Level Reward Models

Paper • 2501.03124 • Published Jan 6 • 14

upvoted 3 papers 7 months ago

Towards World Simulator: Crafting Physical Commonsense-Based Benchmark for Video Generation

Paper • 2410.05363 • Published Oct 7, 2024 • 46

Grounded-VideoLLM: Sharpening Fine-grained Temporal Grounding in Video Large Language Models

Paper • 2410.03290 • Published Oct 4, 2024 • 7

CLIP-MoE: Towards Building Mixture of Experts for CLIP with Diversified Multiplet Upcycling

Paper • 2409.19291 • Published Sep 28, 2024 • 19