seojinlee

sjlee311

AI & ML interests

None yet

Recent Activity

upvoted a paper 3 days ago

Could Thinking Multilingually Empower LLM Reasoning?

upvoted a paper 3 days ago

Does Reinforcement Learning Really Incentivize Reasoning Capacity in LLMs Beyond the Base Model?

liked a model 6 days ago

deepseek-ai/DeepSeek-R1-Distill-Qwen-1.5B

View all activity

Organizations

None yet

sjlee311's activity

upvoted 2 papers 3 days ago

Could Thinking Multilingually Empower LLM Reasoning?

Paper • 2504.11833 • Published 7 days ago • 25

Does Reinforcement Learning Really Incentivize Reasoning Capacity in LLMs Beyond the Base Model?

Paper • 2504.13837 • Published 5 days ago • 91

upvoted a paper 9 days ago

Have we unified image generation and understanding yet? An empirical study of GPT-4o's image generation ability

Paper • 2504.08003 • Published 14 days ago • 47

upvoted a paper 12 days ago

DeepSeek-R1 Thoughtology: Let's <think> about LLM Reasoning

Paper • 2504.07128 • Published 22 days ago • 82

upvoted a paper 14 days ago

Qwen2.5-Omni Technical Report

Paper • 2503.20215 • Published 29 days ago • 140

upvoted a paper 15 days ago

Quantization Hurts Reasoning? An Empirical Study on Quantized Reasoning Models

Paper • 2504.04823 • Published 16 days ago • 30

upvoted a paper 17 days ago

Understanding R1-Zero-Like Training: A Critical Perspective

Paper • 2503.20783 • Published 28 days ago • 45

upvoted a paper 27 days ago

Challenging the Boundaries of Reasoning: An Olympiad-Level Math Benchmark for Large Language Models

Paper • 2503.21380 • Published 27 days ago • 37

upvoted 2 papers about 1 month ago

Transformers without Normalization

Paper • 2503.10622 • Published Mar 13 • 160

Evaluating and Aligning CodeLLMs on Human Preference

Paper • 2412.05210 • Published Dec 6, 2024 • 51

upvoted a paper 2 months ago

Large Language Diffusion Models

Paper • 2502.09992 • Published Feb 14 • 113

upvoted a paper 3 months ago

Qwen2.5-1M Technical Report

Paper • 2501.15383 • Published Jan 26 • 71

upvoted a paper 4 months ago

Phi-4 Technical Report

Paper • 2412.08905 • Published Dec 12, 2024 • 116

upvoted 2 papers 8 months ago

Attention Heads of Large Language Models: A Survey

Paper • 2409.03752 • Published Sep 5, 2024 • 90

MovieSum: An Abstractive Summarization Dataset for Movie Screenplays

Paper • 2408.06281 • Published Aug 12, 2024 • 9