haneol j. kim's picture

51

haneol j. kim

HaneolKijm

·

https://haneol-kijm.github.io/

AI & ML interests

computer vision, diffusion, LLM agent, deep RL

Organizations

None yet

HaneolKijm's activity

upvoted 13 papers 2 months ago

PaSa: An LLM Agent for Comprehensive Academic Paper Search

Paper • 2501.10120 • Published Jan 17 • 49

Evolving Deeper LLM Thinking

Paper • 2501.09891 • Published Jan 17 • 114

Agent-R: Training Language Model Agents to Reflect via Iterative Self-Training

Paper • 2501.11425 • Published Jan 20 • 104

DeepSeek-R1: Incentivizing Reasoning Capability in LLMs via Reinforcement Learning

Paper • 2501.12948 • Published Jan 22 • 379

Improving Video Generation with Human Feedback

Paper • 2501.13918 • Published Jan 23 • 50

SRMT: Shared Memory for Multi-agent Lifelong Pathfinding

Paper • 2501.13200 • Published Jan 22 • 68

Humanity's Last Exam

Paper • 2501.14249 • Published Jan 24 • 72

Chain-of-Retrieval Augmented Generation

Paper • 2501.14342 • Published Jan 24 • 56

Towards General-Purpose Model-Free Reinforcement Learning

Paper • 2501.16142 • Published Jan 27 • 29

Qwen2.5-1M Technical Report

Paper • 2501.15383 • Published Jan 26 • 69

Optimizing Large Language Model Training Using FP4 Quantization

Paper • 2501.17116 • Published Jan 28 • 37

SFT Memorizes, RL Generalizes: A Comparative Study of Foundation Model Post-training

Paper • 2501.17161 • Published Jan 28 • 120

Critique Fine-Tuning: Learning to Critique is More Effective than Learning to Imitate

Paper • 2501.17703 • Published Jan 29 • 58

upvoted 7 papers 3 months ago

Inference-Time Scaling for Diffusion Models beyond Scaling Denoising Steps

Paper • 2501.09732 • Published Jan 16 • 72

Transformer^2: Self-adaptive LLMs

Paper • 2501.06252 • Published Jan 9 • 55

VideoAuteur: Towards Long Narrative Video Generation

Paper • 2501.06173 • Published Jan 10 • 34

Tensor Product Attention Is All You Need

Paper • 2501.06425 • Published Jan 11 • 88

The Lessons of Developing Process Reward Models in Mathematical Reasoning

Paper • 2501.07301 • Published Jan 13 • 99

MiniMax-01: Scaling Foundation Models with Lightning Attention

Paper • 2501.08313 • Published Jan 14 • 285

The GAN is dead; long live the GAN! A Modern GAN Baseline

Paper • 2501.05441 • Published Jan 9 • 92