Junkang Wu's picture

1 3

Junkang Wu

junkang0909

·

https://junkangwu.github.io/

AI & ML interests

LLM alignment

Recent Activity

upvoted a paper 6 days ago

Aligning Multimodal LLM with Human Preference: A Survey

upvoted a paper 13 days ago

Optimizing Test-Time Compute via Meta Reinforcement Fine-Tuning

authored a paper 15 days ago

RePO: ReLU-based Preference Optimization

View all activity

Organizations

None yet

junkang0909's activity

upvoted a paper 6 days ago

Aligning Multimodal LLM with Human Preference: A Survey

Paper • 2503.14504 • Published 7 days ago • 20

upvoted a paper 13 days ago

Optimizing Test-Time Compute via Meta Reinforcement Fine-Tuning

Paper • 2503.07572 • Published 15 days ago • 40

upvoted a paper 15 days ago

MM-RLHF: The Next Step Forward in Multimodal LLM Alignment

Paper • 2502.10391 • Published Feb 14 • 32