zhanghengyuan's picture

3

zhanghengyuan

hengyuanya

rattlesnakey

AI & ML interests

None yet

Recent Activity

upvoted a paper about 1 month ago

Balancing Speciality and Versatility: a Coarse to Fine Framework for Supervised Fine-tuning Large Language Model

upvoted a paper 3 months ago

Preference Leakage: A Contamination Problem in LLM-as-a-judge

upvoted a paper 3 months ago

Test-Time Preference Optimization: On-the-Fly Alignment via Iterative Textual Feedback

View all activity

Organizations

None yet

hengyuanya's activity

upvoted a paper about 1 month ago

Balancing Speciality and Versatility: a Coarse to Fine Framework for Supervised Fine-tuning Large Language Model

Paper • 2404.10306 • Published Apr 16, 2024 • 1

upvoted 2 papers 3 months ago

Preference Leakage: A Contamination Problem in LLM-as-a-judge

Paper • 2502.01534 • Published Feb 3 • 40

Test-Time Preference Optimization: On-the-Fly Alignment via Iterative Textual Feedback

Paper • 2501.12895 • Published Jan 22 • 61