Zhaopeng Feng's picture

1 2

Zhaopeng Feng

fzp0424

·

fzp0424

AI & ML interests

None yet

Organizations

fzp0424's activity

upvoted a paper 7 months ago

DPO Meets PPO: Reinforced Token Optimization for RLHF

Paper • 2404.18922 • Published Apr 29, 2024 • 1