Dylan Foster's picture

1

Dylan Foster

turtlecannon

AI & ML interests

None yet

Organizations

None yet

turtlecannon's activity

upvoted a paper about 2 months ago

Exploratory Preference Optimization: Harnessing Implicit Q*-Approximation for Sample-Efficient RLHF

Paper • 2405.21046 • Published May 31 • 1