mjren's picture

1 2

mjren

bubble7bo

AI & ML interests

None yet

Recent Activity

upvoted a paper 14 days ago

Learning from Failures: Correction-Oriented Policy Optimization with Verifiable Rewards

liked a dataset almost 2 years ago

sahil2801/CodeAlpaca-20k

liked a dataset almost 3 years ago

QingyiSi/Alpaca-CoT

View all activity

Organizations

None yet

upvoted a paper 14 days ago

Learning from Failures: Correction-Oriented Policy Optimization with Verifiable Rewards

Paper • 2605.14539 • Published May 14 • 7

liked a dataset almost 2 years ago

sahil2801/CodeAlpaca-20k

Viewer • Updated Oct 3, 2023 • 20k • 23k • 236

liked a dataset almost 3 years ago

QingyiSi/Alpaca-CoT

Preview • Updated Sep 14, 2023 • 3.47k • 770