1 1

Kaixuan Ji

KaixuanJi

AI & ML interests

None yet

Recent Activity

upvoted a paper about 1 month ago

R1-Zero's "Aha Moment" in Visual Reasoning on a 2B Non-SFT Model

updated a dataset about 1 month ago

KaixuanJi/SPPO_mistral-7b-instruct-iter3

published a dataset about 1 month ago

KaixuanJi/SPPO_mistral-7b-instruct-iter3

View all activity

Organizations

KaixuanJi's activity

upvoted a paper about 1 month ago

R1-Zero's "Aha Moment" in Visual Reasoning on a 2B Non-SFT Model

Paper • 2503.05132 • Published Mar 7 • 55

updated a dataset about 1 month ago

KaixuanJi/SPPO_mistral-7b-instruct-iter3

Viewer • Updated Mar 5 • 20k • 43

published a dataset about 1 month ago

KaixuanJi/SPPO_mistral-7b-instruct-iter3

Viewer • Updated Mar 5 • 20k • 43

updated a dataset about 1 month ago

KaixuanJi/SPPO_mistral-7b-instruct-iter2

Viewer • Updated Mar 5 • 20k • 42

published a dataset about 1 month ago

KaixuanJi/SPPO_mistral-7b-instruct-iter2

Viewer • Updated Mar 5 • 20k • 42

updated a dataset about 1 month ago

KaixuanJi/SPPO_mistral-7b-instruct-iter1

Viewer • Updated Mar 5 • 19.8k • 29

published a dataset about 1 month ago

KaixuanJi/SPPO_mistral-7b-instruct-iter1

Viewer • Updated Mar 5 • 19.8k • 29

updated a dataset about 1 month ago

KaixuanJi/SPIN_iter3

Viewer • Updated Mar 4 • 50.3k • 51

published a dataset about 1 month ago

KaixuanJi/SPIN_iter3

Viewer • Updated Mar 4 • 50.3k • 51

updated a dataset about 1 month ago

KaixuanJi/SPIN_iter2

Viewer • Updated Mar 4 • 50.3k • 32

published a dataset about 1 month ago

KaixuanJi/SPIN_iter2

Viewer • Updated Mar 4 • 50.3k • 32

updated a dataset about 1 month ago

KaixuanJi/SPIN_iter1

Viewer • Updated Mar 4 • 50.3k • 43

published a dataset about 1 month ago

KaixuanJi/SPIN_iter1

Viewer • Updated Mar 4 • 50.3k • 43

updated a dataset about 1 month ago

KaixuanJi/SPIN_iter0

Viewer • Updated Mar 4 • 50.3k • 32

published a dataset about 1 month ago

KaixuanJi/SPIN_iter0

Viewer • Updated Mar 4 • 50.3k • 32

updated a model 8 months ago

KaixuanJi/zephyr-7b-dpo-full

Text Generation • Updated Aug 7, 2024 • 19

authored a paper 12 months ago

Self-Play Preference Optimization for Language Model Alignment

Paper • 2405.00675 • Published May 1, 2024 • 28

authored 2 papers about 1 year ago

Self-Play Fine-Tuning of Diffusion Models for Text-to-Image Generation

Paper • 2402.10210 • Published Feb 15, 2024 • 36

Self-Play Fine-Tuning Converts Weak Language Models to Strong Language Models

Paper • 2401.01335 • Published Jan 2, 2024 • 66

updated a dataset over 1 year ago

KaixuanJi/tldr-preference

Viewer • Updated Jan 4, 2024 • 51k • 38