106 31 23

TY.Zheng

aaabiao

https://scholar.google.com/citations?user=Vq-VZnUAAAAJ&hl=zh-CN

Zheng0428

AI & ML interests

None yet

Recent Activity

updated a dataset 6 days ago

aaabiao/RL-dataset

published a dataset 6 days ago

aaabiao/RL-dataset

updated a model 9 days ago

aaabiao/OpenR1-Qwen-7B-SFT

View all activity

Organizations

aaabiao's activity

updated a dataset 6 days ago

aaabiao/RL-dataset

Preview • Updated 6 days ago • 231

published a dataset 6 days ago

aaabiao/RL-dataset

Preview • Updated 6 days ago • 231

updated a model 9 days ago

aaabiao/OpenR1-Qwen-7B-SFT

Updated 9 days ago • 4

published a model 9 days ago

aaabiao/OpenR1-Qwen-7B-SFT

Updated 9 days ago • 4

published a dataset 13 days ago

aaabiao/RL-datasets

Updated 13 days ago • 19

authored a paper 13 days ago

COIG-P: A High-Quality and Large-Scale Chinese Preference Dataset for Alignment with Human Values

Paper • 2504.05535 • Published 15 days ago • 44

upvoted a paper 13 days ago

COIG-P: A High-Quality and Large-Scale Chinese Preference Dataset for Alignment with Human Values

Paper • 2504.05535 • Published 15 days ago • 44

updated a model 21 days ago

aaabiao/test_srpo_sota

Updated 21 days ago

published a model 21 days ago

aaabiao/test_srpo_sota

Updated 21 days ago

upvoted a paper 28 days ago

SimpleRL-Zoo: Investigating and Taming Zero Reinforcement Learning for Open Base Models in the Wild

Paper • 2503.18892 • Published 29 days ago • 30

upvoted a paper about 1 month ago

YuE: Scaling Open Foundation Models for Long-Form Music Generation

Paper • 2503.08638 • Published Mar 11 • 62

updated a dataset about 2 months ago

m-a-p/SuperGPQA

Viewer • Updated Mar 4 • 26.5k • 1.58k • 62