Zikang Shan

zkshan2002

https://zkshan2002.github.io/

zkshan2002

AI & ML interests

Reinforcement Learning

Recent Activity

updated a dataset 1 day ago

zkshan2002/numia10k_gen0-r1d7b

published a dataset 1 day ago

zkshan2002/numia10k_gen0-r1d7b

updated a dataset 1 day ago

zkshan2002/numia10k_gen0.75-r1d7b

View all activity

Organizations

Collections 2

models

None public yet

datasets 18

Zikang Shan

AI & ML interests

Recent Activity

Organizations

Collections 2

zkshan2002/aime24

zkshan2002/aime25

zkshan2002/amc23

zkshan2002/math500

zkshan2002/prime_math-455k

zkshan2002/orz-57k

zkshan2002/orz_extended-72k

zkshan2002/orz_hard-13k

models

datasets 18

zkshan2002/numia10k_gen0-r1d7b

zkshan2002/numia10k_gen0.75-r1d7b

zkshan2002/numia10k_sft-32b

zkshan2002/numia10k_sft-r1d32b

zkshan2002/numia10k_gen-32b

zkshan2002/numia10k_gen-r1d32b

zkshan2002/numia_math_train-10k

zkshan2002/gpqa_diamond

zkshan2002/olympiad_bench

zkshan2002/minerva_math

Zikang Shan

AI & ML interests

Recent Activity

Organizations

Collections 2

models

datasets 18 Sort: Recently updated

datasets 18