1 2 4

dasqw

1231czx

AI & ML interests

None yet

Recent Activity

updated a model 15 days ago

1231czx/qwmathbase_reinforce40

published a model 15 days ago

1231czx/qwmathbase_reinforce40

updated a model 15 days ago

1231czx/qwmathbase_reinforce20

View all activity

Organizations

1231czx's activity

updated a model 15 days ago

1231czx/qwmathbase_reinforce40

Updated 15 days ago • 1

published a model 15 days ago

1231czx/qwmathbase_reinforce40

Updated 15 days ago • 1

updated a model 15 days ago

1231czx/qwmathbase_reinforce20

Updated 15 days ago • 1

published a model 15 days ago

1231czx/qwmathbase_reinforce20

Updated 15 days ago • 1

updated a model 15 days ago

1231czx/qwmathbase_raftpp_bz512_n8_step260

Updated 15 days ago • 8

published a model 15 days ago

1231czx/qwmathbase_raftpp_bz512_n8_step260

Updated 15 days ago • 8

updated a model 15 days ago

1231czx/qwmathbase_raftpp_bz512_n8_step240

Updated 15 days ago • 8

published a model 15 days ago

1231czx/qwmathbase_raftpp_bz512_n8_step240

Updated 15 days ago • 8

updated a model 15 days ago

1231czx/qwmathbase_raftpp_bz512_n8_step220

Updated 15 days ago • 10

published a model 15 days ago

1231czx/qwmathbase_raftpp_bz512_n8_step220

Updated 15 days ago • 10

updated a model 15 days ago

1231czx/qwmathbase_raftpp_bz512_n8_step200

Updated 15 days ago • 10

published a model 15 days ago

1231czx/qwmathbase_raftpp_bz512_n8_step200

Updated 15 days ago • 10

updated a model 16 days ago

1231czx/llama_32_3b_it_ppo_step220

Updated 16 days ago • 5

published a model 16 days ago

1231czx/llama_32_3b_it_ppo_step220

Updated 16 days ago • 5

updated a model 16 days ago

1231czx/llama_32_3b_it_ppo_step200

Updated 16 days ago • 7

published a model 16 days ago

1231czx/llama_32_3b_it_ppo_step200

Updated 16 days ago • 7

updated a model 16 days ago

1231czx/llama_32_3b_it_ppo_step180

Updated 16 days ago • 7

published a model 16 days ago

1231czx/llama_32_3b_it_ppo_step180

Updated 16 days ago • 7

updated a model 16 days ago

1231czx/llama_32_3b_it_ppo_step160

Updated 16 days ago • 7

published a model 16 days ago

1231czx/llama_32_3b_it_ppo_step160

Updated 16 days ago • 7