Hanning Zhang

HanningZhang

AI & ML interests

None yet

Recent Activity

updated a model about 13 hours ago

HanningZhang/Qwen2.5-Math-7B-raft-plusplus_cliphigher050_em-iter3

published a model about 13 hours ago

HanningZhang/Qwen2.5-Math-7B-raft-plusplus_cliphigher050_em-iter3

updated a model about 20 hours ago

HanningZhang/Qwen2.5-Math-7B-raft-plusplus_cliphigher050_em-iter2

View all activity

Organizations

HanningZhang's activity

updated a model about 13 hours ago

HanningZhang/Qwen2.5-Math-7B-raft-plusplus_cliphigher050_em-iter3

Text Generation • Updated about 13 hours ago

published a model about 13 hours ago

HanningZhang/Qwen2.5-Math-7B-raft-plusplus_cliphigher050_em-iter3

Text Generation • Updated about 13 hours ago

updated a model about 20 hours ago

HanningZhang/Qwen2.5-Math-7B-raft-plusplus_cliphigher050_em-iter2

Text Generation • Updated about 20 hours ago • 4

published a model about 20 hours ago

HanningZhang/Qwen2.5-Math-7B-raft-plusplus_cliphigher050_em-iter2

Text Generation • Updated about 20 hours ago • 4

updated a model about 20 hours ago

HanningZhang/Qwen2.5-Math-7B-raft-plusplus_cliphigher050_em-iter1

Text Generation • Updated about 20 hours ago • 4

published a model about 20 hours ago

HanningZhang/Qwen2.5-Math-7B-raft-plusplus_cliphigher050_em-iter1

Text Generation • Updated about 20 hours ago • 4

updated a model 1 day ago

HanningZhang/Qwen2.5-Math-7B-raft-plusplus_em-sample1n8-sample8-filter1.0-insufficient0.0-a0.001-b2.0-iter12

Text Generation • Updated 1 day ago

published a model 2 days ago

HanningZhang/Qwen2.5-Math-7B-raft-plusplus_em-sample1n8-sample8-filter1.0-insufficient0.0-a0.001-b2.0-iter12

Text Generation • Updated 1 day ago

updated a model 2 days ago

HanningZhang/Qwen2.5-Math-7B-raft-plusplus_em-sample1n8-sample8-filter1.0-insufficient0.0-a0.001-b2.0-iter11

Text Generation • Updated 2 days ago

published a model 2 days ago

HanningZhang/Qwen2.5-Math-7B-raft-plusplus_em-sample1n8-sample8-filter1.0-insufficient0.0-a0.001-b2.0-iter11

Text Generation • Updated 2 days ago

updated a model 2 days ago

HanningZhang/Qwen2.5-Math-7B-raft-plusplus_em-sample1n8-sample8-filter1.0-insufficient0.0-a0.001-b2.0-iter10

Text Generation • Updated 2 days ago

published a model 2 days ago

HanningZhang/Qwen2.5-Math-7B-raft-plusplus_em-sample1n8-sample8-filter1.0-insufficient0.0-a0.001-b2.0-iter10

Text Generation • Updated 2 days ago

updated a model 2 days ago

HanningZhang/Qwen2.5-Math-7B-raft-plusplus_em-sample1n8-sample8-filter1.0-insufficient0.0-a0.001-b2.0-iter9

Text Generation • Updated 2 days ago

published a model 2 days ago

HanningZhang/Qwen2.5-Math-7B-raft-plusplus_em-sample1n8-sample8-filter1.0-insufficient0.0-a0.001-b2.0-iter9

Text Generation • Updated 2 days ago

updated a dataset 2 days ago

HanningZhang/scalebio_reasoning_think_220k_with_system_and_cot

Viewer • Updated 2 days ago • 193k • 51

published a dataset 2 days ago

HanningZhang/scalebio_reasoning_think_220k_with_system_and_cot

Viewer • Updated 2 days ago • 193k • 51

updated a model 4 days ago

HanningZhang/Qwen-7B-grpo-plusplus-nocliphigher-sample1n8-sample8-filter1.0-insufficient0.0-a0.001-b2.0-iter8

Text Generation • Updated 4 days ago • 82

published a model 4 days ago

HanningZhang/Qwen-7B-grpo-plusplus-nocliphigher-sample1n8-sample8-filter1.0-insufficient0.0-a0.001-b2.0-iter8

Text Generation • Updated 4 days ago • 82

updated a model 4 days ago

HanningZhang/Qwen-7B-grpo-plusplus-nocliphigher-sample1n8-sample8-filter1.0-insufficient0.0-a0.001-b2.0-iter7

Text Generation • Updated 4 days ago • 6

published a model 4 days ago

HanningZhang/Qwen-7B-grpo-plusplus-nocliphigher-sample1n8-sample8-filter1.0-insufficient0.0-a0.001-b2.0-iter7

Text Generation • Updated 4 days ago • 6