hjkim00's picture
Upload TestTime-RLVR-v2 from Full-pipeline-relative_0827 branch
f50dc54 verified
bash eval_math_nodes.sh \
--run_name azr_coder_3b_seed2 \
--init_model $(ls -d ~/.cache/huggingface/hub/models--andrewzh--Absolute_Zero_Reasoner-Coder-3b/snapshots/*) \
--template azr \
--tp_size 1 \
--add_step_0 true \
--temperature 0 \
--top_p 0.95 \
--max_tokens 16000 \
--benchmarks aime24,aime25,amc23,math500,olympiadbench,minerva_math \
--n_sampling 1 \
--just_wandb false \
--seed 2
bash eval_math_nodes.sh \
--run_name azr_base_7b_seed2 \
--init_model $(ls -d ~/.cache/huggingface/hub/models--andrewzh2--Absolute_Zero_Reasoner-Base-7b/snapshots/*) \
--template azr \
--tp_size 1 \
--add_step_0 true \
--temperature 0 \
--top_p 0.95 \
--max_tokens 16000 \
--benchmarks aime24,aime25,amc23,math500,olympiadbench,minerva_math \
--n_sampling 1 \
--just_wandb false \
--seed 2
bash eval_math_nodes.sh \
--run_name azr_coder_7b_seed2 \
--init_model $(ls -d ~/.cache/huggingface/hub/models--andrewzh--Absolute_Zero_Reasoner-Coder-7b/snapshots/*) \
--template azr_boxed \
--tp_size 1 \
--add_step_0 true \
--temperature 0 \
--top_p 0.95 \
--max_tokens 16000 \
--benchmarks aime24,aime25,amc23,math500,olympiadbench,minerva_math \
--n_sampling 1 \
--just_wandb false \
--seed 2
bash eval_math_nodes.sh \
--run_name azr_base_14b_seed2 \
--init_model $(ls -d ~/.cache/huggingface/hub/models--andrewzh2--Absolute_Zero_Reasoner-Base-14b/snapshots/*) \
--template azr \
--tp_size 1 \
--add_step_0 true \
--temperature 0 \
--top_p 0.95 \
--max_tokens 16000 \
--benchmarks aime24,aime25,amc23,math500,olympiadbench,minerva_math \
--n_sampling 1 \
--just_wandb false \
--seed 2
bash eval_math_nodes.sh \
--run_name azr_coder_14b_seed2 \
--init_model $(ls -d ~/.cache/huggingface/hub/models--andrewzh--Absolute_Zero_Reasoner-Coder-14b/snapshots/*) \
--template azr \
--tp_size 1 \
--add_step_0 true \
--temperature 0 \
--top_p 0.95 \
--max_tokens 16000 \
--benchmarks aime24,aime25,amc23,math500,olympiadbench,minerva_math \
--n_sampling 1 \
--just_wandb false \
--seed 2