File size: 2,207 Bytes
24c2665 |
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 |
bash eval_math_nodes.sh \
--run_name azr_coder_3b_seed2 \
--init_model $(ls -d ~/.cache/huggingface/hub/models--andrewzh--Absolute_Zero_Reasoner-Coder-3b/snapshots/*) \
--template azr \
--tp_size 1 \
--add_step_0 true \
--temperature 0 \
--top_p 0.95 \
--max_tokens 16000 \
--benchmarks aime24,aime25,amc23,math500,olympiadbench,minerva_math \
--n_sampling 1 \
--just_wandb false \
--seed 2
bash eval_math_nodes.sh \
--run_name azr_base_7b_seed2 \
--init_model $(ls -d ~/.cache/huggingface/hub/models--andrewzh2--Absolute_Zero_Reasoner-Base-7b/snapshots/*) \
--template azr \
--tp_size 1 \
--add_step_0 true \
--temperature 0 \
--top_p 0.95 \
--max_tokens 16000 \
--benchmarks aime24,aime25,amc23,math500,olympiadbench,minerva_math \
--n_sampling 1 \
--just_wandb false \
--seed 2
bash eval_math_nodes.sh \
--run_name azr_coder_7b_seed2 \
--init_model $(ls -d ~/.cache/huggingface/hub/models--andrewzh--Absolute_Zero_Reasoner-Coder-7b/snapshots/*) \
--template azr_boxed \
--tp_size 1 \
--add_step_0 true \
--temperature 0 \
--top_p 0.95 \
--max_tokens 16000 \
--benchmarks aime24,aime25,amc23,math500,olympiadbench,minerva_math \
--n_sampling 1 \
--just_wandb false \
--seed 2
bash eval_math_nodes.sh \
--run_name azr_base_14b_seed2 \
--init_model $(ls -d ~/.cache/huggingface/hub/models--andrewzh2--Absolute_Zero_Reasoner-Base-14b/snapshots/*) \
--template azr \
--tp_size 1 \
--add_step_0 true \
--temperature 0 \
--top_p 0.95 \
--max_tokens 16000 \
--benchmarks aime24,aime25,amc23,math500,olympiadbench,minerva_math \
--n_sampling 1 \
--just_wandb false \
--seed 2
bash eval_math_nodes.sh \
--run_name azr_coder_14b_seed2 \
--init_model $(ls -d ~/.cache/huggingface/hub/models--andrewzh--Absolute_Zero_Reasoner-Coder-14b/snapshots/*) \
--template azr \
--tp_size 1 \
--add_step_0 true \
--temperature 0 \
--top_p 0.95 \
--max_tokens 16000 \
--benchmarks aime24,aime25,amc23,math500,olympiadbench,minerva_math \
--n_sampling 1 \
--just_wandb false \
--seed 2 |