|
bash eval_math_nodes.sh \ |
|
--run_name azr_coder_3b_seed2 \ |
|
--init_model $(ls -d ~/.cache/huggingface/hub/models--andrewzh--Absolute_Zero_Reasoner-Coder-3b/snapshots/*) \ |
|
--template azr \ |
|
--tp_size 1 \ |
|
--add_step_0 true \ |
|
--temperature 0 \ |
|
--top_p 0.95 \ |
|
--max_tokens 16000 \ |
|
--benchmarks aime24,aime25,amc23,math500,olympiadbench,minerva_math \ |
|
--n_sampling 1 \ |
|
--just_wandb false \ |
|
--seed 2 |
|
|
|
bash eval_math_nodes.sh \ |
|
--run_name azr_base_7b_seed2 \ |
|
--init_model $(ls -d ~/.cache/huggingface/hub/models--andrewzh2--Absolute_Zero_Reasoner-Base-7b/snapshots/*) \ |
|
--template azr \ |
|
--tp_size 1 \ |
|
--add_step_0 true \ |
|
--temperature 0 \ |
|
--top_p 0.95 \ |
|
--max_tokens 16000 \ |
|
--benchmarks aime24,aime25,amc23,math500,olympiadbench,minerva_math \ |
|
--n_sampling 1 \ |
|
--just_wandb false \ |
|
--seed 2 |
|
|
|
bash eval_math_nodes.sh \ |
|
--run_name azr_coder_7b_seed2 \ |
|
--init_model $(ls -d ~/.cache/huggingface/hub/models--andrewzh--Absolute_Zero_Reasoner-Coder-7b/snapshots/*) \ |
|
--template azr_boxed \ |
|
--tp_size 1 \ |
|
--add_step_0 true \ |
|
--temperature 0 \ |
|
--top_p 0.95 \ |
|
--max_tokens 16000 \ |
|
--benchmarks aime24,aime25,amc23,math500,olympiadbench,minerva_math \ |
|
--n_sampling 1 \ |
|
--just_wandb false \ |
|
--seed 2 |
|
|
|
bash eval_math_nodes.sh \ |
|
--run_name azr_base_14b_seed2 \ |
|
--init_model $(ls -d ~/.cache/huggingface/hub/models--andrewzh2--Absolute_Zero_Reasoner-Base-14b/snapshots/*) \ |
|
--template azr \ |
|
--tp_size 1 \ |
|
--add_step_0 true \ |
|
--temperature 0 \ |
|
--top_p 0.95 \ |
|
--max_tokens 16000 \ |
|
--benchmarks aime24,aime25,amc23,math500,olympiadbench,minerva_math \ |
|
--n_sampling 1 \ |
|
--just_wandb false \ |
|
--seed 2 |
|
|
|
|
|
bash eval_math_nodes.sh \ |
|
--run_name azr_coder_14b_seed2 \ |
|
--init_model $(ls -d ~/.cache/huggingface/hub/models--andrewzh--Absolute_Zero_Reasoner-Coder-14b/snapshots/*) \ |
|
--template azr \ |
|
--tp_size 1 \ |
|
--add_step_0 true \ |
|
--temperature 0 \ |
|
--top_p 0.95 \ |
|
--max_tokens 16000 \ |
|
--benchmarks aime24,aime25,amc23,math500,olympiadbench,minerva_math \ |
|
--n_sampling 1 \ |
|
--just_wandb false \ |
|
--seed 2 |