logical-reasoning / results /mgtv-llama3_p2_en_full_metrics.csv
dh-mc's picture
ready for internlm r3
c4a6675
raw
history blame
654 Bytes
epoch,model,accuracy,precision,recall,f1
0.0,meta-llama/Meta-Llama-3-8B-Instruct_torch.bfloat16_lf,0.15466666666666667,0.5218515852800517,0.15466666666666667,0.17611762474007195
0.3333333333333333,meta-llama/Meta-Llama-3-8B-Instruct/checkpoint-117_torch.bfloat16_lf,0.6203333333333333,0.663582082981778,0.6203333333333333,0.6363626392286635
0.6666666666666666,meta-llama/Meta-Llama-3-8B-Instruct/checkpoint-234_torch.bfloat16_lf,0.5613333333333334,0.7000506187405509,0.5613333333333334,0.6113039056178092
1.0,meta-llama/Meta-Llama-3-8B-Instruct/checkpoint-351_torch.bfloat16_lf,0.6203333333333333,0.6819200833733873,0.6203333333333333,0.6405153767205392