logical-reasoning / results /mgtv-llama3_p1_r3_full_metrics.csv
dh-mc's picture
ready for internlm r3
c4a6675
raw
history blame
884 Bytes
epoch,model,accuracy,precision,recall,f1
0.0,hfl/llama-3-chinese-8b-instruct-v3_torch.bfloat16_lf,0.4563333333333333,0.6744501777722286,0.4563333333333333,0.5301217655617138
0.2,hfl/llama-3-chinese-8b-instruct-v3/checkpoint-35_torch.bfloat16_lf,0.6406666666666667,0.7652410757316818,0.6406666666666667,0.686506602559313
0.4,hfl/llama-3-chinese-8b-instruct-v3/checkpoint-70_torch.bfloat16_lf,0.7223333333333334,0.761495200766395,0.7223333333333334,0.7296692772947554
0.6,hfl/llama-3-chinese-8b-instruct-v3/checkpoint-105_torch.bfloat16_lf,0.6256666666666667,0.7694288569564225,0.6256666666666667,0.6747421032154606
0.8,hfl/llama-3-chinese-8b-instruct-v3/checkpoint-140_torch.bfloat16_lf,0.7173333333333334,0.7746925589996599,0.7173333333333334,0.7391047683054164
1.0,hfl/llama-3-chinese-8b-instruct-v3/checkpoint-175_torch.bfloat16_lf,0.688,0.7678475683985698,0.688,0.7181965107150645