OpsEval / data /huaweicloud_zh_mc.csv
Junetheriver's picture
update leaderboard
cb9ec9c
raw
history blame
1.3 kB
name,few_native,few_self_con,few_cot,few_cot_self_con,zero_native,zero_self_con,zero_cot,zero_cot_self_con
GPT4,43.33,43.33,46.67,46.67,20,20,20,20
Yi-34B-Chat,50,46.67,30,43.33,36.67,40,36.67,30
DevOps-Model-14B-Chat,40,40,20,23.33,16.67,16.67,33.33,13.33
LLaMA-2-7B,16.67,16.67,33.33,33.33,10,10,26.67,26.67
Qwen-72B-Chat,43.33,43.33,33.33,36.67,36.67,36.67,33.33,33.33
GPT-3.5-turbo,20,20,16.67,23.33,13.33,13.33,20,26.67
ERNIE-Bot-4.0,36.67,36.67,23.33,23.33,16.67,16.67,20,20
Mistral-7B,0,0,16.67,16.67,0,0,23.33,23.33
LLaMA-2-13B,26.67,26.67,13.33,13.33,10,10,20,20
Baichuan2-13B-Chat,16.67,20,26.67,30,6.67,10,23.33,23.33
Qwen-14B-Chat,40,30,26.67,33.33,13.33,13.33,20,26.67
LLaMA-2-70B-Chat,23.33,23.33,16.67,16.67,3.33,3.33,20,20
ChatGLM3-6B,6.666666667,6.666666667,13.33333333,13.33333333,13.33333333,13.33333333,16.66666667,16.66666667
InternLM2-Chat-20B,16.66666667,16.66666667,,,13.33333333,13.33333333,20,20
InternLM2-Chat-7B,30,30,40,40,43.33333333,43.33333333,23.33333333,23.33333333
gemma_2b,26.66667,26.66667,20,20,26.66667,26.66667,10,10
gemma_7b,13.33333,13.33333,30,30,3.333333,3.333333,23.33333,23.33333
qwen1.5-14b-base,20,20,30,30,20,20,33.33333,33.33333
qwen1.5-14b-chat,26.66667,26.66667,20,30,23.33333,26.66667,13.33333,13.33333
Claude-3-Opus,,,,,60,60,,