如何对比Baichuan和其他国产框架在解决中文问题时的表现呢?

#1
by RanranLyu - opened

摘取SuperClue总榜单

总榜单,包括基础能力、中文特性、学术与专业能力
模型 机构 总分 基础能力 中文特性 学术与专业能力
人类 CLUE 96.50 98.00 95.00 -
GPT-4 OpenAI 76.67 90.00 68.00 72.00
GPT-3.5-turbo OpenAI 66.18 85.00 59.00 54.55
Claude Anthropic 65.13 87.00 55.00 53.39
360智脑 360 58.24 80.00 49.00 45.71
讯飞星火 科大讯飞 53.58 74.00 44.00 42.73
ChatGLM-130B 清华&智谱AI 49.52 73.00 33.00 42.55
西湖大模型 西湖大学&西湖心辰 49.46 75.00 35.00 38.39
MiniMax-abab5 MiniMax 46.45 72.00 29.00 38.36
IDEA-姜子牙-13B IDEA研究院 44.69 65.00 33.00 36.07
BELLE-13B 链家 43.70 69.00 23.00 39.09
ChatGLM-6B 清华&智谱AI 42.15 60.00 33.00 33.45
MOSS-16B 复旦 36.52 52.00 27.00 30.55
Vicuna-13B UC伯克利 34.33 45.00 30.00 28.00
RWKV-Raven-7B RWKV基金会 23.37 26.00 25.00 19.11

蹲一下,康康Baichuan会在哪儿
katelynlyu@163.com

Sign up or log in to comment