metadata
license: bsd
Welcome to Qwen2-72B-Instruct-math model, which is used for solving Math Problem.
评估结果
不同模型经过微调的数学能力测评表如下:
基座模型 | GSM8K | MATH | 样本数 |
---|---|---|---|
QWen1.5-32B | 79.68% | 43.58% | 2402 |
Yi-1.5-34B | 83.47% | 52.76% | 3480 |
Yi-1.5-34B-Chat | 85.67% | 57.22% | 3479 |
QWen-2-72B-Instruct | 93.03% | 68.54% | 3469 |
其它模型:
模型 | GSM8K | MATH |
---|---|---|
GPT-4o-0513 | 95.8% | 76.6% |
Claude-3.5-Sonnet | 96.4% | 71.1% |
GEMINI-1.5-PRO(May 2024) | / | 67.7% |
DeepSeek-Coder-V2-Instruct(236B) | 94.9% | 75.7% |
使用方法
参考文献
关于该模型使用的训练数据、训练方法和相关文章,可以参考Github上项目: llm_math_solver.
文章如下: