m3e在大并发场景下(如30并发)CPU是否可以支撑,是否支持华为atlas昇腾的GPU卡

#7
by wayne7356 - opened

如题,在大并发情况下是否必须使用GPU;若使用GPU,是否兼容华为的昇腾GPU卡

Moka HR SaSS org

如果是大并发的情况,确实是需要 GPU 才能保证运算效率。m3e 可以很容易的转换为 onnx 等通用格式,理论上来讲只要华为昇腾支持类似 onnx 这种通用格式,就是兼容的。另外,m3e 中用到的算子都是常见的算子,虽然我没有真实测试过,但应该不至于不兼容。

实测昇腾310b可以用torch npu推理

Sign up or log in to comment