如题,在大并发情况下是否必须使用GPU;若使用GPU,是否兼容华为的昇腾GPU卡
如果是大并发的情况,确实是需要 GPU 才能保证运算效率。m3e 可以很容易的转换为 onnx 等通用格式,理论上来讲只要华为昇腾支持类似 onnx 这种通用格式,就是兼容的。另外,m3e 中用到的算子都是常见的算子,虽然我没有真实测试过,但应该不至于不兼容。
实测昇腾310b可以用torch npu推理
· Sign up or log in to comment