好像lmdeploy无法加速推理8bit版本?

#6
by yuezhiyu - opened

目前所有model format参数都已经测试过了,无法正常部署。4bit是可以用awq部署的

Sign up or log in to comment