有什么加速的方案吗?

#7
by hanswang1973 - opened

有什么加速的方案吗?reranker比embedding还是慢了很多

可以在推理的时候使用fp16

Sign up or log in to comment