请问能提供GPTQ-Int8版本吗?
#5
by
worldggg
- opened
看了这个版本的信息,非常想本地部署,奈何GPU不给力,所以想问是否可以提供GPTQ-Int8版本?
非常感谢你的回复,而且给出了相关的详细资料。现在的情况是:由于是p100-16G的GPU,使用Ollama运行速度非常慢,现在使用vllm的特殊版能够运行GPTQ-Int8,而且速度能够比Ollama快10倍,所以才找GPTQ量化版本。但由于自己不会量化,所以才试着问一下,如果你不方便的话就算了。
能否提供GPTQ-INT8的,想和int4的对比一下