3060 12g demo代码可以跑起来 4090 24g内存溢出

#12
by duketxl - opened

4090 24g device_map:cuda:0 内存溢出,3060 是偶尔有输出 有时候会计算很久无结果 默认demo代码

Baichuan Intelligent Technology org

跑的是int8?

跑的是int8?

不是 我也看到非量化版26g 只是奇怪为啥3060 12g 居然还有输出

Baichuan Intelligent Technology org

跑的是int8?

不是 我也看到非量化版26g 只是奇怪为啥3060 12g 居然还有输出

输出正常吗

跑的是int8?

不是 我也看到非量化版26g 只是奇怪为啥3060 12g 居然还有输出

输出正常吗

正常 没截断 速度慢些

这个大概率是导入到内存用cpu跑的

同4090,fp16 13b是直接跑不起来的,必须8bit量化以后才行,然后内存需要64g,32g不够的无论你做不做量化。3060估计你是跑在cpu上了。

Sign up or log in to comment