GPU内存OOM

#5
by chaiying - opened

使用40G内存,half(), 加载原生Llama-2-7b模型没问题,但是加载Chinese-Llama-2-7b报错,OOM了。

北京零速科技 org

这不应该吧,用的是我们提供的代码吗?我们这边16G、24G、32G都能跑通的

shiyemin2 changed discussion status to closed

Sign up or log in to comment