原始模型:https://huggingface.co/SakuraLLM/Sakura-13B-Qwen2beta-v0.9
4Bit AWQ量化,未测试,不建议使用。
GroupSize=64
适用于Kaggle双卡推理。
- Downloads last month
- 6
原始模型:https://huggingface.co/SakuraLLM/Sakura-13B-Qwen2beta-v0.9
4Bit AWQ量化,未测试,不建议使用。
GroupSize=64
适用于Kaggle双卡推理。