Edit model card

原始模型:https://huggingface.co/SakuraLLM/Sakura-13B-Qwen2beta-v0.9

4Bit AWQ量化,未测试,不建议使用。

GroupSize=64

适用于Kaggle双卡推理。

Downloads last month
6
Safetensors
Model size
3.36B params
Tensor type
I32
·
FP16
·