原始模型:https://huggingface.co/SakuraLLM/Sakura-13B-Qwen2beta-v0.9
https://huggingface.co/SakuraLLM/Sakura-13B-Qwen2beta-v0.9
4Bit AWQ量化,未测试,不建议使用。