很棒的模型,比其他人的oss-20B都好

#1
by ZhudaAndZhuer - opened

在不做任何外部工程的情況下,第一款能通過我全部測試,並且得到達到分數93/100的模型.
設備:Mac Air M4 24GB
效率:31 t/s Average

附上測試圖,模型配上Harness工程化的Server + OpneCode Agent,很完美.
測試在codex或claude會負擔太重,最佳建議是自行建置輕量的Harness Agent or Loop Agent.
image

MLX Community org

謝謝你這麼詳細的測試與回饋!看到它在 M4 Air 24GB 上一次通過你全部測試、拿到 93/100,還能跑到 31 t/s,真的很開心。

OptiQ 的混合精度量化就是為了這種記憶體吃緊的 Mac 設計的:把最敏感的層留在 8-bit、其餘壓到 4-bit,所以在相同大小下會比一般的 uniform 4-bit 更耐用。

也很認同你的建議,這類模型搭配輕量的 harness / loop agent 效果最好,你的 OpenCode 組合看起來很棒。謝謝分享,歡迎隨時回報使用心得!

Sign up or log in to comment