q3_k_m: Uses Q4_K for the attention.wv, attention.wo, and feed_forward.w2 tensors, else Q3_K

Files changed (2) hide show

.gitattributes CHANGED Viewed

@@ -36,3 +36,4 @@ saved_model/**/* filter=lfs diff=lfs merge=lfs -text
 Yugo45A-GPT-Quantized-GGUF-unsloth.Q4_K_M.gguf filter=lfs diff=lfs merge=lfs -text
 Yugo45A-GPT-Quantized-GGUF.Q4_K_M.gguf filter=lfs diff=lfs merge=lfs -text
 Yugo45A-GPT-Quantized-GGUF-unsloth.Q3_K_M.gguf filter=lfs diff=lfs merge=lfs -text

 Yugo45A-GPT-Quantized-GGUF-unsloth.Q4_K_M.gguf filter=lfs diff=lfs merge=lfs -text
 Yugo45A-GPT-Quantized-GGUF.Q4_K_M.gguf filter=lfs diff=lfs merge=lfs -text
 Yugo45A-GPT-Quantized-GGUF-unsloth.Q3_K_M.gguf filter=lfs diff=lfs merge=lfs -text
+Yugo45A-GPT-Quantized-GGUF.Q3_K_M.gguf filter=lfs diff=lfs merge=lfs -text

Yugo45A-GPT-Quantized-GGUF-unsloth.Q3_K_M.gguf → Yugo45A-GPT-Quantized-GGUF.Q3_K_M.gguf RENAMED Viewed

File without changes