v000000
/

L3-8B-MegaSerpentine-imat-GGUFs

Not-For-All-Audiences

Inference Endpoints

Model card Files Files and versions Community

v000000 commited on Jun 17

Commit

7c656ba

•

1 Parent(s): 5f13a84

Update README.md

Files changed (1) hide show

README.md +3 -1

README.md CHANGED Viewed

@@ -64,4 +64,6 @@ dtype: bfloat16
 {output}<|eot_id|>
-```

 {output}<|eot_id|>
+```
+./llama-quantize --imatrix ./imatrix.dat ./L3-8B-MegaSerpentine-Tria.fp16.gguf name quantsize