koesn
/

Turdus-7B-GGUF

mlabonne/NeuralMarcoro14-7B

mmlu_abstract_algebra

Inference Endpoints

Model card Files Files and versions Community

koesn commited on Feb 27

Commit

381ed0e

•

1 Parent(s): 67ac9b1

Update README.md

Files changed (1) hide show

README.md +13 -13

README.md CHANGED Viewed

@@ -10,22 +10,22 @@ This repo contains GGUF format model files for Turdus-7B-GGUF.
 ## Model Info
-| path | type | architecture | rope_theta | sliding_win | max_pos_embed |
-| ---- | ---- | ------------ | ---------- | ----------- | ------------- |
-| udkai/Turdus | mistral | MistralForCausalLM | 10000.0 | 4096 | 32768 |
 ## Provided Files
-| Name | Quant Method | Bits | File Size | Remark |
-| ---- | ------------ | ---- | --------- | -------- |
-| turdus-7b.IQ3_S.gguf | IQ3_S | 3 | 3.18 GB | 3.44 bpw quantization |
-| turdus-7b.IQ3_M.gguf | IQ3_M | 3 | 3.28 GB | 3.66 bpw quantization mix |
-| turdus-7b.Q4_0.gguf | Q4_0 | 4 | 4.11 GB | 3.56G, +0.2166 ppl @ LLaMA-v1-7B |
-| turdus-7b.IQ4_NL.gguf | IQ4_NL | 4 | 4.16 GB | 4.25 bpw non-linear quantization |
-| turdus-7b.Q4_K_M.gguf | Q4_K_M | 4 | 4.37 GB | 3.80G, +0.0532 ppl @ LLaMA-v1-7B |
-| turdus-7b.Q5_K_M.gguf | Q5_K_M | 5 | 5.13 GB | 4.45G, +0.0122 ppl @ LLaMA-v1-7B |
-| turdus-7b.Q6_K.gguf | Q6_K | 6 | 5.94 GB | 5.15G, +0.0008 ppl @ LLaMA-v1-7B |
-| turdus-7b.Q8_0.gguf | Q8_0 | 7 | 7.7 GB | 6.70G, +0.0004 ppl @ LLaMA-v1-7B |
 # Original Model Card

 ## Model Info
+| path         | type    | architecture       | rope_theta | sliding_win | max_pos_embed |
+| ------------ | ------- | ------------------ | ---------- | ----------- | ------------- |
+| udkai/Turdus | mistral | MistralForCausalLM | 10000.0    | 4096        | 32768         |
 ## Provided Files
+|         Name          | Quant  | Bits | File Size |              Remark              |
+| --------------------- | ------ | -----| --------- | -------------------------------- |
+| turdus-7b.IQ3_S.gguf  | IQ3_S  |  3   |  3.18 GB  | 3.44 bpw quantization            |
+| turdus-7b.IQ3_M.gguf  | IQ3_M  |  3   |  3.28 GB  | 3.66 bpw quantization mix        |
+| turdus-7b.Q4_0.gguf   | Q4_0   |  4   |  4.11 GB  | 3.56G, +0.2166 ppl @ LLaMA-v1-7B |
+| turdus-7b.IQ4_NL.gguf | IQ4_NL |  4   |  4.16 GB  | 4.25 bpw non-linear quantization |
+| turdus-7b.Q4_K_M.gguf | Q4_K_M |  4   |  4.37 GB  | 3.80G, +0.0532 ppl @ LLaMA-v1-7B |
+| turdus-7b.Q5_K_M.gguf | Q5_K_M |  5   |  5.13 GB  | 4.45G, +0.0122 ppl @ LLaMA-v1-7B |
+| turdus-7b.Q6_K.gguf   | Q6_K   |  6   |  5.94 GB  | 5.15G, +0.0008 ppl @ LLaMA-v1-7B |
+| turdus-7b.Q8_0.gguf   | Q8_0   |  8   |  7.70 GB  | 6.70G, +0.0004 ppl @ LLaMA-v1-7B |
 # Original Model Card