RichardErkhov
/

davzoku_-_frankencria-llama2-11b-v1.3-m.1-gguf

GGUF

Inference Endpoints

Model card Files Files and versions Community

RichardErkhov commited on May 24

Commit

5b70884

•

1 Parent(s): ce2380a

uploaded readme

Browse files

Files changed (1) hide show

README.md +114 -0

README.md ADDED Viewed

	@@ -0,0 +1,114 @@

+Quantization made by Richard Erkhov.
+[Github](https://github.com/RichardErkhov)
+[Discord](https://discord.gg/pvy7H8DZMG)
+[Request more models](https://github.com/RichardErkhov/quant_request)
+frankencria-llama2-11b-v1.3-m.1 - GGUF
+- Model creator: https://huggingface.co/davzoku/
+- Original model: https://huggingface.co/davzoku/frankencria-llama2-11b-v1.3-m.1/
+| Name | Quant method | Size |
+| ---- | ---- | ---- |
+| [frankencria-llama2-11b-v1.3-m.1.Q2_K.gguf](https://huggingface.co/RichardErkhov/davzoku_-_frankencria-llama2-11b-v1.3-m.1-gguf/blob/main/frankencria-llama2-11b-v1.3-m.1.Q2_K.gguf) | Q2_K | 3.47GB |
+| [frankencria-llama2-11b-v1.3-m.1.IQ3_XS.gguf](https://huggingface.co/RichardErkhov/davzoku_-_frankencria-llama2-11b-v1.3-m.1-gguf/blob/main/frankencria-llama2-11b-v1.3-m.1.IQ3_XS.gguf) | IQ3_XS | 3.83GB |
+| [frankencria-llama2-11b-v1.3-m.1.IQ3_S.gguf](https://huggingface.co/RichardErkhov/davzoku_-_frankencria-llama2-11b-v1.3-m.1-gguf/blob/main/frankencria-llama2-11b-v1.3-m.1.IQ3_S.gguf) | IQ3_S | 4.04GB |
+| [frankencria-llama2-11b-v1.3-m.1.Q3_K_S.gguf](https://huggingface.co/RichardErkhov/davzoku_-_frankencria-llama2-11b-v1.3-m.1-gguf/blob/main/frankencria-llama2-11b-v1.3-m.1.Q3_K_S.gguf) | Q3_K_S | 4.04GB |
+| [frankencria-llama2-11b-v1.3-m.1.IQ3_M.gguf](https://huggingface.co/RichardErkhov/davzoku_-_frankencria-llama2-11b-v1.3-m.1-gguf/blob/main/frankencria-llama2-11b-v1.3-m.1.IQ3_M.gguf) | IQ3_M | 4.27GB |
+| [frankencria-llama2-11b-v1.3-m.1.Q3_K.gguf](https://huggingface.co/RichardErkhov/davzoku_-_frankencria-llama2-11b-v1.3-m.1-gguf/blob/main/frankencria-llama2-11b-v1.3-m.1.Q3_K.gguf) | Q3_K | 4.53GB |
+| [frankencria-llama2-11b-v1.3-m.1.Q3_K_M.gguf](https://huggingface.co/RichardErkhov/davzoku_-_frankencria-llama2-11b-v1.3-m.1-gguf/blob/main/frankencria-llama2-11b-v1.3-m.1.Q3_K_M.gguf) | Q3_K_M | 4.53GB |
+| [frankencria-llama2-11b-v1.3-m.1.Q3_K_L.gguf](https://huggingface.co/RichardErkhov/davzoku_-_frankencria-llama2-11b-v1.3-m.1-gguf/blob/main/frankencria-llama2-11b-v1.3-m.1.Q3_K_L.gguf) | Q3_K_L | 4.95GB |
+| [frankencria-llama2-11b-v1.3-m.1.IQ4_XS.gguf](https://huggingface.co/RichardErkhov/davzoku_-_frankencria-llama2-11b-v1.3-m.1-gguf/blob/main/frankencria-llama2-11b-v1.3-m.1.IQ4_XS.gguf) | IQ4_XS | 5.01GB |
+| [frankencria-llama2-11b-v1.3-m.1.Q4_0.gguf](https://huggingface.co/RichardErkhov/davzoku_-_frankencria-llama2-11b-v1.3-m.1-gguf/blob/main/frankencria-llama2-11b-v1.3-m.1.Q4_0.gguf) | Q4_0 | 5.26GB |
+| [frankencria-llama2-11b-v1.3-m.1.IQ4_NL.gguf](https://huggingface.co/RichardErkhov/davzoku_-_frankencria-llama2-11b-v1.3-m.1-gguf/blob/main/frankencria-llama2-11b-v1.3-m.1.IQ4_NL.gguf) | IQ4_NL | 5.29GB |
+| [frankencria-llama2-11b-v1.3-m.1.Q4_K_S.gguf](https://huggingface.co/RichardErkhov/davzoku_-_frankencria-llama2-11b-v1.3-m.1-gguf/blob/main/frankencria-llama2-11b-v1.3-m.1.Q4_K_S.gguf) | Q4_K_S | 5.3GB |
+| [frankencria-llama2-11b-v1.3-m.1.Q4_K.gguf](https://huggingface.co/RichardErkhov/davzoku_-_frankencria-llama2-11b-v1.3-m.1-gguf/blob/main/frankencria-llama2-11b-v1.3-m.1.Q4_K.gguf) | Q4_K | 5.62GB |
+| [frankencria-llama2-11b-v1.3-m.1.Q4_K_M.gguf](https://huggingface.co/RichardErkhov/davzoku_-_frankencria-llama2-11b-v1.3-m.1-gguf/blob/main/frankencria-llama2-11b-v1.3-m.1.Q4_K_M.gguf) | Q4_K_M | 5.62GB |
+| [frankencria-llama2-11b-v1.3-m.1.Q4_1.gguf](https://huggingface.co/RichardErkhov/davzoku_-_frankencria-llama2-11b-v1.3-m.1-gguf/blob/main/frankencria-llama2-11b-v1.3-m.1.Q4_1.gguf) | Q4_1 | 5.83GB |
+| [frankencria-llama2-11b-v1.3-m.1.Q5_0.gguf](https://huggingface.co/RichardErkhov/davzoku_-_frankencria-llama2-11b-v1.3-m.1-gguf/blob/main/frankencria-llama2-11b-v1.3-m.1.Q5_0.gguf) | Q5_0 | 6.41GB |
+| [frankencria-llama2-11b-v1.3-m.1.Q5_K_S.gguf](https://huggingface.co/RichardErkhov/davzoku_-_frankencria-llama2-11b-v1.3-m.1-gguf/blob/main/frankencria-llama2-11b-v1.3-m.1.Q5_K_S.gguf) | Q5_K_S | 6.41GB |
+| [frankencria-llama2-11b-v1.3-m.1.Q5_K.gguf](https://huggingface.co/RichardErkhov/davzoku_-_frankencria-llama2-11b-v1.3-m.1-gguf/blob/main/frankencria-llama2-11b-v1.3-m.1.Q5_K.gguf) | Q5_K | 6.59GB |
+| [frankencria-llama2-11b-v1.3-m.1.Q5_K_M.gguf](https://huggingface.co/RichardErkhov/davzoku_-_frankencria-llama2-11b-v1.3-m.1-gguf/blob/main/frankencria-llama2-11b-v1.3-m.1.Q5_K_M.gguf) | Q5_K_M | 6.59GB |
+| [frankencria-llama2-11b-v1.3-m.1.Q5_1.gguf](https://huggingface.co/RichardErkhov/davzoku_-_frankencria-llama2-11b-v1.3-m.1-gguf/blob/main/frankencria-llama2-11b-v1.3-m.1.Q5_1.gguf) | Q5_1 | 6.98GB |
+| [frankencria-llama2-11b-v1.3-m.1.Q6_K.gguf](https://huggingface.co/RichardErkhov/davzoku_-_frankencria-llama2-11b-v1.3-m.1-gguf/blob/main/frankencria-llama2-11b-v1.3-m.1.Q6_K.gguf) | Q6_K | 7.62GB |
+| [frankencria-llama2-11b-v1.3-m.1.Q8_0.gguf](https://huggingface.co/RichardErkhov/davzoku_-_frankencria-llama2-11b-v1.3-m.1-gguf/blob/main/frankencria-llama2-11b-v1.3-m.1.Q8_0.gguf) | Q8_0 | 9.87GB |
+Original model description:
+---
+inference: false
+language: en
+license: llama2
+model_type: llama
+datasets:
+  - mlabonne/CodeLlama-2-20k
+pipeline_tag: text-generation
+base_model:
+- davzoku/cria-llama2-7b-v1.3
+library_name: transformers
+tags:
+- mergekit
+- merge
+- llama-2
+---
+# FrankenCRIA v1.3-m.1
+## What is FrankenCRIA?
+<p align="center">
+  <img src="https://github.com/davzoku/cria/blob/main/assets/frankencria-icon-512x512.png?raw=true" width="300" height="300" alt="FrankenCRIA Logo"> <br>
+  <i>This is a frankenmerge of <a href="https://huggingface.co/davzoku/cria-llama2-7b-v1.3">davzoku/cria-llama2-7b-v1.3</a>.</i>
+</p>
+The configuration is the same as [Undi95/Mistral-11B-v0.1](https://huggingface.co/Undi95/Mistral-11B-v0.1), [mlabonne/FrankenBeagle14-11B](https://huggingface.co/mlabonne/FrankenBeagle14-11B) and the DUS technique used in [upstage/SOLAR-10.7B-v1.0](https://huggingface.co/upstage/SOLAR-10.7B-v1.0).
+Please be aware that this model is highly experimental, and no further training has been conducted following the merge.
+Therefore, the model performance may not meet expectations, as described in the [SOLAR paper](https://arxiv.org/abs/2312.15166)
+## 📦 FrankenCRIA Model Release
+FrankenCRIA v1.3 comes with several variants.
+- [davzoku/frankencria-llama2-11b-v1.3-m.1](https://huggingface.co/davzoku/frankencria-llama2-11b-v1.3-m.1): 11B FrankenMerge inspired by [Undi95/Mistral-11B-v0.1](https://huggingface.co/Undi95/Mistral-11B-v0.1)
+- [davzoku/frankencria-llama2-11b-v1.3-m.2](https://huggingface.co/davzoku/frankencria-llama2-12.5b-v1.3-m.2): 12.5B interleaving FrankenMerge inspired by [vilm/vinallama-12.5b-chat-DUS](https://huggingface.co/vilm/vinallama-12.5b-chat-DUS)
+## 🧩 Merge Details
+### Merge Method
+This model was merged using the passthrough merge method.
+### Models Merged
+The following models were included in the merge:
+* [davzoku/cria-llama2-7b-v1.3](https://huggingface.co/davzoku/cria-llama2-7b-v1.3)
+### Configuration
+The following YAML configuration was used to produce this model.
+```yaml
+# https://huggingface.co/Undi95/Mistral-11B-v0.1
+slices:
+  - sources:
+      - model: davzoku/cria-llama2-7b-v1.3
+        layer_range: [0, 24]
+  - sources:
+      - model: davzoku/cria-llama2-7b-v1.3
+        layer_range: [8, 32]
+merge_method: passthrough
+dtype: bfloat16
+```