bartowski commited on Apr 6

Commit

7290581

•

1 Parent(s): 4695e01

Llamacpp quants

Browse files

Files changed (18) hide show

.gitattributes +16 -0
README.md +48 -0
gemma-1.1-2b-it-IQ3_M.gguf +3 -0
gemma-1.1-2b-it-IQ3_S.gguf +3 -0
gemma-1.1-2b-it-IQ4_NL.gguf +3 -0
gemma-1.1-2b-it-IQ4_XS.gguf +3 -0
gemma-1.1-2b-it-Q2_K.gguf +3 -0
gemma-1.1-2b-it-Q3_K_L.gguf +3 -0
gemma-1.1-2b-it-Q3_K_M.gguf +3 -0
gemma-1.1-2b-it-Q3_K_S.gguf +3 -0
gemma-1.1-2b-it-Q4_0.gguf +3 -0
gemma-1.1-2b-it-Q4_K_M.gguf +3 -0
gemma-1.1-2b-it-Q4_K_S.gguf +3 -0
gemma-1.1-2b-it-Q5_0.gguf +3 -0
gemma-1.1-2b-it-Q5_K_M.gguf +3 -0
gemma-1.1-2b-it-Q5_K_S.gguf +3 -0
gemma-1.1-2b-it-Q6_K.gguf +3 -0
gemma-1.1-2b-it-Q8_0.gguf +3 -0

.gitattributes CHANGED Viewed

@@ -33,3 +33,19 @@ saved_model/**/* filter=lfs diff=lfs merge=lfs -text
 *.zip filter=lfs diff=lfs merge=lfs -text
 *.zst filter=lfs diff=lfs merge=lfs -text
 *tfevents* filter=lfs diff=lfs merge=lfs -text

 *.zip filter=lfs diff=lfs merge=lfs -text
 *.zst filter=lfs diff=lfs merge=lfs -text
 *tfevents* filter=lfs diff=lfs merge=lfs -text
+gemma-1.1-2b-it-IQ3_M.gguf filter=lfs diff=lfs merge=lfs -text
+gemma-1.1-2b-it-IQ3_S.gguf filter=lfs diff=lfs merge=lfs -text
+gemma-1.1-2b-it-IQ4_NL.gguf filter=lfs diff=lfs merge=lfs -text
+gemma-1.1-2b-it-IQ4_XS.gguf filter=lfs diff=lfs merge=lfs -text
+gemma-1.1-2b-it-Q2_K.gguf filter=lfs diff=lfs merge=lfs -text
+gemma-1.1-2b-it-Q3_K_L.gguf filter=lfs diff=lfs merge=lfs -text
+gemma-1.1-2b-it-Q3_K_M.gguf filter=lfs diff=lfs merge=lfs -text
+gemma-1.1-2b-it-Q3_K_S.gguf filter=lfs diff=lfs merge=lfs -text
+gemma-1.1-2b-it-Q4_0.gguf filter=lfs diff=lfs merge=lfs -text
+gemma-1.1-2b-it-Q4_K_M.gguf filter=lfs diff=lfs merge=lfs -text
+gemma-1.1-2b-it-Q4_K_S.gguf filter=lfs diff=lfs merge=lfs -text
+gemma-1.1-2b-it-Q5_0.gguf filter=lfs diff=lfs merge=lfs -text
+gemma-1.1-2b-it-Q5_K_M.gguf filter=lfs diff=lfs merge=lfs -text
+gemma-1.1-2b-it-Q5_K_S.gguf filter=lfs diff=lfs merge=lfs -text
+gemma-1.1-2b-it-Q6_K.gguf filter=lfs diff=lfs merge=lfs -text
+gemma-1.1-2b-it-Q8_0.gguf filter=lfs diff=lfs merge=lfs -text

README.md ADDED Viewed

	@@ -0,0 +1,48 @@

+---
+library_name: transformers
+widget:
+- messages:
+  - role: user
+    content: How does the brain work?
+inference:
+  parameters:
+    max_new_tokens: 200
+extra_gated_heading: Access Gemma on Hugging Face
+extra_gated_prompt: >-
+  To access Gemma on Hugging Face, you’re required to review and agree to
+  Google’s usage license. To do this, please ensure you’re logged-in to Hugging
+  Face and click below. Requests are processed immediately.
+extra_gated_button_content: Acknowledge license
+license: gemma
+quantized_by: bartowski
+pipeline_tag: text-generation
+---
+## Llamacpp Quantizations of gemma-1.1-2b-it
+Using <a href="https://github.com/ggerganov/llama.cpp/">llama.cpp</a> release <a href="https://github.com/ggerganov/llama.cpp/releases/tag/b2589">b2589</a> for quantization.
+Original model: https://huggingface.co/google/gemma-1.1-2b-it
+Download a file (not the whole branch) from below:
+| Filename | Quant type | File Size | Description |
+| -------- | ---------- | --------- | ----------- |
+| [gemma-1.1-2b-it-Q8_0.gguf](https://huggingface.co/bartowski/gemma-1.1-2b-it-GGUF/blob/main/gemma-1.1-2b-it-Q8_0.gguf) | Q8_0 | 2.66GB | Extremely high quality, generally unneeded but max available quant. |
+| [gemma-1.1-2b-it-Q6_K.gguf](https://huggingface.co/bartowski/gemma-1.1-2b-it-GGUF/blob/main/gemma-1.1-2b-it-Q6_K.gguf) | Q6_K | 2.06GB | Very high quality, near perfect, *recommended*. |
+| [gemma-1.1-2b-it-Q5_K_M.gguf](https://huggingface.co/bartowski/gemma-1.1-2b-it-GGUF/blob/main/gemma-1.1-2b-it-Q5_K_M.gguf) | Q5_K_M | 1.83GB | High quality, *recommended*. |
+| [gemma-1.1-2b-it-Q5_K_S.gguf](https://huggingface.co/bartowski/gemma-1.1-2b-it-GGUF/blob/main/gemma-1.1-2b-it-Q5_K_S.gguf) | Q5_K_S | 1.79GB | High quality, *recommended*. |
+| [gemma-1.1-2b-it-Q5_0.gguf](https://huggingface.co/bartowski/gemma-1.1-2b-it-GGUF/blob/main/gemma-1.1-2b-it-Q5_0.gguf) | Q5_0 | 1.79GB | High quality, older format, generally not recommended. |
+| [gemma-1.1-2b-it-Q4_K_M.gguf](https://huggingface.co/bartowski/gemma-1.1-2b-it-GGUF/blob/main/gemma-1.1-2b-it-Q4_K_M.gguf) | Q4_K_M | 1.63GB | Good quality, uses about 4.83 bits per weight, *recommended*. |
+| [gemma-1.1-2b-it-Q4_K_S.gguf](https://huggingface.co/bartowski/gemma-1.1-2b-it-GGUF/blob/main/gemma-1.1-2b-it-Q4_K_S.gguf) | Q4_K_S | 1.55GB | Slightly lower quality with small space savings. |
+| [gemma-1.1-2b-it-IQ4_NL.gguf](https://huggingface.co/bartowski/gemma-1.1-2b-it-GGUF/blob/main/gemma-1.1-2b-it-IQ4_NL.gguf) | IQ4_NL | 1.56GB | Decent quality, similar to Q4_K_S, new method of quanting, *recommended*. |
+| [gemma-1.1-2b-it-IQ4_XS.gguf](https://huggingface.co/bartowski/gemma-1.1-2b-it-GGUF/blob/main/gemma-1.1-2b-it-IQ4_XS.gguf) | IQ4_XS | 1.50GB | Decent quality, new method with similar performance to Q4. |
+| [gemma-1.1-2b-it-Q4_0.gguf](https://huggingface.co/bartowski/gemma-1.1-2b-it-GGUF/blob/main/gemma-1.1-2b-it-Q4_0.gguf) | Q4_0 | 1.55GB | Decent quality, older format, generally not recommended. |
+| [gemma-1.1-2b-it-Q3_K_L.gguf](https://huggingface.co/bartowski/gemma-1.1-2b-it-GGUF/blob/main/gemma-1.1-2b-it-Q3_K_L.gguf) | Q3_K_L | 1.46GB | Lower quality but usable, good for low RAM availability. |
+| [gemma-1.1-2b-it-Q3_K_M.gguf](https://huggingface.co/bartowski/gemma-1.1-2b-it-GGUF/blob/main/gemma-1.1-2b-it-Q3_K_M.gguf) | Q3_K_M | 1.38GB | Even lower quality. |
+| [gemma-1.1-2b-it-IQ3_M.gguf](https://huggingface.co/bartowski/gemma-1.1-2b-it-GGUF/blob/main/gemma-1.1-2b-it-IQ3_M.gguf) | IQ3_M | 1.30GB | Medium-low quality, new method with decent performance. |
+| [gemma-1.1-2b-it-IQ3_S.gguf](https://huggingface.co/bartowski/gemma-1.1-2b-it-GGUF/blob/main/gemma-1.1-2b-it-IQ3_S.gguf) | IQ3_S | 1.28GB | Lower quality, new method with decent performance, recommended over Q3 quants. |
+| [gemma-1.1-2b-it-Q3_K_S.gguf](https://huggingface.co/bartowski/gemma-1.1-2b-it-GGUF/blob/main/gemma-1.1-2b-it-Q3_K_S.gguf) | Q3_K_S | 1.28GB | Low quality, not recommended. |
+| [gemma-1.1-2b-it-Q2_K.gguf](https://huggingface.co/bartowski/gemma-1.1-2b-it-GGUF/blob/main/gemma-1.1-2b-it-Q2_K.gguf) | Q2_K | 1.15GB | Extremely low quality, *not* recommended. |
+Want to support my work? Visit my ko-fi page here: https://ko-fi.com/bartowski

gemma-1.1-2b-it-IQ3_M.gguf ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:00a5fbfc4e159681da16464f6faf41b73d1d4589d469d5515289a82ae4d408aa
+size 1308174048

gemma-1.1-2b-it-IQ3_S.gguf ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:8d3de552d7fb8d864ef2aed4eaadbc49d1213b16490cfc0cc06b4ae9e5296306
+size 1289234144

gemma-1.1-2b-it-IQ4_NL.gguf ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:9b86787843372c84d80be69b526e1297bfd3927d3f3caf545d37827002c45542
+size 1560757984

gemma-1.1-2b-it-IQ4_XS.gguf ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:c57b8d9ae9a42389c2c272dcd25f5e503804e07f663448e2c793663992f4239a
+size 1501218528

gemma-1.1-2b-it-Q2_K.gguf ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:fd565dc7ce9f11dc840895c02506dcf5a7f7f595d7837d5eb7816b9fdfa7679d
+size 1157924576

gemma-1.1-2b-it-Q3_K_L.gguf ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:3ee84ba9d80c8fe63ecbb92882dbfe41b6ae65950c63e410962f93a6a9f2570a
+size 1465591520

gemma-1.1-2b-it-Q3_K_M.gguf ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:d8aaa0dab9fae50249b5bed1ee880669fc0199d551ae757e47e9a52a49810e6d
+size 1383802592

gemma-1.1-2b-it-Q3_K_S.gguf ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:cf52d95e1f23e8a1f29a85a4bc86accc6ad834e03df7eb2e5a432355db60b1dd
+size 1287980768

gemma-1.1-2b-it-Q4_0.gguf ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:5ec0c6be4f9ccd657518e9304c1912c872939884748f0927a23b0d542aa4043c
+size 1551189728

gemma-1.1-2b-it-Q4_K_M.gguf ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:cc2118e1d780fa33582738d8c99223d62c8734b06ef65076c01618d484d081d4
+size 1630263008

gemma-1.1-2b-it-Q4_K_S.gguf ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:381472785f7f3a4a72c1f76b3351d9eb2686836b8587d389e7d2afb82f6f48f4
+size 1559840480

gemma-1.1-2b-it-Q5_0.gguf ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:74b19076a50159b0af56ce92270ce53430d2ec5e00e1cddc1fab3c88683f09f7
+size 1798915808

gemma-1.1-2b-it-Q5_K_M.gguf ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:9c19111998d075a9e9f2241c0ebfdd331be0e74e68633637d8a89af832fb3b4e
+size 1839650528

gemma-1.1-2b-it-Q5_K_S.gguf ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:b2eefbefa4ee3567eb7cbe891caa6550bae83c6c1d6f1a8c4cfe8aef42f09c52
+size 1798915808

gemma-1.1-2b-it-Q6_K.gguf ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:6c1e783072c32fdd56a60eb3dff33dac0126e8657b9d7bd558fad7dbeceefad4
+size 2062124768

gemma-1.1-2b-it-Q8_0.gguf ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:769d716580c94c874864da0991e54a53d27ead0760b419e38a2d56bcfc4d4f8d
+size 2669070048