init

Browse files

Files changed (3) hide show

.gitattributes +1 -0
README.md +253 -0
granite-20b-code-base.Q4_K_M.gguf +3 -0

.gitattributes CHANGED Viewed

@@ -33,3 +33,4 @@ saved_model/**/* filter=lfs diff=lfs merge=lfs -text
 *.zip filter=lfs diff=lfs merge=lfs -text
 *.zst filter=lfs diff=lfs merge=lfs -text
 *tfevents* filter=lfs diff=lfs merge=lfs -text

 *.zip filter=lfs diff=lfs merge=lfs -text
 *.zst filter=lfs diff=lfs merge=lfs -text
 *tfevents* filter=lfs diff=lfs merge=lfs -text
+granite-20b-code-base.Q4_K_M.gguf filter=lfs diff=lfs merge=lfs -text

README.md CHANGED Viewed

@@ -1,3 +1,256 @@
 ---
 license: apache-2.0
 ---

 ---
+pipeline_tag: text-generation
+inference: true
 license: apache-2.0
+datasets:
+- codeparrot/github-code-clean
+- bigcode/starcoderdata
+# - Stackexchange
+# - CommonCrawl
+- open-web-math/open-web-math
+- math-ai/StackMathQA
+# - Arxiv
+# - Wikipedia
+# - conceptofmind/FLAN_2022 # Original link is broken, we used IBM's filtered version | Phase 2
+metrics:
+- code_eval
+library_name: transformers
+tags:
+- code
+- granite
+model-index:
+- name: granite-20b-code-base
+  results:
+  - task:
+      type: text-generation
+    dataset:
+        type: mbpp
+        name: MBPP
+    metrics:
+    - name: pass@1
+      type: pass@1
+      value: 43.8
+      veriefied: false
+  - task:
+      type: text-generation
+    dataset:
+        type: evalplus/mbppplus
+        name: MBPP+
+    metrics:
+    - name: pass@1
+      type: pass@1
+      value: 51.6
+      veriefied: false
+  - task:
+      type: text-generation
+    dataset:
+        type: bigcode/humanevalpack
+        name: HumanEvalSynthesis(Python)
+    metrics:
+    - name: pass@1
+      type: pass@1
+      value: 48.2
+      veriefied: false
+  - task:
+      type: text-generation
+    dataset:
+        type: bigcode/humanevalpack
+        name: HumanEvalSynthesis(JavaScript)
+    metrics:
+    - name: pass@1
+      type: pass@1
+      value: 50.0
+      veriefied: false
+  - task:
+      type: text-generation
+    dataset:
+        type: bigcode/humanevalpack
+        name: HumanEvalSynthesis(Java)
+    metrics:
+    - name: pass@1
+      type: pass@1
+      value: 59.1
+      veriefied: false
+  - task:
+      type: text-generation
+    dataset:
+        type: bigcode/humanevalpack
+        name: HumanEvalSynthesis(Go)
+    metrics:
+    - name: pass@1
+      type: pass@1
+      value: 32.3
+      veriefied: false
+  - task:
+      type: text-generation
+    dataset:
+        type: bigcode/humanevalpack
+        name: HumanEvalSynthesis(C++)
+    metrics:
+    - name: pass@1
+      type: pass@1
+      value: 40.9
+      veriefied: false
+  - task:
+      type: text-generation
+    dataset:
+        type: bigcode/humanevalpack
+        name: HumanEvalSynthesis(Rust)
+    metrics:
+    - name: pass@1
+      type: pass@1
+      value: 35.4
+      veriefied: false
+  - task:
+      type: text-generation
+    dataset:
+        type: bigcode/humanevalpack
+        name:  HumanEvalExplain(Python)
+    metrics:
+    - name: pass@1
+      type: pass@1
+      value: 17.1
+      veriefied: false
+  - task:
+      type: text-generation
+    dataset:
+        type: bigcode/humanevalpack
+        name:  HumanEvalExplain(JavaScript)
+    metrics:
+    - name: pass@1
+      type: pass@1
+      value: 18.3
+      veriefied: false
+  - task:
+      type: text-generation
+    dataset:
+        type: bigcode/humanevalpack
+        name:  HumanEvalExplain(Java)
+    metrics:
+    - name: pass@1
+      type: pass@1
+      value: 23.2
+      veriefied: false
+  - task:
+      type: text-generation
+    dataset:
+        type: bigcode/humanevalpack
+        name:  HumanEvalExplain(Go)
+    metrics:
+    - name: pass@1
+      type: pass@1
+      value: 10.4
+      veriefied: false
+  - task:
+      type: text-generation
+    dataset:
+        type: bigcode/humanevalpack
+        name:  HumanEvalExplain(C++)
+    metrics:
+    - name: pass@1
+      type: pass@1
+      value: 25.6
+      veriefied: false
+  - task:
+      type: text-generation
+    dataset:
+        type: bigcode/humanevalpack
+        name:  HumanEvalExplain(Rust)
+    metrics:
+    - name: pass@1
+      type: pass@1
+      value: 18.3
+      veriefied: false
+  - task:
+      type: text-generation
+    dataset:
+        type: bigcode/humanevalpack
+        name:  HumanEvalFix(Python)
+    metrics:
+    - name: pass@1
+      type: pass@1
+      value: 23.2
+      veriefied: false
+  - task:
+      type: text-generation
+    dataset:
+        type: bigcode/humanevalpack
+        name:  HumanEvalFix(JavaScript)
+    metrics:
+    - name: pass@1
+      type: pass@1
+      value: 23.8
+      veriefied: false # Check
+  - task:
+      type: text-generation
+    dataset:
+        type: bigcode/humanevalpack
+        name:  HumanEvalFix(Java)
+    metrics:
+    - name: pass@1
+      type: pass@1
+      value: 14.6
+      veriefied: false
+  - task:
+      type: text-generation
+    dataset:
+        type: bigcode/humanevalpack
+        name:  HumanEvalFix(Go)
+    metrics:
+    - name: pass@1
+      type: pass@1
+      value: 26.2
+      veriefied: false
+  - task:
+      type: text-generation
+    dataset:
+        type: bigcode/humanevalpack
+        name:  HumanEvalFix(C++)
+    metrics:
+    - name: pass@1
+      type: pass@1
+      value: 15.2
+      veriefied: false
+  - task:
+      type: text-generation
+    dataset:
+        type: bigcode/humanevalpack
+        name:  HumanEvalFix(Rust)
+    metrics:
+    - name: pass@1
+      type: pass@1
+      value: 3.0
+      veriefied: false
 ---
+![image/png](https://cdn-uploads.huggingface.co/production/uploads/62cd5057674cdb524450093d/1hzxoPwqkBJXshKVVe6_9.png)
+# ibm-granite/granite-20b-code-base-Q4_K_M-GGUF
+This model was converted to GGUF format from [`ibm-granite/granite-20b-code-base`](https://huggingface.co/ibm-granite/granite-20b-code-base).
+Refer to the [original model card](https://huggingface.co/ibm-granite/granite-20b-code-base) for more details on the model.
+## Use with llama.cpp
+Install llama.cpp through brew.
+```bash
+brew install ggerganov/ggerganov/llama.cpp
+```
+Invoke the llama.cpp server or the CLI.
+CLI:
+```bash
+llama-cli --hf-repo ibm-granite/granite-20b-code-base-Q4_K_M-GGUF --model granite-20b-code-base.Q4_K_M.gguf -p "def generate(random_seed: int):"
+```
+Server:
+```bash
+llama-server --hf-repo ibm-granite/granite-20b-code-base-Q4_K_M-GGUF --model granite-20b-code-base.Q4_K_M.gguf -c 2048
+```
+Note: You can also use this checkpoint directly through the [usage steps](https://github.com/ggerganov/llama.cpp?tab=readme-ov-file#usage) listed in the Llama.cpp repo as well.
+```
+git clone https://github.com/ggerganov/llama.cpp &&             cd llama.cpp &&             make &&             ./main -m granite-20b-code-base.Q4_K_M.gguf -n 128
+```

granite-20b-code-base.Q4_K_M.gguf ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:f85769a9438b4f7a42377223aa0fbfc4cedc3e2e142259243ba73730d816dc7a
+size 12820206944