ibm-ai-platform
/

granite-7b-lab-accelerator

Transformers

Safetensors

mlp_speculator

Model card Files Files and versions

xet

Community

JRosenkranz commited on Apr 24, 2024

Commit

cebf8b4

verified ·

1 Parent(s): 6150e54

Update README.md

Browse files

Files changed (1) hide show

README.md +7 -4

README.md CHANGED Viewed

@@ -108,7 +108,7 @@ _Note: first prompt may be slower as there is a slight warmup time_
 #### Install
 ```bash
-git clone https://github.com/foundation-model-stack/fms-extras
 (cd fms-extras && pip install -e .)
 pip install transformers==4.35.0 sentencepiece numpy
 ```
@@ -120,12 +120,13 @@ pip install transformers==4.35.0 sentencepiece numpy
 ```bash
 MODEL_PATH=/path/to/instructlab/granite-7b-lab
 python fms-extras/scripts/paged_speculative_inference.py \
-    --variant=ibm.7b_instruct_lab \
     --model_path=$MODEL_PATH \
     --model_source=hf \
     --tokenizer=$MODEL_PATH \
     --speculator_path=ibm/granite-7b-lab-accelerator \
     --speculator_source=hf \
     --top_k_tokens_per_head=4,3,2,2,2 \
     --compile \
     --compile_mode=reduce-overhead
@@ -136,12 +137,13 @@ python fms-extras/scripts/paged_speculative_inference.py \
 ```bash
 MODEL_PATH=/path/to/instructlab/granite-7b-lab
 python fms-extras/scripts/paged_speculative_inference.py \
-    --variant=ibm.7b_instruct_lab \
     --model_path=$MODEL_PATH \
     --model_source=hf \
     --tokenizer=$MODEL_PATH \
     --speculator_path=ibm/granite-7b-lab-accelerator \
     --speculator_source=hf \
     --top_k_tokens_per_head=4,3,2,2,2 \
     --compile \
 ```
@@ -151,12 +153,13 @@ python fms-extras/scripts/paged_speculative_inference.py \
 ```bash
 MODEL_PATH=/path/to/instructlab/granite-7b-lab
 python fms-extras/scripts/paged_speculative_inference.py \
-    --variant=ibm.7b_instruct_lab \
     --model_path=$MODEL_PATH \
     --model_source=hf \
     --tokenizer=$MODEL_PATH \
     --speculator_path=ibm/granite-7b-lab-accelerator \
     --speculator_source=hf \
     --top_k_tokens_per_head=4,3,2,2,2 \
     --batch_input \
     --compile \

 #### Install
 ```bash
+git clone --branch ibm_7b_instruct_lab_variant --single-branch https://github.com/JRosenkranz/fms-extras.git
 (cd fms-extras && pip install -e .)
 pip install transformers==4.35.0 sentencepiece numpy
 ```
 ```bash
 MODEL_PATH=/path/to/instructlab/granite-7b-lab
 python fms-extras/scripts/paged_speculative_inference.py \
+    --variant=7b.ibm_instruct_lab \
     --model_path=$MODEL_PATH \
     --model_source=hf \
     --tokenizer=$MODEL_PATH \
     --speculator_path=ibm/granite-7b-lab-accelerator \
     --speculator_source=hf \
+    --speculator_variant=1.4b \
     --top_k_tokens_per_head=4,3,2,2,2 \
     --compile \
     --compile_mode=reduce-overhead
 ```bash
 MODEL_PATH=/path/to/instructlab/granite-7b-lab
 python fms-extras/scripts/paged_speculative_inference.py \
+    --variant=7b.ibm_instruct_lab \
     --model_path=$MODEL_PATH \
     --model_source=hf \
     --tokenizer=$MODEL_PATH \
     --speculator_path=ibm/granite-7b-lab-accelerator \
     --speculator_source=hf \
+    --speculator_variant=1.4b \
     --top_k_tokens_per_head=4,3,2,2,2 \
     --compile \
 ```
 ```bash
 MODEL_PATH=/path/to/instructlab/granite-7b-lab
 python fms-extras/scripts/paged_speculative_inference.py \
+    --variant=7b.ibm_instruct_lab \
     --model_path=$MODEL_PATH \
     --model_source=hf \
     --tokenizer=$MODEL_PATH \
     --speculator_path=ibm/granite-7b-lab-accelerator \
     --speculator_source=hf \
+    --speculator_variant=1.4b \
     --top_k_tokens_per_head=4,3,2,2,2 \
     --batch_input \
     --compile \