rename projector file

Signed-off-by: Xin Liu <sam@secondstate.io>

Files changed (2) hide show

README.md CHANGED Viewed

@@ -39,7 +39,7 @@ quantized_by: Second State Inc.
 - Run as LlamaEdge service
   ```bash
-  wasmedge --dir .:. --nn-preload default:GGML:AUTO:llava-v1.5-7b-Q5_K_M.gguf llama-api-server.wasm -p vicuna-llava -c 2048 --llava-mmproj mmproj-model-f16.gguf -m llava-v1.5
   ```
 ## Quantized GGUF Models
@@ -58,6 +58,6 @@ quantized_by: Second State Inc.
 | [llava-v1.5-7b-Q5_K_S.gguf](https://huggingface.co/second-state/Llava-v1.5-7B-GGUF/blob/main/llava-v1.5-7b-Q5_K_S.gguf) | Q5_K_S | 5 | 4.65 GB| large, low quality loss - recommended |
 | [llava-v1.5-7b-Q6_K.gguf](https://huggingface.co/second-state/Llava-v1.5-7B-GGUF/blob/main/llava-v1.5-7b-Q6_K.gguf)     | Q6_K   | 6 | 5.53 GB| very large, extremely low quality loss |
 | [llava-v1.5-7b-Q8_0.gguf](https://huggingface.co/second-state/Llava-v1.5-7B-GGUF/blob/main/llava-v1.5-7b-Q8_0.gguf)     | Q8_0   | 8 | 7.16 GB| very large, extremely low quality loss - not recommended |
-| [mmproj-model-f16.gguf](https://huggingface.co/second-state/Llava-v1.5-7B-GGUF/blob/main/mmproj-model-f16.gguf)     | f16   | 8 | 624 MB|  |
 *Quantized with llama.cpp b2230*

 - Run as LlamaEdge service
   ```bash
+  wasmedge --dir .:. --nn-preload default:GGML:AUTO:llava-v1.5-7b-Q5_K_M.gguf llama-api-server.wasm -p vicuna-llava -c 2048 --llava-mmproj llava-v1.5-7b-mmproj-model-f16.gguf -m llava-v1.5
   ```
 ## Quantized GGUF Models
 | [llava-v1.5-7b-Q5_K_S.gguf](https://huggingface.co/second-state/Llava-v1.5-7B-GGUF/blob/main/llava-v1.5-7b-Q5_K_S.gguf) | Q5_K_S | 5 | 4.65 GB| large, low quality loss - recommended |
 | [llava-v1.5-7b-Q6_K.gguf](https://huggingface.co/second-state/Llava-v1.5-7B-GGUF/blob/main/llava-v1.5-7b-Q6_K.gguf)     | Q6_K   | 6 | 5.53 GB| very large, extremely low quality loss |
 | [llava-v1.5-7b-Q8_0.gguf](https://huggingface.co/second-state/Llava-v1.5-7B-GGUF/blob/main/llava-v1.5-7b-Q8_0.gguf)     | Q8_0   | 8 | 7.16 GB| very large, extremely low quality loss - not recommended |
+| [llava-v1.5-7b-mmproj-model-f16.gguf](https://huggingface.co/second-state/Llava-v1.5-7B-GGUF/blob/main/llava-v1.5-7b-mmproj-model-f16.gguf)     | f16   | 8 | 624 MB|  |
 *Quantized with llama.cpp b2230*

mmproj-model-f16.gguf → llava-v1.5-7b-mmproj-model-f16.gguf RENAMED Viewed

File without changes