second-state
/

All-MiniLM-L6-v2-Embedding-GGUF

Feature Extraction

sentence-transformers

sentence-similarity

text-embeddings-inference

Inference Endpoints

Model card Files Files and versions Community

apepkuss79 commited on Apr 15

Commit

b2a6536

•

1 Parent(s): 4505133

Update README.md

Files changed (1) hide show

README.md +11 -1

README.md CHANGED Viewed

@@ -28,10 +28,20 @@ tags:
 ## Run with LlamaEdge
-- LlamaEdge version: coming soon
 - Context size: `384`
 ## Quantized GGUF Models
 | Name | Quant method | Bits | Size | Use case |

 ## Run with LlamaEdge
+- LlamaEdge version: [v0.8.2](https://github.com/LlamaEdge/LlamaEdge/releases/tag/0.8.2) and above
 - Context size: `384`
+- Run as LlamaEdge service
+  ```bash
+  wasmedge --dir .:. --nn-preload default:GGML:AUTO:all-MiniLM-L6-v2-ggml-model-f16.gguf \
+    llama-api-server.wasm \
+    --prompt-template llama-2-chat \
+    --ctx-size 384 \
+    --model-name all-MiniLM-L6-v2
+  ```
 ## Quantized GGUF Models
 | Name | Quant method | Bits | Size | Use case |