rawsh
/

multi-qa-MiniLM-distill-onnx-L6-cos-v1

Sentence Similarity

sentence-transformers

feature-extraction

text-embeddings-inference

Inference Endpoints

Model card Files Files and versions Community

rawsh commited on Jun 6, 2023

Commit

d6054ae

·

1 Parent(s): 7394ed5

Update README.md

Files changed (1) hide show

README.md +3 -3

README.md CHANGED Viewed

@@ -62,11 +62,11 @@ class SentenceEmbeddingPipeline(Pipeline):
         return sentence_embeddings
 # load optimized model
-onnx_path = "./models/cos-v1-best/"
-model = ORTModelForFeatureExtraction.from_pretrained(onnx_path, file_name="model_quantized.onnx")
 # create optimized pipeline
-tokenizer = AutoTokenizer.from_pretrained(onnx_path, use_fast=True)
 optimized_emb = SentenceEmbeddingPipeline(model=model, tokenizer=tokenizer)
 pred1 = optimized_emb("Hello world!")
 pred2 = optimized_emb("I hate everything.")

         return sentence_embeddings
 # load optimized model
+model_name = "rawsh/multi-qa-MiniLM-distill-onnx-L6-cos-v1"
+model = ORTModelForFeatureExtraction.from_pretrained(model_name, file_name="model_quantized.onnx")
 # create optimized pipeline
+tokenizer = AutoTokenizer.from_pretrained(model_name, use_fast=True)
 optimized_emb = SentenceEmbeddingPipeline(model=model, tokenizer=tokenizer)
 pred1 = optimized_emb("Hello world!")
 pred2 = optimized_emb("I hate everything.")