cmarkea
/

bloomz-3b-retriever

Feature Extraction

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

Cyrile commited on Nov 2, 2023

Commit

9f34c3a

·

1 Parent(s): 7696112

Update README.md

Files changed (1) hide show

README.md +18 -0

README.md CHANGED Viewed

@@ -8,3 +8,21 @@ language:
 pipeline_tag: sentence-similarity
 ---

 pipeline_tag: sentence-similarity
 ---
+```python
+import numpy as np
+from transformers import pipeline
+from scipy.spatial.distance import cdist
+retriever = pipeline('feature-extraction', 'cmarkea/bloomz-560m-retriever')
+infer = lambda x: [ii[0][-1] for ii in retriever(x)]
+list_of_contexts = [...]
+emb_contexts = np.concatenate(infer(list_of_contexts), axis=0)
+list_of_queries = [...]
+emb_queries = np.concatenate(infer(list_of_queries), axis=0)
+dist = cdist(emb_queries, emb_contexts, 'euclidean')
+# top 5 nearest contexts for each queries
+top_k = lambda x: [[list_of_contexts[qq] for qq in ii] for ii in dist.argsort(axis=-1)[:,:x]]
+top_contexts = top_k(5)
+```