Spaces:

somosnlp-hackathon-2022
/

BioMedIA

Build error

avacaondata commited on Mar 30, 2022

Commit

fa00011

•

1 Parent(s): 05aebdd

añadida mejora en el ranker

Files changed (1) hide show

app.py CHANGED Viewed

@@ -97,7 +97,7 @@ def query_index(question: str):
         context for context in contexts if len(context.split()) > min_snippet_length
     ]
 def sort_on_similarity(question, contexts, include_rank: int = 5):
     # TODO: METER AQUÍ EL CROSSENCODER nuestro
     question_encoded = similarity_model.encode([question])[0]
@@ -107,6 +107,19 @@ def sort_on_similarity(question, contexts, include_rank: int = 5):
     ]
     similarity_ranking_idx = np.flip(np.argsort(similarity_scores))
     return [contexts[idx] for idx in similarity_ranking_idx][:include_rank]
 def create_context(contexts: List):

         context for context in contexts if len(context.split()) > min_snippet_length
     ]
+"""
 def sort_on_similarity(question, contexts, include_rank: int = 5):
     # TODO: METER AQUÍ EL CROSSENCODER nuestro
     question_encoded = similarity_model.encode([question])[0]
     ]
     similarity_ranking_idx = np.flip(np.argsort(similarity_scores))
     return [contexts[idx] for idx in similarity_ranking_idx][:include_rank]
+"""
+def sort_on_similarity(question, contexts, include_rank: int = 5):
+    question_encoded = similarity_model.encode([question])[0]
+    ctxs_encoded = similarity_model.encode(contexts)
+    sim_scores_ss = [
+         util.cos_sim(question_encoded, ctx_encoded) for ctx_encoded in ctxs_encoded
+    ]
+    text_pairs = [[question, ctx] for ctx in contexts]
+    similarity_scores = crossencoder.predict(text_pairs)
+    similarity_scores = sim_scores_ss * similarity_scores
+    similarity_ranking_idx = np.flip(np.argsort(similarity_scores))
+    return [contexts[idx] for idx in similarity_ranking_idx][:include_rank]
 def create_context(contexts: List):