Spaces:

rm-lht
/

lightrag

Configuration error

davidlzs commited on Nov 13, 2024

Commit

ccc7d21

1 Parent(s): ddcc625

fix hf embedding to support loading to different device

Files changed (1) hide show

lightrag/llm.py CHANGED Viewed

@@ -693,13 +693,17 @@ async def bedrock_embedding(
 async def hf_embedding(texts: list[str], tokenizer, embed_model) -> np.ndarray:
     input_ids = tokenizer(
         texts, return_tensors="pt", padding=True, truncation=True
-    ).input_ids
     with torch.no_grad():
         outputs = embed_model(input_ids)
         embeddings = outputs.last_hidden_state.mean(dim=1)
-    return embeddings.detach().numpy()
 async def ollama_embedding(texts: list[str], embed_model, **kwargs) -> np.ndarray:

 async def hf_embedding(texts: list[str], tokenizer, embed_model) -> np.ndarray:
+    device = next(embed_model.parameters()).device
     input_ids = tokenizer(
         texts, return_tensors="pt", padding=True, truncation=True
+    ).input_ids.to(device)
     with torch.no_grad():
         outputs = embed_model(input_ids)
         embeddings = outputs.last_hidden_state.mean(dim=1)
+    if embeddings.dtype == torch.bfloat16:
+        return embeddings.detach().to(torch.float32).cpu().numpy()
+    else:
+        return embeddings.detach().cpu().numpy()
 async def ollama_embedding(texts: list[str], embed_model, **kwargs) -> np.ndarray: