Spaces:

Wills17
/

Document-RAG-System

Sleeping

Wills17 commited on Oct 24

Commit

76c79b2

verified ·

1 Parent(s): 90bd68b

Update flask_app.py

Files changed (1) hide show

flask_app.py CHANGED Viewed

@@ -6,6 +6,11 @@ import re
 import tempfile
 from flask import Flask, request, jsonify, render_template
 # Disable CUDA and excessive parallel threads to save memory
 os.environ["CUDA_VISIBLE_DEVICES"] = "-1"
@@ -86,8 +91,8 @@ def upload_file():
     # Light embedding model (fast + low memory)
     try:
-        embeds = HuggingFaceEmbeddings(model_name="sentence-transformers/paraphrase-MiniLM-L3-v2")
-        # embeds = HuggingFaceEmbeddings(model_name="./models/paraphrase-MiniLM-L3-v2")
         vector_store = FAISS.from_documents(chunks, embeds)
         retriever = vector_store.as_retriever(search_type="similarity", search_kwargs={"k": 5})

 import tempfile
 from flask import Flask, request, jsonify, render_template
+# Pre-download and save the embedding model
+from sentence_transformers import SentenceTransformer
+model = SentenceTransformer("sentence-transformers/paraphrase-MiniLM-L3-v2")
+model.save("models/paraphrase-MiniLM-L3-v2")
 # Disable CUDA and excessive parallel threads to save memory
 os.environ["CUDA_VISIBLE_DEVICES"] = "-1"
     # Light embedding model (fast + low memory)
     try:
+        # embeds = HuggingFaceEmbeddings(model_name="sentence-transformers/paraphrase-MiniLM-L3-v2")
+        embeds = HuggingFaceEmbeddings(model_name="./models/paraphrase-MiniLM-L3-v2")  # local model (offline)
         vector_store = FAISS.from_documents(chunks, embeds)
         retriever = vector_store.as_retriever(search_type="similarity", search_kwargs={"k": 5})