Spaces:

theachyuttiwari
/

lfqa1

Build error

App Files Files Community

Achyut Tiwari commited on Jun 8, 2022

Commit

da74da1

unverified ·

0 Parent(s):

Add files via upload

Browse files

Files changed (4) hide show

context_server/Dockerfile +23 -0
context_server/__init__.py +0 -0
context_server/main.py +122 -0
context_server/requirements.txt +7 -0

context_server/Dockerfile ADDED Viewed

	@@ -0,0 +1,23 @@

+FROM nvidia/cuda:11.2.2-runtime-ubuntu20.04
+#set up environment
+RUN apt-get update && apt-get install --no-install-recommends --no-install-suggests -y curl
+RUN apt-get install unzip
+RUN apt-get -y install python3
+RUN apt-get -y install python3-pip
+WORKDIR /code
+ENV HF_HOME=/code/cache
+COPY ./requirements.txt /code/requirements.txt
+RUN pip3 install --pre torch -f https://download.pytorch.org/whl/nightly/cu113/torch_nightly.html
+RUN pip3 install --no-cache-dir --upgrade -r /code/requirements.txt
+COPY ./main.py /code/app/main.py
+COPY ./data/kilt_wiki_prepared/ /code/data/kilt_wiki_prepared
+COPY ./data/kilt_wikipedia.faiss /code/data/kilt_wikipedia.faiss
+CMD ["uvicorn", "app.main:app", "--host", "0.0.0.0", "--port", "8080"]

context_server/__init__.py ADDED Viewed

File without changes

context_server/main.py ADDED Viewed

	@@ -0,0 +1,122 @@

+import torch
+from fastapi import FastAPI, Depends, status
+from fastapi.responses import PlainTextResponse
+from transformers import AutoTokenizer, AutoModel, DPRQuestionEncoder
+from datasets import load_from_disk
+import time
+from typing import Dict
+import jwt
+from decouple import config
+from fastapi import Request, HTTPException
+from fastapi.security import HTTPBearer, HTTPAuthorizationCredentials
+JWT_SECRET = config("secret")
+JWT_ALGORITHM = config("algorithm")
+app = FastAPI()
+app.ready = False
+columns = ['kilt_id', 'wikipedia_id', 'wikipedia_title', 'text', 'anchors', 'categories',
+           'wikidata_info', 'history']
+min_snippet_length = 20
+topk = 21
+device = ("cuda" if torch.cuda.is_available() else "cpu")
+model = DPRQuestionEncoder.from_pretrained("vblagoje/dpr-question_encoder-single-lfqa-wiki").to(device)
+tokenizer = AutoTokenizer.from_pretrained("vblagoje/dpr-question_encoder-single-lfqa-wiki")
+_ = model.eval()
+index_file_name = "./data/kilt_wikipedia.faiss"
+kilt_wikipedia_paragraphs = load_from_disk("./data/kilt_wiki_prepared")
+# use paragraphs that are not simple fragments or very short sentences
+kilt_wikipedia_paragraphs = kilt_wikipedia_paragraphs.filter(lambda x: x["end_character"] > 200)
+class JWTBearer(HTTPBearer):
+    def __init__(self, auto_error: bool = True):
+        super(JWTBearer, self).__init__(auto_error=auto_error)
+    async def __call__(self, request: Request):
+        credentials: HTTPAuthorizationCredentials = await super(JWTBearer, self).__call__(request)
+        if credentials:
+            if not credentials.scheme == "Bearer":
+                raise HTTPException(status_code=403, detail="Invalid authentication scheme.")
+            if not self.verify_jwt(credentials.credentials):
+                raise HTTPException(status_code=403, detail="Invalid token or expired token.")
+            return credentials.credentials
+        else:
+            raise HTTPException(status_code=403, detail="Invalid authorization code.")
+    def verify_jwt(self, jwtoken: str) -> bool:
+        isTokenValid: bool = False
+        try:
+            payload = decodeJWT(jwtoken)
+        except:
+            payload = None
+        if payload:
+            isTokenValid = True
+        return isTokenValid
+def token_response(token: str):
+    return {
+        "access_token": token
+    }
+def signJWT(user_id: str) -> Dict[str, str]:
+    payload = {
+        "user_id": user_id,
+        "expires": time.time() + 6000
+    }
+    token = jwt.encode(payload, JWT_SECRET, algorithm=JWT_ALGORITHM)
+    return token_response(token)
+def decodeJWT(token: str) -> dict:
+    try:
+        decoded_token = jwt.decode(token, JWT_SECRET, algorithms=[JWT_ALGORITHM])
+        return decoded_token if decoded_token["expires"] >= time.time() else None
+    except:
+        return {}
+def embed_questions_for_retrieval(questions):
+    query = tokenizer(questions, max_length=128, padding=True, truncation=True, return_tensors="pt")
+    with torch.no_grad():
+        q_reps = model(query["input_ids"].to(device), query["attention_mask"].to(device)).pooler_output
+    return q_reps.cpu().numpy()
+def query_index(question):
+    question_embedding = embed_questions_for_retrieval([question])
+    scores, wiki_passages = kilt_wikipedia_paragraphs.get_nearest_examples("embeddings", question_embedding, k=topk)
+    columns = ['wikipedia_id', 'title', 'text', 'section', 'start_paragraph_id', 'end_paragraph_id',
+               'start_character', 'end_character']
+    retrieved_examples = []
+    r = list(zip(wiki_passages[k] for k in columns))
+    for i in range(topk):
+        retrieved_examples.append({k: v for k, v in zip(columns, [r[j][0][i] for j in range(len(columns))])})
+    return retrieved_examples
+@app.on_event("startup")
+def startup():
+    kilt_wikipedia_paragraphs.load_faiss_index("embeddings", index_file_name, device=0)
+    app.ready = True
+@app.get("/healthz")
+def healthz():
+    if app.ready:
+        return PlainTextResponse("ok")
+    return PlainTextResponse("service unavailable", status_code=status.HTTP_503_SERVICE_UNAVAILABLE)
+@app.get("/find_context", dependencies=[Depends(JWTBearer())])
+def find_context(question: str = None):
+    return [res for res in query_index(question) if len(res["text"].split()) > min_snippet_length][:int(topk / 3)]

context_server/requirements.txt ADDED Viewed

	@@ -0,0 +1,7 @@

+datasets
+transformers
+fastapi
+faiss-gpu
+uvicorn[standard]
+PyJWT==1.7.1
+python-decouple==3.3