Spaces:

eliot-hub
/

RAG-gemma2b

Runtime error

App Files Files Community

eliot-hub commited on Mar 12

Commit

4972318

•

1 Parent(s): 98ff3d8

first commit

Browse files

Files changed (2) hide show

app.py +65 -0
requirements.txt +4 -0

app.py ADDED Viewed

	@@ -0,0 +1,65 @@

+import gradio as gr
+from sentence_transformers import SentenceTransformer
+from transformers import AutoTokenizer, AutoModelForCausalLM
+import vecs
+# Load models
+model_ret =  SentenceTransformer("intfloat/multilingual-e5-large")
+tokenizer = AutoTokenizer.from_pretrained("google/gemma-2b-it")
+model_it = AutoModelForCausalLM.from_pretrained("google/gemma-2b-it")  #, device_map="auto")
+# Init session
+user = SUPABASE_USER
+password = SUPABASE_PASSWORD
+host = "aws-0-eu-central-1.pooler.supabase.com"
+port = "5432"
+db_name = "postgres"
+DB_CONNECTION = f"postgresql://{user}:{password}@{host}:{port}/{db_name}"
+examples = [
+    "Comment fonctionne l'assurance emprunteur ?",
+    "Qu'est ce que l'euro croissance ?"
+]
+def pipeline(query):
+    query_emb = model_ret.encode(query).tolist()
+    with vecs.create_client(DB_CONNECTION) as vx:
+        resume = vx.get_or_create_collection(
+            name="resume_vec",
+            dimension=1024,
+        )
+        result = resume.query(
+            data=query_emb,
+            limit=5,
+            measure="cosine_distance",
+            include_value=True,
+            include_metadata=True,
+        )
+    source_information = " ".join([e[2]["body"] for e in result])
+    combined_information = (
+        f"Requête: {query}\nRéponds à la requête en te basant sur le contexte suivant :\n{source_information}. \nRéponse:"
+    )
+    input_ids = tokenizer(combined_information, return_tensors="pt")  #.to("cuda")
+    response = model_it.generate(**input_ids, max_new_tokens=500)
+    response_str = tokenizer.decode(response[0])
+    return response_str.split("Réponse:")[-1].strip().replace("<eos>", "")
+demo = gr.Interface(
+    fn=pipeline,
+    inputs=gr.Textbox(label="Input", lines=2), #"text",
+    outputs=gr.Textbox(label="Output", lines=2),
+    title="RAG gemma-2b",
+    examples=examples,
+    allow_flagging="never",
+    theme=gr.themes.Default()
+)
+demo.launch(inbrowser=True)  #share=True

requirements.txt ADDED Viewed

	@@ -0,0 +1,4 @@

+gradio==4.21.0
+sentence-transformers==2.5.1
+transformers @ git+https://github.com/huggingface/transformers.git
+vecs==0.4.3