Spaces:

projecte-aina
/

EADOP_RAG

Running

App Files Files Community

Marina Pliusnina commited on Apr 17

Commit

c8bd9ca

•

1 Parent(s): 1823861

change generation parameters values

Browse files

Files changed (4) hide show

__pycache__/rag.cpython-311.pyc +0 -0
__pycache__/utils.cpython-311.pyc +0 -0
app.py +19 -19
rag.py +4 -4

__pycache__/rag.cpython-311.pyc ADDED Viewed

Binary file (3.09 kB). View file

__pycache__/utils.cpython-311.pyc ADDED Viewed

Binary file (1.71 kB). View file

app.py CHANGED Viewed

@@ -7,7 +7,7 @@ from urllib.error import HTTPError
 from rag import RAG
 from utils import setup
-MAX_NEW_TOKENS = int(os.environ.get("MAX_NEW_TOKENS", default=100))
 SHOW_MODEL_PARAMETERS_IN_UI = os.environ.get("SHOW_MODEL_PARAMETERS_IN_UI", default="True") == "True"
 setup()
@@ -44,13 +44,13 @@ def submit_input(input_, max_new_tokens, repetition_penalty, top_k, top_p, do_sa
     model_parameters = {
-        "max_new_tokens": max_new_tokens,
-        "repetition_penalty": repetition_penalty,
-        "top_k": top_k,
-        "top_p": top_p,
-        "do_sample": do_sample,
-        "num_beams": num_beams,
-        "temperature": temperature
     }
     output = generate(input_, model_parameters)
@@ -110,17 +110,17 @@ def gradio_app():
                 with gr.Row(variant="panel"):
                     with gr.Accordion("Model parameters", open=False, visible=SHOW_MODEL_PARAMETERS_IN_UI):
                         max_new_tokens = Slider(
-                            minimum=1,
-                            maximum=200,
                             step=1,
                             value=MAX_NEW_TOKENS,
                             label="Max tokens"
                         )
                         repetition_penalty = Slider(
                             minimum=0.1,
-                            maximum=10,
                             step=0.1,
-                            value=1.2,
                             label="Repetition penalty"
                         )
                         top_k = Slider(
@@ -132,25 +132,25 @@ def gradio_app():
                         )
                         top_p = Slider(
                             minimum=0.01,
-                            maximum=0.99,
-                            value=0.95,
                             label="Top p"
                         )
                         do_sample = Checkbox(
-                            value=True,
                             label="Do sample"
                         )
                         num_beams = Slider(
                             minimum=1,
-                            maximum=8,
                             step=1,
-                            value=4,
                             label="Beams"
                         )
                         temperature = Slider(
-                            minimum=0,
                             maximum=1,
-                            value=0.5,
                             label="Temperature"
                         )

 from rag import RAG
 from utils import setup
+MAX_NEW_TOKENS = int(os.environ.get("MAX_NEW_TOKENS", default=200))
 SHOW_MODEL_PARAMETERS_IN_UI = os.environ.get("SHOW_MODEL_PARAMETERS_IN_UI", default="True") == "True"
 setup()
     model_parameters = {
+        "MAX_NEW_TOKENS": max_new_tokens,
+        "REPETITION_PENALTY": repetition_penalty,
+        "TOP_K": top_k,
+        "TOP_P": top_p,
+        "DO_SAMPLE": do_sample,
+        "NUM_BEAMS": num_beams,
+        "TEMPERATURE": temperature
     }
     output = generate(input_, model_parameters)
                 with gr.Row(variant="panel"):
                     with gr.Accordion("Model parameters", open=False, visible=SHOW_MODEL_PARAMETERS_IN_UI):
                         max_new_tokens = Slider(
+                            minimum=50,
+                            maximum=1000,
                             step=1,
                             value=MAX_NEW_TOKENS,
                             label="Max tokens"
                         )
                         repetition_penalty = Slider(
                             minimum=0.1,
+                            maximum=2.0,
                             step=0.1,
+                            value=1.0,
                             label="Repetition penalty"
                         )
                         top_k = Slider(
                         )
                         top_p = Slider(
                             minimum=0.01,
+                            maximum=1.0,
+                            value=1.0,
                             label="Top p"
                         )
                         do_sample = Checkbox(
+                            value=False,
                             label="Do sample"
                         )
                         num_beams = Slider(
                             minimum=1,
+                            maximum=4,
                             step=1,
+                            value=1,
                             label="Beams"
                         )
                         temperature = Slider(
+                            minimum=0.1,
                             maximum=1,
+                            value=0.35,
                             label="Temperature"
                         )

rag.py CHANGED Viewed

@@ -38,7 +38,7 @@ class RAG:
         return context
-    def predict(self, instruction, context):
         api_key = os.getenv("HF_TOKEN")
@@ -55,18 +55,18 @@ class RAG:
         payload = {
         "inputs": query,
-        "parameters": {"MAX_NEW_TOKENS": 1000, "TEMPERATURE": 0.25}
         }
         response = requests.post(self.model_name, headers=headers, json=payload)
         return response.json()[0]["generated_text"].split("###")[-1][8:-1]
-    def get_response(self, prompt: str) -> str:
         context = self.get_context(prompt)
-        response = self.predict(prompt, context)
         if not response:
             return self.NO_ANSWER_MESSAGE

         return context
+    def predict(self, instruction, context, model_parameters):
         api_key = os.getenv("HF_TOKEN")
         payload = {
         "inputs": query,
+        "parameters": model_parameters
         }
         response = requests.post(self.model_name, headers=headers, json=payload)
         return response.json()[0]["generated_text"].split("###")[-1][8:-1]
+    def get_response(self, prompt: str, model_parameters: dict) -> str:
         context = self.get_context(prompt)
+        response = self.predict(prompt, context, model_parameters)
         if not response:
             return self.NO_ANSWER_MESSAGE