webpluging

Paused

ranamhamoud commited on Apr 18

Commit

9905ae2

•

1 Parent(s): bda6d90

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -56,7 +56,14 @@ def generate(
     top_k: int = 50,
     repetition_penalty: float = 1.2,
 ) -> Iterator[str]:
-    if model == "A":
         model = modelA
         tokenizer = tokenizerA
         enc = tokenizer(make_prompt(message), return_tensors="pt", padding=True, truncation=True)
@@ -66,13 +73,7 @@ def generate(
         model = modelB
         tokenizer = tokenizerB
         input_ids = tokenizer.apply_chat_template(conversation, return_tensors="pt")
-    conversation = []
-    if system_prompt:
-        conversation.append({"role": "system", "content": system_prompt})
-    for user, assistant in chat_history:
-        conversation.extend([{"role": "user", "content": user}, {"role": "assistant", "content": assistant}])
-    conversation.append({"role": "user", "content": message})
     if input_ids.shape[1] > MAX_INPUT_TOKEN_LENGTH:
         input_ids = input_ids[:, -MAX_INPUT_TOKEN_LENGTH:]
         gr.Warning(f"Trimmed input from conversation as it was longer than {MAX_INPUT_TOKEN_LENGTH} tokens.")

     top_k: int = 50,
     repetition_penalty: float = 1.2,
 ) -> Iterator[str]:
+    conversation = []
+    if system_prompt:
+        conversation.append({"role": "system", "content": system_prompt})
+    for user, assistant in chat_history:
+        conversation.extend([{"role": "user", "content": user}, {"role": "assistant", "content": assistant}])
+    conversation.append({"role": "user", "content": message})
+     if model == "A":
         model = modelA
         tokenizer = tokenizerA
         enc = tokenizer(make_prompt(message), return_tensors="pt", padding=True, truncation=True)
         model = modelB
         tokenizer = tokenizerB
         input_ids = tokenizer.apply_chat_template(conversation, return_tensors="pt")
     if input_ids.shape[1] > MAX_INPUT_TOKEN_LENGTH:
         input_ids = input_ids[:, -MAX_INPUT_TOKEN_LENGTH:]
         gr.Warning(f"Trimmed input from conversation as it was longer than {MAX_INPUT_TOKEN_LENGTH} tokens.")