Spaces:

dkdaniz
/

katara

Paused

Daniel Marques commited on Oct 15, 2023

Commit

ee52019

1 Parent(s): 5873d33

fix: add websocketClient

Files changed (2) hide show

load_models.py CHANGED Viewed

@@ -69,7 +69,7 @@ def load_quantized_model_gguf_ggml(model_id, model_basename, device_type, loggin
         kwargs["stream"] = stream
         if stream == True:
-            kwargs["callbacks"] = [StreamingStdOutCallbackHandler()]
         return LlamaCpp(**kwargs)
     except:

         kwargs["stream"] = stream
         if stream == True:
+            kwargs["callbacks"] = callbacks
         return LlamaCpp(**kwargs)
     except:

main.py CHANGED Viewed

@@ -31,15 +31,13 @@ class Predict(BaseModel):
 class Delete(BaseModel):
     filename: str
-tokenWS = ''
 class MyCustomHandler(BaseCallbackHandler):
     def on_llm_new_token(self, token: str, **kwargs) -> None:
         global websocketClient
         websocketClient.send_text(f"Message text was: {token}")
-        print(f" token: {tokenWS}")
     async def on_llm_start(
         self, serialized: Dict[str, Any], prompts: List[str], **kwargs: Any

 class Delete(BaseModel):
     filename: str
 class MyCustomHandler(BaseCallbackHandler):
     def on_llm_new_token(self, token: str, **kwargs) -> None:
         global websocketClient
         websocketClient.send_text(f"Message text was: {token}")
+        print(f" token: {token}")
     async def on_llm_start(
         self, serialized: Dict[str, Any], prompts: List[str], **kwargs: Any