Chat_with_Meta_llama3_8b

Sleeping

leoskyscape commited on 28 days ago

Commit

4c2740f

verified ·

1 Parent(s): c3d6a36

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -23,8 +23,10 @@ print(f"Model downloaded to: {model_path}")
 llm = Llama(
     model_path=model_path,
     n_gpu_layers=0,       # GPU acceleration if available
-    n_ctx=4096,
     chat_format="llama-3",
 )

 llm = Llama(
     model_path=model_path,
+    n_threads=2,
+    n_batch=256,
     n_gpu_layers=0,       # GPU acceleration if available
+    n_ctx=2048,
     chat_format="llama-3",
 )