Spaces:

PharynxAI
/

LLM_FinetuneR

Paused

Diksha2001 commited on Dec 3, 2024

Commit

e44e2bf

•

1 Parent(s): 546c728

Update Finetuning_Pipeline.py

Files changed (1) hide show

Finetuning_Pipeline.py CHANGED Viewed

@@ -62,8 +62,8 @@ def start_vllm_server(model_name):
         "vllm",
         "serve",
         "hugging-quants/Meta-Llama-3.1-8B-Instruct-AWQ-INT4",
-        "--gpu_memory_utilization=0.98",
-        "--max_model_len=4096",
         "--enable-chunked-prefill=False",
         "--num_scheduler_steps=2"
     ]

         "vllm",
         "serve",
         "hugging-quants/Meta-Llama-3.1-8B-Instruct-AWQ-INT4",
+        "--gpu_memory_utilization=0.99",
+        "--max_model_len=8192",
         "--enable-chunked-prefill=False",
         "--num_scheduler_steps=2"
     ]