Spaces:

Nitishkumar-ai
/

commitguard-env

Running on A10G

Nitishkumar-ai commited on 1 day ago

Commit

b3eb082

1 Parent(s): f1f76e5

Fix: Explicit HF token handling and final GRPO batch alignment

Files changed (1) hide show

scripts/train_grpo.py CHANGED Viewed

@@ -104,6 +104,7 @@ def main():
         wandb.init(project=WANDB_PROJECT, name=f"grpo-{MODEL_NAME.split('/')[-1]}-run1")
     # 1. Load Model
     print(f"Loading {MODEL_NAME} with Unsloth 4-bit...")
     model, tokenizer = FastLanguageModel.from_pretrained(
         model_name=MODEL_NAME,
@@ -111,6 +112,7 @@ def main():
         load_in_4bit=True,
         fast_inference=True,
         max_lora_rank=16,
     )
     model = FastLanguageModel.get_peft_model(

         wandb.init(project=WANDB_PROJECT, name=f"grpo-{MODEL_NAME.split('/')[-1]}-run1")
     # 1. Load Model
+    hf_token = os.getenv("HF_TOKEN")
     print(f"Loading {MODEL_NAME} with Unsloth 4-bit...")
     model, tokenizer = FastLanguageModel.from_pretrained(
         model_name=MODEL_NAME,
         load_in_4bit=True,
         fast_inference=True,
         max_lora_rank=16,
+        token=hf_token,
     )
     model = FastLanguageModel.get_peft_model(