Spaces:

Erpg12
/

code-reviewer

Sleeping

Erpg12 commited on May 1

Commit

4d1dce3

1 Parent(s): 894ef1a

fix: disable WandB

Files changed (1) hide show

train_sft.py CHANGED Viewed

@@ -1,10 +1,12 @@
-# train_sft.py
 import sys
 import json
 from datasets import load_dataset
 from transformers import AutoModelForCausalLM, AutoTokenizer, TrainingArguments
 from trl import SFTTrainer
 DRY_RUN = "--dry-run" in sys.argv
 MODEL_ID = "Salesforce/codegen-350M-multi"
@@ -55,7 +57,7 @@ training_args = TrainingArguments(
     save_steps       = 200,
     fp16             = False,            # no half‐precision on CPU
-    report_to        = None,             # disable WandB/others
 )
 # 4) instantiate trainer
@@ -65,8 +67,9 @@ trainer = SFTTrainer(
     train_dataset=(tokenized if DRY_RUN else ds),
 )
-print(f"\n✅ DRY-RUN: Trainer instantiated:\n  – model: {type(model)}\n  – tokenizer: {type(tokenizer)}\n  – train_dataset size: {len(tokenized if DRY_RUN else ds)}")
-print(f"  – SFTTrainingArguments: {training_args}")
 if not DRY_RUN:
     # only run the real training if you didn’t pass --dry-run

+import os
 import sys
 import json
 from datasets import load_dataset
 from transformers import AutoModelForCausalLM, AutoTokenizer, TrainingArguments
 from trl import SFTTrainer
+os.environ["WANDB_MODE"] = "disabled"
 DRY_RUN = "--dry-run" in sys.argv
 MODEL_ID = "Salesforce/codegen-350M-multi"
     save_steps       = 200,
     fp16             = False,            # no half‐precision on CPU
+    report_to        = [],             # disable WandB/others
 )
 # 4) instantiate trainer
     train_dataset=(tokenized if DRY_RUN else ds),
 )
+if DRY_RUN:
+    print(f"\n✅ DRY-RUN: Trainer instantiated:\n  – model: {type(model)}\n  – tokenizer: {type(tokenizer)}\n  – train_dataset size: {len(tokenized if DRY_RUN else ds)}")
+    print(f"  – SFTTrainingArguments: {training_args}")
 if not DRY_RUN:
     # only run the real training if you didn’t pass --dry-run