Spaces:

lightita
/

seallm-khm-sum

Sleeping

lightita commited on 21 days ago

Commit

9a5ab5c

verified ·

1 Parent(s): a53b482

Update train_seallm_khm_sum.py

Files changed (1) hide show

train_seallm_khm_sum.py CHANGED Viewed

@@ -86,11 +86,13 @@ def load_model_and_tokenizer():
         trust_remote_code=True,
     )
-    model.gradient_checkpointing_enable()
     return model, tokenizer
 def main():
     train_ds, eval_ds = load_khm_dataset()
     model, tokenizer = load_model_and_tokenizer()
@@ -149,10 +151,11 @@ def main():
         save_total_limit=2,
         lr_scheduler_type="cosine",
         warmup_ratio=0.03,
-        fp16=True,          # safer for old transformers
-        report_to="none",   # remove if this crashes
     )
     trainer = Trainer(
         model=model,
         args=training_args,

         trust_remote_code=True,
     )
+    # Disable gradient checkpointing; old transformers breaks autograd here
+    # model.gradient_checkpointing_enable()
     return model, tokenizer
 def main():
     train_ds, eval_ds = load_khm_dataset()
     model, tokenizer = load_model_and_tokenizer()
         save_total_limit=2,
         lr_scheduler_type="cosine",
         warmup_ratio=0.03,
+        fp16=False,        # turn off mixed precision for CPU
+        report_to="none",
     )
     trainer = Trainer(
         model=model,
         args=training_args,