moos124
/

code-reasoning-0.5b

Generated from Trainer

Model card Files Files and versions

moos124 commited on 19 days ago

Commit

8a60c63

·

verified ·

1 Parent(s): e96fb55

Upload train_code_reasoning.py

Files changed (1) hide show

train_code_reasoning.py +0 -6

train_code_reasoning.py CHANGED Viewed

@@ -5,7 +5,6 @@
 #     "datasets",
 #     "accelerate",
 #     "torch",
-#     "trackio",
 #     "huggingface_hub",
 #     "peft",
 # ]
@@ -17,16 +16,12 @@ from datasets import load_dataset, concatenate_datasets
 from transformers import AutoTokenizer
 from trl import SFTTrainer, SFTConfig
 from peft import LoraConfig, TaskType
-import trackio
 # Configuration - smaller model to fit in A10G 24GB VRAM comfortably
 MODEL_ID = "Qwen/Qwen2.5-Coder-0.5B-Instruct"
 HUB_MODEL_ID = "moos124/code-reasoning-0.5b"
 OUTPUT_DIR = "./code-reasoning-0.5b"
-# Initialize Trackio
-trackio.init(project="code-reasoning-ft", name="qwen2.5-coder-0.5b-code-reasoning")
 # Load tokenizer
 tokenizer = AutoTokenizer.from_pretrained(MODEL_ID, trust_remote_code=True)
@@ -192,7 +187,6 @@ training_args = SFTConfig(
     packing=False,
     dataset_num_proc=4,
     disable_tqdm=True,
-    report_to=["trackio"],
     seed=42,
     hub_strategy="checkpoint",
 )

 #     "datasets",
 #     "accelerate",
 #     "torch",
 #     "huggingface_hub",
 #     "peft",
 # ]
 from transformers import AutoTokenizer
 from trl import SFTTrainer, SFTConfig
 from peft import LoraConfig, TaskType
 # Configuration - smaller model to fit in A10G 24GB VRAM comfortably
 MODEL_ID = "Qwen/Qwen2.5-Coder-0.5B-Instruct"
 HUB_MODEL_ID = "moos124/code-reasoning-0.5b"
 OUTPUT_DIR = "./code-reasoning-0.5b"
 # Load tokenizer
 tokenizer = AutoTokenizer.from_pretrained(MODEL_ID, trust_remote_code=True)
     packing=False,
     dataset_num_proc=4,
     disable_tqdm=True,
     seed=42,
     hub_strategy="checkpoint",
 )