Spaces:

shorecode
/

gradio-3

Sleeping

Kevin Fink commited on Dec 5, 2024

Commit

3c24b96

1 Parent(s): d06ead9

init

Files changed (1) hide show

app.py CHANGED Viewed

@@ -51,7 +51,7 @@ def fine_tune_model(model_name, dataset_name, hub_id, api_key, num_epochs, batch
             save_strategy='epoch',
             learning_rate=lr*0.00001,
             per_device_train_batch_size=int(batch_size),
-            per_device_eval_batch_size=int(batch_size),
             num_train_epochs=int(num_epochs),
             weight_decay=0.01,
             gradient_accumulation_steps=grad*0.1,
@@ -63,7 +63,7 @@ def fine_tune_model(model_name, dataset_name, hub_id, api_key, num_epochs, batch
             #push_to_hub=True,
             hub_model_id=hub_id.strip(),
             #fp16=True,
-            lr_scheduler_type='cosine',
         )
         # Create Trainer
@@ -99,10 +99,10 @@ try:
             gr.Textbox(label="Dataset Name (e.g., 'imdb')"),
             gr.Textbox(label="HF hub to push to after training"),
             gr.Textbox(label="HF API token"),
-            gr.Slider(minimum=1, maximum=10, value=3, label="Number of Epochs"),
-            gr.Slider(minimum=1, maximum=16, value=4, label="Batch Size"),
-            gr.Slider(minimum=1, maximum=1000, value=50, label="Learning Rate (e-5)"),
-            gr.Slider(minimum=1, maximum=100, value=1, label="Gradient accumulation (e-1)"),
         ],
         outputs="text",
         title="Fine-Tune Hugging Face Model",

             save_strategy='epoch',
             learning_rate=lr*0.00001,
             per_device_train_batch_size=int(batch_size),
+            per_device_eval_batch_size=1,
             num_train_epochs=int(num_epochs),
             weight_decay=0.01,
             gradient_accumulation_steps=grad*0.1,
             #push_to_hub=True,
             hub_model_id=hub_id.strip(),
             #fp16=True,
+            #lr_scheduler_type='cosine',
         )
         # Create Trainer
             gr.Textbox(label="Dataset Name (e.g., 'imdb')"),
             gr.Textbox(label="HF hub to push to after training"),
             gr.Textbox(label="HF API token"),
+            gr.Slider(minimum=1, maximum=10, value=3, label="Number of Epochs", step=1),
+            gr.Slider(minimum=1, maximum=16, value=4, label="Batch Size", step=1),
+            gr.Slider(minimum=1, maximum=1000, value=50, label="Learning Rate (e-5)", step=1),
+            gr.Slider(minimum=1, maximum=100, value=1, label="Gradient accumulation (e-1)", step=1),
         ],
         outputs="text",
         title="Fine-Tune Hugging Face Model",