Spaces:

zetavg
/

LLaMA-LoRA-Tuner-UI-Demo

Runtime error

App Files Files Community

zetavg commited on Apr 20, 2023

Commit

8cb0300

unverified ·

1 Parent(s): dd931be

finetune: support lora_modules_to_save

Browse files

Files changed (3) hide show

llama_lora/lib/finetune.py +35 -8
llama_lora/ui/finetune_ui.py +175 -100
llama_lora/ui/main_page.py +35 -5

llama_lora/lib/finetune.py CHANGED Viewed

@@ -1,7 +1,8 @@
 import os
 import sys
 import importlib
-from typing import Any, List
 import json
@@ -18,7 +19,7 @@ from peft import (
     prepare_model_for_int8_training,
     set_peft_model_state_dict,
 )
-from transformers import LlamaForCausalLM, LlamaTokenizer
 def train(
@@ -42,6 +43,7 @@ def train(
         "q_proj",
         "v_proj",
     ],
     # llm hyperparams
     train_on_inputs: bool = True,  # if False, masks out inputs in loss
     group_by_length: bool = False,  # faster, but produces an odd training loss curve
@@ -61,6 +63,8 @@ def train(
     wandb_watch: str = "false",  # options: false | gradients | all
     wandb_log_model: str = "true",  # options: false | true
 ):
     # for logging
     finetune_args = {
         'micro_batch_size': micro_batch_size,
@@ -81,6 +85,8 @@ def train(
     }
     if val_set_size and val_set_size > 0:
         finetune_args['val_set_size'] = val_set_size
     if resume_from_checkpoint:
         finetune_args['resume_from_checkpoint'] = resume_from_checkpoint
@@ -131,19 +137,39 @@ def train(
     model = base_model
     if isinstance(model, str):
-        model = LlamaForCausalLM.from_pretrained(
             base_model,
             load_in_8bit=True,
             torch_dtype=torch.float16,
             device_map=device_map,
         )
     if isinstance(tokenizer, str):
-        tokenizer = LlamaTokenizer.from_pretrained(tokenizer)
-    tokenizer.pad_token_id = (
-        0  # unk. we want this to be different from the eos token
-    )
     tokenizer.padding_side = "left"  # Allow batched inference
     def tokenize(prompt, add_eos_token=True):
@@ -196,6 +222,7 @@ def train(
         r=lora_r,
         lora_alpha=lora_alpha,
         target_modules=lora_target_modules,
         lora_dropout=lora_dropout,
         bias="none",
         task_type="CAUSAL_LM",

 import os
 import sys
+import re
 import importlib
+from typing import Any, List, Union
 import json
     prepare_model_for_int8_training,
     set_peft_model_state_dict,
 )
+from transformers import AutoModelForCausalLM, AutoTokenizer, LlamaTokenizer
 def train(
         "q_proj",
         "v_proj",
     ],
+    lora_modules_to_save: Union[List[str], None] = [],
     # llm hyperparams
     train_on_inputs: bool = True,  # if False, masks out inputs in loss
     group_by_length: bool = False,  # faster, but produces an odd training loss curve
     wandb_watch: str = "false",  # options: false | gradients | all
     wandb_log_model: str = "true",  # options: false | true
 ):
+    if lora_modules_to_save is not None and len(lora_modules_to_save) <= 0:
+        lora_modules_to_save = None
     # for logging
     finetune_args = {
         'micro_batch_size': micro_batch_size,
     }
     if val_set_size and val_set_size > 0:
         finetune_args['val_set_size'] = val_set_size
+    if lora_modules_to_save:
+        finetune_args['lora_modules_to_save'] = lora_modules_to_save
     if resume_from_checkpoint:
         finetune_args['resume_from_checkpoint'] = resume_from_checkpoint
     model = base_model
     if isinstance(model, str):
+        model_name = model
+        model = AutoModelForCausalLM.from_pretrained(
             base_model,
             load_in_8bit=True,
             torch_dtype=torch.float16,
+            llm_int8_skip_modules=lora_modules_to_save,
             device_map=device_map,
         )
+        if re.match("[^/]+/llama", model_name):
+            model.config.pad_token_id = 0
+            model.config.bos_token_id = 1
+            model.config.eos_token_id = 2
     if isinstance(tokenizer, str):
+        tokenizer_name = tokenizer
+        try:
+            tokenizer = AutoTokenizer.from_pretrained(tokenizer)
+        except Exception as e:
+            if 'LLaMATokenizer' in str(e):
+                tokenizer = LlamaTokenizer.from_pretrained(
+                    tokenizer_name,
+                )
+            else:
+                raise e
+        if re.match("[^/]+/llama", tokenizer_name):
+            tokenizer.pad_token_id = 0
+            tokenizer.bos_token_id = 1
+            tokenizer.eos_token_id = 2
+    # tokenizer.pad_token_id = (
+    #     0  # unk. we want this to be different from the eos token
+    # )
     tokenizer.padding_side = "left"  # Allow batched inference
     def tokenize(prompt, add_eos_token=True):
         r=lora_r,
         lora_alpha=lora_alpha,
         target_modules=lora_target_modules,
+        modules_to_save=lora_modules_to_save,
         lora_dropout=lora_dropout,
         bias="none",
         task_type="CAUSAL_LM",

llama_lora/ui/finetune_ui.py CHANGED Viewed

@@ -296,6 +296,7 @@ def do_train(
     lora_alpha,
     lora_dropout,
     lora_target_modules,
     save_steps,
     save_total_limit,
     logging_steps,
@@ -314,16 +315,22 @@ def do_train(
         if continue_from_checkpoint == "-" or continue_from_checkpoint == "None":
             continue_from_checkpoint = None
         if continue_from_model:
-            resume_from_checkpoint = os.path.join(Global.data_dir, "lora_models", continue_from_model)
             if continue_from_checkpoint:
-                resume_from_checkpoint = os.path.join(resume_from_checkpoint, continue_from_checkpoint)
-                will_be_resume_from_checkpoint_file = os.path.join(resume_from_checkpoint, "pytorch_model.bin")
                 if not os.path.exists(will_be_resume_from_checkpoint_file):
-                    raise ValueError(f"Unable to resume from checkpoint {continue_from_model}/{continue_from_checkpoint}. Resuming is only possible from checkpoints stored locally in the data directory. Please ensure that the file '{will_be_resume_from_checkpoint_file}' exists.")
             else:
-                will_be_resume_from_checkpoint_file = os.path.join(resume_from_checkpoint, "adapter_model.bin")
                 if not os.path.exists(will_be_resume_from_checkpoint_file):
-                    raise ValueError(f"Unable to continue from model {continue_from_model}. Continuation is only possible from models stored locally in the data directory. Please ensure that the file '{will_be_resume_from_checkpoint_file}' exists.")
         output_dir = os.path.join(Global.data_dir, "lora_models", model_name)
         if os.path.exists(output_dir):
@@ -334,7 +341,11 @@ def do_train(
         if not should_training_progress_track_tqdm:
             progress(0, desc="Preparing train data...")
-        unload_models()  # Need RAM for training
         prompter = Prompter(template)
         # variable_names = prompter.get_variable_names()
@@ -363,23 +374,6 @@ def do_train(
         if Global.ui_dev_mode:
             Global.should_stop_training = False
-            for i in range(300):
-                if (Global.should_stop_training):
-                    return
-                epochs = 3
-                epoch = i / 100
-                last_loss = None
-                if (i > 20):
-                    last_loss = 3 + (i - 0) * (0.5 - 3) / (300 - 0)
-                progress(
-                    (i, 300),
-                    desc="(Simulate) " +
-                    get_progress_text(epoch, epochs, last_loss)
-                )
-                time.sleep(0.1)
             message = f"""Currently in UI dev mode, not doing the actual training.
 Train options: {json.dumps({
@@ -394,6 +388,7 @@ Train options: {json.dumps({
     'lora_alpha': lora_alpha,
     'lora_dropout': lora_dropout,
     'lora_target_modules': lora_target_modules,
     'model_name': model_name,
     'continue_from_model': continue_from_model,
     'continue_from_checkpoint': continue_from_checkpoint,
@@ -403,11 +398,30 @@ Train data (first 10):
 {json.dumps(train_data[:10], indent=2)}
             """
             print(message)
             time.sleep(2)
             return message
         if not should_training_progress_track_tqdm:
-            progress(0, desc=f"Preparing model {base_model_name} for training...")
         log_history = []
@@ -445,9 +459,6 @@ Train data (first 10):
         Global.should_stop_training = False
-        base_model = get_new_base_model(base_model_name)
-        tokenizer = get_tokenizer(tokenizer_name)
         # Do not let other tqdm iterations interfere the progress reporting after training starts.
         # progress.track_tqdm = False  # setting this dynamically is not working, determining if track_tqdm should be enabled based on GPU cores at start instead.
@@ -498,33 +509,34 @@ Train data (first 10):
             wandb_tags.append(f"dataset:{dataset_from_data_dir}")
         train_output = Global.train_fn(
-            base_model,  # base_model
-            tokenizer,  # tokenizer
-            output_dir,  # output_dir
-            train_data,
             # 128,  # batch_size (is not used, use gradient_accumulation_steps instead)
-            micro_batch_size,    # micro_batch_size
-            gradient_accumulation_steps,
-            epochs,   # num_epochs
-            learning_rate,   # learning_rate
-            max_seq_length,  # cutoff_len
-            evaluate_data_count,  # val_set_size
-            lora_r,  # lora_r
-            lora_alpha,  # lora_alpha
-            lora_dropout,  # lora_dropout
-            lora_target_modules,  # lora_target_modules
-            train_on_inputs,  # train_on_inputs
-            False,  # group_by_length
-            resume_from_checkpoint,  # resume_from_checkpoint
-            save_steps,  # save_steps
-            save_total_limit,  # save_total_limit
-            logging_steps,  # logging_steps
-            training_callbacks,  # callbacks
-            Global.wandb_api_key,  # wandb_api_key
-            Global.default_wandb_project if Global.enable_wandb else None,  # wandb_project
-            wandb_group,  # wandb_group
-            model_name,  # wandb_run_name
-            wandb_tags  # wandb_tags
         )
         logs_str = "\n".join([json.dumps(log)
@@ -578,10 +590,12 @@ def handle_load_params_from_model(
     lora_alpha,
     lora_dropout,
     lora_target_modules,
     save_steps,
     save_total_limit,
     logging_steps,
     lora_target_module_choices,
 ):
     error_message = ""
     notice_message = ""
@@ -633,6 +647,11 @@ def handle_load_params_from_model(
                 for element in value:
                     if element not in lora_target_module_choices:
                         lora_target_module_choices.append(element)
             elif key == "save_steps":
                 save_steps = value
             elif key == "save_total_limit":
@@ -670,15 +689,20 @@ def handle_load_params_from_model(
         lora_r,
         lora_alpha,
         lora_dropout,
-        gr.CheckboxGroup.update(value=lora_target_modules, choices=lora_target_module_choices),
         save_steps,
         save_total_limit,
         logging_steps,
         lora_target_module_choices,
     )
 default_lora_target_module_choices = ["q_proj", "k_proj", "v_proj", "o_proj"]
 def handle_lora_target_modules_add(choices, new_module, selected_modules):
@@ -688,6 +712,13 @@ def handle_lora_target_modules_add(choices, new_module, selected_modules):
     return (choices, "", gr.CheckboxGroup.update(value=selected_modules, choices=choices))
 def finetune_ui():
     things_that_might_timeout = []
@@ -863,12 +894,13 @@ def finetune_ui():
                     info="The initial learning rate for the optimizer. A higher learning rate may speed up convergence but also cause instability or divergence. A lower learning rate may require more steps to reach optimal performance but also avoid overshooting or oscillating around local minima."
                 )
-                evaluate_data_count = gr.Slider(
-                    minimum=0, maximum=1, step=1, value=0,
-                    label="Evaluation Data Count",
-                    info="The number of data to be used for evaluation. This specific amount of data will be randomly chosen from the training dataset for evaluating the model's performance during the process, without contributing to the actual training.",
-                    elem_id="finetune_evaluate_data_count"
-                )
                 with gr.Box(elem_id="finetune_continue_from_model_box"):
                     with gr.Row():
@@ -923,30 +955,65 @@ def finetune_ui():
                     info="The dropout probability for LoRA, which controls the fraction of LoRA parameters that are set to zero during training. A larger lora_dropout increases the regularization effect of LoRA but also increases the risk of underfitting."
                 )
-                lora_target_modules = gr.CheckboxGroup(
-                    label="LoRA Target Modules",
-                    choices=default_lora_target_module_choices,
-                    value=["q_proj", "v_proj"],
-                    info="Modules to replace with LoRA.",
-                    elem_id="finetune_lora_target_modules"
-                )
-                lora_target_module_choices = gr.State(value=default_lora_target_module_choices)
-                with gr.Box(elem_id="finetune_lora_target_modules_add_box"):
-                    with gr.Row():
-                        lora_target_modules_add = gr.Textbox(
-                            lines=1, max_lines=1, show_label=False,
-                            elem_id="finetune_lora_target_modules_add"
-                        )
-                        lora_target_modules_add_btn = gr.Button(
-                            "Add",
-                            elem_id="finetune_lora_target_modules_add_btn"
-                        )
-                        lora_target_modules_add_btn.style(full_width=False, size="sm")
-                things_that_might_timeout.append(lora_target_modules_add_btn.click(
-                    handle_lora_target_modules_add,
-                    inputs=[lora_target_module_choices, lora_target_modules_add, lora_target_modules],
-                    outputs=[lora_target_module_choices, lora_target_modules_add, lora_target_modules],
-                ))
                 with gr.Row():
                     logging_steps = gr.Number(
@@ -976,20 +1043,25 @@ def finetune_ui():
                         elem_id="finetune_model_name",
                     )
-                    with gr.Row():
-                        train_btn = gr.Button(
-                            "Train", variant="primary", label="Train",
-                            elem_id="finetune_start_btn"
-                        )
-                        abort_button = gr.Button(
-                            "Abort", label="Abort",
-                            elem_id="finetune_stop_btn"
-                        )
-                        confirm_abort_button = gr.Button(
-                            "Confirm Abort", label="Confirm Abort", variant="stop",
-                            elem_id="finetune_confirm_stop_btn"
-                        )
         things_that_might_timeout.append(reload_selections_button.click(
             reload_selections,
@@ -1031,6 +1103,7 @@ def finetune_ui():
             lora_alpha,
             lora_dropout,
             lora_target_modules,
             save_steps,
             save_total_limit,
             logging_steps,
@@ -1039,8 +1112,10 @@ def finetune_ui():
         things_that_might_timeout.append(
             load_params_from_model_btn.click(
                 fn=handle_load_params_from_model,
-                inputs=[continue_from_model] + finetune_args + [lora_target_module_choices],
-                outputs=[load_params_from_model_message] + finetune_args + [lora_target_module_choices]
             )
         )

     lora_alpha,
     lora_dropout,
     lora_target_modules,
+    lora_modules_to_save,
     save_steps,
     save_total_limit,
     logging_steps,
         if continue_from_checkpoint == "-" or continue_from_checkpoint == "None":
             continue_from_checkpoint = None
         if continue_from_model:
+            resume_from_checkpoint = os.path.join(
+                Global.data_dir, "lora_models", continue_from_model)
             if continue_from_checkpoint:
+                resume_from_checkpoint = os.path.join(
+                    resume_from_checkpoint, continue_from_checkpoint)
+                will_be_resume_from_checkpoint_file = os.path.join(
+                    resume_from_checkpoint, "pytorch_model.bin")
                 if not os.path.exists(will_be_resume_from_checkpoint_file):
+                    raise ValueError(
+                        f"Unable to resume from checkpoint {continue_from_model}/{continue_from_checkpoint}. Resuming is only possible from checkpoints stored locally in the data directory. Please ensure that the file '{will_be_resume_from_checkpoint_file}' exists.")
             else:
+                will_be_resume_from_checkpoint_file = os.path.join(
+                    resume_from_checkpoint, "adapter_model.bin")
                 if not os.path.exists(will_be_resume_from_checkpoint_file):
+                    raise ValueError(
+                        f"Unable to continue from model {continue_from_model}. Continuation is only possible from models stored locally in the data directory. Please ensure that the file '{will_be_resume_from_checkpoint_file}' exists.")
         output_dir = os.path.join(Global.data_dir, "lora_models", model_name)
         if os.path.exists(output_dir):
         if not should_training_progress_track_tqdm:
             progress(0, desc="Preparing train data...")
+        # Need RAM for training
+        unload_models()
+        Global.new_base_model_that_is_ready_to_be_used = None
+        Global.name_of_new_base_model_that_is_ready_to_be_used = None
+        clear_cache()
         prompter = Prompter(template)
         # variable_names = prompter.get_variable_names()
         if Global.ui_dev_mode:
             Global.should_stop_training = False
             message = f"""Currently in UI dev mode, not doing the actual training.
 Train options: {json.dumps({
     'lora_alpha': lora_alpha,
     'lora_dropout': lora_dropout,
     'lora_target_modules': lora_target_modules,
+    'lora_modules_to_save': lora_modules_to_save,
     'model_name': model_name,
     'continue_from_model': continue_from_model,
     'continue_from_checkpoint': continue_from_checkpoint,
 {json.dumps(train_data[:10], indent=2)}
             """
             print(message)
+            for i in range(300):
+                if (Global.should_stop_training):
+                    return
+                epochs = 3
+                epoch = i / 100
+                last_loss = None
+                if (i > 20):
+                    last_loss = 3 + (i - 0) * (0.5 - 3) / (300 - 0)
+                progress(
+                    (i, 300),
+                    desc="(Simulate) " +
+                    get_progress_text(epoch, epochs, last_loss)
+                )
+                time.sleep(0.1)
             time.sleep(2)
             return message
         if not should_training_progress_track_tqdm:
+            progress(
+                0, desc=f"Preparing model {base_model_name} for training...")
         log_history = []
         Global.should_stop_training = False
         # Do not let other tqdm iterations interfere the progress reporting after training starts.
         # progress.track_tqdm = False  # setting this dynamically is not working, determining if track_tqdm should be enabled based on GPU cores at start instead.
             wandb_tags.append(f"dataset:{dataset_from_data_dir}")
         train_output = Global.train_fn(
+            base_model=base_model_name,
+            tokenizer=tokenizer_name,
+            output_dir=output_dir,
+            train_data=train_data,
             # 128,  # batch_size (is not used, use gradient_accumulation_steps instead)
+            micro_batch_size=micro_batch_size,
+            gradient_accumulation_steps=gradient_accumulation_steps,
+            num_epochs=epochs,
+            learning_rate=learning_rate,
+            cutoff_len=max_seq_length,
+            val_set_size=evaluate_data_count,
+            lora_r=lora_r,
+            lora_alpha=lora_alpha,
+            lora_dropout=lora_dropout,
+            lora_target_modules=lora_target_modules,
+            lora_modules_to_save=lora_modules_to_save,
+            train_on_inputs=train_on_inputs,
+            group_by_length=False,
+            resume_from_checkpoint=resume_from_checkpoint,
+            save_steps=save_steps,
+            save_total_limit=save_total_limit,
+            logging_steps=logging_steps,
+            callbacks=training_callbacks,
+            wandb_api_key=Global.wandb_api_key,
+            wandb_project=Global.default_wandb_project if Global.enable_wandb else None,
+            wandb_group=wandb_group,
+            wandb_run_name=model_name,
+            wandb_tags=wandb_tags
         )
         logs_str = "\n".join([json.dumps(log)
     lora_alpha,
     lora_dropout,
     lora_target_modules,
+    lora_modules_to_save,
     save_steps,
     save_total_limit,
     logging_steps,
     lora_target_module_choices,
+    lora_modules_to_save_choices,
 ):
     error_message = ""
     notice_message = ""
                 for element in value:
                     if element not in lora_target_module_choices:
                         lora_target_module_choices.append(element)
+            elif key == "lora_modules_to_save":
+                lora_modules_to_save = value
+                for element in value:
+                    if element not in lora_modules_to_save_choices:
+                        lora_modules_to_save_choices.append(element)
             elif key == "save_steps":
                 save_steps = value
             elif key == "save_total_limit":
         lora_r,
         lora_alpha,
         lora_dropout,
+        gr.CheckboxGroup.update(value=lora_target_modules,
+                                choices=lora_target_module_choices),
+        gr.CheckboxGroup.update(
+            value=lora_modules_to_save, choices=lora_modules_to_save_choices),
         save_steps,
         save_total_limit,
         logging_steps,
         lora_target_module_choices,
+        lora_modules_to_save_choices
     )
 default_lora_target_module_choices = ["q_proj", "k_proj", "v_proj", "o_proj"]
+default_lora_modules_to_save_choices = ["model.embed_tokens", "lm_head"]
 def handle_lora_target_modules_add(choices, new_module, selected_modules):
     return (choices, "", gr.CheckboxGroup.update(value=selected_modules, choices=choices))
+def handle_lora_modules_to_save_add(choices, new_module, selected_modules):
+    choices.append(new_module)
+    selected_modules.append(new_module)
+    return (choices, "", gr.CheckboxGroup.update(value=selected_modules, choices=choices))
 def finetune_ui():
     things_that_might_timeout = []
                     info="The initial learning rate for the optimizer. A higher learning rate may speed up convergence but also cause instability or divergence. A lower learning rate may require more steps to reach optimal performance but also avoid overshooting or oscillating around local minima."
                 )
+                with gr.Column():
+                    evaluate_data_count = gr.Slider(
+                        minimum=0, maximum=1, step=1, value=0,
+                        label="Evaluation Data Count",
+                        info="The number of data to be used for evaluation. This specific amount of data will be randomly chosen from the training dataset for evaluating the model's performance during the process, without contributing to the actual training.",
+                        elem_id="finetune_evaluate_data_count"
+                    )
                 with gr.Box(elem_id="finetune_continue_from_model_box"):
                     with gr.Row():
                     info="The dropout probability for LoRA, which controls the fraction of LoRA parameters that are set to zero during training. A larger lora_dropout increases the regularization effect of LoRA but also increases the risk of underfitting."
                 )
+                with gr.Column(elem_id="finetune_lora_target_modules_box"):
+                    lora_target_modules = gr.CheckboxGroup(
+                        label="LoRA Target Modules",
+                        choices=default_lora_target_module_choices,
+                        value=["q_proj", "v_proj"],
+                        info="Modules to replace with LoRA.",
+                        elem_id="finetune_lora_target_modules"
+                    )
+                    lora_target_module_choices = gr.State(
+                        value=default_lora_target_module_choices)
+                    with gr.Box(elem_id="finetune_lora_target_modules_add_box"):
+                        with gr.Row():
+                            lora_target_modules_add = gr.Textbox(
+                                lines=1, max_lines=1, show_label=False,
+                                elem_id="finetune_lora_target_modules_add"
+                            )
+                            lora_target_modules_add_btn = gr.Button(
+                                "Add",
+                                elem_id="finetune_lora_target_modules_add_btn"
+                            )
+                            lora_target_modules_add_btn.style(
+                                full_width=False, size="sm")
+                    things_that_might_timeout.append(lora_target_modules_add_btn.click(
+                        handle_lora_target_modules_add,
+                        inputs=[lora_target_module_choices,
+                                lora_target_modules_add, lora_target_modules],
+                        outputs=[lora_target_module_choices,
+                                 lora_target_modules_add, lora_target_modules],
+                    ))
+                with gr.Column(elem_id="finetune_lora_modules_to_save_box"):
+                    lora_modules_to_save = gr.CheckboxGroup(
+                        label="LoRA Modules To Save",
+                        choices=default_lora_modules_to_save_choices,
+                        value=[],
+                        # info="",
+                        elem_id="finetune_lora_modules_to_save"
+                    )
+                    lora_modules_to_save_choices = gr.State(
+                        value=default_lora_modules_to_save_choices)
+                    with gr.Box(elem_id="finetune_lora_modules_to_save_add_box"):
+                        with gr.Row():
+                            lora_modules_to_save_add = gr.Textbox(
+                                lines=1, max_lines=1, show_label=False,
+                                elem_id="finetune_lora_modules_to_save_add"
+                            )
+                            lora_modules_to_save_add_btn = gr.Button(
+                                "Add",
+                                elem_id="finetune_lora_modules_to_save_add_btn"
+                            )
+                            lora_modules_to_save_add_btn.style(
+                                full_width=False, size="sm")
+                    things_that_might_timeout.append(lora_modules_to_save_add_btn.click(
+                        handle_lora_modules_to_save_add,
+                        inputs=[lora_modules_to_save_choices,
+                                lora_modules_to_save_add, lora_modules_to_save],
+                        outputs=[lora_modules_to_save_choices,
+                                 lora_modules_to_save_add, lora_modules_to_save],
+                    ))
                 with gr.Row():
                     logging_steps = gr.Number(
                         elem_id="finetune_model_name",
                     )
+        with gr.Row():
+            with gr.Column():
+                pass
+            with gr.Column():
+                with gr.Row():
+                    train_btn = gr.Button(
+                        "Train", variant="primary", label="Train",
+                        elem_id="finetune_start_btn"
+                    )
+                    abort_button = gr.Button(
+                        "Abort", label="Abort",
+                        elem_id="finetune_stop_btn"
+                    )
+                    confirm_abort_button = gr.Button(
+                        "Confirm Abort", label="Confirm Abort", variant="stop",
+                        elem_id="finetune_confirm_stop_btn"
+                    )
         things_that_might_timeout.append(reload_selections_button.click(
             reload_selections,
             lora_alpha,
             lora_dropout,
             lora_target_modules,
+            lora_modules_to_save,
             save_steps,
             save_total_limit,
             logging_steps,
         things_that_might_timeout.append(
             load_params_from_model_btn.click(
                 fn=handle_load_params_from_model,
+                inputs=[continue_from_model] + finetune_args +
+                [lora_target_module_choices, lora_modules_to_save_choices],
+                outputs=[load_params_from_model_message] + finetune_args +
+                [lora_target_module_choices, lora_modules_to_save_choices]
             )
         )

llama_lora/ui/main_page.py CHANGED Viewed

@@ -733,24 +733,54 @@ def main_page_custom_css():
         flex: 2;
     }
-    #finetune_lora_target_modules_add_box {
         margin-top: -24px;
         padding-top: 8px;
         border-top-left-radius: 0;
         border-top-right-radius: 0;
         border-top: 0;
     }
-    #finetune_lora_target_modules_add_box > * > .form {
         border: 0;
         box-shadow: none;
     }
-    #finetune_lora_target_modules_add {
         padding: 0;
     }
-    #finetune_lora_target_modules_add input {
         padding: 4px 8px;
     }
-    #finetune_lora_target_modules_add_btn {
         min-width: 60px;
     }

         flex: 2;
     }
+    #finetune_lora_target_modules_box,
+    #finetune_lora_modules_to_save_box {
+        margin-top: -24px;
+    }
+    #finetune_lora_target_modules_box > .form,
+    #finetune_lora_modules_to_save_box > .form {
+        padding-top: 8px;
+        border-top: 0;
+        border-top-left-radius: 0;
+        border-top-right-radius: 0;
+        background: var(--block-background-fill);
+        position: relative;
+    }
+    #finetune_lora_target_modules_box > .form::before,
+    #finetune_lora_modules_to_save_box > .form::before {
+        content: "";
+        display: block;
+        position: absolute;
+        top: 8px;
+        left: 0;
+        right: 0;
+        height: 1px;
+        z-index: 1;
+        background: var(--block-border-color);
+    }
+    #finetune_lora_target_modules_add_box,
+    #finetune_lora_modules_to_save_add_box {
         margin-top: -24px;
         padding-top: 8px;
         border-top-left-radius: 0;
         border-top-right-radius: 0;
         border-top: 0;
     }
+    #finetune_lora_target_modules_add_box > * > .form,
+    #finetune_lora_modules_to_save_add_box > * > .form {
         border: 0;
         box-shadow: none;
     }
+    #finetune_lora_target_modules_add,
+    #finetune_lora_modules_to_save_add {
         padding: 0;
     }
+    #finetune_lora_target_modules_add input,
+    #finetune_lora_modules_to_save_add input {
         padding: 4px 8px;
     }
+    #finetune_lora_target_modules_add_btn,
+    #finetune_lora_modules_to_save_add_btn {
         min-width: 60px;
     }