Spaces:

shorecode
/

gradio-3

Sleeping

App Files Files Community

Kevin Fink commited on Dec 10, 2024

Commit

88838d4

1 Parent(s): 7d1a420

dev

Browse files

Files changed (1) hide show

app.py +12 -53

app.py CHANGED Viewed

@@ -2,15 +2,15 @@ import spaces
 import gradio as gr
 from transformers import Trainer, TrainingArguments, AutoTokenizer, AutoModelForSeq2SeqLM
 from transformers import DataCollatorForSeq2Seq, AutoConfig
-#from datasets import load_dataset, concatenate_datasets, load_from_disk, DatasetDict
 import traceback
-#from sklearn.metrics import accuracy_score
-#import numpy as np
 import torch
 import os
-#import evaluate
-#from huggingface_hub import login
-#from peft import get_peft_model, LoraConfig
 os.environ['HF_HOME'] = '/data/.huggingface'
 '''
@@ -31,7 +31,7 @@ def fine_tune_model(model, dataset_name, hub_id, api_key, num_epochs, batch_size
     try:
         torch.cuda.empty_cache()
         torch.nn.CrossEntropyLoss()
-        rouge_metric = evaluate.load("rouge", cache_dir='/data/cache')
         #def compute_metrics(eval_preds):
             #preds, labels = eval_preds
             #if isinstance(preds, tuple):
@@ -96,7 +96,6 @@ def fine_tune_model(model, dataset_name, hub_id, api_key, num_epochs, batch_size
         #if os.path.exists(training_args.output_dir) and os.listdir(training_args.output_dir):
             #print("Loading model from checkpoint...")
             #model = AutoModelForSeq2SeqLM.from_pretrained(training_args.output_dir)
-        config = AutoConfig.from_pretrained("google/t5-efficient-tiny-nh8")
         tokenizer = AutoTokenizer.from_pretrained('google/t5-efficient-tiny-nh8', use_fast=True, trust_remote_code=True)
         #max_length = model.get_input_embeddings().weight.shape[0]
@@ -234,45 +233,15 @@ def fine_tune_model(model, dataset_name, hub_id, api_key, num_epochs, batch_size
         #)
         # Fine-tune the model
-        if os.path.exists(training_args.output_dir) and os.listdir(training_args.output_dir):
-            train_result = trainer.train(resume_from_checkpoint=True)
-        else:
-            train_result = trainer.train()
         trainer.push_to_hub(commit_message="Training complete!")
     except Exception as e:
         return f"An error occurred: {str(e)}, TB: {traceback.format_exc()}"
     return 'DONE!'#train_result
-# Define Gradio interface
-@spaces.GPU
-def predict(text):
-    print(text)
-    config = AutoConfig.from_pretrained("shorecode/t5-efficient-tiny-nh8-summarizer")
-    model = AutoModelForSeq2SeqLM.from_config(config)
-    #initialize_weights(model)
-    tokenizer = AutoTokenizer.from_pretrained('shorecode/t5-efficient-tiny-nh8')
-    inputs = tokenizer(text, return_tensors="pt", padding='max_length', max_length=512, truncation=True)
-    # Move model and inputs to GPU if available
-    if torch.cuda.is_available():
-        model = model.to('cuda')
-        inputs = {key: value.to('cuda') for key, value in inputs.items()}
-    print('xxxxxxxxxxxxxxxxxxxxxxx')
-    print(inputs)
-    # Generate outputs
-    with torch.no_grad():  # Disable gradient calculation for inference
-        outputs = model.generate(inputs['input_ids'])
-    ## Decode the generated output
-    #predictions = tokenizer.decode(outputs[0], skip_special_tokens=True)
-    #inputs = tokenizer(text, padding='max_length', max_length=512, truncation=True)
-    #with torch.no_grad():  # Disable gradient calculation for inference
-        #outputs = model.generate(inputs)
-    predictions = tokenizer.decode(outputs[0], skip_special_tokens=True)
-    print('xxxxxxxxxxxxxxxxxxxxxxx')
-    print(predictions)
-    return predictions
 @spaces.GPU(duration=120)
 def run_train(dataset_name, hub_id, api_key, num_epochs, batch_size, lr, grad):
@@ -312,17 +281,7 @@ try:
         title="Fine-Tune Hugging Face Model",
         description="This interface allows you to fine-tune a Hugging Face model on a specified dataset."
     )
-    '''
-    iface = gr.Interface(
-        fn=predict,
-        inputs=[
-            gr.Textbox(label="Query"),
-        ],
-        outputs="text",
-        title="Fine-Tune Hugging Face Model",
-        description="This interface allows you to test a fine-tune Hugging Face model."
-    )
-    '''
     # Launch the interface
     iface.launch()
 except Exception as e:

 import gradio as gr
 from transformers import Trainer, TrainingArguments, AutoTokenizer, AutoModelForSeq2SeqLM
 from transformers import DataCollatorForSeq2Seq, AutoConfig
+from datasets import load_dataset, concatenate_datasets, load_from_disk, DatasetDict
 import traceback
+from sklearn.metrics import accuracy_score
+import numpy as np
 import torch
 import os
+import evaluate
+from huggingface_hub import login
+from peft import get_peft_model, LoraConfig
 os.environ['HF_HOME'] = '/data/.huggingface'
 '''
     try:
         torch.cuda.empty_cache()
         torch.nn.CrossEntropyLoss()
+        #rouge_metric = evaluate.load("rouge", cache_dir='/data/cache')
         #def compute_metrics(eval_preds):
             #preds, labels = eval_preds
             #if isinstance(preds, tuple):
         #if os.path.exists(training_args.output_dir) and os.listdir(training_args.output_dir):
             #print("Loading model from checkpoint...")
             #model = AutoModelForSeq2SeqLM.from_pretrained(training_args.output_dir)
         tokenizer = AutoTokenizer.from_pretrained('google/t5-efficient-tiny-nh8', use_fast=True, trust_remote_code=True)
         #max_length = model.get_input_embeddings().weight.shape[0]
         #)
         # Fine-tune the model
+        #if os.path.exists(training_args.output_dir) and os.listdir(training_args.output_dir):
+            #train_result = trainer.train(resume_from_checkpoint=True)
+        #else:
+        train_result = trainer.train()
         trainer.push_to_hub(commit_message="Training complete!")
     except Exception as e:
         return f"An error occurred: {str(e)}, TB: {traceback.format_exc()}"
     return 'DONE!'#train_result
 @spaces.GPU(duration=120)
 def run_train(dataset_name, hub_id, api_key, num_epochs, batch_size, lr, grad):
         title="Fine-Tune Hugging Face Model",
         description="This interface allows you to fine-tune a Hugging Face model on a specified dataset."
     )
     # Launch the interface
     iface.launch()
 except Exception as e: