Spaces:

atifsial123
/

Engineer

Sleeping

atifsial123 commited on Sep 2, 2024

Commit

bf33cf7

verified ·

1 Parent(s): 3af39a2

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -3,10 +3,11 @@ os.system('pip install transformers')
 # Import the necessary libraries
 import os
 os.system('pip install torch')
 from transformers import AutoModel, AutoTokenizer
 import torch
 from torch.utils.data import DataLoader, Dataset
-from sklearn.model_selection import train_test_split
 import pandas as pd
 import gradio as gr
@@ -14,9 +15,9 @@ import gradio as gr
 model = AutoModel.from_pretrained("Alibaba-NLP/gte-multilingual-base", trust_remote_code=True)
 tokenizer = AutoTokenizer.from_pretrained("Alibaba-NLP/gte-multilingual-base", trust_remote_code=True)
-# Function to load dataset (adjust this function if your dataset is complex)
 def load_dataset():
-    df = pd.read_excel("your_dataset.xlsx")  # Ensure this file exists in your working directory
     print("Columns in the dataset:", df.columns.tolist())
     return df

 # Import the necessary libraries
 import os
 os.system('pip install torch')
+# Import the necessary libraries
 from transformers import AutoModel, AutoTokenizer
 import torch
 from torch.utils.data import DataLoader, Dataset
+from sklearn.model_selection import train_test_split  # Importing train_test_split from scikit-learn
 import pandas as pd
 import gradio as gr
 model = AutoModel.from_pretrained("Alibaba-NLP/gte-multilingual-base", trust_remote_code=True)
 tokenizer = AutoTokenizer.from_pretrained("Alibaba-NLP/gte-multilingual-base", trust_remote_code=True)
+# Function to load the dataset
 def load_dataset():
+    df = pd.read_excel("your_dataset.xlsx")  # Ensure the file name and path are correct
     print("Columns in the dataset:", df.columns.tolist())
     return df