Cleaning-ImageNet-Hard2

Paused

App Files Files Community

taesiri commited on May 2, 2023

Commit

adf2913

1 Parent(s): 106ce32

revert r3

Browse files

Files changed (1) hide show

app.py +3 -22

app.py CHANGED Viewed

@@ -18,8 +18,6 @@ import torch
 import torchvision
 from huggingface_hub import HfApi, login, snapshot_download
 from PIL import Image
-import re
-from fnmatch import translate
 session_token = os.environ.get("SessionToken")
 login(token=session_token)
@@ -66,13 +64,11 @@ if not os.path.exists("./imagenet_samples") or not os.path.exists(
 imagenet_hard = datasets.load_dataset("taesiri/imagenet-hard", split="validation")
-def update_snapshot(username):
-    escaped_username = re.escape(username)
-    pattern = f"*{escaped_username}*.json"
     output_dir = snapshot_download(
         repo_id="taesiri/imagenet_hard_review_data_r2",
-        allow_patterns=translate(pattern),
         repo_type="dataset",
     )
     files = glob(f"{output_dir}/*.json")
@@ -87,23 +83,8 @@ def update_snapshot(username):
             rows.append(tdf)
     df = pd.DataFrame(rows, columns=columns)
-    # download and append all CSV files
-    output_dir = snapshot_download(
-        repo_id="taesiri/imagenet_hard_review_data_r3",
-        allow_patterns="*.csv",
-        repo_type="dataset",
-    )
-    files = glob(f"{output_dir}/*.csv")
-    if len(files) > 0:
-        csv_dataframes = [pd.read_csv(file) for file in files]
-        csv_dataframes = pd.concat(csv_dataframes, ignore_index=True)
-        df = pd.concat([df, csv_dataframes], ignore_index=True)
-    # remove duplicate rows
-    df = df.drop_duplicates(subset=["id", "user_id"], keep="last")
     df = df[df["user_id"] == username]
     return df

 import torchvision
 from huggingface_hub import HfApi, login, snapshot_download
 from PIL import Image
 session_token = os.environ.get("SessionToken")
 login(token=session_token)
 imagenet_hard = datasets.load_dataset("taesiri/imagenet-hard", split="validation")
+def update_snapshot(username):
     output_dir = snapshot_download(
         repo_id="taesiri/imagenet_hard_review_data_r2",
+        allow_patterns=f"*{username}*.json",
         repo_type="dataset",
     )
     files = glob(f"{output_dir}/*.json")
             rows.append(tdf)
     df = pd.DataFrame(rows, columns=columns)
     df = df[df["user_id"] == username]
     return df