Spaces:

sonoisa
/

Irasuto_search_CLIP_zero-shot

Running

sonoisa commited on Apr 9, 2022

Commit

755718a

•

1 Parent(s): cf2cbe0

Fix app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -14,7 +14,7 @@ import pyminizip
 import transformers
 from transformers import AutoModel, AutoTokenizer
 from huggingface_hub import hf_hub_download, snapshot_download
-from PIL import Image
 def unicode_normalize(cls, s):
@@ -150,7 +150,7 @@ class ClipTextModel(nn.Module):
     @torch.no_grad()
     def encode_text(self, texts, batch_size=8, max_length=64):
-        model.eval()
         all_embeddings = []
         iterator = range(0, len(texts), batch_size)
         for batch_idx in iterator:
@@ -222,6 +222,7 @@ class ClipTextModel(nn.Module):
 #     @torch.no_grad()
 #     def encode_image(self, images, batch_size=8):
 #         all_embeddings = []
 #         iterator = range(0, len(images), batch_size)
 #         for batch_idx in iterator:
@@ -327,11 +328,11 @@ if "model" not in st.session_state:
     print("extract dataset")
     pyminizip.uncompress(
-        "clip_zeroshot_irasuto_items_20210224.pq.zip", st.secrets["ZIP_PASSWORD"], None, 1
     )
     print("loading dataset")
-    df = pq.read_table("clip_zeroshot_irasuto_items_20210224.parquet",
         columns=["page", "description", "image_url", "image_vector"]).to_pandas()
     st.session_state.df = df

 import transformers
 from transformers import AutoModel, AutoTokenizer
 from huggingface_hub import hf_hub_download, snapshot_download
+# from PIL import Image
 def unicode_normalize(cls, s):
     @torch.no_grad()
     def encode_text(self, texts, batch_size=8, max_length=64):
+        self.eval()
         all_embeddings = []
         iterator = range(0, len(texts), batch_size)
         for batch_idx in iterator:
 #     @torch.no_grad()
 #     def encode_image(self, images, batch_size=8):
+#         self.eval()
 #         all_embeddings = []
 #         iterator = range(0, len(images), batch_size)
 #         for batch_idx in iterator:
     print("extract dataset")
     pyminizip.uncompress(
+        "clip_zeroshot_irasuto_image_items_20210224.pq.zip", st.secrets["ZIP_PASSWORD"], None, 1
     )
     print("loading dataset")
+    df = pq.read_table("clip_zeroshot_irasuto_image_items_20210224.parquet",
         columns=["page", "description", "image_url", "image_vector"]).to_pandas()
     st.session_state.df = df