Add missing preprocessor-related files

Files changed (5) hide show

.gitattributes CHANGED Viewed

@@ -33,3 +33,4 @@ saved_model/**/* filter=lfs diff=lfs merge=lfs -text
 *.zip filter=lfs diff=lfs merge=lfs -text
 *.zst filter=lfs diff=lfs merge=lfs -text
 *tfevents* filter=lfs diff=lfs merge=lfs -text

 *.zip filter=lfs diff=lfs merge=lfs -text
 *.zst filter=lfs diff=lfs merge=lfs -text
 *tfevents* filter=lfs diff=lfs merge=lfs -text
+tokenizer.json filter=lfs diff=lfs merge=lfs -text

preprocessor_config.json CHANGED Viewed

@@ -1,19 +1,4 @@
 {
-  "_valid_processor_keys": [
-    "images",
-    "do_resize",
-    "size",
-    "resample",
-    "do_rescale",
-    "rescale_factor",
-    "do_normalize",
-    "image_mean",
-    "image_std",
-    "return_tensors",
-    "data_format",
-    "input_data_format",
-    "do_convert_rgb"
-  ],
   "do_convert_rgb": null,
   "do_normalize": true,
   "do_rescale": true,
@@ -30,11 +15,11 @@
     0.5,
     0.5
   ],
-  "processor_class": "PaliGemmaProcessor",
   "resample": 3,
   "rescale_factor": 0.00392156862745098,
   "size": {
     "height": 448,
     "width": 448
   }
-}

 {
   "do_convert_rgb": null,
   "do_normalize": true,
   "do_rescale": true,
     0.5,
     0.5
   ],
+  "processor_class": "ColPaliProcessor",
   "resample": 3,
   "rescale_factor": 0.00392156862745098,
   "size": {
     "height": 448,
     "width": 448
   }
+}

special_tokens_map.json ADDED Viewed

+{
+  "additional_special_tokens": [
+    {
+      "content": "<image>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false
+    }
+  ],
+  "bos_token": {
+    "content": "<bos>",
+    "lstrip": false,
+    "normalized": false,
+    "rstrip": false,
+    "single_word": false
+  },
+  "eos_token": {
+    "content": "<eos>",
+    "lstrip": false,
+    "normalized": false,
+    "rstrip": false,
+    "single_word": false
+  },
+  "pad_token": {
+    "content": "<pad>",
+    "lstrip": false,
+    "normalized": false,
+    "rstrip": false,
+    "single_word": false
+  },
+  "unk_token": {
+    "content": "<unk>",
+    "lstrip": false,
+    "normalized": false,
+    "rstrip": false,
+    "single_word": false
+  }
+}

tokenizer.json ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:1ff84f53c290d0348c4e206da6094ef781cf8c0e482fec8b268a996b32257cfd
+size 34600975

tokenizer_config.json ADDED Viewed

The diff for this file is too large to render. See raw diff