Yntec
/

VectorArtz

@@ -1,30 +1,6 @@
 {
-  "bos_token": {
-    "content": "<|startoftext|>",
-    "lstrip": false,
-    "normalized": true,
-    "rstrip": false,
-    "single_word": false
-  },
-  "eos_token": {
-    "content": "<|endoftext|>",
-    "lstrip": false,
-    "normalized": false,
-    "rstrip": false,
-    "single_word": false
-  },
-  "pad_token": {
-    "content": "<|endoftext|>",
-    "lstrip": false,
-    "normalized": false,
-    "rstrip": false,
-    "single_word": false
-  },
-  "unk_token": {
-    "content": "<|endoftext|>",
-    "lstrip": false,
-    "normalized": false,
-    "rstrip": false,
-    "single_word": false
-  }
 }

 {
+  "bos_token": "<|startoftext|>",
+  "eos_token": "<|endoftext|>",
+  "pad_token": "<|endoftext|>",
+  "unk_token": "<|endoftext|>"
 }

tokenizer/tokenizer_config.json CHANGED Viewed

@@ -7,7 +7,7 @@
       "normalized": true,
       "rstrip": false,
       "single_word": false,
-      "special": true
     },
     "49407": {
       "content": "<|endoftext|>",
@@ -15,9 +15,10 @@
       "normalized": false,
       "rstrip": false,
       "single_word": false,
-      "special": true
     }
   },
   "bos_token": "<|startoftext|>",
   "clean_up_tokenization_spaces": true,
   "do_lower_case": true,
@@ -26,5 +27,6 @@
   "model_max_length": 77,
   "pad_token": "<|endoftext|>",
   "tokenizer_class": "CLIPTokenizer",
   "unk_token": "<|endoftext|>"
-}

       "normalized": true,
       "rstrip": false,
       "single_word": false,
+      "special": false
     },
     "49407": {
       "content": "<|endoftext|>",
       "normalized": false,
       "rstrip": false,
       "single_word": false,
+      "special": false
     }
   },
+  "additional_special_tokens": [],
   "bos_token": "<|startoftext|>",
   "clean_up_tokenization_spaces": true,
   "do_lower_case": true,
   "model_max_length": 77,
   "pad_token": "<|endoftext|>",
   "tokenizer_class": "CLIPTokenizer",
+  "tokenizer_file": "/home/user/.cache/huggingface/hub/models--openai--clip-vit-large-patch14/snapshots/32bd64288804d66eefd0ccbe215aa642df71cc41/tokenizer.json",
   "unk_token": "<|endoftext|>"
+}