Delete tokenizer

Browse files

Files changed (10) hide show

tokenizer/added_tokens.json +0 -34
tokenizer/config.json +0 -85
tokenizer/generation_config.json +0 -9
tokenizer/merges.txt +0 -0
tokenizer/model_index.json +0 -38
tokenizer/pytorch_model.bin +0 -3
tokenizer/special_tokens_map.json +0 -24
tokenizer/tokenizer.json +0 -0
tokenizer/tokenizer_config.json +0 -33
tokenizer/vocab.json +0 -0

tokenizer/added_tokens.json DELETED Viewed

@@ -1,34 +0,0 @@
-{
-  "<active_listening>": 50286,
-  "<apology>": 50268,
-  "<bos>": 50258,
-  "<cls>": 50263,
-  "<empathy>": 50285,
-  "<eos>": 50259,
-  "<farewell>": 50266,
-  "<greeting>": 50265,
-  "<mask>": 50264,
-  "<open_ended_question>": 50287,
-  "<pad>": 50260,
-  "<reflective_summary>": 50288,
-  "<sep>": 50262,
-  "<thank>": 50267,
-  "<unk>": 50261,
-  "<|pad|>": 50257,
-  "[PAD]": 50269,
-  "active_listening": 50282,
-  "amazeballs": 50271,
-  "bromance": 50279,
-  "crowdfunding": 50278,
-  "cryptocurrency": 50272,
-  "empathy": 50281,
-  "facepalm": 50277,
-  "hangry": 50280,
-  "intelligent": 50270,
-  "open_ended_question": 50283,
-  "photobomb": 50276,
-  "reflective_summary": 50284,
-  "upcycle": 50275,
-  "vlog": 50274,
-  "webinar": 50273
-}

tokenizer/config.json DELETED Viewed

@@ -1,85 +0,0 @@
-{
-  "_name_or_path": "ayjays132/CustomGPT2Conversational",
-  "activation_function": "gelu_new",
-  "architectures": [
-    "GPT2LMHeadModel"
-  ],
-  "attn_pdrop": 0.1,
-  "bos_token_id": 50256,
-  "context_window": 20,
-  "contextual_embedding_dim": 1024,
-  "device": "cuda",
-  "dropout_rate": 0.1,
-  "embd_pdrop": 0.1,
-  "embedding_dim": 1024,
-  "eos_token_id": 50256,
-  "hidden_dim": 1024,
-  "initializer_range": 0.02,
-  "innovative_growth_capacity": 50000,
-  "integration_settings": {
-    "config_name": "config.json",
-    "load_from_transformers": true,
-    "pytorch_dump_folder_path": "./model_save",
-    "pytorch_model_bin_name": "pytorch_model.bin"
-  },
-  "layer_norm_epsilon": 1e-05,
-  "max_memory_size": 100000,
-  "max_neurons": 100,
-  "meta_learning_rate": 0.001,
-  "model_type": "gpt2",
-  "n_ctx": 1024,
-  "n_embd": 1024,
-  "n_head": 16,
-  "n_inner": null,
-  "n_layer": 24,
-  "n_positions": 1024,
-  "num_embeddings": 50268,
-  "num_heads": 64,
-  "num_layers": 24,
-  "output_attentions": true,
-  "output_hidden_states": true,
-  "pad_token_id": 0,
-  "reorder_and_upcast_attn": false,
-  "resid_pdrop": 0.1,
-  "scale_attn_by_inverse_layer_idx": false,
-  "scale_attn_weights": true,
-  "sep_token_id": -1,
-  "special_tokens": {
-    "additional_special_tokens": [
-      "<greeting>",
-      "<farewell>",
-      "<thank>",
-      "<apology>"
-    ],
-    "bos_token": "<bos>",
-    "cls_token": "<cls>",
-    "eos_token": "<eos>",
-    "mask_token": "<mask>",
-    "pad_token": "<pad>",
-    "sep_token": "<sep>",
-    "unk_token": "<unk>"
-  },
-  "state_shape": null,
-  "summary_activation": null,
-  "summary_first_dropout": 0.1,
-  "summary_proj_to_labels": true,
-  "summary_type": "cls_index",
-  "summary_use_proj": true,
-  "target_q_model": null,
-  "task_specific_params": {
-    "text-generation": {
-      "do_sample": true,
-      "length_penalty": 1.0,
-      "max_length": 50,
-      "no_repeat_ngram_size": 2,
-      "repetition_penalty": 1.2,
-      "temperature": 0.9,
-      "top_k": 50,
-      "top_p": 0.95
-    }
-  },
-  "torch_dtype": "float32",
-  "transformers_version": "4.28.0.dev0",
-  "use_cache": true,
-  "vocab_size": 50257
-}

tokenizer/generation_config.json DELETED Viewed

@@ -1,9 +0,0 @@
-{
-  "_from_model_config": true,
-  "bos_token_id": 50256,
-  "eos_token_id": 50256,
-  "output_attentions": true,
-  "output_hidden_states": true,
-  "pad_token_id": 0,
-  "transformers_version": "4.28.0.dev0"
-}

tokenizer/merges.txt DELETED Viewed

The diff for this file is too large to render. See raw diff

tokenizer/model_index.json DELETED Viewed

@@ -1,38 +0,0 @@
-{
-  "_class_name": "StableDiffusionPipeline",
-  "_diffusers_version": "0.27.0",
-  "_name_or_path": "CompVis/stable-diffusion-v1-4",
-  "feature_extractor": [
-    "transformers",
-    "CLIPImageProcessor"
-  ],
-  "image_encoder": [
-    null,
-    null
-  ],
-  "requires_safety_checker": true,
-  "safety_checker": [
-    "stable_diffusion",
-    "StableDiffusionSafetyChecker"
-  ],
-  "scheduler": [
-    "diffusers",
-    "PNDMScheduler"
-  ],
-  "text_encoder": [
-    "transformers",
-    "CLIPTextModel"
-  ],
-  "tokenizer": [
-    "transformers",
-    "CLIPTokenizer"
-  ],
-  "unet": [
-    "diffusers",
-    "UNet2DConditionModel"
-  ],
-  "vae": [
-    "diffusers",
-    "AutoencoderKL"
-  ]
-}

tokenizer/pytorch_model.bin DELETED Viewed

@@ -1,3 +0,0 @@
-version https://git-lfs.github.com/spec/v1
-oid sha256:e0281d5c40c659ba4197119cab76775cf384955e2d8864889300b0a677dfb97e
-size 1444569818

tokenizer/special_tokens_map.json DELETED Viewed

@@ -1,24 +0,0 @@
-{
-  "bos_token": {
-    "content": "<|startoftext|>",
-    "lstrip": false,
-    "normalized": true,
-    "rstrip": false,
-    "single_word": false
-  },
-  "eos_token": {
-    "content": "<|endoftext|>",
-    "lstrip": false,
-    "normalized": true,
-    "rstrip": false,
-    "single_word": false
-  },
-  "pad_token": "<|endoftext|>",
-  "unk_token": {
-    "content": "<|endoftext|>",
-    "lstrip": false,
-    "normalized": true,
-    "rstrip": false,
-    "single_word": false
-  }
-}

tokenizer/tokenizer.json DELETED Viewed

The diff for this file is too large to render. See raw diff

tokenizer/tokenizer_config.json DELETED Viewed

@@ -1,33 +0,0 @@
-{
-  "add_prefix_space": false,
-  "bos_token": {
-    "__type": "AddedToken",
-    "content": "<|startoftext|>",
-    "lstrip": false,
-    "normalized": true,
-    "rstrip": false,
-    "single_word": false
-  },
-  "do_lower_case": true,
-  "eos_token": {
-    "__type": "AddedToken",
-    "content": "<|endoftext|>",
-    "lstrip": false,
-    "normalized": true,
-    "rstrip": false,
-    "single_word": false
-  },
-  "errors": "replace",
-  "model_max_length": 77,
-  "pad_token": "<|endoftext|>",
-  "special_tokens_map_file": "./special_tokens_map.json",
-  "tokenizer_class": "CLIPTokenizer",
-  "unk_token": {
-    "__type": "AddedToken",
-    "content": "<|endoftext|>",
-    "lstrip": false,
-    "normalized": true,
-    "rstrip": false,
-    "single_word": false
-  }
-}

tokenizer/vocab.json DELETED Viewed

The diff for this file is too large to render. See raw diff