wenhuan
/

MR-DNA

wenhuan commited on Oct 15, 2023

Commit

8316d26

•

1 Parent(s): f5182a5

Upload folder using huggingface_hub

Files changed (5) hide show

added_tokens.json ADDED Viewed

+{
+  "AGN": 25000,
+  "ATA": 25002,
+  "ATG": 25011,
+  "ATN": 25034,
+  "CCG": 25016,
+  "CCN": 25006,
+  "CGN": 25021,
+  "CTA": 25003,
+  "CTG": 25008,
+  "CTN": 25022,
+  "GAN": 25027,
+  "GCG": 25032,
+  "GCN": 25014,
+  "GGN": 25017,
+  "GTA": 25030,
+  "GTG": 25033,
+  "GTN": 25029,
+  "NAA": 25023,
+  "NAC": 25010,
+  "NAG": 25019,
+  "NAT": 25025,
+  "NCA": 25020,
+  "NCG": 25005,
+  "NCT": 25035,
+  "NGA": 25009,
+  "NGC": 25024,
+  "NGG": 25026,
+  "NGT": 25036,
+  "NTA": 25028,
+  "NTC": 25012,
+  "NTG": 25004,
+  "NTT": 25018,
+  "TAN": 25013,
+  "TCG": 25015,
+  "TCN": 25031,
+  "TGN": 25038,
+  "TTA": 25001,
+  "TTG": 25037,
+  "TTN": 25007
+}

special_tokens_map.json ADDED Viewed

+{
+  "cls_token": "[CLS]",
+  "mask_token": "[MASK]",
+  "pad_token": "[PAD]",
+  "sep_token": "[SEP]",
+  "unk_token": "[UNK]"
+}

tokenizer.json ADDED Viewed

The diff for this file is too large to render. See raw diff

tokenizer_config.json ADDED Viewed

+{
+  "cls_token": "[CLS]",
+  "do_lower_case": false,
+  "mask_token": "[MASK]",
+  "model_max_length": 512,
+  "name_or_path": "/mnt/volume/project/5mC/pretrainedModel/distilbert/tokenizer/distilbert_seq_tax_trained",
+  "pad_token": "[PAD]",
+  "sep_token": "[SEP]",
+  "special_tokens_map_file": null,
+  "strip_accents": null,
+  "tokenize_chinese_chars": true,
+  "tokenizer_class": "DistilBertTokenizer",
+  "unk_token": "[UNK]"
+}

vocab.txt ADDED Viewed

The diff for this file is too large to render. See raw diff