AmelieSchreiber commited on Sep 28, 2023

Commit

986143f

•

1 Parent(s): a049c3f

Upload 48 files

Browse files

Files changed (48) hide show

esm2_t6_8M_qlora_binding_sites_2023-09-28_00-05-45/checkpoint-11817/README.md +21 -0
esm2_t6_8M_qlora_binding_sites_2023-09-28_00-05-45/checkpoint-11817/adapter_config.json +26 -0
esm2_t6_8M_qlora_binding_sites_2023-09-28_00-05-45/checkpoint-11817/adapter_model.bin +3 -0
esm2_t6_8M_qlora_binding_sites_2023-09-28_00-05-45/checkpoint-11817/added_tokens.json +7 -0
esm2_t6_8M_qlora_binding_sites_2023-09-28_00-05-45/checkpoint-11817/optimizer.pt +3 -0
esm2_t6_8M_qlora_binding_sites_2023-09-28_00-05-45/checkpoint-11817/rng_state.pth +3 -0
esm2_t6_8M_qlora_binding_sites_2023-09-28_00-05-45/checkpoint-11817/scheduler.pt +3 -0
esm2_t6_8M_qlora_binding_sites_2023-09-28_00-05-45/checkpoint-11817/special_tokens_map.json +7 -0
esm2_t6_8M_qlora_binding_sites_2023-09-28_00-05-45/checkpoint-11817/tokenizer_config.json +54 -0
esm2_t6_8M_qlora_binding_sites_2023-09-28_00-05-45/checkpoint-11817/trainer_state.json +415 -0
esm2_t6_8M_qlora_binding_sites_2023-09-28_00-05-45/checkpoint-11817/training_args.bin +3 -0
esm2_t6_8M_qlora_binding_sites_2023-09-28_00-05-45/checkpoint-11817/vocab.txt +33 -0
esm2_t6_8M_qlora_binding_sites_2023-09-28_00-05-45/checkpoint-15756/README.md +21 -0
esm2_t6_8M_qlora_binding_sites_2023-09-28_00-05-45/checkpoint-15756/adapter_config.json +26 -0
esm2_t6_8M_qlora_binding_sites_2023-09-28_00-05-45/checkpoint-15756/adapter_model.bin +3 -0
esm2_t6_8M_qlora_binding_sites_2023-09-28_00-05-45/checkpoint-15756/added_tokens.json +7 -0
esm2_t6_8M_qlora_binding_sites_2023-09-28_00-05-45/checkpoint-15756/optimizer.pt +3 -0
esm2_t6_8M_qlora_binding_sites_2023-09-28_00-05-45/checkpoint-15756/rng_state.pth +3 -0
esm2_t6_8M_qlora_binding_sites_2023-09-28_00-05-45/checkpoint-15756/scheduler.pt +3 -0
esm2_t6_8M_qlora_binding_sites_2023-09-28_00-05-45/checkpoint-15756/special_tokens_map.json +7 -0
esm2_t6_8M_qlora_binding_sites_2023-09-28_00-05-45/checkpoint-15756/tokenizer_config.json +54 -0
esm2_t6_8M_qlora_binding_sites_2023-09-28_00-05-45/checkpoint-15756/trainer_state.json +543 -0
esm2_t6_8M_qlora_binding_sites_2023-09-28_00-05-45/checkpoint-15756/training_args.bin +3 -0
esm2_t6_8M_qlora_binding_sites_2023-09-28_00-05-45/checkpoint-15756/vocab.txt +33 -0
esm2_t6_8M_qlora_binding_sites_2023-09-28_00-05-45/checkpoint-3939/README.md +21 -0
esm2_t6_8M_qlora_binding_sites_2023-09-28_00-05-45/checkpoint-3939/adapter_config.json +26 -0
esm2_t6_8M_qlora_binding_sites_2023-09-28_00-05-45/checkpoint-3939/adapter_model.bin +3 -0
esm2_t6_8M_qlora_binding_sites_2023-09-28_00-05-45/checkpoint-3939/added_tokens.json +7 -0
esm2_t6_8M_qlora_binding_sites_2023-09-28_00-05-45/checkpoint-3939/optimizer.pt +3 -0
esm2_t6_8M_qlora_binding_sites_2023-09-28_00-05-45/checkpoint-3939/rng_state.pth +3 -0
esm2_t6_8M_qlora_binding_sites_2023-09-28_00-05-45/checkpoint-3939/scheduler.pt +3 -0
esm2_t6_8M_qlora_binding_sites_2023-09-28_00-05-45/checkpoint-3939/special_tokens_map.json +7 -0
esm2_t6_8M_qlora_binding_sites_2023-09-28_00-05-45/checkpoint-3939/tokenizer_config.json +54 -0
esm2_t6_8M_qlora_binding_sites_2023-09-28_00-05-45/checkpoint-3939/trainer_state.json +147 -0
esm2_t6_8M_qlora_binding_sites_2023-09-28_00-05-45/checkpoint-3939/training_args.bin +3 -0
esm2_t6_8M_qlora_binding_sites_2023-09-28_00-05-45/checkpoint-3939/vocab.txt +33 -0
esm2_t6_8M_qlora_binding_sites_2023-09-28_00-05-45/checkpoint-7878/README.md +21 -0
esm2_t6_8M_qlora_binding_sites_2023-09-28_00-05-45/checkpoint-7878/adapter_config.json +26 -0
esm2_t6_8M_qlora_binding_sites_2023-09-28_00-05-45/checkpoint-7878/adapter_model.bin +3 -0
esm2_t6_8M_qlora_binding_sites_2023-09-28_00-05-45/checkpoint-7878/added_tokens.json +7 -0
esm2_t6_8M_qlora_binding_sites_2023-09-28_00-05-45/checkpoint-7878/optimizer.pt +3 -0
esm2_t6_8M_qlora_binding_sites_2023-09-28_00-05-45/checkpoint-7878/rng_state.pth +3 -0
esm2_t6_8M_qlora_binding_sites_2023-09-28_00-05-45/checkpoint-7878/scheduler.pt +3 -0
esm2_t6_8M_qlora_binding_sites_2023-09-28_00-05-45/checkpoint-7878/special_tokens_map.json +7 -0
esm2_t6_8M_qlora_binding_sites_2023-09-28_00-05-45/checkpoint-7878/tokenizer_config.json +54 -0
esm2_t6_8M_qlora_binding_sites_2023-09-28_00-05-45/checkpoint-7878/trainer_state.json +281 -0
esm2_t6_8M_qlora_binding_sites_2023-09-28_00-05-45/checkpoint-7878/training_args.bin +3 -0
esm2_t6_8M_qlora_binding_sites_2023-09-28_00-05-45/checkpoint-7878/vocab.txt +33 -0

esm2_t6_8M_qlora_binding_sites_2023-09-28_00-05-45/checkpoint-11817/README.md ADDED Viewed

	@@ -0,0 +1,21 @@

+---
+library_name: peft
+---
+## Training procedure
+The following `bitsandbytes` quantization config was used during training:
+- quant_method: bitsandbytes
+- load_in_8bit: False
+- load_in_4bit: True
+- llm_int8_threshold: 6.0
+- llm_int8_skip_modules: None
+- llm_int8_enable_fp32_cpu_offload: False
+- llm_int8_has_fp16_weight: False
+- bnb_4bit_quant_type: nf4
+- bnb_4bit_use_double_quant: True
+- bnb_4bit_compute_dtype: bfloat16
+### Framework versions
+- PEFT 0.6.0.dev0

esm2_t6_8M_qlora_binding_sites_2023-09-28_00-05-45/checkpoint-11817/adapter_config.json ADDED Viewed

	@@ -0,0 +1,26 @@

+{
+  "alpha_pattern": {},
+  "auto_mapping": null,
+  "base_model_name_or_path": "facebook/esm2_t6_8M_UR50D",
+  "bias": "none",
+  "fan_in_fan_out": false,
+  "inference_mode": true,
+  "init_lora_weights": true,
+  "layers_pattern": null,
+  "layers_to_transform": null,
+  "lora_alpha": 1,
+  "lora_dropout": 0.5,
+  "modules_to_save": [
+    "classifier"
+  ],
+  "peft_type": "LORA",
+  "r": 2,
+  "rank_pattern": {},
+  "revision": null,
+  "target_modules": [
+    "query",
+    "key",
+    "value"
+  ],
+  "task_type": "TOKEN_CLS"
+}

esm2_t6_8M_qlora_binding_sites_2023-09-28_00-05-45/checkpoint-11817/adapter_model.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:9aa2cfb408dccd4df17ebd460d1c53e78d1634a07d4fdbc9fa235a87559ba464
+size 108323

esm2_t6_8M_qlora_binding_sites_2023-09-28_00-05-45/checkpoint-11817/added_tokens.json ADDED Viewed

	@@ -0,0 +1,7 @@

+{
+  "<cls>": 0,
+  "<eos>": 2,
+  "<mask>": 32,
+  "<pad>": 1,
+  "<unk>": 3
+}

esm2_t6_8M_qlora_binding_sites_2023-09-28_00-05-45/checkpoint-11817/optimizer.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:90d68ccc83326239b324895a33766d44e52a8f0e5db512b7ffc7f1460ab88f7e
+size 211805

esm2_t6_8M_qlora_binding_sites_2023-09-28_00-05-45/checkpoint-11817/rng_state.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:77b0ab42bbe269c06df0d453790ac0c293c65348ede27908f98bd8f1ebd0fc13
+size 14575

esm2_t6_8M_qlora_binding_sites_2023-09-28_00-05-45/checkpoint-11817/scheduler.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:d3676a61e287c72a94f887301dbd12aad47cd3033c71e16308c1190c5c28aecd
+size 627

esm2_t6_8M_qlora_binding_sites_2023-09-28_00-05-45/checkpoint-11817/special_tokens_map.json ADDED Viewed

	@@ -0,0 +1,7 @@

+{
+  "cls_token": "<cls>",
+  "eos_token": "<eos>",
+  "mask_token": "<mask>",
+  "pad_token": "<pad>",
+  "unk_token": "<unk>"
+}

esm2_t6_8M_qlora_binding_sites_2023-09-28_00-05-45/checkpoint-11817/tokenizer_config.json ADDED Viewed

	@@ -0,0 +1,54 @@

+{
+  "added_tokens_decoder": {
+    "0": {
+      "content": "<cls>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "1": {
+      "content": "<pad>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "2": {
+      "content": "<eos>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "3": {
+      "content": "<unk>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "32": {
+      "content": "<mask>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    }
+  },
+  "additional_special_tokens": [],
+  "clean_up_tokenization_spaces": true,
+  "cls_token": "<cls>",
+  "eos_token": "<eos>",
+  "mask_token": "<mask>",
+  "model_max_length": 1024,
+  "pad_token": "<pad>",
+  "tokenizer_class": "EsmTokenizer",
+  "tokenizer_file": null,
+  "unk_token": "<unk>"
+}

esm2_t6_8M_qlora_binding_sites_2023-09-28_00-05-45/checkpoint-11817/trainer_state.json ADDED Viewed

	@@ -0,0 +1,415 @@

+{
+  "best_metric": 0.20658952998649033,
+  "best_model_checkpoint": "esm2_t6_8M_qlora_binding_sites_2023-09-28_00-05-45/checkpoint-7878",
+  "epoch": 3.0,
+  "eval_steps": 500,
+  "global_step": 11817,
+  "is_hyper_param_search": false,
+  "is_local_process_zero": true,
+  "is_world_process_zero": true,
+  "log_history": [
+    {
+      "epoch": 0.05,
+      "learning_rate": 0.0003700096638060586,
+      "loss": 0.4987,
+      "step": 200
+    },
+    {
+      "epoch": 0.1,
+      "learning_rate": 0.0003695684724487918,
+      "loss": 0.3756,
+      "step": 400
+    },
+    {
+      "epoch": 0.15,
+      "learning_rate": 0.00036883393302294926,
+      "loss": 0.3422,
+      "step": 600
+    },
+    {
+      "epoch": 0.2,
+      "learning_rate": 0.0003678072134814851,
+      "loss": 0.3223,
+      "step": 800
+    },
+    {
+      "epoch": 0.25,
+      "learning_rate": 0.0003664899463577655,
+      "loss": 0.3094,
+      "step": 1000
+    },
+    {
+      "epoch": 0.3,
+      "learning_rate": 0.00036488422616976233,
+      "loss": 0.3001,
+      "step": 1200
+    },
+    {
+      "epoch": 0.36,
+      "learning_rate": 0.0003629926060896693,
+      "loss": 0.2916,
+      "step": 1400
+    },
+    {
+      "epoch": 0.41,
+      "learning_rate": 0.00036081809388423475,
+      "loss": 0.2847,
+      "step": 1600
+    },
+    {
+      "epoch": 0.46,
+      "learning_rate": 0.0003583641471322691,
+      "loss": 0.2787,
+      "step": 1800
+    },
+    {
+      "epoch": 0.51,
+      "learning_rate": 0.00035563466772692797,
+      "loss": 0.2725,
+      "step": 2000
+    },
+    {
+      "epoch": 0.56,
+      "learning_rate": 0.0003526339956715147,
+      "loss": 0.2699,
+      "step": 2200
+    },
+    {
+      "epoch": 0.61,
+      "learning_rate": 0.00034936690217866705,
+      "loss": 0.2668,
+      "step": 2400
+    },
+    {
+      "epoch": 0.66,
+      "learning_rate": 0.00034583858208389975,
+      "loss": 0.2636,
+      "step": 2600
+    },
+    {
+      "epoch": 0.71,
+      "learning_rate": 0.0003420546455855667,
+      "loss": 0.2604,
+      "step": 2800
+    },
+    {
+      "epoch": 0.76,
+      "learning_rate": 0.00033802110932437625,
+      "loss": 0.2577,
+      "step": 3000
+    },
+    {
+      "epoch": 0.81,
+      "learning_rate": 0.0003337443868166437,
+      "loss": 0.2545,
+      "step": 3200
+    },
+    {
+      "epoch": 0.86,
+      "learning_rate": 0.00032923127825649205,
+      "loss": 0.2515,
+      "step": 3400
+    },
+    {
+      "epoch": 0.91,
+      "learning_rate": 0.00032448895970321745,
+      "loss": 0.2518,
+      "step": 3600
+    },
+    {
+      "epoch": 0.96,
+      "learning_rate": 0.0003195503301009428,
+      "loss": 0.2465,
+      "step": 3800
+    },
+    {
+      "epoch": 1.0,
+      "eval_accuracy": 0.8584993872301376,
+      "eval_auc": 0.8182032038033911,
+      "eval_f1": 0.1931125248049425,
+      "eval_loss": 0.4206424355506897,
+      "eval_mcc": 0.25789003640920655,
+      "eval_precision": 0.11027656492418843,
+      "eval_recall": 0.7760683791635847,
+      "eval_runtime": 1158.8552,
+      "eval_samples_per_second": 110.153,
+      "eval_steps_per_second": 1.722,
+      "step": 3939
+    },
+    {
+      "epoch": 1.02,
+      "learning_rate": 0.0003143736142501833,
+      "loss": 0.2489,
+      "step": 4000
+    },
+    {
+      "epoch": 1.07,
+      "learning_rate": 0.0003089913128054233,
+      "loss": 0.244,
+      "step": 4200
+    },
+    {
+      "epoch": 1.12,
+      "learning_rate": 0.0003034119838843777,
+      "loss": 0.2417,
+      "step": 4400
+    },
+    {
+      "epoch": 1.17,
+      "learning_rate": 0.00029764449888790783,
+      "loss": 0.243,
+      "step": 4600
+    },
+    {
+      "epoch": 1.22,
+      "learning_rate": 0.0002916980283940693,
+      "loss": 0.2387,
+      "step": 4800
+    },
+    {
+      "epoch": 1.27,
+      "learning_rate": 0.00028558202757645164,
+      "loss": 0.2384,
+      "step": 5000
+    },
+    {
+      "epoch": 1.32,
+      "learning_rate": 0.0002793062211699992,
+      "loss": 0.2369,
+      "step": 5200
+    },
+    {
+      "epoch": 1.37,
+      "learning_rate": 0.0002728805880082148,
+      "loss": 0.2378,
+      "step": 5400
+    },
+    {
+      "epoch": 1.42,
+      "learning_rate": 0.00026631534515633606,
+      "loss": 0.2344,
+      "step": 5600
+    },
+    {
+      "epoch": 1.47,
+      "learning_rate": 0.0002596209316657108,
+      "loss": 0.2355,
+      "step": 5800
+    },
+    {
+      "epoch": 1.52,
+      "learning_rate": 0.00025280799197520415,
+      "loss": 0.2336,
+      "step": 6000
+    },
+    {
+      "epoch": 1.57,
+      "learning_rate": 0.0002458873589860299,
+      "loss": 0.2308,
+      "step": 6200
+    },
+    {
+      "epoch": 1.62,
+      "learning_rate": 0.00023887003683691727,
+      "loss": 0.2336,
+      "step": 6400
+    },
+    {
+      "epoch": 1.68,
+      "learning_rate": 0.00023176718340700212,
+      "loss": 0.2323,
+      "step": 6600
+    },
+    {
+      "epoch": 1.73,
+      "learning_rate": 0.00022462614386106907,
+      "loss": 0.2313,
+      "step": 6800
+    },
+    {
+      "epoch": 1.78,
+      "learning_rate": 0.00021738651311196128,
+      "loss": 0.231,
+      "step": 7000
+    },
+    {
+      "epoch": 1.83,
+      "learning_rate": 0.00021009551091624989,
+      "loss": 0.2299,
+      "step": 7200
+    },
+    {
+      "epoch": 1.88,
+      "learning_rate": 0.0002027647303174849,
+      "loss": 0.2289,
+      "step": 7400
+    },
+    {
+      "epoch": 1.93,
+      "learning_rate": 0.00019540582760878698,
+      "loss": 0.229,
+      "step": 7600
+    },
+    {
+      "epoch": 1.98,
+      "learning_rate": 0.00018803050379878183,
+      "loss": 0.229,
+      "step": 7800
+    },
+    {
+      "epoch": 2.0,
+      "eval_accuracy": 0.8743961636075187,
+      "eval_auc": 0.8133290603995718,
+      "eval_f1": 0.20658952998649033,
+      "eval_loss": 0.44484642148017883,
+      "eval_mcc": 0.26666675881078966,
+      "eval_precision": 0.11980687472936644,
+      "eval_recall": 0.749475576865448,
+      "eval_runtime": 1151.9615,
+      "eval_samples_per_second": 110.812,
+      "eval_steps_per_second": 1.732,
+      "step": 7878
+    },
+    {
+      "epoch": 2.03,
+      "learning_rate": 0.00018065048600643456,
+      "loss": 0.2252,
+      "step": 8000
+    },
+    {
+      "epoch": 2.08,
+      "learning_rate": 0.0001732775088143677,
+      "loss": 0.2269,
+      "step": 8200
+    },
+    {
+      "epoch": 2.13,
+      "learning_rate": 0.0001659232956103113,
+      "loss": 0.2269,
+      "step": 8400
+    },
+    {
+      "epoch": 2.18,
+      "learning_rate": 0.00015859953994635335,
+      "loss": 0.227,
+      "step": 8600
+    },
+    {
+      "epoch": 2.23,
+      "learning_rate": 0.00015131788694563091,
+      "loss": 0.2238,
+      "step": 8800
+    },
+    {
+      "epoch": 2.28,
+      "learning_rate": 0.00014412590206441025,
+      "loss": 0.2258,
+      "step": 9000
+    },
+    {
+      "epoch": 2.34,
+      "learning_rate": 0.00013696274927583722,
+      "loss": 0.2231,
+      "step": 9200
+    },
+    {
+      "epoch": 2.39,
+      "learning_rate": 0.00012987610268650092,
+      "loss": 0.2245,
+      "step": 9400
+    },
+    {
+      "epoch": 2.44,
+      "learning_rate": 0.00012287723040472557,
+      "loss": 0.2241,
+      "step": 9600
+    },
+    {
+      "epoch": 2.49,
+      "learning_rate": 0.00011597726097347204,
+      "loss": 0.225,
+      "step": 9800
+    },
+    {
+      "epoch": 2.54,
+      "learning_rate": 0.00010918716567542043,
+      "loss": 0.2228,
+      "step": 10000
+    },
+    {
+      "epoch": 2.59,
+      "learning_rate": 0.0001025177410881037,
+      "loss": 0.2212,
+      "step": 10200
+    },
+    {
+      "epoch": 2.64,
+      "learning_rate": 9.597959191683088e-05,
+      "loss": 0.2212,
+      "step": 10400
+    },
+    {
+      "epoch": 2.69,
+      "learning_rate": 8.958311413269684e-05,
+      "loss": 0.2211,
+      "step": 10600
+    },
+    {
+      "epoch": 2.74,
+      "learning_rate": 8.333847844248891e-05,
+      "loss": 0.2208,
+      "step": 10800
+    },
+    {
+      "epoch": 2.79,
+      "learning_rate": 7.725561411677462e-05,
+      "loss": 0.2208,
+      "step": 11000
+    },
+    {
+      "epoch": 2.84,
+      "learning_rate": 7.137330817547789e-05,
+      "loss": 0.2236,
+      "step": 11200
+    },
+    {
+      "epoch": 2.89,
+      "learning_rate": 6.564180298866504e-05,
+      "loss": 0.2252,
+      "step": 11400
+    },
+    {
+      "epoch": 2.94,
+      "learning_rate": 6.010020772997792e-05,
+      "loss": 0.2217,
+      "step": 11600
+    },
+    {
+      "epoch": 3.0,
+      "learning_rate": 5.475733380194338e-05,
+      "loss": 0.2171,
+      "step": 11800
+    },
+    {
+      "epoch": 3.0,
+      "eval_accuracy": 0.871436177611881,
+      "eval_auc": 0.8150915702010527,
+      "eval_f1": 0.2042404682874535,
+      "eval_loss": 0.4439041316509247,
+      "eval_mcc": 0.2655282757252214,
+      "eval_precision": 0.11806465629899295,
+      "eval_recall": 0.7561760613174451,
+      "eval_runtime": 1159.3364,
+      "eval_samples_per_second": 110.107,
+      "eval_steps_per_second": 1.721,
+      "step": 11817
+    }
+  ],
+  "logging_steps": 200,
+  "max_steps": 15756,
+  "num_train_epochs": 4,
+  "save_steps": 500,
+  "total_flos": 6.076133341593283e+16,
+  "trial_name": null,
+  "trial_params": null
+}

esm2_t6_8M_qlora_binding_sites_2023-09-28_00-05-45/checkpoint-11817/training_args.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:21e29ca655570a4c93caaae2152a14df90626498f407241f0d253a3640c7a8ce
+size 4155

esm2_t6_8M_qlora_binding_sites_2023-09-28_00-05-45/checkpoint-11817/vocab.txt ADDED Viewed

	@@ -0,0 +1,33 @@

+<cls>
+<pad>
+<eos>
+<unk>
+L
+A
+G
+V
+S
+E
+R
+T
+I
+D
+P
+K
+Q
+N
+F
+Y
+M
+H
+W
+C
+X
+B
+U
+Z
+O
+.
+-
+<null_1>
+<mask>

esm2_t6_8M_qlora_binding_sites_2023-09-28_00-05-45/checkpoint-15756/README.md ADDED Viewed

	@@ -0,0 +1,21 @@

+---
+library_name: peft
+---
+## Training procedure
+The following `bitsandbytes` quantization config was used during training:
+- quant_method: bitsandbytes
+- load_in_8bit: False
+- load_in_4bit: True
+- llm_int8_threshold: 6.0
+- llm_int8_skip_modules: None
+- llm_int8_enable_fp32_cpu_offload: False
+- llm_int8_has_fp16_weight: False
+- bnb_4bit_quant_type: nf4
+- bnb_4bit_use_double_quant: True
+- bnb_4bit_compute_dtype: bfloat16
+### Framework versions
+- PEFT 0.6.0.dev0

esm2_t6_8M_qlora_binding_sites_2023-09-28_00-05-45/checkpoint-15756/adapter_config.json ADDED Viewed

	@@ -0,0 +1,26 @@

+{
+  "alpha_pattern": {},
+  "auto_mapping": null,
+  "base_model_name_or_path": "facebook/esm2_t6_8M_UR50D",
+  "bias": "none",
+  "fan_in_fan_out": false,
+  "inference_mode": true,
+  "init_lora_weights": true,
+  "layers_pattern": null,
+  "layers_to_transform": null,
+  "lora_alpha": 1,
+  "lora_dropout": 0.5,
+  "modules_to_save": [
+    "classifier"
+  ],
+  "peft_type": "LORA",
+  "r": 2,
+  "rank_pattern": {},
+  "revision": null,
+  "target_modules": [
+    "query",
+    "key",
+    "value"
+  ],
+  "task_type": "TOKEN_CLS"
+}

esm2_t6_8M_qlora_binding_sites_2023-09-28_00-05-45/checkpoint-15756/adapter_model.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:3ea428d19fc1c256e6d448e032b63cbcb1c0fe35c1cad4960c7a6ed03c5b92ba
+size 108323

esm2_t6_8M_qlora_binding_sites_2023-09-28_00-05-45/checkpoint-15756/added_tokens.json ADDED Viewed

	@@ -0,0 +1,7 @@

+{
+  "<cls>": 0,
+  "<eos>": 2,
+  "<mask>": 32,
+  "<pad>": 1,
+  "<unk>": 3
+}

esm2_t6_8M_qlora_binding_sites_2023-09-28_00-05-45/checkpoint-15756/optimizer.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:3f16afa5d73496c13e042eb7e137c69517f95ec7f0ab3b4c76fd442bf9edf2e0
+size 211805

esm2_t6_8M_qlora_binding_sites_2023-09-28_00-05-45/checkpoint-15756/rng_state.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:291bc0bdc85d782988ee26dcae148038cc1f15508622f285332bbe7b99270d1b
+size 14575

esm2_t6_8M_qlora_binding_sites_2023-09-28_00-05-45/checkpoint-15756/scheduler.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:86ab8ca8d941f7a9dc0e1bfb3c414eb3afc0b3e1513ea8a7ce0db94586cd403d
+size 627

esm2_t6_8M_qlora_binding_sites_2023-09-28_00-05-45/checkpoint-15756/special_tokens_map.json ADDED Viewed

	@@ -0,0 +1,7 @@

+{
+  "cls_token": "<cls>",
+  "eos_token": "<eos>",
+  "mask_token": "<mask>",
+  "pad_token": "<pad>",
+  "unk_token": "<unk>"
+}

esm2_t6_8M_qlora_binding_sites_2023-09-28_00-05-45/checkpoint-15756/tokenizer_config.json ADDED Viewed

	@@ -0,0 +1,54 @@

+{
+  "added_tokens_decoder": {
+    "0": {
+      "content": "<cls>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "1": {
+      "content": "<pad>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "2": {
+      "content": "<eos>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "3": {
+      "content": "<unk>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "32": {
+      "content": "<mask>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    }
+  },
+  "additional_special_tokens": [],
+  "clean_up_tokenization_spaces": true,
+  "cls_token": "<cls>",
+  "eos_token": "<eos>",
+  "mask_token": "<mask>",
+  "model_max_length": 1024,
+  "pad_token": "<pad>",
+  "tokenizer_class": "EsmTokenizer",
+  "tokenizer_file": null,
+  "unk_token": "<unk>"
+}

esm2_t6_8M_qlora_binding_sites_2023-09-28_00-05-45/checkpoint-15756/trainer_state.json ADDED Viewed

	@@ -0,0 +1,543 @@

+{
+  "best_metric": 0.20658952998649033,
+  "best_model_checkpoint": "esm2_t6_8M_qlora_binding_sites_2023-09-28_00-05-45/checkpoint-7878",
+  "epoch": 4.0,
+  "eval_steps": 500,
+  "global_step": 15756,
+  "is_hyper_param_search": false,
+  "is_local_process_zero": true,
+  "is_world_process_zero": true,
+  "log_history": [
+    {
+      "epoch": 0.05,
+      "learning_rate": 0.0003700096638060586,
+      "loss": 0.4987,
+      "step": 200
+    },
+    {
+      "epoch": 0.1,
+      "learning_rate": 0.0003695684724487918,
+      "loss": 0.3756,
+      "step": 400
+    },
+    {
+      "epoch": 0.15,
+      "learning_rate": 0.00036883393302294926,
+      "loss": 0.3422,
+      "step": 600
+    },
+    {
+      "epoch": 0.2,
+      "learning_rate": 0.0003678072134814851,
+      "loss": 0.3223,
+      "step": 800
+    },
+    {
+      "epoch": 0.25,
+      "learning_rate": 0.0003664899463577655,
+      "loss": 0.3094,
+      "step": 1000
+    },
+    {
+      "epoch": 0.3,
+      "learning_rate": 0.00036488422616976233,
+      "loss": 0.3001,
+      "step": 1200
+    },
+    {
+      "epoch": 0.36,
+      "learning_rate": 0.0003629926060896693,
+      "loss": 0.2916,
+      "step": 1400
+    },
+    {
+      "epoch": 0.41,
+      "learning_rate": 0.00036081809388423475,
+      "loss": 0.2847,
+      "step": 1600
+    },
+    {
+      "epoch": 0.46,
+      "learning_rate": 0.0003583641471322691,
+      "loss": 0.2787,
+      "step": 1800
+    },
+    {
+      "epoch": 0.51,
+      "learning_rate": 0.00035563466772692797,
+      "loss": 0.2725,
+      "step": 2000
+    },
+    {
+      "epoch": 0.56,
+      "learning_rate": 0.0003526339956715147,
+      "loss": 0.2699,
+      "step": 2200
+    },
+    {
+      "epoch": 0.61,
+      "learning_rate": 0.00034936690217866705,
+      "loss": 0.2668,
+      "step": 2400
+    },
+    {
+      "epoch": 0.66,
+      "learning_rate": 0.00034583858208389975,
+      "loss": 0.2636,
+      "step": 2600
+    },
+    {
+      "epoch": 0.71,
+      "learning_rate": 0.0003420546455855667,
+      "loss": 0.2604,
+      "step": 2800
+    },
+    {
+      "epoch": 0.76,
+      "learning_rate": 0.00033802110932437625,
+      "loss": 0.2577,
+      "step": 3000
+    },
+    {
+      "epoch": 0.81,
+      "learning_rate": 0.0003337443868166437,
+      "loss": 0.2545,
+      "step": 3200
+    },
+    {
+      "epoch": 0.86,
+      "learning_rate": 0.00032923127825649205,
+      "loss": 0.2515,
+      "step": 3400
+    },
+    {
+      "epoch": 0.91,
+      "learning_rate": 0.00032448895970321745,
+      "loss": 0.2518,
+      "step": 3600
+    },
+    {
+      "epoch": 0.96,
+      "learning_rate": 0.0003195503301009428,
+      "loss": 0.2465,
+      "step": 3800
+    },
+    {
+      "epoch": 1.0,
+      "eval_accuracy": 0.8584993872301376,
+      "eval_auc": 0.8182032038033911,
+      "eval_f1": 0.1931125248049425,
+      "eval_loss": 0.4206424355506897,
+      "eval_mcc": 0.25789003640920655,
+      "eval_precision": 0.11027656492418843,
+      "eval_recall": 0.7760683791635847,
+      "eval_runtime": 1158.8552,
+      "eval_samples_per_second": 110.153,
+      "eval_steps_per_second": 1.722,
+      "step": 3939
+    },
+    {
+      "epoch": 1.02,
+      "learning_rate": 0.0003143736142501833,
+      "loss": 0.2489,
+      "step": 4000
+    },
+    {
+      "epoch": 1.07,
+      "learning_rate": 0.0003089913128054233,
+      "loss": 0.244,
+      "step": 4200
+    },
+    {
+      "epoch": 1.12,
+      "learning_rate": 0.0003034119838843777,
+      "loss": 0.2417,
+      "step": 4400
+    },
+    {
+      "epoch": 1.17,
+      "learning_rate": 0.00029764449888790783,
+      "loss": 0.243,
+      "step": 4600
+    },
+    {
+      "epoch": 1.22,
+      "learning_rate": 0.0002916980283940693,
+      "loss": 0.2387,
+      "step": 4800
+    },
+    {
+      "epoch": 1.27,
+      "learning_rate": 0.00028558202757645164,
+      "loss": 0.2384,
+      "step": 5000
+    },
+    {
+      "epoch": 1.32,
+      "learning_rate": 0.0002793062211699992,
+      "loss": 0.2369,
+      "step": 5200
+    },
+    {
+      "epoch": 1.37,
+      "learning_rate": 0.0002728805880082148,
+      "loss": 0.2378,
+      "step": 5400
+    },
+    {
+      "epoch": 1.42,
+      "learning_rate": 0.00026631534515633606,
+      "loss": 0.2344,
+      "step": 5600
+    },
+    {
+      "epoch": 1.47,
+      "learning_rate": 0.0002596209316657108,
+      "loss": 0.2355,
+      "step": 5800
+    },
+    {
+      "epoch": 1.52,
+      "learning_rate": 0.00025280799197520415,
+      "loss": 0.2336,
+      "step": 6000
+    },
+    {
+      "epoch": 1.57,
+      "learning_rate": 0.0002458873589860299,
+      "loss": 0.2308,
+      "step": 6200
+    },
+    {
+      "epoch": 1.62,
+      "learning_rate": 0.00023887003683691727,
+      "loss": 0.2336,
+      "step": 6400
+    },
+    {
+      "epoch": 1.68,
+      "learning_rate": 0.00023176718340700212,
+      "loss": 0.2323,
+      "step": 6600
+    },
+    {
+      "epoch": 1.73,
+      "learning_rate": 0.00022462614386106907,
+      "loss": 0.2313,
+      "step": 6800
+    },
+    {
+      "epoch": 1.78,
+      "learning_rate": 0.00021738651311196128,
+      "loss": 0.231,
+      "step": 7000
+    },
+    {
+      "epoch": 1.83,
+      "learning_rate": 0.00021009551091624989,
+      "loss": 0.2299,
+      "step": 7200
+    },
+    {
+      "epoch": 1.88,
+      "learning_rate": 0.0002027647303174849,
+      "loss": 0.2289,
+      "step": 7400
+    },
+    {
+      "epoch": 1.93,
+      "learning_rate": 0.00019540582760878698,
+      "loss": 0.229,
+      "step": 7600
+    },
+    {
+      "epoch": 1.98,
+      "learning_rate": 0.00018803050379878183,
+      "loss": 0.229,
+      "step": 7800
+    },
+    {
+      "epoch": 2.0,
+      "eval_accuracy": 0.8743961636075187,
+      "eval_auc": 0.8133290603995718,
+      "eval_f1": 0.20658952998649033,
+      "eval_loss": 0.44484642148017883,
+      "eval_mcc": 0.26666675881078966,
+      "eval_precision": 0.11980687472936644,
+      "eval_recall": 0.749475576865448,
+      "eval_runtime": 1151.9615,
+      "eval_samples_per_second": 110.812,
+      "eval_steps_per_second": 1.732,
+      "step": 7878
+    },
+    {
+      "epoch": 2.03,
+      "learning_rate": 0.00018065048600643456,
+      "loss": 0.2252,
+      "step": 8000
+    },
+    {
+      "epoch": 2.08,
+      "learning_rate": 0.0001732775088143677,
+      "loss": 0.2269,
+      "step": 8200
+    },
+    {
+      "epoch": 2.13,
+      "learning_rate": 0.0001659232956103113,
+      "loss": 0.2269,
+      "step": 8400
+    },
+    {
+      "epoch": 2.18,
+      "learning_rate": 0.00015859953994635335,
+      "loss": 0.227,
+      "step": 8600
+    },
+    {
+      "epoch": 2.23,
+      "learning_rate": 0.00015131788694563091,
+      "loss": 0.2238,
+      "step": 8800
+    },
+    {
+      "epoch": 2.28,
+      "learning_rate": 0.00014412590206441025,
+      "loss": 0.2258,
+      "step": 9000
+    },
+    {
+      "epoch": 2.34,
+      "learning_rate": 0.00013696274927583722,
+      "loss": 0.2231,
+      "step": 9200
+    },
+    {
+      "epoch": 2.39,
+      "learning_rate": 0.00012987610268650092,
+      "loss": 0.2245,
+      "step": 9400
+    },
+    {
+      "epoch": 2.44,
+      "learning_rate": 0.00012287723040472557,
+      "loss": 0.2241,
+      "step": 9600
+    },
+    {
+      "epoch": 2.49,
+      "learning_rate": 0.00011597726097347204,
+      "loss": 0.225,
+      "step": 9800
+    },
+    {
+      "epoch": 2.54,
+      "learning_rate": 0.00010918716567542043,
+      "loss": 0.2228,
+      "step": 10000
+    },
+    {
+      "epoch": 2.59,
+      "learning_rate": 0.0001025177410881037,
+      "loss": 0.2212,
+      "step": 10200
+    },
+    {
+      "epoch": 2.64,
+      "learning_rate": 9.597959191683088e-05,
+      "loss": 0.2212,
+      "step": 10400
+    },
+    {
+      "epoch": 2.69,
+      "learning_rate": 8.958311413269684e-05,
+      "loss": 0.2211,
+      "step": 10600
+    },
+    {
+      "epoch": 2.74,
+      "learning_rate": 8.333847844248891e-05,
+      "loss": 0.2208,
+      "step": 10800
+    },
+    {
+      "epoch": 2.79,
+      "learning_rate": 7.725561411677462e-05,
+      "loss": 0.2208,
+      "step": 11000
+    },
+    {
+      "epoch": 2.84,
+      "learning_rate": 7.137330817547789e-05,
+      "loss": 0.2236,
+      "step": 11200
+    },
+    {
+      "epoch": 2.89,
+      "learning_rate": 6.564180298866504e-05,
+      "loss": 0.2252,
+      "step": 11400
+    },
+    {
+      "epoch": 2.94,
+      "learning_rate": 6.010020772997792e-05,
+      "loss": 0.2217,
+      "step": 11600
+    },
+    {
+      "epoch": 3.0,
+      "learning_rate": 5.475733380194338e-05,
+      "loss": 0.2171,
+      "step": 11800
+    },
+    {
+      "epoch": 3.0,
+      "eval_accuracy": 0.871436177611881,
+      "eval_auc": 0.8150915702010527,
+      "eval_f1": 0.2042404682874535,
+      "eval_loss": 0.4439041316509247,
+      "eval_mcc": 0.2655282757252214,
+      "eval_precision": 0.11806465629899295,
+      "eval_recall": 0.7561760613174451,
+      "eval_runtime": 1159.3364,
+      "eval_samples_per_second": 110.107,
+      "eval_steps_per_second": 1.721,
+      "step": 11817
+    },
+    {
+      "epoch": 3.05,
+      "learning_rate": 4.962167663063128e-05,
+      "loss": 0.2222,
+      "step": 12000
+    },
+    {
+      "epoch": 3.1,
+      "learning_rate": 4.4701402157519476e-05,
+      "loss": 0.2192,
+      "step": 12200
+    },
+    {
+      "epoch": 3.15,
+      "learning_rate": 4.000433385525458e-05,
+      "loss": 0.2214,
+      "step": 12400
+    },
+    {
+      "epoch": 3.2,
+      "learning_rate": 3.553794028795492e-05,
+      "loss": 0.2231,
+      "step": 12600
+    },
+    {
+      "epoch": 3.25,
+      "learning_rate": 3.130932323583492e-05,
+      "loss": 0.2182,
+      "step": 12800
+    },
+    {
+      "epoch": 3.3,
+      "learning_rate": 2.7325206403033605e-05,
+      "loss": 0.2206,
+      "step": 13000
+    },
+    {
+      "epoch": 3.35,
+      "learning_rate": 2.359192472660235e-05,
+      "loss": 0.2211,
+      "step": 13200
+    },
+    {
+      "epoch": 3.4,
+      "learning_rate": 2.0132148821294626e-05,
+      "loss": 0.22,
+      "step": 13400
+    },
+    {
+      "epoch": 3.45,
+      "learning_rate": 1.691661291092208e-05,
+      "loss": 0.2191,
+      "step": 13600
+    },
+    {
+      "epoch": 3.5,
+      "learning_rate": 1.3968462320313953e-05,
+      "loss": 0.2178,
+      "step": 13800
+    },
+    {
+      "epoch": 3.55,
+      "learning_rate": 1.1292384750457188e-05,
+      "loss": 0.2212,
+      "step": 14000
+    },
+    {
+      "epoch": 3.6,
+      "learning_rate": 8.892635293172929e-06,
+      "loss": 0.2194,
+      "step": 14200
+    },
+    {
+      "epoch": 3.66,
+      "learning_rate": 6.773029665315992e-06,
+      "loss": 0.2195,
+      "step": 14400
+    },
+    {
+      "epoch": 3.71,
+      "learning_rate": 4.936938141602164e-06,
+      "loss": 0.2153,
+      "step": 14600
+    },
+    {
+      "epoch": 3.76,
+      "learning_rate": 3.387280195709328e-06,
+      "loss": 0.2199,
+      "step": 14800
+    },
+    {
+      "epoch": 3.81,
+      "learning_rate": 2.126519858174352e-06,
+      "loss": 0.2191,
+      "step": 15000
+    },
+    {
+      "epoch": 3.86,
+      "learning_rate": 1.1566617984660576e-06,
+      "loss": 0.2208,
+      "step": 15200
+    },
+    {
+      "epoch": 3.91,
+      "learning_rate": 4.792481374646427e-07,
+      "loss": 0.2189,
+      "step": 15400
+    },
+    {
+      "epoch": 3.96,
+      "learning_rate": 9.535599541537485e-08,
+      "loss": 0.2214,
+      "step": 15600
+    },
+    {
+      "epoch": 4.0,
+      "eval_accuracy": 0.8728236161082246,
+      "eval_auc": 0.8142150086545907,
+      "eval_f1": 0.2053073108400613,
+      "eval_loss": 0.4466347098350525,
+      "eval_mcc": 0.26601389088241206,
+      "eval_precision": 0.11885866956163944,
+      "eval_recall": 0.7529321975434273,
+      "eval_runtime": 1151.0693,
+      "eval_samples_per_second": 110.898,
+      "eval_steps_per_second": 1.733,
+      "step": 15756
+    }
+  ],
+  "logging_steps": 200,
+  "max_steps": 15756,
+  "num_train_epochs": 4,
+  "save_steps": 500,
+  "total_flos": 8.101511122124378e+16,
+  "trial_name": null,
+  "trial_params": null
+}

esm2_t6_8M_qlora_binding_sites_2023-09-28_00-05-45/checkpoint-15756/training_args.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:21e29ca655570a4c93caaae2152a14df90626498f407241f0d253a3640c7a8ce
+size 4155

esm2_t6_8M_qlora_binding_sites_2023-09-28_00-05-45/checkpoint-15756/vocab.txt ADDED Viewed

	@@ -0,0 +1,33 @@

+<cls>
+<pad>
+<eos>
+<unk>
+L
+A
+G
+V
+S
+E
+R
+T
+I
+D
+P
+K
+Q
+N
+F
+Y
+M
+H
+W
+C
+X
+B
+U
+Z
+O
+.
+-
+<null_1>
+<mask>

esm2_t6_8M_qlora_binding_sites_2023-09-28_00-05-45/checkpoint-3939/README.md ADDED Viewed

	@@ -0,0 +1,21 @@

+---
+library_name: peft
+---
+## Training procedure
+The following `bitsandbytes` quantization config was used during training:
+- quant_method: bitsandbytes
+- load_in_8bit: False
+- load_in_4bit: True
+- llm_int8_threshold: 6.0
+- llm_int8_skip_modules: None
+- llm_int8_enable_fp32_cpu_offload: False
+- llm_int8_has_fp16_weight: False
+- bnb_4bit_quant_type: nf4
+- bnb_4bit_use_double_quant: True
+- bnb_4bit_compute_dtype: bfloat16
+### Framework versions
+- PEFT 0.6.0.dev0

esm2_t6_8M_qlora_binding_sites_2023-09-28_00-05-45/checkpoint-3939/adapter_config.json ADDED Viewed

	@@ -0,0 +1,26 @@

+{
+  "alpha_pattern": {},
+  "auto_mapping": null,
+  "base_model_name_or_path": "facebook/esm2_t6_8M_UR50D",
+  "bias": "none",
+  "fan_in_fan_out": false,
+  "inference_mode": true,
+  "init_lora_weights": true,
+  "layers_pattern": null,
+  "layers_to_transform": null,
+  "lora_alpha": 1,
+  "lora_dropout": 0.5,
+  "modules_to_save": [
+    "classifier"
+  ],
+  "peft_type": "LORA",
+  "r": 2,
+  "rank_pattern": {},
+  "revision": null,
+  "target_modules": [
+    "query",
+    "key",
+    "value"
+  ],
+  "task_type": "TOKEN_CLS"
+}

esm2_t6_8M_qlora_binding_sites_2023-09-28_00-05-45/checkpoint-3939/adapter_model.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:58f0e1345bfe41c5efffdc521d99e708f2403a2bda6bc0dc7f54366b7e83c583
+size 108323

esm2_t6_8M_qlora_binding_sites_2023-09-28_00-05-45/checkpoint-3939/added_tokens.json ADDED Viewed

	@@ -0,0 +1,7 @@

+{
+  "<cls>": 0,
+  "<eos>": 2,
+  "<mask>": 32,
+  "<pad>": 1,
+  "<unk>": 3
+}

esm2_t6_8M_qlora_binding_sites_2023-09-28_00-05-45/checkpoint-3939/optimizer.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:5667c0e66802b9aeb1d3905ba5b9d7744b3b18a6fa4588c3ee4a32c87d175357
+size 211805

esm2_t6_8M_qlora_binding_sites_2023-09-28_00-05-45/checkpoint-3939/rng_state.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:dda48e7f13921baa764c07484621328651515c0c8ccfdfb93f93ae7e61fae19f
+size 14575

esm2_t6_8M_qlora_binding_sites_2023-09-28_00-05-45/checkpoint-3939/scheduler.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:1ca35a022c60477fa8e7993efcd1e5fb3018c98742658e53d75e6554387a88dd
+size 627

esm2_t6_8M_qlora_binding_sites_2023-09-28_00-05-45/checkpoint-3939/special_tokens_map.json ADDED Viewed

	@@ -0,0 +1,7 @@

+{
+  "cls_token": "<cls>",
+  "eos_token": "<eos>",
+  "mask_token": "<mask>",
+  "pad_token": "<pad>",
+  "unk_token": "<unk>"
+}

esm2_t6_8M_qlora_binding_sites_2023-09-28_00-05-45/checkpoint-3939/tokenizer_config.json ADDED Viewed

	@@ -0,0 +1,54 @@

+{
+  "added_tokens_decoder": {
+    "0": {
+      "content": "<cls>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "1": {
+      "content": "<pad>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "2": {
+      "content": "<eos>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "3": {
+      "content": "<unk>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "32": {
+      "content": "<mask>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    }
+  },
+  "additional_special_tokens": [],
+  "clean_up_tokenization_spaces": true,
+  "cls_token": "<cls>",
+  "eos_token": "<eos>",
+  "mask_token": "<mask>",
+  "model_max_length": 1024,
+  "pad_token": "<pad>",
+  "tokenizer_class": "EsmTokenizer",
+  "tokenizer_file": null,
+  "unk_token": "<unk>"
+}

esm2_t6_8M_qlora_binding_sites_2023-09-28_00-05-45/checkpoint-3939/trainer_state.json ADDED Viewed

	@@ -0,0 +1,147 @@

+{
+  "best_metric": 0.1931125248049425,
+  "best_model_checkpoint": "esm2_t6_8M_qlora_binding_sites_2023-09-28_00-05-45/checkpoint-3939",
+  "epoch": 1.0,
+  "eval_steps": 500,
+  "global_step": 3939,
+  "is_hyper_param_search": false,
+  "is_local_process_zero": true,
+  "is_world_process_zero": true,
+  "log_history": [
+    {
+      "epoch": 0.05,
+      "learning_rate": 0.0003700096638060586,
+      "loss": 0.4987,
+      "step": 200
+    },
+    {
+      "epoch": 0.1,
+      "learning_rate": 0.0003695684724487918,
+      "loss": 0.3756,
+      "step": 400
+    },
+    {
+      "epoch": 0.15,
+      "learning_rate": 0.00036883393302294926,
+      "loss": 0.3422,
+      "step": 600
+    },
+    {
+      "epoch": 0.2,
+      "learning_rate": 0.0003678072134814851,
+      "loss": 0.3223,
+      "step": 800
+    },
+    {
+      "epoch": 0.25,
+      "learning_rate": 0.0003664899463577655,
+      "loss": 0.3094,
+      "step": 1000
+    },
+    {
+      "epoch": 0.3,
+      "learning_rate": 0.00036488422616976233,
+      "loss": 0.3001,
+      "step": 1200
+    },
+    {
+      "epoch": 0.36,
+      "learning_rate": 0.0003629926060896693,
+      "loss": 0.2916,
+      "step": 1400
+    },
+    {
+      "epoch": 0.41,
+      "learning_rate": 0.00036081809388423475,
+      "loss": 0.2847,
+      "step": 1600
+    },
+    {
+      "epoch": 0.46,
+      "learning_rate": 0.0003583641471322691,
+      "loss": 0.2787,
+      "step": 1800
+    },
+    {
+      "epoch": 0.51,
+      "learning_rate": 0.00035563466772692797,
+      "loss": 0.2725,
+      "step": 2000
+    },
+    {
+      "epoch": 0.56,
+      "learning_rate": 0.0003526339956715147,
+      "loss": 0.2699,
+      "step": 2200
+    },
+    {
+      "epoch": 0.61,
+      "learning_rate": 0.00034936690217866705,
+      "loss": 0.2668,
+      "step": 2400
+    },
+    {
+      "epoch": 0.66,
+      "learning_rate": 0.00034583858208389975,
+      "loss": 0.2636,
+      "step": 2600
+    },
+    {
+      "epoch": 0.71,
+      "learning_rate": 0.0003420546455855667,
+      "loss": 0.2604,
+      "step": 2800
+    },
+    {
+      "epoch": 0.76,
+      "learning_rate": 0.00033802110932437625,
+      "loss": 0.2577,
+      "step": 3000
+    },
+    {
+      "epoch": 0.81,
+      "learning_rate": 0.0003337443868166437,
+      "loss": 0.2545,
+      "step": 3200
+    },
+    {
+      "epoch": 0.86,
+      "learning_rate": 0.00032923127825649205,
+      "loss": 0.2515,
+      "step": 3400
+    },
+    {
+      "epoch": 0.91,
+      "learning_rate": 0.00032448895970321745,
+      "loss": 0.2518,
+      "step": 3600
+    },
+    {
+      "epoch": 0.96,
+      "learning_rate": 0.0003195503301009428,
+      "loss": 0.2465,
+      "step": 3800
+    },
+    {
+      "epoch": 1.0,
+      "eval_accuracy": 0.8584993872301376,
+      "eval_auc": 0.8182032038033911,
+      "eval_f1": 0.1931125248049425,
+      "eval_loss": 0.4206424355506897,
+      "eval_mcc": 0.25789003640920655,
+      "eval_precision": 0.11027656492418843,
+      "eval_recall": 0.7760683791635847,
+      "eval_runtime": 1158.8552,
+      "eval_samples_per_second": 110.153,
+      "eval_steps_per_second": 1.722,
+      "step": 3939
+    }
+  ],
+  "logging_steps": 200,
+  "max_steps": 15756,
+  "num_train_epochs": 4,
+  "save_steps": 500,
+  "total_flos": 2.025377780531094e+16,
+  "trial_name": null,
+  "trial_params": null
+}

esm2_t6_8M_qlora_binding_sites_2023-09-28_00-05-45/checkpoint-3939/training_args.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:21e29ca655570a4c93caaae2152a14df90626498f407241f0d253a3640c7a8ce
+size 4155

esm2_t6_8M_qlora_binding_sites_2023-09-28_00-05-45/checkpoint-3939/vocab.txt ADDED Viewed

	@@ -0,0 +1,33 @@

+<cls>
+<pad>
+<eos>
+<unk>
+L
+A
+G
+V
+S
+E
+R
+T
+I
+D
+P
+K
+Q
+N
+F
+Y
+M
+H
+W
+C
+X
+B
+U
+Z
+O
+.
+-
+<null_1>
+<mask>

esm2_t6_8M_qlora_binding_sites_2023-09-28_00-05-45/checkpoint-7878/README.md ADDED Viewed

	@@ -0,0 +1,21 @@

+---
+library_name: peft
+---
+## Training procedure
+The following `bitsandbytes` quantization config was used during training:
+- quant_method: bitsandbytes
+- load_in_8bit: False
+- load_in_4bit: True
+- llm_int8_threshold: 6.0
+- llm_int8_skip_modules: None
+- llm_int8_enable_fp32_cpu_offload: False
+- llm_int8_has_fp16_weight: False
+- bnb_4bit_quant_type: nf4
+- bnb_4bit_use_double_quant: True
+- bnb_4bit_compute_dtype: bfloat16
+### Framework versions
+- PEFT 0.6.0.dev0

esm2_t6_8M_qlora_binding_sites_2023-09-28_00-05-45/checkpoint-7878/adapter_config.json ADDED Viewed

	@@ -0,0 +1,26 @@

+{
+  "alpha_pattern": {},
+  "auto_mapping": null,
+  "base_model_name_or_path": "facebook/esm2_t6_8M_UR50D",
+  "bias": "none",
+  "fan_in_fan_out": false,
+  "inference_mode": true,
+  "init_lora_weights": true,
+  "layers_pattern": null,
+  "layers_to_transform": null,
+  "lora_alpha": 1,
+  "lora_dropout": 0.5,
+  "modules_to_save": [
+    "classifier"
+  ],
+  "peft_type": "LORA",
+  "r": 2,
+  "rank_pattern": {},
+  "revision": null,
+  "target_modules": [
+    "query",
+    "key",
+    "value"
+  ],
+  "task_type": "TOKEN_CLS"
+}

esm2_t6_8M_qlora_binding_sites_2023-09-28_00-05-45/checkpoint-7878/adapter_model.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:46cf5fda038695acb6e2984cf4f53d4538084b803b547514f0d1116818a239d4
+size 108323

esm2_t6_8M_qlora_binding_sites_2023-09-28_00-05-45/checkpoint-7878/added_tokens.json ADDED Viewed

	@@ -0,0 +1,7 @@

+{
+  "<cls>": 0,
+  "<eos>": 2,
+  "<mask>": 32,
+  "<pad>": 1,
+  "<unk>": 3
+}

esm2_t6_8M_qlora_binding_sites_2023-09-28_00-05-45/checkpoint-7878/optimizer.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:8e84b07be31e0a5c5b01c1af139af70b47871b2b3307d6b701dbceafd3d65b2f
+size 211805

esm2_t6_8M_qlora_binding_sites_2023-09-28_00-05-45/checkpoint-7878/rng_state.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:f4749862068cb738e8ae2866b01be18899de3c0c66608f4b02e33b522b0c2ac7
+size 14575

esm2_t6_8M_qlora_binding_sites_2023-09-28_00-05-45/checkpoint-7878/scheduler.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:1ee80568c48d9c580fd7750f89963a598159ebb4c182b6e39f1bf7f626966ded
+size 627

esm2_t6_8M_qlora_binding_sites_2023-09-28_00-05-45/checkpoint-7878/special_tokens_map.json ADDED Viewed

	@@ -0,0 +1,7 @@

+{
+  "cls_token": "<cls>",
+  "eos_token": "<eos>",
+  "mask_token": "<mask>",
+  "pad_token": "<pad>",
+  "unk_token": "<unk>"
+}

esm2_t6_8M_qlora_binding_sites_2023-09-28_00-05-45/checkpoint-7878/tokenizer_config.json ADDED Viewed

	@@ -0,0 +1,54 @@

+{
+  "added_tokens_decoder": {
+    "0": {
+      "content": "<cls>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "1": {
+      "content": "<pad>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "2": {
+      "content": "<eos>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "3": {
+      "content": "<unk>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "32": {
+      "content": "<mask>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    }
+  },
+  "additional_special_tokens": [],
+  "clean_up_tokenization_spaces": true,
+  "cls_token": "<cls>",
+  "eos_token": "<eos>",
+  "mask_token": "<mask>",
+  "model_max_length": 1024,
+  "pad_token": "<pad>",
+  "tokenizer_class": "EsmTokenizer",
+  "tokenizer_file": null,
+  "unk_token": "<unk>"
+}

esm2_t6_8M_qlora_binding_sites_2023-09-28_00-05-45/checkpoint-7878/trainer_state.json ADDED Viewed

	@@ -0,0 +1,281 @@

+{
+  "best_metric": 0.20658952998649033,
+  "best_model_checkpoint": "esm2_t6_8M_qlora_binding_sites_2023-09-28_00-05-45/checkpoint-7878",
+  "epoch": 2.0,
+  "eval_steps": 500,
+  "global_step": 7878,
+  "is_hyper_param_search": false,
+  "is_local_process_zero": true,
+  "is_world_process_zero": true,
+  "log_history": [
+    {
+      "epoch": 0.05,
+      "learning_rate": 0.0003700096638060586,
+      "loss": 0.4987,
+      "step": 200
+    },
+    {
+      "epoch": 0.1,
+      "learning_rate": 0.0003695684724487918,
+      "loss": 0.3756,
+      "step": 400
+    },
+    {
+      "epoch": 0.15,
+      "learning_rate": 0.00036883393302294926,
+      "loss": 0.3422,
+      "step": 600
+    },
+    {
+      "epoch": 0.2,
+      "learning_rate": 0.0003678072134814851,
+      "loss": 0.3223,
+      "step": 800
+    },
+    {
+      "epoch": 0.25,
+      "learning_rate": 0.0003664899463577655,
+      "loss": 0.3094,
+      "step": 1000
+    },
+    {
+      "epoch": 0.3,
+      "learning_rate": 0.00036488422616976233,
+      "loss": 0.3001,
+      "step": 1200
+    },
+    {
+      "epoch": 0.36,
+      "learning_rate": 0.0003629926060896693,
+      "loss": 0.2916,
+      "step": 1400
+    },
+    {
+      "epoch": 0.41,
+      "learning_rate": 0.00036081809388423475,
+      "loss": 0.2847,
+      "step": 1600
+    },
+    {
+      "epoch": 0.46,
+      "learning_rate": 0.0003583641471322691,
+      "loss": 0.2787,
+      "step": 1800
+    },
+    {
+      "epoch": 0.51,
+      "learning_rate": 0.00035563466772692797,
+      "loss": 0.2725,
+      "step": 2000
+    },
+    {
+      "epoch": 0.56,
+      "learning_rate": 0.0003526339956715147,
+      "loss": 0.2699,
+      "step": 2200
+    },
+    {
+      "epoch": 0.61,
+      "learning_rate": 0.00034936690217866705,
+      "loss": 0.2668,
+      "step": 2400
+    },
+    {
+      "epoch": 0.66,
+      "learning_rate": 0.00034583858208389975,
+      "loss": 0.2636,
+      "step": 2600
+    },
+    {
+      "epoch": 0.71,
+      "learning_rate": 0.0003420546455855667,
+      "loss": 0.2604,
+      "step": 2800
+    },
+    {
+      "epoch": 0.76,
+      "learning_rate": 0.00033802110932437625,
+      "loss": 0.2577,
+      "step": 3000
+    },
+    {
+      "epoch": 0.81,
+      "learning_rate": 0.0003337443868166437,
+      "loss": 0.2545,
+      "step": 3200
+    },
+    {
+      "epoch": 0.86,
+      "learning_rate": 0.00032923127825649205,
+      "loss": 0.2515,
+      "step": 3400
+    },
+    {
+      "epoch": 0.91,
+      "learning_rate": 0.00032448895970321745,
+      "loss": 0.2518,
+      "step": 3600
+    },
+    {
+      "epoch": 0.96,
+      "learning_rate": 0.0003195503301009428,
+      "loss": 0.2465,
+      "step": 3800
+    },
+    {
+      "epoch": 1.0,
+      "eval_accuracy": 0.8584993872301376,
+      "eval_auc": 0.8182032038033911,
+      "eval_f1": 0.1931125248049425,
+      "eval_loss": 0.4206424355506897,
+      "eval_mcc": 0.25789003640920655,
+      "eval_precision": 0.11027656492418843,
+      "eval_recall": 0.7760683791635847,
+      "eval_runtime": 1158.8552,
+      "eval_samples_per_second": 110.153,
+      "eval_steps_per_second": 1.722,
+      "step": 3939
+    },
+    {
+      "epoch": 1.02,
+      "learning_rate": 0.0003143736142501833,
+      "loss": 0.2489,
+      "step": 4000
+    },
+    {
+      "epoch": 1.07,
+      "learning_rate": 0.0003089913128054233,
+      "loss": 0.244,
+      "step": 4200
+    },
+    {
+      "epoch": 1.12,
+      "learning_rate": 0.0003034119838843777,
+      "loss": 0.2417,
+      "step": 4400
+    },
+    {
+      "epoch": 1.17,
+      "learning_rate": 0.00029764449888790783,
+      "loss": 0.243,
+      "step": 4600
+    },
+    {
+      "epoch": 1.22,
+      "learning_rate": 0.0002916980283940693,
+      "loss": 0.2387,
+      "step": 4800
+    },
+    {
+      "epoch": 1.27,
+      "learning_rate": 0.00028558202757645164,
+      "loss": 0.2384,
+      "step": 5000
+    },
+    {
+      "epoch": 1.32,
+      "learning_rate": 0.0002793062211699992,
+      "loss": 0.2369,
+      "step": 5200
+    },
+    {
+      "epoch": 1.37,
+      "learning_rate": 0.0002728805880082148,
+      "loss": 0.2378,
+      "step": 5400
+    },
+    {
+      "epoch": 1.42,
+      "learning_rate": 0.00026631534515633606,
+      "loss": 0.2344,
+      "step": 5600
+    },
+    {
+      "epoch": 1.47,
+      "learning_rate": 0.0002596209316657108,
+      "loss": 0.2355,
+      "step": 5800
+    },
+    {
+      "epoch": 1.52,
+      "learning_rate": 0.00025280799197520415,
+      "loss": 0.2336,
+      "step": 6000
+    },
+    {
+      "epoch": 1.57,
+      "learning_rate": 0.0002458873589860299,
+      "loss": 0.2308,
+      "step": 6200
+    },
+    {
+      "epoch": 1.62,
+      "learning_rate": 0.00023887003683691727,
+      "loss": 0.2336,
+      "step": 6400
+    },
+    {
+      "epoch": 1.68,
+      "learning_rate": 0.00023176718340700212,
+      "loss": 0.2323,
+      "step": 6600
+    },
+    {
+      "epoch": 1.73,
+      "learning_rate": 0.00022462614386106907,
+      "loss": 0.2313,
+      "step": 6800
+    },
+    {
+      "epoch": 1.78,
+      "learning_rate": 0.00021738651311196128,
+      "loss": 0.231,
+      "step": 7000
+    },
+    {
+      "epoch": 1.83,
+      "learning_rate": 0.00021009551091624989,
+      "loss": 0.2299,
+      "step": 7200
+    },
+    {
+      "epoch": 1.88,
+      "learning_rate": 0.0002027647303174849,
+      "loss": 0.2289,
+      "step": 7400
+    },
+    {
+      "epoch": 1.93,
+      "learning_rate": 0.00019540582760878698,
+      "loss": 0.229,
+      "step": 7600
+    },
+    {
+      "epoch": 1.98,
+      "learning_rate": 0.00018803050379878183,
+      "loss": 0.229,
+      "step": 7800
+    },
+    {
+      "epoch": 2.0,
+      "eval_accuracy": 0.8743961636075187,
+      "eval_auc": 0.8133290603995718,
+      "eval_f1": 0.20658952998649033,
+      "eval_loss": 0.44484642148017883,
+      "eval_mcc": 0.26666675881078966,
+      "eval_precision": 0.11980687472936644,
+      "eval_recall": 0.749475576865448,
+      "eval_runtime": 1151.9615,
+      "eval_samples_per_second": 110.812,
+      "eval_steps_per_second": 1.732,
+      "step": 7878
+    }
+  ],
+  "logging_steps": 200,
+  "max_steps": 15756,
+  "num_train_epochs": 4,
+  "save_steps": 500,
+  "total_flos": 4.050755561062189e+16,
+  "trial_name": null,
+  "trial_params": null
+}

esm2_t6_8M_qlora_binding_sites_2023-09-28_00-05-45/checkpoint-7878/training_args.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:21e29ca655570a4c93caaae2152a14df90626498f407241f0d253a3640c7a8ce
+size 4155

esm2_t6_8M_qlora_binding_sites_2023-09-28_00-05-45/checkpoint-7878/vocab.txt ADDED Viewed

	@@ -0,0 +1,33 @@

+<cls>
+<pad>
+<eos>
+<unk>
+L
+A
+G
+V
+S
+E
+R
+T
+I
+D
+P
+K
+Q
+N
+F
+Y
+M
+H
+W
+C
+X
+B
+U
+Z
+O
+.
+-
+<null_1>
+<mask>