AmelieSchreiber
/

esm2_t6_8m_qlora_binding_sites_v1

Model card Files Files and versions Community

AmelieSchreiber commited on Sep 29, 2023

Commit

692f69c

1 Parent(s): 32ec1db

Upload 48 files

Browse files

Files changed (48) hide show

esm2_t6_8M_qlora_binding_sites_2023-09-29_03-34-40/checkpoint-11817/README.md +21 -0
esm2_t6_8M_qlora_binding_sites_2023-09-29_03-34-40/checkpoint-11817/adapter_config.json +29 -0
esm2_t6_8M_qlora_binding_sites_2023-09-29_03-34-40/checkpoint-11817/adapter_model.bin +3 -0
esm2_t6_8M_qlora_binding_sites_2023-09-29_03-34-40/checkpoint-11817/added_tokens.json +7 -0
esm2_t6_8M_qlora_binding_sites_2023-09-29_03-34-40/checkpoint-11817/optimizer.pt +3 -0
esm2_t6_8M_qlora_binding_sites_2023-09-29_03-34-40/checkpoint-11817/rng_state.pth +3 -0
esm2_t6_8M_qlora_binding_sites_2023-09-29_03-34-40/checkpoint-11817/scheduler.pt +3 -0
esm2_t6_8M_qlora_binding_sites_2023-09-29_03-34-40/checkpoint-11817/special_tokens_map.json +7 -0
esm2_t6_8M_qlora_binding_sites_2023-09-29_03-34-40/checkpoint-11817/tokenizer_config.json +54 -0
esm2_t6_8M_qlora_binding_sites_2023-09-29_03-34-40/checkpoint-11817/trainer_state.json +415 -0
esm2_t6_8M_qlora_binding_sites_2023-09-29_03-34-40/checkpoint-11817/training_args.bin +3 -0
esm2_t6_8M_qlora_binding_sites_2023-09-29_03-34-40/checkpoint-11817/vocab.txt +33 -0
esm2_t6_8M_qlora_binding_sites_2023-09-29_03-34-40/checkpoint-15756/README.md +21 -0
esm2_t6_8M_qlora_binding_sites_2023-09-29_03-34-40/checkpoint-15756/adapter_config.json +29 -0
esm2_t6_8M_qlora_binding_sites_2023-09-29_03-34-40/checkpoint-15756/adapter_model.bin +3 -0
esm2_t6_8M_qlora_binding_sites_2023-09-29_03-34-40/checkpoint-15756/added_tokens.json +7 -0
esm2_t6_8M_qlora_binding_sites_2023-09-29_03-34-40/checkpoint-15756/optimizer.pt +3 -0
esm2_t6_8M_qlora_binding_sites_2023-09-29_03-34-40/checkpoint-15756/rng_state.pth +3 -0
esm2_t6_8M_qlora_binding_sites_2023-09-29_03-34-40/checkpoint-15756/scheduler.pt +3 -0
esm2_t6_8M_qlora_binding_sites_2023-09-29_03-34-40/checkpoint-15756/special_tokens_map.json +7 -0
esm2_t6_8M_qlora_binding_sites_2023-09-29_03-34-40/checkpoint-15756/tokenizer_config.json +54 -0
esm2_t6_8M_qlora_binding_sites_2023-09-29_03-34-40/checkpoint-15756/trainer_state.json +543 -0
esm2_t6_8M_qlora_binding_sites_2023-09-29_03-34-40/checkpoint-15756/training_args.bin +3 -0
esm2_t6_8M_qlora_binding_sites_2023-09-29_03-34-40/checkpoint-15756/vocab.txt +33 -0
esm2_t6_8M_qlora_binding_sites_2023-09-29_03-34-40/checkpoint-3939/README.md +21 -0
esm2_t6_8M_qlora_binding_sites_2023-09-29_03-34-40/checkpoint-3939/adapter_config.json +29 -0
esm2_t6_8M_qlora_binding_sites_2023-09-29_03-34-40/checkpoint-3939/adapter_model.bin +3 -0
esm2_t6_8M_qlora_binding_sites_2023-09-29_03-34-40/checkpoint-3939/added_tokens.json +7 -0
esm2_t6_8M_qlora_binding_sites_2023-09-29_03-34-40/checkpoint-3939/optimizer.pt +3 -0
esm2_t6_8M_qlora_binding_sites_2023-09-29_03-34-40/checkpoint-3939/rng_state.pth +3 -0
esm2_t6_8M_qlora_binding_sites_2023-09-29_03-34-40/checkpoint-3939/scheduler.pt +3 -0
esm2_t6_8M_qlora_binding_sites_2023-09-29_03-34-40/checkpoint-3939/special_tokens_map.json +7 -0
esm2_t6_8M_qlora_binding_sites_2023-09-29_03-34-40/checkpoint-3939/tokenizer_config.json +54 -0
esm2_t6_8M_qlora_binding_sites_2023-09-29_03-34-40/checkpoint-3939/trainer_state.json +147 -0
esm2_t6_8M_qlora_binding_sites_2023-09-29_03-34-40/checkpoint-3939/training_args.bin +3 -0
esm2_t6_8M_qlora_binding_sites_2023-09-29_03-34-40/checkpoint-3939/vocab.txt +33 -0
esm2_t6_8M_qlora_binding_sites_2023-09-29_03-34-40/checkpoint-7878/README.md +21 -0
esm2_t6_8M_qlora_binding_sites_2023-09-29_03-34-40/checkpoint-7878/adapter_config.json +29 -0
esm2_t6_8M_qlora_binding_sites_2023-09-29_03-34-40/checkpoint-7878/adapter_model.bin +3 -0
esm2_t6_8M_qlora_binding_sites_2023-09-29_03-34-40/checkpoint-7878/added_tokens.json +7 -0
esm2_t6_8M_qlora_binding_sites_2023-09-29_03-34-40/checkpoint-7878/optimizer.pt +3 -0
esm2_t6_8M_qlora_binding_sites_2023-09-29_03-34-40/checkpoint-7878/rng_state.pth +3 -0
esm2_t6_8M_qlora_binding_sites_2023-09-29_03-34-40/checkpoint-7878/scheduler.pt +3 -0
esm2_t6_8M_qlora_binding_sites_2023-09-29_03-34-40/checkpoint-7878/special_tokens_map.json +7 -0
esm2_t6_8M_qlora_binding_sites_2023-09-29_03-34-40/checkpoint-7878/tokenizer_config.json +54 -0
esm2_t6_8M_qlora_binding_sites_2023-09-29_03-34-40/checkpoint-7878/trainer_state.json +281 -0
esm2_t6_8M_qlora_binding_sites_2023-09-29_03-34-40/checkpoint-7878/training_args.bin +3 -0
esm2_t6_8M_qlora_binding_sites_2023-09-29_03-34-40/checkpoint-7878/vocab.txt +33 -0

esm2_t6_8M_qlora_binding_sites_2023-09-29_03-34-40/checkpoint-11817/README.md ADDED Viewed

	@@ -0,0 +1,21 @@

+---
+library_name: peft
+---
+## Training procedure
+The following `bitsandbytes` quantization config was used during training:
+- quant_method: bitsandbytes
+- load_in_8bit: False
+- load_in_4bit: True
+- llm_int8_threshold: 6.0
+- llm_int8_skip_modules: None
+- llm_int8_enable_fp32_cpu_offload: False
+- llm_int8_has_fp16_weight: False
+- bnb_4bit_quant_type: nf4
+- bnb_4bit_use_double_quant: True
+- bnb_4bit_compute_dtype: bfloat16
+### Framework versions
+- PEFT 0.6.0.dev0

esm2_t6_8M_qlora_binding_sites_2023-09-29_03-34-40/checkpoint-11817/adapter_config.json ADDED Viewed

	@@ -0,0 +1,29 @@

+{
+  "alpha_pattern": {},
+  "auto_mapping": null,
+  "base_model_name_or_path": "facebook/esm2_t6_8M_UR50D",
+  "bias": "none",
+  "fan_in_fan_out": false,
+  "inference_mode": true,
+  "init_lora_weights": true,
+  "layers_pattern": null,
+  "layers_to_transform": null,
+  "lora_alpha": 1,
+  "lora_dropout": 0.5,
+  "modules_to_save": null,
+  "peft_type": "LORA",
+  "r": 2,
+  "rank_pattern": {},
+  "revision": null,
+  "target_modules": [
+    "query",
+    "key",
+    "value",
+    "EsmSelfOutput.dense",
+    "EsmIntermediate.dense",
+    "EsmOutput.dense",
+    "EsmContactPredictionHead.regression",
+    "classifier"
+  ],
+  "task_type": "TOKEN_CLS"
+}

esm2_t6_8M_qlora_binding_sites_2023-09-29_03-34-40/checkpoint-11817/adapter_model.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:a3e861c1a99b016ce76e69794f42346cccbdc6bf95658b3c3bc4d3cf0b8b999c
+size 114991

esm2_t6_8M_qlora_binding_sites_2023-09-29_03-34-40/checkpoint-11817/added_tokens.json ADDED Viewed

	@@ -0,0 +1,7 @@

+{
+  "<cls>": 0,
+  "<eos>": 2,
+  "<mask>": 32,
+  "<pad>": 1,
+  "<unk>": 3
+}

esm2_t6_8M_qlora_binding_sites_2023-09-29_03-34-40/checkpoint-11817/optimizer.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:84927c18255420a7ed70e70a5f7bf68e48b1a0b356f64c733677a7eeb9ad36c5
+size 218073

esm2_t6_8M_qlora_binding_sites_2023-09-29_03-34-40/checkpoint-11817/rng_state.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:baa211bb85c9638f95b353de5eefb72e14175247f5be85ccfed47b88c3f91a13
+size 14575

esm2_t6_8M_qlora_binding_sites_2023-09-29_03-34-40/checkpoint-11817/scheduler.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:d3676a61e287c72a94f887301dbd12aad47cd3033c71e16308c1190c5c28aecd
+size 627

esm2_t6_8M_qlora_binding_sites_2023-09-29_03-34-40/checkpoint-11817/special_tokens_map.json ADDED Viewed

	@@ -0,0 +1,7 @@

+{
+  "cls_token": "<cls>",
+  "eos_token": "<eos>",
+  "mask_token": "<mask>",
+  "pad_token": "<pad>",
+  "unk_token": "<unk>"
+}

esm2_t6_8M_qlora_binding_sites_2023-09-29_03-34-40/checkpoint-11817/tokenizer_config.json ADDED Viewed

	@@ -0,0 +1,54 @@

+{
+  "added_tokens_decoder": {
+    "0": {
+      "content": "<cls>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "1": {
+      "content": "<pad>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "2": {
+      "content": "<eos>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "3": {
+      "content": "<unk>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "32": {
+      "content": "<mask>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    }
+  },
+  "additional_special_tokens": [],
+  "clean_up_tokenization_spaces": true,
+  "cls_token": "<cls>",
+  "eos_token": "<eos>",
+  "mask_token": "<mask>",
+  "model_max_length": 1024,
+  "pad_token": "<pad>",
+  "tokenizer_class": "EsmTokenizer",
+  "tokenizer_file": null,
+  "unk_token": "<unk>"
+}

esm2_t6_8M_qlora_binding_sites_2023-09-29_03-34-40/checkpoint-11817/trainer_state.json ADDED Viewed

	@@ -0,0 +1,415 @@

+{
+  "best_metric": 0.21386215966220054,
+  "best_model_checkpoint": "esm2_t6_8M_qlora_binding_sites_2023-09-29_03-34-40/checkpoint-7878",
+  "epoch": 3.0,
+  "eval_steps": 500,
+  "global_step": 11817,
+  "is_hyper_param_search": false,
+  "is_local_process_zero": true,
+  "is_world_process_zero": true,
+  "log_history": [
+    {
+      "epoch": 0.05,
+      "learning_rate": 0.0003700096638060586,
+      "loss": 0.5009,
+      "step": 200
+    },
+    {
+      "epoch": 0.1,
+      "learning_rate": 0.0003695684724487918,
+      "loss": 0.3725,
+      "step": 400
+    },
+    {
+      "epoch": 0.15,
+      "learning_rate": 0.00036883393302294926,
+      "loss": 0.3363,
+      "step": 600
+    },
+    {
+      "epoch": 0.2,
+      "learning_rate": 0.0003678072134814851,
+      "loss": 0.3171,
+      "step": 800
+    },
+    {
+      "epoch": 0.25,
+      "learning_rate": 0.0003664899463577655,
+      "loss": 0.3041,
+      "step": 1000
+    },
+    {
+      "epoch": 0.3,
+      "learning_rate": 0.00036488422616976233,
+      "loss": 0.2954,
+      "step": 1200
+    },
+    {
+      "epoch": 0.36,
+      "learning_rate": 0.0003629926060896693,
+      "loss": 0.2872,
+      "step": 1400
+    },
+    {
+      "epoch": 0.41,
+      "learning_rate": 0.00036081809388423475,
+      "loss": 0.2804,
+      "step": 1600
+    },
+    {
+      "epoch": 0.46,
+      "learning_rate": 0.0003583641471322691,
+      "loss": 0.2754,
+      "step": 1800
+    },
+    {
+      "epoch": 0.51,
+      "learning_rate": 0.00035563466772692797,
+      "loss": 0.2696,
+      "step": 2000
+    },
+    {
+      "epoch": 0.56,
+      "learning_rate": 0.0003526339956715147,
+      "loss": 0.2675,
+      "step": 2200
+    },
+    {
+      "epoch": 0.61,
+      "learning_rate": 0.00034936690217866705,
+      "loss": 0.2642,
+      "step": 2400
+    },
+    {
+      "epoch": 0.66,
+      "learning_rate": 0.00034583858208389975,
+      "loss": 0.262,
+      "step": 2600
+    },
+    {
+      "epoch": 0.71,
+      "learning_rate": 0.0003420546455855667,
+      "loss": 0.2592,
+      "step": 2800
+    },
+    {
+      "epoch": 0.76,
+      "learning_rate": 0.00033802110932437625,
+      "loss": 0.2565,
+      "step": 3000
+    },
+    {
+      "epoch": 0.81,
+      "learning_rate": 0.0003337443868166437,
+      "loss": 0.2542,
+      "step": 3200
+    },
+    {
+      "epoch": 0.86,
+      "learning_rate": 0.00032923127825649205,
+      "loss": 0.2509,
+      "step": 3400
+    },
+    {
+      "epoch": 0.91,
+      "learning_rate": 0.00032448895970321745,
+      "loss": 0.2509,
+      "step": 3600
+    },
+    {
+      "epoch": 0.96,
+      "learning_rate": 0.0003195249716710097,
+      "loss": 0.2464,
+      "step": 3800
+    },
+    {
+      "epoch": 1.0,
+      "eval_accuracy": 0.8625347674451358,
+      "eval_auc": 0.8222331548742136,
+      "eval_f1": 0.19848246486644372,
+      "eval_loss": 0.41490185260772705,
+      "eval_mcc": 0.2639007297474409,
+      "eval_precision": 0.11370668247419904,
+      "eval_recall": 0.7800926533683039,
+      "eval_runtime": 1163.712,
+      "eval_samples_per_second": 109.693,
+      "eval_steps_per_second": 1.714,
+      "step": 3939
+    },
+    {
+      "epoch": 1.02,
+      "learning_rate": 0.00031434720713917336,
+      "loss": 0.2484,
+      "step": 4000
+    },
+    {
+      "epoch": 1.07,
+      "learning_rate": 0.0003089913128054233,
+      "loss": 0.2437,
+      "step": 4200
+    },
+    {
+      "epoch": 1.12,
+      "learning_rate": 0.0003034119838843777,
+      "loss": 0.242,
+      "step": 4400
+    },
+    {
+      "epoch": 1.17,
+      "learning_rate": 0.00029764449888790783,
+      "loss": 0.2423,
+      "step": 4600
+    },
+    {
+      "epoch": 1.22,
+      "learning_rate": 0.0002916980283940693,
+      "loss": 0.2387,
+      "step": 4800
+    },
+    {
+      "epoch": 1.27,
+      "learning_rate": 0.00028558202757645164,
+      "loss": 0.239,
+      "step": 5000
+    },
+    {
+      "epoch": 1.32,
+      "learning_rate": 0.0002793062211699992,
+      "loss": 0.2376,
+      "step": 5200
+    },
+    {
+      "epoch": 1.37,
+      "learning_rate": 0.0002728805880082148,
+      "loss": 0.2384,
+      "step": 5400
+    },
+    {
+      "epoch": 1.42,
+      "learning_rate": 0.00026631534515633606,
+      "loss": 0.2355,
+      "step": 5600
+    },
+    {
+      "epoch": 1.47,
+      "learning_rate": 0.0002596209316657108,
+      "loss": 0.2352,
+      "step": 5800
+    },
+    {
+      "epoch": 1.52,
+      "learning_rate": 0.00025280799197520415,
+      "loss": 0.2343,
+      "step": 6000
+    },
+    {
+      "epoch": 1.57,
+      "learning_rate": 0.0002458873589860299,
+      "loss": 0.231,
+      "step": 6200
+    },
+    {
+      "epoch": 1.62,
+      "learning_rate": 0.00023890534556422294,
+      "loss": 0.2339,
+      "step": 6400
+    },
+    {
+      "epoch": 1.68,
+      "learning_rate": 0.00023180289180308998,
+      "loss": 0.2332,
+      "step": 6600
+    },
+    {
+      "epoch": 1.73,
+      "learning_rate": 0.00022462614386106907,
+      "loss": 0.232,
+      "step": 6800
+    },
+    {
+      "epoch": 1.78,
+      "learning_rate": 0.00021738651311196128,
+      "loss": 0.231,
+      "step": 7000
+    },
+    {
+      "epoch": 1.83,
+      "learning_rate": 0.00021013207456600314,
+      "loss": 0.2305,
+      "step": 7200
+    },
+    {
+      "epoch": 1.88,
+      "learning_rate": 0.00020280146390924225,
+      "loss": 0.2298,
+      "step": 7400
+    },
+    {
+      "epoch": 1.93,
+      "learning_rate": 0.00019544267273437384,
+      "loss": 0.2302,
+      "step": 7600
+    },
+    {
+      "epoch": 1.98,
+      "learning_rate": 0.0001880674018726795,
+      "loss": 0.2295,
+      "step": 7800
+    },
+    {
+      "epoch": 2.0,
+      "eval_accuracy": 0.8789903474277315,
+      "eval_auc": 0.8180827968848764,
+      "eval_f1": 0.21386215966220054,
+      "eval_loss": 0.4392629563808441,
+      "eval_mcc": 0.27446788968929925,
+      "eval_precision": 0.12459111498869992,
+      "eval_recall": 0.7543961461123881,
+      "eval_runtime": 1167.9434,
+      "eval_samples_per_second": 109.296,
+      "eval_steps_per_second": 1.708,
+      "step": 7878
+    },
+    {
+      "epoch": 2.03,
+      "learning_rate": 0.00018068737835893393,
+      "loss": 0.2261,
+      "step": 8000
+    },
+    {
+      "epoch": 2.08,
+      "learning_rate": 0.00017331433678485712,
+      "loss": 0.2277,
+      "step": 8200
+    },
+    {
+      "epoch": 2.13,
+      "learning_rate": 0.00016596000064054934,
+      "loss": 0.2275,
+      "step": 8400
+    },
+    {
+      "epoch": 2.18,
+      "learning_rate": 0.0001586360636735797,
+      "loss": 0.2267,
+      "step": 8600
+    },
+    {
+      "epoch": 2.23,
+      "learning_rate": 0.0001513541712953658,
+      "loss": 0.2243,
+      "step": 8800
+    },
+    {
+      "epoch": 2.28,
+      "learning_rate": 0.00014412590206441025,
+      "loss": 0.2266,
+      "step": 9000
+    },
+    {
+      "epoch": 2.34,
+      "learning_rate": 0.00013696274927583722,
+      "loss": 0.2243,
+      "step": 9200
+    },
+    {
+      "epoch": 2.39,
+      "learning_rate": 0.00012987610268650092,
+      "loss": 0.2253,
+      "step": 9400
+    },
+    {
+      "epoch": 2.44,
+      "learning_rate": 0.00012287723040472557,
+      "loss": 0.2255,
+      "step": 9600
+    },
+    {
+      "epoch": 2.49,
+      "learning_rate": 0.00011597726097347204,
+      "loss": 0.2254,
+      "step": 9800
+    },
+    {
+      "epoch": 2.54,
+      "learning_rate": 0.00010918716567542043,
+      "loss": 0.2241,
+      "step": 10000
+    },
+    {
+      "epoch": 2.59,
+      "learning_rate": 0.0001025177410881037,
+      "loss": 0.223,
+      "step": 10200
+    },
+    {
+      "epoch": 2.64,
+      "learning_rate": 9.597959191683088e-05,
+      "loss": 0.2217,
+      "step": 10400
+    },
+    {
+      "epoch": 2.69,
+      "learning_rate": 8.958311413269684e-05,
+      "loss": 0.222,
+      "step": 10600
+    },
+    {
+      "epoch": 2.74,
+      "learning_rate": 8.333847844248891e-05,
+      "loss": 0.2219,
+      "step": 10800
+    },
+    {
+      "epoch": 2.79,
+      "learning_rate": 7.725561411677462e-05,
+      "loss": 0.2218,
+      "step": 11000
+    },
+    {
+      "epoch": 2.84,
+      "learning_rate": 7.134419320188491e-05,
+      "loss": 0.2233,
+      "step": 11200
+    },
+    {
+      "epoch": 2.89,
+      "learning_rate": 6.564180298866504e-05,
+      "loss": 0.2261,
+      "step": 11400
+    },
+    {
+      "epoch": 2.94,
+      "learning_rate": 6.010020772997792e-05,
+      "loss": 0.2225,
+      "step": 11600
+    },
+    {
+      "epoch": 3.0,
+      "learning_rate": 5.475733380194338e-05,
+      "loss": 0.2176,
+      "step": 11800
+    },
+    {
+      "epoch": 3.0,
+      "eval_accuracy": 0.8735072413749101,
+      "eval_auc": 0.8195797310899098,
+      "eval_f1": 0.20841207680022153,
+      "eval_loss": 0.4386225640773773,
+      "eval_mcc": 0.2707498152735772,
+      "eval_precision": 0.12068424210520438,
+      "eval_recall": 0.7631916070570107,
+      "eval_runtime": 1165.7733,
+      "eval_samples_per_second": 109.499,
+      "eval_steps_per_second": 1.711,
+      "step": 11817
+    }
+  ],
+  "logging_steps": 200,
+  "max_steps": 15756,
+  "num_train_epochs": 4,
+  "save_steps": 500,
+  "total_flos": 6.077187662375136e+16,
+  "trial_name": null,
+  "trial_params": null
+}

esm2_t6_8M_qlora_binding_sites_2023-09-29_03-34-40/checkpoint-11817/training_args.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:19560f827f37de980ef9907eb4a996feaadf6e4f6a723cacbef99fc7a0ba1b25
+size 4155

esm2_t6_8M_qlora_binding_sites_2023-09-29_03-34-40/checkpoint-11817/vocab.txt ADDED Viewed

	@@ -0,0 +1,33 @@

+<cls>
+<pad>
+<eos>
+<unk>
+L
+A
+G
+V
+S
+E
+R
+T
+I
+D
+P
+K
+Q
+N
+F
+Y
+M
+H
+W
+C
+X
+B
+U
+Z
+O
+.
+-
+<null_1>
+<mask>

esm2_t6_8M_qlora_binding_sites_2023-09-29_03-34-40/checkpoint-15756/README.md ADDED Viewed

	@@ -0,0 +1,21 @@

+---
+library_name: peft
+---
+## Training procedure
+The following `bitsandbytes` quantization config was used during training:
+- quant_method: bitsandbytes
+- load_in_8bit: False
+- load_in_4bit: True
+- llm_int8_threshold: 6.0
+- llm_int8_skip_modules: None
+- llm_int8_enable_fp32_cpu_offload: False
+- llm_int8_has_fp16_weight: False
+- bnb_4bit_quant_type: nf4
+- bnb_4bit_use_double_quant: True
+- bnb_4bit_compute_dtype: bfloat16
+### Framework versions
+- PEFT 0.6.0.dev0

esm2_t6_8M_qlora_binding_sites_2023-09-29_03-34-40/checkpoint-15756/adapter_config.json ADDED Viewed

	@@ -0,0 +1,29 @@

+{
+  "alpha_pattern": {},
+  "auto_mapping": null,
+  "base_model_name_or_path": "facebook/esm2_t6_8M_UR50D",
+  "bias": "none",
+  "fan_in_fan_out": false,
+  "inference_mode": true,
+  "init_lora_weights": true,
+  "layers_pattern": null,
+  "layers_to_transform": null,
+  "lora_alpha": 1,
+  "lora_dropout": 0.5,
+  "modules_to_save": null,
+  "peft_type": "LORA",
+  "r": 2,
+  "rank_pattern": {},
+  "revision": null,
+  "target_modules": [
+    "query",
+    "key",
+    "value",
+    "EsmSelfOutput.dense",
+    "EsmIntermediate.dense",
+    "EsmOutput.dense",
+    "EsmContactPredictionHead.regression",
+    "classifier"
+  ],
+  "task_type": "TOKEN_CLS"
+}

esm2_t6_8M_qlora_binding_sites_2023-09-29_03-34-40/checkpoint-15756/adapter_model.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:f3075ce6140607858becdd4528bfbba621d0fe5981ed48db8ecdfdd6ed1679e3
+size 114991

esm2_t6_8M_qlora_binding_sites_2023-09-29_03-34-40/checkpoint-15756/added_tokens.json ADDED Viewed

	@@ -0,0 +1,7 @@

+{
+  "<cls>": 0,
+  "<eos>": 2,
+  "<mask>": 32,
+  "<pad>": 1,
+  "<unk>": 3
+}

esm2_t6_8M_qlora_binding_sites_2023-09-29_03-34-40/checkpoint-15756/optimizer.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:a02b58d7f2080fec37a419183d7fefebe47ae919ad6368dd61a35b4e860a40c0
+size 218073

esm2_t6_8M_qlora_binding_sites_2023-09-29_03-34-40/checkpoint-15756/rng_state.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:f8a9a8ddf2bef1b580758f72457a9be5be71f4dc25e234839bea7418a3d9bc67
+size 14575

esm2_t6_8M_qlora_binding_sites_2023-09-29_03-34-40/checkpoint-15756/scheduler.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:86ab8ca8d941f7a9dc0e1bfb3c414eb3afc0b3e1513ea8a7ce0db94586cd403d
+size 627

esm2_t6_8M_qlora_binding_sites_2023-09-29_03-34-40/checkpoint-15756/special_tokens_map.json ADDED Viewed

	@@ -0,0 +1,7 @@

+{
+  "cls_token": "<cls>",
+  "eos_token": "<eos>",
+  "mask_token": "<mask>",
+  "pad_token": "<pad>",
+  "unk_token": "<unk>"
+}

esm2_t6_8M_qlora_binding_sites_2023-09-29_03-34-40/checkpoint-15756/tokenizer_config.json ADDED Viewed

	@@ -0,0 +1,54 @@

+{
+  "added_tokens_decoder": {
+    "0": {
+      "content": "<cls>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "1": {
+      "content": "<pad>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "2": {
+      "content": "<eos>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "3": {
+      "content": "<unk>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "32": {
+      "content": "<mask>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    }
+  },
+  "additional_special_tokens": [],
+  "clean_up_tokenization_spaces": true,
+  "cls_token": "<cls>",
+  "eos_token": "<eos>",
+  "mask_token": "<mask>",
+  "model_max_length": 1024,
+  "pad_token": "<pad>",
+  "tokenizer_class": "EsmTokenizer",
+  "tokenizer_file": null,
+  "unk_token": "<unk>"
+}

esm2_t6_8M_qlora_binding_sites_2023-09-29_03-34-40/checkpoint-15756/trainer_state.json ADDED Viewed

	@@ -0,0 +1,543 @@

+{
+  "best_metric": 0.21386215966220054,
+  "best_model_checkpoint": "esm2_t6_8M_qlora_binding_sites_2023-09-29_03-34-40/checkpoint-7878",
+  "epoch": 4.0,
+  "eval_steps": 500,
+  "global_step": 15756,
+  "is_hyper_param_search": false,
+  "is_local_process_zero": true,
+  "is_world_process_zero": true,
+  "log_history": [
+    {
+      "epoch": 0.05,
+      "learning_rate": 0.0003700096638060586,
+      "loss": 0.5009,
+      "step": 200
+    },
+    {
+      "epoch": 0.1,
+      "learning_rate": 0.0003695684724487918,
+      "loss": 0.3725,
+      "step": 400
+    },
+    {
+      "epoch": 0.15,
+      "learning_rate": 0.00036883393302294926,
+      "loss": 0.3363,
+      "step": 600
+    },
+    {
+      "epoch": 0.2,
+      "learning_rate": 0.0003678072134814851,
+      "loss": 0.3171,
+      "step": 800
+    },
+    {
+      "epoch": 0.25,
+      "learning_rate": 0.0003664899463577655,
+      "loss": 0.3041,
+      "step": 1000
+    },
+    {
+      "epoch": 0.3,
+      "learning_rate": 0.00036488422616976233,
+      "loss": 0.2954,
+      "step": 1200
+    },
+    {
+      "epoch": 0.36,
+      "learning_rate": 0.0003629926060896693,
+      "loss": 0.2872,
+      "step": 1400
+    },
+    {
+      "epoch": 0.41,
+      "learning_rate": 0.00036081809388423475,
+      "loss": 0.2804,
+      "step": 1600
+    },
+    {
+      "epoch": 0.46,
+      "learning_rate": 0.0003583641471322691,
+      "loss": 0.2754,
+      "step": 1800
+    },
+    {
+      "epoch": 0.51,
+      "learning_rate": 0.00035563466772692797,
+      "loss": 0.2696,
+      "step": 2000
+    },
+    {
+      "epoch": 0.56,
+      "learning_rate": 0.0003526339956715147,
+      "loss": 0.2675,
+      "step": 2200
+    },
+    {
+      "epoch": 0.61,
+      "learning_rate": 0.00034936690217866705,
+      "loss": 0.2642,
+      "step": 2400
+    },
+    {
+      "epoch": 0.66,
+      "learning_rate": 0.00034583858208389975,
+      "loss": 0.262,
+      "step": 2600
+    },
+    {
+      "epoch": 0.71,
+      "learning_rate": 0.0003420546455855667,
+      "loss": 0.2592,
+      "step": 2800
+    },
+    {
+      "epoch": 0.76,
+      "learning_rate": 0.00033802110932437625,
+      "loss": 0.2565,
+      "step": 3000
+    },
+    {
+      "epoch": 0.81,
+      "learning_rate": 0.0003337443868166437,
+      "loss": 0.2542,
+      "step": 3200
+    },
+    {
+      "epoch": 0.86,
+      "learning_rate": 0.00032923127825649205,
+      "loss": 0.2509,
+      "step": 3400
+    },
+    {
+      "epoch": 0.91,
+      "learning_rate": 0.00032448895970321745,
+      "loss": 0.2509,
+      "step": 3600
+    },
+    {
+      "epoch": 0.96,
+      "learning_rate": 0.0003195249716710097,
+      "loss": 0.2464,
+      "step": 3800
+    },
+    {
+      "epoch": 1.0,
+      "eval_accuracy": 0.8625347674451358,
+      "eval_auc": 0.8222331548742136,
+      "eval_f1": 0.19848246486644372,
+      "eval_loss": 0.41490185260772705,
+      "eval_mcc": 0.2639007297474409,
+      "eval_precision": 0.11370668247419904,
+      "eval_recall": 0.7800926533683039,
+      "eval_runtime": 1163.712,
+      "eval_samples_per_second": 109.693,
+      "eval_steps_per_second": 1.714,
+      "step": 3939
+    },
+    {
+      "epoch": 1.02,
+      "learning_rate": 0.00031434720713917336,
+      "loss": 0.2484,
+      "step": 4000
+    },
+    {
+      "epoch": 1.07,
+      "learning_rate": 0.0003089913128054233,
+      "loss": 0.2437,
+      "step": 4200
+    },
+    {
+      "epoch": 1.12,
+      "learning_rate": 0.0003034119838843777,
+      "loss": 0.242,
+      "step": 4400
+    },
+    {
+      "epoch": 1.17,
+      "learning_rate": 0.00029764449888790783,
+      "loss": 0.2423,
+      "step": 4600
+    },
+    {
+      "epoch": 1.22,
+      "learning_rate": 0.0002916980283940693,
+      "loss": 0.2387,
+      "step": 4800
+    },
+    {
+      "epoch": 1.27,
+      "learning_rate": 0.00028558202757645164,
+      "loss": 0.239,
+      "step": 5000
+    },
+    {
+      "epoch": 1.32,
+      "learning_rate": 0.0002793062211699992,
+      "loss": 0.2376,
+      "step": 5200
+    },
+    {
+      "epoch": 1.37,
+      "learning_rate": 0.0002728805880082148,
+      "loss": 0.2384,
+      "step": 5400
+    },
+    {
+      "epoch": 1.42,
+      "learning_rate": 0.00026631534515633606,
+      "loss": 0.2355,
+      "step": 5600
+    },
+    {
+      "epoch": 1.47,
+      "learning_rate": 0.0002596209316657108,
+      "loss": 0.2352,
+      "step": 5800
+    },
+    {
+      "epoch": 1.52,
+      "learning_rate": 0.00025280799197520415,
+      "loss": 0.2343,
+      "step": 6000
+    },
+    {
+      "epoch": 1.57,
+      "learning_rate": 0.0002458873589860299,
+      "loss": 0.231,
+      "step": 6200
+    },
+    {
+      "epoch": 1.62,
+      "learning_rate": 0.00023890534556422294,
+      "loss": 0.2339,
+      "step": 6400
+    },
+    {
+      "epoch": 1.68,
+      "learning_rate": 0.00023180289180308998,
+      "loss": 0.2332,
+      "step": 6600
+    },
+    {
+      "epoch": 1.73,
+      "learning_rate": 0.00022462614386106907,
+      "loss": 0.232,
+      "step": 6800
+    },
+    {
+      "epoch": 1.78,
+      "learning_rate": 0.00021738651311196128,
+      "loss": 0.231,
+      "step": 7000
+    },
+    {
+      "epoch": 1.83,
+      "learning_rate": 0.00021013207456600314,
+      "loss": 0.2305,
+      "step": 7200
+    },
+    {
+      "epoch": 1.88,
+      "learning_rate": 0.00020280146390924225,
+      "loss": 0.2298,
+      "step": 7400
+    },
+    {
+      "epoch": 1.93,
+      "learning_rate": 0.00019544267273437384,
+      "loss": 0.2302,
+      "step": 7600
+    },
+    {
+      "epoch": 1.98,
+      "learning_rate": 0.0001880674018726795,
+      "loss": 0.2295,
+      "step": 7800
+    },
+    {
+      "epoch": 2.0,
+      "eval_accuracy": 0.8789903474277315,
+      "eval_auc": 0.8180827968848764,
+      "eval_f1": 0.21386215966220054,
+      "eval_loss": 0.4392629563808441,
+      "eval_mcc": 0.27446788968929925,
+      "eval_precision": 0.12459111498869992,
+      "eval_recall": 0.7543961461123881,
+      "eval_runtime": 1167.9434,
+      "eval_samples_per_second": 109.296,
+      "eval_steps_per_second": 1.708,
+      "step": 7878
+    },
+    {
+      "epoch": 2.03,
+      "learning_rate": 0.00018068737835893393,
+      "loss": 0.2261,
+      "step": 8000
+    },
+    {
+      "epoch": 2.08,
+      "learning_rate": 0.00017331433678485712,
+      "loss": 0.2277,
+      "step": 8200
+    },
+    {
+      "epoch": 2.13,
+      "learning_rate": 0.00016596000064054934,
+      "loss": 0.2275,
+      "step": 8400
+    },
+    {
+      "epoch": 2.18,
+      "learning_rate": 0.0001586360636735797,
+      "loss": 0.2267,
+      "step": 8600
+    },
+    {
+      "epoch": 2.23,
+      "learning_rate": 0.0001513541712953658,
+      "loss": 0.2243,
+      "step": 8800
+    },
+    {
+      "epoch": 2.28,
+      "learning_rate": 0.00014412590206441025,
+      "loss": 0.2266,
+      "step": 9000
+    },
+    {
+      "epoch": 2.34,
+      "learning_rate": 0.00013696274927583722,
+      "loss": 0.2243,
+      "step": 9200
+    },
+    {
+      "epoch": 2.39,
+      "learning_rate": 0.00012987610268650092,
+      "loss": 0.2253,
+      "step": 9400
+    },
+    {
+      "epoch": 2.44,
+      "learning_rate": 0.00012287723040472557,
+      "loss": 0.2255,
+      "step": 9600
+    },
+    {
+      "epoch": 2.49,
+      "learning_rate": 0.00011597726097347204,
+      "loss": 0.2254,
+      "step": 9800
+    },
+    {
+      "epoch": 2.54,
+      "learning_rate": 0.00010918716567542043,
+      "loss": 0.2241,
+      "step": 10000
+    },
+    {
+      "epoch": 2.59,
+      "learning_rate": 0.0001025177410881037,
+      "loss": 0.223,
+      "step": 10200
+    },
+    {
+      "epoch": 2.64,
+      "learning_rate": 9.597959191683088e-05,
+      "loss": 0.2217,
+      "step": 10400
+    },
+    {
+      "epoch": 2.69,
+      "learning_rate": 8.958311413269684e-05,
+      "loss": 0.222,
+      "step": 10600
+    },
+    {
+      "epoch": 2.74,
+      "learning_rate": 8.333847844248891e-05,
+      "loss": 0.2219,
+      "step": 10800
+    },
+    {
+      "epoch": 2.79,
+      "learning_rate": 7.725561411677462e-05,
+      "loss": 0.2218,
+      "step": 11000
+    },
+    {
+      "epoch": 2.84,
+      "learning_rate": 7.134419320188491e-05,
+      "loss": 0.2233,
+      "step": 11200
+    },
+    {
+      "epoch": 2.89,
+      "learning_rate": 6.564180298866504e-05,
+      "loss": 0.2261,
+      "step": 11400
+    },
+    {
+      "epoch": 2.94,
+      "learning_rate": 6.010020772997792e-05,
+      "loss": 0.2225,
+      "step": 11600
+    },
+    {
+      "epoch": 3.0,
+      "learning_rate": 5.475733380194338e-05,
+      "loss": 0.2176,
+      "step": 11800
+    },
+    {
+      "epoch": 3.0,
+      "eval_accuracy": 0.8735072413749101,
+      "eval_auc": 0.8195797310899098,
+      "eval_f1": 0.20841207680022153,
+      "eval_loss": 0.4386225640773773,
+      "eval_mcc": 0.2707498152735772,
+      "eval_precision": 0.12068424210520438,
+      "eval_recall": 0.7631916070570107,
+      "eval_runtime": 1165.7733,
+      "eval_samples_per_second": 109.499,
+      "eval_steps_per_second": 1.711,
+      "step": 11817
+    },
+    {
+      "epoch": 3.05,
+      "learning_rate": 4.962167663063128e-05,
+      "loss": 0.2223,
+      "step": 12000
+    },
+    {
+      "epoch": 3.1,
+      "learning_rate": 4.4701402157519476e-05,
+      "loss": 0.2204,
+      "step": 12200
+    },
+    {
+      "epoch": 3.15,
+      "learning_rate": 4.000433385525458e-05,
+      "loss": 0.2224,
+      "step": 12400
+    },
+    {
+      "epoch": 3.2,
+      "learning_rate": 3.553794028795492e-05,
+      "loss": 0.2239,
+      "step": 12600
+    },
+    {
+      "epoch": 3.25,
+      "learning_rate": 3.130932323583492e-05,
+      "loss": 0.2188,
+      "step": 12800
+    },
+    {
+      "epoch": 3.3,
+      "learning_rate": 2.7325206403033605e-05,
+      "loss": 0.2214,
+      "step": 13000
+    },
+    {
+      "epoch": 3.35,
+      "learning_rate": 2.359192472660235e-05,
+      "loss": 0.2216,
+      "step": 13200
+    },
+    {
+      "epoch": 3.4,
+      "learning_rate": 2.0132148821294626e-05,
+      "loss": 0.2207,
+      "step": 13400
+    },
+    {
+      "epoch": 3.45,
+      "learning_rate": 1.691661291092208e-05,
+      "loss": 0.2199,
+      "step": 13600
+    },
+    {
+      "epoch": 3.5,
+      "learning_rate": 1.3968462320313953e-05,
+      "loss": 0.219,
+      "step": 13800
+    },
+    {
+      "epoch": 3.55,
+      "learning_rate": 1.1292384750457188e-05,
+      "loss": 0.2219,
+      "step": 14000
+    },
+    {
+      "epoch": 3.6,
+      "learning_rate": 8.892635293172929e-06,
+      "loss": 0.2202,
+      "step": 14200
+    },
+    {
+      "epoch": 3.66,
+      "learning_rate": 6.773029665315992e-06,
+      "loss": 0.2202,
+      "step": 14400
+    },
+    {
+      "epoch": 3.71,
+      "learning_rate": 4.936938141602164e-06,
+      "loss": 0.2168,
+      "step": 14600
+    },
+    {
+      "epoch": 3.76,
+      "learning_rate": 3.387280195709328e-06,
+      "loss": 0.221,
+      "step": 14800
+    },
+    {
+      "epoch": 3.81,
+      "learning_rate": 2.1321015191903147e-06,
+      "loss": 0.2195,
+      "step": 15000
+    },
+    {
+      "epoch": 3.86,
+      "learning_rate": 1.1607847254776198e-06,
+      "loss": 0.2214,
+      "step": 15200
+    },
+    {
+      "epoch": 3.91,
+      "learning_rate": 4.819057748199279e-07,
+      "loss": 0.2202,
+      "step": 15400
+    },
+    {
+      "epoch": 3.96,
+      "learning_rate": 9.654411734337413e-08,
+      "loss": 0.2222,
+      "step": 15600
+    },
+    {
+      "epoch": 4.0,
+      "eval_accuracy": 0.8741850393920096,
+      "eval_auc": 0.819488037818028,
+      "eval_f1": 0.20910544751589633,
+      "eval_loss": 0.43909892439842224,
+      "eval_mcc": 0.27126529185336096,
+      "eval_precision": 0.12117210076100346,
+      "eval_recall": 0.7622953120147897,
+      "eval_runtime": 1162.7299,
+      "eval_samples_per_second": 109.786,
+      "eval_steps_per_second": 1.716,
+      "step": 15756
+    }
+  ],
+  "logging_steps": 200,
+  "max_steps": 15756,
+  "num_train_epochs": 4,
+  "save_steps": 500,
+  "total_flos": 8.102916883166848e+16,
+  "trial_name": null,
+  "trial_params": null
+}

esm2_t6_8M_qlora_binding_sites_2023-09-29_03-34-40/checkpoint-15756/training_args.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:19560f827f37de980ef9907eb4a996feaadf6e4f6a723cacbef99fc7a0ba1b25
+size 4155

esm2_t6_8M_qlora_binding_sites_2023-09-29_03-34-40/checkpoint-15756/vocab.txt ADDED Viewed

	@@ -0,0 +1,33 @@

+<cls>
+<pad>
+<eos>
+<unk>
+L
+A
+G
+V
+S
+E
+R
+T
+I
+D
+P
+K
+Q
+N
+F
+Y
+M
+H
+W
+C
+X
+B
+U
+Z
+O
+.
+-
+<null_1>
+<mask>

esm2_t6_8M_qlora_binding_sites_2023-09-29_03-34-40/checkpoint-3939/README.md ADDED Viewed

	@@ -0,0 +1,21 @@

+---
+library_name: peft
+---
+## Training procedure
+The following `bitsandbytes` quantization config was used during training:
+- quant_method: bitsandbytes
+- load_in_8bit: False
+- load_in_4bit: True
+- llm_int8_threshold: 6.0
+- llm_int8_skip_modules: None
+- llm_int8_enable_fp32_cpu_offload: False
+- llm_int8_has_fp16_weight: False
+- bnb_4bit_quant_type: nf4
+- bnb_4bit_use_double_quant: True
+- bnb_4bit_compute_dtype: bfloat16
+### Framework versions
+- PEFT 0.6.0.dev0

esm2_t6_8M_qlora_binding_sites_2023-09-29_03-34-40/checkpoint-3939/adapter_config.json ADDED Viewed

	@@ -0,0 +1,29 @@

+{
+  "alpha_pattern": {},
+  "auto_mapping": null,
+  "base_model_name_or_path": "facebook/esm2_t6_8M_UR50D",
+  "bias": "none",
+  "fan_in_fan_out": false,
+  "inference_mode": true,
+  "init_lora_weights": true,
+  "layers_pattern": null,
+  "layers_to_transform": null,
+  "lora_alpha": 1,
+  "lora_dropout": 0.5,
+  "modules_to_save": null,
+  "peft_type": "LORA",
+  "r": 2,
+  "rank_pattern": {},
+  "revision": null,
+  "target_modules": [
+    "query",
+    "key",
+    "value",
+    "EsmSelfOutput.dense",
+    "EsmIntermediate.dense",
+    "EsmOutput.dense",
+    "EsmContactPredictionHead.regression",
+    "classifier"
+  ],
+  "task_type": "TOKEN_CLS"
+}

esm2_t6_8M_qlora_binding_sites_2023-09-29_03-34-40/checkpoint-3939/adapter_model.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:44501128da965af2da76593044b359220b9cbd2c5b399bc9de7aac4197d83273
+size 114991

esm2_t6_8M_qlora_binding_sites_2023-09-29_03-34-40/checkpoint-3939/added_tokens.json ADDED Viewed

	@@ -0,0 +1,7 @@

+{
+  "<cls>": 0,
+  "<eos>": 2,
+  "<mask>": 32,
+  "<pad>": 1,
+  "<unk>": 3
+}

esm2_t6_8M_qlora_binding_sites_2023-09-29_03-34-40/checkpoint-3939/optimizer.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:550477f400ea5edc292478c534a1dae4e96fbbd3c25f393b7ce864fbce100b69
+size 218073

esm2_t6_8M_qlora_binding_sites_2023-09-29_03-34-40/checkpoint-3939/rng_state.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:f4867cc190d63a633b96f2672fb906a1c6c53f31c353db36e79d6433f4038473
+size 14575

esm2_t6_8M_qlora_binding_sites_2023-09-29_03-34-40/checkpoint-3939/scheduler.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:4bc87ecdf29595d0187df2e3c0721fbf08cc9aa799fab4c51aafa53363300bd1
+size 627

esm2_t6_8M_qlora_binding_sites_2023-09-29_03-34-40/checkpoint-3939/special_tokens_map.json ADDED Viewed

	@@ -0,0 +1,7 @@

+{
+  "cls_token": "<cls>",
+  "eos_token": "<eos>",
+  "mask_token": "<mask>",
+  "pad_token": "<pad>",
+  "unk_token": "<unk>"
+}

esm2_t6_8M_qlora_binding_sites_2023-09-29_03-34-40/checkpoint-3939/tokenizer_config.json ADDED Viewed

	@@ -0,0 +1,54 @@

+{
+  "added_tokens_decoder": {
+    "0": {
+      "content": "<cls>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "1": {
+      "content": "<pad>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "2": {
+      "content": "<eos>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "3": {
+      "content": "<unk>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "32": {
+      "content": "<mask>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    }
+  },
+  "additional_special_tokens": [],
+  "clean_up_tokenization_spaces": true,
+  "cls_token": "<cls>",
+  "eos_token": "<eos>",
+  "mask_token": "<mask>",
+  "model_max_length": 1024,
+  "pad_token": "<pad>",
+  "tokenizer_class": "EsmTokenizer",
+  "tokenizer_file": null,
+  "unk_token": "<unk>"
+}

esm2_t6_8M_qlora_binding_sites_2023-09-29_03-34-40/checkpoint-3939/trainer_state.json ADDED Viewed

	@@ -0,0 +1,147 @@

+{
+  "best_metric": 0.19848246486644372,
+  "best_model_checkpoint": "esm2_t6_8M_qlora_binding_sites_2023-09-29_03-34-40/checkpoint-3939",
+  "epoch": 1.0,
+  "eval_steps": 500,
+  "global_step": 3939,
+  "is_hyper_param_search": false,
+  "is_local_process_zero": true,
+  "is_world_process_zero": true,
+  "log_history": [
+    {
+      "epoch": 0.05,
+      "learning_rate": 0.0003700096638060586,
+      "loss": 0.5009,
+      "step": 200
+    },
+    {
+      "epoch": 0.1,
+      "learning_rate": 0.0003695684724487918,
+      "loss": 0.3725,
+      "step": 400
+    },
+    {
+      "epoch": 0.15,
+      "learning_rate": 0.00036883393302294926,
+      "loss": 0.3363,
+      "step": 600
+    },
+    {
+      "epoch": 0.2,
+      "learning_rate": 0.0003678072134814851,
+      "loss": 0.3171,
+      "step": 800
+    },
+    {
+      "epoch": 0.25,
+      "learning_rate": 0.0003664899463577655,
+      "loss": 0.3041,
+      "step": 1000
+    },
+    {
+      "epoch": 0.3,
+      "learning_rate": 0.00036488422616976233,
+      "loss": 0.2954,
+      "step": 1200
+    },
+    {
+      "epoch": 0.36,
+      "learning_rate": 0.0003629926060896693,
+      "loss": 0.2872,
+      "step": 1400
+    },
+    {
+      "epoch": 0.41,
+      "learning_rate": 0.00036081809388423475,
+      "loss": 0.2804,
+      "step": 1600
+    },
+    {
+      "epoch": 0.46,
+      "learning_rate": 0.0003583641471322691,
+      "loss": 0.2754,
+      "step": 1800
+    },
+    {
+      "epoch": 0.51,
+      "learning_rate": 0.00035563466772692797,
+      "loss": 0.2696,
+      "step": 2000
+    },
+    {
+      "epoch": 0.56,
+      "learning_rate": 0.0003526339956715147,
+      "loss": 0.2675,
+      "step": 2200
+    },
+    {
+      "epoch": 0.61,
+      "learning_rate": 0.00034936690217866705,
+      "loss": 0.2642,
+      "step": 2400
+    },
+    {
+      "epoch": 0.66,
+      "learning_rate": 0.00034583858208389975,
+      "loss": 0.262,
+      "step": 2600
+    },
+    {
+      "epoch": 0.71,
+      "learning_rate": 0.0003420546455855667,
+      "loss": 0.2592,
+      "step": 2800
+    },
+    {
+      "epoch": 0.76,
+      "learning_rate": 0.00033802110932437625,
+      "loss": 0.2565,
+      "step": 3000
+    },
+    {
+      "epoch": 0.81,
+      "learning_rate": 0.0003337443868166437,
+      "loss": 0.2542,
+      "step": 3200
+    },
+    {
+      "epoch": 0.86,
+      "learning_rate": 0.00032923127825649205,
+      "loss": 0.2509,
+      "step": 3400
+    },
+    {
+      "epoch": 0.91,
+      "learning_rate": 0.00032448895970321745,
+      "loss": 0.2509,
+      "step": 3600
+    },
+    {
+      "epoch": 0.96,
+      "learning_rate": 0.0003195249716710097,
+      "loss": 0.2464,
+      "step": 3800
+    },
+    {
+      "epoch": 1.0,
+      "eval_accuracy": 0.8625347674451358,
+      "eval_auc": 0.8222331548742136,
+      "eval_f1": 0.19848246486644372,
+      "eval_loss": 0.41490185260772705,
+      "eval_mcc": 0.2639007297474409,
+      "eval_precision": 0.11370668247419904,
+      "eval_recall": 0.7800926533683039,
+      "eval_runtime": 1163.712,
+      "eval_samples_per_second": 109.693,
+      "eval_steps_per_second": 1.714,
+      "step": 3939
+    }
+  ],
+  "logging_steps": 200,
+  "max_steps": 15756,
+  "num_train_epochs": 4,
+  "save_steps": 500,
+  "total_flos": 2.0257292207917116e+16,
+  "trial_name": null,
+  "trial_params": null
+}

esm2_t6_8M_qlora_binding_sites_2023-09-29_03-34-40/checkpoint-3939/training_args.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:19560f827f37de980ef9907eb4a996feaadf6e4f6a723cacbef99fc7a0ba1b25
+size 4155

esm2_t6_8M_qlora_binding_sites_2023-09-29_03-34-40/checkpoint-3939/vocab.txt ADDED Viewed

	@@ -0,0 +1,33 @@

+<cls>
+<pad>
+<eos>
+<unk>
+L
+A
+G
+V
+S
+E
+R
+T
+I
+D
+P
+K
+Q
+N
+F
+Y
+M
+H
+W
+C
+X
+B
+U
+Z
+O
+.
+-
+<null_1>
+<mask>

esm2_t6_8M_qlora_binding_sites_2023-09-29_03-34-40/checkpoint-7878/README.md ADDED Viewed

	@@ -0,0 +1,21 @@

+---
+library_name: peft
+---
+## Training procedure
+The following `bitsandbytes` quantization config was used during training:
+- quant_method: bitsandbytes
+- load_in_8bit: False
+- load_in_4bit: True
+- llm_int8_threshold: 6.0
+- llm_int8_skip_modules: None
+- llm_int8_enable_fp32_cpu_offload: False
+- llm_int8_has_fp16_weight: False
+- bnb_4bit_quant_type: nf4
+- bnb_4bit_use_double_quant: True
+- bnb_4bit_compute_dtype: bfloat16
+### Framework versions
+- PEFT 0.6.0.dev0

esm2_t6_8M_qlora_binding_sites_2023-09-29_03-34-40/checkpoint-7878/adapter_config.json ADDED Viewed

	@@ -0,0 +1,29 @@

+{
+  "alpha_pattern": {},
+  "auto_mapping": null,
+  "base_model_name_or_path": "facebook/esm2_t6_8M_UR50D",
+  "bias": "none",
+  "fan_in_fan_out": false,
+  "inference_mode": true,
+  "init_lora_weights": true,
+  "layers_pattern": null,
+  "layers_to_transform": null,
+  "lora_alpha": 1,
+  "lora_dropout": 0.5,
+  "modules_to_save": null,
+  "peft_type": "LORA",
+  "r": 2,
+  "rank_pattern": {},
+  "revision": null,
+  "target_modules": [
+    "query",
+    "key",
+    "value",
+    "EsmSelfOutput.dense",
+    "EsmIntermediate.dense",
+    "EsmOutput.dense",
+    "EsmContactPredictionHead.regression",
+    "classifier"
+  ],
+  "task_type": "TOKEN_CLS"
+}

esm2_t6_8M_qlora_binding_sites_2023-09-29_03-34-40/checkpoint-7878/adapter_model.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:9d6bae6aa0fe5623cd84eb369c0e9e8027fbbc24839cc196e742de63964ef886
+size 114991

esm2_t6_8M_qlora_binding_sites_2023-09-29_03-34-40/checkpoint-7878/added_tokens.json ADDED Viewed

	@@ -0,0 +1,7 @@

+{
+  "<cls>": 0,
+  "<eos>": 2,
+  "<mask>": 32,
+  "<pad>": 1,
+  "<unk>": 3
+}

esm2_t6_8M_qlora_binding_sites_2023-09-29_03-34-40/checkpoint-7878/optimizer.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:3b24037eda5de7e73c7d7b3ffec29293e2178a5511cb51b0d27fca0ff899fabe
+size 218073

esm2_t6_8M_qlora_binding_sites_2023-09-29_03-34-40/checkpoint-7878/rng_state.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:370252d5d09ed129e985231b3e21fc550a6f7a7c660b7c74edd054a4e7ae94ed
+size 14575

esm2_t6_8M_qlora_binding_sites_2023-09-29_03-34-40/checkpoint-7878/scheduler.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:b402c76a39b9f4986855645efcbcac8cfd51de5b448f17a8868056e810e6bdf0
+size 627

esm2_t6_8M_qlora_binding_sites_2023-09-29_03-34-40/checkpoint-7878/special_tokens_map.json ADDED Viewed

	@@ -0,0 +1,7 @@

+{
+  "cls_token": "<cls>",
+  "eos_token": "<eos>",
+  "mask_token": "<mask>",
+  "pad_token": "<pad>",
+  "unk_token": "<unk>"
+}

esm2_t6_8M_qlora_binding_sites_2023-09-29_03-34-40/checkpoint-7878/tokenizer_config.json ADDED Viewed

	@@ -0,0 +1,54 @@

+{
+  "added_tokens_decoder": {
+    "0": {
+      "content": "<cls>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "1": {
+      "content": "<pad>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "2": {
+      "content": "<eos>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "3": {
+      "content": "<unk>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "32": {
+      "content": "<mask>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    }
+  },
+  "additional_special_tokens": [],
+  "clean_up_tokenization_spaces": true,
+  "cls_token": "<cls>",
+  "eos_token": "<eos>",
+  "mask_token": "<mask>",
+  "model_max_length": 1024,
+  "pad_token": "<pad>",
+  "tokenizer_class": "EsmTokenizer",
+  "tokenizer_file": null,
+  "unk_token": "<unk>"
+}

esm2_t6_8M_qlora_binding_sites_2023-09-29_03-34-40/checkpoint-7878/trainer_state.json ADDED Viewed

	@@ -0,0 +1,281 @@

+{
+  "best_metric": 0.21386215966220054,
+  "best_model_checkpoint": "esm2_t6_8M_qlora_binding_sites_2023-09-29_03-34-40/checkpoint-7878",
+  "epoch": 2.0,
+  "eval_steps": 500,
+  "global_step": 7878,
+  "is_hyper_param_search": false,
+  "is_local_process_zero": true,
+  "is_world_process_zero": true,
+  "log_history": [
+    {
+      "epoch": 0.05,
+      "learning_rate": 0.0003700096638060586,
+      "loss": 0.5009,
+      "step": 200
+    },
+    {
+      "epoch": 0.1,
+      "learning_rate": 0.0003695684724487918,
+      "loss": 0.3725,
+      "step": 400
+    },
+    {
+      "epoch": 0.15,
+      "learning_rate": 0.00036883393302294926,
+      "loss": 0.3363,
+      "step": 600
+    },
+    {
+      "epoch": 0.2,
+      "learning_rate": 0.0003678072134814851,
+      "loss": 0.3171,
+      "step": 800
+    },
+    {
+      "epoch": 0.25,
+      "learning_rate": 0.0003664899463577655,
+      "loss": 0.3041,
+      "step": 1000
+    },
+    {
+      "epoch": 0.3,
+      "learning_rate": 0.00036488422616976233,
+      "loss": 0.2954,
+      "step": 1200
+    },
+    {
+      "epoch": 0.36,
+      "learning_rate": 0.0003629926060896693,
+      "loss": 0.2872,
+      "step": 1400
+    },
+    {
+      "epoch": 0.41,
+      "learning_rate": 0.00036081809388423475,
+      "loss": 0.2804,
+      "step": 1600
+    },
+    {
+      "epoch": 0.46,
+      "learning_rate": 0.0003583641471322691,
+      "loss": 0.2754,
+      "step": 1800
+    },
+    {
+      "epoch": 0.51,
+      "learning_rate": 0.00035563466772692797,
+      "loss": 0.2696,
+      "step": 2000
+    },
+    {
+      "epoch": 0.56,
+      "learning_rate": 0.0003526339956715147,
+      "loss": 0.2675,
+      "step": 2200
+    },
+    {
+      "epoch": 0.61,
+      "learning_rate": 0.00034936690217866705,
+      "loss": 0.2642,
+      "step": 2400
+    },
+    {
+      "epoch": 0.66,
+      "learning_rate": 0.00034583858208389975,
+      "loss": 0.262,
+      "step": 2600
+    },
+    {
+      "epoch": 0.71,
+      "learning_rate": 0.0003420546455855667,
+      "loss": 0.2592,
+      "step": 2800
+    },
+    {
+      "epoch": 0.76,
+      "learning_rate": 0.00033802110932437625,
+      "loss": 0.2565,
+      "step": 3000
+    },
+    {
+      "epoch": 0.81,
+      "learning_rate": 0.0003337443868166437,
+      "loss": 0.2542,
+      "step": 3200
+    },
+    {
+      "epoch": 0.86,
+      "learning_rate": 0.00032923127825649205,
+      "loss": 0.2509,
+      "step": 3400
+    },
+    {
+      "epoch": 0.91,
+      "learning_rate": 0.00032448895970321745,
+      "loss": 0.2509,
+      "step": 3600
+    },
+    {
+      "epoch": 0.96,
+      "learning_rate": 0.0003195249716710097,
+      "loss": 0.2464,
+      "step": 3800
+    },
+    {
+      "epoch": 1.0,
+      "eval_accuracy": 0.8625347674451358,
+      "eval_auc": 0.8222331548742136,
+      "eval_f1": 0.19848246486644372,
+      "eval_loss": 0.41490185260772705,
+      "eval_mcc": 0.2639007297474409,
+      "eval_precision": 0.11370668247419904,
+      "eval_recall": 0.7800926533683039,
+      "eval_runtime": 1163.712,
+      "eval_samples_per_second": 109.693,
+      "eval_steps_per_second": 1.714,
+      "step": 3939
+    },
+    {
+      "epoch": 1.02,
+      "learning_rate": 0.00031434720713917336,
+      "loss": 0.2484,
+      "step": 4000
+    },
+    {
+      "epoch": 1.07,
+      "learning_rate": 0.0003089913128054233,
+      "loss": 0.2437,
+      "step": 4200
+    },
+    {
+      "epoch": 1.12,
+      "learning_rate": 0.0003034119838843777,
+      "loss": 0.242,
+      "step": 4400
+    },
+    {
+      "epoch": 1.17,
+      "learning_rate": 0.00029764449888790783,
+      "loss": 0.2423,
+      "step": 4600
+    },
+    {
+      "epoch": 1.22,
+      "learning_rate": 0.0002916980283940693,
+      "loss": 0.2387,
+      "step": 4800
+    },
+    {
+      "epoch": 1.27,
+      "learning_rate": 0.00028558202757645164,
+      "loss": 0.239,
+      "step": 5000
+    },
+    {
+      "epoch": 1.32,
+      "learning_rate": 0.0002793062211699992,
+      "loss": 0.2376,
+      "step": 5200
+    },
+    {
+      "epoch": 1.37,
+      "learning_rate": 0.0002728805880082148,
+      "loss": 0.2384,
+      "step": 5400
+    },
+    {
+      "epoch": 1.42,
+      "learning_rate": 0.00026631534515633606,
+      "loss": 0.2355,
+      "step": 5600
+    },
+    {
+      "epoch": 1.47,
+      "learning_rate": 0.0002596209316657108,
+      "loss": 0.2352,
+      "step": 5800
+    },
+    {
+      "epoch": 1.52,
+      "learning_rate": 0.00025280799197520415,
+      "loss": 0.2343,
+      "step": 6000
+    },
+    {
+      "epoch": 1.57,
+      "learning_rate": 0.0002458873589860299,
+      "loss": 0.231,
+      "step": 6200
+    },
+    {
+      "epoch": 1.62,
+      "learning_rate": 0.00023890534556422294,
+      "loss": 0.2339,
+      "step": 6400
+    },
+    {
+      "epoch": 1.68,
+      "learning_rate": 0.00023180289180308998,
+      "loss": 0.2332,
+      "step": 6600
+    },
+    {
+      "epoch": 1.73,
+      "learning_rate": 0.00022462614386106907,
+      "loss": 0.232,
+      "step": 6800
+    },
+    {
+      "epoch": 1.78,
+      "learning_rate": 0.00021738651311196128,
+      "loss": 0.231,
+      "step": 7000
+    },
+    {
+      "epoch": 1.83,
+      "learning_rate": 0.00021013207456600314,
+      "loss": 0.2305,
+      "step": 7200
+    },
+    {
+      "epoch": 1.88,
+      "learning_rate": 0.00020280146390924225,
+      "loss": 0.2298,
+      "step": 7400
+    },
+    {
+      "epoch": 1.93,
+      "learning_rate": 0.00019544267273437384,
+      "loss": 0.2302,
+      "step": 7600
+    },
+    {
+      "epoch": 1.98,
+      "learning_rate": 0.0001880674018726795,
+      "loss": 0.2295,
+      "step": 7800
+    },
+    {
+      "epoch": 2.0,
+      "eval_accuracy": 0.8789903474277315,
+      "eval_auc": 0.8180827968848764,
+      "eval_f1": 0.21386215966220054,
+      "eval_loss": 0.4392629563808441,
+      "eval_mcc": 0.27446788968929925,
+      "eval_precision": 0.12459111498869992,
+      "eval_recall": 0.7543961461123881,
+      "eval_runtime": 1167.9434,
+      "eval_samples_per_second": 109.296,
+      "eval_steps_per_second": 1.708,
+      "step": 7878
+    }
+  ],
+  "logging_steps": 200,
+  "max_steps": 15756,
+  "num_train_epochs": 4,
+  "save_steps": 500,
+  "total_flos": 4.051458441583424e+16,
+  "trial_name": null,
+  "trial_params": null
+}

esm2_t6_8M_qlora_binding_sites_2023-09-29_03-34-40/checkpoint-7878/training_args.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:19560f827f37de980ef9907eb4a996feaadf6e4f6a723cacbef99fc7a0ba1b25
+size 4155

esm2_t6_8M_qlora_binding_sites_2023-09-29_03-34-40/checkpoint-7878/vocab.txt ADDED Viewed

	@@ -0,0 +1,33 @@

+<cls>
+<pad>
+<eos>
+<unk>
+L
+A
+G
+V
+S
+E
+R
+T
+I
+D
+P
+K
+Q
+N
+F
+Y
+M
+H
+W
+C
+X
+B
+U
+Z
+O
+.
+-
+<null_1>
+<mask>