AmelieSchreiber
/

esm2_t12_35M_qlora_binding_2600K_cp1

Model card Files Files and versions Community

AmelieSchreiber commited on Sep 30, 2023

Commit

c4a7b07

•

1 Parent(s): fcf5eb5

Upload 10 files

Browse files

Files changed (10) hide show

adapter_model.bin +3 -0
added_tokens.json +7 -0
optimizer.pt +3 -0
rng_state.pth +3 -0
scheduler.pt +3 -0
special_tokens_map.json +7 -0
tokenizer_config.json +54 -0
trainer_state.json +189 -0
training_args.bin +3 -0
vocab.txt +33 -0

adapter_model.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:43b452dd060767dd70f47cedeaf44542b697374130a372bf310a1f45bd6c156f
+size 316315

added_tokens.json ADDED Viewed

	@@ -0,0 +1,7 @@

+{
+  "<cls>": 0,
+  "<eos>": 2,
+  "<mask>": 32,
+  "<pad>": 1,
+  "<unk>": 3
+}

optimizer.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:0246b16ad2a4ff5346cc7cd436d9865710a83f218ce64578c913184989a1485a
+size 613061

rng_state.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:cd9c5833a930482059798aab998f33fa3d0167a6fcf4b32dba0ae0b19178c0c2
+size 14575

scheduler.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:081e2d3bd93b47a1a918240d8077826ebb0b43206a9f65cc14d171889238fc62
+size 627

special_tokens_map.json ADDED Viewed

	@@ -0,0 +1,7 @@

+{
+  "cls_token": "<cls>",
+  "eos_token": "<eos>",
+  "mask_token": "<mask>",
+  "pad_token": "<pad>",
+  "unk_token": "<unk>"
+}

tokenizer_config.json ADDED Viewed

	@@ -0,0 +1,54 @@

+{
+  "added_tokens_decoder": {
+    "0": {
+      "content": "<cls>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "1": {
+      "content": "<pad>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "2": {
+      "content": "<eos>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "3": {
+      "content": "<unk>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "32": {
+      "content": "<mask>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    }
+  },
+  "additional_special_tokens": [],
+  "clean_up_tokenization_spaces": true,
+  "cls_token": "<cls>",
+  "eos_token": "<eos>",
+  "mask_token": "<mask>",
+  "model_max_length": 1024,
+  "pad_token": "<pad>",
+  "tokenizer_class": "EsmTokenizer",
+  "tokenizer_file": null,
+  "unk_token": "<unk>"
+}

trainer_state.json ADDED Viewed

	@@ -0,0 +1,189 @@

+{
+  "best_metric": 0.3440490710592986,
+  "best_model_checkpoint": "esm2_t12_35M_qlora_binding_sites_2023-09-30_06-27-21/checkpoint-5289",
+  "epoch": 1.0,
+  "eval_steps": 500,
+  "global_step": 5289,
+  "is_hyper_param_search": false,
+  "is_local_process_zero": true,
+  "is_world_process_zero": true,
+  "log_history": [
+    {
+      "epoch": 0.04,
+      "learning_rate": 0.0003700117150420716,
+      "loss": 0.4265,
+      "step": 200
+    },
+    {
+      "epoch": 0.08,
+      "learning_rate": 0.0003695766709151845,
+      "loss": 0.2446,
+      "step": 400
+    },
+    {
+      "epoch": 0.11,
+      "learning_rate": 0.00036885235529645174,
+      "loss": 0.1964,
+      "step": 600
+    },
+    {
+      "epoch": 0.15,
+      "learning_rate": 0.00036783990382720894,
+      "loss": 0.1714,
+      "step": 800
+    },
+    {
+      "epoch": 0.19,
+      "learning_rate": 0.000366540903911771,
+      "loss": 0.1556,
+      "step": 1000
+    },
+    {
+      "epoch": 0.23,
+      "learning_rate": 0.00036495739222857005,
+      "loss": 0.1454,
+      "step": 1200
+    },
+    {
+      "epoch": 0.26,
+      "learning_rate": 0.00036309185153688393,
+      "loss": 0.1387,
+      "step": 1400
+    },
+    {
+      "epoch": 0.3,
+      "learning_rate": 0.0003609472067841633,
+      "loss": 0.133,
+      "step": 1600
+    },
+    {
+      "epoch": 0.34,
+      "learning_rate": 0.0003585268205200591,
+      "loss": 0.1289,
+      "step": 1800
+    },
+    {
+      "epoch": 0.38,
+      "learning_rate": 0.0003558344876243421,
+      "loss": 0.1228,
+      "step": 2000
+    },
+    {
+      "epoch": 0.42,
+      "learning_rate": 0.0003528744293569798,
+      "loss": 0.1208,
+      "step": 2200
+    },
+    {
+      "epoch": 0.45,
+      "learning_rate": 0.00034965128673969907,
+      "loss": 0.1167,
+      "step": 2400
+    },
+    {
+      "epoch": 0.49,
+      "learning_rate": 0.0003461701132794125,
+      "loss": 0.1131,
+      "step": 2600
+    },
+    {
+      "epoch": 0.53,
+      "learning_rate": 0.0003424363670449164,
+      "loss": 0.1113,
+      "step": 2800
+    },
+    {
+      "epoch": 0.57,
+      "learning_rate": 0.00033845590210928363,
+      "loss": 0.1088,
+      "step": 3000
+    },
+    {
+      "epoch": 0.61,
+      "learning_rate": 0.00033423495937136847,
+      "loss": 0.1081,
+      "step": 3200
+    },
+    {
+      "epoch": 0.64,
+      "learning_rate": 0.00032978015677081454,
+      "loss": 0.1054,
+      "step": 3400
+    },
+    {
+      "epoch": 0.68,
+      "learning_rate": 0.00032509847891190683,
+      "loss": 0.1029,
+      "step": 3600
+    },
+    {
+      "epoch": 0.72,
+      "learning_rate": 0.0003201972661125376,
+      "loss": 0.102,
+      "step": 3800
+    },
+    {
+      "epoch": 0.76,
+      "learning_rate": 0.0003150842028954544,
+      "loss": 0.0999,
+      "step": 4000
+    },
+    {
+      "epoch": 0.79,
+      "learning_rate": 0.0003097673059398367,
+      "loss": 0.098,
+      "step": 4200
+    },
+    {
+      "epoch": 0.83,
+      "learning_rate": 0.00030425491151208934,
+      "loss": 0.0972,
+      "step": 4400
+    },
+    {
+      "epoch": 0.87,
+      "learning_rate": 0.00029855566239556173,
+      "loss": 0.0968,
+      "step": 4600
+    },
+    {
+      "epoch": 0.91,
+      "learning_rate": 0.0002926784943396845,
+      "loss": 0.0947,
+      "step": 4800
+    },
+    {
+      "epoch": 0.95,
+      "learning_rate": 0.00028663262204976965,
+      "loss": 0.0933,
+      "step": 5000
+    },
+    {
+      "epoch": 0.98,
+      "learning_rate": 0.00028042752473944106,
+      "loss": 0.094,
+      "step": 5200
+    },
+    {
+      "epoch": 1.0,
+      "eval_accuracy": 0.9297529150299436,
+      "eval_auc": 0.8167222019799886,
+      "eval_f1": 0.3440490710592986,
+      "eval_loss": 0.6011912822723389,
+      "eval_mcc": 0.3730152153022164,
+      "eval_precision": 0.22835223718675476,
+      "eval_recall": 0.697386656717114,
+      "eval_runtime": 3756.1015,
+      "eval_samples_per_second": 144.201,
+      "eval_steps_per_second": 0.687,
+      "step": 5289
+    }
+  ],
+  "logging_steps": 200,
+  "max_steps": 15867,
+  "num_train_epochs": 3,
+  "save_steps": 500,
+  "total_flos": 4.006517704836067e+17,
+  "trial_name": null,
+  "trial_params": null
+}

training_args.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:b915c4deb5ba56cacb3593b78264a7c9bd0e44e5e5af7a361d94ad20b8ca1c89
+size 4155

vocab.txt ADDED Viewed

	@@ -0,0 +1,33 @@

+<cls>
+<pad>
+<eos>
+<unk>
+L
+A
+G
+V
+S
+E
+R
+T
+I
+D
+P
+K
+Q
+N
+F
+Y
+M
+H
+W
+C
+X
+B
+U
+Z
+O
+.
+-
+<null_1>
+<mask>