anamelchor commited on Feb 27, 2024

Commit

65d303f

verified ·

1 Parent(s): 6615f0f

Training in progress, epoch 1

Browse files

Files changed (31) hide show

model.safetensors +1 -1
run-4/checkpoint-54/model.safetensors +1 -1
run-4/checkpoint-54/optimizer.pt +1 -1
run-4/checkpoint-54/rng_state.pth +2 -2
run-4/checkpoint-54/scheduler.pt +1 -1
run-4/checkpoint-54/trainer_state.json +22 -13
run-4/checkpoint-54/training_args.bin +1 -1
run-4/checkpoint-81/config.json +25 -0
run-4/checkpoint-81/model.safetensors +3 -0
run-4/checkpoint-81/optimizer.pt +3 -0
run-4/checkpoint-81/rng_state.pth +3 -0
run-4/checkpoint-81/scheduler.pt +3 -0
run-4/checkpoint-81/special_tokens_map.json +7 -0
run-4/checkpoint-81/tokenizer.json +0 -0
run-4/checkpoint-81/tokenizer_config.json +55 -0
run-4/checkpoint-81/trainer_state.json +53 -0
run-4/checkpoint-81/training_args.bin +3 -0
run-4/checkpoint-81/vocab.txt +0 -0
run-5/checkpoint-27/config.json +25 -0
run-5/checkpoint-27/model.safetensors +3 -0
run-5/checkpoint-27/optimizer.pt +3 -0
run-5/checkpoint-27/rng_state.pth +3 -0
run-5/checkpoint-27/scheduler.pt +3 -0
run-5/checkpoint-27/special_tokens_map.json +7 -0
run-5/checkpoint-27/tokenizer.json +0 -0
run-5/checkpoint-27/tokenizer_config.json +55 -0
run-5/checkpoint-27/trainer_state.json +35 -0
run-5/checkpoint-27/training_args.bin +3 -0
run-5/checkpoint-27/vocab.txt +0 -0
runs/Feb27_16-43-42_b3bc3fede2ea/events.out.tfevents.1709053071.b3bc3fede2ea.5958.7 +3 -0
training_args.bin +1 -1

model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:2b9b8a8ddd3b961d8a615d72d44899f4f014544b243b6416621b85ccbf3c8ad2
 size 267832560

 version https://git-lfs.github.com/spec/v1
+oid sha256:7b7264777c389cb61e3202e49cd712d6a0a7c71278279effc9d1901b3bd91bac
 size 267832560

run-4/checkpoint-54/model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:cb261ee18f81041ba8cec98c84be936a1ec23b01180cf95bd3d1190a82549429
 size 267832560

 version https://git-lfs.github.com/spec/v1
+oid sha256:341e92457360435fb9f32395253c06f0d5eeb92dbf408559787ed14ebe2d01f0
 size 267832560

run-4/checkpoint-54/optimizer.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:7916126064082f2ce9db20867574584196a6a27b89987dd7ce8e9b7d140d2030
 size 535727290

 version https://git-lfs.github.com/spec/v1
+oid sha256:22e45aee2b5c34e073e8f19912e9e0b351e8cbe890f77d8b5b3a37b35f8036a9
 size 535727290

run-4/checkpoint-54/rng_state.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:7c9ec64315d092a0ea25ac2e27e41edc8abaffd16fcc7e533b633da1cbb0a551
-size 14308

 version https://git-lfs.github.com/spec/v1
+oid sha256:2032ba244bd2dafbbf529f865ea2d23c61262b0fed6820b9b52930307b4df882
+size 14244

run-4/checkpoint-54/scheduler.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:c8ba7c8ef246a01bcc9141e27f6de94b542ff4919c75a16a944a09386f439afb
 size 1064

 version https://git-lfs.github.com/spec/v1
+oid sha256:61f20c597357d88f9f47e8abae0da1330535f50b9e39477c18ccef7d4e9cb300
 size 1064

run-4/checkpoint-54/trainer_state.json CHANGED Viewed

@@ -1,7 +1,7 @@
 {
-  "best_metric": 0.0,
   "best_model_checkpoint": "distilbert-base-uncased-finetuned-cola/run-4/checkpoint-54",
-  "epoch": 1.0,
   "eval_steps": 500,
   "global_step": 54,
   "is_hyper_param_search": true,
@@ -10,26 +10,35 @@
   "log_history": [
     {
       "epoch": 1.0,
-      "eval_loss": 0.617499053478241,
       "eval_matthews_correlation": 0.0,
-      "eval_runtime": 0.7191,
-      "eval_samples_per_second": 1450.391,
-      "eval_steps_per_second": 91.779,
       "step": 54
     }
   ],
   "logging_steps": 500,
-  "max_steps": 54,
   "num_input_tokens_seen": 0,
-  "num_train_epochs": 1,
   "save_steps": 500,
   "total_flos": 0,
-  "train_batch_size": 16,
   "trial_name": null,
   "trial_params": {
-    "learning_rate": 9.155071793841301e-06,
-    "num_train_epochs": 1,
-    "per_device_train_batch_size": 16,
-    "seed": 24
   }
 }

 {
+  "best_metric": 0.0863794254719202,
   "best_model_checkpoint": "distilbert-base-uncased-finetuned-cola/run-4/checkpoint-54",
+  "epoch": 2.0,
   "eval_steps": 500,
   "global_step": 54,
   "is_hyper_param_search": true,
   "log_history": [
     {
       "epoch": 1.0,
+      "eval_loss": 0.598613440990448,
       "eval_matthews_correlation": 0.0,
+      "eval_runtime": 0.7931,
+      "eval_samples_per_second": 1315.11,
+      "eval_steps_per_second": 83.219,
+      "step": 27
+    },
+    {
+      "epoch": 2.0,
+      "eval_loss": 0.5975402593612671,
+      "eval_matthews_correlation": 0.0863794254719202,
+      "eval_runtime": 0.7965,
+      "eval_samples_per_second": 1309.539,
+      "eval_steps_per_second": 82.866,
       "step": 54
     }
   ],
   "logging_steps": 500,
+  "max_steps": 81,
   "num_input_tokens_seen": 0,
+  "num_train_epochs": 3,
   "save_steps": 500,
   "total_flos": 0,
+  "train_batch_size": 32,
   "trial_name": null,
   "trial_params": {
+    "learning_rate": 3.6796428408677604e-05,
+    "num_train_epochs": 3,
+    "per_device_train_batch_size": 32,
+    "seed": 1
   }
 }

run-4/checkpoint-54/training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:f522a57ff45b04702d23b1a21b6a560b003d1565d8bb0047401bc05c8c441902
 size 4984

 version https://git-lfs.github.com/spec/v1
+oid sha256:3bcf9d16a39b36f26738ac27ccd3d625cd9d28ed3e5f9694dea854578c72fb9e
 size 4984

run-4/checkpoint-81/config.json ADDED Viewed

	@@ -0,0 +1,25 @@

+{
+  "_name_or_path": "distilbert-base-uncased",
+  "activation": "gelu",
+  "architectures": [
+    "DistilBertForSequenceClassification"
+  ],
+  "attention_dropout": 0.1,
+  "dim": 768,
+  "dropout": 0.1,
+  "hidden_dim": 3072,
+  "initializer_range": 0.02,
+  "max_position_embeddings": 512,
+  "model_type": "distilbert",
+  "n_heads": 12,
+  "n_layers": 6,
+  "pad_token_id": 0,
+  "problem_type": "single_label_classification",
+  "qa_dropout": 0.1,
+  "seq_classif_dropout": 0.2,
+  "sinusoidal_pos_embds": false,
+  "tie_weights_": true,
+  "torch_dtype": "float32",
+  "transformers_version": "4.38.1",
+  "vocab_size": 30522
+}

run-4/checkpoint-81/model.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:0ee0caa10715f887372eaa0e30df712fed4d1f683ea968d185e4ff7026bfe302
+size 267832560

run-4/checkpoint-81/optimizer.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:221a71dfefb4cff2007102961583abe8e353f0703234a3d38d569ab62ae51d17
+size 535727290

run-4/checkpoint-81/rng_state.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:790f23647dc62293b735d826a0a1c199bddc650af4e9f8c8a6a48fcacdfcf34e
+size 14244

run-4/checkpoint-81/scheduler.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:1c2143573de3c71ec0df8d247132422493cc42d6fdd0ee4056c09505b0486112
+size 1064

run-4/checkpoint-81/special_tokens_map.json ADDED Viewed

	@@ -0,0 +1,7 @@

+{
+  "cls_token": "[CLS]",
+  "mask_token": "[MASK]",
+  "pad_token": "[PAD]",
+  "sep_token": "[SEP]",
+  "unk_token": "[UNK]"
+}

run-4/checkpoint-81/tokenizer.json ADDED Viewed

The diff for this file is too large to render. See raw diff

run-4/checkpoint-81/tokenizer_config.json ADDED Viewed

	@@ -0,0 +1,55 @@

+{
+  "added_tokens_decoder": {
+    "0": {
+      "content": "[PAD]",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "100": {
+      "content": "[UNK]",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "101": {
+      "content": "[CLS]",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "102": {
+      "content": "[SEP]",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "103": {
+      "content": "[MASK]",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    }
+  },
+  "clean_up_tokenization_spaces": true,
+  "cls_token": "[CLS]",
+  "do_lower_case": true,
+  "mask_token": "[MASK]",
+  "model_max_length": 512,
+  "pad_token": "[PAD]",
+  "sep_token": "[SEP]",
+  "strip_accents": null,
+  "tokenize_chinese_chars": true,
+  "tokenizer_class": "DistilBertTokenizer",
+  "unk_token": "[UNK]"
+}

run-4/checkpoint-81/trainer_state.json ADDED Viewed

	@@ -0,0 +1,53 @@

+{
+  "best_metric": 0.2462710523446019,
+  "best_model_checkpoint": "distilbert-base-uncased-finetuned-cola/run-4/checkpoint-81",
+  "epoch": 3.0,
+  "eval_steps": 500,
+  "global_step": 81,
+  "is_hyper_param_search": true,
+  "is_local_process_zero": true,
+  "is_world_process_zero": true,
+  "log_history": [
+    {
+      "epoch": 1.0,
+      "eval_loss": 0.598613440990448,
+      "eval_matthews_correlation": 0.0,
+      "eval_runtime": 0.7931,
+      "eval_samples_per_second": 1315.11,
+      "eval_steps_per_second": 83.219,
+      "step": 27
+    },
+    {
+      "epoch": 2.0,
+      "eval_loss": 0.5975402593612671,
+      "eval_matthews_correlation": 0.0863794254719202,
+      "eval_runtime": 0.7965,
+      "eval_samples_per_second": 1309.539,
+      "eval_steps_per_second": 82.866,
+      "step": 54
+    },
+    {
+      "epoch": 3.0,
+      "eval_loss": 0.5608728528022766,
+      "eval_matthews_correlation": 0.2462710523446019,
+      "eval_runtime": 1.1904,
+      "eval_samples_per_second": 876.167,
+      "eval_steps_per_second": 55.443,
+      "step": 81
+    }
+  ],
+  "logging_steps": 500,
+  "max_steps": 81,
+  "num_input_tokens_seen": 0,
+  "num_train_epochs": 3,
+  "save_steps": 500,
+  "total_flos": 0,
+  "train_batch_size": 32,
+  "trial_name": null,
+  "trial_params": {
+    "learning_rate": 3.6796428408677604e-05,
+    "num_train_epochs": 3,
+    "per_device_train_batch_size": 32,
+    "seed": 1
+  }
+}

run-4/checkpoint-81/training_args.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:3bcf9d16a39b36f26738ac27ccd3d625cd9d28ed3e5f9694dea854578c72fb9e
+size 4984

run-4/checkpoint-81/vocab.txt ADDED Viewed

The diff for this file is too large to render. See raw diff

run-5/checkpoint-27/config.json ADDED Viewed

	@@ -0,0 +1,25 @@

+{
+  "_name_or_path": "distilbert-base-uncased",
+  "activation": "gelu",
+  "architectures": [
+    "DistilBertForSequenceClassification"
+  ],
+  "attention_dropout": 0.1,
+  "dim": 768,
+  "dropout": 0.1,
+  "hidden_dim": 3072,
+  "initializer_range": 0.02,
+  "max_position_embeddings": 512,
+  "model_type": "distilbert",
+  "n_heads": 12,
+  "n_layers": 6,
+  "pad_token_id": 0,
+  "problem_type": "single_label_classification",
+  "qa_dropout": 0.1,
+  "seq_classif_dropout": 0.2,
+  "sinusoidal_pos_embds": false,
+  "tie_weights_": true,
+  "torch_dtype": "float32",
+  "transformers_version": "4.38.1",
+  "vocab_size": 30522
+}

run-5/checkpoint-27/model.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:7b7264777c389cb61e3202e49cd712d6a0a7c71278279effc9d1901b3bd91bac
+size 267832560

run-5/checkpoint-27/optimizer.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:d0f772f075bb533b3e4c635270bf552c850b145a89978ebcbbc5303c26837565
+size 535727290

run-5/checkpoint-27/rng_state.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:22f40887a9aa64436f373c2378e34877cfef171d5714e7005f6563bf4cdadc6d
+size 14308

run-5/checkpoint-27/scheduler.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:8b1cfe251fe716f208540e6f5d0e55c8a1c32c5ace5bb2879270776ed8a783bd
+size 1064

run-5/checkpoint-27/special_tokens_map.json ADDED Viewed

	@@ -0,0 +1,7 @@

+{
+  "cls_token": "[CLS]",
+  "mask_token": "[MASK]",
+  "pad_token": "[PAD]",
+  "sep_token": "[SEP]",
+  "unk_token": "[UNK]"
+}

run-5/checkpoint-27/tokenizer.json ADDED Viewed

The diff for this file is too large to render. See raw diff

run-5/checkpoint-27/tokenizer_config.json ADDED Viewed

	@@ -0,0 +1,55 @@

+{
+  "added_tokens_decoder": {
+    "0": {
+      "content": "[PAD]",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "100": {
+      "content": "[UNK]",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "101": {
+      "content": "[CLS]",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "102": {
+      "content": "[SEP]",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "103": {
+      "content": "[MASK]",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    }
+  },
+  "clean_up_tokenization_spaces": true,
+  "cls_token": "[CLS]",
+  "do_lower_case": true,
+  "mask_token": "[MASK]",
+  "model_max_length": 512,
+  "pad_token": "[PAD]",
+  "sep_token": "[SEP]",
+  "strip_accents": null,
+  "tokenize_chinese_chars": true,
+  "tokenizer_class": "DistilBertTokenizer",
+  "unk_token": "[UNK]"
+}

run-5/checkpoint-27/trainer_state.json ADDED Viewed

	@@ -0,0 +1,35 @@

+{
+  "best_metric": 0.0,
+  "best_model_checkpoint": "distilbert-base-uncased-finetuned-cola/run-5/checkpoint-27",
+  "epoch": 1.0,
+  "eval_steps": 500,
+  "global_step": 27,
+  "is_hyper_param_search": true,
+  "is_local_process_zero": true,
+  "is_world_process_zero": true,
+  "log_history": [
+    {
+      "epoch": 1.0,
+      "eval_loss": 0.6698710918426514,
+      "eval_matthews_correlation": 0.0,
+      "eval_runtime": 0.8001,
+      "eval_samples_per_second": 1303.648,
+      "eval_steps_per_second": 82.494,
+      "step": 27
+    }
+  ],
+  "logging_steps": 500,
+  "max_steps": 135,
+  "num_input_tokens_seen": 0,
+  "num_train_epochs": 5,
+  "save_steps": 500,
+  "total_flos": 0,
+  "train_batch_size": 32,
+  "trial_name": null,
+  "trial_params": {
+    "learning_rate": 1.8122310780931108e-06,
+    "num_train_epochs": 5,
+    "per_device_train_batch_size": 32,
+    "seed": 21
+  }
+}

run-5/checkpoint-27/training_args.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:12789646f1ace8590d718854a0dcb7cbdcd7655dfa3e3b9eea3031d650c025e3
+size 4984

run-5/checkpoint-27/vocab.txt ADDED Viewed

The diff for this file is too large to render. See raw diff

runs/Feb27_16-43-42_b3bc3fede2ea/events.out.tfevents.1709053071.b3bc3fede2ea.5958.7 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:6d73f88f2928276fee2bca47ce61db0023ac2ef8f90e9e8bb48c5bd6534a054c
+size 5201

training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:3bcf9d16a39b36f26738ac27ccd3d625cd9d28ed3e5f9694dea854578c72fb9e
 size 4984

 version https://git-lfs.github.com/spec/v1
+oid sha256:12789646f1ace8590d718854a0dcb7cbdcd7655dfa3e3b9eea3031d650c025e3
 size 4984