halu1003 commited on Dec 23, 2023

Commit

8bd45ec

1 Parent(s): c810669

Training in progress, epoch 1

Browse files

Files changed (18) hide show

run-4/checkpoint-268/model.safetensors +1 -1
run-4/checkpoint-268/optimizer.pt +1 -1
run-4/checkpoint-268/rng_state.pth +1 -1
run-4/checkpoint-268/scheduler.pt +1 -1
run-4/checkpoint-268/trainer_state.json +13 -13
run-4/checkpoint-268/training_args.bin +1 -1
run-4/checkpoint-402/model.safetensors +1 -1
run-4/checkpoint-402/optimizer.pt +1 -1
run-4/checkpoint-402/rng_state.pth +1 -1
run-4/checkpoint-402/scheduler.pt +1 -1
run-4/checkpoint-402/trainer_state.json +19 -19
run-4/checkpoint-402/training_args.bin +1 -1
runs/Dec23_05-05-39_584c28cbb8bb/events.out.tfevents.1703309005.584c28cbb8bb.195.7 +3 -0
runs/Dec23_05-05-39_584c28cbb8bb/events.out.tfevents.1703309028.584c28cbb8bb.195.8 +3 -0
runs/Dec23_05-05-39_584c28cbb8bb/events.out.tfevents.1703309059.584c28cbb8bb.195.9 +3 -0
runs/Dec23_05-05-39_584c28cbb8bb/events.out.tfevents.1703309110.584c28cbb8bb.195.10 +3 -0
runs/Dec23_05-05-39_584c28cbb8bb/events.out.tfevents.1703309209.584c28cbb8bb.195.11 +3 -0
runs/Dec23_05-05-39_584c28cbb8bb/events.out.tfevents.1703309232.584c28cbb8bb.195.12 +3 -0

run-4/checkpoint-268/model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:23e834589b1a2f28c299ce7cb5cf5e0891ab445f649e9ce25a76b9177a2af4c7
 size 267832560

 version https://git-lfs.github.com/spec/v1
+oid sha256:37c1d3f957f29d7064ec44df127e22dff47f830ad87b4c8c5e4ee6406535f61f
 size 267832560

run-4/checkpoint-268/optimizer.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:96c92d9a743ba47444ecb0b53cd98bf744571370c379ecb80cc95b0d3715ee38
 size 535727290

 version https://git-lfs.github.com/spec/v1
+oid sha256:a524375dc06aa38bc7631ec47246d19138b8160416c70f0261de4c617f2ee30d
 size 535727290

run-4/checkpoint-268/rng_state.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:67c7825404bfca8251e3494c1620a72bb2e77173338c20795f9bf4ce6c487968
 size 14308

 version https://git-lfs.github.com/spec/v1
+oid sha256:c4673231a8890960613fbc0d72ac5ae6b6d28a97f6de205448ae29f3327ef297
 size 14308

run-4/checkpoint-268/scheduler.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:7d2e29bb1379012fb8bed39a76bc69a742722634ce80c9419ba02eec2e0f5258
 size 1064

 version https://git-lfs.github.com/spec/v1
+oid sha256:300fed9dfd7a6cedcc5669b3637997990428597519c8113007a44ab980a922d9
 size 1064

run-4/checkpoint-268/trainer_state.json CHANGED Viewed

@@ -1,5 +1,5 @@
 {
-  "best_metric": 0.472806497515492,
   "best_model_checkpoint": "distilbert-base-uncased-finetuned-cola/run-4/checkpoint-268",
   "epoch": 2.0,
   "eval_steps": 500,
@@ -10,20 +10,20 @@
   "log_history": [
     {
       "epoch": 1.0,
-      "eval_loss": 0.4921027719974518,
-      "eval_matthews_correlation": 0.4130889956247439,
-      "eval_runtime": 0.7437,
-      "eval_samples_per_second": 1402.413,
-      "eval_steps_per_second": 88.743,
       "step": 134
     },
     {
       "epoch": 2.0,
-      "eval_loss": 0.47313278913497925,
-      "eval_matthews_correlation": 0.472806497515492,
-      "eval_runtime": 0.7764,
-      "eval_samples_per_second": 1343.447,
-      "eval_steps_per_second": 85.012,
       "step": 268
     }
   ],
@@ -36,9 +36,9 @@
   "train_batch_size": 64,
   "trial_name": null,
   "trial_params": {
-    "learning_rate": 2.3070930848457665e-05,
     "num_train_epochs": 3,
     "per_device_train_batch_size": 64,
-    "seed": 17
   }
 }

 {
+  "best_metric": 0.4818349198265336,
   "best_model_checkpoint": "distilbert-base-uncased-finetuned-cola/run-4/checkpoint-268",
   "epoch": 2.0,
   "eval_steps": 500,
   "log_history": [
     {
       "epoch": 1.0,
+      "eval_loss": 0.5429930686950684,
+      "eval_matthews_correlation": 0.3489031724545359,
+      "eval_runtime": 0.7377,
+      "eval_samples_per_second": 1413.869,
+      "eval_steps_per_second": 89.468,
       "step": 134
     },
     {
       "epoch": 2.0,
+      "eval_loss": 0.48521509766578674,
+      "eval_matthews_correlation": 0.4818349198265336,
+      "eval_runtime": 0.807,
+      "eval_samples_per_second": 1292.399,
+      "eval_steps_per_second": 81.782,
       "step": 268
     }
   ],
   "train_batch_size": 64,
   "trial_name": null,
   "trial_params": {
+    "learning_rate": 2.829056514710492e-05,
     "num_train_epochs": 3,
     "per_device_train_batch_size": 64,
+    "seed": 21
   }
 }

run-4/checkpoint-268/training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:36bde66e6449e9c1f7e73eb4952b2d02cf91a055154e256af6d28a1a6c8f7d0c
 size 4792

 version https://git-lfs.github.com/spec/v1
+oid sha256:61b56e5f82cc951887c4c01ff028e462450cb914b81691299dbf652a64752f11
 size 4792

run-4/checkpoint-402/model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:c3354d90441ef340b351648cbeb0c1e14a51ab8932d3d41f68defa20f99a945e
 size 267832560

 version https://git-lfs.github.com/spec/v1
+oid sha256:7a6531a733ee551131b322c727a87dfeed2900030db3ddce5a4eba90bf5c9feb
 size 267832560

run-4/checkpoint-402/optimizer.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:8073458bb1aafd1fd2cebe487dc9455267493831c494bd3da84de4d76b9d105b
 size 535727290

 version https://git-lfs.github.com/spec/v1
+oid sha256:3d3ec6c81440acff9afc235a72555391cc08ec6e828e9d89cffe9143be6dbb0a
 size 535727290

run-4/checkpoint-402/rng_state.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:7e94700464065d7210e304995f87e6c38cd10867184f842b51244323518b2bcc
 size 14308

 version https://git-lfs.github.com/spec/v1
+oid sha256:ab8ade6320fe0027f77c7ae27cbabbd8ad616c220947a83967a7a0923aef60eb
 size 14308

run-4/checkpoint-402/scheduler.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:bdb419fbf518150296b1645004333563adb6aaf70cbc153884850dc62f63d2e7
 size 1064

 version https://git-lfs.github.com/spec/v1
+oid sha256:256f7c5b54bec2c1cfc1bc6942726e0ce2c5d88fbbdc399027460710a0f701a7
 size 1064

run-4/checkpoint-402/trainer_state.json CHANGED Viewed

@@ -1,6 +1,6 @@
 {
-  "best_metric": 0.4738935490751179,
-  "best_model_checkpoint": "distilbert-base-uncased-finetuned-cola/run-4/checkpoint-402",
   "epoch": 3.0,
   "eval_steps": 500,
   "global_step": 402,
@@ -10,29 +10,29 @@
   "log_history": [
     {
       "epoch": 1.0,
-      "eval_loss": 0.4921027719974518,
-      "eval_matthews_correlation": 0.4130889956247439,
-      "eval_runtime": 0.7437,
-      "eval_samples_per_second": 1402.413,
-      "eval_steps_per_second": 88.743,
       "step": 134
     },
     {
       "epoch": 2.0,
-      "eval_loss": 0.47313278913497925,
-      "eval_matthews_correlation": 0.472806497515492,
-      "eval_runtime": 0.7764,
-      "eval_samples_per_second": 1343.447,
-      "eval_steps_per_second": 85.012,
       "step": 268
     },
     {
       "epoch": 3.0,
-      "eval_loss": 0.514751672744751,
-      "eval_matthews_correlation": 0.4738935490751179,
-      "eval_runtime": 0.7708,
-      "eval_samples_per_second": 1353.057,
-      "eval_steps_per_second": 85.62,
       "step": 402
     }
   ],
@@ -45,9 +45,9 @@
   "train_batch_size": 64,
   "trial_name": null,
   "trial_params": {
-    "learning_rate": 2.3070930848457665e-05,
     "num_train_epochs": 3,
     "per_device_train_batch_size": 64,
-    "seed": 17
   }
 }

 {
+  "best_metric": 0.4818349198265336,
+  "best_model_checkpoint": "distilbert-base-uncased-finetuned-cola/run-4/checkpoint-268",
   "epoch": 3.0,
   "eval_steps": 500,
   "global_step": 402,
   "log_history": [
     {
       "epoch": 1.0,
+      "eval_loss": 0.5429930686950684,
+      "eval_matthews_correlation": 0.3489031724545359,
+      "eval_runtime": 0.7377,
+      "eval_samples_per_second": 1413.869,
+      "eval_steps_per_second": 89.468,
       "step": 134
     },
     {
       "epoch": 2.0,
+      "eval_loss": 0.48521509766578674,
+      "eval_matthews_correlation": 0.4818349198265336,
+      "eval_runtime": 0.807,
+      "eval_samples_per_second": 1292.399,
+      "eval_steps_per_second": 81.782,
       "step": 268
     },
     {
       "epoch": 3.0,
+      "eval_loss": 0.5382273197174072,
+      "eval_matthews_correlation": 0.46768485679358657,
+      "eval_runtime": 0.7838,
+      "eval_samples_per_second": 1330.662,
+      "eval_steps_per_second": 84.203,
       "step": 402
     }
   ],
   "train_batch_size": 64,
   "trial_name": null,
   "trial_params": {
+    "learning_rate": 2.829056514710492e-05,
     "num_train_epochs": 3,
     "per_device_train_batch_size": 64,
+    "seed": 21
   }
 }

run-4/checkpoint-402/training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:36bde66e6449e9c1f7e73eb4952b2d02cf91a055154e256af6d28a1a6c8f7d0c
 size 4792

 version https://git-lfs.github.com/spec/v1
+oid sha256:61b56e5f82cc951887c4c01ff028e462450cb914b81691299dbf652a64752f11
 size 4792

runs/Dec23_05-05-39_584c28cbb8bb/events.out.tfevents.1703309005.584c28cbb8bb.195.7 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:3a5f9003fdcbf26fb984b2a771b96c77cccf892cc4a0eeae3526ef57a9c56af7
+size 4686

runs/Dec23_05-05-39_584c28cbb8bb/events.out.tfevents.1703309028.584c28cbb8bb.195.8 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:b5bab35c689c7bb0ed308599d4df6b022c09034b2855a0e512e55dd8434a4848
+size 4843

runs/Dec23_05-05-39_584c28cbb8bb/events.out.tfevents.1703309059.584c28cbb8bb.195.9 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:19c8bb0f4053a9324c38f3bebd724f609d7d760f5e1c669eafc8a524a142934a
+size 5000

runs/Dec23_05-05-39_584c28cbb8bb/events.out.tfevents.1703309110.584c28cbb8bb.195.10 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:d14604fabca8d517db773a5f06086cacab459dce0625c11e8908ae9dfa998117
+size 5312

runs/Dec23_05-05-39_584c28cbb8bb/events.out.tfevents.1703309209.584c28cbb8bb.195.11 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:43d6b8f0cc3646d08a346d6aaa7eb24842085a52517962cbeada4b1b35751543
+size 4687

runs/Dec23_05-05-39_584c28cbb8bb/events.out.tfevents.1703309232.584c28cbb8bb.195.12 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:547b71842b2bdbf51316be303419605dbf6ff2014098e75b85f95a7c07d9be07
+size 5710