Training in progress, step 1500

Browse files

Files changed (6) hide show

model.safetensors +1 -1
run-2/checkpoint-1500/model.safetensors +1 -1
run-2/checkpoint-1500/optimizer.pt +1 -1
run-2/checkpoint-1500/trainer_state.json +27 -27
run-2/checkpoint-1500/training_args.bin +1 -1
runs/May20_08-46-15_MainPC/events.out.tfevents.1716163630.MainPC.215644.3 +2 -2

model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:419642769ae67cef6e01708b125840f3864c36e170fd8e75820472f755b4d00e
 size 268290900

 version https://git-lfs.github.com/spec/v1
+oid sha256:8c0b54af839f197fd556e2802b995e04c0e84b6a7dd75ee7bd1cd439b5e136b8
 size 268290900

run-2/checkpoint-1500/model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:93982c596a316534ec6049dc4326fd8bb8c68519f3bd73a807df5fbac8ae6656
 size 268290900

 version https://git-lfs.github.com/spec/v1
+oid sha256:8c0b54af839f197fd556e2802b995e04c0e84b6a7dd75ee7bd1cd439b5e136b8
 size 268290900

run-2/checkpoint-1500/optimizer.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:1fde47893799b8f3f4f56489a4110ea1da0e51e3702f9cc3187ffeb0bf02f547
 size 536643898

 version https://git-lfs.github.com/spec/v1
+oid sha256:735b33efb421584f65e3eeeaef0cc981323128818b267ced3ff6374b95b6fcc7
 size 536643898

run-2/checkpoint-1500/trainer_state.json CHANGED Viewed

@@ -10,59 +10,59 @@
   "log_history": [
     {
       "epoch": 1.0,
-      "eval_accuracy": 0.5770967741935484,
-      "eval_loss": 0.21370309591293335,
-      "eval_runtime": 14.3261,
-      "eval_samples_per_second": 216.388,
-      "eval_steps_per_second": 27.083,
       "step": 318
     },
     {
       "epoch": 1.5723270440251573,
-      "grad_norm": 0.547938346862793,
       "learning_rate": 1.371069182389937e-05,
-      "loss": 0.3338,
       "step": 500
     },
     {
       "epoch": 2.0,
-      "eval_accuracy": 0.8070967741935484,
-      "eval_loss": 0.10994400829076767,
-      "eval_runtime": 15.3734,
-      "eval_samples_per_second": 201.647,
-      "eval_steps_per_second": 25.238,
       "step": 636
     },
     {
       "epoch": 3.0,
       "eval_accuracy": 0.8664516129032258,
-      "eval_loss": 0.07803630828857422,
-      "eval_runtime": 14.0224,
-      "eval_samples_per_second": 221.075,
-      "eval_steps_per_second": 27.67,
       "step": 954
     },
     {
       "epoch": 3.1446540880503147,
-      "grad_norm": 0.510848343372345,
       "learning_rate": 7.421383647798742e-06,
-      "loss": 0.1268,
       "step": 1000
     },
     {
       "epoch": 4.0,
-      "eval_accuracy": 0.8819354838709678,
-      "eval_loss": 0.06529980897903442,
-      "eval_runtime": 15.0804,
-      "eval_samples_per_second": 205.564,
-      "eval_steps_per_second": 25.729,
       "step": 1272
     },
     {
       "epoch": 4.716981132075472,
-      "grad_norm": 0.4325341582298279,
       "learning_rate": 1.1320754716981133e-06,
-      "loss": 0.0905,
       "step": 1500
     }
   ],
@@ -75,8 +75,8 @@
   "train_batch_size": 48,
   "trial_name": null,
   "trial_params": {
-    "alpha": 0.18349258351603082,
     "num_train_epochs": 5,
-    "temperature": 9
   }
 }

   "log_history": [
     {
       "epoch": 1.0,
+      "eval_accuracy": 0.5787096774193549,
+      "eval_loss": 0.21759462356567383,
+      "eval_runtime": 13.1676,
+      "eval_samples_per_second": 235.426,
+      "eval_steps_per_second": 29.466,
       "step": 318
     },
     {
       "epoch": 1.5723270440251573,
+      "grad_norm": 0.5513952970504761,
       "learning_rate": 1.371069182389937e-05,
+      "loss": 0.3396,
       "step": 500
     },
     {
       "epoch": 2.0,
+      "eval_accuracy": 0.8083870967741935,
+      "eval_loss": 0.11128884553909302,
+      "eval_runtime": 13.9571,
+      "eval_samples_per_second": 222.109,
+      "eval_steps_per_second": 27.799,
       "step": 636
     },
     {
       "epoch": 3.0,
       "eval_accuracy": 0.8664516129032258,
+      "eval_loss": 0.07867251336574554,
+      "eval_runtime": 13.1876,
+      "eval_samples_per_second": 235.07,
+      "eval_steps_per_second": 29.422,
       "step": 954
     },
     {
       "epoch": 3.1446540880503147,
+      "grad_norm": 0.5208547711372375,
       "learning_rate": 7.421383647798742e-06,
+      "loss": 0.1284,
       "step": 1000
     },
     {
       "epoch": 4.0,
+      "eval_accuracy": 0.8825806451612903,
+      "eval_loss": 0.0656495988368988,
+      "eval_runtime": 15.4062,
+      "eval_samples_per_second": 201.217,
+      "eval_steps_per_second": 25.185,
       "step": 1272
     },
     {
       "epoch": 4.716981132075472,
+      "grad_norm": 0.4366990029811859,
       "learning_rate": 1.1320754716981133e-06,
+      "loss": 0.0913,
       "step": 1500
     }
   ],
   "train_batch_size": 48,
   "trial_name": null,
   "trial_params": {
+    "alpha": 0.8001341619530338,
     "num_train_epochs": 5,
+    "temperature": 8
   }
 }

run-2/checkpoint-1500/training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:8733c9bfaf4d70d36ff31a7dbf705d06c4d9307caf55ee0ae732d8ed448c8a36
 size 5048

 version https://git-lfs.github.com/spec/v1
+oid sha256:c3a86d837a7a7b0e3b25e6ad0ff44a7299c5ea5790990e72e2773a24b09c1a55
 size 5048

runs/May20_08-46-15_MainPC/events.out.tfevents.1716163630.MainPC.215644.3 CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:fbfa38857a5894d2314d6690c5cefef9de603e47c018c03faa9ad7f945d77ade
-size 13919

 version https://git-lfs.github.com/spec/v1
+oid sha256:9f2a949d1fa504d2e87b204bcda1ea0231e0c2645253873a93b4084c51f8b0f1
+size 14807