Training in progress, step 1500

Browse files

Files changed (7) hide show

model.safetensors +1 -1
run-3/checkpoint-1500/model.safetensors +1 -1
run-3/checkpoint-1500/optimizer.pt +1 -1
run-3/checkpoint-1500/tokenizer.json +1 -6
run-3/checkpoint-1500/trainer_state.json +28 -28
run-3/checkpoint-1500/training_args.bin +1 -1
runs/May17_05-23-10_MainPC/events.out.tfevents.1715892449.MainPC.51768.4 +2 -2

model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:9169c18fe6ab1d35cc81db6d46d303cd839fd2d5478f7e6c93b153bd39b56bd4
 size 268290900

 version https://git-lfs.github.com/spec/v1
+oid sha256:80683dcd7bad6070adbf4a6cffeae9bd86f1e04d3dd349da72feb2cb66c2f5e7
 size 268290900

run-3/checkpoint-1500/model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:1bcafbe25aa7348bc6bf4b4bd252013a208b1533c2992524f2a20bfd4619e26b
 size 268290900

 version https://git-lfs.github.com/spec/v1
+oid sha256:80683dcd7bad6070adbf4a6cffeae9bd86f1e04d3dd349da72feb2cb66c2f5e7
 size 268290900

run-3/checkpoint-1500/optimizer.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:b89ad745c164756f20140145c6ff5b0f47efcb27faefddb0d17144ff5a060dd5
 size 536643898

 version https://git-lfs.github.com/spec/v1
+oid sha256:fe8cbfb9e2257dc0b4fbbac790d34de3afc0a44cc2d721e2014970cdce5a85ae
 size 536643898

run-3/checkpoint-1500/tokenizer.json CHANGED Viewed

@@ -1,11 +1,6 @@
 {
   "version": "1.0",
-  "truncation": {
-    "direction": "Right",
-    "max_length": 512,
-    "strategy": "LongestFirst",
-    "stride": 0
-  },
   "padding": null,
   "added_tokens": [
     {

 {
   "version": "1.0",
+  "truncation": null,
   "padding": null,
   "added_tokens": [
     {

run-3/checkpoint-1500/trainer_state.json CHANGED Viewed

@@ -10,59 +10,59 @@
   "log_history": [
     {
       "epoch": 1.0,
-      "eval_accuracy": 0.582258064516129,
-      "eval_loss": 0.22278250753879547,
-      "eval_runtime": 14.0007,
-      "eval_samples_per_second": 221.418,
-      "eval_steps_per_second": 27.713,
       "step": 318
     },
     {
       "epoch": 1.5723270440251573,
-      "grad_norm": 0.5593786239624023,
       "learning_rate": 1.371069182389937e-05,
-      "loss": 0.3474,
       "step": 500
     },
     {
       "epoch": 2.0,
-      "eval_accuracy": 0.8080645161290323,
-      "eval_loss": 0.11308418214321136,
-      "eval_runtime": 14.7627,
-      "eval_samples_per_second": 209.988,
-      "eval_steps_per_second": 26.282,
       "step": 636
     },
     {
       "epoch": 3.0,
-      "eval_accuracy": 0.8680645161290322,
-      "eval_loss": 0.07942821085453033,
-      "eval_runtime": 14.9523,
-      "eval_samples_per_second": 207.326,
-      "eval_steps_per_second": 25.949,
       "step": 954
     },
     {
       "epoch": 3.1446540880503147,
-      "grad_norm": 0.5294380187988281,
       "learning_rate": 7.421383647798742e-06,
-      "loss": 0.1306,
       "step": 1000
     },
     {
       "epoch": 4.0,
-      "eval_accuracy": 0.8819354838709678,
-      "eval_loss": 0.06604674458503723,
-      "eval_runtime": 14.0202,
-      "eval_samples_per_second": 221.109,
-      "eval_steps_per_second": 27.674,
       "step": 1272
     },
     {
       "epoch": 4.716981132075472,
-      "grad_norm": 0.4432820975780487,
       "learning_rate": 1.1320754716981133e-06,
-      "loss": 0.0924,
       "step": 1500
     }
   ],
@@ -75,8 +75,8 @@
   "train_batch_size": 48,
   "trial_name": null,
   "trial_params": {
-    "alpha": 0.5645557808027578,
     "num_train_epochs": 5,
-    "temperature": 7
   }
 }

   "log_history": [
     {
       "epoch": 1.0,
+      "eval_accuracy": 0.5741935483870968,
+      "eval_loss": 0.21085834503173828,
+      "eval_runtime": 16.9112,
+      "eval_samples_per_second": 183.311,
+      "eval_steps_per_second": 22.943,
       "step": 318
     },
     {
       "epoch": 1.5723270440251573,
+      "grad_norm": 0.5454378724098206,
       "learning_rate": 1.371069182389937e-05,
+      "loss": 0.3294,
       "step": 500
     },
     {
       "epoch": 2.0,
+      "eval_accuracy": 0.805483870967742,
+      "eval_loss": 0.10886585712432861,
+      "eval_runtime": 17.9646,
+      "eval_samples_per_second": 172.561,
+      "eval_steps_per_second": 21.598,
       "step": 636
     },
     {
       "epoch": 3.0,
+      "eval_accuracy": 0.8641935483870967,
+      "eval_loss": 0.07757259905338287,
+      "eval_runtime": 16.7496,
+      "eval_samples_per_second": 185.079,
+      "eval_steps_per_second": 23.165,
       "step": 954
     },
     {
       "epoch": 3.1446540880503147,
+      "grad_norm": 0.5058844685554504,
       "learning_rate": 7.421383647798742e-06,
+      "loss": 0.1255,
       "step": 1000
     },
     {
       "epoch": 4.0,
+      "eval_accuracy": 0.8812903225806452,
+      "eval_loss": 0.06505604088306427,
+      "eval_runtime": 18.1226,
+      "eval_samples_per_second": 171.057,
+      "eval_steps_per_second": 21.41,
       "step": 1272
     },
     {
       "epoch": 4.716981132075472,
+      "grad_norm": 0.42884188890457153,
       "learning_rate": 1.1320754716981133e-06,
+      "loss": 0.0899,
       "step": 1500
     }
   ],
   "train_batch_size": 48,
   "trial_name": null,
   "trial_params": {
+    "alpha": 0.9132537559988115,
     "num_train_epochs": 5,
+    "temperature": 10
   }
 }

run-3/checkpoint-1500/training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:680b691392cebb0d600b63a5b93814d3fbbfedd5e88be725429c4eb7bd20e96e
 size 5048

 version https://git-lfs.github.com/spec/v1
+oid sha256:651d2dfaf598da9232615029aef591cddb19f62ee5e131248da1afc5915c5227
 size 5048

runs/May17_05-23-10_MainPC/events.out.tfevents.1715892449.MainPC.51768.4 CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:2f3430182fee1733e835c772c25d90960564b3d254866a770b3a40402784bad2
-size 13919

 version https://git-lfs.github.com/spec/v1
+oid sha256:b323b1310c8ddc9dfa72103b595b799ab03d99c36cbeed3cd7cfc19b8022574b
+size 14807