Training in progress, step 30000

Browse files

Files changed (5) hide show

last-checkpoint/optimizer.pt +1 -1
last-checkpoint/rng_state.pth +2 -2
last-checkpoint/scheduler.pt +1 -1
last-checkpoint/trainer_state.json +161 -3
runs/Dec05_03-30-37_fbdce2302f52/events.out.tfevents.1670211053.fbdce2302f52.24.0 +2 -2

last-checkpoint/optimizer.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:f04bebc3423c9754bc5ca418b7467629af05af26e1266c57de200e5bd906de93
 size 1115513717

 version https://git-lfs.github.com/spec/v1
+oid sha256:2754a19deafed33f80b8bc9e1d496271fbdefd4dde6d02139929e3ddf01b008f
 size 1115513717

last-checkpoint/rng_state.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:66e154bc9d87e516bef6fa1fe3f5eab0c1a369245f153611b9ee0abd80d50cac
-size 15459

 version https://git-lfs.github.com/spec/v1
+oid sha256:0e6f2984904c3cd3157bcf9409a340770e020350dad6bed8f8d65bce2381442b
+size 15523

last-checkpoint/scheduler.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:68af8dadd166b77d3ac3501660bb80d8a28f8c54961c3c81b3e418d659352771
 size 623

 version https://git-lfs.github.com/spec/v1
+oid sha256:3d3cf89aef0bc5afe4fc7de6b797864a345f7acd73a830413d35a9d7579e5dbe
 size 623

last-checkpoint/trainer_state.json CHANGED Viewed

@@ -1,8 +1,8 @@
 {
   "best_metric": null,
   "best_model_checkpoint": null,
-  "epoch": 1.6221317760868281,
-  "global_step": 27500,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
@@ -1672,11 +1672,169 @@
       "learning_rate": 0.0,
       "loss": 0.6499,
       "step": 27500
     }
   ],
   "max_steps": 30516,
   "num_train_epochs": 2,
-  "total_flos": 1.6758234520215552e+17,
   "trial_name": null,
   "trial_params": null
 }

 {
   "best_metric": null,
   "best_model_checkpoint": null,
+  "epoch": 1.7695983011856309,
+  "global_step": 30000,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
       "learning_rate": 0.0,
       "loss": 0.6499,
       "step": 27500
+    },
+    {
+      "epoch": 1.63,
+      "learning_rate": 0.0,
+      "loss": 0.6648,
+      "step": 27600
+    },
+    {
+      "epoch": 1.63,
+      "learning_rate": 0.0,
+      "loss": 0.6292,
+      "step": 27700
+    },
+    {
+      "epoch": 1.64,
+      "learning_rate": 0.0,
+      "loss": 0.5542,
+      "step": 27800
+    },
+    {
+      "epoch": 1.65,
+      "learning_rate": 0.0,
+      "loss": 0.5549,
+      "step": 27900
+    },
+    {
+      "epoch": 1.65,
+      "learning_rate": 0.0,
+      "loss": 0.6058,
+      "step": 28000
+    },
+    {
+      "epoch": 1.66,
+      "learning_rate": 0.0,
+      "loss": 0.565,
+      "step": 28100
+    },
+    {
+      "epoch": 1.66,
+      "learning_rate": 0.0,
+      "loss": 0.7065,
+      "step": 28200
+    },
+    {
+      "epoch": 1.67,
+      "learning_rate": 0.0,
+      "loss": 0.6621,
+      "step": 28300
+    },
+    {
+      "epoch": 1.68,
+      "learning_rate": 0.0,
+      "loss": 0.6052,
+      "step": 28400
+    },
+    {
+      "epoch": 1.68,
+      "learning_rate": 0.0,
+      "loss": 0.6506,
+      "step": 28500
+    },
+    {
+      "epoch": 1.69,
+      "learning_rate": 0.0,
+      "loss": 0.7008,
+      "step": 28600
+    },
+    {
+      "epoch": 1.69,
+      "learning_rate": 0.0,
+      "loss": 0.6847,
+      "step": 28700
+    },
+    {
+      "epoch": 1.7,
+      "learning_rate": 0.0,
+      "loss": 0.6591,
+      "step": 28800
+    },
+    {
+      "epoch": 1.7,
+      "learning_rate": 0.0,
+      "loss": 0.6289,
+      "step": 28900
+    },
+    {
+      "epoch": 1.71,
+      "learning_rate": 0.0,
+      "loss": 0.5949,
+      "step": 29000
+    },
+    {
+      "epoch": 1.72,
+      "learning_rate": 0.0,
+      "loss": 0.6497,
+      "step": 29100
+    },
+    {
+      "epoch": 1.72,
+      "learning_rate": 0.0,
+      "loss": 0.5947,
+      "step": 29200
+    },
+    {
+      "epoch": 1.73,
+      "learning_rate": 0.0,
+      "loss": 0.6483,
+      "step": 29300
+    },
+    {
+      "epoch": 1.73,
+      "learning_rate": 0.0,
+      "loss": 0.5743,
+      "step": 29400
+    },
+    {
+      "epoch": 1.74,
+      "learning_rate": 0.0,
+      "loss": 0.6876,
+      "step": 29500
+    },
+    {
+      "epoch": 1.75,
+      "learning_rate": 0.0,
+      "loss": 0.6503,
+      "step": 29600
+    },
+    {
+      "epoch": 1.75,
+      "learning_rate": 0.0,
+      "loss": 0.5963,
+      "step": 29700
+    },
+    {
+      "epoch": 1.76,
+      "learning_rate": 0.0,
+      "loss": 0.6361,
+      "step": 29800
+    },
+    {
+      "epoch": 1.76,
+      "learning_rate": 0.0,
+      "loss": 0.6624,
+      "step": 29900
+    },
+    {
+      "epoch": 1.77,
+      "learning_rate": 0.0,
+      "loss": 0.6298,
+      "step": 30000
+    },
+    {
+      "epoch": 1.77,
+      "eval_loss": 0.8651230335235596,
+      "eval_runtime": 546.7955,
+      "eval_samples_per_second": 29.15,
+      "eval_steps_per_second": 1.823,
+      "step": 30000
     }
   ],
   "max_steps": 30516,
   "num_train_epochs": 2,
+  "total_flos": 1.8284013786415104e+17,
   "trial_name": null,
   "trial_params": null
 }

runs/Dec05_03-30-37_fbdce2302f52/events.out.tfevents.1670211053.fbdce2302f52.24.0 CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:6970173370577d76d998a4804604477fa1af002f43070cb67cef3855a24c8ef6
-size 53461

 version https://git-lfs.github.com/spec/v1
+oid sha256:89b673d9ccde84e81880a851f0f5abf58604d05b17b5b045206afb9d74ba26fb
+size 57737