Model save

Files changed (5) hide show

adapter_model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:ed3d959cc6ff0319ebeb80281e439f2cba867f20ea34b65ae440688b5b8c75ef
 size 872450448

 version https://git-lfs.github.com/spec/v1
+oid sha256:50f9f18326b14f78e6e5baa1cd8a08bf2c26653a7be354015978e694797c82eb
 size 872450448

all_results.json CHANGED Viewed

@@ -1,13 +1,13 @@
 {
     "epoch": 1.45,
     "eval_loss": 0.491791695356369,
-    "eval_runtime": 105.74,
     "eval_samples": 852,
-    "eval_samples_per_second": 8.058,
-    "eval_steps_per_second": 2.014,
     "train_loss": 0.305820442848905,
-    "train_runtime": 6666.1209,
     "train_samples": 7665,
-    "train_samples_per_second": 2.3,
-    "train_steps_per_second": 0.575
 }

 {
     "epoch": 1.45,
     "eval_loss": 0.491791695356369,
+    "eval_runtime": 106.5509,
     "eval_samples": 852,
+    "eval_samples_per_second": 7.996,
+    "eval_steps_per_second": 1.999,
     "train_loss": 0.305820442848905,
+    "train_runtime": 6698.0985,
     "train_samples": 7665,
+    "train_samples_per_second": 2.289,
+    "train_steps_per_second": 0.572
 }

eval_results.json CHANGED Viewed

@@ -1,8 +1,8 @@
 {
     "epoch": 1.45,
     "eval_loss": 0.491791695356369,
-    "eval_runtime": 105.74,
     "eval_samples": 852,
-    "eval_samples_per_second": 8.058,
-    "eval_steps_per_second": 2.014
 }

 {
     "epoch": 1.45,
     "eval_loss": 0.491791695356369,
+    "eval_runtime": 106.5509,
     "eval_samples": 852,
+    "eval_samples_per_second": 7.996,
+    "eval_steps_per_second": 1.999
 }

train_results.json CHANGED Viewed

@@ -1,8 +1,8 @@
 {
     "epoch": 1.45,
     "train_loss": 0.305820442848905,
-    "train_runtime": 6666.1209,
     "train_samples": 7665,
-    "train_samples_per_second": 2.3,
-    "train_steps_per_second": 0.575
 }

 {
     "epoch": 1.45,
     "train_loss": 0.305820442848905,
+    "train_runtime": 6698.0985,
     "train_samples": 7665,
+    "train_samples_per_second": 2.289,
+    "train_steps_per_second": 0.572
 }

trainer_state.json CHANGED Viewed

@@ -317,9 +317,9 @@
     {
       "epoch": 0.26,
       "eval_loss": 0.5063315629959106,
-      "eval_runtime": 105.7257,
-      "eval_samples_per_second": 8.059,
-      "eval_steps_per_second": 2.015,
       "step": 500
     },
     {
@@ -625,9 +625,9 @@
     {
       "epoch": 1.07,
       "eval_loss": 0.48916903138160706,
-      "eval_runtime": 106.4721,
-      "eval_samples_per_second": 8.002,
-      "eval_steps_per_second": 2.001,
       "step": 1000
     },
     {
@@ -933,9 +933,9 @@
     {
       "epoch": 1.33,
       "eval_loss": 0.4950372576713562,
-      "eval_runtime": 105.7937,
-      "eval_samples_per_second": 8.053,
-      "eval_steps_per_second": 2.013,
       "step": 1500
     },
     {
@@ -1069,9 +1069,9 @@
       "step": 1718,
       "total_flos": 3.091617473007452e+17,
       "train_loss": 0.305820442848905,
-      "train_runtime": 6666.1209,
-      "train_samples_per_second": 2.3,
-      "train_steps_per_second": 0.575
     }
   ],
   "logging_steps": 10,

     {
       "epoch": 0.26,
       "eval_loss": 0.5063315629959106,
+      "eval_runtime": 106.6235,
+      "eval_samples_per_second": 7.991,
+      "eval_steps_per_second": 1.998,
       "step": 500
     },
     {
     {
       "epoch": 1.07,
       "eval_loss": 0.48916903138160706,
+      "eval_runtime": 106.511,
+      "eval_samples_per_second": 7.999,
+      "eval_steps_per_second": 2.0,
       "step": 1000
     },
     {
     {
       "epoch": 1.33,
       "eval_loss": 0.4950372576713562,
+      "eval_runtime": 106.6983,
+      "eval_samples_per_second": 7.985,
+      "eval_steps_per_second": 1.996,
       "step": 1500
     },
     {
       "step": 1718,
       "total_flos": 3.091617473007452e+17,
       "train_loss": 0.305820442848905,
+      "train_runtime": 6698.0985,
+      "train_samples_per_second": 2.289,
+      "train_steps_per_second": 0.572
     }
   ],
   "logging_steps": 10,