Model save

Browse files

Files changed (10) hide show

all_results.json +7 -7
eval_results.json +4 -4
model-00001-of-00003.safetensors +1 -1
model-00002-of-00003.safetensors +1 -1
model-00003-of-00003.safetensors +1 -1
runs/Nov10_00-16-16_ip-26-0-155-187/events.out.tfevents.1699575456.ip-26-0-155-187.230765.0 +3 -0
runs/Nov10_00-16-16_ip-26-0-155-187/events.out.tfevents.1699587432.ip-26-0-155-187.230765.1 +3 -0
train_results.json +3 -3
trainer_state.json +16 -16
training_args.bin +1 -1

all_results.json CHANGED Viewed

@@ -1,13 +1,13 @@
 {
     "epoch": 0.67,
-    "eval_loss": 0.9324473142623901,
-    "eval_runtime": 332.1457,
     "eval_samples": 23110,
-    "eval_samples_per_second": 69.578,
-    "eval_steps_per_second": 0.545,
-    "train_loss": 0.9717074483633041,
-    "train_runtime": 11641.8542,
     "train_samples": 207865,
-    "train_samples_per_second": 17.855,
     "train_steps_per_second": 0.035
 }

 {
     "epoch": 0.67,
+    "eval_loss": 0.932437002658844,
+    "eval_runtime": 331.0457,
     "eval_samples": 23110,
+    "eval_samples_per_second": 69.809,
+    "eval_steps_per_second": 0.547,
+    "train_loss": 0.9717322877224754,
+    "train_runtime": 11645.5121,
     "train_samples": 207865,
+    "train_samples_per_second": 17.849,
     "train_steps_per_second": 0.035
 }

eval_results.json CHANGED Viewed

@@ -1,8 +1,8 @@
 {
     "epoch": 0.67,
-    "eval_loss": 0.9324473142623901,
-    "eval_runtime": 332.1457,
     "eval_samples": 23110,
-    "eval_samples_per_second": 69.578,
-    "eval_steps_per_second": 0.545
 }

 {
     "epoch": 0.67,
+    "eval_loss": 0.932437002658844,
+    "eval_runtime": 331.0457,
     "eval_samples": 23110,
+    "eval_samples_per_second": 69.809,
+    "eval_steps_per_second": 0.547
 }

model-00001-of-00003.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:680b68a743e98d28395a9d4de52faa2e9f0903ac1bd00e2da3e3a86cd6d2b30e
 size 4943162336

 version https://git-lfs.github.com/spec/v1
+oid sha256:68b1e135ad66cee90fef5c9335e8c80b8e60b16254ff5f4e88d3369ebcce96a4
 size 4943162336

model-00002-of-00003.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:af63d2ee6754e3ee87e77fe640326da11423269bd2ad9bf2bfebafb1d19ed797
 size 4999819336

 version https://git-lfs.github.com/spec/v1
+oid sha256:8df5a386b05f0393662aaa5d39d8dd052a22a366fe6f5cd42a0c7bc940898d6e
 size 4999819336

model-00003-of-00003.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:d849ec49660cbf358f514b3da3e123ef0480f7eecd76da2098129ee9e97cc58b
 size 4540516344

 version https://git-lfs.github.com/spec/v1
+oid sha256:202c8e90c2ac2219a17c1bce35622a063977658808c635d326433237022d2ea3
 size 4540516344

runs/Nov10_00-16-16_ip-26-0-155-187/events.out.tfevents.1699575456.ip-26-0-155-187.230765.0 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:3189372cc8c6459ee460d3d31cbaddfb99a40696a85cc9050a23dea2a8e6a339
+size 13430

runs/Nov10_00-16-16_ip-26-0-155-187/events.out.tfevents.1699587432.ip-26-0-155-187.230765.1 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:e2868aa7d42743dcea1cc11cb77830e050620d5fc59cb3c0b74befa9a82dd81e
+size 359

train_results.json CHANGED Viewed

@@ -1,8 +1,8 @@
 {
     "epoch": 0.67,
-    "train_loss": 0.9717074483633041,
-    "train_runtime": 11641.8542,
     "train_samples": 207865,
-    "train_samples_per_second": 17.855,
     "train_steps_per_second": 0.035
 }

 {
     "epoch": 0.67,
+    "train_loss": 0.9717322877224754,
+    "train_runtime": 11645.5121,
     "train_samples": 207865,
+    "train_samples_per_second": 17.849,
     "train_steps_per_second": 0.035
 }

trainer_state.json CHANGED Viewed

@@ -17,25 +17,25 @@
     {
       "epoch": 0.01,
       "learning_rate": 1.999251652147735e-05,
-      "loss": 1.6998,
       "step": 5
     },
     {
       "epoch": 0.02,
       "learning_rate": 1.997007728639956e-05,
-      "loss": 1.1491,
       "step": 10
     },
     {
       "epoch": 0.04,
       "learning_rate": 1.9932715879473385e-05,
-      "loss": 1.0708,
       "step": 15
     },
     {
       "epoch": 0.05,
       "learning_rate": 1.9880488219356086e-05,
-      "loss": 1.0485,
       "step": 20
     },
     {
@@ -59,7 +59,7 @@
     {
       "epoch": 0.1,
       "learning_rate": 1.9524809490566878e-05,
-      "loss": 0.9806,
       "step": 40
     },
     {
@@ -71,7 +71,7 @@
     {
       "epoch": 0.12,
       "learning_rate": 1.926084840336821e-05,
-      "loss": 0.9815,
       "step": 50
     },
     {
@@ -113,7 +113,7 @@
     {
       "epoch": 0.21,
       "learning_rate": 1.791386494010081e-05,
-      "loss": 0.9643,
       "step": 85
     },
     {
@@ -125,7 +125,7 @@
     {
       "epoch": 0.23,
       "learning_rate": 1.7417625312098453e-05,
-      "loss": 0.9443,
       "step": 95
     },
     {
@@ -143,13 +143,13 @@
     {
       "epoch": 0.27,
       "learning_rate": 1.659103377877423e-05,
-      "loss": 0.9497,
       "step": 110
     },
     {
       "epoch": 0.28,
       "learning_rate": 1.629520819706912e-05,
-      "loss": 0.9465,
       "step": 115
     },
     {
@@ -340,9 +340,9 @@
     },
     {
       "epoch": 0.67,
-      "eval_loss": 0.9322993755340576,
-      "eval_runtime": 337.3516,
-      "eval_samples_per_second": 68.504,
       "eval_steps_per_second": 0.537,
       "step": 272
     },
@@ -350,9 +350,9 @@
       "epoch": 0.67,
       "step": 272,
       "total_flos": 455322233733120.0,
-      "train_loss": 0.9717074483633041,
-      "train_runtime": 11641.8542,
-      "train_samples_per_second": 17.855,
       "train_steps_per_second": 0.035
     }
   ],

     {
       "epoch": 0.01,
       "learning_rate": 1.999251652147735e-05,
+      "loss": 1.6995,
       "step": 5
     },
     {
       "epoch": 0.02,
       "learning_rate": 1.997007728639956e-05,
+      "loss": 1.1502,
       "step": 10
     },
     {
       "epoch": 0.04,
       "learning_rate": 1.9932715879473385e-05,
+      "loss": 1.0714,
       "step": 15
     },
     {
       "epoch": 0.05,
       "learning_rate": 1.9880488219356086e-05,
+      "loss": 1.0487,
       "step": 20
     },
     {
     {
       "epoch": 0.1,
       "learning_rate": 1.9524809490566878e-05,
+      "loss": 0.9805,
       "step": 40
     },
     {
     {
       "epoch": 0.12,
       "learning_rate": 1.926084840336821e-05,
+      "loss": 0.9814,
       "step": 50
     },
     {
     {
       "epoch": 0.21,
       "learning_rate": 1.791386494010081e-05,
+      "loss": 0.9642,
       "step": 85
     },
     {
     {
       "epoch": 0.23,
       "learning_rate": 1.7417625312098453e-05,
+      "loss": 0.9444,
       "step": 95
     },
     {
     {
       "epoch": 0.27,
       "learning_rate": 1.659103377877423e-05,
+      "loss": 0.9498,
       "step": 110
     },
     {
       "epoch": 0.28,
       "learning_rate": 1.629520819706912e-05,
+      "loss": 0.9464,
       "step": 115
     },
     {
     },
     {
       "epoch": 0.67,
+      "eval_loss": 0.9322898387908936,
+      "eval_runtime": 337.0923,
+      "eval_samples_per_second": 68.557,
       "eval_steps_per_second": 0.537,
       "step": 272
     },
       "epoch": 0.67,
       "step": 272,
       "total_flos": 455322233733120.0,
+      "train_loss": 0.9717322877224754,
+      "train_runtime": 11645.5121,
+      "train_samples_per_second": 17.849,
       "train_steps_per_second": 0.035
     }
   ],

training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:e6f1c9a0c5c8fa59d877590748d687cb1b42797067ac4868f119c9e310152f11
 size 5624

 version https://git-lfs.github.com/spec/v1
+oid sha256:3c5e5f1c2e60e8566b60a42c429bdeebcc5f5392a53938ef2fe0c39224dde9fc
 size 5624