loss 0.6

Browse files

Files changed (4) hide show

optimizer.pt +1 -1
pytorch_model.bin +1 -1
trainer_state.json +20 -20
training_args.bin +1 -1

optimizer.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:f47f9dfd4db9c9ec151a63abad536764855bc77ae7c5b51d92a7ac5356d68ac7
 size 1376950965

 version https://git-lfs.github.com/spec/v1
+oid sha256:8f026eda995519627803ace49004b3bc7ea09e4718d606ea2a985c1aa49bec92
 size 1376950965

pytorch_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:e18c81df99acab8af427dd3790e53aeb09b6ade90fb6de29bdb78209b43d114b
 size 688496379

 version https://git-lfs.github.com/spec/v1
+oid sha256:4af008a4fb55ce22292b6d47f4f921949c51109b77f9094d3ec89f3c9810fcac
 size 688496379

trainer_state.json CHANGED Viewed

@@ -10,121 +10,121 @@
     {
       "epoch": 0.01,
       "learning_rate": 0.0006992397089171283,
-      "loss": 0.6909,
       "step": 100
     },
     {
       "epoch": 0.02,
       "learning_rate": 0.0006984794178342565,
-      "loss": 0.7334,
       "step": 200
     },
     {
       "epoch": 0.03,
       "learning_rate": 0.0006977191267513849,
-      "loss": 0.7397,
       "step": 300
     },
     {
       "epoch": 0.04,
       "learning_rate": 0.0006969588356685131,
-      "loss": 0.7262,
       "step": 400
     },
     {
       "epoch": 0.05,
       "learning_rate": 0.0006961985445856413,
-      "loss": 0.7232,
       "step": 500
     },
     {
       "epoch": 0.07,
       "learning_rate": 0.0006954382535027696,
-      "loss": 0.7182,
       "step": 600
     },
     {
       "epoch": 0.08,
       "learning_rate": 0.0006946779624198979,
-      "loss": 0.7438,
       "step": 700
     },
     {
       "epoch": 0.09,
       "learning_rate": 0.0006939176713370262,
-      "loss": 0.7207,
       "step": 800
     },
     {
       "epoch": 0.1,
       "learning_rate": 0.0006931573802541545,
-      "loss": 0.7147,
       "step": 900
     },
     {
       "epoch": 0.11,
       "learning_rate": 0.0006923970891712827,
-      "loss": 0.7547,
       "step": 1000
     },
     {
       "epoch": 0.12,
       "learning_rate": 0.0006916367980884109,
-      "loss": 0.7609,
       "step": 1100
     },
     {
       "epoch": 0.13,
       "learning_rate": 0.0006908765070055393,
-      "loss": 0.7163,
       "step": 1200
     },
     {
       "epoch": 0.14,
       "learning_rate": 0.0006901162159226675,
-      "loss": 0.7518,
       "step": 1300
     },
     {
       "epoch": 0.15,
       "learning_rate": 0.0006893559248397958,
-      "loss": 0.7698,
       "step": 1400
     },
     {
       "epoch": 0.16,
       "learning_rate": 0.0006885956337569241,
-      "loss": 0.7327,
       "step": 1500
     },
     {
       "epoch": 0.17,
       "learning_rate": 0.0006878353426740524,
-      "loss": 0.7871,
       "step": 1600
     },
     {
       "epoch": 0.18,
       "learning_rate": 0.0006870750515911806,
-      "loss": 0.7908,
       "step": 1700
     },
     {
       "epoch": 0.2,
       "learning_rate": 0.0006863147605083089,
-      "loss": 0.7646,
       "step": 1800
     },
     {
       "epoch": 0.21,
       "learning_rate": 0.0006855544694254371,
-      "loss": 0.7677,
       "step": 1900
     },
     {
       "epoch": 0.22,
       "learning_rate": 0.0006847941783425654,
-      "loss": 0.7533,
       "step": 2000
     }
   ],

     {
       "epoch": 0.01,
       "learning_rate": 0.0006992397089171283,
+      "loss": 0.5664,
       "step": 100
     },
     {
       "epoch": 0.02,
       "learning_rate": 0.0006984794178342565,
+      "loss": 0.5958,
       "step": 200
     },
     {
       "epoch": 0.03,
       "learning_rate": 0.0006977191267513849,
+      "loss": 0.599,
       "step": 300
     },
     {
       "epoch": 0.04,
       "learning_rate": 0.0006969588356685131,
+      "loss": 0.6111,
       "step": 400
     },
     {
       "epoch": 0.05,
       "learning_rate": 0.0006961985445856413,
+      "loss": 0.5763,
       "step": 500
     },
     {
       "epoch": 0.07,
       "learning_rate": 0.0006954382535027696,
+      "loss": 0.6012,
       "step": 600
     },
     {
       "epoch": 0.08,
       "learning_rate": 0.0006946779624198979,
+      "loss": 0.6054,
       "step": 700
     },
     {
       "epoch": 0.09,
       "learning_rate": 0.0006939176713370262,
+      "loss": 0.5922,
       "step": 800
     },
     {
       "epoch": 0.1,
       "learning_rate": 0.0006931573802541545,
+      "loss": 0.5865,
       "step": 900
     },
     {
       "epoch": 0.11,
       "learning_rate": 0.0006923970891712827,
+      "loss": 0.6263,
       "step": 1000
     },
     {
       "epoch": 0.12,
       "learning_rate": 0.0006916367980884109,
+      "loss": 0.6332,
       "step": 1100
     },
     {
       "epoch": 0.13,
       "learning_rate": 0.0006908765070055393,
+      "loss": 0.618,
       "step": 1200
     },
     {
       "epoch": 0.14,
       "learning_rate": 0.0006901162159226675,
+      "loss": 0.6272,
       "step": 1300
     },
     {
       "epoch": 0.15,
       "learning_rate": 0.0006893559248397958,
+      "loss": 0.6505,
       "step": 1400
     },
     {
       "epoch": 0.16,
       "learning_rate": 0.0006885956337569241,
+      "loss": 0.6179,
       "step": 1500
     },
     {
       "epoch": 0.17,
       "learning_rate": 0.0006878353426740524,
+      "loss": 0.6509,
       "step": 1600
     },
     {
       "epoch": 0.18,
       "learning_rate": 0.0006870750515911806,
+      "loss": 0.6487,
       "step": 1700
     },
     {
       "epoch": 0.2,
       "learning_rate": 0.0006863147605083089,
+      "loss": 0.6341,
       "step": 1800
     },
     {
       "epoch": 0.21,
       "learning_rate": 0.0006855544694254371,
+      "loss": 0.6408,
       "step": 1900
     },
     {
       "epoch": 0.22,
       "learning_rate": 0.0006847941783425654,
+      "loss": 0.6413,
       "step": 2000
     }
   ],

training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:4bf29105b2f1e653c8eadf07726bc244d198013decfeabceefd5896a51895501
 size 2607

 version https://git-lfs.github.com/spec/v1
+oid sha256:cde6ae4d30903dd742743295e31cc8a8412a32ae7919684e13e6a12099005672
 size 2607