Upload folder using huggingface_hub

Browse files

Files changed (6) hide show

README.md +1 -1
all_results.json +4 -4
pytorch_model.bin +1 -1
train_results.json +4 -4
trainer_state.json +80 -80
training_args.bin +1 -1

README.md CHANGED Viewed

@@ -31,7 +31,7 @@ More information needed
 ### Training hyperparameters
 The following hyperparameters were used during training:
-- learning_rate: 1e-05
 - train_batch_size: 1
 - eval_batch_size: 1
 - seed: 42

 ### Training hyperparameters
 The following hyperparameters were used during training:
+- learning_rate: 0.0001
 - train_batch_size: 1
 - eval_batch_size: 1
 - seed: 42

all_results.json CHANGED Viewed

@@ -1,8 +1,8 @@
 {
     "epoch": 4.94,
-    "train_loss": 2.042334004452354,
-    "train_runtime": 318.1284,
     "train_samples": 308,
-    "train_samples_per_second": 4.841,
-    "train_steps_per_second": 0.597
 }

 {
     "epoch": 4.94,
+    "train_loss": 1.8531885046707957,
+    "train_runtime": 316.8119,
     "train_samples": 308,
+    "train_samples_per_second": 4.861,
+    "train_steps_per_second": 0.6
 }

pytorch_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:b01c7704f3eac1238c897e633f9b20a7acce4704430aacf188f1e033cca89ca3
 size 70790896

 version https://git-lfs.github.com/spec/v1
+oid sha256:ad702168f0b67fd888c2bb6105e476b05e9177a34a0e086f08f683810380922f
 size 70790896

train_results.json CHANGED Viewed

@@ -1,8 +1,8 @@
 {
     "epoch": 4.94,
-    "train_loss": 2.042334004452354,
-    "train_runtime": 318.1284,
     "train_samples": 308,
-    "train_samples_per_second": 4.841,
-    "train_steps_per_second": 0.597
 }

 {
     "epoch": 4.94,
+    "train_loss": 1.8531885046707957,
+    "train_runtime": 316.8119,
     "train_samples": 308,
+    "train_samples_per_second": 4.861,
+    "train_steps_per_second": 0.6
 }

trainer_state.json CHANGED Viewed

@@ -10,240 +10,240 @@
   "log_history": [
     {
       "epoch": 0.13,
-      "learning_rate": 1e-05,
-      "loss": 2.0916,
       "step": 5
     },
     {
       "epoch": 0.26,
-      "learning_rate": 1e-05,
-      "loss": 2.0612,
       "step": 10
     },
     {
       "epoch": 0.39,
-      "learning_rate": 1e-05,
-      "loss": 2.0475,
       "step": 15
     },
     {
       "epoch": 0.52,
-      "learning_rate": 1e-05,
-      "loss": 2.113,
       "step": 20
     },
     {
       "epoch": 0.65,
-      "learning_rate": 1e-05,
-      "loss": 2.0671,
       "step": 25
     },
     {
       "epoch": 0.78,
-      "learning_rate": 1e-05,
-      "loss": 2.0571,
       "step": 30
     },
     {
       "epoch": 0.91,
-      "learning_rate": 1e-05,
-      "loss": 2.1778,
       "step": 35
     },
     {
       "epoch": 1.04,
-      "learning_rate": 1e-05,
-      "loss": 1.9966,
       "step": 40
     },
     {
       "epoch": 1.17,
-      "learning_rate": 1e-05,
-      "loss": 2.1532,
       "step": 45
     },
     {
       "epoch": 1.3,
-      "learning_rate": 1e-05,
-      "loss": 2.0544,
       "step": 50
     },
     {
       "epoch": 1.43,
-      "learning_rate": 1e-05,
-      "loss": 2.0557,
       "step": 55
     },
     {
       "epoch": 1.56,
-      "learning_rate": 1e-05,
-      "loss": 1.9958,
       "step": 60
     },
     {
       "epoch": 1.69,
-      "learning_rate": 1e-05,
-      "loss": 2.0753,
       "step": 65
     },
     {
       "epoch": 1.82,
-      "learning_rate": 1e-05,
-      "loss": 2.0377,
       "step": 70
     },
     {
       "epoch": 1.95,
-      "learning_rate": 1e-05,
-      "loss": 2.0342,
       "step": 75
     },
     {
       "epoch": 2.08,
-      "learning_rate": 1e-05,
-      "loss": 2.0771,
       "step": 80
     },
     {
       "epoch": 2.21,
-      "learning_rate": 1e-05,
-      "loss": 2.0425,
       "step": 85
     },
     {
       "epoch": 2.34,
-      "learning_rate": 1e-05,
-      "loss": 2.0426,
       "step": 90
     },
     {
       "epoch": 2.47,
-      "learning_rate": 1e-05,
-      "loss": 2.0426,
       "step": 95
     },
     {
       "epoch": 2.6,
-      "learning_rate": 1e-05,
-      "loss": 2.0512,
       "step": 100
     },
     {
       "epoch": 2.73,
-      "learning_rate": 1e-05,
-      "loss": 2.0731,
       "step": 105
     },
     {
       "epoch": 2.86,
-      "learning_rate": 1e-05,
-      "loss": 2.0021,
       "step": 110
     },
     {
       "epoch": 2.99,
-      "learning_rate": 1e-05,
-      "loss": 2.01,
       "step": 115
     },
     {
       "epoch": 3.12,
-      "learning_rate": 1e-05,
-      "loss": 2.0817,
       "step": 120
     },
     {
       "epoch": 3.25,
-      "learning_rate": 1e-05,
-      "loss": 1.9851,
       "step": 125
     },
     {
       "epoch": 3.38,
-      "learning_rate": 1e-05,
-      "loss": 2.0813,
       "step": 130
     },
     {
       "epoch": 3.51,
-      "learning_rate": 1e-05,
-      "loss": 1.9777,
       "step": 135
     },
     {
       "epoch": 3.64,
-      "learning_rate": 1e-05,
-      "loss": 2.0708,
       "step": 140
     },
     {
       "epoch": 3.77,
-      "learning_rate": 1e-05,
-      "loss": 1.9515,
       "step": 145
     },
     {
       "epoch": 3.9,
-      "learning_rate": 1e-05,
-      "loss": 2.0794,
       "step": 150
     },
     {
       "epoch": 4.03,
-      "learning_rate": 1e-05,
-      "loss": 1.9146,
       "step": 155
     },
     {
       "epoch": 4.16,
-      "learning_rate": 1e-05,
-      "loss": 2.0522,
       "step": 160
     },
     {
       "epoch": 4.29,
-      "learning_rate": 1e-05,
-      "loss": 1.9599,
       "step": 165
     },
     {
       "epoch": 4.42,
-      "learning_rate": 1e-05,
-      "loss": 1.9645,
       "step": 170
     },
     {
       "epoch": 4.55,
-      "learning_rate": 1e-05,
-      "loss": 1.9873,
       "step": 175
     },
     {
       "epoch": 4.68,
-      "learning_rate": 1e-05,
-      "loss": 2.0311,
       "step": 180
     },
     {
       "epoch": 4.81,
-      "learning_rate": 1e-05,
-      "loss": 2.0541,
       "step": 185
     },
     {
       "epoch": 4.94,
-      "learning_rate": 1e-05,
-      "loss": 2.0583,
       "step": 190
     },
     {
       "epoch": 4.94,
       "step": 190,
       "total_flos": 697572311040000.0,
-      "train_loss": 2.042334004452354,
-      "train_runtime": 318.1284,
-      "train_samples_per_second": 4.841,
-      "train_steps_per_second": 0.597
     }
   ],
   "logging_steps": 5,

   "log_history": [
     {
       "epoch": 0.13,
+      "learning_rate": 0.0001,
+      "loss": 2.0038,
       "step": 5
     },
     {
       "epoch": 0.26,
+      "learning_rate": 0.0001,
+      "loss": 1.9796,
       "step": 10
     },
     {
       "epoch": 0.39,
+      "learning_rate": 0.0001,
+      "loss": 1.9617,
       "step": 15
     },
     {
       "epoch": 0.52,
+      "learning_rate": 0.0001,
+      "loss": 2.0267,
       "step": 20
     },
     {
       "epoch": 0.65,
+      "learning_rate": 0.0001,
+      "loss": 1.9767,
       "step": 25
     },
     {
       "epoch": 0.78,
+      "learning_rate": 0.0001,
+      "loss": 1.9649,
       "step": 30
     },
     {
       "epoch": 0.91,
+      "learning_rate": 0.0001,
+      "loss": 2.0785,
       "step": 35
     },
     {
       "epoch": 1.04,
+      "learning_rate": 0.0001,
+      "loss": 1.8929,
       "step": 40
     },
     {
       "epoch": 1.17,
+      "learning_rate": 0.0001,
+      "loss": 1.9942,
       "step": 45
     },
     {
       "epoch": 1.3,
+      "learning_rate": 0.0001,
+      "loss": 1.8956,
       "step": 50
     },
     {
       "epoch": 1.43,
+      "learning_rate": 0.0001,
+      "loss": 1.8971,
       "step": 55
     },
     {
       "epoch": 1.56,
+      "learning_rate": 0.0001,
+      "loss": 1.8397,
       "step": 60
     },
     {
       "epoch": 1.69,
+      "learning_rate": 0.0001,
+      "loss": 1.9135,
       "step": 65
     },
     {
       "epoch": 1.82,
+      "learning_rate": 0.0001,
+      "loss": 1.8782,
       "step": 70
     },
     {
       "epoch": 1.95,
+      "learning_rate": 0.0001,
+      "loss": 1.8756,
       "step": 75
     },
     {
       "epoch": 2.08,
+      "learning_rate": 0.0001,
+      "loss": 1.887,
       "step": 80
     },
     {
       "epoch": 2.21,
+      "learning_rate": 0.0001,
+      "loss": 1.8408,
       "step": 85
     },
     {
       "epoch": 2.34,
+      "learning_rate": 0.0001,
+      "loss": 1.8352,
       "step": 90
     },
     {
       "epoch": 2.47,
+      "learning_rate": 0.0001,
+      "loss": 1.8403,
       "step": 95
     },
     {
       "epoch": 2.6,
+      "learning_rate": 0.0001,
+      "loss": 1.8519,
       "step": 100
     },
     {
       "epoch": 2.73,
+      "learning_rate": 0.0001,
+      "loss": 1.8683,
       "step": 105
     },
     {
       "epoch": 2.86,
+      "learning_rate": 0.0001,
+      "loss": 1.8082,
       "step": 110
     },
     {
       "epoch": 2.99,
+      "learning_rate": 0.0001,
+      "loss": 1.811,
       "step": 115
     },
     {
       "epoch": 3.12,
+      "learning_rate": 0.0001,
+      "loss": 1.8451,
       "step": 120
     },
     {
       "epoch": 3.25,
+      "learning_rate": 0.0001,
+      "loss": 1.7562,
       "step": 125
     },
     {
       "epoch": 3.38,
+      "learning_rate": 0.0001,
+      "loss": 1.8435,
       "step": 130
     },
     {
       "epoch": 3.51,
+      "learning_rate": 0.0001,
+      "loss": 1.7416,
       "step": 135
     },
     {
       "epoch": 3.64,
+      "learning_rate": 0.0001,
+      "loss": 1.8242,
       "step": 140
     },
     {
       "epoch": 3.77,
+      "learning_rate": 0.0001,
+      "loss": 1.7191,
       "step": 145
     },
     {
       "epoch": 3.9,
+      "learning_rate": 0.0001,
+      "loss": 1.8372,
       "step": 150
     },
     {
       "epoch": 4.03,
+      "learning_rate": 0.0001,
+      "loss": 1.6897,
       "step": 155
     },
     {
       "epoch": 4.16,
+      "learning_rate": 0.0001,
+      "loss": 1.7764,
       "step": 160
     },
     {
       "epoch": 4.29,
+      "learning_rate": 0.0001,
+      "loss": 1.7044,
       "step": 165
     },
     {
       "epoch": 4.42,
+      "learning_rate": 0.0001,
+      "loss": 1.6948,
       "step": 170
     },
     {
       "epoch": 4.55,
+      "learning_rate": 0.0001,
+      "loss": 1.7268,
       "step": 175
     },
     {
       "epoch": 4.68,
+      "learning_rate": 0.0001,
+      "loss": 1.7703,
       "step": 180
     },
     {
       "epoch": 4.81,
+      "learning_rate": 0.0001,
+      "loss": 1.7836,
       "step": 185
     },
     {
       "epoch": 4.94,
+      "learning_rate": 0.0001,
+      "loss": 1.7871,
       "step": 190
     },
     {
       "epoch": 4.94,
       "step": 190,
       "total_flos": 697572311040000.0,
+      "train_loss": 1.8531885046707957,
+      "train_runtime": 316.8119,
+      "train_samples_per_second": 4.861,
+      "train_steps_per_second": 0.6
     }
   ],
   "logging_steps": 5,

training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:14c4ad59d2bec1733b3950f3135d8f641dadbdde098573f9f64da556199a2758
 size 4027

 version https://git-lfs.github.com/spec/v1
+oid sha256:5c04da5cc7864cd267f0243eae8f6136695c817d3986296d85802aa7795263ac
 size 4027