re-trained mutlitask model to align it with the singletask ones

Files changed (5) hide show

all_results.json CHANGED Viewed

@@ -1,9 +1,9 @@
 {
     "epoch": 2.0,
     "total_flos": 1.0506418329673728e+16,
-    "train_loss": 1.2171453878437424,
-    "train_runtime": 2739.982,
     "train_samples": 32526,
-    "train_samples_per_second": 23.742,
-    "train_steps_per_second": 2.968
 }

 {
     "epoch": 2.0,
     "total_flos": 1.0506418329673728e+16,
+    "train_loss": 1.2627147819042441,
+    "train_runtime": 2692.7589,
     "train_samples": 32526,
+    "train_samples_per_second": 24.158,
+    "train_steps_per_second": 3.02
 }

pytorch_model.bin DELETED Viewed

@@ -1,3 +0,0 @@
-version https://git-lfs.github.com/spec/v1
-oid sha256:b3eaa0d748919f005e35eacce9d318c2c877d5927c80de9aa517279ea615dfbb
-size 990253005

train_results.json CHANGED Viewed

@@ -1,9 +1,9 @@
 {
     "epoch": 2.0,
     "total_flos": 1.0506418329673728e+16,
-    "train_loss": 1.2171453878437424,
-    "train_runtime": 2739.982,
     "train_samples": 32526,
-    "train_samples_per_second": 23.742,
-    "train_steps_per_second": 2.968
 }

 {
     "epoch": 2.0,
     "total_flos": 1.0506418329673728e+16,
+    "train_loss": 1.2627147819042441,
+    "train_runtime": 2692.7589,
     "train_samples": 32526,
+    "train_samples_per_second": 24.158,
+    "train_steps_per_second": 3.02
 }

trainer_state.json CHANGED Viewed

@@ -10,23 +10,23 @@
     {
       "epoch": 1.0,
       "learning_rate": 5e-06,
-      "loss": 2.0403,
       "step": 4066
     },
     {
       "epoch": 2.0,
       "learning_rate": 0.0,
-      "loss": 0.394,
       "step": 8132
     },
     {
       "epoch": 2.0,
       "step": 8132,
       "total_flos": 1.0506418329673728e+16,
-      "train_loss": 1.2171453878437424,
-      "train_runtime": 2739.982,
-      "train_samples_per_second": 23.742,
-      "train_steps_per_second": 2.968
     }
   ],
   "max_steps": 8132,

     {
       "epoch": 1.0,
       "learning_rate": 5e-06,
+      "loss": 2.1304,
       "step": 4066
     },
     {
       "epoch": 2.0,
       "learning_rate": 0.0,
+      "loss": 0.395,
       "step": 8132
     },
     {
       "epoch": 2.0,
       "step": 8132,
       "total_flos": 1.0506418329673728e+16,
+      "train_loss": 1.2627147819042441,
+      "train_runtime": 2692.7589,
+      "train_samples_per_second": 24.158,
+      "train_steps_per_second": 3.02
     }
   ],
   "max_steps": 8132,

training_args.bin CHANGED Viewed

Binary files a/training_args.bin and b/training_args.bin differ