horsbug98
/

Part_1_mBERT_Model_E1

Question Answering

Generated from Trainer

Inference Endpoints

Model card Files Files and versions Community

horsbug98 commited on Mar 16, 2022

Commit

e8b02f7

•

1 Parent(s): 074529d

Upload trainer_state.json

Files changed (1) hide show

trainer_state.json +57 -15

trainer_state.json CHANGED Viewed

@@ -2,36 +2,78 @@
   "best_metric": null,
   "best_model_checkpoint": null,
   "epoch": 1.0,
-  "global_step": 1242,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
   "log_history": [
     {
-      "epoch": 0.4,
-      "learning_rate": 1.7922705314009663e-05,
-      "loss": 1.5077,
       "step": 500
     },
     {
-      "epoch": 0.81,
-      "learning_rate": 5.845410628019324e-06,
-      "loss": 1.2752,
       "step": 1000
     },
     {
       "epoch": 1.0,
-      "step": 1242,
-      "total_flos": 2920187229092352.0,
-      "train_loss": 1.3494737904620824,
-      "train_runtime": 616.7037,
-      "train_samples_per_second": 24.162,
-      "train_steps_per_second": 2.014
     }
   ],
-  "max_steps": 1242,
   "num_train_epochs": 1,
-  "total_flos": 2920187229092352.0,
   "trial_name": null,
   "trial_params": null
 }

   "best_metric": null,
   "best_model_checkpoint": null,
   "epoch": 1.0,
+  "global_step": 4685,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
   "log_history": [
     {
+      "epoch": 0.11,
+      "learning_rate": 2.67982924226254e-05,
+      "loss": 2.2761,
       "step": 500
     },
     {
+      "epoch": 0.21,
+      "learning_rate": 2.35965848452508e-05,
+      "loss": 1.6473,
       "step": 1000
     },
+    {
+      "epoch": 0.32,
+      "learning_rate": 2.0394877267876203e-05,
+      "loss": 1.5402,
+      "step": 1500
+    },
+    {
+      "epoch": 0.43,
+      "learning_rate": 1.7193169690501603e-05,
+      "loss": 1.4675,
+      "step": 2000
+    },
+    {
+      "epoch": 0.53,
+      "learning_rate": 1.3991462113127e-05,
+      "loss": 1.4086,
+      "step": 2500
+    },
+    {
+      "epoch": 0.64,
+      "learning_rate": 1.0789754535752402e-05,
+      "loss": 1.3708,
+      "step": 3000
+    },
+    {
+      "epoch": 0.75,
+      "learning_rate": 7.588046958377802e-06,
+      "loss": 1.3538,
+      "step": 3500
+    },
+    {
+      "epoch": 0.85,
+      "learning_rate": 4.386339381003202e-06,
+      "loss": 1.2966,
+      "step": 4000
+    },
+    {
+      "epoch": 0.96,
+      "learning_rate": 1.1846318036286021e-06,
+      "loss": 1.2822,
+      "step": 4500
+    },
     {
       "epoch": 1.0,
+      "step": 4685,
+      "total_flos": 1.1016793857503232e+16,
+      "train_loss": 1.5054649426308615,
+      "train_runtime": 2424.9282,
+      "train_samples_per_second": 23.183,
+      "train_steps_per_second": 1.932
     }
   ],
+  "max_steps": 4685,
   "num_train_epochs": 1,
+  "total_flos": 1.1016793857503232e+16,
   "trial_name": null,
   "trial_params": null
 }