Upload 11 files

Browse files

Files changed (11) hide show

adapter_config.json +16 -0
adapter_model.bin +3 -0
all_results.json +11 -0
eval_results.json +7 -0
finetuning_args.json +11 -0
train_results.json +7 -0
trainer_log.jsonl +453 -0
trainer_state.json +3103 -0
training_args.bin +3 -0
training_eval_loss.png +0 -0
training_loss.png +0 -0

adapter_config.json ADDED Viewed

	@@ -0,0 +1,16 @@

+{
+  "base_model_name_or_path": "baichuan-inc/baichuan-7B",
+  "bias": "none",
+  "fan_in_fan_out": false,
+  "inference_mode": true,
+  "init_lora_weights": true,
+  "lora_alpha": 32.0,
+  "lora_dropout": 0.1,
+  "modules_to_save": null,
+  "peft_type": "LORA",
+  "r": 8,
+  "target_modules": [
+    "W_pack"
+  ],
+  "task_type": "CAUSAL_LM"
+}

adapter_model.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:a608b5ca80729ecaa032ad0bfe6b80b33f842f62f183aab7f47d56475108c113
+size 16799153

all_results.json ADDED Viewed

	@@ -0,0 +1,11 @@

+{
+    "epoch": 3.0,
+    "eval_loss": 1.3997734785079956,
+    "eval_runtime": 19.9371,
+    "eval_samples_per_second": 24.527,
+    "eval_steps_per_second": 6.169,
+    "train_loss": 1.4043121354732555,
+    "train_runtime": 20600.2987,
+    "train_samples_per_second": 7.038,
+    "train_steps_per_second": 0.22
+}

eval_results.json ADDED Viewed

	@@ -0,0 +1,7 @@

+{
+    "epoch": 3.0,
+    "eval_loss": 1.3997734785079956,
+    "eval_runtime": 19.9371,
+    "eval_samples_per_second": 24.527,
+    "eval_steps_per_second": 6.169
+}

finetuning_args.json ADDED Viewed

	@@ -0,0 +1,11 @@

+{
+  "finetuning_type": "lora",
+  "lora_alpha": 32.0,
+  "lora_dropout": 0.1,
+  "lora_rank": 8,
+  "lora_target": [
+    "W_pack"
+  ],
+  "name_module_trainable": "mlp",
+  "num_layer_trainable": 3
+}

train_results.json ADDED Viewed

	@@ -0,0 +1,7 @@

+{
+    "epoch": 3.0,
+    "train_loss": 1.4043121354732555,
+    "train_runtime": 20600.2987,
+    "train_samples_per_second": 7.038,
+    "train_steps_per_second": 0.22
+}

trainer_log.jsonl ADDED Viewed

	@@ -0,0 +1,453 @@

+{"current_steps": 10, "total_steps": 4530, "loss": 1.6257, "reward": null, "learning_rate": 4.999939881018594e-05, "epoch": 0.01, "percentage": 0.22, "elapsed_time": "0:00:48", "remaining_time": "6:04:04"}
+{"current_steps": 20, "total_steps": 4530, "loss": 1.6388, "reward": null, "learning_rate": 4.999759526965809e-05, "epoch": 0.01, "percentage": 0.44, "elapsed_time": "0:01:33", "remaining_time": "5:49:40"}
+{"current_steps": 30, "total_steps": 4530, "loss": 1.5034, "reward": null, "learning_rate": 4.999458946515808e-05, "epoch": 0.02, "percentage": 0.66, "elapsed_time": "0:02:18", "remaining_time": "5:46:24"}
+{"current_steps": 40, "total_steps": 4530, "loss": 1.5761, "reward": null, "learning_rate": 4.999038154125061e-05, "epoch": 0.03, "percentage": 0.88, "elapsed_time": "0:03:01", "remaining_time": "5:40:03"}
+{"current_steps": 50, "total_steps": 4530, "loss": 1.5066, "reward": null, "learning_rate": 4.998497170031657e-05, "epoch": 0.03, "percentage": 1.1, "elapsed_time": "0:03:42", "remaining_time": "5:32:10"}
+{"current_steps": 60, "total_steps": 4530, "loss": 1.5738, "reward": null, "learning_rate": 4.997836020254328e-05, "epoch": 0.04, "percentage": 1.32, "elapsed_time": "0:04:24", "remaining_time": "5:28:48"}
+{"current_steps": 70, "total_steps": 4530, "loss": 1.4921, "reward": null, "learning_rate": 4.9970547365911925e-05, "epoch": 0.05, "percentage": 1.55, "elapsed_time": "0:05:10", "remaining_time": "5:29:44"}
+{"current_steps": 80, "total_steps": 4530, "loss": 1.4508, "reward": null, "learning_rate": 4.996153356618233e-05, "epoch": 0.05, "percentage": 1.77, "elapsed_time": "0:05:55", "remaining_time": "5:29:27"}
+{"current_steps": 90, "total_steps": 4530, "loss": 1.4714, "reward": null, "learning_rate": 4.995131923687488e-05, "epoch": 0.06, "percentage": 1.99, "elapsed_time": "0:06:39", "remaining_time": "5:28:16"}
+{"current_steps": 100, "total_steps": 4530, "loss": 1.494, "reward": null, "learning_rate": 4.9939904869249616e-05, "epoch": 0.07, "percentage": 2.21, "elapsed_time": "0:07:23", "remaining_time": "5:27:38"}
+{"current_steps": 110, "total_steps": 4530, "loss": 1.4934, "reward": null, "learning_rate": 4.992729101228267e-05, "epoch": 0.07, "percentage": 2.43, "elapsed_time": "0:08:27", "remaining_time": "5:39:45"}
+{"current_steps": 120, "total_steps": 4530, "loss": 1.4789, "reward": null, "learning_rate": 4.991347827263982e-05, "epoch": 0.08, "percentage": 2.65, "elapsed_time": "0:09:09", "remaining_time": "5:36:30"}
+{"current_steps": 130, "total_steps": 4530, "loss": 1.4511, "reward": null, "learning_rate": 4.9898467314647356e-05, "epoch": 0.09, "percentage": 2.87, "elapsed_time": "0:09:52", "remaining_time": "5:34:17"}
+{"current_steps": 140, "total_steps": 4530, "loss": 1.4876, "reward": null, "learning_rate": 4.9882258860260065e-05, "epoch": 0.09, "percentage": 3.09, "elapsed_time": "0:10:35", "remaining_time": "5:32:00"}
+{"current_steps": 150, "total_steps": 4530, "loss": 1.5124, "reward": null, "learning_rate": 4.9864853689026556e-05, "epoch": 0.1, "percentage": 3.31, "elapsed_time": "0:11:18", "remaining_time": "5:30:00"}
+{"current_steps": 160, "total_steps": 4530, "loss": 1.4772, "reward": null, "learning_rate": 4.984625263805178e-05, "epoch": 0.11, "percentage": 3.53, "elapsed_time": "0:12:00", "remaining_time": "5:28:04"}
+{"current_steps": 170, "total_steps": 4530, "loss": 1.436, "reward": null, "learning_rate": 4.982645660195671e-05, "epoch": 0.11, "percentage": 3.75, "elapsed_time": "0:12:44", "remaining_time": "5:26:50"}
+{"current_steps": 180, "total_steps": 4530, "loss": 1.4377, "reward": null, "learning_rate": 4.9805466532835376e-05, "epoch": 0.12, "percentage": 3.97, "elapsed_time": "0:13:26", "remaining_time": "5:24:57"}
+{"current_steps": 190, "total_steps": 4530, "loss": 1.438, "reward": null, "learning_rate": 4.978328344020904e-05, "epoch": 0.13, "percentage": 4.19, "elapsed_time": "0:14:10", "remaining_time": "5:23:46"}
+{"current_steps": 200, "total_steps": 4530, "loss": 1.4448, "reward": null, "learning_rate": 4.975990839097764e-05, "epoch": 0.13, "percentage": 4.42, "elapsed_time": "0:14:52", "remaining_time": "5:22:08"}
+{"current_steps": 210, "total_steps": 4530, "loss": 1.452, "reward": null, "learning_rate": 4.973534250936851e-05, "epoch": 0.14, "percentage": 4.64, "elapsed_time": "0:15:58", "remaining_time": "5:28:29"}
+{"current_steps": 220, "total_steps": 4530, "loss": 1.4813, "reward": null, "learning_rate": 4.970958697688226e-05, "epoch": 0.15, "percentage": 4.86, "elapsed_time": "0:16:42", "remaining_time": "5:27:26"}
+{"current_steps": 230, "total_steps": 4530, "loss": 1.41, "reward": null, "learning_rate": 4.9682643032235996e-05, "epoch": 0.15, "percentage": 5.08, "elapsed_time": "0:17:26", "remaining_time": "5:26:12"}
+{"current_steps": 240, "total_steps": 4530, "loss": 1.428, "reward": null, "learning_rate": 4.965451197130373e-05, "epoch": 0.16, "percentage": 5.3, "elapsed_time": "0:18:12", "remaining_time": "5:25:21"}
+{"current_steps": 250, "total_steps": 4530, "loss": 1.463, "reward": null, "learning_rate": 4.9625195147054034e-05, "epoch": 0.17, "percentage": 5.52, "elapsed_time": "0:18:56", "remaining_time": "5:24:16"}
+{"current_steps": 260, "total_steps": 4530, "loss": 1.4821, "reward": null, "learning_rate": 4.9594693969485006e-05, "epoch": 0.17, "percentage": 5.74, "elapsed_time": "0:19:39", "remaining_time": "5:22:51"}
+{"current_steps": 270, "total_steps": 4530, "loss": 1.4855, "reward": null, "learning_rate": 4.956300990555643e-05, "epoch": 0.18, "percentage": 5.96, "elapsed_time": "0:20:25", "remaining_time": "5:22:10"}
+{"current_steps": 280, "total_steps": 4530, "loss": 1.4322, "reward": null, "learning_rate": 4.9530144479119215e-05, "epoch": 0.19, "percentage": 6.18, "elapsed_time": "0:21:09", "remaining_time": "5:21:15"}
+{"current_steps": 290, "total_steps": 4530, "loss": 1.4397, "reward": null, "learning_rate": 4.9496099270842145e-05, "epoch": 0.19, "percentage": 6.4, "elapsed_time": "0:21:51", "remaining_time": "5:19:40"}
+{"current_steps": 300, "total_steps": 4530, "loss": 1.4107, "reward": null, "learning_rate": 4.9460875918135804e-05, "epoch": 0.2, "percentage": 6.62, "elapsed_time": "0:22:35", "remaining_time": "5:18:27"}
+{"current_steps": 310, "total_steps": 4530, "loss": 1.4722, "reward": null, "learning_rate": 4.942447611507386e-05, "epoch": 0.21, "percentage": 6.84, "elapsed_time": "0:23:37", "remaining_time": "5:21:34"}
+{"current_steps": 320, "total_steps": 4530, "loss": 1.423, "reward": null, "learning_rate": 4.938690161231159e-05, "epoch": 0.21, "percentage": 7.06, "elapsed_time": "0:24:21", "remaining_time": "5:20:30"}
+{"current_steps": 330, "total_steps": 4530, "loss": 1.4288, "reward": null, "learning_rate": 4.934815421700165e-05, "epoch": 0.22, "percentage": 7.28, "elapsed_time": "0:25:05", "remaining_time": "5:19:25"}
+{"current_steps": 340, "total_steps": 4530, "loss": 1.4294, "reward": null, "learning_rate": 4.9308235792707194e-05, "epoch": 0.23, "percentage": 7.51, "elapsed_time": "0:25:51", "remaining_time": "5:18:43"}
+{"current_steps": 350, "total_steps": 4530, "loss": 1.4233, "reward": null, "learning_rate": 4.9267148259312224e-05, "epoch": 0.23, "percentage": 7.73, "elapsed_time": "0:26:38", "remaining_time": "5:18:12"}
+{"current_steps": 360, "total_steps": 4530, "loss": 1.4553, "reward": null, "learning_rate": 4.9224893592929275e-05, "epoch": 0.24, "percentage": 7.95, "elapsed_time": "0:27:19", "remaining_time": "5:16:36"}
+{"current_steps": 370, "total_steps": 4530, "loss": 1.4206, "reward": null, "learning_rate": 4.9181473825804346e-05, "epoch": 0.24, "percentage": 8.17, "elapsed_time": "0:28:03", "remaining_time": "5:15:24"}
+{"current_steps": 380, "total_steps": 4530, "loss": 1.442, "reward": null, "learning_rate": 4.913689104621917e-05, "epoch": 0.25, "percentage": 8.39, "elapsed_time": "0:28:48", "remaining_time": "5:14:32"}
+{"current_steps": 390, "total_steps": 4530, "loss": 1.4668, "reward": null, "learning_rate": 4.909114739839079e-05, "epoch": 0.26, "percentage": 8.61, "elapsed_time": "0:29:33", "remaining_time": "5:13:43"}
+{"current_steps": 400, "total_steps": 4530, "loss": 1.4439, "reward": null, "learning_rate": 4.9044245082368415e-05, "epoch": 0.26, "percentage": 8.83, "elapsed_time": "0:30:18", "remaining_time": "5:12:51"}
+{"current_steps": 410, "total_steps": 4530, "loss": 1.4224, "reward": null, "learning_rate": 4.8996186353927606e-05, "epoch": 0.27, "percentage": 9.05, "elapsed_time": "0:31:21", "remaining_time": "5:15:01"}
+{"current_steps": 420, "total_steps": 4530, "loss": 1.4084, "reward": null, "learning_rate": 4.894697352446182e-05, "epoch": 0.28, "percentage": 9.27, "elapsed_time": "0:32:11", "remaining_time": "5:14:58"}
+{"current_steps": 430, "total_steps": 4530, "loss": 1.4398, "reward": null, "learning_rate": 4.889660896087119e-05, "epoch": 0.28, "percentage": 9.49, "elapsed_time": "0:32:54", "remaining_time": "5:13:50"}
+{"current_steps": 440, "total_steps": 4530, "loss": 1.4268, "reward": null, "learning_rate": 4.884509508544874e-05, "epoch": 0.29, "percentage": 9.71, "elapsed_time": "0:33:38", "remaining_time": "5:12:44"}
+{"current_steps": 450, "total_steps": 4530, "loss": 1.4522, "reward": null, "learning_rate": 4.879243437576383e-05, "epoch": 0.3, "percentage": 9.93, "elapsed_time": "0:34:20", "remaining_time": "5:11:24"}
+{"current_steps": 460, "total_steps": 4530, "loss": 1.4222, "reward": null, "learning_rate": 4.8738629364543045e-05, "epoch": 0.3, "percentage": 10.15, "elapsed_time": "0:35:03", "remaining_time": "5:10:09"}
+{"current_steps": 470, "total_steps": 4530, "loss": 1.4956, "reward": null, "learning_rate": 4.8683682639548365e-05, "epoch": 0.31, "percentage": 10.38, "elapsed_time": "0:35:45", "remaining_time": "5:08:51"}
+{"current_steps": 480, "total_steps": 4530, "loss": 1.4538, "reward": null, "learning_rate": 4.862759684345269e-05, "epoch": 0.32, "percentage": 10.6, "elapsed_time": "0:36:28", "remaining_time": "5:07:48"}
+{"current_steps": 490, "total_steps": 4530, "loss": 1.3748, "reward": null, "learning_rate": 4.857037467371278e-05, "epoch": 0.32, "percentage": 10.82, "elapsed_time": "0:37:11", "remaining_time": "5:06:38"}
+{"current_steps": 500, "total_steps": 4530, "loss": 1.4127, "reward": null, "learning_rate": 4.8512018882439475e-05, "epoch": 0.33, "percentage": 11.04, "elapsed_time": "0:37:56", "remaining_time": "5:05:45"}
+{"current_steps": 510, "total_steps": 4530, "loss": 1.3795, "reward": null, "learning_rate": 4.8452532276265364e-05, "epoch": 0.34, "percentage": 11.26, "elapsed_time": "0:39:03", "remaining_time": "5:07:49"}
+{"current_steps": 520, "total_steps": 4530, "loss": 1.4414, "reward": null, "learning_rate": 4.8391917716209765e-05, "epoch": 0.34, "percentage": 11.48, "elapsed_time": "0:39:45", "remaining_time": "5:06:35"}
+{"current_steps": 530, "total_steps": 4530, "loss": 1.4242, "reward": null, "learning_rate": 4.833017811754119e-05, "epoch": 0.35, "percentage": 11.7, "elapsed_time": "0:40:27", "remaining_time": "5:05:19"}
+{"current_steps": 540, "total_steps": 4530, "loss": 1.4196, "reward": null, "learning_rate": 4.8267316449637054e-05, "epoch": 0.36, "percentage": 11.92, "elapsed_time": "0:41:09", "remaining_time": "5:04:08"}
+{"current_steps": 550, "total_steps": 4530, "loss": 1.389, "reward": null, "learning_rate": 4.820333573584091e-05, "epoch": 0.36, "percentage": 12.14, "elapsed_time": "0:41:52", "remaining_time": "5:03:02"}
+{"current_steps": 560, "total_steps": 4530, "loss": 1.4597, "reward": null, "learning_rate": 4.813823905331704e-05, "epoch": 0.37, "percentage": 12.36, "elapsed_time": "0:42:36", "remaining_time": "5:02:04"}
+{"current_steps": 570, "total_steps": 4530, "loss": 1.4275, "reward": null, "learning_rate": 4.8072029532902426e-05, "epoch": 0.38, "percentage": 12.58, "elapsed_time": "0:43:22", "remaining_time": "5:01:23"}
+{"current_steps": 580, "total_steps": 4530, "loss": 1.4364, "reward": null, "learning_rate": 4.800471035895624e-05, "epoch": 0.38, "percentage": 12.8, "elapsed_time": "0:44:08", "remaining_time": "5:00:38"}
+{"current_steps": 590, "total_steps": 4530, "loss": 1.4366, "reward": null, "learning_rate": 4.7936284769206584e-05, "epoch": 0.39, "percentage": 13.02, "elapsed_time": "0:44:49", "remaining_time": "4:59:23"}
+{"current_steps": 600, "total_steps": 4530, "loss": 1.5086, "reward": null, "learning_rate": 4.786675605459487e-05, "epoch": 0.4, "percentage": 13.25, "elapsed_time": "0:45:33", "remaining_time": "4:58:27"}
+{"current_steps": 610, "total_steps": 4530, "loss": 1.4309, "reward": null, "learning_rate": 4.779612755911752e-05, "epoch": 0.4, "percentage": 13.47, "elapsed_time": "0:46:38", "remaining_time": "4:59:43"}
+{"current_steps": 620, "total_steps": 4530, "loss": 1.4102, "reward": null, "learning_rate": 4.772440267966508e-05, "epoch": 0.41, "percentage": 13.69, "elapsed_time": "0:47:21", "remaining_time": "4:58:40"}
+{"current_steps": 630, "total_steps": 4530, "loss": 1.4035, "reward": null, "learning_rate": 4.76515848658589e-05, "epoch": 0.42, "percentage": 13.91, "elapsed_time": "0:48:05", "remaining_time": "4:57:42"}
+{"current_steps": 640, "total_steps": 4530, "loss": 1.4478, "reward": null, "learning_rate": 4.7577677619885234e-05, "epoch": 0.42, "percentage": 14.13, "elapsed_time": "0:48:45", "remaining_time": "4:56:24"}
+{"current_steps": 650, "total_steps": 4530, "loss": 1.3999, "reward": null, "learning_rate": 4.7502684496326746e-05, "epoch": 0.43, "percentage": 14.35, "elapsed_time": "0:49:28", "remaining_time": "4:55:21"}
+{"current_steps": 660, "total_steps": 4530, "loss": 1.4042, "reward": null, "learning_rate": 4.7426609101991605e-05, "epoch": 0.44, "percentage": 14.57, "elapsed_time": "0:50:13", "remaining_time": "4:54:30"}
+{"current_steps": 670, "total_steps": 4530, "loss": 1.4216, "reward": null, "learning_rate": 4.734945509573997e-05, "epoch": 0.44, "percentage": 14.79, "elapsed_time": "0:50:55", "remaining_time": "4:53:21"}
+{"current_steps": 680, "total_steps": 4530, "loss": 1.4786, "reward": null, "learning_rate": 4.727122618830808e-05, "epoch": 0.45, "percentage": 15.01, "elapsed_time": "0:51:41", "remaining_time": "4:52:40"}
+{"current_steps": 690, "total_steps": 4530, "loss": 1.4414, "reward": null, "learning_rate": 4.719192614212969e-05, "epoch": 0.46, "percentage": 15.23, "elapsed_time": "0:52:24", "remaining_time": "4:51:40"}
+{"current_steps": 700, "total_steps": 4530, "loss": 1.493, "reward": null, "learning_rate": 4.711155877115523e-05, "epoch": 0.46, "percentage": 15.45, "elapsed_time": "0:53:05", "remaining_time": "4:50:29"}
+{"current_steps": 710, "total_steps": 4530, "loss": 1.4078, "reward": null, "learning_rate": 4.703012794066827e-05, "epoch": 0.47, "percentage": 15.67, "elapsed_time": "0:54:12", "remaining_time": "4:51:37"}
+{"current_steps": 720, "total_steps": 4530, "loss": 1.4539, "reward": null, "learning_rate": 4.694763756709967e-05, "epoch": 0.48, "percentage": 15.89, "elapsed_time": "0:54:58", "remaining_time": "4:50:53"}
+{"current_steps": 730, "total_steps": 4530, "loss": 1.4458, "reward": null, "learning_rate": 4.6864091617839235e-05, "epoch": 0.48, "percentage": 16.11, "elapsed_time": "0:55:42", "remaining_time": "4:49:59"}
+{"current_steps": 740, "total_steps": 4530, "loss": 1.4001, "reward": null, "learning_rate": 4.677949411104485e-05, "epoch": 0.49, "percentage": 16.34, "elapsed_time": "0:56:25", "remaining_time": "4:49:01"}
+{"current_steps": 750, "total_steps": 4530, "loss": 1.433, "reward": null, "learning_rate": 4.669384911544927e-05, "epoch": 0.5, "percentage": 16.56, "elapsed_time": "0:57:09", "remaining_time": "4:48:06"}
+{"current_steps": 760, "total_steps": 4530, "loss": 1.4323, "reward": null, "learning_rate": 4.660716075016442e-05, "epoch": 0.5, "percentage": 16.78, "elapsed_time": "0:57:56", "remaining_time": "4:47:24"}
+{"current_steps": 770, "total_steps": 4530, "loss": 1.4052, "reward": null, "learning_rate": 4.6519433184483245e-05, "epoch": 0.51, "percentage": 17.0, "elapsed_time": "0:58:42", "remaining_time": "4:46:39"}
+{"current_steps": 780, "total_steps": 4530, "loss": 1.4021, "reward": null, "learning_rate": 4.6430670637679295e-05, "epoch": 0.52, "percentage": 17.22, "elapsed_time": "0:59:27", "remaining_time": "4:45:52"}
+{"current_steps": 790, "total_steps": 4530, "loss": 1.4049, "reward": null, "learning_rate": 4.634087737880367e-05, "epoch": 0.52, "percentage": 17.44, "elapsed_time": "1:00:12", "remaining_time": "4:45:03"}
+{"current_steps": 800, "total_steps": 4530, "loss": 1.3701, "reward": null, "learning_rate": 4.625005772647979e-05, "epoch": 0.53, "percentage": 17.66, "elapsed_time": "1:00:57", "remaining_time": "4:44:14"}
+{"current_steps": 810, "total_steps": 4530, "loss": 1.4209, "reward": null, "learning_rate": 4.615821604869564e-05, "epoch": 0.54, "percentage": 17.88, "elapsed_time": "1:02:00", "remaining_time": "4:44:45"}
+{"current_steps": 820, "total_steps": 4530, "loss": 1.4373, "reward": null, "learning_rate": 4.606535676259372e-05, "epoch": 0.54, "percentage": 18.1, "elapsed_time": "1:02:43", "remaining_time": "4:43:47"}
+{"current_steps": 830, "total_steps": 4530, "loss": 1.4913, "reward": null, "learning_rate": 4.597148433425857e-05, "epoch": 0.55, "percentage": 18.32, "elapsed_time": "1:03:26", "remaining_time": "4:42:48"}
+{"current_steps": 840, "total_steps": 4530, "loss": 1.434, "reward": null, "learning_rate": 4.587660327850203e-05, "epoch": 0.56, "percentage": 18.54, "elapsed_time": "1:04:13", "remaining_time": "4:42:06"}
+{"current_steps": 850, "total_steps": 4530, "loss": 1.3932, "reward": null, "learning_rate": 4.578071815864602e-05, "epoch": 0.56, "percentage": 18.76, "elapsed_time": "1:04:58", "remaining_time": "4:41:18"}
+{"current_steps": 860, "total_steps": 4530, "loss": 1.4232, "reward": null, "learning_rate": 4.5683833586303157e-05, "epoch": 0.57, "percentage": 18.98, "elapsed_time": "1:05:41", "remaining_time": "4:40:19"}
+{"current_steps": 870, "total_steps": 4530, "loss": 1.3651, "reward": null, "learning_rate": 4.5585954221154856e-05, "epoch": 0.58, "percentage": 19.21, "elapsed_time": "1:06:24", "remaining_time": "4:39:23"}
+{"current_steps": 880, "total_steps": 4530, "loss": 1.4009, "reward": null, "learning_rate": 4.548708477072733e-05, "epoch": 0.58, "percentage": 19.43, "elapsed_time": "1:07:10", "remaining_time": "4:38:38"}
+{"current_steps": 890, "total_steps": 4530, "loss": 1.428, "reward": null, "learning_rate": 4.5387229990165073e-05, "epoch": 0.59, "percentage": 19.65, "elapsed_time": "1:07:55", "remaining_time": "4:37:49"}
+{"current_steps": 900, "total_steps": 4530, "loss": 1.413, "reward": null, "learning_rate": 4.528639468200226e-05, "epoch": 0.6, "percentage": 19.87, "elapsed_time": "1:08:40", "remaining_time": "4:36:57"}
+{"current_steps": 910, "total_steps": 4530, "loss": 1.4328, "reward": null, "learning_rate": 4.51845836959317e-05, "epoch": 0.6, "percentage": 20.09, "elapsed_time": "1:09:42", "remaining_time": "4:37:19"}
+{"current_steps": 920, "total_steps": 4530, "loss": 1.4262, "reward": null, "learning_rate": 4.508180192857162e-05, "epoch": 0.61, "percentage": 20.31, "elapsed_time": "1:10:27", "remaining_time": "4:36:28"}
+{"current_steps": 930, "total_steps": 4530, "loss": 1.3677, "reward": null, "learning_rate": 4.497805432323015e-05, "epoch": 0.62, "percentage": 20.53, "elapsed_time": "1:11:12", "remaining_time": "4:35:39"}
+{"current_steps": 940, "total_steps": 4530, "loss": 1.4546, "reward": null, "learning_rate": 4.487334586966756e-05, "epoch": 0.62, "percentage": 20.75, "elapsed_time": "1:11:54", "remaining_time": "4:34:37"}
+{"current_steps": 950, "total_steps": 4530, "loss": 1.4011, "reward": null, "learning_rate": 4.476768160385632e-05, "epoch": 0.63, "percentage": 20.97, "elapsed_time": "1:12:39", "remaining_time": "4:33:49"}
+{"current_steps": 960, "total_steps": 4530, "loss": 1.441, "reward": null, "learning_rate": 4.466106660773885e-05, "epoch": 0.64, "percentage": 21.19, "elapsed_time": "1:13:22", "remaining_time": "4:32:50"}
+{"current_steps": 970, "total_steps": 4530, "loss": 1.3946, "reward": null, "learning_rate": 4.4553506008983126e-05, "epoch": 0.64, "percentage": 21.41, "elapsed_time": "1:14:06", "remaining_time": "4:31:57"}
+{"current_steps": 980, "total_steps": 4530, "loss": 1.4478, "reward": null, "learning_rate": 4.4445004980736064e-05, "epoch": 0.65, "percentage": 21.63, "elapsed_time": "1:14:47", "remaining_time": "4:30:55"}
+{"current_steps": 990, "total_steps": 4530, "loss": 1.4093, "reward": null, "learning_rate": 4.43355687413747e-05, "epoch": 0.66, "percentage": 21.85, "elapsed_time": "1:15:30", "remaining_time": "4:29:58"}
+{"current_steps": 1000, "total_steps": 4530, "loss": 1.4285, "reward": null, "learning_rate": 4.4225202554255227e-05, "epoch": 0.66, "percentage": 22.08, "elapsed_time": "1:16:14", "remaining_time": "4:29:06"}
+{"current_steps": 1010, "total_steps": 4530, "loss": 1.3971, "reward": null, "learning_rate": 4.411391172745984e-05, "epoch": 0.67, "percentage": 22.3, "elapsed_time": "1:17:17", "remaining_time": "4:29:20"}
+{"current_steps": 1020, "total_steps": 4530, "loss": 1.4024, "reward": null, "learning_rate": 4.4001701613541456e-05, "epoch": 0.68, "percentage": 22.52, "elapsed_time": "1:18:00", "remaining_time": "4:28:26"}
+{"current_steps": 1030, "total_steps": 4530, "loss": 1.3623, "reward": null, "learning_rate": 4.388857760926629e-05, "epoch": 0.68, "percentage": 22.74, "elapsed_time": "1:18:45", "remaining_time": "4:27:37"}
+{"current_steps": 1040, "total_steps": 4530, "loss": 1.3943, "reward": null, "learning_rate": 4.3774545155354254e-05, "epoch": 0.69, "percentage": 22.96, "elapsed_time": "1:19:31", "remaining_time": "4:26:53"}
+{"current_steps": 1050, "total_steps": 4530, "loss": 1.4586, "reward": null, "learning_rate": 4.3659609736217344e-05, "epoch": 0.7, "percentage": 23.18, "elapsed_time": "1:20:18", "remaining_time": "4:26:09"}
+{"current_steps": 1060, "total_steps": 4530, "loss": 1.4178, "reward": null, "learning_rate": 4.354377687969581e-05, "epoch": 0.7, "percentage": 23.4, "elapsed_time": "1:21:00", "remaining_time": "4:25:10"}
+{"current_steps": 1070, "total_steps": 4530, "loss": 1.4454, "reward": null, "learning_rate": 4.342705215679232e-05, "epoch": 0.71, "percentage": 23.62, "elapsed_time": "1:21:44", "remaining_time": "4:24:18"}
+{"current_steps": 1080, "total_steps": 4530, "loss": 1.3769, "reward": null, "learning_rate": 4.330944118140407e-05, "epoch": 0.72, "percentage": 23.84, "elapsed_time": "1:22:33", "remaining_time": "4:23:44"}
+{"current_steps": 1090, "total_steps": 4530, "loss": 1.3912, "reward": null, "learning_rate": 4.3190949610052645e-05, "epoch": 0.72, "percentage": 24.06, "elapsed_time": "1:23:18", "remaining_time": "4:22:53"}
+{"current_steps": 1100, "total_steps": 4530, "loss": 1.4116, "reward": null, "learning_rate": 4.3071583141612135e-05, "epoch": 0.73, "percentage": 24.28, "elapsed_time": "1:24:01", "remaining_time": "4:21:58"}
+{"current_steps": 1110, "total_steps": 4530, "loss": 1.4019, "reward": null, "learning_rate": 4.295134751703493e-05, "epoch": 0.73, "percentage": 24.5, "elapsed_time": "1:25:01", "remaining_time": "4:21:59"}
+{"current_steps": 1120, "total_steps": 4530, "loss": 1.378, "reward": null, "learning_rate": 4.283024851907565e-05, "epoch": 0.74, "percentage": 24.72, "elapsed_time": "1:25:46", "remaining_time": "4:21:09"}
+{"current_steps": 1130, "total_steps": 4530, "loss": 1.432, "reward": null, "learning_rate": 4.2708291972013026e-05, "epoch": 0.75, "percentage": 24.94, "elapsed_time": "1:26:31", "remaining_time": "4:20:19"}
+{"current_steps": 1140, "total_steps": 4530, "loss": 1.4531, "reward": null, "learning_rate": 4.2585483741369755e-05, "epoch": 0.75, "percentage": 25.17, "elapsed_time": "1:27:13", "remaining_time": "4:19:24"}
+{"current_steps": 1150, "total_steps": 4530, "loss": 1.4455, "reward": null, "learning_rate": 4.2461829733630435e-05, "epoch": 0.76, "percentage": 25.39, "elapsed_time": "1:27:58", "remaining_time": "4:18:34"}
+{"current_steps": 1160, "total_steps": 4530, "loss": 1.4081, "reward": null, "learning_rate": 4.233733589595746e-05, "epoch": 0.77, "percentage": 25.61, "elapsed_time": "1:28:40", "remaining_time": "4:17:38"}
+{"current_steps": 1170, "total_steps": 4530, "loss": 1.4344, "reward": null, "learning_rate": 4.2212008215905e-05, "epoch": 0.77, "percentage": 25.83, "elapsed_time": "1:29:22", "remaining_time": "4:16:38"}
+{"current_steps": 1180, "total_steps": 4530, "loss": 1.3935, "reward": null, "learning_rate": 4.208585272113102e-05, "epoch": 0.78, "percentage": 26.05, "elapsed_time": "1:30:04", "remaining_time": "4:15:43"}
+{"current_steps": 1190, "total_steps": 4530, "loss": 1.4161, "reward": null, "learning_rate": 4.195887547910741e-05, "epoch": 0.79, "percentage": 26.27, "elapsed_time": "1:30:49", "remaining_time": "4:14:54"}
+{"current_steps": 1200, "total_steps": 4530, "loss": 1.4185, "reward": null, "learning_rate": 4.1831082596828106e-05, "epoch": 0.79, "percentage": 26.49, "elapsed_time": "1:31:31", "remaining_time": "4:13:59"}
+{"current_steps": 1210, "total_steps": 4530, "loss": 1.3714, "reward": null, "learning_rate": 4.1702480220515475e-05, "epoch": 0.8, "percentage": 26.71, "elapsed_time": "1:32:38", "remaining_time": "4:14:10"}
+{"current_steps": 1220, "total_steps": 4530, "loss": 1.4062, "reward": null, "learning_rate": 4.157307453532457e-05, "epoch": 0.81, "percentage": 26.93, "elapsed_time": "1:33:23", "remaining_time": "4:13:23"}
+{"current_steps": 1230, "total_steps": 4530, "loss": 1.4007, "reward": null, "learning_rate": 4.144287176504582e-05, "epoch": 0.81, "percentage": 27.15, "elapsed_time": "1:34:06", "remaining_time": "4:12:29"}
+{"current_steps": 1240, "total_steps": 4530, "loss": 1.4153, "reward": null, "learning_rate": 4.131187817180554e-05, "epoch": 0.82, "percentage": 27.37, "elapsed_time": "1:34:51", "remaining_time": "4:11:41"}
+{"current_steps": 1250, "total_steps": 4530, "loss": 1.3619, "reward": null, "learning_rate": 4.118010005576485e-05, "epoch": 0.83, "percentage": 27.59, "elapsed_time": "1:35:34", "remaining_time": "4:10:48"}
+{"current_steps": 1260, "total_steps": 4530, "loss": 1.507, "reward": null, "learning_rate": 4.104754375481664e-05, "epoch": 0.83, "percentage": 27.81, "elapsed_time": "1:36:17", "remaining_time": "4:09:53"}
+{"current_steps": 1270, "total_steps": 4530, "loss": 1.4487, "reward": null, "learning_rate": 4.0914215644280754e-05, "epoch": 0.84, "percentage": 28.04, "elapsed_time": "1:36:58", "remaining_time": "4:08:55"}
+{"current_steps": 1280, "total_steps": 4530, "loss": 1.409, "reward": null, "learning_rate": 4.0780122136597323e-05, "epoch": 0.85, "percentage": 28.26, "elapsed_time": "1:37:42", "remaining_time": "4:08:04"}
+{"current_steps": 1290, "total_steps": 4530, "loss": 1.3994, "reward": null, "learning_rate": 4.064526968101844e-05, "epoch": 0.85, "percentage": 28.48, "elapsed_time": "1:38:23", "remaining_time": "4:07:07"}
+{"current_steps": 1300, "total_steps": 4530, "loss": 1.4285, "reward": null, "learning_rate": 4.050966476329793e-05, "epoch": 0.86, "percentage": 28.7, "elapsed_time": "1:39:06", "remaining_time": "4:06:14"}
+{"current_steps": 1310, "total_steps": 4530, "loss": 1.4562, "reward": null, "learning_rate": 4.037331390537939e-05, "epoch": 0.87, "percentage": 28.92, "elapsed_time": "1:40:10", "remaining_time": "4:06:13"}
+{"current_steps": 1320, "total_steps": 4530, "loss": 1.4202, "reward": null, "learning_rate": 4.023622366508261e-05, "epoch": 0.87, "percentage": 29.14, "elapsed_time": "1:40:53", "remaining_time": "4:05:22"}
+{"current_steps": 1330, "total_steps": 4530, "loss": 1.381, "reward": null, "learning_rate": 4.0098400635788035e-05, "epoch": 0.88, "percentage": 29.36, "elapsed_time": "1:41:37", "remaining_time": "4:04:30"}
+{"current_steps": 1340, "total_steps": 4530, "loss": 1.4656, "reward": null, "learning_rate": 3.99598514461198e-05, "epoch": 0.89, "percentage": 29.58, "elapsed_time": "1:42:16", "remaining_time": "4:03:27"}
+{"current_steps": 1350, "total_steps": 4530, "loss": 1.4094, "reward": null, "learning_rate": 3.9820582759626825e-05, "epoch": 0.89, "percentage": 29.8, "elapsed_time": "1:43:03", "remaining_time": "4:02:45"}
+{"current_steps": 1360, "total_steps": 4530, "loss": 1.4183, "reward": null, "learning_rate": 3.968060127446236e-05, "epoch": 0.9, "percentage": 30.02, "elapsed_time": "1:43:46", "remaining_time": "4:01:53"}
+{"current_steps": 1370, "total_steps": 4530, "loss": 1.411, "reward": null, "learning_rate": 3.953991372306186e-05, "epoch": 0.91, "percentage": 30.24, "elapsed_time": "1:44:29", "remaining_time": "4:01:00"}
+{"current_steps": 1380, "total_steps": 4530, "loss": 1.418, "reward": null, "learning_rate": 3.9398526871819154e-05, "epoch": 0.91, "percentage": 30.46, "elapsed_time": "1:45:13", "remaining_time": "4:00:10"}
+{"current_steps": 1390, "total_steps": 4530, "loss": 1.4751, "reward": null, "learning_rate": 3.925644752076101e-05, "epoch": 0.92, "percentage": 30.68, "elapsed_time": "1:45:55", "remaining_time": "3:59:17"}
+{"current_steps": 1400, "total_steps": 4530, "loss": 1.4246, "reward": null, "learning_rate": 3.911368250322014e-05, "epoch": 0.93, "percentage": 30.91, "elapsed_time": "1:46:39", "remaining_time": "3:58:27"}
+{"current_steps": 1410, "total_steps": 4530, "loss": 1.4102, "reward": null, "learning_rate": 3.897023868550649e-05, "epoch": 0.93, "percentage": 31.13, "elapsed_time": "1:47:40", "remaining_time": "3:58:15"}
+{"current_steps": 1420, "total_steps": 4530, "loss": 1.3871, "reward": null, "learning_rate": 3.882612296657701e-05, "epoch": 0.94, "percentage": 31.35, "elapsed_time": "1:48:23", "remaining_time": "3:57:24"}
+{"current_steps": 1430, "total_steps": 4530, "loss": 1.4156, "reward": null, "learning_rate": 3.8681342277703906e-05, "epoch": 0.95, "percentage": 31.57, "elapsed_time": "1:49:06", "remaining_time": "3:56:32"}
+{"current_steps": 1440, "total_steps": 4530, "loss": 1.433, "reward": null, "learning_rate": 3.853590358214119e-05, "epoch": 0.95, "percentage": 31.79, "elapsed_time": "1:49:49", "remaining_time": "3:55:40"}
+{"current_steps": 1450, "total_steps": 4530, "loss": 1.4372, "reward": null, "learning_rate": 3.8389813874789856e-05, "epoch": 0.96, "percentage": 32.01, "elapsed_time": "1:50:31", "remaining_time": "3:54:46"}
+{"current_steps": 1460, "total_steps": 4530, "loss": 1.3978, "reward": null, "learning_rate": 3.8243080181861435e-05, "epoch": 0.97, "percentage": 32.23, "elapsed_time": "1:51:13", "remaining_time": "3:53:52"}
+{"current_steps": 1470, "total_steps": 4530, "loss": 1.3964, "reward": null, "learning_rate": 3.809570956054004e-05, "epoch": 0.97, "percentage": 32.45, "elapsed_time": "1:51:54", "remaining_time": "3:52:56"}
+{"current_steps": 1480, "total_steps": 4530, "loss": 1.4332, "reward": null, "learning_rate": 3.794770909864298e-05, "epoch": 0.98, "percentage": 32.67, "elapsed_time": "1:52:35", "remaining_time": "3:52:02"}
+{"current_steps": 1490, "total_steps": 4530, "loss": 1.4044, "reward": null, "learning_rate": 3.779908591427988e-05, "epoch": 0.99, "percentage": 32.89, "elapsed_time": "1:53:20", "remaining_time": "3:51:14"}
+{"current_steps": 1500, "total_steps": 4530, "loss": 1.4301, "reward": null, "learning_rate": 3.764984715551032e-05, "epoch": 0.99, "percentage": 33.11, "elapsed_time": "1:54:00", "remaining_time": "3:50:18"}
+{"current_steps": 1510, "total_steps": 4530, "loss": 1.4721, "reward": null, "learning_rate": 3.7500000000000003e-05, "epoch": 1.0, "percentage": 33.33, "elapsed_time": "1:55:04", "remaining_time": "3:50:08"}
+{"current_steps": 1520, "total_steps": 4530, "loss": 1.3905, "reward": null, "learning_rate": 3.734955165467563e-05, "epoch": 1.01, "percentage": 33.55, "elapsed_time": "1:55:47", "remaining_time": "3:49:17"}
+{"current_steps": 1530, "total_steps": 4530, "loss": 1.423, "reward": null, "learning_rate": 3.719850935537821e-05, "epoch": 1.01, "percentage": 33.77, "elapsed_time": "1:56:29", "remaining_time": "3:48:24"}
+{"current_steps": 1540, "total_steps": 4530, "loss": 1.404, "reward": null, "learning_rate": 3.70468803665151e-05, "epoch": 1.02, "percentage": 34.0, "elapsed_time": "1:57:10", "remaining_time": "3:47:30"}
+{"current_steps": 1550, "total_steps": 4530, "loss": 1.4042, "reward": null, "learning_rate": 3.6894671980710574e-05, "epoch": 1.03, "percentage": 34.22, "elapsed_time": "1:57:54", "remaining_time": "3:46:42"}
+{"current_steps": 1560, "total_steps": 4530, "loss": 1.4158, "reward": null, "learning_rate": 3.674189151845515e-05, "epoch": 1.03, "percentage": 34.44, "elapsed_time": "1:58:40", "remaining_time": "3:45:55"}
+{"current_steps": 1570, "total_steps": 4530, "loss": 1.409, "reward": null, "learning_rate": 3.6588546327753425e-05, "epoch": 1.04, "percentage": 34.66, "elapsed_time": "1:59:21", "remaining_time": "3:45:01"}
+{"current_steps": 1580, "total_steps": 4530, "loss": 1.3764, "reward": null, "learning_rate": 3.6434643783770736e-05, "epoch": 1.05, "percentage": 34.88, "elapsed_time": "2:00:04", "remaining_time": "3:44:11"}
+{"current_steps": 1590, "total_steps": 4530, "loss": 1.4021, "reward": null, "learning_rate": 3.6280191288478436e-05, "epoch": 1.05, "percentage": 35.1, "elapsed_time": "2:00:47", "remaining_time": "3:43:20"}
+{"current_steps": 1600, "total_steps": 4530, "loss": 1.3973, "reward": null, "learning_rate": 3.612519627029787e-05, "epoch": 1.06, "percentage": 35.32, "elapsed_time": "2:01:26", "remaining_time": "3:42:22"}
+{"current_steps": 1610, "total_steps": 4530, "loss": 1.3985, "reward": null, "learning_rate": 3.596966618374313e-05, "epoch": 1.07, "percentage": 35.54, "elapsed_time": "2:02:32", "remaining_time": "3:42:14"}
+{"current_steps": 1620, "total_steps": 4530, "loss": 1.3444, "reward": null, "learning_rate": 3.5813608509062526e-05, "epoch": 1.07, "percentage": 35.76, "elapsed_time": "2:03:19", "remaining_time": "3:41:31"}
+{"current_steps": 1630, "total_steps": 4530, "loss": 1.4207, "reward": null, "learning_rate": 3.5657030751878814e-05, "epoch": 1.08, "percentage": 35.98, "elapsed_time": "2:04:00", "remaining_time": "3:40:38"}
+{"current_steps": 1640, "total_steps": 4530, "loss": 1.4304, "reward": null, "learning_rate": 3.5499940442828206e-05, "epoch": 1.09, "percentage": 36.2, "elapsed_time": "2:04:42", "remaining_time": "3:39:46"}
+{"current_steps": 1650, "total_steps": 4530, "loss": 1.3924, "reward": null, "learning_rate": 3.534234513719821e-05, "epoch": 1.09, "percentage": 36.42, "elapsed_time": "2:05:25", "remaining_time": "3:38:54"}
+{"current_steps": 1660, "total_steps": 4530, "loss": 1.3686, "reward": null, "learning_rate": 3.51842524145642e-05, "epoch": 1.1, "percentage": 36.64, "elapsed_time": "2:06:11", "remaining_time": "3:38:09"}
+{"current_steps": 1670, "total_steps": 4530, "loss": 1.4248, "reward": null, "learning_rate": 3.502566987842496e-05, "epoch": 1.11, "percentage": 36.87, "elapsed_time": "2:06:53", "remaining_time": "3:37:18"}
+{"current_steps": 1680, "total_steps": 4530, "loss": 1.3906, "reward": null, "learning_rate": 3.4866605155836915e-05, "epoch": 1.11, "percentage": 37.09, "elapsed_time": "2:07:34", "remaining_time": "3:36:25"}
+{"current_steps": 1690, "total_steps": 4530, "loss": 1.444, "reward": null, "learning_rate": 3.470706589704734e-05, "epoch": 1.12, "percentage": 37.31, "elapsed_time": "2:08:19", "remaining_time": "3:35:37"}
+{"current_steps": 1700, "total_steps": 4530, "loss": 1.3589, "reward": null, "learning_rate": 3.4547059775126445e-05, "epoch": 1.13, "percentage": 37.53, "elapsed_time": "2:09:04", "remaining_time": "3:34:52"}
+{"current_steps": 1710, "total_steps": 4530, "loss": 1.319, "reward": null, "learning_rate": 3.438659448559825e-05, "epoch": 1.13, "percentage": 37.75, "elapsed_time": "2:10:07", "remaining_time": "3:34:34"}
+{"current_steps": 1720, "total_steps": 4530, "loss": 1.406, "reward": null, "learning_rate": 3.422567774607058e-05, "epoch": 1.14, "percentage": 37.97, "elapsed_time": "2:10:50", "remaining_time": "3:33:44"}
+{"current_steps": 1730, "total_steps": 4530, "loss": 1.4114, "reward": null, "learning_rate": 3.406431729586382e-05, "epoch": 1.15, "percentage": 38.19, "elapsed_time": "2:11:33", "remaining_time": "3:32:55"}
+{"current_steps": 1740, "total_steps": 4530, "loss": 1.3722, "reward": null, "learning_rate": 3.390252089563867e-05, "epoch": 1.15, "percentage": 38.41, "elapsed_time": "2:12:16", "remaining_time": "3:32:05"}
+{"current_steps": 1750, "total_steps": 4530, "loss": 1.3528, "reward": null, "learning_rate": 3.3740296327022984e-05, "epoch": 1.16, "percentage": 38.63, "elapsed_time": "2:13:01", "remaining_time": "3:31:19"}
+{"current_steps": 1760, "total_steps": 4530, "loss": 1.4274, "reward": null, "learning_rate": 3.35776513922374e-05, "epoch": 1.17, "percentage": 38.85, "elapsed_time": "2:13:45", "remaining_time": "3:30:31"}
+{"current_steps": 1770, "total_steps": 4530, "loss": 1.4324, "reward": null, "learning_rate": 3.341459391372016e-05, "epoch": 1.17, "percentage": 39.07, "elapsed_time": "2:14:29", "remaining_time": "3:29:43"}
+{"current_steps": 1780, "total_steps": 4530, "loss": 1.409, "reward": null, "learning_rate": 3.32511317337509e-05, "epoch": 1.18, "percentage": 39.29, "elapsed_time": "2:15:10", "remaining_time": "3:28:50"}
+{"current_steps": 1790, "total_steps": 4530, "loss": 1.3464, "reward": null, "learning_rate": 3.30872727140734e-05, "epoch": 1.19, "percentage": 39.51, "elapsed_time": "2:15:55", "remaining_time": "3:28:04"}
+{"current_steps": 1800, "total_steps": 4530, "loss": 1.4144, "reward": null, "learning_rate": 3.292302473551757e-05, "epoch": 1.19, "percentage": 39.74, "elapsed_time": "2:16:40", "remaining_time": "3:27:16"}
+{"current_steps": 1810, "total_steps": 4530, "loss": 1.4139, "reward": null, "learning_rate": 3.2758395697620334e-05, "epoch": 1.2, "percentage": 39.96, "elapsed_time": "2:17:41", "remaining_time": "3:26:55"}
+{"current_steps": 1820, "total_steps": 4530, "loss": 1.4247, "reward": null, "learning_rate": 3.259339351824575e-05, "epoch": 1.2, "percentage": 40.18, "elapsed_time": "2:18:25", "remaining_time": "3:26:06"}
+{"current_steps": 1830, "total_steps": 4530, "loss": 1.4241, "reward": null, "learning_rate": 3.2428026133204184e-05, "epoch": 1.21, "percentage": 40.4, "elapsed_time": "2:19:09", "remaining_time": "3:25:18"}
+{"current_steps": 1840, "total_steps": 4530, "loss": 1.3941, "reward": null, "learning_rate": 3.226230149587063e-05, "epoch": 1.22, "percentage": 40.62, "elapsed_time": "2:19:53", "remaining_time": "3:24:31"}
+{"current_steps": 1850, "total_steps": 4530, "loss": 1.4238, "reward": null, "learning_rate": 3.20962275768022e-05, "epoch": 1.22, "percentage": 40.84, "elapsed_time": "2:20:36", "remaining_time": "3:23:41"}
+{"current_steps": 1860, "total_steps": 4530, "loss": 1.382, "reward": null, "learning_rate": 3.1929812363354766e-05, "epoch": 1.23, "percentage": 41.06, "elapsed_time": "2:21:17", "remaining_time": "3:22:49"}
+{"current_steps": 1870, "total_steps": 4530, "loss": 1.4124, "reward": null, "learning_rate": 3.1763063859298845e-05, "epoch": 1.24, "percentage": 41.28, "elapsed_time": "2:22:00", "remaining_time": "3:22:00"}
+{"current_steps": 1880, "total_steps": 4530, "loss": 1.3963, "reward": null, "learning_rate": 3.159599008443459e-05, "epoch": 1.24, "percentage": 41.5, "elapsed_time": "2:22:44", "remaining_time": "3:21:12"}
+{"current_steps": 1890, "total_steps": 4530, "loss": 1.3542, "reward": null, "learning_rate": 3.142859907420615e-05, "epoch": 1.25, "percentage": 41.72, "elapsed_time": "2:23:27", "remaining_time": "3:20:23"}
+{"current_steps": 1900, "total_steps": 4530, "loss": 1.3852, "reward": null, "learning_rate": 3.126089887931515e-05, "epoch": 1.26, "percentage": 41.94, "elapsed_time": "2:24:09", "remaining_time": "3:19:32"}
+{"current_steps": 1910, "total_steps": 4530, "loss": 1.3972, "reward": null, "learning_rate": 3.109289756533349e-05, "epoch": 1.26, "percentage": 42.16, "elapsed_time": "2:25:13", "remaining_time": "3:19:13"}
+{"current_steps": 1920, "total_steps": 4530, "loss": 1.3783, "reward": null, "learning_rate": 3.092460321231547e-05, "epoch": 1.27, "percentage": 42.38, "elapsed_time": "2:25:55", "remaining_time": "3:18:21"}
+{"current_steps": 1930, "total_steps": 4530, "loss": 1.4122, "reward": null, "learning_rate": 3.075602391440918e-05, "epoch": 1.28, "percentage": 42.6, "elapsed_time": "2:26:40", "remaining_time": "3:17:35"}
+{"current_steps": 1940, "total_steps": 4530, "loss": 1.4105, "reward": null, "learning_rate": 3.058716777946713e-05, "epoch": 1.28, "percentage": 42.83, "elapsed_time": "2:27:26", "remaining_time": "3:16:50"}
+{"current_steps": 1950, "total_steps": 4530, "loss": 1.4091, "reward": null, "learning_rate": 3.0418042928656414e-05, "epoch": 1.29, "percentage": 43.05, "elapsed_time": "2:28:10", "remaining_time": "3:16:03"}
+{"current_steps": 1960, "total_steps": 4530, "loss": 1.4067, "reward": null, "learning_rate": 3.0248657496068027e-05, "epoch": 1.3, "percentage": 43.27, "elapsed_time": "2:28:55", "remaining_time": "3:15:16"}
+{"current_steps": 1970, "total_steps": 4530, "loss": 1.4172, "reward": null, "learning_rate": 3.0079019628325706e-05, "epoch": 1.3, "percentage": 43.49, "elapsed_time": "2:29:36", "remaining_time": "3:14:24"}
+{"current_steps": 1980, "total_steps": 4530, "loss": 1.3803, "reward": null, "learning_rate": 2.990913748419411e-05, "epoch": 1.31, "percentage": 43.71, "elapsed_time": "2:30:19", "remaining_time": "3:13:36"}
+{"current_steps": 1990, "total_steps": 4530, "loss": 1.4096, "reward": null, "learning_rate": 2.97390192341864e-05, "epoch": 1.32, "percentage": 43.93, "elapsed_time": "2:31:03", "remaining_time": "3:12:48"}
+{"current_steps": 2000, "total_steps": 4530, "loss": 1.3774, "reward": null, "learning_rate": 2.9568673060171326e-05, "epoch": 1.32, "percentage": 44.15, "elapsed_time": "2:31:46", "remaining_time": "3:11:59"}
+{"current_steps": 2010, "total_steps": 4530, "loss": 1.3729, "reward": null, "learning_rate": 2.9398107154979638e-05, "epoch": 1.33, "percentage": 44.37, "elapsed_time": "2:32:51", "remaining_time": "3:11:38"}
+{"current_steps": 2020, "total_steps": 4530, "loss": 1.3687, "reward": null, "learning_rate": 2.922732972201014e-05, "epoch": 1.34, "percentage": 44.59, "elapsed_time": "2:33:33", "remaining_time": "3:10:49"}
+{"current_steps": 2030, "total_steps": 4530, "loss": 1.3946, "reward": null, "learning_rate": 2.9056348974835067e-05, "epoch": 1.34, "percentage": 44.81, "elapsed_time": "2:34:17", "remaining_time": "3:10:01"}
+{"current_steps": 2040, "total_steps": 4530, "loss": 1.3922, "reward": null, "learning_rate": 2.8885173136805127e-05, "epoch": 1.35, "percentage": 45.03, "elapsed_time": "2:35:01", "remaining_time": "3:09:12"}
+{"current_steps": 2050, "total_steps": 4530, "loss": 1.3631, "reward": null, "learning_rate": 2.8713810440653926e-05, "epoch": 1.36, "percentage": 45.25, "elapsed_time": "2:35:45", "remaining_time": "3:08:25"}
+{"current_steps": 2060, "total_steps": 4530, "loss": 1.4193, "reward": null, "learning_rate": 2.8542269128102063e-05, "epoch": 1.36, "percentage": 45.47, "elapsed_time": "2:36:29", "remaining_time": "3:07:37"}
+{"current_steps": 2070, "total_steps": 4530, "loss": 1.3776, "reward": null, "learning_rate": 2.837055744946072e-05, "epoch": 1.37, "percentage": 45.7, "elapsed_time": "2:37:14", "remaining_time": "3:06:51"}
+{"current_steps": 2080, "total_steps": 4530, "loss": 1.4099, "reward": null, "learning_rate": 2.819868366323488e-05, "epoch": 1.38, "percentage": 45.92, "elapsed_time": "2:37:56", "remaining_time": "3:06:02"}
+{"current_steps": 2090, "total_steps": 4530, "loss": 1.41, "reward": null, "learning_rate": 2.8026656035726095e-05, "epoch": 1.38, "percentage": 46.14, "elapsed_time": "2:38:40", "remaining_time": "3:05:14"}
+{"current_steps": 2100, "total_steps": 4530, "loss": 1.4604, "reward": null, "learning_rate": 2.7854482840634965e-05, "epoch": 1.39, "percentage": 46.36, "elapsed_time": "2:39:21", "remaining_time": "3:04:24"}
+{"current_steps": 2110, "total_steps": 4530, "loss": 1.4485, "reward": null, "learning_rate": 2.7682172358663173e-05, "epoch": 1.4, "percentage": 46.58, "elapsed_time": "2:40:23", "remaining_time": "3:03:57"}
+{"current_steps": 2120, "total_steps": 4530, "loss": 1.4445, "reward": null, "learning_rate": 2.7509732877115257e-05, "epoch": 1.4, "percentage": 46.8, "elapsed_time": "2:41:06", "remaining_time": "3:03:08"}
+{"current_steps": 2130, "total_steps": 4530, "loss": 1.3889, "reward": null, "learning_rate": 2.73371726895e-05, "epoch": 1.41, "percentage": 47.02, "elapsed_time": "2:41:49", "remaining_time": "3:02:20"}
+{"current_steps": 2140, "total_steps": 4530, "loss": 1.4167, "reward": null, "learning_rate": 2.716450009513158e-05, "epoch": 1.42, "percentage": 47.24, "elapsed_time": "2:42:32", "remaining_time": "3:01:31"}
+{"current_steps": 2150, "total_steps": 4530, "loss": 1.3388, "reward": null, "learning_rate": 2.6991723398730383e-05, "epoch": 1.42, "percentage": 47.46, "elapsed_time": "2:43:16", "remaining_time": "3:00:44"}
+{"current_steps": 2160, "total_steps": 4530, "loss": 1.4379, "reward": null, "learning_rate": 2.68188509100236e-05, "epoch": 1.43, "percentage": 47.68, "elapsed_time": "2:44:01", "remaining_time": "2:59:57"}
+{"current_steps": 2170, "total_steps": 4530, "loss": 1.4119, "reward": null, "learning_rate": 2.6645890943345585e-05, "epoch": 1.44, "percentage": 47.9, "elapsed_time": "2:44:44", "remaining_time": "2:59:09"}
+{"current_steps": 2180, "total_steps": 4530, "loss": 1.3961, "reward": null, "learning_rate": 2.6472851817237948e-05, "epoch": 1.44, "percentage": 48.12, "elapsed_time": "2:45:29", "remaining_time": "2:58:23"}
+{"current_steps": 2190, "total_steps": 4530, "loss": 1.3999, "reward": null, "learning_rate": 2.6299741854049508e-05, "epoch": 1.45, "percentage": 48.34, "elapsed_time": "2:46:10", "remaining_time": "2:57:33"}
+{"current_steps": 2200, "total_steps": 4530, "loss": 1.3739, "reward": null, "learning_rate": 2.6126569379535985e-05, "epoch": 1.46, "percentage": 48.57, "elapsed_time": "2:46:53", "remaining_time": "2:56:45"}
+{"current_steps": 2210, "total_steps": 4530, "loss": 1.4256, "reward": null, "learning_rate": 2.5953342722459594e-05, "epoch": 1.46, "percentage": 48.79, "elapsed_time": "2:47:53", "remaining_time": "2:56:14"}
+{"current_steps": 2220, "total_steps": 4530, "loss": 1.4615, "reward": null, "learning_rate": 2.5780070214188478e-05, "epoch": 1.47, "percentage": 49.01, "elapsed_time": "2:48:38", "remaining_time": "2:55:28"}
+{"current_steps": 2230, "total_steps": 4530, "loss": 1.3877, "reward": null, "learning_rate": 2.5606760188296004e-05, "epoch": 1.48, "percentage": 49.23, "elapsed_time": "2:49:20", "remaining_time": "2:54:38"}
+{"current_steps": 2240, "total_steps": 4530, "loss": 1.3752, "reward": null, "learning_rate": 2.5433420980159944e-05, "epoch": 1.48, "percentage": 49.45, "elapsed_time": "2:50:03", "remaining_time": "2:53:50"}
+{"current_steps": 2250, "total_steps": 4530, "loss": 1.4084, "reward": null, "learning_rate": 2.526006092656161e-05, "epoch": 1.49, "percentage": 49.67, "elapsed_time": "2:50:45", "remaining_time": "2:53:01"}
+{"current_steps": 2260, "total_steps": 4530, "loss": 1.3921, "reward": null, "learning_rate": 2.508668836528486e-05, "epoch": 1.5, "percentage": 49.89, "elapsed_time": "2:51:29", "remaining_time": "2:52:14"}
+{"current_steps": 2270, "total_steps": 4530, "loss": 1.4104, "reward": null, "learning_rate": 2.491331163471514e-05, "epoch": 1.5, "percentage": 50.11, "elapsed_time": "2:52:13", "remaining_time": "2:51:28"}
+{"current_steps": 2280, "total_steps": 4530, "loss": 1.4053, "reward": null, "learning_rate": 2.4739939073438397e-05, "epoch": 1.51, "percentage": 50.33, "elapsed_time": "2:52:59", "remaining_time": "2:50:42"}
+{"current_steps": 2290, "total_steps": 4530, "loss": 1.381, "reward": null, "learning_rate": 2.456657901984006e-05, "epoch": 1.52, "percentage": 50.55, "elapsed_time": "2:53:45", "remaining_time": "2:49:57"}
+{"current_steps": 2300, "total_steps": 4530, "loss": 1.3752, "reward": null, "learning_rate": 2.4393239811704e-05, "epoch": 1.52, "percentage": 50.77, "elapsed_time": "2:54:29", "remaining_time": "2:49:10"}
+{"current_steps": 2310, "total_steps": 4530, "loss": 1.4023, "reward": null, "learning_rate": 2.4219929785811518e-05, "epoch": 1.53, "percentage": 50.99, "elapsed_time": "2:55:31", "remaining_time": "2:48:41"}
+{"current_steps": 2320, "total_steps": 4530, "loss": 1.3642, "reward": null, "learning_rate": 2.4046657277540412e-05, "epoch": 1.54, "percentage": 51.21, "elapsed_time": "2:56:16", "remaining_time": "2:47:55"}
+{"current_steps": 2330, "total_steps": 4530, "loss": 1.3977, "reward": null, "learning_rate": 2.3873430620464024e-05, "epoch": 1.54, "percentage": 51.43, "elapsed_time": "2:57:01", "remaining_time": "2:47:09"}
+{"current_steps": 2340, "total_steps": 4530, "loss": 1.3905, "reward": null, "learning_rate": 2.3700258145950495e-05, "epoch": 1.55, "percentage": 51.66, "elapsed_time": "2:57:45", "remaining_time": "2:46:22"}
+{"current_steps": 2350, "total_steps": 4530, "loss": 1.4022, "reward": null, "learning_rate": 2.3527148182762054e-05, "epoch": 1.56, "percentage": 51.88, "elapsed_time": "2:58:29", "remaining_time": "2:45:34"}
+{"current_steps": 2360, "total_steps": 4530, "loss": 1.4162, "reward": null, "learning_rate": 2.335410905665442e-05, "epoch": 1.56, "percentage": 52.1, "elapsed_time": "2:59:10", "remaining_time": "2:44:45"}
+{"current_steps": 2370, "total_steps": 4530, "loss": 1.3877, "reward": null, "learning_rate": 2.3181149089976405e-05, "epoch": 1.57, "percentage": 52.32, "elapsed_time": "2:59:55", "remaining_time": "2:43:58"}
+{"current_steps": 2380, "total_steps": 4530, "loss": 1.3704, "reward": null, "learning_rate": 2.3008276601269623e-05, "epoch": 1.58, "percentage": 52.54, "elapsed_time": "3:00:41", "remaining_time": "2:43:14"}
+{"current_steps": 2390, "total_steps": 4530, "loss": 1.3725, "reward": null, "learning_rate": 2.283549990486842e-05, "epoch": 1.58, "percentage": 52.76, "elapsed_time": "3:01:26", "remaining_time": "2:42:28"}
+{"current_steps": 2400, "total_steps": 4530, "loss": 1.4232, "reward": null, "learning_rate": 2.2662827310499995e-05, "epoch": 1.59, "percentage": 52.98, "elapsed_time": "3:02:10", "remaining_time": "2:41:41"}
+{"current_steps": 2410, "total_steps": 4530, "loss": 1.3916, "reward": null, "learning_rate": 2.249026712288474e-05, "epoch": 1.6, "percentage": 53.2, "elapsed_time": "3:03:15", "remaining_time": "2:41:12"}
+{"current_steps": 2420, "total_steps": 4530, "loss": 1.384, "reward": null, "learning_rate": 2.2317827641336833e-05, "epoch": 1.6, "percentage": 53.42, "elapsed_time": "3:03:59", "remaining_time": "2:40:25"}
+{"current_steps": 2430, "total_steps": 4530, "loss": 1.3969, "reward": null, "learning_rate": 2.2145517159365044e-05, "epoch": 1.61, "percentage": 53.64, "elapsed_time": "3:04:44", "remaining_time": "2:39:39"}
+{"current_steps": 2440, "total_steps": 4530, "loss": 1.3742, "reward": null, "learning_rate": 2.197334396427391e-05, "epoch": 1.62, "percentage": 53.86, "elapsed_time": "3:05:26", "remaining_time": "2:38:50"}
+{"current_steps": 2450, "total_steps": 4530, "loss": 1.3901, "reward": null, "learning_rate": 2.1801316336765126e-05, "epoch": 1.62, "percentage": 54.08, "elapsed_time": "3:06:08", "remaining_time": "2:38:02"}
+{"current_steps": 2460, "total_steps": 4530, "loss": 1.3853, "reward": null, "learning_rate": 2.162944255053928e-05, "epoch": 1.63, "percentage": 54.3, "elapsed_time": "3:06:52", "remaining_time": "2:37:14"}
+{"current_steps": 2470, "total_steps": 4530, "loss": 1.3709, "reward": null, "learning_rate": 2.145773087189794e-05, "epoch": 1.64, "percentage": 54.53, "elapsed_time": "3:07:36", "remaining_time": "2:36:27"}
+{"current_steps": 2480, "total_steps": 4530, "loss": 1.3758, "reward": null, "learning_rate": 2.128618955934608e-05, "epoch": 1.64, "percentage": 54.75, "elapsed_time": "3:08:19", "remaining_time": "2:35:40"}
+{"current_steps": 2490, "total_steps": 4530, "loss": 1.3561, "reward": null, "learning_rate": 2.1114826863194882e-05, "epoch": 1.65, "percentage": 54.97, "elapsed_time": "3:09:04", "remaining_time": "2:34:54"}
+{"current_steps": 2500, "total_steps": 4530, "loss": 1.3774, "reward": null, "learning_rate": 2.0943651025164932e-05, "epoch": 1.66, "percentage": 55.19, "elapsed_time": "3:09:48", "remaining_time": "2:34:07"}
+{"current_steps": 2510, "total_steps": 4530, "loss": 1.3961, "reward": null, "learning_rate": 2.0772670277989864e-05, "epoch": 1.66, "percentage": 55.41, "elapsed_time": "3:10:52", "remaining_time": "2:33:36"}
+{"current_steps": 2520, "total_steps": 4530, "loss": 1.3794, "reward": null, "learning_rate": 2.060189284502037e-05, "epoch": 1.67, "percentage": 55.63, "elapsed_time": "3:11:35", "remaining_time": "2:32:49"}
+{"current_steps": 2530, "total_steps": 4530, "loss": 1.4147, "reward": null, "learning_rate": 2.0431326939828686e-05, "epoch": 1.68, "percentage": 55.85, "elapsed_time": "3:12:17", "remaining_time": "2:32:00"}
+{"current_steps": 2540, "total_steps": 4530, "loss": 1.4336, "reward": null, "learning_rate": 2.0260980765813604e-05, "epoch": 1.68, "percentage": 56.07, "elapsed_time": "3:13:00", "remaining_time": "2:31:13"}
+{"current_steps": 2550, "total_steps": 4530, "loss": 1.4228, "reward": null, "learning_rate": 2.0090862515805898e-05, "epoch": 1.69, "percentage": 56.29, "elapsed_time": "3:13:45", "remaining_time": "2:30:26"}
+{"current_steps": 2560, "total_steps": 4530, "loss": 1.4188, "reward": null, "learning_rate": 1.99209803716743e-05, "epoch": 1.69, "percentage": 56.51, "elapsed_time": "3:14:26", "remaining_time": "2:29:37"}
+{"current_steps": 2570, "total_steps": 4530, "loss": 1.4492, "reward": null, "learning_rate": 1.975134250393198e-05, "epoch": 1.7, "percentage": 56.73, "elapsed_time": "3:15:10", "remaining_time": "2:28:50"}
+{"current_steps": 2580, "total_steps": 4530, "loss": 1.4492, "reward": null, "learning_rate": 1.9581957071343592e-05, "epoch": 1.71, "percentage": 56.95, "elapsed_time": "3:15:51", "remaining_time": "2:28:02"}
+{"current_steps": 2590, "total_steps": 4530, "loss": 1.4261, "reward": null, "learning_rate": 1.9412832220532867e-05, "epoch": 1.71, "percentage": 57.17, "elapsed_time": "3:16:32", "remaining_time": "2:27:13"}
+{"current_steps": 2600, "total_steps": 4530, "loss": 1.412, "reward": null, "learning_rate": 1.9243976085590824e-05, "epoch": 1.72, "percentage": 57.4, "elapsed_time": "3:17:14", "remaining_time": "2:26:25"}
+{"current_steps": 2610, "total_steps": 4530, "loss": 1.3858, "reward": null, "learning_rate": 1.9075396787684533e-05, "epoch": 1.73, "percentage": 57.62, "elapsed_time": "3:18:17", "remaining_time": "2:25:51"}
+{"current_steps": 2620, "total_steps": 4530, "loss": 1.3648, "reward": null, "learning_rate": 1.8907102434666523e-05, "epoch": 1.73, "percentage": 57.84, "elapsed_time": "3:19:00", "remaining_time": "2:25:04"}
+{"current_steps": 2630, "total_steps": 4530, "loss": 1.4267, "reward": null, "learning_rate": 1.8739101120684866e-05, "epoch": 1.74, "percentage": 58.06, "elapsed_time": "3:19:40", "remaining_time": "2:24:15"}
+{"current_steps": 2640, "total_steps": 4530, "loss": 1.4115, "reward": null, "learning_rate": 1.8571400925793855e-05, "epoch": 1.75, "percentage": 58.28, "elapsed_time": "3:20:23", "remaining_time": "2:23:27"}
+{"current_steps": 2650, "total_steps": 4530, "loss": 1.3767, "reward": null, "learning_rate": 1.840400991556541e-05, "epoch": 1.75, "percentage": 58.5, "elapsed_time": "3:21:07", "remaining_time": "2:22:41"}
+{"current_steps": 2660, "total_steps": 4530, "loss": 1.3934, "reward": null, "learning_rate": 1.8236936140701165e-05, "epoch": 1.76, "percentage": 58.72, "elapsed_time": "3:21:53", "remaining_time": "2:21:56"}
+{"current_steps": 2670, "total_steps": 4530, "loss": 1.368, "reward": null, "learning_rate": 1.807018763664524e-05, "epoch": 1.77, "percentage": 58.94, "elapsed_time": "3:22:39", "remaining_time": "2:21:10"}
+{"current_steps": 2680, "total_steps": 4530, "loss": 1.3925, "reward": null, "learning_rate": 1.7903772423197806e-05, "epoch": 1.77, "percentage": 59.16, "elapsed_time": "3:23:20", "remaining_time": "2:20:22"}
+{"current_steps": 2690, "total_steps": 4530, "loss": 1.3786, "reward": null, "learning_rate": 1.773769850412937e-05, "epoch": 1.78, "percentage": 59.38, "elapsed_time": "3:24:04", "remaining_time": "2:19:35"}
+{"current_steps": 2700, "total_steps": 4530, "loss": 1.4204, "reward": null, "learning_rate": 1.7571973866795815e-05, "epoch": 1.79, "percentage": 59.6, "elapsed_time": "3:24:46", "remaining_time": "2:18:47"}
+{"current_steps": 2710, "total_steps": 4530, "loss": 1.3907, "reward": null, "learning_rate": 1.7406606481754258e-05, "epoch": 1.79, "percentage": 59.82, "elapsed_time": "3:25:52", "remaining_time": "2:18:15"}
+{"current_steps": 2720, "total_steps": 4530, "loss": 1.3598, "reward": null, "learning_rate": 1.724160430237967e-05, "epoch": 1.8, "percentage": 60.04, "elapsed_time": "3:26:39", "remaining_time": "2:17:31"}
+{"current_steps": 2730, "total_steps": 4530, "loss": 1.4157, "reward": null, "learning_rate": 1.7076975264482434e-05, "epoch": 1.81, "percentage": 60.26, "elapsed_time": "3:27:20", "remaining_time": "2:16:42"}
+{"current_steps": 2740, "total_steps": 4530, "loss": 1.3922, "reward": null, "learning_rate": 1.6912727285926605e-05, "epoch": 1.81, "percentage": 60.49, "elapsed_time": "3:28:04", "remaining_time": "2:15:55"}
+{"current_steps": 2750, "total_steps": 4530, "loss": 1.4413, "reward": null, "learning_rate": 1.6748868266249114e-05, "epoch": 1.82, "percentage": 60.71, "elapsed_time": "3:28:47", "remaining_time": "2:15:08"}
+{"current_steps": 2760, "total_steps": 4530, "loss": 1.4219, "reward": null, "learning_rate": 1.658540608627985e-05, "epoch": 1.83, "percentage": 60.93, "elapsed_time": "3:29:30", "remaining_time": "2:14:21"}
+{"current_steps": 2770, "total_steps": 4530, "loss": 1.3447, "reward": null, "learning_rate": 1.642234860776261e-05, "epoch": 1.83, "percentage": 61.15, "elapsed_time": "3:30:13", "remaining_time": "2:13:34"}
+{"current_steps": 2780, "total_steps": 4530, "loss": 1.4383, "reward": null, "learning_rate": 1.6259703672977022e-05, "epoch": 1.84, "percentage": 61.37, "elapsed_time": "3:30:55", "remaining_time": "2:12:46"}
+{"current_steps": 2790, "total_steps": 4530, "loss": 1.3562, "reward": null, "learning_rate": 1.6097479104361326e-05, "epoch": 1.85, "percentage": 61.59, "elapsed_time": "3:31:39", "remaining_time": "2:12:00"}
+{"current_steps": 2800, "total_steps": 4530, "loss": 1.3865, "reward": null, "learning_rate": 1.5935682704136183e-05, "epoch": 1.85, "percentage": 61.81, "elapsed_time": "3:32:23", "remaining_time": "2:11:13"}
+{"current_steps": 2810, "total_steps": 4530, "loss": 1.3875, "reward": null, "learning_rate": 1.5774322253929425e-05, "epoch": 1.86, "percentage": 62.03, "elapsed_time": "3:33:27", "remaining_time": "2:10:39"}
+{"current_steps": 2820, "total_steps": 4530, "loss": 1.4282, "reward": null, "learning_rate": 1.561340551440176e-05, "epoch": 1.87, "percentage": 62.25, "elapsed_time": "3:34:09", "remaining_time": "2:09:51"}
+{"current_steps": 2830, "total_steps": 4530, "loss": 1.401, "reward": null, "learning_rate": 1.5452940224873568e-05, "epoch": 1.87, "percentage": 62.47, "elapsed_time": "3:34:51", "remaining_time": "2:09:04"}
+{"current_steps": 2840, "total_steps": 4530, "loss": 1.3645, "reward": null, "learning_rate": 1.529293410295266e-05, "epoch": 1.88, "percentage": 62.69, "elapsed_time": "3:35:37", "remaining_time": "2:08:18"}
+{"current_steps": 2850, "total_steps": 4530, "loss": 1.3877, "reward": null, "learning_rate": 1.5133394844163093e-05, "epoch": 1.89, "percentage": 62.91, "elapsed_time": "3:36:19", "remaining_time": "2:07:30"}
+{"current_steps": 2860, "total_steps": 4530, "loss": 1.4026, "reward": null, "learning_rate": 1.4974330121575048e-05, "epoch": 1.89, "percentage": 63.13, "elapsed_time": "3:37:03", "remaining_time": "2:06:44"}
+{"current_steps": 2870, "total_steps": 4530, "loss": 1.4235, "reward": null, "learning_rate": 1.4815747585435801e-05, "epoch": 1.9, "percentage": 63.36, "elapsed_time": "3:37:42", "remaining_time": "2:05:55"}
+{"current_steps": 2880, "total_steps": 4530, "loss": 1.3623, "reward": null, "learning_rate": 1.4657654862801798e-05, "epoch": 1.91, "percentage": 63.58, "elapsed_time": "3:38:23", "remaining_time": "2:05:07"}
+{"current_steps": 2890, "total_steps": 4530, "loss": 1.3823, "reward": null, "learning_rate": 1.4500059557171791e-05, "epoch": 1.91, "percentage": 63.8, "elapsed_time": "3:39:07", "remaining_time": "2:04:20"}
+{"current_steps": 2900, "total_steps": 4530, "loss": 1.3717, "reward": null, "learning_rate": 1.4342969248121185e-05, "epoch": 1.92, "percentage": 64.02, "elapsed_time": "3:39:51", "remaining_time": "2:03:34"}
+{"current_steps": 2910, "total_steps": 4530, "loss": 1.434, "reward": null, "learning_rate": 1.4186391490937481e-05, "epoch": 1.93, "percentage": 64.24, "elapsed_time": "3:40:52", "remaining_time": "2:02:57"}
+{"current_steps": 2920, "total_steps": 4530, "loss": 1.3688, "reward": null, "learning_rate": 1.403033381625688e-05, "epoch": 1.93, "percentage": 64.46, "elapsed_time": "3:41:34", "remaining_time": "2:02:10"}
+{"current_steps": 2930, "total_steps": 4530, "loss": 1.3404, "reward": null, "learning_rate": 1.3874803729702141e-05, "epoch": 1.94, "percentage": 64.68, "elapsed_time": "3:42:21", "remaining_time": "2:01:25"}
+{"current_steps": 2940, "total_steps": 4530, "loss": 1.3956, "reward": null, "learning_rate": 1.3719808711521573e-05, "epoch": 1.95, "percentage": 64.9, "elapsed_time": "3:43:04", "remaining_time": "2:00:38"}
+{"current_steps": 2950, "total_steps": 4530, "loss": 1.366, "reward": null, "learning_rate": 1.3565356216229268e-05, "epoch": 1.95, "percentage": 65.12, "elapsed_time": "3:43:50", "remaining_time": "1:59:53"}
+{"current_steps": 2960, "total_steps": 4530, "loss": 1.4425, "reward": null, "learning_rate": 1.341145367224657e-05, "epoch": 1.96, "percentage": 65.34, "elapsed_time": "3:44:32", "remaining_time": "1:59:06"}
+{"current_steps": 2970, "total_steps": 4530, "loss": 1.3728, "reward": null, "learning_rate": 1.3258108481544849e-05, "epoch": 1.97, "percentage": 65.56, "elapsed_time": "3:45:17", "remaining_time": "1:58:20"}
+{"current_steps": 2980, "total_steps": 4530, "loss": 1.4581, "reward": null, "learning_rate": 1.310532801928942e-05, "epoch": 1.97, "percentage": 65.78, "elapsed_time": "3:45:59", "remaining_time": "1:57:32"}
+{"current_steps": 2990, "total_steps": 4530, "loss": 1.3678, "reward": null, "learning_rate": 1.2953119633484903e-05, "epoch": 1.98, "percentage": 66.0, "elapsed_time": "3:46:42", "remaining_time": "1:56:46"}
+{"current_steps": 3000, "total_steps": 4530, "loss": 1.4091, "reward": null, "learning_rate": 1.2801490644621789e-05, "epoch": 1.99, "percentage": 66.23, "elapsed_time": "3:47:26", "remaining_time": "1:55:59"}
+{"current_steps": 3010, "total_steps": 4530, "loss": 1.3642, "reward": null, "learning_rate": 1.2650448345324384e-05, "epoch": 1.99, "percentage": 66.45, "elapsed_time": "3:48:27", "remaining_time": "1:55:21"}
+{"current_steps": 3020, "total_steps": 4530, "loss": 1.3949, "reward": null, "learning_rate": 1.2500000000000006e-05, "epoch": 2.0, "percentage": 66.67, "elapsed_time": "3:49:12", "remaining_time": "1:54:36"}
+{"current_steps": 3030, "total_steps": 4530, "loss": 1.3507, "reward": null, "learning_rate": 1.235015284448969e-05, "epoch": 2.01, "percentage": 66.89, "elapsed_time": "3:49:55", "remaining_time": "1:53:49"}
+{"current_steps": 3040, "total_steps": 4530, "loss": 1.3553, "reward": null, "learning_rate": 1.2200914085720119e-05, "epoch": 2.01, "percentage": 67.11, "elapsed_time": "3:50:39", "remaining_time": "1:53:03"}
+{"current_steps": 3050, "total_steps": 4530, "loss": 1.4108, "reward": null, "learning_rate": 1.2052290901357025e-05, "epoch": 2.02, "percentage": 67.33, "elapsed_time": "3:51:21", "remaining_time": "1:52:16"}
+{"current_steps": 3060, "total_steps": 4530, "loss": 1.3549, "reward": null, "learning_rate": 1.1904290439459973e-05, "epoch": 2.03, "percentage": 67.55, "elapsed_time": "3:52:05", "remaining_time": "1:51:29"}
+{"current_steps": 3070, "total_steps": 4530, "loss": 1.3371, "reward": null, "learning_rate": 1.175691981813858e-05, "epoch": 2.03, "percentage": 67.77, "elapsed_time": "3:52:51", "remaining_time": "1:50:44"}
+{"current_steps": 3080, "total_steps": 4530, "loss": 1.3775, "reward": null, "learning_rate": 1.1610186125210151e-05, "epoch": 2.04, "percentage": 67.99, "elapsed_time": "3:53:33", "remaining_time": "1:49:57"}
+{"current_steps": 3090, "total_steps": 4530, "loss": 1.3884, "reward": null, "learning_rate": 1.1464096417858822e-05, "epoch": 2.05, "percentage": 68.21, "elapsed_time": "3:54:18", "remaining_time": "1:49:11"}
+{"current_steps": 3100, "total_steps": 4530, "loss": 1.3516, "reward": null, "learning_rate": 1.1318657722296097e-05, "epoch": 2.05, "percentage": 68.43, "elapsed_time": "3:54:59", "remaining_time": "1:48:24"}
+{"current_steps": 3110, "total_steps": 4530, "loss": 1.405, "reward": null, "learning_rate": 1.1173877033422994e-05, "epoch": 2.06, "percentage": 68.65, "elapsed_time": "3:56:02", "remaining_time": "1:47:46"}
+{"current_steps": 3120, "total_steps": 4530, "loss": 1.3909, "reward": null, "learning_rate": 1.102976131449352e-05, "epoch": 2.07, "percentage": 68.87, "elapsed_time": "3:56:44", "remaining_time": "1:46:59"}
+{"current_steps": 3130, "total_steps": 4530, "loss": 1.4057, "reward": null, "learning_rate": 1.0886317496779863e-05, "epoch": 2.07, "percentage": 69.09, "elapsed_time": "3:57:27", "remaining_time": "1:46:12"}
+{"current_steps": 3140, "total_steps": 4530, "loss": 1.3807, "reward": null, "learning_rate": 1.0743552479238994e-05, "epoch": 2.08, "percentage": 69.32, "elapsed_time": "3:58:11", "remaining_time": "1:45:26"}
+{"current_steps": 3150, "total_steps": 4530, "loss": 1.3804, "reward": null, "learning_rate": 1.0601473128180855e-05, "epoch": 2.09, "percentage": 69.54, "elapsed_time": "3:58:55", "remaining_time": "1:44:40"}
+{"current_steps": 3160, "total_steps": 4530, "loss": 1.3368, "reward": null, "learning_rate": 1.0460086276938144e-05, "epoch": 2.09, "percentage": 69.76, "elapsed_time": "3:59:38", "remaining_time": "1:43:53"}
+{"current_steps": 3170, "total_steps": 4530, "loss": 1.3465, "reward": null, "learning_rate": 1.0319398725537644e-05, "epoch": 2.1, "percentage": 69.98, "elapsed_time": "4:00:22", "remaining_time": "1:43:07"}
+{"current_steps": 3180, "total_steps": 4530, "loss": 1.3716, "reward": null, "learning_rate": 1.0179417240373183e-05, "epoch": 2.11, "percentage": 70.2, "elapsed_time": "4:01:04", "remaining_time": "1:42:20"}
+{"current_steps": 3190, "total_steps": 4530, "loss": 1.3833, "reward": null, "learning_rate": 1.0040148553880205e-05, "epoch": 2.11, "percentage": 70.42, "elapsed_time": "4:01:47", "remaining_time": "1:41:33"}
+{"current_steps": 3200, "total_steps": 4530, "loss": 1.3893, "reward": null, "learning_rate": 9.90159936421197e-06, "epoch": 2.12, "percentage": 70.64, "elapsed_time": "4:02:29", "remaining_time": "1:40:47"}
+{"current_steps": 3210, "total_steps": 4530, "loss": 1.4088, "reward": null, "learning_rate": 9.763776334917399e-06, "epoch": 2.13, "percentage": 70.86, "elapsed_time": "4:03:32", "remaining_time": "1:40:08"}
+{"current_steps": 3220, "total_steps": 4530, "loss": 1.402, "reward": null, "learning_rate": 9.626686094620608e-06, "epoch": 2.13, "percentage": 71.08, "elapsed_time": "4:04:14", "remaining_time": "1:39:21"}
+{"current_steps": 3230, "total_steps": 4530, "loss": 1.3151, "reward": null, "learning_rate": 9.490335236702075e-06, "epoch": 2.14, "percentage": 71.3, "elapsed_time": "4:04:57", "remaining_time": "1:38:35"}
+{"current_steps": 3240, "total_steps": 4530, "loss": 1.4126, "reward": null, "learning_rate": 9.354730318981562e-06, "epoch": 2.15, "percentage": 71.52, "elapsed_time": "4:05:40", "remaining_time": "1:37:48"}
+{"current_steps": 3250, "total_steps": 4530, "loss": 1.431, "reward": null, "learning_rate": 9.219877863402682e-06, "epoch": 2.15, "percentage": 71.74, "elapsed_time": "4:06:23", "remaining_time": "1:37:02"}
+{"current_steps": 3260, "total_steps": 4530, "loss": 1.3843, "reward": null, "learning_rate": 9.085784355719257e-06, "epoch": 2.16, "percentage": 71.96, "elapsed_time": "4:07:06", "remaining_time": "1:36:15"}
+{"current_steps": 3270, "total_steps": 4530, "loss": 1.3513, "reward": null, "learning_rate": 8.95245624518336e-06, "epoch": 2.17, "percentage": 72.19, "elapsed_time": "4:07:51", "remaining_time": "1:35:30"}
+{"current_steps": 3280, "total_steps": 4530, "loss": 1.362, "reward": null, "learning_rate": 8.819899944235152e-06, "epoch": 2.17, "percentage": 72.41, "elapsed_time": "4:08:35", "remaining_time": "1:34:44"}
+{"current_steps": 3290, "total_steps": 4530, "loss": 1.3979, "reward": null, "learning_rate": 8.688121828194462e-06, "epoch": 2.18, "percentage": 72.63, "elapsed_time": "4:09:17", "remaining_time": "1:33:57"}
+{"current_steps": 3300, "total_steps": 4530, "loss": 1.3949, "reward": null, "learning_rate": 8.55712823495419e-06, "epoch": 2.18, "percentage": 72.85, "elapsed_time": "4:10:01", "remaining_time": "1:33:11"}
+{"current_steps": 3310, "total_steps": 4530, "loss": 1.3912, "reward": null, "learning_rate": 8.426925464675433e-06, "epoch": 2.19, "percentage": 73.07, "elapsed_time": "4:11:04", "remaining_time": "1:32:32"}
+{"current_steps": 3320, "total_steps": 4530, "loss": 1.35, "reward": null, "learning_rate": 8.297519779484541e-06, "epoch": 2.2, "percentage": 73.29, "elapsed_time": "4:11:47", "remaining_time": "1:31:45"}
+{"current_steps": 3330, "total_steps": 4530, "loss": 1.3528, "reward": null, "learning_rate": 8.168917403171891e-06, "epoch": 2.2, "percentage": 73.51, "elapsed_time": "4:12:33", "remaining_time": "1:31:00"}
+{"current_steps": 3340, "total_steps": 4530, "loss": 1.3743, "reward": null, "learning_rate": 8.041124520892598e-06, "epoch": 2.21, "percentage": 73.73, "elapsed_time": "4:13:19", "remaining_time": "1:30:15"}
+{"current_steps": 3350, "total_steps": 4530, "loss": 1.3708, "reward": null, "learning_rate": 7.91414727886898e-06, "epoch": 2.22, "percentage": 73.95, "elapsed_time": "4:14:05", "remaining_time": "1:29:30"}
+{"current_steps": 3360, "total_steps": 4530, "loss": 1.4525, "reward": null, "learning_rate": 7.787991784095e-06, "epoch": 2.22, "percentage": 74.17, "elapsed_time": "4:14:46", "remaining_time": "1:28:43"}
+{"current_steps": 3370, "total_steps": 4530, "loss": 1.3708, "reward": null, "learning_rate": 7.662664104042538e-06, "epoch": 2.23, "percentage": 74.39, "elapsed_time": "4:15:29", "remaining_time": "1:27:56"}
+{"current_steps": 3380, "total_steps": 4530, "loss": 1.3871, "reward": null, "learning_rate": 7.538170266369563e-06, "epoch": 2.24, "percentage": 74.61, "elapsed_time": "4:16:13", "remaining_time": "1:27:10"}
+{"current_steps": 3390, "total_steps": 4530, "loss": 1.3853, "reward": null, "learning_rate": 7.414516258630244e-06, "epoch": 2.24, "percentage": 74.83, "elapsed_time": "4:16:55", "remaining_time": "1:26:24"}
+{"current_steps": 3400, "total_steps": 4530, "loss": 1.3861, "reward": null, "learning_rate": 7.291708027986988e-06, "epoch": 2.25, "percentage": 75.06, "elapsed_time": "4:17:38", "remaining_time": "1:25:37"}
+{"current_steps": 3410, "total_steps": 4530, "loss": 1.3738, "reward": null, "learning_rate": 7.169751480924361e-06, "epoch": 2.26, "percentage": 75.28, "elapsed_time": "4:18:41", "remaining_time": "1:24:58"}
+{"current_steps": 3420, "total_steps": 4530, "loss": 1.3908, "reward": null, "learning_rate": 7.048652482965079e-06, "epoch": 2.26, "percentage": 75.5, "elapsed_time": "4:19:23", "remaining_time": "1:24:11"}
+{"current_steps": 3430, "total_steps": 4530, "loss": 1.3652, "reward": null, "learning_rate": 6.928416858387874e-06, "epoch": 2.27, "percentage": 75.72, "elapsed_time": "4:20:09", "remaining_time": "1:23:26"}
+{"current_steps": 3440, "total_steps": 4530, "loss": 1.3673, "reward": null, "learning_rate": 6.809050389947363e-06, "epoch": 2.28, "percentage": 75.94, "elapsed_time": "4:20:54", "remaining_time": "1:22:40"}
+{"current_steps": 3450, "total_steps": 4530, "loss": 1.395, "reward": null, "learning_rate": 6.690558818595943e-06, "epoch": 2.28, "percentage": 76.16, "elapsed_time": "4:21:39", "remaining_time": "1:21:54"}
+{"current_steps": 3460, "total_steps": 4530, "loss": 1.3734, "reward": null, "learning_rate": 6.5729478432076775e-06, "epoch": 2.29, "percentage": 76.38, "elapsed_time": "4:22:23", "remaining_time": "1:21:08"}
+{"current_steps": 3470, "total_steps": 4530, "loss": 1.4366, "reward": null, "learning_rate": 6.456223120304192e-06, "epoch": 2.3, "percentage": 76.6, "elapsed_time": "4:23:02", "remaining_time": "1:20:21"}
+{"current_steps": 3480, "total_steps": 4530, "loss": 1.4222, "reward": null, "learning_rate": 6.340390263782655e-06, "epoch": 2.3, "percentage": 76.82, "elapsed_time": "4:23:43", "remaining_time": "1:19:34"}
+{"current_steps": 3490, "total_steps": 4530, "loss": 1.3545, "reward": null, "learning_rate": 6.22545484464574e-06, "epoch": 2.31, "percentage": 77.04, "elapsed_time": "4:24:29", "remaining_time": "1:18:49"}
+{"current_steps": 3500, "total_steps": 4530, "loss": 1.3581, "reward": null, "learning_rate": 6.111422390733715e-06, "epoch": 2.32, "percentage": 77.26, "elapsed_time": "4:25:13", "remaining_time": "1:18:02"}
+{"current_steps": 3510, "total_steps": 4530, "loss": 1.4052, "reward": null, "learning_rate": 5.998298386458545e-06, "epoch": 2.32, "percentage": 77.48, "elapsed_time": "4:26:17", "remaining_time": "1:17:23"}
+{"current_steps": 3520, "total_steps": 4530, "loss": 1.3886, "reward": null, "learning_rate": 5.8860882725401665e-06, "epoch": 2.33, "percentage": 77.7, "elapsed_time": "4:27:02", "remaining_time": "1:16:37"}
+{"current_steps": 3530, "total_steps": 4530, "loss": 1.3818, "reward": null, "learning_rate": 5.774797445744781e-06, "epoch": 2.34, "percentage": 77.92, "elapsed_time": "4:27:45", "remaining_time": "1:15:51"}
+{"current_steps": 3540, "total_steps": 4530, "loss": 1.3817, "reward": null, "learning_rate": 5.664431258625305e-06, "epoch": 2.34, "percentage": 78.15, "elapsed_time": "4:28:25", "remaining_time": "1:15:04"}
+{"current_steps": 3550, "total_steps": 4530, "loss": 1.3617, "reward": null, "learning_rate": 5.55499501926394e-06, "epoch": 2.35, "percentage": 78.37, "elapsed_time": "4:29:09", "remaining_time": "1:14:18"}
+{"current_steps": 3560, "total_steps": 4530, "loss": 1.3768, "reward": null, "learning_rate": 5.446493991016879e-06, "epoch": 2.36, "percentage": 78.59, "elapsed_time": "4:29:50", "remaining_time": "1:13:31"}
+{"current_steps": 3570, "total_steps": 4530, "loss": 1.3755, "reward": null, "learning_rate": 5.338933392261159e-06, "epoch": 2.36, "percentage": 78.81, "elapsed_time": "4:30:35", "remaining_time": "1:12:45"}
+{"current_steps": 3580, "total_steps": 4530, "loss": 1.3823, "reward": null, "learning_rate": 5.23231839614369e-06, "epoch": 2.37, "percentage": 79.03, "elapsed_time": "4:31:20", "remaining_time": "1:12:00"}
+{"current_steps": 3590, "total_steps": 4530, "loss": 1.3883, "reward": null, "learning_rate": 5.126654130332451e-06, "epoch": 2.38, "percentage": 79.25, "elapsed_time": "4:32:02", "remaining_time": "1:11:13"}
+{"current_steps": 3600, "total_steps": 4530, "loss": 1.3988, "reward": null, "learning_rate": 5.02194567676986e-06, "epoch": 2.38, "percentage": 79.47, "elapsed_time": "4:32:44", "remaining_time": "1:10:27"}
+{"current_steps": 3610, "total_steps": 4530, "loss": 1.3838, "reward": null, "learning_rate": 4.918198071428382e-06, "epoch": 2.39, "percentage": 79.69, "elapsed_time": "4:33:48", "remaining_time": "1:09:46"}
+{"current_steps": 3620, "total_steps": 4530, "loss": 1.4422, "reward": null, "learning_rate": 4.815416304068298e-06, "epoch": 2.4, "percentage": 79.91, "elapsed_time": "4:34:36", "remaining_time": "1:09:01"}
+{"current_steps": 3630, "total_steps": 4530, "loss": 1.3834, "reward": null, "learning_rate": 4.713605317997741e-06, "epoch": 2.4, "percentage": 80.13, "elapsed_time": "4:35:20", "remaining_time": "1:08:15"}
+{"current_steps": 3640, "total_steps": 4530, "loss": 1.3743, "reward": null, "learning_rate": 4.61277000983493e-06, "epoch": 2.41, "percentage": 80.35, "elapsed_time": "4:36:00", "remaining_time": "1:07:29"}
+{"current_steps": 3650, "total_steps": 4530, "loss": 1.451, "reward": null, "learning_rate": 4.51291522927268e-06, "epoch": 2.42, "percentage": 80.57, "elapsed_time": "4:36:40", "remaining_time": "1:06:42"}
+{"current_steps": 3660, "total_steps": 4530, "loss": 1.3644, "reward": null, "learning_rate": 4.414045778845144e-06, "epoch": 2.42, "percentage": 80.79, "elapsed_time": "4:37:22", "remaining_time": "1:05:56"}
+{"current_steps": 3670, "total_steps": 4530, "loss": 1.3944, "reward": null, "learning_rate": 4.316166413696851e-06, "epoch": 2.43, "percentage": 81.02, "elapsed_time": "4:38:05", "remaining_time": "1:05:09"}
+{"current_steps": 3680, "total_steps": 4530, "loss": 1.3514, "reward": null, "learning_rate": 4.219281841353981e-06, "epoch": 2.44, "percentage": 81.24, "elapsed_time": "4:38:47", "remaining_time": "1:04:23"}
+{"current_steps": 3690, "total_steps": 4530, "loss": 1.3389, "reward": null, "learning_rate": 4.123396721497977e-06, "epoch": 2.44, "percentage": 81.46, "elapsed_time": "4:39:30", "remaining_time": "1:03:37"}
+{"current_steps": 3700, "total_steps": 4530, "loss": 1.3792, "reward": null, "learning_rate": 4.028515665741439e-06, "epoch": 2.45, "percentage": 81.68, "elapsed_time": "4:40:13", "remaining_time": "1:02:51"}
+{"current_steps": 3710, "total_steps": 4530, "loss": 1.3686, "reward": null, "learning_rate": 3.934643237406291e-06, "epoch": 2.46, "percentage": 81.9, "elapsed_time": "4:41:18", "remaining_time": "1:02:10"}
+{"current_steps": 3720, "total_steps": 4530, "loss": 1.3424, "reward": null, "learning_rate": 3.8417839513043645e-06, "epoch": 2.46, "percentage": 82.12, "elapsed_time": "4:42:03", "remaining_time": "1:01:25"}
+{"current_steps": 3730, "total_steps": 4530, "loss": 1.3684, "reward": null, "learning_rate": 3.7499422735202127e-06, "epoch": 2.47, "percentage": 82.34, "elapsed_time": "4:42:45", "remaining_time": "1:00:38"}
+{"current_steps": 3740, "total_steps": 4530, "loss": 1.3868, "reward": null, "learning_rate": 3.6591226211963287e-06, "epoch": 2.48, "percentage": 82.56, "elapsed_time": "4:43:28", "remaining_time": "0:59:52"}
+{"current_steps": 3750, "total_steps": 4530, "loss": 1.368, "reward": null, "learning_rate": 3.5693293623207086e-06, "epoch": 2.48, "percentage": 82.78, "elapsed_time": "4:44:12", "remaining_time": "0:59:06"}
+{"current_steps": 3760, "total_steps": 4530, "loss": 1.3027, "reward": null, "learning_rate": 3.480566815516756e-06, "epoch": 2.49, "percentage": 83.0, "elapsed_time": "4:44:59", "remaining_time": "0:58:21"}
+{"current_steps": 3770, "total_steps": 4530, "loss": 1.4223, "reward": null, "learning_rate": 3.3928392498355916e-06, "epoch": 2.5, "percentage": 83.22, "elapsed_time": "4:45:40", "remaining_time": "0:57:35"}
+{"current_steps": 3780, "total_steps": 4530, "loss": 1.3674, "reward": null, "learning_rate": 3.3061508845507323e-06, "epoch": 2.5, "percentage": 83.44, "elapsed_time": "4:46:26", "remaining_time": "0:56:49"}
+{"current_steps": 3790, "total_steps": 4530, "loss": 1.3848, "reward": null, "learning_rate": 3.22050588895515e-06, "epoch": 2.51, "percentage": 83.66, "elapsed_time": "4:47:11", "remaining_time": "0:56:04"}
+{"current_steps": 3800, "total_steps": 4530, "loss": 1.4191, "reward": null, "learning_rate": 3.135908382160771e-06, "epoch": 2.52, "percentage": 83.89, "elapsed_time": "4:47:54", "remaining_time": "0:55:18"}
+{"current_steps": 3810, "total_steps": 4530, "loss": 1.3796, "reward": null, "learning_rate": 3.0523624329003324e-06, "epoch": 2.52, "percentage": 84.11, "elapsed_time": "4:49:00", "remaining_time": "0:54:37"}
+{"current_steps": 3820, "total_steps": 4530, "loss": 1.4101, "reward": null, "learning_rate": 2.969872059331738e-06, "epoch": 2.53, "percentage": 84.33, "elapsed_time": "4:49:44", "remaining_time": "0:53:51"}
+{"current_steps": 3830, "total_steps": 4530, "loss": 1.379, "reward": null, "learning_rate": 2.8884412288447737e-06, "epoch": 2.54, "percentage": 84.55, "elapsed_time": "4:50:27", "remaining_time": "0:53:05"}
+{"current_steps": 3840, "total_steps": 4530, "loss": 1.3881, "reward": null, "learning_rate": 2.8080738578703054e-06, "epoch": 2.54, "percentage": 84.77, "elapsed_time": "4:51:09", "remaining_time": "0:52:19"}
+{"current_steps": 3850, "total_steps": 4530, "loss": 1.3464, "reward": null, "learning_rate": 2.728773811691923e-06, "epoch": 2.55, "percentage": 84.99, "elapsed_time": "4:51:54", "remaining_time": "0:51:33"}
+{"current_steps": 3860, "total_steps": 4530, "loss": 1.367, "reward": null, "learning_rate": 2.6505449042600244e-06, "epoch": 2.56, "percentage": 85.21, "elapsed_time": "4:52:39", "remaining_time": "0:50:47"}
+{"current_steps": 3870, "total_steps": 4530, "loss": 1.3498, "reward": null, "learning_rate": 2.5733908980083988e-06, "epoch": 2.56, "percentage": 85.43, "elapsed_time": "4:53:24", "remaining_time": "0:50:02"}
+{"current_steps": 3880, "total_steps": 4530, "loss": 1.3895, "reward": null, "learning_rate": 2.4973155036732534e-06, "epoch": 2.57, "percentage": 85.65, "elapsed_time": "4:54:06", "remaining_time": "0:49:16"}
+{"current_steps": 3890, "total_steps": 4530, "loss": 1.4072, "reward": null, "learning_rate": 2.422322380114772e-06, "epoch": 2.58, "percentage": 85.87, "elapsed_time": "4:54:47", "remaining_time": "0:48:30"}
+{"current_steps": 3900, "total_steps": 4530, "loss": 1.347, "reward": null, "learning_rate": 2.348415134141102e-06, "epoch": 2.58, "percentage": 86.09, "elapsed_time": "4:55:33", "remaining_time": "0:47:44"}
+{"current_steps": 3910, "total_steps": 4530, "loss": 1.3605, "reward": null, "learning_rate": 2.2755973203349294e-06, "epoch": 2.59, "percentage": 86.31, "elapsed_time": "4:56:36", "remaining_time": "0:47:02"}
+{"current_steps": 3920, "total_steps": 4530, "loss": 1.3105, "reward": null, "learning_rate": 2.2038724408824844e-06, "epoch": 2.6, "percentage": 86.53, "elapsed_time": "4:57:21", "remaining_time": "0:46:16"}
+{"current_steps": 3930, "total_steps": 4530, "loss": 1.3718, "reward": null, "learning_rate": 2.133243945405128e-06, "epoch": 2.6, "percentage": 86.75, "elapsed_time": "4:58:06", "remaining_time": "0:45:30"}
+{"current_steps": 3940, "total_steps": 4530, "loss": 1.3293, "reward": null, "learning_rate": 2.0637152307934228e-06, "epoch": 2.61, "percentage": 86.98, "elapsed_time": "4:58:53", "remaining_time": "0:44:45"}
+{"current_steps": 3950, "total_steps": 4530, "loss": 1.3677, "reward": null, "learning_rate": 1.995289641043768e-06, "epoch": 2.62, "percentage": 87.2, "elapsed_time": "4:59:35", "remaining_time": "0:43:59"}
+{"current_steps": 3960, "total_steps": 4530, "loss": 1.409, "reward": null, "learning_rate": 1.927970467097573e-06, "epoch": 2.62, "percentage": 87.42, "elapsed_time": "5:00:16", "remaining_time": "0:43:13"}
+{"current_steps": 3970, "total_steps": 4530, "loss": 1.3973, "reward": null, "learning_rate": 1.8617609466829666e-06, "epoch": 2.63, "percentage": 87.64, "elapsed_time": "5:01:01", "remaining_time": "0:42:27"}
+{"current_steps": 3980, "total_steps": 4530, "loss": 1.3991, "reward": null, "learning_rate": 1.7966642641590925e-06, "epoch": 2.64, "percentage": 87.86, "elapsed_time": "5:01:43", "remaining_time": "0:41:41"}
+{"current_steps": 3990, "total_steps": 4530, "loss": 1.3662, "reward": null, "learning_rate": 1.732683550362954e-06, "epoch": 2.64, "percentage": 88.08, "elapsed_time": "5:02:25", "remaining_time": "0:40:55"}
+{"current_steps": 4000, "total_steps": 4530, "loss": 1.3871, "reward": null, "learning_rate": 1.6698218824588164e-06, "epoch": 2.65, "percentage": 88.3, "elapsed_time": "5:03:09", "remaining_time": "0:40:10"}
+{"current_steps": 4010, "total_steps": 4530, "loss": 1.4072, "reward": null, "learning_rate": 1.6080822837902382e-06, "epoch": 2.65, "percentage": 88.52, "elapsed_time": "5:04:12", "remaining_time": "0:39:26"}
+{"current_steps": 4020, "total_steps": 4530, "loss": 1.3841, "reward": null, "learning_rate": 1.5474677237346468e-06, "epoch": 2.66, "percentage": 88.74, "elapsed_time": "5:04:57", "remaining_time": "0:38:41"}
+{"current_steps": 4030, "total_steps": 4530, "loss": 1.3729, "reward": null, "learning_rate": 1.4879811175605302e-06, "epoch": 2.67, "percentage": 88.96, "elapsed_time": "5:05:42", "remaining_time": "0:37:55"}
+{"current_steps": 4040, "total_steps": 4530, "loss": 1.3648, "reward": null, "learning_rate": 1.4296253262872234e-06, "epoch": 2.67, "percentage": 89.18, "elapsed_time": "5:06:24", "remaining_time": "0:37:09"}
+{"current_steps": 4050, "total_steps": 4530, "loss": 1.4043, "reward": null, "learning_rate": 1.3724031565473112e-06, "epoch": 2.68, "percentage": 89.4, "elapsed_time": "5:07:06", "remaining_time": "0:36:23"}
+{"current_steps": 4060, "total_steps": 4530, "loss": 1.4135, "reward": null, "learning_rate": 1.316317360451641e-06, "epoch": 2.69, "percentage": 89.62, "elapsed_time": "5:07:50", "remaining_time": "0:35:38"}
+{"current_steps": 4070, "total_steps": 4530, "loss": 1.399, "reward": null, "learning_rate": 1.2613706354569571e-06, "epoch": 2.69, "percentage": 89.85, "elapsed_time": "5:08:34", "remaining_time": "0:34:52"}
+{"current_steps": 4080, "total_steps": 4530, "loss": 1.4024, "reward": null, "learning_rate": 1.2075656242361732e-06, "epoch": 2.7, "percentage": 90.07, "elapsed_time": "5:09:18", "remaining_time": "0:34:06"}
+{"current_steps": 4090, "total_steps": 4530, "loss": 1.3668, "reward": null, "learning_rate": 1.1549049145512636e-06, "epoch": 2.71, "percentage": 90.29, "elapsed_time": "5:10:02", "remaining_time": "0:33:21"}
+{"current_steps": 4100, "total_steps": 4530, "loss": 1.3692, "reward": null, "learning_rate": 1.1033910391288065e-06, "epoch": 2.71, "percentage": 90.51, "elapsed_time": "5:10:48", "remaining_time": "0:32:35"}
+{"current_steps": 4110, "total_steps": 4530, "loss": 1.3908, "reward": null, "learning_rate": 1.0530264755381824e-06, "epoch": 2.72, "percentage": 90.73, "elapsed_time": "5:11:50", "remaining_time": "0:31:52"}
+{"current_steps": 4120, "total_steps": 4530, "loss": 1.3999, "reward": null, "learning_rate": 1.0038136460723963e-06, "epoch": 2.73, "percentage": 90.95, "elapsed_time": "5:12:34", "remaining_time": "0:31:06"}
+{"current_steps": 4130, "total_steps": 4530, "loss": 1.4098, "reward": null, "learning_rate": 9.557549176315934e-07, "epoch": 2.73, "percentage": 91.17, "elapsed_time": "5:13:16", "remaining_time": "0:30:20"}
+{"current_steps": 4140, "total_steps": 4530, "loss": 1.3973, "reward": null, "learning_rate": 9.088526016092142e-07, "epoch": 2.74, "percentage": 91.39, "elapsed_time": "5:13:59", "remaining_time": "0:29:34"}
+{"current_steps": 4150, "total_steps": 4530, "loss": 1.3758, "reward": null, "learning_rate": 8.631089537808307e-07, "epoch": 2.75, "percentage": 91.61, "elapsed_time": "5:14:41", "remaining_time": "0:28:48"}
+{"current_steps": 4160, "total_steps": 4530, "loss": 1.3197, "reward": null, "learning_rate": 8.185261741956551e-07, "epoch": 2.75, "percentage": 91.83, "elapsed_time": "5:15:24", "remaining_time": "0:28:03"}
+{"current_steps": 4170, "total_steps": 4530, "loss": 1.3794, "reward": null, "learning_rate": 7.751064070707248e-07, "epoch": 2.76, "percentage": 92.05, "elapsed_time": "5:16:10", "remaining_time": "0:27:17"}
+{"current_steps": 4180, "total_steps": 4530, "loss": 1.3764, "reward": null, "learning_rate": 7.328517406877761e-07, "epoch": 2.77, "percentage": 92.27, "elapsed_time": "5:16:57", "remaining_time": "0:26:32"}
+{"current_steps": 4190, "total_steps": 4530, "loss": 1.4063, "reward": null, "learning_rate": 6.917642072928137e-07, "epoch": 2.77, "percentage": 92.49, "elapsed_time": "5:17:38", "remaining_time": "0:25:46"}
+{"current_steps": 4200, "total_steps": 4530, "loss": 1.3959, "reward": null, "learning_rate": 6.51845782998356e-07, "epoch": 2.78, "percentage": 92.72, "elapsed_time": "5:18:19", "remaining_time": "0:25:00"}
+{"current_steps": 4210, "total_steps": 4530, "loss": 1.3767, "reward": null, "learning_rate": 6.130983876884155e-07, "epoch": 2.79, "percentage": 92.94, "elapsed_time": "5:19:24", "remaining_time": "0:24:16"}
+{"current_steps": 4220, "total_steps": 4530, "loss": 1.3619, "reward": null, "learning_rate": 5.755238849261407e-07, "epoch": 2.79, "percentage": 93.16, "elapsed_time": "5:20:07", "remaining_time": "0:23:30"}
+{"current_steps": 4230, "total_steps": 4530, "loss": 1.3723, "reward": null, "learning_rate": 5.391240818642007e-07, "epoch": 2.8, "percentage": 93.38, "elapsed_time": "5:20:48", "remaining_time": "0:22:45"}
+{"current_steps": 4240, "total_steps": 4530, "loss": 1.4262, "reward": null, "learning_rate": 5.039007291578579e-07, "epoch": 2.81, "percentage": 93.6, "elapsed_time": "5:21:33", "remaining_time": "0:21:59"}
+{"current_steps": 4250, "total_steps": 4530, "loss": 1.3775, "reward": null, "learning_rate": 4.698555208807853e-07, "epoch": 2.81, "percentage": 93.82, "elapsed_time": "5:22:16", "remaining_time": "0:21:13"}
+{"current_steps": 4260, "total_steps": 4530, "loss": 1.4159, "reward": null, "learning_rate": 4.3699009444357344e-07, "epoch": 2.82, "percentage": 94.04, "elapsed_time": "5:22:58", "remaining_time": "0:20:28"}
+{"current_steps": 4270, "total_steps": 4530, "loss": 1.4007, "reward": null, "learning_rate": 4.0530603051499584e-07, "epoch": 2.83, "percentage": 94.26, "elapsed_time": "5:23:38", "remaining_time": "0:19:42"}
+{"current_steps": 4280, "total_steps": 4530, "loss": 1.3898, "reward": null, "learning_rate": 3.7480485294596747e-07, "epoch": 2.83, "percentage": 94.48, "elapsed_time": "5:24:23", "remaining_time": "0:18:56"}
+{"current_steps": 4290, "total_steps": 4530, "loss": 1.4173, "reward": null, "learning_rate": 3.454880286962781e-07, "epoch": 2.84, "percentage": 94.7, "elapsed_time": "5:25:05", "remaining_time": "0:18:11"}
+{"current_steps": 4300, "total_steps": 4530, "loss": 1.3539, "reward": null, "learning_rate": 3.1735696776400703e-07, "epoch": 2.85, "percentage": 94.92, "elapsed_time": "5:25:51", "remaining_time": "0:17:25"}
+{"current_steps": 4310, "total_steps": 4530, "loss": 1.3803, "reward": null, "learning_rate": 2.9041302311774433e-07, "epoch": 2.85, "percentage": 95.14, "elapsed_time": "5:26:52", "remaining_time": "0:16:41"}
+{"current_steps": 4320, "total_steps": 4530, "loss": 1.4141, "reward": null, "learning_rate": 2.646574906314925e-07, "epoch": 2.86, "percentage": 95.36, "elapsed_time": "5:27:35", "remaining_time": "0:15:55"}
+{"current_steps": 4330, "total_steps": 4530, "loss": 1.3444, "reward": null, "learning_rate": 2.4009160902235816e-07, "epoch": 2.87, "percentage": 95.58, "elapsed_time": "5:28:18", "remaining_time": "0:15:09"}
+{"current_steps": 4340, "total_steps": 4530, "loss": 1.3669, "reward": null, "learning_rate": 2.1671655979096094e-07, "epoch": 2.87, "percentage": 95.81, "elapsed_time": "5:29:03", "remaining_time": "0:14:24"}
+{"current_steps": 4350, "total_steps": 4530, "loss": 1.3776, "reward": null, "learning_rate": 1.9453346716462317e-07, "epoch": 2.88, "percentage": 96.03, "elapsed_time": "5:29:46", "remaining_time": "0:13:38"}
+{"current_steps": 4360, "total_steps": 4530, "loss": 1.4048, "reward": null, "learning_rate": 1.73543398043291e-07, "epoch": 2.89, "percentage": 96.25, "elapsed_time": "5:30:28", "remaining_time": "0:12:53"}
+{"current_steps": 4370, "total_steps": 4530, "loss": 1.3623, "reward": null, "learning_rate": 1.537473619482227e-07, "epoch": 2.89, "percentage": 96.47, "elapsed_time": "5:31:09", "remaining_time": "0:12:07"}
+{"current_steps": 4380, "total_steps": 4530, "loss": 1.3861, "reward": null, "learning_rate": 1.351463109734441e-07, "epoch": 2.9, "percentage": 96.69, "elapsed_time": "5:31:48", "remaining_time": "0:11:21"}
+{"current_steps": 4390, "total_steps": 4530, "loss": 1.3323, "reward": null, "learning_rate": 1.1774113973994083e-07, "epoch": 2.91, "percentage": 96.91, "elapsed_time": "5:32:32", "remaining_time": "0:10:36"}
+{"current_steps": 4400, "total_steps": 4530, "loss": 1.3646, "reward": null, "learning_rate": 1.0153268535264827e-07, "epoch": 2.91, "percentage": 97.13, "elapsed_time": "5:33:15", "remaining_time": "0:09:50"}
+{"current_steps": 4410, "total_steps": 4530, "loss": 1.3963, "reward": null, "learning_rate": 8.652172736017816e-08, "epoch": 2.92, "percentage": 97.35, "elapsed_time": "5:34:18", "remaining_time": "0:09:05"}
+{"current_steps": 4420, "total_steps": 4530, "loss": 1.3812, "reward": null, "learning_rate": 7.270898771733481e-08, "epoch": 2.93, "percentage": 97.57, "elapsed_time": "5:35:04", "remaining_time": "0:08:20"}
+{"current_steps": 4430, "total_steps": 4530, "loss": 1.375, "reward": null, "learning_rate": 6.00951307503872e-08, "epoch": 2.93, "percentage": 97.79, "elapsed_time": "5:35:47", "remaining_time": "0:07:34"}
+{"current_steps": 4440, "total_steps": 4530, "loss": 1.4015, "reward": null, "learning_rate": 4.868076312512515e-08, "epoch": 2.94, "percentage": 98.01, "elapsed_time": "5:36:30", "remaining_time": "0:06:49"}
+{"current_steps": 4450, "total_steps": 4530, "loss": 1.3795, "reward": null, "learning_rate": 3.846643381766879e-08, "epoch": 2.95, "percentage": 98.23, "elapsed_time": "5:37:12", "remaining_time": "0:06:03"}
+{"current_steps": 4460, "total_steps": 4530, "loss": 1.4244, "reward": null, "learning_rate": 2.94526340880813e-08, "epoch": 2.95, "percentage": 98.45, "elapsed_time": "5:37:53", "remaining_time": "0:05:18"}
+{"current_steps": 4470, "total_steps": 4530, "loss": 1.3731, "reward": null, "learning_rate": 2.1639797456723952e-08, "epoch": 2.96, "percentage": 98.68, "elapsed_time": "5:38:37", "remaining_time": "0:04:32"}
+{"current_steps": 4480, "total_steps": 4530, "loss": 1.4061, "reward": null, "learning_rate": 1.5028299683425562e-08, "epoch": 2.97, "percentage": 98.9, "elapsed_time": "5:39:21", "remaining_time": "0:03:47"}
+{"current_steps": 4490, "total_steps": 4530, "loss": 1.3842, "reward": null, "learning_rate": 9.618458749391379e-09, "epoch": 2.97, "percentage": 99.12, "elapsed_time": "5:40:04", "remaining_time": "0:03:01"}
+{"current_steps": 4500, "total_steps": 4530, "loss": 1.3693, "reward": null, "learning_rate": 5.41053484192644e-09, "epoch": 2.98, "percentage": 99.34, "elapsed_time": "5:40:45", "remaining_time": "0:02:16"}
+{"current_steps": 4510, "total_steps": 4530, "loss": 1.3439, "reward": null, "learning_rate": 2.4047303419094667e-09, "epoch": 2.99, "percentage": 99.56, "elapsed_time": "5:41:51", "remaining_time": "0:01:30"}
+{"current_steps": 4520, "total_steps": 4530, "loss": 1.3848, "reward": null, "learning_rate": 6.011898140617645e-10, "epoch": 2.99, "percentage": 99.78, "elapsed_time": "5:42:37", "remaining_time": "0:00:45"}
+{"current_steps": 4530, "total_steps": 4530, "loss": 1.3852, "reward": null, "learning_rate": 0.0, "epoch": 3.0, "percentage": 100.0, "elapsed_time": "5:43:21", "remaining_time": "0:00:00"}

trainer_state.json ADDED Viewed

	@@ -0,0 +1,3103 @@

+{
+  "best_metric": 1.3997734785079956,
+  "best_model_checkpoint": "alpaca_baichuan/checkpoint-4400",
+  "epoch": 2.9992551518662585,
+  "global_step": 4530,
+  "is_hyper_param_search": false,
+  "is_local_process_zero": true,
+  "is_world_process_zero": true,
+  "log_history": [
+    {
+      "epoch": 0.01,
+      "learning_rate": 4.999939881018594e-05,
+      "loss": 1.6257,
+      "step": 10
+    },
+    {
+      "epoch": 0.01,
+      "learning_rate": 4.999759526965809e-05,
+      "loss": 1.6388,
+      "step": 20
+    },
+    {
+      "epoch": 0.02,
+      "learning_rate": 4.999458946515808e-05,
+      "loss": 1.5034,
+      "step": 30
+    },
+    {
+      "epoch": 0.03,
+      "learning_rate": 4.999038154125061e-05,
+      "loss": 1.5761,
+      "step": 40
+    },
+    {
+      "epoch": 0.03,
+      "learning_rate": 4.998497170031657e-05,
+      "loss": 1.5066,
+      "step": 50
+    },
+    {
+      "epoch": 0.04,
+      "learning_rate": 4.997836020254328e-05,
+      "loss": 1.5738,
+      "step": 60
+    },
+    {
+      "epoch": 0.05,
+      "learning_rate": 4.9970547365911925e-05,
+      "loss": 1.4921,
+      "step": 70
+    },
+    {
+      "epoch": 0.05,
+      "learning_rate": 4.996153356618233e-05,
+      "loss": 1.4508,
+      "step": 80
+    },
+    {
+      "epoch": 0.06,
+      "learning_rate": 4.995131923687488e-05,
+      "loss": 1.4714,
+      "step": 90
+    },
+    {
+      "epoch": 0.07,
+      "learning_rate": 4.9939904869249616e-05,
+      "loss": 1.494,
+      "step": 100
+    },
+    {
+      "epoch": 0.07,
+      "eval_loss": 1.4796885251998901,
+      "eval_runtime": 20.1174,
+      "eval_samples_per_second": 24.307,
+      "eval_steps_per_second": 6.114,
+      "step": 100
+    },
+    {
+      "epoch": 0.07,
+      "learning_rate": 4.992729101228267e-05,
+      "loss": 1.4934,
+      "step": 110
+    },
+    {
+      "epoch": 0.08,
+      "learning_rate": 4.991347827263982e-05,
+      "loss": 1.4789,
+      "step": 120
+    },
+    {
+      "epoch": 0.09,
+      "learning_rate": 4.9898467314647356e-05,
+      "loss": 1.4511,
+      "step": 130
+    },
+    {
+      "epoch": 0.09,
+      "learning_rate": 4.9882258860260065e-05,
+      "loss": 1.4876,
+      "step": 140
+    },
+    {
+      "epoch": 0.1,
+      "learning_rate": 4.9864853689026556e-05,
+      "loss": 1.5124,
+      "step": 150
+    },
+    {
+      "epoch": 0.11,
+      "learning_rate": 4.984625263805178e-05,
+      "loss": 1.4772,
+      "step": 160
+    },
+    {
+      "epoch": 0.11,
+      "learning_rate": 4.982645660195671e-05,
+      "loss": 1.436,
+      "step": 170
+    },
+    {
+      "epoch": 0.12,
+      "learning_rate": 4.9805466532835376e-05,
+      "loss": 1.4377,
+      "step": 180
+    },
+    {
+      "epoch": 0.13,
+      "learning_rate": 4.978328344020904e-05,
+      "loss": 1.438,
+      "step": 190
+    },
+    {
+      "epoch": 0.13,
+      "learning_rate": 4.975990839097764e-05,
+      "loss": 1.4448,
+      "step": 200
+    },
+    {
+      "epoch": 0.13,
+      "eval_loss": 1.45673668384552,
+      "eval_runtime": 20.2667,
+      "eval_samples_per_second": 24.128,
+      "eval_steps_per_second": 6.069,
+      "step": 200
+    },
+    {
+      "epoch": 0.14,
+      "learning_rate": 4.973534250936851e-05,
+      "loss": 1.452,
+      "step": 210
+    },
+    {
+      "epoch": 0.15,
+      "learning_rate": 4.970958697688226e-05,
+      "loss": 1.4813,
+      "step": 220
+    },
+    {
+      "epoch": 0.15,
+      "learning_rate": 4.9682643032235996e-05,
+      "loss": 1.41,
+      "step": 230
+    },
+    {
+      "epoch": 0.16,
+      "learning_rate": 4.965451197130373e-05,
+      "loss": 1.428,
+      "step": 240
+    },
+    {
+      "epoch": 0.17,
+      "learning_rate": 4.9625195147054034e-05,
+      "loss": 1.463,
+      "step": 250
+    },
+    {
+      "epoch": 0.17,
+      "learning_rate": 4.9594693969485006e-05,
+      "loss": 1.4821,
+      "step": 260
+    },
+    {
+      "epoch": 0.18,
+      "learning_rate": 4.956300990555643e-05,
+      "loss": 1.4855,
+      "step": 270
+    },
+    {
+      "epoch": 0.19,
+      "learning_rate": 4.9530144479119215e-05,
+      "loss": 1.4322,
+      "step": 280
+    },
+    {
+      "epoch": 0.19,
+      "learning_rate": 4.9496099270842145e-05,
+      "loss": 1.4397,
+      "step": 290
+    },
+    {
+      "epoch": 0.2,
+      "learning_rate": 4.9460875918135804e-05,
+      "loss": 1.4107,
+      "step": 300
+    },
+    {
+      "epoch": 0.2,
+      "eval_loss": 1.4451508522033691,
+      "eval_runtime": 19.869,
+      "eval_samples_per_second": 24.611,
+      "eval_steps_per_second": 6.191,
+      "step": 300
+    },
+    {
+      "epoch": 0.21,
+      "learning_rate": 4.942447611507386e-05,
+      "loss": 1.4722,
+      "step": 310
+    },
+    {
+      "epoch": 0.21,
+      "learning_rate": 4.938690161231159e-05,
+      "loss": 1.423,
+      "step": 320
+    },
+    {
+      "epoch": 0.22,
+      "learning_rate": 4.934815421700165e-05,
+      "loss": 1.4288,
+      "step": 330
+    },
+    {
+      "epoch": 0.23,
+      "learning_rate": 4.9308235792707194e-05,
+      "loss": 1.4294,
+      "step": 340
+    },
+    {
+      "epoch": 0.23,
+      "learning_rate": 4.9267148259312224e-05,
+      "loss": 1.4233,
+      "step": 350
+    },
+    {
+      "epoch": 0.24,
+      "learning_rate": 4.9224893592929275e-05,
+      "loss": 1.4553,
+      "step": 360
+    },
+    {
+      "epoch": 0.24,
+      "learning_rate": 4.9181473825804346e-05,
+      "loss": 1.4206,
+      "step": 370
+    },
+    {
+      "epoch": 0.25,
+      "learning_rate": 4.913689104621917e-05,
+      "loss": 1.442,
+      "step": 380
+    },
+    {
+      "epoch": 0.26,
+      "learning_rate": 4.909114739839079e-05,
+      "loss": 1.4668,
+      "step": 390
+    },
+    {
+      "epoch": 0.26,
+      "learning_rate": 4.9044245082368415e-05,
+      "loss": 1.4439,
+      "step": 400
+    },
+    {
+      "epoch": 0.26,
+      "eval_loss": 1.4394803047180176,
+      "eval_runtime": 19.9302,
+      "eval_samples_per_second": 24.536,
+      "eval_steps_per_second": 6.172,
+      "step": 400
+    },
+    {
+      "epoch": 0.27,
+      "learning_rate": 4.8996186353927606e-05,
+      "loss": 1.4224,
+      "step": 410
+    },
+    {
+      "epoch": 0.28,
+      "learning_rate": 4.894697352446182e-05,
+      "loss": 1.4084,
+      "step": 420
+    },
+    {
+      "epoch": 0.28,
+      "learning_rate": 4.889660896087119e-05,
+      "loss": 1.4398,
+      "step": 430
+    },
+    {
+      "epoch": 0.29,
+      "learning_rate": 4.884509508544874e-05,
+      "loss": 1.4268,
+      "step": 440
+    },
+    {
+      "epoch": 0.3,
+      "learning_rate": 4.879243437576383e-05,
+      "loss": 1.4522,
+      "step": 450
+    },
+    {
+      "epoch": 0.3,
+      "learning_rate": 4.8738629364543045e-05,
+      "loss": 1.4222,
+      "step": 460
+    },
+    {
+      "epoch": 0.31,
+      "learning_rate": 4.8683682639548365e-05,
+      "loss": 1.4956,
+      "step": 470
+    },
+    {
+      "epoch": 0.32,
+      "learning_rate": 4.862759684345269e-05,
+      "loss": 1.4538,
+      "step": 480
+    },
+    {
+      "epoch": 0.32,
+      "learning_rate": 4.857037467371278e-05,
+      "loss": 1.3748,
+      "step": 490
+    },
+    {
+      "epoch": 0.33,
+      "learning_rate": 4.8512018882439475e-05,
+      "loss": 1.4127,
+      "step": 500
+    },
+    {
+      "epoch": 0.33,
+      "eval_loss": 1.435186505317688,
+      "eval_runtime": 19.8689,
+      "eval_samples_per_second": 24.611,
+      "eval_steps_per_second": 6.191,
+      "step": 500
+    },
+    {
+      "epoch": 0.34,
+      "learning_rate": 4.8452532276265364e-05,
+      "loss": 1.3795,
+      "step": 510
+    },
+    {
+      "epoch": 0.34,
+      "learning_rate": 4.8391917716209765e-05,
+      "loss": 1.4414,
+      "step": 520
+    },
+    {
+      "epoch": 0.35,
+      "learning_rate": 4.833017811754119e-05,
+      "loss": 1.4242,
+      "step": 530
+    },
+    {
+      "epoch": 0.36,
+      "learning_rate": 4.8267316449637054e-05,
+      "loss": 1.4196,
+      "step": 540
+    },
+    {
+      "epoch": 0.36,
+      "learning_rate": 4.820333573584091e-05,
+      "loss": 1.389,
+      "step": 550
+    },
+    {
+      "epoch": 0.37,
+      "learning_rate": 4.813823905331704e-05,
+      "loss": 1.4597,
+      "step": 560
+    },
+    {
+      "epoch": 0.38,
+      "learning_rate": 4.8072029532902426e-05,
+      "loss": 1.4275,
+      "step": 570
+    },
+    {
+      "epoch": 0.38,
+      "learning_rate": 4.800471035895624e-05,
+      "loss": 1.4364,
+      "step": 580
+    },
+    {
+      "epoch": 0.39,
+      "learning_rate": 4.7936284769206584e-05,
+      "loss": 1.4366,
+      "step": 590
+    },
+    {
+      "epoch": 0.4,
+      "learning_rate": 4.786675605459487e-05,
+      "loss": 1.5086,
+      "step": 600
+    },
+    {
+      "epoch": 0.4,
+      "eval_loss": 1.4307918548583984,
+      "eval_runtime": 20.0563,
+      "eval_samples_per_second": 24.381,
+      "eval_steps_per_second": 6.133,
+      "step": 600
+    },
+    {
+      "epoch": 0.4,
+      "learning_rate": 4.779612755911752e-05,
+      "loss": 1.4309,
+      "step": 610
+    },
+    {
+      "epoch": 0.41,
+      "learning_rate": 4.772440267966508e-05,
+      "loss": 1.4102,
+      "step": 620
+    },
+    {
+      "epoch": 0.42,
+      "learning_rate": 4.76515848658589e-05,
+      "loss": 1.4035,
+      "step": 630
+    },
+    {
+      "epoch": 0.42,
+      "learning_rate": 4.7577677619885234e-05,
+      "loss": 1.4478,
+      "step": 640
+    },
+    {
+      "epoch": 0.43,
+      "learning_rate": 4.7502684496326746e-05,
+      "loss": 1.3999,
+      "step": 650
+    },
+    {
+      "epoch": 0.44,
+      "learning_rate": 4.7426609101991605e-05,
+      "loss": 1.4042,
+      "step": 660
+    },
+    {
+      "epoch": 0.44,
+      "learning_rate": 4.734945509573997e-05,
+      "loss": 1.4216,
+      "step": 670
+    },
+    {
+      "epoch": 0.45,
+      "learning_rate": 4.727122618830808e-05,
+      "loss": 1.4786,
+      "step": 680
+    },
+    {
+      "epoch": 0.46,
+      "learning_rate": 4.719192614212969e-05,
+      "loss": 1.4414,
+      "step": 690
+    },
+    {
+      "epoch": 0.46,
+      "learning_rate": 4.711155877115523e-05,
+      "loss": 1.493,
+      "step": 700
+    },
+    {
+      "epoch": 0.46,
+      "eval_loss": 1.427127480506897,
+      "eval_runtime": 20.5172,
+      "eval_samples_per_second": 23.834,
+      "eval_steps_per_second": 5.995,
+      "step": 700
+    },
+    {
+      "epoch": 0.47,
+      "learning_rate": 4.703012794066827e-05,
+      "loss": 1.4078,
+      "step": 710
+    },
+    {
+      "epoch": 0.48,
+      "learning_rate": 4.694763756709967e-05,
+      "loss": 1.4539,
+      "step": 720
+    },
+    {
+      "epoch": 0.48,
+      "learning_rate": 4.6864091617839235e-05,
+      "loss": 1.4458,
+      "step": 730
+    },
+    {
+      "epoch": 0.49,
+      "learning_rate": 4.677949411104485e-05,
+      "loss": 1.4001,
+      "step": 740
+    },
+    {
+      "epoch": 0.5,
+      "learning_rate": 4.669384911544927e-05,
+      "loss": 1.433,
+      "step": 750
+    },
+    {
+      "epoch": 0.5,
+      "learning_rate": 4.660716075016442e-05,
+      "loss": 1.4323,
+      "step": 760
+    },
+    {
+      "epoch": 0.51,
+      "learning_rate": 4.6519433184483245e-05,
+      "loss": 1.4052,
+      "step": 770
+    },
+    {
+      "epoch": 0.52,
+      "learning_rate": 4.6430670637679295e-05,
+      "loss": 1.4021,
+      "step": 780
+    },
+    {
+      "epoch": 0.52,
+      "learning_rate": 4.634087737880367e-05,
+      "loss": 1.4049,
+      "step": 790
+    },
+    {
+      "epoch": 0.53,
+      "learning_rate": 4.625005772647979e-05,
+      "loss": 1.3701,
+      "step": 800
+    },
+    {
+      "epoch": 0.53,
+      "eval_loss": 1.4250208139419556,
+      "eval_runtime": 20.0939,
+      "eval_samples_per_second": 24.336,
+      "eval_steps_per_second": 6.121,
+      "step": 800
+    },
+    {
+      "epoch": 0.54,
+      "learning_rate": 4.615821604869564e-05,
+      "loss": 1.4209,
+      "step": 810
+    },
+    {
+      "epoch": 0.54,
+      "learning_rate": 4.606535676259372e-05,
+      "loss": 1.4373,
+      "step": 820
+    },
+    {
+      "epoch": 0.55,
+      "learning_rate": 4.597148433425857e-05,
+      "loss": 1.4913,
+      "step": 830
+    },
+    {
+      "epoch": 0.56,
+      "learning_rate": 4.587660327850203e-05,
+      "loss": 1.434,
+      "step": 840
+    },
+    {
+      "epoch": 0.56,
+      "learning_rate": 4.578071815864602e-05,
+      "loss": 1.3932,
+      "step": 850
+    },
+    {
+      "epoch": 0.57,
+      "learning_rate": 4.5683833586303157e-05,
+      "loss": 1.4232,
+      "step": 860
+    },
+    {
+      "epoch": 0.58,
+      "learning_rate": 4.5585954221154856e-05,
+      "loss": 1.3651,
+      "step": 870
+    },
+    {
+      "epoch": 0.58,
+      "learning_rate": 4.548708477072733e-05,
+      "loss": 1.4009,
+      "step": 880
+    },
+    {
+      "epoch": 0.59,
+      "learning_rate": 4.5387229990165073e-05,
+      "loss": 1.428,
+      "step": 890
+    },
+    {
+      "epoch": 0.6,
+      "learning_rate": 4.528639468200226e-05,
+      "loss": 1.413,
+      "step": 900
+    },
+    {
+      "epoch": 0.6,
+      "eval_loss": 1.4226006269454956,
+      "eval_runtime": 20.161,
+      "eval_samples_per_second": 24.255,
+      "eval_steps_per_second": 6.101,
+      "step": 900
+    },
+    {
+      "epoch": 0.6,
+      "learning_rate": 4.51845836959317e-05,
+      "loss": 1.4328,
+      "step": 910
+    },
+    {
+      "epoch": 0.61,
+      "learning_rate": 4.508180192857162e-05,
+      "loss": 1.4262,
+      "step": 920
+    },
+    {
+      "epoch": 0.62,
+      "learning_rate": 4.497805432323015e-05,
+      "loss": 1.3677,
+      "step": 930
+    },
+    {
+      "epoch": 0.62,
+      "learning_rate": 4.487334586966756e-05,
+      "loss": 1.4546,
+      "step": 940
+    },
+    {
+      "epoch": 0.63,
+      "learning_rate": 4.476768160385632e-05,
+      "loss": 1.4011,
+      "step": 950
+    },
+    {
+      "epoch": 0.64,
+      "learning_rate": 4.466106660773885e-05,
+      "loss": 1.441,
+      "step": 960
+    },
+    {
+      "epoch": 0.64,
+      "learning_rate": 4.4553506008983126e-05,
+      "loss": 1.3946,
+      "step": 970
+    },
+    {
+      "epoch": 0.65,
+      "learning_rate": 4.4445004980736064e-05,
+      "loss": 1.4478,
+      "step": 980
+    },
+    {
+      "epoch": 0.66,
+      "learning_rate": 4.43355687413747e-05,
+      "loss": 1.4093,
+      "step": 990
+    },
+    {
+      "epoch": 0.66,
+      "learning_rate": 4.4225202554255227e-05,
+      "loss": 1.4285,
+      "step": 1000
+    },
+    {
+      "epoch": 0.66,
+      "eval_loss": 1.4204448461532593,
+      "eval_runtime": 19.9265,
+      "eval_samples_per_second": 24.54,
+      "eval_steps_per_second": 6.173,
+      "step": 1000
+    },
+    {
+      "epoch": 0.67,
+      "learning_rate": 4.411391172745984e-05,
+      "loss": 1.3971,
+      "step": 1010
+    },
+    {
+      "epoch": 0.68,
+      "learning_rate": 4.4001701613541456e-05,
+      "loss": 1.4024,
+      "step": 1020
+    },
+    {
+      "epoch": 0.68,
+      "learning_rate": 4.388857760926629e-05,
+      "loss": 1.3623,
+      "step": 1030
+    },
+    {
+      "epoch": 0.69,
+      "learning_rate": 4.3774545155354254e-05,
+      "loss": 1.3943,
+      "step": 1040
+    },
+    {
+      "epoch": 0.7,
+      "learning_rate": 4.3659609736217344e-05,
+      "loss": 1.4586,
+      "step": 1050
+    },
+    {
+      "epoch": 0.7,
+      "learning_rate": 4.354377687969581e-05,
+      "loss": 1.4178,
+      "step": 1060
+    },
+    {
+      "epoch": 0.71,
+      "learning_rate": 4.342705215679232e-05,
+      "loss": 1.4454,
+      "step": 1070
+    },
+    {
+      "epoch": 0.72,
+      "learning_rate": 4.330944118140407e-05,
+      "loss": 1.3769,
+      "step": 1080
+    },
+    {
+      "epoch": 0.72,
+      "learning_rate": 4.3190949610052645e-05,
+      "loss": 1.3912,
+      "step": 1090
+    },
+    {
+      "epoch": 0.73,
+      "learning_rate": 4.3071583141612135e-05,
+      "loss": 1.4116,
+      "step": 1100
+    },
+    {
+      "epoch": 0.73,
+      "eval_loss": 1.4190473556518555,
+      "eval_runtime": 19.9596,
+      "eval_samples_per_second": 24.499,
+      "eval_steps_per_second": 6.162,
+      "step": 1100
+    },
+    {
+      "epoch": 0.73,
+      "learning_rate": 4.295134751703493e-05,
+      "loss": 1.4019,
+      "step": 1110
+    },
+    {
+      "epoch": 0.74,
+      "learning_rate": 4.283024851907565e-05,
+      "loss": 1.378,
+      "step": 1120
+    },
+    {
+      "epoch": 0.75,
+      "learning_rate": 4.2708291972013026e-05,
+      "loss": 1.432,
+      "step": 1130
+    },
+    {
+      "epoch": 0.75,
+      "learning_rate": 4.2585483741369755e-05,
+      "loss": 1.4531,
+      "step": 1140
+    },
+    {
+      "epoch": 0.76,
+      "learning_rate": 4.2461829733630435e-05,
+      "loss": 1.4455,
+      "step": 1150
+    },
+    {
+      "epoch": 0.77,
+      "learning_rate": 4.233733589595746e-05,
+      "loss": 1.4081,
+      "step": 1160
+    },
+    {
+      "epoch": 0.77,
+      "learning_rate": 4.2212008215905e-05,
+      "loss": 1.4344,
+      "step": 1170
+    },
+    {
+      "epoch": 0.78,
+      "learning_rate": 4.208585272113102e-05,
+      "loss": 1.3935,
+      "step": 1180
+    },
+    {
+      "epoch": 0.79,
+      "learning_rate": 4.195887547910741e-05,
+      "loss": 1.4161,
+      "step": 1190
+    },
+    {
+      "epoch": 0.79,
+      "learning_rate": 4.1831082596828106e-05,
+      "loss": 1.4185,
+      "step": 1200
+    },
+    {
+      "epoch": 0.79,
+      "eval_loss": 1.4168447256088257,
+      "eval_runtime": 19.9431,
+      "eval_samples_per_second": 24.52,
+      "eval_steps_per_second": 6.168,
+      "step": 1200
+    },
+    {
+      "epoch": 0.8,
+      "learning_rate": 4.1702480220515475e-05,
+      "loss": 1.3714,
+      "step": 1210
+    },
+    {
+      "epoch": 0.81,
+      "learning_rate": 4.157307453532457e-05,
+      "loss": 1.4062,
+      "step": 1220
+    },
+    {
+      "epoch": 0.81,
+      "learning_rate": 4.144287176504582e-05,
+      "loss": 1.4007,
+      "step": 1230
+    },
+    {
+      "epoch": 0.82,
+      "learning_rate": 4.131187817180554e-05,
+      "loss": 1.4153,
+      "step": 1240
+    },
+    {
+      "epoch": 0.83,
+      "learning_rate": 4.118010005576485e-05,
+      "loss": 1.3619,
+      "step": 1250
+    },
+    {
+      "epoch": 0.83,
+      "learning_rate": 4.104754375481664e-05,
+      "loss": 1.507,
+      "step": 1260
+    },
+    {
+      "epoch": 0.84,
+      "learning_rate": 4.0914215644280754e-05,
+      "loss": 1.4487,
+      "step": 1270
+    },
+    {
+      "epoch": 0.85,
+      "learning_rate": 4.0780122136597323e-05,
+      "loss": 1.409,
+      "step": 1280
+    },
+    {
+      "epoch": 0.85,
+      "learning_rate": 4.064526968101844e-05,
+      "loss": 1.3994,
+      "step": 1290
+    },
+    {
+      "epoch": 0.86,
+      "learning_rate": 4.050966476329793e-05,
+      "loss": 1.4285,
+      "step": 1300
+    },
+    {
+      "epoch": 0.86,
+      "eval_loss": 1.4150002002716064,
+      "eval_runtime": 19.9449,
+      "eval_samples_per_second": 24.518,
+      "eval_steps_per_second": 6.167,
+      "step": 1300
+    },
+    {
+      "epoch": 0.87,
+      "learning_rate": 4.037331390537939e-05,
+      "loss": 1.4562,
+      "step": 1310
+    },
+    {
+      "epoch": 0.87,
+      "learning_rate": 4.023622366508261e-05,
+      "loss": 1.4202,
+      "step": 1320
+    },
+    {
+      "epoch": 0.88,
+      "learning_rate": 4.0098400635788035e-05,
+      "loss": 1.381,
+      "step": 1330
+    },
+    {
+      "epoch": 0.89,
+      "learning_rate": 3.99598514461198e-05,
+      "loss": 1.4656,
+      "step": 1340
+    },
+    {
+      "epoch": 0.89,
+      "learning_rate": 3.9820582759626825e-05,
+      "loss": 1.4094,
+      "step": 1350
+    },
+    {
+      "epoch": 0.9,
+      "learning_rate": 3.968060127446236e-05,
+      "loss": 1.4183,
+      "step": 1360
+    },
+    {
+      "epoch": 0.91,
+      "learning_rate": 3.953991372306186e-05,
+      "loss": 1.411,
+      "step": 1370
+    },
+    {
+      "epoch": 0.91,
+      "learning_rate": 3.9398526871819154e-05,
+      "loss": 1.418,
+      "step": 1380
+    },
+    {
+      "epoch": 0.92,
+      "learning_rate": 3.925644752076101e-05,
+      "loss": 1.4751,
+      "step": 1390
+    },
+    {
+      "epoch": 0.93,
+      "learning_rate": 3.911368250322014e-05,
+      "loss": 1.4246,
+      "step": 1400
+    },
+    {
+      "epoch": 0.93,
+      "eval_loss": 1.4129770994186401,
+      "eval_runtime": 19.9327,
+      "eval_samples_per_second": 24.533,
+      "eval_steps_per_second": 6.171,
+      "step": 1400
+    },
+    {
+      "epoch": 0.93,
+      "learning_rate": 3.897023868550649e-05,
+      "loss": 1.4102,
+      "step": 1410
+    },
+    {
+      "epoch": 0.94,
+      "learning_rate": 3.882612296657701e-05,
+      "loss": 1.3871,
+      "step": 1420
+    },
+    {
+      "epoch": 0.95,
+      "learning_rate": 3.8681342277703906e-05,
+      "loss": 1.4156,
+      "step": 1430
+    },
+    {
+      "epoch": 0.95,
+      "learning_rate": 3.853590358214119e-05,
+      "loss": 1.433,
+      "step": 1440
+    },
+    {
+      "epoch": 0.96,
+      "learning_rate": 3.8389813874789856e-05,
+      "loss": 1.4372,
+      "step": 1450
+    },
+    {
+      "epoch": 0.97,
+      "learning_rate": 3.8243080181861435e-05,
+      "loss": 1.3978,
+      "step": 1460
+    },
+    {
+      "epoch": 0.97,
+      "learning_rate": 3.809570956054004e-05,
+      "loss": 1.3964,
+      "step": 1470
+    },
+    {
+      "epoch": 0.98,
+      "learning_rate": 3.794770909864298e-05,
+      "loss": 1.4332,
+      "step": 1480
+    },
+    {
+      "epoch": 0.99,
+      "learning_rate": 3.779908591427988e-05,
+      "loss": 1.4044,
+      "step": 1490
+    },
+    {
+      "epoch": 0.99,
+      "learning_rate": 3.764984715551032e-05,
+      "loss": 1.4301,
+      "step": 1500
+    },
+    {
+      "epoch": 0.99,
+      "eval_loss": 1.412743330001831,
+      "eval_runtime": 19.9577,
+      "eval_samples_per_second": 24.502,
+      "eval_steps_per_second": 6.163,
+      "step": 1500
+    },
+    {
+      "epoch": 1.0,
+      "learning_rate": 3.7500000000000003e-05,
+      "loss": 1.4721,
+      "step": 1510
+    },
+    {
+      "epoch": 1.01,
+      "learning_rate": 3.734955165467563e-05,
+      "loss": 1.3905,
+      "step": 1520
+    },
+    {
+      "epoch": 1.01,
+      "learning_rate": 3.719850935537821e-05,
+      "loss": 1.423,
+      "step": 1530
+    },
+    {
+      "epoch": 1.02,
+      "learning_rate": 3.70468803665151e-05,
+      "loss": 1.404,
+      "step": 1540
+    },
+    {
+      "epoch": 1.03,
+      "learning_rate": 3.6894671980710574e-05,
+      "loss": 1.4042,
+      "step": 1550
+    },
+    {
+      "epoch": 1.03,
+      "learning_rate": 3.674189151845515e-05,
+      "loss": 1.4158,
+      "step": 1560
+    },
+    {
+      "epoch": 1.04,
+      "learning_rate": 3.6588546327753425e-05,
+      "loss": 1.409,
+      "step": 1570
+    },
+    {
+      "epoch": 1.05,
+      "learning_rate": 3.6434643783770736e-05,
+      "loss": 1.3764,
+      "step": 1580
+    },
+    {
+      "epoch": 1.05,
+      "learning_rate": 3.6280191288478436e-05,
+      "loss": 1.4021,
+      "step": 1590
+    },
+    {
+      "epoch": 1.06,
+      "learning_rate": 3.612519627029787e-05,
+      "loss": 1.3973,
+      "step": 1600
+    },
+    {
+      "epoch": 1.06,
+      "eval_loss": 1.411142349243164,
+      "eval_runtime": 19.9375,
+      "eval_samples_per_second": 24.527,
+      "eval_steps_per_second": 6.169,
+      "step": 1600
+    },
+    {
+      "epoch": 1.07,
+      "learning_rate": 3.596966618374313e-05,
+      "loss": 1.3985,
+      "step": 1610
+    },
+    {
+      "epoch": 1.07,
+      "learning_rate": 3.5813608509062526e-05,
+      "loss": 1.3444,
+      "step": 1620
+    },
+    {
+      "epoch": 1.08,
+      "learning_rate": 3.5657030751878814e-05,
+      "loss": 1.4207,
+      "step": 1630
+    },
+    {
+      "epoch": 1.09,
+      "learning_rate": 3.5499940442828206e-05,
+      "loss": 1.4304,
+      "step": 1640
+    },
+    {
+      "epoch": 1.09,
+      "learning_rate": 3.534234513719821e-05,
+      "loss": 1.3924,
+      "step": 1650
+    },
+    {
+      "epoch": 1.1,
+      "learning_rate": 3.51842524145642e-05,
+      "loss": 1.3686,
+      "step": 1660
+    },
+    {
+      "epoch": 1.11,
+      "learning_rate": 3.502566987842496e-05,
+      "loss": 1.4248,
+      "step": 1670
+    },
+    {
+      "epoch": 1.11,
+      "learning_rate": 3.4866605155836915e-05,
+      "loss": 1.3906,
+      "step": 1680
+    },
+    {
+      "epoch": 1.12,
+      "learning_rate": 3.470706589704734e-05,
+      "loss": 1.444,
+      "step": 1690
+    },
+    {
+      "epoch": 1.13,
+      "learning_rate": 3.4547059775126445e-05,
+      "loss": 1.3589,
+      "step": 1700
+    },
+    {
+      "epoch": 1.13,
+      "eval_loss": 1.4102592468261719,
+      "eval_runtime": 19.9452,
+      "eval_samples_per_second": 24.517,
+      "eval_steps_per_second": 6.167,
+      "step": 1700
+    },
+    {
+      "epoch": 1.13,
+      "learning_rate": 3.438659448559825e-05,
+      "loss": 1.319,
+      "step": 1710
+    },
+    {
+      "epoch": 1.14,
+      "learning_rate": 3.422567774607058e-05,
+      "loss": 1.406,
+      "step": 1720
+    },
+    {
+      "epoch": 1.15,
+      "learning_rate": 3.406431729586382e-05,
+      "loss": 1.4114,
+      "step": 1730
+    },
+    {
+      "epoch": 1.15,
+      "learning_rate": 3.390252089563867e-05,
+      "loss": 1.3722,
+      "step": 1740
+    },
+    {
+      "epoch": 1.16,
+      "learning_rate": 3.3740296327022984e-05,
+      "loss": 1.3528,
+      "step": 1750
+    },
+    {
+      "epoch": 1.17,
+      "learning_rate": 3.35776513922374e-05,
+      "loss": 1.4274,
+      "step": 1760
+    },
+    {
+      "epoch": 1.17,
+      "learning_rate": 3.341459391372016e-05,
+      "loss": 1.4324,
+      "step": 1770
+    },
+    {
+      "epoch": 1.18,
+      "learning_rate": 3.32511317337509e-05,
+      "loss": 1.409,
+      "step": 1780
+    },
+    {
+      "epoch": 1.19,
+      "learning_rate": 3.30872727140734e-05,
+      "loss": 1.3464,
+      "step": 1790
+    },
+    {
+      "epoch": 1.19,
+      "learning_rate": 3.292302473551757e-05,
+      "loss": 1.4144,
+      "step": 1800
+    },
+    {
+      "epoch": 1.19,
+      "eval_loss": 1.4091637134552002,
+      "eval_runtime": 19.9455,
+      "eval_samples_per_second": 24.517,
+      "eval_steps_per_second": 6.167,
+      "step": 1800
+    },
+    {
+      "epoch": 1.2,
+      "learning_rate": 3.2758395697620334e-05,
+      "loss": 1.4139,
+      "step": 1810
+    },
+    {
+      "epoch": 1.2,
+      "learning_rate": 3.259339351824575e-05,
+      "loss": 1.4247,
+      "step": 1820
+    },
+    {
+      "epoch": 1.21,
+      "learning_rate": 3.2428026133204184e-05,
+      "loss": 1.4241,
+      "step": 1830
+    },
+    {
+      "epoch": 1.22,
+      "learning_rate": 3.226230149587063e-05,
+      "loss": 1.3941,
+      "step": 1840
+    },
+    {
+      "epoch": 1.22,
+      "learning_rate": 3.20962275768022e-05,
+      "loss": 1.4238,
+      "step": 1850
+    },
+    {
+      "epoch": 1.23,
+      "learning_rate": 3.1929812363354766e-05,
+      "loss": 1.382,
+      "step": 1860
+    },
+    {
+      "epoch": 1.24,
+      "learning_rate": 3.1763063859298845e-05,
+      "loss": 1.4124,
+      "step": 1870
+    },
+    {
+      "epoch": 1.24,
+      "learning_rate": 3.159599008443459e-05,
+      "loss": 1.3963,
+      "step": 1880
+    },
+    {
+      "epoch": 1.25,
+      "learning_rate": 3.142859907420615e-05,
+      "loss": 1.3542,
+      "step": 1890
+    },
+    {
+      "epoch": 1.26,
+      "learning_rate": 3.126089887931515e-05,
+      "loss": 1.3852,
+      "step": 1900
+    },
+    {
+      "epoch": 1.26,
+      "eval_loss": 1.4086569547653198,
+      "eval_runtime": 19.948,
+      "eval_samples_per_second": 24.514,
+      "eval_steps_per_second": 6.166,
+      "step": 1900
+    },
+    {
+      "epoch": 1.26,
+      "learning_rate": 3.109289756533349e-05,
+      "loss": 1.3972,
+      "step": 1910
+    },
+    {
+      "epoch": 1.27,
+      "learning_rate": 3.092460321231547e-05,
+      "loss": 1.3783,
+      "step": 1920
+    },
+    {
+      "epoch": 1.28,
+      "learning_rate": 3.075602391440918e-05,
+      "loss": 1.4122,
+      "step": 1930
+    },
+    {
+      "epoch": 1.28,
+      "learning_rate": 3.058716777946713e-05,
+      "loss": 1.4105,
+      "step": 1940
+    },
+    {
+      "epoch": 1.29,
+      "learning_rate": 3.0418042928656414e-05,
+      "loss": 1.4091,
+      "step": 1950
+    },
+    {
+      "epoch": 1.3,
+      "learning_rate": 3.0248657496068027e-05,
+      "loss": 1.4067,
+      "step": 1960
+    },
+    {
+      "epoch": 1.3,
+      "learning_rate": 3.0079019628325706e-05,
+      "loss": 1.4172,
+      "step": 1970
+    },
+    {
+      "epoch": 1.31,
+      "learning_rate": 2.990913748419411e-05,
+      "loss": 1.3803,
+      "step": 1980
+    },
+    {
+      "epoch": 1.32,
+      "learning_rate": 2.97390192341864e-05,
+      "loss": 1.4096,
+      "step": 1990
+    },
+    {
+      "epoch": 1.32,
+      "learning_rate": 2.9568673060171326e-05,
+      "loss": 1.3774,
+      "step": 2000
+    },
+    {
+      "epoch": 1.32,
+      "eval_loss": 1.407130479812622,
+      "eval_runtime": 19.928,
+      "eval_samples_per_second": 24.538,
+      "eval_steps_per_second": 6.172,
+      "step": 2000
+    },
+    {
+      "epoch": 1.33,
+      "learning_rate": 2.9398107154979638e-05,
+      "loss": 1.3729,
+      "step": 2010
+    },
+    {
+      "epoch": 1.34,
+      "learning_rate": 2.922732972201014e-05,
+      "loss": 1.3687,
+      "step": 2020
+    },
+    {
+      "epoch": 1.34,
+      "learning_rate": 2.9056348974835067e-05,
+      "loss": 1.3946,
+      "step": 2030
+    },
+    {
+      "epoch": 1.35,
+      "learning_rate": 2.8885173136805127e-05,
+      "loss": 1.3922,
+      "step": 2040
+    },
+    {
+      "epoch": 1.36,
+      "learning_rate": 2.8713810440653926e-05,
+      "loss": 1.3631,
+      "step": 2050
+    },
+    {
+      "epoch": 1.36,
+      "learning_rate": 2.8542269128102063e-05,
+      "loss": 1.4193,
+      "step": 2060
+    },
+    {
+      "epoch": 1.37,
+      "learning_rate": 2.837055744946072e-05,
+      "loss": 1.3776,
+      "step": 2070
+    },
+    {
+      "epoch": 1.38,
+      "learning_rate": 2.819868366323488e-05,
+      "loss": 1.4099,
+      "step": 2080
+    },
+    {
+      "epoch": 1.38,
+      "learning_rate": 2.8026656035726095e-05,
+      "loss": 1.41,
+      "step": 2090
+    },
+    {
+      "epoch": 1.39,
+      "learning_rate": 2.7854482840634965e-05,
+      "loss": 1.4604,
+      "step": 2100
+    },
+    {
+      "epoch": 1.39,
+      "eval_loss": 1.406220555305481,
+      "eval_runtime": 19.947,
+      "eval_samples_per_second": 24.515,
+      "eval_steps_per_second": 6.166,
+      "step": 2100
+    },
+    {
+      "epoch": 1.4,
+      "learning_rate": 2.7682172358663173e-05,
+      "loss": 1.4485,
+      "step": 2110
+    },
+    {
+      "epoch": 1.4,
+      "learning_rate": 2.7509732877115257e-05,
+      "loss": 1.4445,
+      "step": 2120
+    },
+    {
+      "epoch": 1.41,
+      "learning_rate": 2.73371726895e-05,
+      "loss": 1.3889,
+      "step": 2130
+    },
+    {
+      "epoch": 1.42,
+      "learning_rate": 2.716450009513158e-05,
+      "loss": 1.4167,
+      "step": 2140
+    },
+    {
+      "epoch": 1.42,
+      "learning_rate": 2.6991723398730383e-05,
+      "loss": 1.3388,
+      "step": 2150
+    },
+    {
+      "epoch": 1.43,
+      "learning_rate": 2.68188509100236e-05,
+      "loss": 1.4379,
+      "step": 2160
+    },
+    {
+      "epoch": 1.44,
+      "learning_rate": 2.6645890943345585e-05,
+      "loss": 1.4119,
+      "step": 2170
+    },
+    {
+      "epoch": 1.44,
+      "learning_rate": 2.6472851817237948e-05,
+      "loss": 1.3961,
+      "step": 2180
+    },
+    {
+      "epoch": 1.45,
+      "learning_rate": 2.6299741854049508e-05,
+      "loss": 1.3999,
+      "step": 2190
+    },
+    {
+      "epoch": 1.46,
+      "learning_rate": 2.6126569379535985e-05,
+      "loss": 1.3739,
+      "step": 2200
+    },
+    {
+      "epoch": 1.46,
+      "eval_loss": 1.4052706956863403,
+      "eval_runtime": 19.9293,
+      "eval_samples_per_second": 24.537,
+      "eval_steps_per_second": 6.172,
+      "step": 2200
+    },
+    {
+      "epoch": 1.46,
+      "learning_rate": 2.5953342722459594e-05,
+      "loss": 1.4256,
+      "step": 2210
+    },
+    {
+      "epoch": 1.47,
+      "learning_rate": 2.5780070214188478e-05,
+      "loss": 1.4615,
+      "step": 2220
+    },
+    {
+      "epoch": 1.48,
+      "learning_rate": 2.5606760188296004e-05,
+      "loss": 1.3877,
+      "step": 2230
+    },
+    {
+      "epoch": 1.48,
+      "learning_rate": 2.5433420980159944e-05,
+      "loss": 1.3752,
+      "step": 2240
+    },
+    {
+      "epoch": 1.49,
+      "learning_rate": 2.526006092656161e-05,
+      "loss": 1.4084,
+      "step": 2250
+    },
+    {
+      "epoch": 1.5,
+      "learning_rate": 2.508668836528486e-05,
+      "loss": 1.3921,
+      "step": 2260
+    },
+    {
+      "epoch": 1.5,
+      "learning_rate": 2.491331163471514e-05,
+      "loss": 1.4104,
+      "step": 2270
+    },
+    {
+      "epoch": 1.51,
+      "learning_rate": 2.4739939073438397e-05,
+      "loss": 1.4053,
+      "step": 2280
+    },
+    {
+      "epoch": 1.52,
+      "learning_rate": 2.456657901984006e-05,
+      "loss": 1.381,
+      "step": 2290
+    },
+    {
+      "epoch": 1.52,
+      "learning_rate": 2.4393239811704e-05,
+      "loss": 1.3752,
+      "step": 2300
+    },
+    {
+      "epoch": 1.52,
+      "eval_loss": 1.4050989151000977,
+      "eval_runtime": 19.9544,
+      "eval_samples_per_second": 24.506,
+      "eval_steps_per_second": 6.164,
+      "step": 2300
+    },
+    {
+      "epoch": 1.53,
+      "learning_rate": 2.4219929785811518e-05,
+      "loss": 1.4023,
+      "step": 2310
+    },
+    {
+      "epoch": 1.54,
+      "learning_rate": 2.4046657277540412e-05,
+      "loss": 1.3642,
+      "step": 2320
+    },
+    {
+      "epoch": 1.54,
+      "learning_rate": 2.3873430620464024e-05,
+      "loss": 1.3977,
+      "step": 2330
+    },
+    {
+      "epoch": 1.55,
+      "learning_rate": 2.3700258145950495e-05,
+      "loss": 1.3905,
+      "step": 2340
+    },
+    {
+      "epoch": 1.56,
+      "learning_rate": 2.3527148182762054e-05,
+      "loss": 1.4022,
+      "step": 2350
+    },
+    {
+      "epoch": 1.56,
+      "learning_rate": 2.335410905665442e-05,
+      "loss": 1.4162,
+      "step": 2360
+    },
+    {
+      "epoch": 1.57,
+      "learning_rate": 2.3181149089976405e-05,
+      "loss": 1.3877,
+      "step": 2370
+    },
+    {
+      "epoch": 1.58,
+      "learning_rate": 2.3008276601269623e-05,
+      "loss": 1.3704,
+      "step": 2380
+    },
+    {
+      "epoch": 1.58,
+      "learning_rate": 2.283549990486842e-05,
+      "loss": 1.3725,
+      "step": 2390
+    },
+    {
+      "epoch": 1.59,
+      "learning_rate": 2.2662827310499995e-05,
+      "loss": 1.4232,
+      "step": 2400
+    },
+    {
+      "epoch": 1.59,
+      "eval_loss": 1.4044643640518188,
+      "eval_runtime": 19.9565,
+      "eval_samples_per_second": 24.503,
+      "eval_steps_per_second": 6.163,
+      "step": 2400
+    },
+    {
+      "epoch": 1.6,
+      "learning_rate": 2.249026712288474e-05,
+      "loss": 1.3916,
+      "step": 2410
+    },
+    {
+      "epoch": 1.6,
+      "learning_rate": 2.2317827641336833e-05,
+      "loss": 1.384,
+      "step": 2420
+    },
+    {
+      "epoch": 1.61,
+      "learning_rate": 2.2145517159365044e-05,
+      "loss": 1.3969,
+      "step": 2430
+    },
+    {
+      "epoch": 1.62,
+      "learning_rate": 2.197334396427391e-05,
+      "loss": 1.3742,
+      "step": 2440
+    },
+    {
+      "epoch": 1.62,
+      "learning_rate": 2.1801316336765126e-05,
+      "loss": 1.3901,
+      "step": 2450
+    },
+    {
+      "epoch": 1.63,
+      "learning_rate": 2.162944255053928e-05,
+      "loss": 1.3853,
+      "step": 2460
+    },
+    {
+      "epoch": 1.64,
+      "learning_rate": 2.145773087189794e-05,
+      "loss": 1.3709,
+      "step": 2470
+    },
+    {
+      "epoch": 1.64,
+      "learning_rate": 2.128618955934608e-05,
+      "loss": 1.3758,
+      "step": 2480
+    },
+    {
+      "epoch": 1.65,
+      "learning_rate": 2.1114826863194882e-05,
+      "loss": 1.3561,
+      "step": 2490
+    },
+    {
+      "epoch": 1.66,
+      "learning_rate": 2.0943651025164932e-05,
+      "loss": 1.3774,
+      "step": 2500
+    },
+    {
+      "epoch": 1.66,
+      "eval_loss": 1.4048223495483398,
+      "eval_runtime": 19.9312,
+      "eval_samples_per_second": 24.534,
+      "eval_steps_per_second": 6.171,
+      "step": 2500
+    },
+    {
+      "epoch": 1.66,
+      "learning_rate": 2.0772670277989864e-05,
+      "loss": 1.3961,
+      "step": 2510
+    },
+    {
+      "epoch": 1.67,
+      "learning_rate": 2.060189284502037e-05,
+      "loss": 1.3794,
+      "step": 2520
+    },
+    {
+      "epoch": 1.68,
+      "learning_rate": 2.0431326939828686e-05,
+      "loss": 1.4147,
+      "step": 2530
+    },
+    {
+      "epoch": 1.68,
+      "learning_rate": 2.0260980765813604e-05,
+      "loss": 1.4336,
+      "step": 2540
+    },
+    {
+      "epoch": 1.69,
+      "learning_rate": 2.0090862515805898e-05,
+      "loss": 1.4228,
+      "step": 2550
+    },
+    {
+      "epoch": 1.69,
+      "learning_rate": 1.99209803716743e-05,
+      "loss": 1.4188,
+      "step": 2560
+    },
+    {
+      "epoch": 1.7,
+      "learning_rate": 1.975134250393198e-05,
+      "loss": 1.4492,
+      "step": 2570
+    },
+    {
+      "epoch": 1.71,
+      "learning_rate": 1.9581957071343592e-05,
+      "loss": 1.4492,
+      "step": 2580
+    },
+    {
+      "epoch": 1.71,
+      "learning_rate": 1.9412832220532867e-05,
+      "loss": 1.4261,
+      "step": 2590
+    },
+    {
+      "epoch": 1.72,
+      "learning_rate": 1.9243976085590824e-05,
+      "loss": 1.412,
+      "step": 2600
+    },
+    {
+      "epoch": 1.72,
+      "eval_loss": 1.4038400650024414,
+      "eval_runtime": 19.9456,
+      "eval_samples_per_second": 24.517,
+      "eval_steps_per_second": 6.167,
+      "step": 2600
+    },
+    {
+      "epoch": 1.73,
+      "learning_rate": 1.9075396787684533e-05,
+      "loss": 1.3858,
+      "step": 2610
+    },
+    {
+      "epoch": 1.73,
+      "learning_rate": 1.8907102434666523e-05,
+      "loss": 1.3648,
+      "step": 2620
+    },
+    {
+      "epoch": 1.74,
+      "learning_rate": 1.8739101120684866e-05,
+      "loss": 1.4267,
+      "step": 2630
+    },
+    {
+      "epoch": 1.75,
+      "learning_rate": 1.8571400925793855e-05,
+      "loss": 1.4115,
+      "step": 2640
+    },
+    {
+      "epoch": 1.75,
+      "learning_rate": 1.840400991556541e-05,
+      "loss": 1.3767,
+      "step": 2650
+    },
+    {
+      "epoch": 1.76,
+      "learning_rate": 1.8236936140701165e-05,
+      "loss": 1.3934,
+      "step": 2660
+    },
+    {
+      "epoch": 1.77,
+      "learning_rate": 1.807018763664524e-05,
+      "loss": 1.368,
+      "step": 2670
+    },
+    {
+      "epoch": 1.77,
+      "learning_rate": 1.7903772423197806e-05,
+      "loss": 1.3925,
+      "step": 2680
+    },
+    {
+      "epoch": 1.78,
+      "learning_rate": 1.773769850412937e-05,
+      "loss": 1.3786,
+      "step": 2690
+    },
+    {
+      "epoch": 1.79,
+      "learning_rate": 1.7571973866795815e-05,
+      "loss": 1.4204,
+      "step": 2700
+    },
+    {
+      "epoch": 1.79,
+      "eval_loss": 1.4035720825195312,
+      "eval_runtime": 19.9322,
+      "eval_samples_per_second": 24.533,
+      "eval_steps_per_second": 6.171,
+      "step": 2700
+    },
+    {
+      "epoch": 1.79,
+      "learning_rate": 1.7406606481754258e-05,
+      "loss": 1.3907,
+      "step": 2710
+    },
+    {
+      "epoch": 1.8,
+      "learning_rate": 1.724160430237967e-05,
+      "loss": 1.3598,
+      "step": 2720
+    },
+    {
+      "epoch": 1.81,
+      "learning_rate": 1.7076975264482434e-05,
+      "loss": 1.4157,
+      "step": 2730
+    },
+    {
+      "epoch": 1.81,
+      "learning_rate": 1.6912727285926605e-05,
+      "loss": 1.3922,
+      "step": 2740
+    },
+    {
+      "epoch": 1.82,
+      "learning_rate": 1.6748868266249114e-05,
+      "loss": 1.4413,
+      "step": 2750
+    },
+    {
+      "epoch": 1.83,
+      "learning_rate": 1.658540608627985e-05,
+      "loss": 1.4219,
+      "step": 2760
+    },
+    {
+      "epoch": 1.83,
+      "learning_rate": 1.642234860776261e-05,
+      "loss": 1.3447,
+      "step": 2770
+    },
+    {
+      "epoch": 1.84,
+      "learning_rate": 1.6259703672977022e-05,
+      "loss": 1.4383,
+      "step": 2780
+    },
+    {
+      "epoch": 1.85,
+      "learning_rate": 1.6097479104361326e-05,
+      "loss": 1.3562,
+      "step": 2790
+    },
+    {
+      "epoch": 1.85,
+      "learning_rate": 1.5935682704136183e-05,
+      "loss": 1.3865,
+      "step": 2800
+    },
+    {
+      "epoch": 1.85,
+      "eval_loss": 1.40265691280365,
+      "eval_runtime": 19.9442,
+      "eval_samples_per_second": 24.518,
+      "eval_steps_per_second": 6.167,
+      "step": 2800
+    },
+    {
+      "epoch": 1.86,
+      "learning_rate": 1.5774322253929425e-05,
+      "loss": 1.3875,
+      "step": 2810
+    },
+    {
+      "epoch": 1.87,
+      "learning_rate": 1.561340551440176e-05,
+      "loss": 1.4282,
+      "step": 2820
+    },
+    {
+      "epoch": 1.87,
+      "learning_rate": 1.5452940224873568e-05,
+      "loss": 1.401,
+      "step": 2830
+    },
+    {
+      "epoch": 1.88,
+      "learning_rate": 1.529293410295266e-05,
+      "loss": 1.3645,
+      "step": 2840
+    },
+    {
+      "epoch": 1.89,
+      "learning_rate": 1.5133394844163093e-05,
+      "loss": 1.3877,
+      "step": 2850
+    },
+    {
+      "epoch": 1.89,
+      "learning_rate": 1.4974330121575048e-05,
+      "loss": 1.4026,
+      "step": 2860
+    },
+    {
+      "epoch": 1.9,
+      "learning_rate": 1.4815747585435801e-05,
+      "loss": 1.4235,
+      "step": 2870
+    },
+    {
+      "epoch": 1.91,
+      "learning_rate": 1.4657654862801798e-05,
+      "loss": 1.3623,
+      "step": 2880
+    },
+    {
+      "epoch": 1.91,
+      "learning_rate": 1.4500059557171791e-05,
+      "loss": 1.3823,
+      "step": 2890
+    },
+    {
+      "epoch": 1.92,
+      "learning_rate": 1.4342969248121185e-05,
+      "loss": 1.3717,
+      "step": 2900
+    },
+    {
+      "epoch": 1.92,
+      "eval_loss": 1.4025269746780396,
+      "eval_runtime": 19.9411,
+      "eval_samples_per_second": 24.522,
+      "eval_steps_per_second": 6.168,
+      "step": 2900
+    },
+    {
+      "epoch": 1.93,
+      "learning_rate": 1.4186391490937481e-05,
+      "loss": 1.434,
+      "step": 2910
+    },
+    {
+      "epoch": 1.93,
+      "learning_rate": 1.403033381625688e-05,
+      "loss": 1.3688,
+      "step": 2920
+    },
+    {
+      "epoch": 1.94,
+      "learning_rate": 1.3874803729702141e-05,
+      "loss": 1.3404,
+      "step": 2930
+    },
+    {
+      "epoch": 1.95,
+      "learning_rate": 1.3719808711521573e-05,
+      "loss": 1.3956,
+      "step": 2940
+    },
+    {
+      "epoch": 1.95,
+      "learning_rate": 1.3565356216229268e-05,
+      "loss": 1.366,
+      "step": 2950
+    },
+    {
+      "epoch": 1.96,
+      "learning_rate": 1.341145367224657e-05,
+      "loss": 1.4425,
+      "step": 2960
+    },
+    {
+      "epoch": 1.97,
+      "learning_rate": 1.3258108481544849e-05,
+      "loss": 1.3728,
+      "step": 2970
+    },
+    {
+      "epoch": 1.97,
+      "learning_rate": 1.310532801928942e-05,
+      "loss": 1.4581,
+      "step": 2980
+    },
+    {
+      "epoch": 1.98,
+      "learning_rate": 1.2953119633484903e-05,
+      "loss": 1.3678,
+      "step": 2990
+    },
+    {
+      "epoch": 1.99,
+      "learning_rate": 1.2801490644621789e-05,
+      "loss": 1.4091,
+      "step": 3000
+    },
+    {
+      "epoch": 1.99,
+      "eval_loss": 1.4022454023361206,
+      "eval_runtime": 19.9582,
+      "eval_samples_per_second": 24.501,
+      "eval_steps_per_second": 6.163,
+      "step": 3000
+    },
+    {
+      "epoch": 1.99,
+      "learning_rate": 1.2650448345324384e-05,
+      "loss": 1.3642,
+      "step": 3010
+    },
+    {
+      "epoch": 2.0,
+      "learning_rate": 1.2500000000000006e-05,
+      "loss": 1.3949,
+      "step": 3020
+    },
+    {
+      "epoch": 2.01,
+      "learning_rate": 1.235015284448969e-05,
+      "loss": 1.3507,
+      "step": 3030
+    },
+    {
+      "epoch": 2.01,
+      "learning_rate": 1.2200914085720119e-05,
+      "loss": 1.3553,
+      "step": 3040
+    },
+    {
+      "epoch": 2.02,
+      "learning_rate": 1.2052290901357025e-05,
+      "loss": 1.4108,
+      "step": 3050
+    },
+    {
+      "epoch": 2.03,
+      "learning_rate": 1.1904290439459973e-05,
+      "loss": 1.3549,
+      "step": 3060
+    },
+    {
+      "epoch": 2.03,
+      "learning_rate": 1.175691981813858e-05,
+      "loss": 1.3371,
+      "step": 3070
+    },
+    {
+      "epoch": 2.04,
+      "learning_rate": 1.1610186125210151e-05,
+      "loss": 1.3775,
+      "step": 3080
+    },
+    {
+      "epoch": 2.05,
+      "learning_rate": 1.1464096417858822e-05,
+      "loss": 1.3884,
+      "step": 3090
+    },
+    {
+      "epoch": 2.05,
+      "learning_rate": 1.1318657722296097e-05,
+      "loss": 1.3516,
+      "step": 3100
+    },
+    {
+      "epoch": 2.05,
+      "eval_loss": 1.4020849466323853,
+      "eval_runtime": 19.9491,
+      "eval_samples_per_second": 24.512,
+      "eval_steps_per_second": 6.166,
+      "step": 3100
+    },
+    {
+      "epoch": 2.06,
+      "learning_rate": 1.1173877033422994e-05,
+      "loss": 1.405,
+      "step": 3110
+    },
+    {
+      "epoch": 2.07,
+      "learning_rate": 1.102976131449352e-05,
+      "loss": 1.3909,
+      "step": 3120
+    },
+    {
+      "epoch": 2.07,
+      "learning_rate": 1.0886317496779863e-05,
+      "loss": 1.4057,
+      "step": 3130
+    },
+    {
+      "epoch": 2.08,
+      "learning_rate": 1.0743552479238994e-05,
+      "loss": 1.3807,
+      "step": 3140
+    },
+    {
+      "epoch": 2.09,
+      "learning_rate": 1.0601473128180855e-05,
+      "loss": 1.3804,
+      "step": 3150
+    },
+    {
+      "epoch": 2.09,
+      "learning_rate": 1.0460086276938144e-05,
+      "loss": 1.3368,
+      "step": 3160
+    },
+    {
+      "epoch": 2.1,
+      "learning_rate": 1.0319398725537644e-05,
+      "loss": 1.3465,
+      "step": 3170
+    },
+    {
+      "epoch": 2.11,
+      "learning_rate": 1.0179417240373183e-05,
+      "loss": 1.3716,
+      "step": 3180
+    },
+    {
+      "epoch": 2.11,
+      "learning_rate": 1.0040148553880205e-05,
+      "loss": 1.3833,
+      "step": 3190
+    },
+    {
+      "epoch": 2.12,
+      "learning_rate": 9.90159936421197e-06,
+      "loss": 1.3893,
+      "step": 3200
+    },
+    {
+      "epoch": 2.12,
+      "eval_loss": 1.4016104936599731,
+      "eval_runtime": 19.9587,
+      "eval_samples_per_second": 24.501,
+      "eval_steps_per_second": 6.163,
+      "step": 3200
+    },
+    {
+      "epoch": 2.13,
+      "learning_rate": 9.763776334917399e-06,
+      "loss": 1.4088,
+      "step": 3210
+    },
+    {
+      "epoch": 2.13,
+      "learning_rate": 9.626686094620608e-06,
+      "loss": 1.402,
+      "step": 3220
+    },
+    {
+      "epoch": 2.14,
+      "learning_rate": 9.490335236702075e-06,
+      "loss": 1.3151,
+      "step": 3230
+    },
+    {
+      "epoch": 2.15,
+      "learning_rate": 9.354730318981562e-06,
+      "loss": 1.4126,
+      "step": 3240
+    },
+    {
+      "epoch": 2.15,
+      "learning_rate": 9.219877863402682e-06,
+      "loss": 1.431,
+      "step": 3250
+    },
+    {
+      "epoch": 2.16,
+      "learning_rate": 9.085784355719257e-06,
+      "loss": 1.3843,
+      "step": 3260
+    },
+    {
+      "epoch": 2.17,
+      "learning_rate": 8.95245624518336e-06,
+      "loss": 1.3513,
+      "step": 3270
+    },
+    {
+      "epoch": 2.17,
+      "learning_rate": 8.819899944235152e-06,
+      "loss": 1.362,
+      "step": 3280
+    },
+    {
+      "epoch": 2.18,
+      "learning_rate": 8.688121828194462e-06,
+      "loss": 1.3979,
+      "step": 3290
+    },
+    {
+      "epoch": 2.18,
+      "learning_rate": 8.55712823495419e-06,
+      "loss": 1.3949,
+      "step": 3300
+    },
+    {
+      "epoch": 2.18,
+      "eval_loss": 1.4013094902038574,
+      "eval_runtime": 19.9488,
+      "eval_samples_per_second": 24.513,
+      "eval_steps_per_second": 6.166,
+      "step": 3300
+    },
+    {
+      "epoch": 2.19,
+      "learning_rate": 8.426925464675433e-06,
+      "loss": 1.3912,
+      "step": 3310
+    },
+    {
+      "epoch": 2.2,
+      "learning_rate": 8.297519779484541e-06,
+      "loss": 1.35,
+      "step": 3320
+    },
+    {
+      "epoch": 2.2,
+      "learning_rate": 8.168917403171891e-06,
+      "loss": 1.3528,
+      "step": 3330
+    },
+    {
+      "epoch": 2.21,
+      "learning_rate": 8.041124520892598e-06,
+      "loss": 1.3743,
+      "step": 3340
+    },
+    {
+      "epoch": 2.22,
+      "learning_rate": 7.91414727886898e-06,
+      "loss": 1.3708,
+      "step": 3350
+    },
+    {
+      "epoch": 2.22,
+      "learning_rate": 7.787991784095e-06,
+      "loss": 1.4525,
+      "step": 3360
+    },
+    {
+      "epoch": 2.23,
+      "learning_rate": 7.662664104042538e-06,
+      "loss": 1.3708,
+      "step": 3370
+    },
+    {
+      "epoch": 2.24,
+      "learning_rate": 7.538170266369563e-06,
+      "loss": 1.3871,
+      "step": 3380
+    },
+    {
+      "epoch": 2.24,
+      "learning_rate": 7.414516258630244e-06,
+      "loss": 1.3853,
+      "step": 3390
+    },
+    {
+      "epoch": 2.25,
+      "learning_rate": 7.291708027986988e-06,
+      "loss": 1.3861,
+      "step": 3400
+    },
+    {
+      "epoch": 2.25,
+      "eval_loss": 1.4008599519729614,
+      "eval_runtime": 19.9567,
+      "eval_samples_per_second": 24.503,
+      "eval_steps_per_second": 6.163,
+      "step": 3400
+    },
+    {
+      "epoch": 2.26,
+      "learning_rate": 7.169751480924361e-06,
+      "loss": 1.3738,
+      "step": 3410
+    },
+    {
+      "epoch": 2.26,
+      "learning_rate": 7.048652482965079e-06,
+      "loss": 1.3908,
+      "step": 3420
+    },
+    {
+      "epoch": 2.27,
+      "learning_rate": 6.928416858387874e-06,
+      "loss": 1.3652,
+      "step": 3430
+    },
+    {
+      "epoch": 2.28,
+      "learning_rate": 6.809050389947363e-06,
+      "loss": 1.3673,
+      "step": 3440
+    },
+    {
+      "epoch": 2.28,
+      "learning_rate": 6.690558818595943e-06,
+      "loss": 1.395,
+      "step": 3450
+    },
+    {
+      "epoch": 2.29,
+      "learning_rate": 6.5729478432076775e-06,
+      "loss": 1.3734,
+      "step": 3460
+    },
+    {
+      "epoch": 2.3,
+      "learning_rate": 6.456223120304192e-06,
+      "loss": 1.4366,
+      "step": 3470
+    },
+    {
+      "epoch": 2.3,
+      "learning_rate": 6.340390263782655e-06,
+      "loss": 1.4222,
+      "step": 3480
+    },
+    {
+      "epoch": 2.31,
+      "learning_rate": 6.22545484464574e-06,
+      "loss": 1.3545,
+      "step": 3490
+    },
+    {
+      "epoch": 2.32,
+      "learning_rate": 6.111422390733715e-06,
+      "loss": 1.3581,
+      "step": 3500
+    },
+    {
+      "epoch": 2.32,
+      "eval_loss": 1.4005074501037598,
+      "eval_runtime": 19.9485,
+      "eval_samples_per_second": 24.513,
+      "eval_steps_per_second": 6.166,
+      "step": 3500
+    },
+    {
+      "epoch": 2.32,
+      "learning_rate": 5.998298386458545e-06,
+      "loss": 1.4052,
+      "step": 3510
+    },
+    {
+      "epoch": 2.33,
+      "learning_rate": 5.8860882725401665e-06,
+      "loss": 1.3886,
+      "step": 3520
+    },
+    {
+      "epoch": 2.34,
+      "learning_rate": 5.774797445744781e-06,
+      "loss": 1.3818,
+      "step": 3530
+    },
+    {
+      "epoch": 2.34,
+      "learning_rate": 5.664431258625305e-06,
+      "loss": 1.3817,
+      "step": 3540
+    },
+    {
+      "epoch": 2.35,
+      "learning_rate": 5.55499501926394e-06,
+      "loss": 1.3617,
+      "step": 3550
+    },
+    {
+      "epoch": 2.36,
+      "learning_rate": 5.446493991016879e-06,
+      "loss": 1.3768,
+      "step": 3560
+    },
+    {
+      "epoch": 2.36,
+      "learning_rate": 5.338933392261159e-06,
+      "loss": 1.3755,
+      "step": 3570
+    },
+    {
+      "epoch": 2.37,
+      "learning_rate": 5.23231839614369e-06,
+      "loss": 1.3823,
+      "step": 3580
+    },
+    {
+      "epoch": 2.38,
+      "learning_rate": 5.126654130332451e-06,
+      "loss": 1.3883,
+      "step": 3590
+    },
+    {
+      "epoch": 2.38,
+      "learning_rate": 5.02194567676986e-06,
+      "loss": 1.3988,
+      "step": 3600
+    },
+    {
+      "epoch": 2.38,
+      "eval_loss": 1.4005191326141357,
+      "eval_runtime": 19.9633,
+      "eval_samples_per_second": 24.495,
+      "eval_steps_per_second": 6.161,
+      "step": 3600
+    },
+    {
+      "epoch": 2.39,
+      "learning_rate": 4.918198071428382e-06,
+      "loss": 1.3838,
+      "step": 3610
+    },
+    {
+      "epoch": 2.4,
+      "learning_rate": 4.815416304068298e-06,
+      "loss": 1.4422,
+      "step": 3620
+    },
+    {
+      "epoch": 2.4,
+      "learning_rate": 4.713605317997741e-06,
+      "loss": 1.3834,
+      "step": 3630
+    },
+    {
+      "epoch": 2.41,
+      "learning_rate": 4.61277000983493e-06,
+      "loss": 1.3743,
+      "step": 3640
+    },
+    {
+      "epoch": 2.42,
+      "learning_rate": 4.51291522927268e-06,
+      "loss": 1.451,
+      "step": 3650
+    },
+    {
+      "epoch": 2.42,
+      "learning_rate": 4.414045778845144e-06,
+      "loss": 1.3644,
+      "step": 3660
+    },
+    {
+      "epoch": 2.43,
+      "learning_rate": 4.316166413696851e-06,
+      "loss": 1.3944,
+      "step": 3670
+    },
+    {
+      "epoch": 2.44,
+      "learning_rate": 4.219281841353981e-06,
+      "loss": 1.3514,
+      "step": 3680
+    },
+    {
+      "epoch": 2.44,
+      "learning_rate": 4.123396721497977e-06,
+      "loss": 1.3389,
+      "step": 3690
+    },
+    {
+      "epoch": 2.45,
+      "learning_rate": 4.028515665741439e-06,
+      "loss": 1.3792,
+      "step": 3700
+    },
+    {
+      "epoch": 2.45,
+      "eval_loss": 1.400659203529358,
+      "eval_runtime": 19.9466,
+      "eval_samples_per_second": 24.515,
+      "eval_steps_per_second": 6.166,
+      "step": 3700
+    },
+    {
+      "epoch": 2.46,
+      "learning_rate": 3.934643237406291e-06,
+      "loss": 1.3686,
+      "step": 3710
+    },
+    {
+      "epoch": 2.46,
+      "learning_rate": 3.8417839513043645e-06,
+      "loss": 1.3424,
+      "step": 3720
+    },
+    {
+      "epoch": 2.47,
+      "learning_rate": 3.7499422735202127e-06,
+      "loss": 1.3684,
+      "step": 3730
+    },
+    {
+      "epoch": 2.48,
+      "learning_rate": 3.6591226211963287e-06,
+      "loss": 1.3868,
+      "step": 3740
+    },
+    {
+      "epoch": 2.48,
+      "learning_rate": 3.5693293623207086e-06,
+      "loss": 1.368,
+      "step": 3750
+    },
+    {
+      "epoch": 2.49,
+      "learning_rate": 3.480566815516756e-06,
+      "loss": 1.3027,
+      "step": 3760
+    },
+    {
+      "epoch": 2.5,
+      "learning_rate": 3.3928392498355916e-06,
+      "loss": 1.4223,
+      "step": 3770
+    },
+    {
+      "epoch": 2.5,
+      "learning_rate": 3.3061508845507323e-06,
+      "loss": 1.3674,
+      "step": 3780
+    },
+    {
+      "epoch": 2.51,
+      "learning_rate": 3.22050588895515e-06,
+      "loss": 1.3848,
+      "step": 3790
+    },
+    {
+      "epoch": 2.52,
+      "learning_rate": 3.135908382160771e-06,
+      "loss": 1.4191,
+      "step": 3800
+    },
+    {
+      "epoch": 2.52,
+      "eval_loss": 1.4003913402557373,
+      "eval_runtime": 19.9553,
+      "eval_samples_per_second": 24.505,
+      "eval_steps_per_second": 6.164,
+      "step": 3800
+    },
+    {
+      "epoch": 2.52,
+      "learning_rate": 3.0523624329003324e-06,
+      "loss": 1.3796,
+      "step": 3810
+    },
+    {
+      "epoch": 2.53,
+      "learning_rate": 2.969872059331738e-06,
+      "loss": 1.4101,
+      "step": 3820
+    },
+    {
+      "epoch": 2.54,
+      "learning_rate": 2.8884412288447737e-06,
+      "loss": 1.379,
+      "step": 3830
+    },
+    {
+      "epoch": 2.54,
+      "learning_rate": 2.8080738578703054e-06,
+      "loss": 1.3881,
+      "step": 3840
+    },
+    {
+      "epoch": 2.55,
+      "learning_rate": 2.728773811691923e-06,
+      "loss": 1.3464,
+      "step": 3850
+    },
+    {
+      "epoch": 2.56,
+      "learning_rate": 2.6505449042600244e-06,
+      "loss": 1.367,
+      "step": 3860
+    },
+    {
+      "epoch": 2.56,
+      "learning_rate": 2.5733908980083988e-06,
+      "loss": 1.3498,
+      "step": 3870
+    },
+    {
+      "epoch": 2.57,
+      "learning_rate": 2.4973155036732534e-06,
+      "loss": 1.3895,
+      "step": 3880
+    },
+    {
+      "epoch": 2.58,
+      "learning_rate": 2.422322380114772e-06,
+      "loss": 1.4072,
+      "step": 3890
+    },
+    {
+      "epoch": 2.58,
+      "learning_rate": 2.348415134141102e-06,
+      "loss": 1.347,
+      "step": 3900
+    },
+    {
+      "epoch": 2.58,
+      "eval_loss": 1.400329351425171,
+      "eval_runtime": 19.9385,
+      "eval_samples_per_second": 24.525,
+      "eval_steps_per_second": 6.169,
+      "step": 3900
+    },
+    {
+      "epoch": 2.59,
+      "learning_rate": 2.2755973203349294e-06,
+      "loss": 1.3605,
+      "step": 3910
+    },
+    {
+      "epoch": 2.6,
+      "learning_rate": 2.2038724408824844e-06,
+      "loss": 1.3105,
+      "step": 3920
+    },
+    {
+      "epoch": 2.6,
+      "learning_rate": 2.133243945405128e-06,
+      "loss": 1.3718,
+      "step": 3930
+    },
+    {
+      "epoch": 2.61,
+      "learning_rate": 2.0637152307934228e-06,
+      "loss": 1.3293,
+      "step": 3940
+    },
+    {
+      "epoch": 2.62,
+      "learning_rate": 1.995289641043768e-06,
+      "loss": 1.3677,
+      "step": 3950
+    },
+    {
+      "epoch": 2.62,
+      "learning_rate": 1.927970467097573e-06,
+      "loss": 1.409,
+      "step": 3960
+    },
+    {
+      "epoch": 2.63,
+      "learning_rate": 1.8617609466829666e-06,
+      "loss": 1.3973,
+      "step": 3970
+    },
+    {
+      "epoch": 2.64,
+      "learning_rate": 1.7966642641590925e-06,
+      "loss": 1.3991,
+      "step": 3980
+    },
+    {
+      "epoch": 2.64,
+      "learning_rate": 1.732683550362954e-06,
+      "loss": 1.3662,
+      "step": 3990
+    },
+    {
+      "epoch": 2.65,
+      "learning_rate": 1.6698218824588164e-06,
+      "loss": 1.3871,
+      "step": 4000
+    },
+    {
+      "epoch": 2.65,
+      "eval_loss": 1.4001953601837158,
+      "eval_runtime": 19.9558,
+      "eval_samples_per_second": 24.504,
+      "eval_steps_per_second": 6.164,
+      "step": 4000
+    },
+    {
+      "epoch": 2.65,
+      "learning_rate": 1.6080822837902382e-06,
+      "loss": 1.4072,
+      "step": 4010
+    },
+    {
+      "epoch": 2.66,
+      "learning_rate": 1.5474677237346468e-06,
+      "loss": 1.3841,
+      "step": 4020
+    },
+    {
+      "epoch": 2.67,
+      "learning_rate": 1.4879811175605302e-06,
+      "loss": 1.3729,
+      "step": 4030
+    },
+    {
+      "epoch": 2.67,
+      "learning_rate": 1.4296253262872234e-06,
+      "loss": 1.3648,
+      "step": 4040
+    },
+    {
+      "epoch": 2.68,
+      "learning_rate": 1.3724031565473112e-06,
+      "loss": 1.4043,
+      "step": 4050
+    },
+    {
+      "epoch": 2.69,
+      "learning_rate": 1.316317360451641e-06,
+      "loss": 1.4135,
+      "step": 4060
+    },
+    {
+      "epoch": 2.69,
+      "learning_rate": 1.2613706354569571e-06,
+      "loss": 1.399,
+      "step": 4070
+    },
+    {
+      "epoch": 2.7,
+      "learning_rate": 1.2075656242361732e-06,
+      "loss": 1.4024,
+      "step": 4080
+    },
+    {
+      "epoch": 2.71,
+      "learning_rate": 1.1549049145512636e-06,
+      "loss": 1.3668,
+      "step": 4090
+    },
+    {
+      "epoch": 2.71,
+      "learning_rate": 1.1033910391288065e-06,
+      "loss": 1.3692,
+      "step": 4100
+    },
+    {
+      "epoch": 2.71,
+      "eval_loss": 1.399943232536316,
+      "eval_runtime": 19.9364,
+      "eval_samples_per_second": 24.528,
+      "eval_steps_per_second": 6.17,
+      "step": 4100
+    },
+    {
+      "epoch": 2.72,
+      "learning_rate": 1.0530264755381824e-06,
+      "loss": 1.3908,
+      "step": 4110
+    },
+    {
+      "epoch": 2.73,
+      "learning_rate": 1.0038136460723963e-06,
+      "loss": 1.3999,
+      "step": 4120
+    },
+    {
+      "epoch": 2.73,
+      "learning_rate": 9.557549176315934e-07,
+      "loss": 1.4098,
+      "step": 4130
+    },
+    {
+      "epoch": 2.74,
+      "learning_rate": 9.088526016092142e-07,
+      "loss": 1.3973,
+      "step": 4140
+    },
+    {
+      "epoch": 2.75,
+      "learning_rate": 8.631089537808307e-07,
+      "loss": 1.3758,
+      "step": 4150
+    },
+    {
+      "epoch": 2.75,
+      "learning_rate": 8.185261741956551e-07,
+      "loss": 1.3197,
+      "step": 4160
+    },
+    {
+      "epoch": 2.76,
+      "learning_rate": 7.751064070707248e-07,
+      "loss": 1.3794,
+      "step": 4170
+    },
+    {
+      "epoch": 2.77,
+      "learning_rate": 7.328517406877761e-07,
+      "loss": 1.3764,
+      "step": 4180
+    },
+    {
+      "epoch": 2.77,
+      "learning_rate": 6.917642072928137e-07,
+      "loss": 1.4063,
+      "step": 4190
+    },
+    {
+      "epoch": 2.78,
+      "learning_rate": 6.51845782998356e-07,
+      "loss": 1.3959,
+      "step": 4200
+    },
+    {
+      "epoch": 2.78,
+      "eval_loss": 1.3998632431030273,
+      "eval_runtime": 19.9527,
+      "eval_samples_per_second": 24.508,
+      "eval_steps_per_second": 6.165,
+      "step": 4200
+    },
+    {
+      "epoch": 2.79,
+      "learning_rate": 6.130983876884155e-07,
+      "loss": 1.3767,
+      "step": 4210
+    },
+    {
+      "epoch": 2.79,
+      "learning_rate": 5.755238849261407e-07,
+      "loss": 1.3619,
+      "step": 4220
+    },
+    {
+      "epoch": 2.8,
+      "learning_rate": 5.391240818642007e-07,
+      "loss": 1.3723,
+      "step": 4230
+    },
+    {
+      "epoch": 2.81,
+      "learning_rate": 5.039007291578579e-07,
+      "loss": 1.4262,
+      "step": 4240
+    },
+    {
+      "epoch": 2.81,
+      "learning_rate": 4.698555208807853e-07,
+      "loss": 1.3775,
+      "step": 4250
+    },
+    {
+      "epoch": 2.82,
+      "learning_rate": 4.3699009444357344e-07,
+      "loss": 1.4159,
+      "step": 4260
+    },
+    {
+      "epoch": 2.83,
+      "learning_rate": 4.0530603051499584e-07,
+      "loss": 1.4007,
+      "step": 4270
+    },
+    {
+      "epoch": 2.83,
+      "learning_rate": 3.7480485294596747e-07,
+      "loss": 1.3898,
+      "step": 4280
+    },
+    {
+      "epoch": 2.84,
+      "learning_rate": 3.454880286962781e-07,
+      "loss": 1.4173,
+      "step": 4290
+    },
+    {
+      "epoch": 2.85,
+      "learning_rate": 3.1735696776400703e-07,
+      "loss": 1.3539,
+      "step": 4300
+    },
+    {
+      "epoch": 2.85,
+      "eval_loss": 1.3998057842254639,
+      "eval_runtime": 19.9318,
+      "eval_samples_per_second": 24.534,
+      "eval_steps_per_second": 6.171,
+      "step": 4300
+    },
+    {
+      "epoch": 2.85,
+      "learning_rate": 2.9041302311774433e-07,
+      "loss": 1.3803,
+      "step": 4310
+    },
+    {
+      "epoch": 2.86,
+      "learning_rate": 2.646574906314925e-07,
+      "loss": 1.4141,
+      "step": 4320
+    },
+    {
+      "epoch": 2.87,
+      "learning_rate": 2.4009160902235816e-07,
+      "loss": 1.3444,
+      "step": 4330
+    },
+    {
+      "epoch": 2.87,
+      "learning_rate": 2.1671655979096094e-07,
+      "loss": 1.3669,
+      "step": 4340
+    },
+    {
+      "epoch": 2.88,
+      "learning_rate": 1.9453346716462317e-07,
+      "loss": 1.3776,
+      "step": 4350
+    },
+    {
+      "epoch": 2.89,
+      "learning_rate": 1.73543398043291e-07,
+      "loss": 1.4048,
+      "step": 4360
+    },
+    {
+      "epoch": 2.89,
+      "learning_rate": 1.537473619482227e-07,
+      "loss": 1.3623,
+      "step": 4370
+    },
+    {
+      "epoch": 2.9,
+      "learning_rate": 1.351463109734441e-07,
+      "loss": 1.3861,
+      "step": 4380
+    },
+    {
+      "epoch": 2.91,
+      "learning_rate": 1.1774113973994083e-07,
+      "loss": 1.3323,
+      "step": 4390
+    },
+    {
+      "epoch": 2.91,
+      "learning_rate": 1.0153268535264827e-07,
+      "loss": 1.3646,
+      "step": 4400
+    },
+    {
+      "epoch": 2.91,
+      "eval_loss": 1.3997734785079956,
+      "eval_runtime": 19.9549,
+      "eval_samples_per_second": 24.505,
+      "eval_steps_per_second": 6.164,
+      "step": 4400
+    },
+    {
+      "epoch": 2.92,
+      "learning_rate": 8.652172736017816e-08,
+      "loss": 1.3963,
+      "step": 4410
+    },
+    {
+      "epoch": 2.93,
+      "learning_rate": 7.270898771733481e-08,
+      "loss": 1.3812,
+      "step": 4420
+    },
+    {
+      "epoch": 2.93,
+      "learning_rate": 6.00951307503872e-08,
+      "loss": 1.375,
+      "step": 4430
+    },
+    {
+      "epoch": 2.94,
+      "learning_rate": 4.868076312512515e-08,
+      "loss": 1.4015,
+      "step": 4440
+    },
+    {
+      "epoch": 2.95,
+      "learning_rate": 3.846643381766879e-08,
+      "loss": 1.3795,
+      "step": 4450
+    },
+    {
+      "epoch": 2.95,
+      "learning_rate": 2.94526340880813e-08,
+      "loss": 1.4244,
+      "step": 4460
+    },
+    {
+      "epoch": 2.96,
+      "learning_rate": 2.1639797456723952e-08,
+      "loss": 1.3731,
+      "step": 4470
+    },
+    {
+      "epoch": 2.97,
+      "learning_rate": 1.5028299683425562e-08,
+      "loss": 1.4061,
+      "step": 4480
+    },
+    {
+      "epoch": 2.97,
+      "learning_rate": 9.618458749391379e-09,
+      "loss": 1.3842,
+      "step": 4490
+    },
+    {
+      "epoch": 2.98,
+      "learning_rate": 5.41053484192644e-09,
+      "loss": 1.3693,
+      "step": 4500
+    },
+    {
+      "epoch": 2.98,
+      "eval_loss": 1.3998451232910156,
+      "eval_runtime": 19.9451,
+      "eval_samples_per_second": 24.517,
+      "eval_steps_per_second": 6.167,
+      "step": 4500
+    },
+    {
+      "epoch": 2.99,
+      "learning_rate": 2.4047303419094667e-09,
+      "loss": 1.3439,
+      "step": 4510
+    },
+    {
+      "epoch": 2.99,
+      "learning_rate": 6.011898140617645e-10,
+      "loss": 1.3848,
+      "step": 4520
+    },
+    {
+      "epoch": 3.0,
+      "learning_rate": 0.0,
+      "loss": 1.3852,
+      "step": 4530
+    },
+    {
+      "epoch": 3.0,
+      "step": 4530,
+      "total_flos": 1.828885230092206e+18,
+      "train_loss": 1.4043121354732555,
+      "train_runtime": 20600.2987,
+      "train_samples_per_second": 7.038,
+      "train_steps_per_second": 0.22
+    }
+  ],
+  "max_steps": 4530,
+  "num_train_epochs": 3,
+  "total_flos": 1.828885230092206e+18,
+  "trial_name": null,
+  "trial_params": null
+}

training_args.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:600e570fde3f2384ebc2a5bebb380c9dafeb644821c59a35d0ce55abb93dd55d
+size 3274

training_eval_loss.png ADDED Viewed

training_loss.png ADDED Viewed