{
  "best_metric": 0.16174831986427307,
  "best_model_checkpoint": "checkpoints_commonvoice/checkpoint-543873",
  "epoch": 54.0,
  "global_step": 889974,
  "is_hyper_param_search": false,
  "is_local_process_zero": true,
  "is_world_process_zero": true,
  "log_history": [
    {
      "epoch": 0.03,
      "learning_rate": 1.9984922031430132e-05,
      "loss": 2.3359,
      "step": 500
    },
    {
      "epoch": 0.06,
      "learning_rate": 1.996975304896548e-05,
      "loss": 1.5264,
      "step": 1000
    },
    {
      "epoch": 0.09,
      "learning_rate": 1.995458406650082e-05,
      "loss": 1.3191,
      "step": 1500
    },
    {
      "epoch": 0.12,
      "learning_rate": 1.9939415084036163e-05,
      "loss": 1.1985,
      "step": 2000
    },
    {
      "epoch": 0.15,
      "learning_rate": 1.9924246101571506e-05,
      "loss": 1.098,
      "step": 2500
    },
    {
      "epoch": 0.18,
      "learning_rate": 1.9909077119106852e-05,
      "loss": 1.0314,
      "step": 3000
    },
    {
      "epoch": 0.21,
      "learning_rate": 1.9893908136642194e-05,
      "loss": 0.9714,
      "step": 3500
    },
    {
      "epoch": 0.24,
      "learning_rate": 1.987873915417754e-05,
      "loss": 0.9334,
      "step": 4000
    },
    {
      "epoch": 0.27,
      "learning_rate": 1.9863570171712883e-05,
      "loss": 0.8831,
      "step": 4500
    },
    {
      "epoch": 0.3,
      "learning_rate": 1.984840118924823e-05,
      "loss": 0.8505,
      "step": 5000
    },
    {
      "epoch": 0.33,
      "learning_rate": 1.983323220678357e-05,
      "loss": 0.8127,
      "step": 5500
    },
    {
      "epoch": 0.36,
      "learning_rate": 1.9818063224318917e-05,
      "loss": 0.786,
      "step": 6000
    },
    {
      "epoch": 0.39,
      "learning_rate": 1.980289424185426e-05,
      "loss": 0.7604,
      "step": 6500
    },
    {
      "epoch": 0.42,
      "learning_rate": 1.9787725259389602e-05,
      "loss": 0.7358,
      "step": 7000
    },
    {
      "epoch": 0.46,
      "learning_rate": 1.9772556276924944e-05,
      "loss": 0.7159,
      "step": 7500
    },
    {
      "epoch": 0.49,
      "learning_rate": 1.9757387294460287e-05,
      "loss": 0.6955,
      "step": 8000
    },
    {
      "epoch": 0.52,
      "learning_rate": 1.9742218311995633e-05,
      "loss": 0.6626,
      "step": 8500
    },
    {
      "epoch": 0.55,
      "learning_rate": 1.9727049329530975e-05,
      "loss": 0.6589,
      "step": 9000
    },
    {
      "epoch": 0.58,
      "learning_rate": 1.971188034706632e-05,
      "loss": 0.6474,
      "step": 9500
    },
    {
      "epoch": 0.61,
      "learning_rate": 1.9696711364601664e-05,
      "loss": 0.6252,
      "step": 10000
    },
    {
      "epoch": 0.64,
      "learning_rate": 1.9681572720101938e-05,
      "loss": 0.6126,
      "step": 10500
    },
    {
      "epoch": 0.67,
      "learning_rate": 1.966640373763728e-05,
      "loss": 0.6078,
      "step": 11000
    },
    {
      "epoch": 0.7,
      "learning_rate": 1.9651234755172626e-05,
      "loss": 0.5942,
      "step": 11500
    },
    {
      "epoch": 0.73,
      "learning_rate": 1.9636096110672897e-05,
      "loss": 0.5797,
      "step": 12000
    },
    {
      "epoch": 0.76,
      "learning_rate": 1.962092712820824e-05,
      "loss": 0.5718,
      "step": 12500
    },
    {
      "epoch": 0.79,
      "learning_rate": 1.9605758145743585e-05,
      "loss": 0.5652,
      "step": 13000
    },
    {
      "epoch": 0.82,
      "learning_rate": 1.9590589163278928e-05,
      "loss": 0.5503,
      "step": 13500
    },
    {
      "epoch": 0.85,
      "learning_rate": 1.9575450518779202e-05,
      "loss": 0.5468,
      "step": 14000
    },
    {
      "epoch": 0.88,
      "learning_rate": 1.9560311874279473e-05,
      "loss": 0.5312,
      "step": 14500
    },
    {
      "epoch": 0.91,
      "learning_rate": 1.954514289181482e-05,
      "loss": 0.5217,
      "step": 15000
    },
    {
      "epoch": 0.94,
      "learning_rate": 1.952997390935016e-05,
      "loss": 0.5175,
      "step": 15500
    },
    {
      "epoch": 0.97,
      "learning_rate": 1.9514804926885507e-05,
      "loss": 0.5108,
      "step": 16000
    },
    {
      "epoch": 1.0,
      "eval_bleu": 69.1957,
      "eval_gen_len": 13.9687,
      "eval_loss": 0.39875420928001404,
      "eval_runtime": 174.0832,
      "eval_samples_per_second": 92.622,
      "eval_steps_per_second": 2.895,
      "step": 16481
    },
    {
      "epoch": 1.0,
      "learning_rate": 1.949963594442085e-05,
      "loss": 0.5057,
      "step": 16500
    },
    {
      "epoch": 1.03,
      "learning_rate": 1.9484466961956195e-05,
      "loss": 0.4922,
      "step": 17000
    },
    {
      "epoch": 1.06,
      "learning_rate": 1.9469297979491538e-05,
      "loss": 0.4873,
      "step": 17500
    },
    {
      "epoch": 1.09,
      "learning_rate": 1.945412899702688e-05,
      "loss": 0.485,
      "step": 18000
    },
    {
      "epoch": 1.12,
      "learning_rate": 1.9438960014562226e-05,
      "loss": 0.4729,
      "step": 18500
    },
    {
      "epoch": 1.15,
      "learning_rate": 1.942379103209757e-05,
      "loss": 0.4682,
      "step": 19000
    },
    {
      "epoch": 1.18,
      "learning_rate": 1.940862204963291e-05,
      "loss": 0.456,
      "step": 19500
    },
    {
      "epoch": 1.21,
      "learning_rate": 1.9393453067168254e-05,
      "loss": 0.4587,
      "step": 20000
    },
    {
      "epoch": 1.24,
      "learning_rate": 1.9378314422668528e-05,
      "loss": 0.4527,
      "step": 20500
    },
    {
      "epoch": 1.27,
      "learning_rate": 1.936314544020387e-05,
      "loss": 0.4474,
      "step": 21000
    },
    {
      "epoch": 1.3,
      "learning_rate": 1.9348006795704145e-05,
      "loss": 0.4398,
      "step": 21500
    },
    {
      "epoch": 1.33,
      "learning_rate": 1.933283781323949e-05,
      "loss": 0.4378,
      "step": 22000
    },
    {
      "epoch": 1.37,
      "learning_rate": 1.9317668830774833e-05,
      "loss": 0.4355,
      "step": 22500
    },
    {
      "epoch": 1.4,
      "learning_rate": 1.9302530186275107e-05,
      "loss": 0.4331,
      "step": 23000
    },
    {
      "epoch": 1.43,
      "learning_rate": 1.928736120381045e-05,
      "loss": 0.4294,
      "step": 23500
    },
    {
      "epoch": 1.46,
      "learning_rate": 1.9272192221345792e-05,
      "loss": 0.4286,
      "step": 24000
    },
    {
      "epoch": 1.49,
      "learning_rate": 1.9257023238881138e-05,
      "loss": 0.4174,
      "step": 24500
    },
    {
      "epoch": 1.52,
      "learning_rate": 1.924185425641648e-05,
      "loss": 0.4158,
      "step": 25000
    },
    {
      "epoch": 1.55,
      "learning_rate": 1.9226685273951823e-05,
      "loss": 0.4142,
      "step": 25500
    },
    {
      "epoch": 1.58,
      "learning_rate": 1.921151629148717e-05,
      "loss": 0.4067,
      "step": 26000
    },
    {
      "epoch": 1.61,
      "learning_rate": 1.919634730902251e-05,
      "loss": 0.4071,
      "step": 26500
    },
    {
      "epoch": 1.64,
      "learning_rate": 1.9181178326557857e-05,
      "loss": 0.4024,
      "step": 27000
    },
    {
      "epoch": 1.67,
      "learning_rate": 1.91660093440932e-05,
      "loss": 0.3952,
      "step": 27500
    },
    {
      "epoch": 1.7,
      "learning_rate": 1.9150840361628546e-05,
      "loss": 0.3987,
      "step": 28000
    },
    {
      "epoch": 1.73,
      "learning_rate": 1.9135671379163888e-05,
      "loss": 0.3952,
      "step": 28500
    },
    {
      "epoch": 1.76,
      "learning_rate": 1.912056307262909e-05,
      "loss": 0.3901,
      "step": 29000
    },
    {
      "epoch": 1.79,
      "learning_rate": 1.9105394090164433e-05,
      "loss": 0.3846,
      "step": 29500
    },
    {
      "epoch": 1.82,
      "learning_rate": 1.909022510769978e-05,
      "loss": 0.384,
      "step": 30000
    },
    {
      "epoch": 1.85,
      "learning_rate": 1.907505612523512e-05,
      "loss": 0.3851,
      "step": 30500
    },
    {
      "epoch": 1.88,
      "learning_rate": 1.9059887142770464e-05,
      "loss": 0.3849,
      "step": 31000
    },
    {
      "epoch": 1.91,
      "learning_rate": 1.904471816030581e-05,
      "loss": 0.3804,
      "step": 31500
    },
    {
      "epoch": 1.94,
      "learning_rate": 1.9029549177841152e-05,
      "loss": 0.3719,
      "step": 32000
    },
    {
      "epoch": 1.97,
      "learning_rate": 1.9014380195376495e-05,
      "loss": 0.3739,
      "step": 32500
    },
    {
      "epoch": 2.0,
      "eval_bleu": 74.3843,
      "eval_gen_len": 13.9751,
      "eval_loss": 0.3009156882762909,
      "eval_runtime": 172.1504,
      "eval_samples_per_second": 93.662,
      "eval_steps_per_second": 2.928,
      "step": 32962
    },
    {
      "epoch": 2.0,
      "learning_rate": 1.8999211212911837e-05,
      "loss": 0.3771,
      "step": 33000
    },
    {
      "epoch": 2.03,
      "learning_rate": 1.8984042230447183e-05,
      "loss": 0.3596,
      "step": 33500
    },
    {
      "epoch": 2.06,
      "learning_rate": 1.8968873247982526e-05,
      "loss": 0.3572,
      "step": 34000
    },
    {
      "epoch": 2.09,
      "learning_rate": 1.8953704265517872e-05,
      "loss": 0.357,
      "step": 34500
    },
    {
      "epoch": 2.12,
      "learning_rate": 1.8938595958983074e-05,
      "loss": 0.3532,
      "step": 35000
    },
    {
      "epoch": 2.15,
      "learning_rate": 1.8923426976518417e-05,
      "loss": 0.3548,
      "step": 35500
    },
    {
      "epoch": 2.18,
      "learning_rate": 1.890825799405376e-05,
      "loss": 0.3508,
      "step": 36000
    },
    {
      "epoch": 2.21,
      "learning_rate": 1.8893119349554033e-05,
      "loss": 0.3457,
      "step": 36500
    },
    {
      "epoch": 2.25,
      "learning_rate": 1.8877950367089376e-05,
      "loss": 0.3467,
      "step": 37000
    },
    {
      "epoch": 2.28,
      "learning_rate": 1.886278138462472e-05,
      "loss": 0.3457,
      "step": 37500
    },
    {
      "epoch": 2.31,
      "learning_rate": 1.8847612402160064e-05,
      "loss": 0.3488,
      "step": 38000
    },
    {
      "epoch": 2.34,
      "learning_rate": 1.8832443419695407e-05,
      "loss": 0.3419,
      "step": 38500
    },
    {
      "epoch": 2.37,
      "learning_rate": 1.8817274437230753e-05,
      "loss": 0.344,
      "step": 39000
    },
    {
      "epoch": 2.4,
      "learning_rate": 1.8802135792731023e-05,
      "loss": 0.3382,
      "step": 39500
    },
    {
      "epoch": 2.43,
      "learning_rate": 1.878696681026637e-05,
      "loss": 0.3381,
      "step": 40000
    },
    {
      "epoch": 2.46,
      "learning_rate": 1.8771797827801712e-05,
      "loss": 0.3378,
      "step": 40500
    },
    {
      "epoch": 2.49,
      "learning_rate": 1.8756628845337058e-05,
      "loss": 0.337,
      "step": 41000
    },
    {
      "epoch": 2.52,
      "learning_rate": 1.8741520538802257e-05,
      "loss": 0.3354,
      "step": 41500
    },
    {
      "epoch": 2.55,
      "learning_rate": 1.8726351556337603e-05,
      "loss": 0.3339,
      "step": 42000
    },
    {
      "epoch": 2.58,
      "learning_rate": 1.8711212911837874e-05,
      "loss": 0.3324,
      "step": 42500
    },
    {
      "epoch": 2.61,
      "learning_rate": 1.869604392937322e-05,
      "loss": 0.3233,
      "step": 43000
    },
    {
      "epoch": 2.64,
      "learning_rate": 1.8680874946908562e-05,
      "loss": 0.3307,
      "step": 43500
    },
    {
      "epoch": 2.67,
      "learning_rate": 1.8665736302408836e-05,
      "loss": 0.3245,
      "step": 44000
    },
    {
      "epoch": 2.7,
      "learning_rate": 1.865056731994418e-05,
      "loss": 0.3249,
      "step": 44500
    },
    {
      "epoch": 2.73,
      "learning_rate": 1.8635398337479525e-05,
      "loss": 0.3181,
      "step": 45000
    },
    {
      "epoch": 2.76,
      "learning_rate": 1.8620229355014867e-05,
      "loss": 0.3238,
      "step": 45500
    },
    {
      "epoch": 2.79,
      "learning_rate": 1.860506037255021e-05,
      "loss": 0.3256,
      "step": 46000
    },
    {
      "epoch": 2.82,
      "learning_rate": 1.8589891390085555e-05,
      "loss": 0.3203,
      "step": 46500
    },
    {
      "epoch": 2.85,
      "learning_rate": 1.8574722407620898e-05,
      "loss": 0.3174,
      "step": 47000
    },
    {
      "epoch": 2.88,
      "learning_rate": 1.8559553425156244e-05,
      "loss": 0.3185,
      "step": 47500
    },
    {
      "epoch": 2.91,
      "learning_rate": 1.8544384442691586e-05,
      "loss": 0.3181,
      "step": 48000
    },
    {
      "epoch": 2.94,
      "learning_rate": 1.852921546022693e-05,
      "loss": 0.3172,
      "step": 48500
    },
    {
      "epoch": 2.97,
      "learning_rate": 1.8514046477762275e-05,
      "loss": 0.3179,
      "step": 49000
    },
    {
      "epoch": 3.0,
      "eval_bleu": 76.4066,
      "eval_gen_len": 13.9632,
      "eval_loss": 0.26052698493003845,
      "eval_runtime": 171.9366,
      "eval_samples_per_second": 93.779,
      "eval_steps_per_second": 2.931,
      "step": 49443
    },
    {
      "epoch": 3.0,
      "learning_rate": 1.8498877495297617e-05,
      "loss": 0.3118,
      "step": 49500
    },
    {
      "epoch": 3.03,
      "learning_rate": 1.848370851283296e-05,
      "loss": 0.2996,
      "step": 50000
    },
    {
      "epoch": 3.06,
      "learning_rate": 1.8468539530368302e-05,
      "loss": 0.3008,
      "step": 50500
    },
    {
      "epoch": 3.09,
      "learning_rate": 1.8453370547903648e-05,
      "loss": 0.3075,
      "step": 51000
    },
    {
      "epoch": 3.12,
      "learning_rate": 1.843820156543899e-05,
      "loss": 0.2995,
      "step": 51500
    },
    {
      "epoch": 3.16,
      "learning_rate": 1.8423032582974336e-05,
      "loss": 0.2985,
      "step": 52000
    },
    {
      "epoch": 3.19,
      "learning_rate": 1.840786360050968e-05,
      "loss": 0.2996,
      "step": 52500
    },
    {
      "epoch": 3.22,
      "learning_rate": 1.8392694618045025e-05,
      "loss": 0.2993,
      "step": 53000
    },
    {
      "epoch": 3.25,
      "learning_rate": 1.8377525635580367e-05,
      "loss": 0.3027,
      "step": 53500
    },
    {
      "epoch": 3.28,
      "learning_rate": 1.8362356653115713e-05,
      "loss": 0.2922,
      "step": 54000
    },
    {
      "epoch": 3.31,
      "learning_rate": 1.8347187670651056e-05,
      "loss": 0.2934,
      "step": 54500
    },
    {
      "epoch": 3.34,
      "learning_rate": 1.8332018688186398e-05,
      "loss": 0.297,
      "step": 55000
    },
    {
      "epoch": 3.37,
      "learning_rate": 1.8316880043686672e-05,
      "loss": 0.2923,
      "step": 55500
    },
    {
      "epoch": 3.4,
      "learning_rate": 1.8301741399186943e-05,
      "loss": 0.2942,
      "step": 56000
    },
    {
      "epoch": 3.43,
      "learning_rate": 1.828657241672229e-05,
      "loss": 0.2946,
      "step": 56500
    },
    {
      "epoch": 3.46,
      "learning_rate": 1.827140343425763e-05,
      "loss": 0.2859,
      "step": 57000
    },
    {
      "epoch": 3.49,
      "learning_rate": 1.8256234451792977e-05,
      "loss": 0.2873,
      "step": 57500
    },
    {
      "epoch": 3.52,
      "learning_rate": 1.824106546932832e-05,
      "loss": 0.2934,
      "step": 58000
    },
    {
      "epoch": 3.55,
      "learning_rate": 1.8225896486863662e-05,
      "loss": 0.2912,
      "step": 58500
    },
    {
      "epoch": 3.58,
      "learning_rate": 1.8210727504399005e-05,
      "loss": 0.2886,
      "step": 59000
    },
    {
      "epoch": 3.61,
      "learning_rate": 1.819555852193435e-05,
      "loss": 0.2859,
      "step": 59500
    },
    {
      "epoch": 3.64,
      "learning_rate": 1.8180389539469693e-05,
      "loss": 0.2891,
      "step": 60000
    },
    {
      "epoch": 3.67,
      "learning_rate": 1.8165220557005036e-05,
      "loss": 0.2834,
      "step": 60500
    },
    {
      "epoch": 3.7,
      "learning_rate": 1.815005157454038e-05,
      "loss": 0.2842,
      "step": 61000
    },
    {
      "epoch": 3.73,
      "learning_rate": 1.8134882592075724e-05,
      "loss": 0.2812,
      "step": 61500
    },
    {
      "epoch": 3.76,
      "learning_rate": 1.8119743947575998e-05,
      "loss": 0.2834,
      "step": 62000
    },
    {
      "epoch": 3.79,
      "learning_rate": 1.810457496511134e-05,
      "loss": 0.286,
      "step": 62500
    },
    {
      "epoch": 3.82,
      "learning_rate": 1.8089405982646687e-05,
      "loss": 0.2779,
      "step": 63000
    },
    {
      "epoch": 3.85,
      "learning_rate": 1.807423700018203e-05,
      "loss": 0.2847,
      "step": 63500
    },
    {
      "epoch": 3.88,
      "learning_rate": 1.8059068017717375e-05,
      "loss": 0.2834,
      "step": 64000
    },
    {
      "epoch": 3.91,
      "learning_rate": 1.8043929373217646e-05,
      "loss": 0.2792,
      "step": 64500
    },
    {
      "epoch": 3.94,
      "learning_rate": 1.802879072871792e-05,
      "loss": 0.2834,
      "step": 65000
    },
    {
      "epoch": 3.97,
      "learning_rate": 1.8013621746253263e-05,
      "loss": 0.2795,
      "step": 65500
    },
    {
      "epoch": 4.0,
      "eval_bleu": 77.5034,
      "eval_gen_len": 14.0025,
      "eval_loss": 0.23620256781578064,
      "eval_runtime": 168.2,
      "eval_samples_per_second": 95.862,
      "eval_steps_per_second": 2.996,
      "step": 65924
    },
    {
      "epoch": 4.0,
      "learning_rate": 1.799845276378861e-05,
      "loss": 0.2778,
      "step": 66000
    },
    {
      "epoch": 4.03,
      "learning_rate": 1.798328378132395e-05,
      "loss": 0.2714,
      "step": 66500
    },
    {
      "epoch": 4.07,
      "learning_rate": 1.7968145136824225e-05,
      "loss": 0.2727,
      "step": 67000
    },
    {
      "epoch": 4.1,
      "learning_rate": 1.7952976154359568e-05,
      "loss": 0.2677,
      "step": 67500
    },
    {
      "epoch": 4.13,
      "learning_rate": 1.793780717189491e-05,
      "loss": 0.2651,
      "step": 68000
    },
    {
      "epoch": 4.16,
      "learning_rate": 1.7922638189430256e-05,
      "loss": 0.2666,
      "step": 68500
    },
    {
      "epoch": 4.19,
      "learning_rate": 1.79074692069656e-05,
      "loss": 0.2655,
      "step": 69000
    },
    {
      "epoch": 4.22,
      "learning_rate": 1.789230022450094e-05,
      "loss": 0.2649,
      "step": 69500
    },
    {
      "epoch": 4.25,
      "learning_rate": 1.7877131242036287e-05,
      "loss": 0.2613,
      "step": 70000
    },
    {
      "epoch": 4.28,
      "learning_rate": 1.786196225957163e-05,
      "loss": 0.2708,
      "step": 70500
    },
    {
      "epoch": 4.31,
      "learning_rate": 1.7846823615071904e-05,
      "loss": 0.266,
      "step": 71000
    },
    {
      "epoch": 4.34,
      "learning_rate": 1.7831654632607246e-05,
      "loss": 0.2631,
      "step": 71500
    },
    {
      "epoch": 4.37,
      "learning_rate": 1.781648565014259e-05,
      "loss": 0.262,
      "step": 72000
    },
    {
      "epoch": 4.4,
      "learning_rate": 1.780131666767793e-05,
      "loss": 0.2614,
      "step": 72500
    },
    {
      "epoch": 4.43,
      "learning_rate": 1.7786147685213277e-05,
      "loss": 0.2607,
      "step": 73000
    },
    {
      "epoch": 4.46,
      "learning_rate": 1.7771009040713548e-05,
      "loss": 0.2646,
      "step": 73500
    },
    {
      "epoch": 4.49,
      "learning_rate": 1.7755840058248894e-05,
      "loss": 0.2619,
      "step": 74000
    },
    {
      "epoch": 4.52,
      "learning_rate": 1.7740731751714096e-05,
      "loss": 0.2572,
      "step": 74500
    },
    {
      "epoch": 4.55,
      "learning_rate": 1.772559310721437e-05,
      "loss": 0.2618,
      "step": 75000
    },
    {
      "epoch": 4.58,
      "learning_rate": 1.7710424124749713e-05,
      "loss": 0.2596,
      "step": 75500
    },
    {
      "epoch": 4.61,
      "learning_rate": 1.769525514228506e-05,
      "loss": 0.2612,
      "step": 76000
    },
    {
      "epoch": 4.64,
      "learning_rate": 1.76800861598204e-05,
      "loss": 0.2555,
      "step": 76500
    },
    {
      "epoch": 4.67,
      "learning_rate": 1.7664917177355744e-05,
      "loss": 0.2597,
      "step": 77000
    },
    {
      "epoch": 4.7,
      "learning_rate": 1.7649748194891086e-05,
      "loss": 0.2563,
      "step": 77500
    },
    {
      "epoch": 4.73,
      "learning_rate": 1.7634579212426432e-05,
      "loss": 0.2587,
      "step": 78000
    },
    {
      "epoch": 4.76,
      "learning_rate": 1.7619440567926703e-05,
      "loss": 0.2564,
      "step": 78500
    },
    {
      "epoch": 4.79,
      "learning_rate": 1.760427158546205e-05,
      "loss": 0.2589,
      "step": 79000
    },
    {
      "epoch": 4.82,
      "learning_rate": 1.758910260299739e-05,
      "loss": 0.2564,
      "step": 79500
    },
    {
      "epoch": 4.85,
      "learning_rate": 1.7573933620532737e-05,
      "loss": 0.2586,
      "step": 80000
    },
    {
      "epoch": 4.88,
      "learning_rate": 1.755876463806808e-05,
      "loss": 0.2519,
      "step": 80500
    },
    {
      "epoch": 4.91,
      "learning_rate": 1.7543595655603422e-05,
      "loss": 0.2539,
      "step": 81000
    },
    {
      "epoch": 4.95,
      "learning_rate": 1.7528426673138768e-05,
      "loss": 0.2547,
      "step": 81500
    },
    {
      "epoch": 4.98,
      "learning_rate": 1.751325769067411e-05,
      "loss": 0.2543,
      "step": 82000
    },
    {
      "epoch": 5.0,
      "eval_bleu": 78.2577,
      "eval_gen_len": 14.0135,
      "eval_loss": 0.21999071538448334,
      "eval_runtime": 172.5496,
      "eval_samples_per_second": 93.446,
      "eval_steps_per_second": 2.921,
      "step": 82405
    },
    {
      "epoch": 5.01,
      "learning_rate": 1.7498088708209456e-05,
      "loss": 0.2506,
      "step": 82500
    },
    {
      "epoch": 5.04,
      "learning_rate": 1.74829197257448e-05,
      "loss": 0.2437,
      "step": 83000
    },
    {
      "epoch": 5.07,
      "learning_rate": 1.746775074328014e-05,
      "loss": 0.2438,
      "step": 83500
    },
    {
      "epoch": 5.1,
      "learning_rate": 1.7452581760815487e-05,
      "loss": 0.2487,
      "step": 84000
    },
    {
      "epoch": 5.13,
      "learning_rate": 1.743741277835083e-05,
      "loss": 0.2456,
      "step": 84500
    },
    {
      "epoch": 5.16,
      "learning_rate": 1.7422274133851104e-05,
      "loss": 0.2423,
      "step": 85000
    },
    {
      "epoch": 5.19,
      "learning_rate": 1.7407105151386446e-05,
      "loss": 0.2457,
      "step": 85500
    },
    {
      "epoch": 5.22,
      "learning_rate": 1.739193616892179e-05,
      "loss": 0.2449,
      "step": 86000
    },
    {
      "epoch": 5.25,
      "learning_rate": 1.737676718645713e-05,
      "loss": 0.2429,
      "step": 86500
    },
    {
      "epoch": 5.28,
      "learning_rate": 1.7361598203992477e-05,
      "loss": 0.2453,
      "step": 87000
    },
    {
      "epoch": 5.31,
      "learning_rate": 1.734642922152782e-05,
      "loss": 0.2453,
      "step": 87500
    },
    {
      "epoch": 5.34,
      "learning_rate": 1.7331290577028094e-05,
      "loss": 0.247,
      "step": 88000
    },
    {
      "epoch": 5.37,
      "learning_rate": 1.7316121594563436e-05,
      "loss": 0.2429,
      "step": 88500
    },
    {
      "epoch": 5.4,
      "learning_rate": 1.7300952612098782e-05,
      "loss": 0.2361,
      "step": 89000
    },
    {
      "epoch": 5.43,
      "learning_rate": 1.7285783629634125e-05,
      "loss": 0.2405,
      "step": 89500
    },
    {
      "epoch": 5.46,
      "learning_rate": 1.727061464716947e-05,
      "loss": 0.2454,
      "step": 90000
    },
    {
      "epoch": 5.49,
      "learning_rate": 1.7255445664704813e-05,
      "loss": 0.2409,
      "step": 90500
    },
    {
      "epoch": 5.52,
      "learning_rate": 1.7240276682240156e-05,
      "loss": 0.2417,
      "step": 91000
    },
    {
      "epoch": 5.55,
      "learning_rate": 1.72251076997755e-05,
      "loss": 0.24,
      "step": 91500
    },
    {
      "epoch": 5.58,
      "learning_rate": 1.7209969055275772e-05,
      "loss": 0.2356,
      "step": 92000
    },
    {
      "epoch": 5.61,
      "learning_rate": 1.7194800072811118e-05,
      "loss": 0.2387,
      "step": 92500
    },
    {
      "epoch": 5.64,
      "learning_rate": 1.717963109034646e-05,
      "loss": 0.2354,
      "step": 93000
    },
    {
      "epoch": 5.67,
      "learning_rate": 1.7164462107881807e-05,
      "loss": 0.2392,
      "step": 93500
    },
    {
      "epoch": 5.7,
      "learning_rate": 1.714929312541715e-05,
      "loss": 0.2404,
      "step": 94000
    },
    {
      "epoch": 5.73,
      "learning_rate": 1.7134154480917423e-05,
      "loss": 0.2354,
      "step": 94500
    },
    {
      "epoch": 5.76,
      "learning_rate": 1.7118985498452766e-05,
      "loss": 0.2372,
      "step": 95000
    },
    {
      "epoch": 5.79,
      "learning_rate": 1.710381651598811e-05,
      "loss": 0.2343,
      "step": 95500
    },
    {
      "epoch": 5.82,
      "learning_rate": 1.7088647533523454e-05,
      "loss": 0.2383,
      "step": 96000
    },
    {
      "epoch": 5.86,
      "learning_rate": 1.7073508889023725e-05,
      "loss": 0.2363,
      "step": 96500
    },
    {
      "epoch": 5.89,
      "learning_rate": 1.7058370244524e-05,
      "loss": 0.2352,
      "step": 97000
    },
    {
      "epoch": 5.92,
      "learning_rate": 1.7043201262059345e-05,
      "loss": 0.2367,
      "step": 97500
    },
    {
      "epoch": 5.95,
      "learning_rate": 1.7028032279594688e-05,
      "loss": 0.2327,
      "step": 98000
    },
    {
      "epoch": 5.98,
      "learning_rate": 1.7012893635094962e-05,
      "loss": 0.2341,
      "step": 98500
    },
    {
      "epoch": 6.0,
      "eval_bleu": 78.7501,
      "eval_gen_len": 14.013,
      "eval_loss": 0.2089208960533142,
      "eval_runtime": 172.3801,
      "eval_samples_per_second": 93.537,
      "eval_steps_per_second": 2.924,
      "step": 98886
    },
    {
      "epoch": 6.01,
      "learning_rate": 1.6997724652630304e-05,
      "loss": 0.2272,
      "step": 99000
    },
    {
      "epoch": 6.04,
      "learning_rate": 1.6982555670165647e-05,
      "loss": 0.2315,
      "step": 99500
    },
    {
      "epoch": 6.07,
      "learning_rate": 1.696738668770099e-05,
      "loss": 0.2238,
      "step": 100000
    },
    {
      "epoch": 6.1,
      "learning_rate": 1.6952217705236335e-05,
      "loss": 0.2268,
      "step": 100500
    },
    {
      "epoch": 6.13,
      "learning_rate": 1.6937048722771678e-05,
      "loss": 0.2264,
      "step": 101000
    },
    {
      "epoch": 6.16,
      "learning_rate": 1.692187974030702e-05,
      "loss": 0.2255,
      "step": 101500
    },
    {
      "epoch": 6.19,
      "learning_rate": 1.6906710757842366e-05,
      "loss": 0.2262,
      "step": 102000
    },
    {
      "epoch": 6.22,
      "learning_rate": 1.689154177537771e-05,
      "loss": 0.2279,
      "step": 102500
    },
    {
      "epoch": 6.25,
      "learning_rate": 1.6876372792913054e-05,
      "loss": 0.2279,
      "step": 103000
    },
    {
      "epoch": 6.28,
      "learning_rate": 1.6861203810448397e-05,
      "loss": 0.2272,
      "step": 103500
    },
    {
      "epoch": 6.31,
      "learning_rate": 1.684603482798374e-05,
      "loss": 0.2235,
      "step": 104000
    },
    {
      "epoch": 6.34,
      "learning_rate": 1.6830896183484014e-05,
      "loss": 0.227,
      "step": 104500
    },
    {
      "epoch": 6.37,
      "learning_rate": 1.6815727201019356e-05,
      "loss": 0.2232,
      "step": 105000
    },
    {
      "epoch": 6.4,
      "learning_rate": 1.6800558218554702e-05,
      "loss": 0.2255,
      "step": 105500
    },
    {
      "epoch": 6.43,
      "learning_rate": 1.6785389236090044e-05,
      "loss": 0.2255,
      "step": 106000
    },
    {
      "epoch": 6.46,
      "learning_rate": 1.6770280929555247e-05,
      "loss": 0.2282,
      "step": 106500
    },
    {
      "epoch": 6.49,
      "learning_rate": 1.675511194709059e-05,
      "loss": 0.2219,
      "step": 107000
    },
    {
      "epoch": 6.52,
      "learning_rate": 1.6739942964625935e-05,
      "loss": 0.2246,
      "step": 107500
    },
    {
      "epoch": 6.55,
      "learning_rate": 1.6724773982161278e-05,
      "loss": 0.2238,
      "step": 108000
    },
    {
      "epoch": 6.58,
      "learning_rate": 1.6709604999696624e-05,
      "loss": 0.2246,
      "step": 108500
    },
    {
      "epoch": 6.61,
      "learning_rate": 1.6694466355196895e-05,
      "loss": 0.2237,
      "step": 109000
    },
    {
      "epoch": 6.64,
      "learning_rate": 1.667929737273224e-05,
      "loss": 0.2241,
      "step": 109500
    },
    {
      "epoch": 6.67,
      "learning_rate": 1.666415872823251e-05,
      "loss": 0.2259,
      "step": 110000
    },
    {
      "epoch": 6.7,
      "learning_rate": 1.6648989745767857e-05,
      "loss": 0.2225,
      "step": 110500
    },
    {
      "epoch": 6.74,
      "learning_rate": 1.66338207633032e-05,
      "loss": 0.2229,
      "step": 111000
    },
    {
      "epoch": 6.77,
      "learning_rate": 1.6618651780838542e-05,
      "loss": 0.2234,
      "step": 111500
    },
    {
      "epoch": 6.8,
      "learning_rate": 1.6603482798373888e-05,
      "loss": 0.2211,
      "step": 112000
    },
    {
      "epoch": 6.83,
      "learning_rate": 1.658831381590923e-05,
      "loss": 0.2203,
      "step": 112500
    },
    {
      "epoch": 6.86,
      "learning_rate": 1.6573144833444573e-05,
      "loss": 0.2195,
      "step": 113000
    },
    {
      "epoch": 6.89,
      "learning_rate": 1.6557975850979915e-05,
      "loss": 0.2219,
      "step": 113500
    },
    {
      "epoch": 6.92,
      "learning_rate": 1.654280686851526e-05,
      "loss": 0.22,
      "step": 114000
    },
    {
      "epoch": 6.95,
      "learning_rate": 1.6527668224015536e-05,
      "loss": 0.2217,
      "step": 114500
    },
    {
      "epoch": 6.98,
      "learning_rate": 1.6512499241550878e-05,
      "loss": 0.2182,
      "step": 115000
    },
    {
      "epoch": 7.0,
      "eval_bleu": 79.0915,
      "eval_gen_len": 14.0505,
      "eval_loss": 0.1989297866821289,
      "eval_runtime": 170.8481,
      "eval_samples_per_second": 94.376,
      "eval_steps_per_second": 2.95,
      "step": 115367
    },
    {
      "epoch": 7.01,
      "learning_rate": 1.649733025908622e-05,
      "loss": 0.2219,
      "step": 115500
    },
    {
      "epoch": 7.04,
      "learning_rate": 1.6482161276621566e-05,
      "loss": 0.2165,
      "step": 116000
    },
    {
      "epoch": 7.07,
      "learning_rate": 1.6467022632121837e-05,
      "loss": 0.214,
      "step": 116500
    },
    {
      "epoch": 7.1,
      "learning_rate": 1.645185364965718e-05,
      "loss": 0.2143,
      "step": 117000
    },
    {
      "epoch": 7.13,
      "learning_rate": 1.6436684667192526e-05,
      "loss": 0.2193,
      "step": 117500
    },
    {
      "epoch": 7.16,
      "learning_rate": 1.6421515684727868e-05,
      "loss": 0.2139,
      "step": 118000
    },
    {
      "epoch": 7.19,
      "learning_rate": 1.6406346702263214e-05,
      "loss": 0.2176,
      "step": 118500
    },
    {
      "epoch": 7.22,
      "learning_rate": 1.6391177719798556e-05,
      "loss": 0.2162,
      "step": 119000
    },
    {
      "epoch": 7.25,
      "learning_rate": 1.6376008737333902e-05,
      "loss": 0.2114,
      "step": 119500
    },
    {
      "epoch": 7.28,
      "learning_rate": 1.6360839754869245e-05,
      "loss": 0.2172,
      "step": 120000
    },
    {
      "epoch": 7.31,
      "learning_rate": 1.634567077240459e-05,
      "loss": 0.2127,
      "step": 120500
    },
    {
      "epoch": 7.34,
      "learning_rate": 1.6330501789939933e-05,
      "loss": 0.2134,
      "step": 121000
    },
    {
      "epoch": 7.37,
      "learning_rate": 1.6315332807475276e-05,
      "loss": 0.2131,
      "step": 121500
    },
    {
      "epoch": 7.4,
      "learning_rate": 1.6300163825010618e-05,
      "loss": 0.2072,
      "step": 122000
    },
    {
      "epoch": 7.43,
      "learning_rate": 1.6284994842545964e-05,
      "loss": 0.2125,
      "step": 122500
    },
    {
      "epoch": 7.46,
      "learning_rate": 1.6269856198046238e-05,
      "loss": 0.2117,
      "step": 123000
    },
    {
      "epoch": 7.49,
      "learning_rate": 1.625468721558158e-05,
      "loss": 0.21,
      "step": 123500
    },
    {
      "epoch": 7.52,
      "learning_rate": 1.6239518233116923e-05,
      "loss": 0.2144,
      "step": 124000
    },
    {
      "epoch": 7.55,
      "learning_rate": 1.6224379588617197e-05,
      "loss": 0.2103,
      "step": 124500
    },
    {
      "epoch": 7.58,
      "learning_rate": 1.620921060615254e-05,
      "loss": 0.2081,
      "step": 125000
    },
    {
      "epoch": 7.61,
      "learning_rate": 1.6194071961652814e-05,
      "loss": 0.2102,
      "step": 125500
    },
    {
      "epoch": 7.65,
      "learning_rate": 1.6178902979188157e-05,
      "loss": 0.2059,
      "step": 126000
    },
    {
      "epoch": 7.68,
      "learning_rate": 1.616376433468843e-05,
      "loss": 0.2104,
      "step": 126500
    },
    {
      "epoch": 7.71,
      "learning_rate": 1.6148595352223773e-05,
      "loss": 0.2104,
      "step": 127000
    },
    {
      "epoch": 7.74,
      "learning_rate": 1.613342636975912e-05,
      "loss": 0.2068,
      "step": 127500
    },
    {
      "epoch": 7.77,
      "learning_rate": 1.6118257387294462e-05,
      "loss": 0.2107,
      "step": 128000
    },
    {
      "epoch": 7.8,
      "learning_rate": 1.6103088404829804e-05,
      "loss": 0.2086,
      "step": 128500
    },
    {
      "epoch": 7.83,
      "learning_rate": 1.6087919422365147e-05,
      "loss": 0.2097,
      "step": 129000
    },
    {
      "epoch": 7.86,
      "learning_rate": 1.6072811115830353e-05,
      "loss": 0.2097,
      "step": 129500
    },
    {
      "epoch": 7.89,
      "learning_rate": 1.6057642133365695e-05,
      "loss": 0.2083,
      "step": 130000
    },
    {
      "epoch": 7.92,
      "learning_rate": 1.6042473150901038e-05,
      "loss": 0.2117,
      "step": 130500
    },
    {
      "epoch": 7.95,
      "learning_rate": 1.602730416843638e-05,
      "loss": 0.2084,
      "step": 131000
    },
    {
      "epoch": 7.98,
      "learning_rate": 1.6012135185971726e-05,
      "loss": 0.2083,
      "step": 131500
    },
    {
      "epoch": 8.0,
      "eval_bleu": 79.6569,
      "eval_gen_len": 14.0215,
      "eval_loss": 0.19143153727054596,
      "eval_runtime": 170.1846,
      "eval_samples_per_second": 94.744,
      "eval_steps_per_second": 2.961,
      "step": 131848
    },
    {
      "epoch": 8.01,
      "learning_rate": 1.599696620350707e-05,
      "loss": 0.2077,
      "step": 132000
    },
    {
      "epoch": 8.04,
      "learning_rate": 1.5981797221042414e-05,
      "loss": 0.2018,
      "step": 132500
    },
    {
      "epoch": 8.07,
      "learning_rate": 1.5966628238577757e-05,
      "loss": 0.204,
      "step": 133000
    },
    {
      "epoch": 8.1,
      "learning_rate": 1.5951459256113103e-05,
      "loss": 0.2021,
      "step": 133500
    },
    {
      "epoch": 8.13,
      "learning_rate": 1.5936290273648445e-05,
      "loss": 0.2026,
      "step": 134000
    },
    {
      "epoch": 8.16,
      "learning_rate": 1.592112129118379e-05,
      "loss": 0.2012,
      "step": 134500
    },
    {
      "epoch": 8.19,
      "learning_rate": 1.5905952308719134e-05,
      "loss": 0.2002,
      "step": 135000
    },
    {
      "epoch": 8.22,
      "learning_rate": 1.5890783326254476e-05,
      "loss": 0.1998,
      "step": 135500
    },
    {
      "epoch": 8.25,
      "learning_rate": 1.5875614343789822e-05,
      "loss": 0.2048,
      "step": 136000
    },
    {
      "epoch": 8.28,
      "learning_rate": 1.5860445361325164e-05,
      "loss": 0.2008,
      "step": 136500
    },
    {
      "epoch": 8.31,
      "learning_rate": 1.5845276378860507e-05,
      "loss": 0.2055,
      "step": 137000
    },
    {
      "epoch": 8.34,
      "learning_rate": 1.583010739639585e-05,
      "loss": 0.2053,
      "step": 137500
    },
    {
      "epoch": 8.37,
      "learning_rate": 1.5814938413931195e-05,
      "loss": 0.2024,
      "step": 138000
    },
    {
      "epoch": 8.4,
      "learning_rate": 1.5799769431466538e-05,
      "loss": 0.2022,
      "step": 138500
    },
    {
      "epoch": 8.43,
      "learning_rate": 1.578460044900188e-05,
      "loss": 0.2003,
      "step": 139000
    },
    {
      "epoch": 8.46,
      "learning_rate": 1.5769431466537226e-05,
      "loss": 0.2016,
      "step": 139500
    },
    {
      "epoch": 8.49,
      "learning_rate": 1.575426248407257e-05,
      "loss": 0.2011,
      "step": 140000
    },
    {
      "epoch": 8.52,
      "learning_rate": 1.5739123839572843e-05,
      "loss": 0.2025,
      "step": 140500
    },
    {
      "epoch": 8.56,
      "learning_rate": 1.5723954857108185e-05,
      "loss": 0.1995,
      "step": 141000
    },
    {
      "epoch": 8.59,
      "learning_rate": 1.570878587464353e-05,
      "loss": 0.2035,
      "step": 141500
    },
    {
      "epoch": 8.62,
      "learning_rate": 1.5693616892178874e-05,
      "loss": 0.2002,
      "step": 142000
    },
    {
      "epoch": 8.65,
      "learning_rate": 1.5678478247679148e-05,
      "loss": 0.2016,
      "step": 142500
    },
    {
      "epoch": 8.68,
      "learning_rate": 1.566330926521449e-05,
      "loss": 0.1985,
      "step": 143000
    },
    {
      "epoch": 8.71,
      "learning_rate": 1.5648170620714765e-05,
      "loss": 0.2004,
      "step": 143500
    },
    {
      "epoch": 8.74,
      "learning_rate": 1.5633001638250107e-05,
      "loss": 0.1992,
      "step": 144000
    },
    {
      "epoch": 8.77,
      "learning_rate": 1.561786299375038e-05,
      "loss": 0.2037,
      "step": 144500
    },
    {
      "epoch": 8.8,
      "learning_rate": 1.5602694011285724e-05,
      "loss": 0.203,
      "step": 145000
    },
    {
      "epoch": 8.83,
      "learning_rate": 1.558752502882107e-05,
      "loss": 0.202,
      "step": 145500
    },
    {
      "epoch": 8.86,
      "learning_rate": 1.5572356046356412e-05,
      "loss": 0.198,
      "step": 146000
    },
    {
      "epoch": 8.89,
      "learning_rate": 1.5557187063891755e-05,
      "loss": 0.1992,
      "step": 146500
    },
    {
      "epoch": 8.92,
      "learning_rate": 1.55420180814271e-05,
      "loss": 0.1988,
      "step": 147000
    },
    {
      "epoch": 8.95,
      "learning_rate": 1.5526849098962443e-05,
      "loss": 0.1992,
      "step": 147500
    },
    {
      "epoch": 8.98,
      "learning_rate": 1.5511680116497786e-05,
      "loss": 0.1986,
      "step": 148000
    },
    {
      "epoch": 9.0,
      "eval_bleu": 79.9315,
      "eval_gen_len": 14.0219,
      "eval_loss": 0.18681135773658752,
      "eval_runtime": 171.5642,
      "eval_samples_per_second": 93.982,
      "eval_steps_per_second": 2.938,
      "step": 148329
    },
    {
      "epoch": 9.01,
      "learning_rate": 1.549651113403313e-05,
      "loss": 0.1942,
      "step": 148500
    },
    {
      "epoch": 9.04,
      "learning_rate": 1.5481342151568474e-05,
      "loss": 0.195,
      "step": 149000
    },
    {
      "epoch": 9.07,
      "learning_rate": 1.5466173169103816e-05,
      "loss": 0.1933,
      "step": 149500
    },
    {
      "epoch": 9.1,
      "learning_rate": 1.5451004186639162e-05,
      "loss": 0.1949,
      "step": 150000
    },
    {
      "epoch": 9.13,
      "learning_rate": 1.5435865542139433e-05,
      "loss": 0.1963,
      "step": 150500
    },
    {
      "epoch": 9.16,
      "learning_rate": 1.542069655967478e-05,
      "loss": 0.1926,
      "step": 151000
    },
    {
      "epoch": 9.19,
      "learning_rate": 1.540552757721012e-05,
      "loss": 0.1897,
      "step": 151500
    },
    {
      "epoch": 9.22,
      "learning_rate": 1.5390358594745464e-05,
      "loss": 0.1931,
      "step": 152000
    },
    {
      "epoch": 9.25,
      "learning_rate": 1.537518961228081e-05,
      "loss": 0.1907,
      "step": 152500
    },
    {
      "epoch": 9.28,
      "learning_rate": 1.5360020629816152e-05,
      "loss": 0.1919,
      "step": 153000
    },
    {
      "epoch": 9.31,
      "learning_rate": 1.5344851647351498e-05,
      "loss": 0.1925,
      "step": 153500
    },
    {
      "epoch": 9.34,
      "learning_rate": 1.532968266488684e-05,
      "loss": 0.1918,
      "step": 154000
    },
    {
      "epoch": 9.37,
      "learning_rate": 1.5314513682422187e-05,
      "loss": 0.1933,
      "step": 154500
    },
    {
      "epoch": 9.4,
      "learning_rate": 1.5299375037922457e-05,
      "loss": 0.1944,
      "step": 155000
    },
    {
      "epoch": 9.44,
      "learning_rate": 1.5284206055457803e-05,
      "loss": 0.1929,
      "step": 155500
    },
    {
      "epoch": 9.47,
      "learning_rate": 1.5269037072993146e-05,
      "loss": 0.1932,
      "step": 156000
    },
    {
      "epoch": 9.5,
      "learning_rate": 1.5253868090528488e-05,
      "loss": 0.1929,
      "step": 156500
    },
    {
      "epoch": 9.53,
      "learning_rate": 1.523872944602876e-05,
      "loss": 0.1916,
      "step": 157000
    },
    {
      "epoch": 9.56,
      "learning_rate": 1.5223560463564105e-05,
      "loss": 0.1938,
      "step": 157500
    },
    {
      "epoch": 9.59,
      "learning_rate": 1.5208391481099449e-05,
      "loss": 0.1891,
      "step": 158000
    },
    {
      "epoch": 9.62,
      "learning_rate": 1.5193222498634792e-05,
      "loss": 0.1875,
      "step": 158500
    },
    {
      "epoch": 9.65,
      "learning_rate": 1.5178083854135066e-05,
      "loss": 0.192,
      "step": 159000
    },
    {
      "epoch": 9.68,
      "learning_rate": 1.5162945209635338e-05,
      "loss": 0.1919,
      "step": 159500
    },
    {
      "epoch": 9.71,
      "learning_rate": 1.5147776227170683e-05,
      "loss": 0.1924,
      "step": 160000
    },
    {
      "epoch": 9.74,
      "learning_rate": 1.5132607244706025e-05,
      "loss": 0.1947,
      "step": 160500
    },
    {
      "epoch": 9.77,
      "learning_rate": 1.5117438262241371e-05,
      "loss": 0.1895,
      "step": 161000
    },
    {
      "epoch": 9.8,
      "learning_rate": 1.5102269279776713e-05,
      "loss": 0.1886,
      "step": 161500
    },
    {
      "epoch": 9.83,
      "learning_rate": 1.5087100297312058e-05,
      "loss": 0.1948,
      "step": 162000
    },
    {
      "epoch": 9.86,
      "learning_rate": 1.507196165281233e-05,
      "loss": 0.1947,
      "step": 162500
    },
    {
      "epoch": 9.89,
      "learning_rate": 1.5056792670347676e-05,
      "loss": 0.1904,
      "step": 163000
    },
    {
      "epoch": 9.92,
      "learning_rate": 1.5041623687883018e-05,
      "loss": 0.1895,
      "step": 163500
    },
    {
      "epoch": 9.95,
      "learning_rate": 1.5026454705418361e-05,
      "loss": 0.1907,
      "step": 164000
    },
    {
      "epoch": 9.98,
      "learning_rate": 1.5011285722953705e-05,
      "loss": 0.1956,
      "step": 164500
    },
    {
      "epoch": 10.0,
      "eval_bleu": 80.0539,
      "eval_gen_len": 14.0305,
      "eval_loss": 0.18285295367240906,
      "eval_runtime": 168.5447,
      "eval_samples_per_second": 95.666,
      "eval_steps_per_second": 2.99,
      "step": 164810
    },
    {
      "epoch": 10.01,
      "learning_rate": 1.4996116740489048e-05,
      "loss": 0.1904,
      "step": 165000
    },
    {
      "epoch": 10.04,
      "learning_rate": 1.4980947758024394e-05,
      "loss": 0.185,
      "step": 165500
    },
    {
      "epoch": 10.07,
      "learning_rate": 1.4965778775559736e-05,
      "loss": 0.1841,
      "step": 166000
    },
    {
      "epoch": 10.1,
      "learning_rate": 1.4950609793095082e-05,
      "loss": 0.1853,
      "step": 166500
    },
    {
      "epoch": 10.13,
      "learning_rate": 1.4935440810630424e-05,
      "loss": 0.1851,
      "step": 167000
    },
    {
      "epoch": 10.16,
      "learning_rate": 1.4920302166130699e-05,
      "loss": 0.1842,
      "step": 167500
    },
    {
      "epoch": 10.19,
      "learning_rate": 1.4905133183666041e-05,
      "loss": 0.1846,
      "step": 168000
    },
    {
      "epoch": 10.22,
      "learning_rate": 1.4889964201201385e-05,
      "loss": 0.1852,
      "step": 168500
    },
    {
      "epoch": 10.25,
      "learning_rate": 1.4874795218736728e-05,
      "loss": 0.1871,
      "step": 169000
    },
    {
      "epoch": 10.28,
      "learning_rate": 1.4859656574237002e-05,
      "loss": 0.1875,
      "step": 169500
    },
    {
      "epoch": 10.31,
      "learning_rate": 1.4844487591772344e-05,
      "loss": 0.1857,
      "step": 170000
    },
    {
      "epoch": 10.35,
      "learning_rate": 1.4829318609307689e-05,
      "loss": 0.1856,
      "step": 170500
    },
    {
      "epoch": 10.38,
      "learning_rate": 1.4814149626843033e-05,
      "loss": 0.1867,
      "step": 171000
    },
    {
      "epoch": 10.41,
      "learning_rate": 1.4799010982343305e-05,
      "loss": 0.1858,
      "step": 171500
    },
    {
      "epoch": 10.44,
      "learning_rate": 1.478384199987865e-05,
      "loss": 0.1872,
      "step": 172000
    },
    {
      "epoch": 10.47,
      "learning_rate": 1.4768673017413992e-05,
      "loss": 0.1825,
      "step": 172500
    },
    {
      "epoch": 10.5,
      "learning_rate": 1.4753504034949338e-05,
      "loss": 0.1839,
      "step": 173000
    },
    {
      "epoch": 10.53,
      "learning_rate": 1.473833505248468e-05,
      "loss": 0.1862,
      "step": 173500
    },
    {
      "epoch": 10.56,
      "learning_rate": 1.4723166070020025e-05,
      "loss": 0.186,
      "step": 174000
    },
    {
      "epoch": 10.59,
      "learning_rate": 1.4707997087555369e-05,
      "loss": 0.1856,
      "step": 174500
    },
    {
      "epoch": 10.62,
      "learning_rate": 1.4692828105090711e-05,
      "loss": 0.1851,
      "step": 175000
    },
    {
      "epoch": 10.65,
      "learning_rate": 1.4677659122626055e-05,
      "loss": 0.1869,
      "step": 175500
    },
    {
      "epoch": 10.68,
      "learning_rate": 1.4662520478126328e-05,
      "loss": 0.1843,
      "step": 176000
    },
    {
      "epoch": 10.71,
      "learning_rate": 1.4647351495661672e-05,
      "loss": 0.1811,
      "step": 176500
    },
    {
      "epoch": 10.74,
      "learning_rate": 1.4632182513197015e-05,
      "loss": 0.1865,
      "step": 177000
    },
    {
      "epoch": 10.77,
      "learning_rate": 1.461701353073236e-05,
      "loss": 0.1843,
      "step": 177500
    },
    {
      "epoch": 10.8,
      "learning_rate": 1.4601844548267703e-05,
      "loss": 0.1836,
      "step": 178000
    },
    {
      "epoch": 10.83,
      "learning_rate": 1.4586736241732906e-05,
      "loss": 0.1832,
      "step": 178500
    },
    {
      "epoch": 10.86,
      "learning_rate": 1.457156725926825e-05,
      "loss": 0.182,
      "step": 179000
    },
    {
      "epoch": 10.89,
      "learning_rate": 1.4556398276803594e-05,
      "loss": 0.1841,
      "step": 179500
    },
    {
      "epoch": 10.92,
      "learning_rate": 1.4541229294338936e-05,
      "loss": 0.1866,
      "step": 180000
    },
    {
      "epoch": 10.95,
      "learning_rate": 1.4526060311874282e-05,
      "loss": 0.1851,
      "step": 180500
    },
    {
      "epoch": 10.98,
      "learning_rate": 1.4510891329409625e-05,
      "loss": 0.1826,
      "step": 181000
    },
    {
      "epoch": 11.0,
      "eval_bleu": 80.3158,
      "eval_gen_len": 14.0452,
      "eval_loss": 0.17846250534057617,
      "eval_runtime": 168.9854,
      "eval_samples_per_second": 95.417,
      "eval_steps_per_second": 2.983,
      "step": 181291
    },
    {
      "epoch": 11.01,
      "learning_rate": 1.4495722346944967e-05,
      "loss": 0.1829,
      "step": 181500
    },
    {
      "epoch": 11.04,
      "learning_rate": 1.4480553364480311e-05,
      "loss": 0.1748,
      "step": 182000
    },
    {
      "epoch": 11.07,
      "learning_rate": 1.4465414719980584e-05,
      "loss": 0.1809,
      "step": 182500
    },
    {
      "epoch": 11.1,
      "learning_rate": 1.4450245737515928e-05,
      "loss": 0.1768,
      "step": 183000
    },
    {
      "epoch": 11.13,
      "learning_rate": 1.4435076755051272e-05,
      "loss": 0.1795,
      "step": 183500
    },
    {
      "epoch": 11.16,
      "learning_rate": 1.4419907772586617e-05,
      "loss": 0.1767,
      "step": 184000
    },
    {
      "epoch": 11.19,
      "learning_rate": 1.4404738790121959e-05,
      "loss": 0.1777,
      "step": 184500
    },
    {
      "epoch": 11.23,
      "learning_rate": 1.4389569807657305e-05,
      "loss": 0.1764,
      "step": 185000
    },
    {
      "epoch": 11.26,
      "learning_rate": 1.4374431163157576e-05,
      "loss": 0.1796,
      "step": 185500
    },
    {
      "epoch": 11.29,
      "learning_rate": 1.4359262180692922e-05,
      "loss": 0.1804,
      "step": 186000
    },
    {
      "epoch": 11.32,
      "learning_rate": 1.4344093198228264e-05,
      "loss": 0.1801,
      "step": 186500
    },
    {
      "epoch": 11.35,
      "learning_rate": 1.4328924215763608e-05,
      "loss": 0.1775,
      "step": 187000
    },
    {
      "epoch": 11.38,
      "learning_rate": 1.431375523329895e-05,
      "loss": 0.1775,
      "step": 187500
    },
    {
      "epoch": 11.41,
      "learning_rate": 1.4298616588799223e-05,
      "loss": 0.1789,
      "step": 188000
    },
    {
      "epoch": 11.44,
      "learning_rate": 1.4283447606334569e-05,
      "loss": 0.1802,
      "step": 188500
    },
    {
      "epoch": 11.47,
      "learning_rate": 1.4268278623869912e-05,
      "loss": 0.1791,
      "step": 189000
    },
    {
      "epoch": 11.5,
      "learning_rate": 1.4253109641405256e-05,
      "loss": 0.1786,
      "step": 189500
    },
    {
      "epoch": 11.53,
      "learning_rate": 1.4237970996905528e-05,
      "loss": 0.1833,
      "step": 190000
    },
    {
      "epoch": 11.56,
      "learning_rate": 1.4222832352405803e-05,
      "loss": 0.1777,
      "step": 190500
    },
    {
      "epoch": 11.59,
      "learning_rate": 1.4207693707906073e-05,
      "loss": 0.1786,
      "step": 191000
    },
    {
      "epoch": 11.62,
      "learning_rate": 1.419252472544142e-05,
      "loss": 0.1769,
      "step": 191500
    },
    {
      "epoch": 11.65,
      "learning_rate": 1.4177355742976762e-05,
      "loss": 0.1775,
      "step": 192000
    },
    {
      "epoch": 11.68,
      "learning_rate": 1.4162186760512106e-05,
      "loss": 0.1827,
      "step": 192500
    },
    {
      "epoch": 11.71,
      "learning_rate": 1.414701777804745e-05,
      "loss": 0.178,
      "step": 193000
    },
    {
      "epoch": 11.74,
      "learning_rate": 1.4131879133547724e-05,
      "loss": 0.1771,
      "step": 193500
    },
    {
      "epoch": 11.77,
      "learning_rate": 1.4116710151083067e-05,
      "loss": 0.1781,
      "step": 194000
    },
    {
      "epoch": 11.8,
      "learning_rate": 1.4101541168618411e-05,
      "loss": 0.1774,
      "step": 194500
    },
    {
      "epoch": 11.83,
      "learning_rate": 1.4086372186153753e-05,
      "loss": 0.1763,
      "step": 195000
    },
    {
      "epoch": 11.86,
      "learning_rate": 1.4071203203689096e-05,
      "loss": 0.1768,
      "step": 195500
    },
    {
      "epoch": 11.89,
      "learning_rate": 1.4056034221224442e-05,
      "loss": 0.1793,
      "step": 196000
    },
    {
      "epoch": 11.92,
      "learning_rate": 1.4040865238759784e-05,
      "loss": 0.1809,
      "step": 196500
    },
    {
      "epoch": 11.95,
      "learning_rate": 1.4025696256295129e-05,
      "loss": 0.1797,
      "step": 197000
    },
    {
      "epoch": 11.98,
      "learning_rate": 1.4010527273830473e-05,
      "loss": 0.1787,
      "step": 197500
    },
    {
      "epoch": 12.0,
      "eval_bleu": 80.3265,
      "eval_gen_len": 14.0303,
      "eval_loss": 0.17605634033679962,
      "eval_runtime": 172.6821,
      "eval_samples_per_second": 93.374,
      "eval_steps_per_second": 2.919,
      "step": 197772
    },
    {
      "epoch": 12.01,
      "learning_rate": 1.3995358291365817e-05,
      "loss": 0.1764,
      "step": 198000
    },
    {
      "epoch": 12.04,
      "learning_rate": 1.398018930890116e-05,
      "loss": 0.1735,
      "step": 198500
    },
    {
      "epoch": 12.07,
      "learning_rate": 1.3965020326436505e-05,
      "loss": 0.1738,
      "step": 199000
    },
    {
      "epoch": 12.1,
      "learning_rate": 1.3949881681936776e-05,
      "loss": 0.1731,
      "step": 199500
    },
    {
      "epoch": 12.14,
      "learning_rate": 1.3934712699472122e-05,
      "loss": 0.1759,
      "step": 200000
    },
    {
      "epoch": 12.17,
      "learning_rate": 1.3919543717007464e-05,
      "loss": 0.1726,
      "step": 200500
    },
    {
      "epoch": 12.2,
      "learning_rate": 1.3904374734542807e-05,
      "loss": 0.1771,
      "step": 201000
    },
    {
      "epoch": 12.23,
      "learning_rate": 1.3889205752078153e-05,
      "loss": 0.1766,
      "step": 201500
    },
    {
      "epoch": 12.26,
      "learning_rate": 1.3874067107578424e-05,
      "loss": 0.1695,
      "step": 202000
    },
    {
      "epoch": 12.29,
      "learning_rate": 1.385889812511377e-05,
      "loss": 0.1714,
      "step": 202500
    },
    {
      "epoch": 12.32,
      "learning_rate": 1.384378981857897e-05,
      "loss": 0.1727,
      "step": 203000
    },
    {
      "epoch": 12.35,
      "learning_rate": 1.3828620836114315e-05,
      "loss": 0.1725,
      "step": 203500
    },
    {
      "epoch": 12.38,
      "learning_rate": 1.3813451853649657e-05,
      "loss": 0.1722,
      "step": 204000
    },
    {
      "epoch": 12.41,
      "learning_rate": 1.3798282871185003e-05,
      "loss": 0.179,
      "step": 204500
    },
    {
      "epoch": 12.44,
      "learning_rate": 1.3783113888720345e-05,
      "loss": 0.1732,
      "step": 205000
    },
    {
      "epoch": 12.47,
      "learning_rate": 1.376794490625569e-05,
      "loss": 0.1722,
      "step": 205500
    },
    {
      "epoch": 12.5,
      "learning_rate": 1.3752775923791034e-05,
      "loss": 0.1723,
      "step": 206000
    },
    {
      "epoch": 12.53,
      "learning_rate": 1.3737606941326378e-05,
      "loss": 0.1716,
      "step": 206500
    },
    {
      "epoch": 12.56,
      "learning_rate": 1.372243795886172e-05,
      "loss": 0.1738,
      "step": 207000
    },
    {
      "epoch": 12.59,
      "learning_rate": 1.3707299314361995e-05,
      "loss": 0.1732,
      "step": 207500
    },
    {
      "epoch": 12.62,
      "learning_rate": 1.3692130331897337e-05,
      "loss": 0.1736,
      "step": 208000
    },
    {
      "epoch": 12.65,
      "learning_rate": 1.367699168739761e-05,
      "loss": 0.1719,
      "step": 208500
    },
    {
      "epoch": 12.68,
      "learning_rate": 1.3661822704932954e-05,
      "loss": 0.1717,
      "step": 209000
    },
    {
      "epoch": 12.71,
      "learning_rate": 1.3646653722468296e-05,
      "loss": 0.1704,
      "step": 209500
    },
    {
      "epoch": 12.74,
      "learning_rate": 1.3631484740003642e-05,
      "loss": 0.174,
      "step": 210000
    },
    {
      "epoch": 12.77,
      "learning_rate": 1.3616315757538985e-05,
      "loss": 0.1718,
      "step": 210500
    },
    {
      "epoch": 12.8,
      "learning_rate": 1.360114677507433e-05,
      "loss": 0.1726,
      "step": 211000
    },
    {
      "epoch": 12.83,
      "learning_rate": 1.3585977792609673e-05,
      "loss": 0.1691,
      "step": 211500
    },
    {
      "epoch": 12.86,
      "learning_rate": 1.3570808810145017e-05,
      "loss": 0.1705,
      "step": 212000
    },
    {
      "epoch": 12.89,
      "learning_rate": 1.355563982768036e-05,
      "loss": 0.1715,
      "step": 212500
    },
    {
      "epoch": 12.92,
      "learning_rate": 1.3540470845215702e-05,
      "loss": 0.1712,
      "step": 213000
    },
    {
      "epoch": 12.95,
      "learning_rate": 1.3525301862751048e-05,
      "loss": 0.1731,
      "step": 213500
    },
    {
      "epoch": 12.98,
      "learning_rate": 1.351013288028639e-05,
      "loss": 0.1725,
      "step": 214000
    },
    {
      "epoch": 13.0,
      "eval_bleu": 80.3976,
      "eval_gen_len": 14.0256,
      "eval_loss": 0.1731211394071579,
      "eval_runtime": 168.6298,
      "eval_samples_per_second": 95.618,
      "eval_steps_per_second": 2.989,
      "step": 214253
    },
    {
      "epoch": 13.01,
      "learning_rate": 1.3494994235786665e-05,
      "loss": 0.1726,
      "step": 214500
    },
    {
      "epoch": 13.05,
      "learning_rate": 1.3479855591286937e-05,
      "loss": 0.169,
      "step": 215000
    },
    {
      "epoch": 13.08,
      "learning_rate": 1.3464686608822282e-05,
      "loss": 0.1673,
      "step": 215500
    },
    {
      "epoch": 13.11,
      "learning_rate": 1.3449517626357624e-05,
      "loss": 0.1696,
      "step": 216000
    },
    {
      "epoch": 13.14,
      "learning_rate": 1.3434378981857898e-05,
      "loss": 0.1696,
      "step": 216500
    },
    {
      "epoch": 13.17,
      "learning_rate": 1.341920999939324e-05,
      "loss": 0.1679,
      "step": 217000
    },
    {
      "epoch": 13.2,
      "learning_rate": 1.3404041016928587e-05,
      "loss": 0.1695,
      "step": 217500
    },
    {
      "epoch": 13.23,
      "learning_rate": 1.3388872034463929e-05,
      "loss": 0.166,
      "step": 218000
    },
    {
      "epoch": 13.26,
      "learning_rate": 1.3373703051999273e-05,
      "loss": 0.1677,
      "step": 218500
    },
    {
      "epoch": 13.29,
      "learning_rate": 1.3358534069534617e-05,
      "loss": 0.1636,
      "step": 219000
    },
    {
      "epoch": 13.32,
      "learning_rate": 1.334336508706996e-05,
      "loss": 0.1637,
      "step": 219500
    },
    {
      "epoch": 13.35,
      "learning_rate": 1.3328196104605304e-05,
      "loss": 0.1665,
      "step": 220000
    },
    {
      "epoch": 13.38,
      "learning_rate": 1.3313027122140647e-05,
      "loss": 0.1657,
      "step": 220500
    },
    {
      "epoch": 13.41,
      "learning_rate": 1.3297858139675992e-05,
      "loss": 0.168,
      "step": 221000
    },
    {
      "epoch": 13.44,
      "learning_rate": 1.3282689157211335e-05,
      "loss": 0.1676,
      "step": 221500
    },
    {
      "epoch": 13.47,
      "learning_rate": 1.326752017474668e-05,
      "loss": 0.169,
      "step": 222000
    },
    {
      "epoch": 13.5,
      "learning_rate": 1.3252351192282022e-05,
      "loss": 0.1677,
      "step": 222500
    },
    {
      "epoch": 13.53,
      "learning_rate": 1.3237212547782296e-05,
      "loss": 0.1676,
      "step": 223000
    },
    {
      "epoch": 13.56,
      "learning_rate": 1.322204356531764e-05,
      "loss": 0.1667,
      "step": 223500
    },
    {
      "epoch": 13.59,
      "learning_rate": 1.3206874582852984e-05,
      "loss": 0.1663,
      "step": 224000
    },
    {
      "epoch": 13.62,
      "learning_rate": 1.3191705600388327e-05,
      "loss": 0.1659,
      "step": 224500
    },
    {
      "epoch": 13.65,
      "learning_rate": 1.3176566955888601e-05,
      "loss": 0.1672,
      "step": 225000
    },
    {
      "epoch": 13.68,
      "learning_rate": 1.3161397973423943e-05,
      "loss": 0.1683,
      "step": 225500
    },
    {
      "epoch": 13.71,
      "learning_rate": 1.3146228990959286e-05,
      "loss": 0.1681,
      "step": 226000
    },
    {
      "epoch": 13.74,
      "learning_rate": 1.3131060008494632e-05,
      "loss": 0.1659,
      "step": 226500
    },
    {
      "epoch": 13.77,
      "learning_rate": 1.3115921363994903e-05,
      "loss": 0.1681,
      "step": 227000
    },
    {
      "epoch": 13.8,
      "learning_rate": 1.3100752381530249e-05,
      "loss": 0.1703,
      "step": 227500
    },
    {
      "epoch": 13.83,
      "learning_rate": 1.3085583399065591e-05,
      "loss": 0.1679,
      "step": 228000
    },
    {
      "epoch": 13.86,
      "learning_rate": 1.3070414416600937e-05,
      "loss": 0.167,
      "step": 228500
    },
    {
      "epoch": 13.89,
      "learning_rate": 1.3055275772101208e-05,
      "loss": 0.1656,
      "step": 229000
    },
    {
      "epoch": 13.93,
      "learning_rate": 1.3040137127601482e-05,
      "loss": 0.172,
      "step": 229500
    },
    {
      "epoch": 13.96,
      "learning_rate": 1.3024968145136824e-05,
      "loss": 0.1678,
      "step": 230000
    },
    {
      "epoch": 13.99,
      "learning_rate": 1.300979916267217e-05,
      "loss": 0.1718,
      "step": 230500
    },
    {
      "epoch": 14.0,
      "eval_bleu": 80.4785,
      "eval_gen_len": 14.0177,
      "eval_loss": 0.1709802895784378,
      "eval_runtime": 169.4766,
      "eval_samples_per_second": 95.14,
      "eval_steps_per_second": 2.974,
      "step": 230734
    },
    {
      "epoch": 14.02,
      "learning_rate": 1.2994630180207513e-05,
      "loss": 0.1667,
      "step": 231000
    },
    {
      "epoch": 14.05,
      "learning_rate": 1.2979461197742857e-05,
      "loss": 0.1626,
      "step": 231500
    },
    {
      "epoch": 14.08,
      "learning_rate": 1.29642922152782e-05,
      "loss": 0.1616,
      "step": 232000
    },
    {
      "epoch": 14.11,
      "learning_rate": 1.2949123232813544e-05,
      "loss": 0.163,
      "step": 232500
    },
    {
      "epoch": 14.14,
      "learning_rate": 1.2933954250348888e-05,
      "loss": 0.161,
      "step": 233000
    },
    {
      "epoch": 14.17,
      "learning_rate": 1.291881560584916e-05,
      "loss": 0.1664,
      "step": 233500
    },
    {
      "epoch": 14.2,
      "learning_rate": 1.2903646623384505e-05,
      "loss": 0.1609,
      "step": 234000
    },
    {
      "epoch": 14.23,
      "learning_rate": 1.2888477640919847e-05,
      "loss": 0.1619,
      "step": 234500
    },
    {
      "epoch": 14.26,
      "learning_rate": 1.2873308658455193e-05,
      "loss": 0.1632,
      "step": 235000
    },
    {
      "epoch": 14.29,
      "learning_rate": 1.2858139675990535e-05,
      "loss": 0.1654,
      "step": 235500
    },
    {
      "epoch": 14.32,
      "learning_rate": 1.284300103149081e-05,
      "loss": 0.1608,
      "step": 236000
    },
    {
      "epoch": 14.35,
      "learning_rate": 1.2827832049026152e-05,
      "loss": 0.1629,
      "step": 236500
    },
    {
      "epoch": 14.38,
      "learning_rate": 1.2812663066561496e-05,
      "loss": 0.1618,
      "step": 237000
    },
    {
      "epoch": 14.41,
      "learning_rate": 1.279749408409684e-05,
      "loss": 0.1618,
      "step": 237500
    },
    {
      "epoch": 14.44,
      "learning_rate": 1.2782355439597115e-05,
      "loss": 0.1651,
      "step": 238000
    },
    {
      "epoch": 14.47,
      "learning_rate": 1.2767186457132457e-05,
      "loss": 0.1639,
      "step": 238500
    },
    {
      "epoch": 14.5,
      "learning_rate": 1.27520174746678e-05,
      "loss": 0.1627,
      "step": 239000
    },
    {
      "epoch": 14.53,
      "learning_rate": 1.2736848492203144e-05,
      "loss": 0.161,
      "step": 239500
    },
    {
      "epoch": 14.56,
      "learning_rate": 1.2721709847703416e-05,
      "loss": 0.1646,
      "step": 240000
    },
    {
      "epoch": 14.59,
      "learning_rate": 1.270654086523876e-05,
      "loss": 0.1646,
      "step": 240500
    },
    {
      "epoch": 14.62,
      "learning_rate": 1.2691371882774105e-05,
      "loss": 0.1619,
      "step": 241000
    },
    {
      "epoch": 14.65,
      "learning_rate": 1.2676233238274377e-05,
      "loss": 0.1633,
      "step": 241500
    },
    {
      "epoch": 14.68,
      "learning_rate": 1.2661064255809721e-05,
      "loss": 0.1668,
      "step": 242000
    },
    {
      "epoch": 14.71,
      "learning_rate": 1.2645895273345066e-05,
      "loss": 0.1645,
      "step": 242500
    },
    {
      "epoch": 14.74,
      "learning_rate": 1.2630726290880408e-05,
      "loss": 0.1634,
      "step": 243000
    },
    {
      "epoch": 14.77,
      "learning_rate": 1.2615557308415754e-05,
      "loss": 0.1641,
      "step": 243500
    },
    {
      "epoch": 14.8,
      "learning_rate": 1.2600388325951096e-05,
      "loss": 0.1626,
      "step": 244000
    },
    {
      "epoch": 14.84,
      "learning_rate": 1.2585219343486439e-05,
      "loss": 0.1599,
      "step": 244500
    },
    {
      "epoch": 14.87,
      "learning_rate": 1.2570050361021783e-05,
      "loss": 0.162,
      "step": 245000
    },
    {
      "epoch": 14.9,
      "learning_rate": 1.2554881378557127e-05,
      "loss": 0.1651,
      "step": 245500
    },
    {
      "epoch": 14.93,
      "learning_rate": 1.2539712396092471e-05,
      "loss": 0.1628,
      "step": 246000
    },
    {
      "epoch": 14.96,
      "learning_rate": 1.2524543413627814e-05,
      "loss": 0.1633,
      "step": 246500
    },
    {
      "epoch": 14.99,
      "learning_rate": 1.2509404769128088e-05,
      "loss": 0.1635,
      "step": 247000
    },
    {
      "epoch": 15.0,
      "eval_bleu": 80.6536,
      "eval_gen_len": 14.0499,
      "eval_loss": 0.16988149285316467,
      "eval_runtime": 171.1611,
      "eval_samples_per_second": 94.204,
      "eval_steps_per_second": 2.945,
      "step": 247215
    },
    {
      "epoch": 15.02,
      "learning_rate": 1.249423578666343e-05,
      "loss": 0.161,
      "step": 247500
    },
    {
      "epoch": 15.05,
      "learning_rate": 1.2479066804198777e-05,
      "loss": 0.158,
      "step": 248000
    },
    {
      "epoch": 15.08,
      "learning_rate": 1.2463897821734119e-05,
      "loss": 0.1592,
      "step": 248500
    },
    {
      "epoch": 15.11,
      "learning_rate": 1.2448728839269463e-05,
      "loss": 0.1589,
      "step": 249000
    },
    {
      "epoch": 15.14,
      "learning_rate": 1.2433590194769736e-05,
      "loss": 0.1584,
      "step": 249500
    },
    {
      "epoch": 15.17,
      "learning_rate": 1.241842121230508e-05,
      "loss": 0.1577,
      "step": 250000
    },
    {
      "epoch": 15.2,
      "learning_rate": 1.2403252229840424e-05,
      "loss": 0.1568,
      "step": 250500
    },
    {
      "epoch": 15.23,
      "learning_rate": 1.2388083247375767e-05,
      "loss": 0.1579,
      "step": 251000
    },
    {
      "epoch": 15.26,
      "learning_rate": 1.237291426491111e-05,
      "loss": 0.1568,
      "step": 251500
    },
    {
      "epoch": 15.29,
      "learning_rate": 1.2357775620411383e-05,
      "loss": 0.1591,
      "step": 252000
    },
    {
      "epoch": 15.32,
      "learning_rate": 1.2342636975911658e-05,
      "loss": 0.1615,
      "step": 252500
    },
    {
      "epoch": 15.35,
      "learning_rate": 1.2327467993447e-05,
      "loss": 0.1582,
      "step": 253000
    },
    {
      "epoch": 15.38,
      "learning_rate": 1.2312299010982344e-05,
      "loss": 0.1609,
      "step": 253500
    },
    {
      "epoch": 15.41,
      "learning_rate": 1.2297130028517688e-05,
      "loss": 0.1601,
      "step": 254000
    },
    {
      "epoch": 15.44,
      "learning_rate": 1.2281961046053033e-05,
      "loss": 0.1594,
      "step": 254500
    },
    {
      "epoch": 15.47,
      "learning_rate": 1.2266792063588375e-05,
      "loss": 0.1569,
      "step": 255000
    },
    {
      "epoch": 15.5,
      "learning_rate": 1.2251623081123721e-05,
      "loss": 0.1602,
      "step": 255500
    },
    {
      "epoch": 15.53,
      "learning_rate": 1.2236454098659063e-05,
      "loss": 0.1618,
      "step": 256000
    },
    {
      "epoch": 15.56,
      "learning_rate": 1.2221285116194406e-05,
      "loss": 0.1566,
      "step": 256500
    },
    {
      "epoch": 15.59,
      "learning_rate": 1.220614647169468e-05,
      "loss": 0.1584,
      "step": 257000
    },
    {
      "epoch": 15.62,
      "learning_rate": 1.2190977489230023e-05,
      "loss": 0.1573,
      "step": 257500
    },
    {
      "epoch": 15.65,
      "learning_rate": 1.2175808506765367e-05,
      "loss": 0.1591,
      "step": 258000
    },
    {
      "epoch": 15.68,
      "learning_rate": 1.2160639524300711e-05,
      "loss": 0.1569,
      "step": 258500
    },
    {
      "epoch": 15.72,
      "learning_rate": 1.2145470541836055e-05,
      "loss": 0.1584,
      "step": 259000
    },
    {
      "epoch": 15.75,
      "learning_rate": 1.2130331897336328e-05,
      "loss": 0.1621,
      "step": 259500
    },
    {
      "epoch": 15.78,
      "learning_rate": 1.2115162914871672e-05,
      "loss": 0.1607,
      "step": 260000
    },
    {
      "epoch": 15.81,
      "learning_rate": 1.2099993932407014e-05,
      "loss": 0.1606,
      "step": 260500
    },
    {
      "epoch": 15.84,
      "learning_rate": 1.208482494994236e-05,
      "loss": 0.1587,
      "step": 261000
    },
    {
      "epoch": 15.87,
      "learning_rate": 1.2069655967477703e-05,
      "loss": 0.1588,
      "step": 261500
    },
    {
      "epoch": 15.9,
      "learning_rate": 1.2054517322977977e-05,
      "loss": 0.1574,
      "step": 262000
    },
    {
      "epoch": 15.93,
      "learning_rate": 1.203934834051332e-05,
      "loss": 0.1639,
      "step": 262500
    },
    {
      "epoch": 15.96,
      "learning_rate": 1.2024209696013594e-05,
      "loss": 0.1579,
      "step": 263000
    },
    {
      "epoch": 15.99,
      "learning_rate": 1.2009040713548936e-05,
      "loss": 0.1593,
      "step": 263500
    },
    {
      "epoch": 16.0,
      "eval_bleu": 80.6166,
      "eval_gen_len": 14.0258,
      "eval_loss": 0.16955877840518951,
      "eval_runtime": 170.3679,
      "eval_samples_per_second": 94.642,
      "eval_steps_per_second": 2.958,
      "step": 263696
    },
    {
      "epoch": 16.02,
      "learning_rate": 1.1993871731084279e-05,
      "loss": 0.1546,
      "step": 264000
    },
    {
      "epoch": 16.05,
      "learning_rate": 1.1978702748619624e-05,
      "loss": 0.1561,
      "step": 264500
    },
    {
      "epoch": 16.08,
      "learning_rate": 1.1963533766154967e-05,
      "loss": 0.1527,
      "step": 265000
    },
    {
      "epoch": 16.11,
      "learning_rate": 1.1948364783690311e-05,
      "loss": 0.1549,
      "step": 265500
    },
    {
      "epoch": 16.14,
      "learning_rate": 1.1933195801225654e-05,
      "loss": 0.1568,
      "step": 266000
    },
    {
      "epoch": 16.17,
      "learning_rate": 1.1918026818761e-05,
      "loss": 0.1508,
      "step": 266500
    },
    {
      "epoch": 16.2,
      "learning_rate": 1.190288817426127e-05,
      "loss": 0.1554,
      "step": 267000
    },
    {
      "epoch": 16.23,
      "learning_rate": 1.1887719191796616e-05,
      "loss": 0.1554,
      "step": 267500
    },
    {
      "epoch": 16.26,
      "learning_rate": 1.1872580547296889e-05,
      "loss": 0.1558,
      "step": 268000
    },
    {
      "epoch": 16.29,
      "learning_rate": 1.1857411564832233e-05,
      "loss": 0.1548,
      "step": 268500
    },
    {
      "epoch": 16.32,
      "learning_rate": 1.1842242582367575e-05,
      "loss": 0.1567,
      "step": 269000
    },
    {
      "epoch": 16.35,
      "learning_rate": 1.1827073599902918e-05,
      "loss": 0.1536,
      "step": 269500
    },
    {
      "epoch": 16.38,
      "learning_rate": 1.1811904617438264e-05,
      "loss": 0.1529,
      "step": 270000
    },
    {
      "epoch": 16.41,
      "learning_rate": 1.1796765972938535e-05,
      "loss": 0.1546,
      "step": 270500
    },
    {
      "epoch": 16.44,
      "learning_rate": 1.178159699047388e-05,
      "loss": 0.1538,
      "step": 271000
    },
    {
      "epoch": 16.47,
      "learning_rate": 1.1766428008009223e-05,
      "loss": 0.1579,
      "step": 271500
    },
    {
      "epoch": 16.5,
      "learning_rate": 1.1751259025544567e-05,
      "loss": 0.1526,
      "step": 272000
    },
    {
      "epoch": 16.53,
      "learning_rate": 1.1736090043079911e-05,
      "loss": 0.1516,
      "step": 272500
    },
    {
      "epoch": 16.56,
      "learning_rate": 1.1720921060615256e-05,
      "loss": 0.1541,
      "step": 273000
    },
    {
      "epoch": 16.59,
      "learning_rate": 1.1705752078150598e-05,
      "loss": 0.1539,
      "step": 273500
    },
    {
      "epoch": 16.63,
      "learning_rate": 1.1690583095685944e-05,
      "loss": 0.1567,
      "step": 274000
    },
    {
      "epoch": 16.66,
      "learning_rate": 1.1675444451186215e-05,
      "loss": 0.1529,
      "step": 274500
    },
    {
      "epoch": 16.69,
      "learning_rate": 1.1660275468721557e-05,
      "loss": 0.1569,
      "step": 275000
    },
    {
      "epoch": 16.72,
      "learning_rate": 1.1645106486256903e-05,
      "loss": 0.1554,
      "step": 275500
    },
    {
      "epoch": 16.75,
      "learning_rate": 1.1629937503792246e-05,
      "loss": 0.1555,
      "step": 276000
    },
    {
      "epoch": 16.78,
      "learning_rate": 1.1614768521327591e-05,
      "loss": 0.1583,
      "step": 276500
    },
    {
      "epoch": 16.81,
      "learning_rate": 1.1599599538862934e-05,
      "loss": 0.1585,
      "step": 277000
    },
    {
      "epoch": 16.84,
      "learning_rate": 1.1584430556398278e-05,
      "loss": 0.1558,
      "step": 277500
    },
    {
      "epoch": 16.87,
      "learning_rate": 1.156926157393362e-05,
      "loss": 0.1564,
      "step": 278000
    },
    {
      "epoch": 16.9,
      "learning_rate": 1.1554092591468967e-05,
      "loss": 0.156,
      "step": 278500
    },
    {
      "epoch": 16.93,
      "learning_rate": 1.1538953946969237e-05,
      "loss": 0.1573,
      "step": 279000
    },
    {
      "epoch": 16.96,
      "learning_rate": 1.1523784964504583e-05,
      "loss": 0.1524,
      "step": 279500
    },
    {
      "epoch": 16.99,
      "learning_rate": 1.1508615982039926e-05,
      "loss": 0.1561,
      "step": 280000
    },
    {
      "epoch": 17.0,
      "eval_bleu": 80.7199,
      "eval_gen_len": 14.0692,
      "eval_loss": 0.16820241510868073,
      "eval_runtime": 169.5628,
      "eval_samples_per_second": 95.092,
      "eval_steps_per_second": 2.972,
      "step": 280177
    },
    {
      "epoch": 17.02,
      "learning_rate": 1.1493446999575268e-05,
      "loss": 0.1497,
      "step": 280500
    },
    {
      "epoch": 17.05,
      "learning_rate": 1.1478278017110614e-05,
      "loss": 0.15,
      "step": 281000
    },
    {
      "epoch": 17.08,
      "learning_rate": 1.1463139372610885e-05,
      "loss": 0.1535,
      "step": 281500
    },
    {
      "epoch": 17.11,
      "learning_rate": 1.1448000728111159e-05,
      "loss": 0.1501,
      "step": 282000
    },
    {
      "epoch": 17.14,
      "learning_rate": 1.1432831745646502e-05,
      "loss": 0.1513,
      "step": 282500
    },
    {
      "epoch": 17.17,
      "learning_rate": 1.1417662763181847e-05,
      "loss": 0.1535,
      "step": 283000
    },
    {
      "epoch": 17.2,
      "learning_rate": 1.140249378071719e-05,
      "loss": 0.1525,
      "step": 283500
    },
    {
      "epoch": 17.23,
      "learning_rate": 1.1387324798252534e-05,
      "loss": 0.151,
      "step": 284000
    },
    {
      "epoch": 17.26,
      "learning_rate": 1.1372155815787878e-05,
      "loss": 0.1497,
      "step": 284500
    },
    {
      "epoch": 17.29,
      "learning_rate": 1.1356986833323223e-05,
      "loss": 0.1517,
      "step": 285000
    },
    {
      "epoch": 17.32,
      "learning_rate": 1.1341817850858565e-05,
      "loss": 0.1525,
      "step": 285500
    },
    {
      "epoch": 17.35,
      "learning_rate": 1.1326648868393908e-05,
      "loss": 0.1548,
      "step": 286000
    },
    {
      "epoch": 17.38,
      "learning_rate": 1.1311479885929253e-05,
      "loss": 0.1516,
      "step": 286500
    },
    {
      "epoch": 17.41,
      "learning_rate": 1.1296310903464596e-05,
      "loss": 0.1546,
      "step": 287000
    },
    {
      "epoch": 17.44,
      "learning_rate": 1.128114192099994e-05,
      "loss": 0.1492,
      "step": 287500
    },
    {
      "epoch": 17.47,
      "learning_rate": 1.1266003276500213e-05,
      "loss": 0.1506,
      "step": 288000
    },
    {
      "epoch": 17.51,
      "learning_rate": 1.1250864632000487e-05,
      "loss": 0.1509,
      "step": 288500
    },
    {
      "epoch": 17.54,
      "learning_rate": 1.123569564953583e-05,
      "loss": 0.1521,
      "step": 289000
    },
    {
      "epoch": 17.57,
      "learning_rate": 1.1220526667071175e-05,
      "loss": 0.1528,
      "step": 289500
    },
    {
      "epoch": 17.6,
      "learning_rate": 1.1205357684606518e-05,
      "loss": 0.1543,
      "step": 290000
    },
    {
      "epoch": 17.63,
      "learning_rate": 1.1190188702141862e-05,
      "loss": 0.1492,
      "step": 290500
    },
    {
      "epoch": 17.66,
      "learning_rate": 1.1175050057642134e-05,
      "loss": 0.1526,
      "step": 291000
    },
    {
      "epoch": 17.69,
      "learning_rate": 1.1159881075177479e-05,
      "loss": 0.1516,
      "step": 291500
    },
    {
      "epoch": 17.72,
      "learning_rate": 1.1144712092712821e-05,
      "loss": 0.15,
      "step": 292000
    },
    {
      "epoch": 17.75,
      "learning_rate": 1.1129543110248164e-05,
      "loss": 0.151,
      "step": 292500
    },
    {
      "epoch": 17.78,
      "learning_rate": 1.1114404465748438e-05,
      "loss": 0.1508,
      "step": 293000
    },
    {
      "epoch": 17.81,
      "learning_rate": 1.1099235483283782e-05,
      "loss": 0.1501,
      "step": 293500
    },
    {
      "epoch": 17.84,
      "learning_rate": 1.1084066500819126e-05,
      "loss": 0.1517,
      "step": 294000
    },
    {
      "epoch": 17.87,
      "learning_rate": 1.1068897518354469e-05,
      "loss": 0.1499,
      "step": 294500
    },
    {
      "epoch": 17.9,
      "learning_rate": 1.1053728535889814e-05,
      "loss": 0.1504,
      "step": 295000
    },
    {
      "epoch": 17.93,
      "learning_rate": 1.1038589891390085e-05,
      "loss": 0.1514,
      "step": 295500
    },
    {
      "epoch": 17.96,
      "learning_rate": 1.1023420908925431e-05,
      "loss": 0.1493,
      "step": 296000
    },
    {
      "epoch": 17.99,
      "learning_rate": 1.1008251926460774e-05,
      "loss": 0.1532,
      "step": 296500
    },
    {
      "epoch": 18.0,
      "eval_bleu": 80.7365,
      "eval_gen_len": 14.0628,
      "eval_loss": 0.16694927215576172,
      "eval_runtime": 170.5372,
      "eval_samples_per_second": 94.548,
      "eval_steps_per_second": 2.955,
      "step": 296658
    },
    {
      "epoch": 18.02,
      "learning_rate": 1.0993113281961048e-05,
      "loss": 0.1487,
      "step": 297000
    },
    {
      "epoch": 18.05,
      "learning_rate": 1.097794429949639e-05,
      "loss": 0.1455,
      "step": 297500
    },
    {
      "epoch": 18.08,
      "learning_rate": 1.0962775317031735e-05,
      "loss": 0.1449,
      "step": 298000
    },
    {
      "epoch": 18.11,
      "learning_rate": 1.0947636672532007e-05,
      "loss": 0.1498,
      "step": 298500
    },
    {
      "epoch": 18.14,
      "learning_rate": 1.0932467690067353e-05,
      "loss": 0.1475,
      "step": 299000
    },
    {
      "epoch": 18.17,
      "learning_rate": 1.0917298707602695e-05,
      "loss": 0.1477,
      "step": 299500
    },
    {
      "epoch": 18.2,
      "learning_rate": 1.0902129725138038e-05,
      "loss": 0.1488,
      "step": 300000
    },
    {
      "epoch": 18.23,
      "learning_rate": 1.0886960742673382e-05,
      "loss": 0.1471,
      "step": 300500
    },
    {
      "epoch": 18.26,
      "learning_rate": 1.0871822098173655e-05,
      "loss": 0.1503,
      "step": 301000
    },
    {
      "epoch": 18.29,
      "learning_rate": 1.0856653115708999e-05,
      "loss": 0.15,
      "step": 301500
    },
    {
      "epoch": 18.32,
      "learning_rate": 1.0841484133244341e-05,
      "loss": 0.1477,
      "step": 302000
    },
    {
      "epoch": 18.35,
      "learning_rate": 1.0826315150779687e-05,
      "loss": 0.1491,
      "step": 302500
    },
    {
      "epoch": 18.38,
      "learning_rate": 1.081114616831503e-05,
      "loss": 0.149,
      "step": 303000
    },
    {
      "epoch": 18.42,
      "learning_rate": 1.0795977185850376e-05,
      "loss": 0.1472,
      "step": 303500
    },
    {
      "epoch": 18.45,
      "learning_rate": 1.0780808203385718e-05,
      "loss": 0.1467,
      "step": 304000
    },
    {
      "epoch": 18.48,
      "learning_rate": 1.0765669558885992e-05,
      "loss": 0.1496,
      "step": 304500
    },
    {
      "epoch": 18.51,
      "learning_rate": 1.0750500576421335e-05,
      "loss": 0.148,
      "step": 305000
    },
    {
      "epoch": 18.54,
      "learning_rate": 1.0735331593956679e-05,
      "loss": 0.1456,
      "step": 305500
    },
    {
      "epoch": 18.57,
      "learning_rate": 1.0720192949456951e-05,
      "loss": 0.149,
      "step": 306000
    },
    {
      "epoch": 18.6,
      "learning_rate": 1.0705023966992294e-05,
      "loss": 0.1485,
      "step": 306500
    },
    {
      "epoch": 18.63,
      "learning_rate": 1.0689854984527638e-05,
      "loss": 0.1478,
      "step": 307000
    },
    {
      "epoch": 18.66,
      "learning_rate": 1.0674686002062982e-05,
      "loss": 0.1473,
      "step": 307500
    },
    {
      "epoch": 18.69,
      "learning_rate": 1.0659517019598326e-05,
      "loss": 0.1484,
      "step": 308000
    },
    {
      "epoch": 18.72,
      "learning_rate": 1.0644348037133669e-05,
      "loss": 0.149,
      "step": 308500
    },
    {
      "epoch": 18.75,
      "learning_rate": 1.0629179054669015e-05,
      "loss": 0.1484,
      "step": 309000
    },
    {
      "epoch": 18.78,
      "learning_rate": 1.0614010072204357e-05,
      "loss": 0.1463,
      "step": 309500
    },
    {
      "epoch": 18.81,
      "learning_rate": 1.0598841089739702e-05,
      "loss": 0.1482,
      "step": 310000
    },
    {
      "epoch": 18.84,
      "learning_rate": 1.0583672107275044e-05,
      "loss": 0.1466,
      "step": 310500
    },
    {
      "epoch": 18.87,
      "learning_rate": 1.0568503124810388e-05,
      "loss": 0.148,
      "step": 311000
    },
    {
      "epoch": 18.9,
      "learning_rate": 1.0553364480310662e-05,
      "loss": 0.1492,
      "step": 311500
    },
    {
      "epoch": 18.93,
      "learning_rate": 1.0538195497846005e-05,
      "loss": 0.1491,
      "step": 312000
    },
    {
      "epoch": 18.96,
      "learning_rate": 1.0523026515381349e-05,
      "loss": 0.1485,
      "step": 312500
    },
    {
      "epoch": 18.99,
      "learning_rate": 1.0507857532916692e-05,
      "loss": 0.15,
      "step": 313000
    },
    {
      "epoch": 19.0,
      "eval_bleu": 80.8654,
      "eval_gen_len": 14.0824,
      "eval_loss": 0.16597765684127808,
      "eval_runtime": 172.4859,
      "eval_samples_per_second": 93.48,
      "eval_steps_per_second": 2.922,
      "step": 313139
    },
    {
      "epoch": 19.02,
      "learning_rate": 1.0492688550452037e-05,
      "loss": 0.1465,
      "step": 313500
    },
    {
      "epoch": 19.05,
      "learning_rate": 1.0477549905952308e-05,
      "loss": 0.1446,
      "step": 314000
    },
    {
      "epoch": 19.08,
      "learning_rate": 1.0462380923487654e-05,
      "loss": 0.1455,
      "step": 314500
    },
    {
      "epoch": 19.11,
      "learning_rate": 1.0447211941022997e-05,
      "loss": 0.1444,
      "step": 315000
    },
    {
      "epoch": 19.14,
      "learning_rate": 1.043204295855834e-05,
      "loss": 0.147,
      "step": 315500
    },
    {
      "epoch": 19.17,
      "learning_rate": 1.0416873976093685e-05,
      "loss": 0.1457,
      "step": 316000
    },
    {
      "epoch": 19.2,
      "learning_rate": 1.040170499362903e-05,
      "loss": 0.1434,
      "step": 316500
    },
    {
      "epoch": 19.23,
      "learning_rate": 1.0386536011164372e-05,
      "loss": 0.1455,
      "step": 317000
    },
    {
      "epoch": 19.26,
      "learning_rate": 1.0371367028699714e-05,
      "loss": 0.1456,
      "step": 317500
    },
    {
      "epoch": 19.29,
      "learning_rate": 1.035619804623506e-05,
      "loss": 0.1443,
      "step": 318000
    },
    {
      "epoch": 19.33,
      "learning_rate": 1.0341029063770403e-05,
      "loss": 0.1452,
      "step": 318500
    },
    {
      "epoch": 19.36,
      "learning_rate": 1.0325860081305747e-05,
      "loss": 0.1417,
      "step": 319000
    },
    {
      "epoch": 19.39,
      "learning_rate": 1.0310691098841091e-05,
      "loss": 0.1423,
      "step": 319500
    },
    {
      "epoch": 19.42,
      "learning_rate": 1.0295522116376435e-05,
      "loss": 0.1466,
      "step": 320000
    },
    {
      "epoch": 19.45,
      "learning_rate": 1.0280353133911778e-05,
      "loss": 0.149,
      "step": 320500
    },
    {
      "epoch": 19.48,
      "learning_rate": 1.026518415144712e-05,
      "loss": 0.1459,
      "step": 321000
    },
    {
      "epoch": 19.51,
      "learning_rate": 1.0250045506947394e-05,
      "loss": 0.1427,
      "step": 321500
    },
    {
      "epoch": 19.54,
      "learning_rate": 1.0234876524482737e-05,
      "loss": 0.1446,
      "step": 322000
    },
    {
      "epoch": 19.57,
      "learning_rate": 1.0219707542018083e-05,
      "loss": 0.1439,
      "step": 322500
    },
    {
      "epoch": 19.6,
      "learning_rate": 1.0204538559553425e-05,
      "loss": 0.1456,
      "step": 323000
    },
    {
      "epoch": 19.63,
      "learning_rate": 1.01893999150537e-05,
      "loss": 0.1463,
      "step": 323500
    },
    {
      "epoch": 19.66,
      "learning_rate": 1.0174230932589042e-05,
      "loss": 0.1454,
      "step": 324000
    },
    {
      "epoch": 19.69,
      "learning_rate": 1.0159061950124388e-05,
      "loss": 0.1439,
      "step": 324500
    },
    {
      "epoch": 19.72,
      "learning_rate": 1.014389296765973e-05,
      "loss": 0.1457,
      "step": 325000
    },
    {
      "epoch": 19.75,
      "learning_rate": 1.0128723985195074e-05,
      "loss": 0.1487,
      "step": 325500
    },
    {
      "epoch": 19.78,
      "learning_rate": 1.0113585340695347e-05,
      "loss": 0.1442,
      "step": 326000
    },
    {
      "epoch": 19.81,
      "learning_rate": 1.0098416358230691e-05,
      "loss": 0.1444,
      "step": 326500
    },
    {
      "epoch": 19.84,
      "learning_rate": 1.0083277713730964e-05,
      "loss": 0.1442,
      "step": 327000
    },
    {
      "epoch": 19.87,
      "learning_rate": 1.0068108731266308e-05,
      "loss": 0.1452,
      "step": 327500
    },
    {
      "epoch": 19.9,
      "learning_rate": 1.005293974880165e-05,
      "loss": 0.1451,
      "step": 328000
    },
    {
      "epoch": 19.93,
      "learning_rate": 1.0037770766336994e-05,
      "loss": 0.1439,
      "step": 328500
    },
    {
      "epoch": 19.96,
      "learning_rate": 1.0022601783872339e-05,
      "loss": 0.1444,
      "step": 329000
    },
    {
      "epoch": 19.99,
      "learning_rate": 1.0007432801407681e-05,
      "loss": 0.1479,
      "step": 329500
    },
    {
      "epoch": 20.0,
      "eval_bleu": 80.8523,
      "eval_gen_len": 14.0607,
      "eval_loss": 0.16498535871505737,
      "eval_runtime": 169.9695,
      "eval_samples_per_second": 94.864,
      "eval_steps_per_second": 2.965,
      "step": 329620
    },
    {
      "epoch": 20.02,
      "learning_rate": 9.992263818943027e-06,
      "loss": 0.1415,
      "step": 330000
    },
    {
      "epoch": 20.05,
      "learning_rate": 9.97709483647837e-06,
      "loss": 0.1391,
      "step": 330500
    },
    {
      "epoch": 20.08,
      "learning_rate": 9.961925854013714e-06,
      "loss": 0.1411,
      "step": 331000
    },
    {
      "epoch": 20.11,
      "learning_rate": 9.946756871549056e-06,
      "loss": 0.1435,
      "step": 331500
    },
    {
      "epoch": 20.14,
      "learning_rate": 9.93161822704933e-06,
      "loss": 0.1422,
      "step": 332000
    },
    {
      "epoch": 20.17,
      "learning_rate": 9.916449244584675e-06,
      "loss": 0.1434,
      "step": 332500
    },
    {
      "epoch": 20.21,
      "learning_rate": 9.901280262120017e-06,
      "loss": 0.1407,
      "step": 333000
    },
    {
      "epoch": 20.24,
      "learning_rate": 9.886111279655361e-06,
      "loss": 0.1434,
      "step": 333500
    },
    {
      "epoch": 20.27,
      "learning_rate": 9.870942297190705e-06,
      "loss": 0.1433,
      "step": 334000
    },
    {
      "epoch": 20.3,
      "learning_rate": 9.855803652690978e-06,
      "loss": 0.1432,
      "step": 334500
    },
    {
      "epoch": 20.33,
      "learning_rate": 9.840634670226322e-06,
      "loss": 0.145,
      "step": 335000
    },
    {
      "epoch": 20.36,
      "learning_rate": 9.825465687761666e-06,
      "loss": 0.1427,
      "step": 335500
    },
    {
      "epoch": 20.39,
      "learning_rate": 9.81029670529701e-06,
      "loss": 0.1454,
      "step": 336000
    },
    {
      "epoch": 20.42,
      "learning_rate": 9.795158060797283e-06,
      "loss": 0.1467,
      "step": 336500
    },
    {
      "epoch": 20.45,
      "learning_rate": 9.780019416297556e-06,
      "loss": 0.1409,
      "step": 337000
    },
    {
      "epoch": 20.48,
      "learning_rate": 9.7648504338329e-06,
      "loss": 0.1432,
      "step": 337500
    },
    {
      "epoch": 20.51,
      "learning_rate": 9.749681451368242e-06,
      "loss": 0.1411,
      "step": 338000
    },
    {
      "epoch": 20.54,
      "learning_rate": 9.734512468903586e-06,
      "loss": 0.1394,
      "step": 338500
    },
    {
      "epoch": 20.57,
      "learning_rate": 9.71934348643893e-06,
      "loss": 0.1431,
      "step": 339000
    },
    {
      "epoch": 20.6,
      "learning_rate": 9.704174503974275e-06,
      "loss": 0.1451,
      "step": 339500
    },
    {
      "epoch": 20.63,
      "learning_rate": 9.689005521509617e-06,
      "loss": 0.1431,
      "step": 340000
    },
    {
      "epoch": 20.66,
      "learning_rate": 9.673836539044961e-06,
      "loss": 0.1452,
      "step": 340500
    },
    {
      "epoch": 20.69,
      "learning_rate": 9.658667556580306e-06,
      "loss": 0.1417,
      "step": 341000
    },
    {
      "epoch": 20.72,
      "learning_rate": 9.64349857411565e-06,
      "loss": 0.1422,
      "step": 341500
    },
    {
      "epoch": 20.75,
      "learning_rate": 9.628359929615922e-06,
      "loss": 0.1398,
      "step": 342000
    },
    {
      "epoch": 20.78,
      "learning_rate": 9.613190947151267e-06,
      "loss": 0.1409,
      "step": 342500
    },
    {
      "epoch": 20.81,
      "learning_rate": 9.598021964686609e-06,
      "loss": 0.1432,
      "step": 343000
    },
    {
      "epoch": 20.84,
      "learning_rate": 9.582852982221953e-06,
      "loss": 0.1418,
      "step": 343500
    },
    {
      "epoch": 20.87,
      "learning_rate": 9.567714337722226e-06,
      "loss": 0.1435,
      "step": 344000
    },
    {
      "epoch": 20.9,
      "learning_rate": 9.55254535525757e-06,
      "loss": 0.142,
      "step": 344500
    },
    {
      "epoch": 20.93,
      "learning_rate": 9.537376372792914e-06,
      "loss": 0.1402,
      "step": 345000
    },
    {
      "epoch": 20.96,
      "learning_rate": 9.522207390328258e-06,
      "loss": 0.1449,
      "step": 345500
    },
    {
      "epoch": 20.99,
      "learning_rate": 9.5070384078636e-06,
      "loss": 0.1404,
      "step": 346000
    },
    {
      "epoch": 21.0,
      "eval_bleu": 80.9578,
      "eval_gen_len": 14.0655,
      "eval_loss": 0.164962500333786,
      "eval_runtime": 171.5734,
      "eval_samples_per_second": 93.977,
      "eval_steps_per_second": 2.938,
      "step": 346101
    },
    {
      "epoch": 21.02,
      "learning_rate": 9.491899763363875e-06,
      "loss": 0.1392,
      "step": 346500
    },
    {
      "epoch": 21.05,
      "learning_rate": 9.476730780899217e-06,
      "loss": 0.1375,
      "step": 347000
    },
    {
      "epoch": 21.08,
      "learning_rate": 9.461561798434562e-06,
      "loss": 0.142,
      "step": 347500
    },
    {
      "epoch": 21.12,
      "learning_rate": 9.446392815969906e-06,
      "loss": 0.139,
      "step": 348000
    },
    {
      "epoch": 21.15,
      "learning_rate": 9.43122383350525e-06,
      "loss": 0.1405,
      "step": 348500
    },
    {
      "epoch": 21.18,
      "learning_rate": 9.416054851040593e-06,
      "loss": 0.1399,
      "step": 349000
    },
    {
      "epoch": 21.21,
      "learning_rate": 9.400885868575937e-06,
      "loss": 0.1388,
      "step": 349500
    },
    {
      "epoch": 21.24,
      "learning_rate": 9.38574722407621e-06,
      "loss": 0.1403,
      "step": 350000
    },
    {
      "epoch": 21.27,
      "learning_rate": 9.370578241611553e-06,
      "loss": 0.1415,
      "step": 350500
    },
    {
      "epoch": 21.3,
      "learning_rate": 9.355409259146898e-06,
      "loss": 0.1387,
      "step": 351000
    },
    {
      "epoch": 21.33,
      "learning_rate": 9.34024027668224e-06,
      "loss": 0.1384,
      "step": 351500
    },
    {
      "epoch": 21.36,
      "learning_rate": 9.325101632182514e-06,
      "loss": 0.1396,
      "step": 352000
    },
    {
      "epoch": 21.39,
      "learning_rate": 9.309932649717858e-06,
      "loss": 0.1417,
      "step": 352500
    },
    {
      "epoch": 21.42,
      "learning_rate": 9.294763667253201e-06,
      "loss": 0.1388,
      "step": 353000
    },
    {
      "epoch": 21.45,
      "learning_rate": 9.279594684788545e-06,
      "loss": 0.139,
      "step": 353500
    },
    {
      "epoch": 21.48,
      "learning_rate": 9.26442570232389e-06,
      "loss": 0.1398,
      "step": 354000
    },
    {
      "epoch": 21.51,
      "learning_rate": 9.249256719859234e-06,
      "loss": 0.1402,
      "step": 354500
    },
    {
      "epoch": 21.54,
      "learning_rate": 9.234087737394576e-06,
      "loss": 0.1402,
      "step": 355000
    },
    {
      "epoch": 21.57,
      "learning_rate": 9.21891875492992e-06,
      "loss": 0.1401,
      "step": 355500
    },
    {
      "epoch": 21.6,
      "learning_rate": 9.203780110430193e-06,
      "loss": 0.1391,
      "step": 356000
    },
    {
      "epoch": 21.63,
      "learning_rate": 9.188641465930465e-06,
      "loss": 0.1394,
      "step": 356500
    },
    {
      "epoch": 21.66,
      "learning_rate": 9.17347248346581e-06,
      "loss": 0.1382,
      "step": 357000
    },
    {
      "epoch": 21.69,
      "learning_rate": 9.158303501001154e-06,
      "loss": 0.1388,
      "step": 357500
    },
    {
      "epoch": 21.72,
      "learning_rate": 9.143134518536498e-06,
      "loss": 0.1379,
      "step": 358000
    },
    {
      "epoch": 21.75,
      "learning_rate": 9.12799587403677e-06,
      "loss": 0.1417,
      "step": 358500
    },
    {
      "epoch": 21.78,
      "learning_rate": 9.112826891572114e-06,
      "loss": 0.1428,
      "step": 359000
    },
    {
      "epoch": 21.81,
      "learning_rate": 9.097657909107459e-06,
      "loss": 0.1406,
      "step": 359500
    },
    {
      "epoch": 21.84,
      "learning_rate": 9.082488926642801e-06,
      "loss": 0.1398,
      "step": 360000
    },
    {
      "epoch": 21.87,
      "learning_rate": 9.067319944178145e-06,
      "loss": 0.1396,
      "step": 360500
    },
    {
      "epoch": 21.9,
      "learning_rate": 9.052181299678418e-06,
      "loss": 0.1405,
      "step": 361000
    },
    {
      "epoch": 21.93,
      "learning_rate": 9.037012317213762e-06,
      "loss": 0.1384,
      "step": 361500
    },
    {
      "epoch": 21.96,
      "learning_rate": 9.021843334749105e-06,
      "loss": 0.1411,
      "step": 362000
    },
    {
      "epoch": 22.0,
      "learning_rate": 9.006674352284449e-06,
      "loss": 0.1428,
      "step": 362500
    },
    {
      "epoch": 22.0,
      "eval_bleu": 80.9035,
      "eval_gen_len": 14.1041,
      "eval_loss": 0.16399070620536804,
      "eval_runtime": 169.4187,
      "eval_samples_per_second": 95.173,
      "eval_steps_per_second": 2.975,
      "step": 362582
    },
    {
      "epoch": 22.03,
      "learning_rate": 8.991505369819793e-06,
      "loss": 0.1366,
      "step": 363000
    },
    {
      "epoch": 22.06,
      "learning_rate": 8.976336387355137e-06,
      "loss": 0.138,
      "step": 363500
    },
    {
      "epoch": 22.09,
      "learning_rate": 8.96119774285541e-06,
      "loss": 0.1386,
      "step": 364000
    },
    {
      "epoch": 22.12,
      "learning_rate": 8.946028760390754e-06,
      "loss": 0.1391,
      "step": 364500
    },
    {
      "epoch": 22.15,
      "learning_rate": 8.930859777926098e-06,
      "loss": 0.1354,
      "step": 365000
    },
    {
      "epoch": 22.18,
      "learning_rate": 8.915690795461442e-06,
      "loss": 0.1372,
      "step": 365500
    },
    {
      "epoch": 22.21,
      "learning_rate": 8.900521812996785e-06,
      "loss": 0.1361,
      "step": 366000
    },
    {
      "epoch": 22.24,
      "learning_rate": 8.885352830532129e-06,
      "loss": 0.1341,
      "step": 366500
    },
    {
      "epoch": 22.27,
      "learning_rate": 8.870183848067473e-06,
      "loss": 0.1345,
      "step": 367000
    },
    {
      "epoch": 22.3,
      "learning_rate": 8.855014865602816e-06,
      "loss": 0.1382,
      "step": 367500
    },
    {
      "epoch": 22.33,
      "learning_rate": 8.839876221103088e-06,
      "loss": 0.1363,
      "step": 368000
    },
    {
      "epoch": 22.36,
      "learning_rate": 8.824707238638432e-06,
      "loss": 0.1369,
      "step": 368500
    },
    {
      "epoch": 22.39,
      "learning_rate": 8.809538256173776e-06,
      "loss": 0.1381,
      "step": 369000
    },
    {
      "epoch": 22.42,
      "learning_rate": 8.79436927370912e-06,
      "loss": 0.1346,
      "step": 369500
    },
    {
      "epoch": 22.45,
      "learning_rate": 8.779200291244465e-06,
      "loss": 0.1378,
      "step": 370000
    },
    {
      "epoch": 22.48,
      "learning_rate": 8.764031308779807e-06,
      "loss": 0.1393,
      "step": 370500
    },
    {
      "epoch": 22.51,
      "learning_rate": 8.748862326315151e-06,
      "loss": 0.1396,
      "step": 371000
    },
    {
      "epoch": 22.54,
      "learning_rate": 8.733693343850496e-06,
      "loss": 0.1395,
      "step": 371500
    },
    {
      "epoch": 22.57,
      "learning_rate": 8.718554699350768e-06,
      "loss": 0.1349,
      "step": 372000
    },
    {
      "epoch": 22.6,
      "learning_rate": 8.703385716886112e-06,
      "loss": 0.1376,
      "step": 372500
    },
    {
      "epoch": 22.63,
      "learning_rate": 8.688216734421455e-06,
      "loss": 0.1389,
      "step": 373000
    },
    {
      "epoch": 22.66,
      "learning_rate": 8.673078089921729e-06,
      "loss": 0.1368,
      "step": 373500
    },
    {
      "epoch": 22.69,
      "learning_rate": 8.657909107457072e-06,
      "loss": 0.1379,
      "step": 374000
    },
    {
      "epoch": 22.72,
      "learning_rate": 8.642740124992416e-06,
      "loss": 0.1348,
      "step": 374500
    },
    {
      "epoch": 22.75,
      "learning_rate": 8.62757114252776e-06,
      "loss": 0.136,
      "step": 375000
    },
    {
      "epoch": 22.78,
      "learning_rate": 8.612402160063104e-06,
      "loss": 0.1374,
      "step": 375500
    },
    {
      "epoch": 22.81,
      "learning_rate": 8.597233177598448e-06,
      "loss": 0.1396,
      "step": 376000
    },
    {
      "epoch": 22.84,
      "learning_rate": 8.58206419513379e-06,
      "loss": 0.1383,
      "step": 376500
    },
    {
      "epoch": 22.87,
      "learning_rate": 8.566925550634065e-06,
      "loss": 0.1387,
      "step": 377000
    },
    {
      "epoch": 22.91,
      "learning_rate": 8.551756568169407e-06,
      "loss": 0.1387,
      "step": 377500
    },
    {
      "epoch": 22.94,
      "learning_rate": 8.536587585704752e-06,
      "loss": 0.1391,
      "step": 378000
    },
    {
      "epoch": 22.97,
      "learning_rate": 8.521418603240096e-06,
      "loss": 0.1402,
      "step": 378500
    },
    {
      "epoch": 23.0,
      "learning_rate": 8.506249620775438e-06,
      "loss": 0.1378,
      "step": 379000
    },
    {
      "epoch": 23.0,
      "eval_bleu": 80.9901,
      "eval_gen_len": 14.0593,
      "eval_loss": 0.16328243911266327,
      "eval_runtime": 168.8208,
      "eval_samples_per_second": 95.51,
      "eval_steps_per_second": 2.985,
      "step": 379063
    },
    {
      "epoch": 23.03,
      "learning_rate": 8.491080638310782e-06,
      "loss": 0.1356,
      "step": 379500
    },
    {
      "epoch": 23.06,
      "learning_rate": 8.475911655846127e-06,
      "loss": 0.1338,
      "step": 380000
    },
    {
      "epoch": 23.09,
      "learning_rate": 8.4607730113464e-06,
      "loss": 0.136,
      "step": 380500
    },
    {
      "epoch": 23.12,
      "learning_rate": 8.445634366846672e-06,
      "loss": 0.1362,
      "step": 381000
    },
    {
      "epoch": 23.15,
      "learning_rate": 8.430465384382016e-06,
      "loss": 0.1355,
      "step": 381500
    },
    {
      "epoch": 23.18,
      "learning_rate": 8.41529640191736e-06,
      "loss": 0.1359,
      "step": 382000
    },
    {
      "epoch": 23.21,
      "learning_rate": 8.400127419452704e-06,
      "loss": 0.1318,
      "step": 382500
    },
    {
      "epoch": 23.24,
      "learning_rate": 8.384958436988048e-06,
      "loss": 0.1335,
      "step": 383000
    },
    {
      "epoch": 23.27,
      "learning_rate": 8.369789454523391e-06,
      "loss": 0.1354,
      "step": 383500
    },
    {
      "epoch": 23.3,
      "learning_rate": 8.354620472058735e-06,
      "loss": 0.1351,
      "step": 384000
    },
    {
      "epoch": 23.33,
      "learning_rate": 8.33945148959408e-06,
      "loss": 0.1377,
      "step": 384500
    },
    {
      "epoch": 23.36,
      "learning_rate": 8.324312845094352e-06,
      "loss": 0.1367,
      "step": 385000
    },
    {
      "epoch": 23.39,
      "learning_rate": 8.309143862629694e-06,
      "loss": 0.1356,
      "step": 385500
    },
    {
      "epoch": 23.42,
      "learning_rate": 8.293974880165039e-06,
      "loss": 0.1352,
      "step": 386000
    },
    {
      "epoch": 23.45,
      "learning_rate": 8.278805897700383e-06,
      "loss": 0.1365,
      "step": 386500
    },
    {
      "epoch": 23.48,
      "learning_rate": 8.263636915235727e-06,
      "loss": 0.136,
      "step": 387000
    },
    {
      "epoch": 23.51,
      "learning_rate": 8.248467932771071e-06,
      "loss": 0.1374,
      "step": 387500
    },
    {
      "epoch": 23.54,
      "learning_rate": 8.233329288271344e-06,
      "loss": 0.1346,
      "step": 388000
    },
    {
      "epoch": 23.57,
      "learning_rate": 8.218160305806688e-06,
      "loss": 0.1364,
      "step": 388500
    },
    {
      "epoch": 23.6,
      "learning_rate": 8.20299132334203e-06,
      "loss": 0.1356,
      "step": 389000
    },
    {
      "epoch": 23.63,
      "learning_rate": 8.187822340877374e-06,
      "loss": 0.1349,
      "step": 389500
    },
    {
      "epoch": 23.66,
      "learning_rate": 8.172653358412719e-06,
      "loss": 0.1357,
      "step": 390000
    },
    {
      "epoch": 23.69,
      "learning_rate": 8.157514713912991e-06,
      "loss": 0.136,
      "step": 390500
    },
    {
      "epoch": 23.72,
      "learning_rate": 8.142345731448335e-06,
      "loss": 0.1334,
      "step": 391000
    },
    {
      "epoch": 23.75,
      "learning_rate": 8.127207086948608e-06,
      "loss": 0.1347,
      "step": 391500
    },
    {
      "epoch": 23.78,
      "learning_rate": 8.112038104483952e-06,
      "loss": 0.1359,
      "step": 392000
    },
    {
      "epoch": 23.82,
      "learning_rate": 8.096869122019295e-06,
      "loss": 0.1347,
      "step": 392500
    },
    {
      "epoch": 23.85,
      "learning_rate": 8.081700139554639e-06,
      "loss": 0.1378,
      "step": 393000
    },
    {
      "epoch": 23.88,
      "learning_rate": 8.066531157089983e-06,
      "loss": 0.1332,
      "step": 393500
    },
    {
      "epoch": 23.91,
      "learning_rate": 8.051362174625327e-06,
      "loss": 0.1352,
      "step": 394000
    },
    {
      "epoch": 23.94,
      "learning_rate": 8.036193192160671e-06,
      "loss": 0.1326,
      "step": 394500
    },
    {
      "epoch": 23.97,
      "learning_rate": 8.021024209696014e-06,
      "loss": 0.1347,
      "step": 395000
    },
    {
      "epoch": 24.0,
      "learning_rate": 8.005855227231358e-06,
      "loss": 0.1359,
      "step": 395500
    },
    {
      "epoch": 24.0,
      "eval_bleu": 81.0343,
      "eval_gen_len": 14.0796,
      "eval_loss": 0.16283883154392242,
      "eval_runtime": 168.3093,
      "eval_samples_per_second": 95.8,
      "eval_steps_per_second": 2.994,
      "step": 395544
    },
    {
      "epoch": 24.03,
      "learning_rate": 7.990716582731632e-06,
      "loss": 0.1295,
      "step": 396000
    },
    {
      "epoch": 24.06,
      "learning_rate": 7.975547600266975e-06,
      "loss": 0.1321,
      "step": 396500
    },
    {
      "epoch": 24.09,
      "learning_rate": 7.960378617802319e-06,
      "loss": 0.1309,
      "step": 397000
    },
    {
      "epoch": 24.12,
      "learning_rate": 7.945209635337661e-06,
      "loss": 0.1327,
      "step": 397500
    },
    {
      "epoch": 24.15,
      "learning_rate": 7.930070990837936e-06,
      "loss": 0.1325,
      "step": 398000
    },
    {
      "epoch": 24.18,
      "learning_rate": 7.914902008373278e-06,
      "loss": 0.1309,
      "step": 398500
    },
    {
      "epoch": 24.21,
      "learning_rate": 7.899733025908622e-06,
      "loss": 0.1318,
      "step": 399000
    },
    {
      "epoch": 24.24,
      "learning_rate": 7.884564043443966e-06,
      "loss": 0.1297,
      "step": 399500
    },
    {
      "epoch": 24.27,
      "learning_rate": 7.86939506097931e-06,
      "loss": 0.1364,
      "step": 400000
    },
    {
      "epoch": 24.3,
      "learning_rate": 7.854226078514655e-06,
      "loss": 0.1321,
      "step": 400500
    },
    {
      "epoch": 24.33,
      "learning_rate": 7.839057096049997e-06,
      "loss": 0.136,
      "step": 401000
    },
    {
      "epoch": 24.36,
      "learning_rate": 7.823888113585341e-06,
      "loss": 0.1332,
      "step": 401500
    },
    {
      "epoch": 24.39,
      "learning_rate": 7.808719131120686e-06,
      "loss": 0.1324,
      "step": 402000
    },
    {
      "epoch": 24.42,
      "learning_rate": 7.793550148656028e-06,
      "loss": 0.1347,
      "step": 402500
    },
    {
      "epoch": 24.45,
      "learning_rate": 7.778381166191372e-06,
      "loss": 0.1343,
      "step": 403000
    },
    {
      "epoch": 24.48,
      "learning_rate": 7.763212183726716e-06,
      "loss": 0.1366,
      "step": 403500
    },
    {
      "epoch": 24.51,
      "learning_rate": 7.748073539226989e-06,
      "loss": 0.1346,
      "step": 404000
    },
    {
      "epoch": 24.54,
      "learning_rate": 7.732934894727261e-06,
      "loss": 0.1348,
      "step": 404500
    },
    {
      "epoch": 24.57,
      "learning_rate": 7.717765912262606e-06,
      "loss": 0.1361,
      "step": 405000
    },
    {
      "epoch": 24.6,
      "learning_rate": 7.70259692979795e-06,
      "loss": 0.1354,
      "step": 405500
    },
    {
      "epoch": 24.63,
      "learning_rate": 7.687427947333294e-06,
      "loss": 0.1327,
      "step": 406000
    },
    {
      "epoch": 24.66,
      "learning_rate": 7.672289302833567e-06,
      "loss": 0.1342,
      "step": 406500
    },
    {
      "epoch": 24.7,
      "learning_rate": 7.65712032036891e-06,
      "loss": 0.1314,
      "step": 407000
    },
    {
      "epoch": 24.73,
      "learning_rate": 7.641951337904255e-06,
      "loss": 0.1329,
      "step": 407500
    },
    {
      "epoch": 24.76,
      "learning_rate": 7.626782355439598e-06,
      "loss": 0.1357,
      "step": 408000
    },
    {
      "epoch": 24.79,
      "learning_rate": 7.611613372974942e-06,
      "loss": 0.1345,
      "step": 408500
    },
    {
      "epoch": 24.82,
      "learning_rate": 7.596444390510285e-06,
      "loss": 0.1316,
      "step": 409000
    },
    {
      "epoch": 24.85,
      "learning_rate": 7.581275408045628e-06,
      "loss": 0.1354,
      "step": 409500
    },
    {
      "epoch": 24.88,
      "learning_rate": 7.5661064255809725e-06,
      "loss": 0.1365,
      "step": 410000
    },
    {
      "epoch": 24.91,
      "learning_rate": 7.550937443116317e-06,
      "loss": 0.1334,
      "step": 410500
    },
    {
      "epoch": 24.94,
      "learning_rate": 7.53576846065166e-06,
      "loss": 0.134,
      "step": 411000
    },
    {
      "epoch": 24.97,
      "learning_rate": 7.520629816151933e-06,
      "loss": 0.1316,
      "step": 411500
    },
    {
      "epoch": 25.0,
      "learning_rate": 7.505460833687277e-06,
      "loss": 0.131,
      "step": 412000
    },
    {
      "epoch": 25.0,
      "eval_bleu": 81.0024,
      "eval_gen_len": 14.078,
      "eval_loss": 0.16371172666549683,
      "eval_runtime": 168.3117,
      "eval_samples_per_second": 95.798,
      "eval_steps_per_second": 2.994,
      "step": 412025
    },
    {
      "epoch": 25.03,
      "learning_rate": 7.490291851222621e-06,
      "loss": 0.1291,
      "step": 412500
    },
    {
      "epoch": 25.06,
      "learning_rate": 7.475122868757965e-06,
      "loss": 0.1311,
      "step": 413000
    },
    {
      "epoch": 25.09,
      "learning_rate": 7.459953886293308e-06,
      "loss": 0.1326,
      "step": 413500
    },
    {
      "epoch": 25.12,
      "learning_rate": 7.444815241793582e-06,
      "loss": 0.1298,
      "step": 414000
    },
    {
      "epoch": 25.15,
      "learning_rate": 7.429646259328925e-06,
      "loss": 0.1309,
      "step": 414500
    },
    {
      "epoch": 25.18,
      "learning_rate": 7.4144772768642684e-06,
      "loss": 0.1319,
      "step": 415000
    },
    {
      "epoch": 25.21,
      "learning_rate": 7.399308294399612e-06,
      "loss": 0.1289,
      "step": 415500
    },
    {
      "epoch": 25.24,
      "learning_rate": 7.384139311934956e-06,
      "loss": 0.1313,
      "step": 416000
    },
    {
      "epoch": 25.27,
      "learning_rate": 7.3690006674352285e-06,
      "loss": 0.1304,
      "step": 416500
    },
    {
      "epoch": 25.3,
      "learning_rate": 7.353831684970573e-06,
      "loss": 0.1367,
      "step": 417000
    },
    {
      "epoch": 25.33,
      "learning_rate": 7.338662702505917e-06,
      "loss": 0.1327,
      "step": 417500
    },
    {
      "epoch": 25.36,
      "learning_rate": 7.32349372004126e-06,
      "loss": 0.1341,
      "step": 418000
    },
    {
      "epoch": 25.39,
      "learning_rate": 7.3083550755415335e-06,
      "loss": 0.1299,
      "step": 418500
    },
    {
      "epoch": 25.42,
      "learning_rate": 7.293186093076877e-06,
      "loss": 0.1322,
      "step": 419000
    },
    {
      "epoch": 25.45,
      "learning_rate": 7.278017110612221e-06,
      "loss": 0.1302,
      "step": 419500
    },
    {
      "epoch": 25.48,
      "learning_rate": 7.262848128147565e-06,
      "loss": 0.1285,
      "step": 420000
    },
    {
      "epoch": 25.51,
      "learning_rate": 7.247679145682908e-06,
      "loss": 0.1315,
      "step": 420500
    },
    {
      "epoch": 25.54,
      "learning_rate": 7.232510163218251e-06,
      "loss": 0.1329,
      "step": 421000
    },
    {
      "epoch": 25.57,
      "learning_rate": 7.217341180753595e-06,
      "loss": 0.1322,
      "step": 421500
    },
    {
      "epoch": 25.61,
      "learning_rate": 7.2021721982889395e-06,
      "loss": 0.1278,
      "step": 422000
    },
    {
      "epoch": 25.64,
      "learning_rate": 7.187033553789212e-06,
      "loss": 0.1288,
      "step": 422500
    },
    {
      "epoch": 25.67,
      "learning_rate": 7.171864571324556e-06,
      "loss": 0.1339,
      "step": 423000
    },
    {
      "epoch": 25.7,
      "learning_rate": 7.156725926824829e-06,
      "loss": 0.1319,
      "step": 423500
    },
    {
      "epoch": 25.73,
      "learning_rate": 7.141556944360173e-06,
      "loss": 0.1299,
      "step": 424000
    },
    {
      "epoch": 25.76,
      "learning_rate": 7.126387961895517e-06,
      "loss": 0.1321,
      "step": 424500
    },
    {
      "epoch": 25.79,
      "learning_rate": 7.11121897943086e-06,
      "loss": 0.131,
      "step": 425000
    },
    {
      "epoch": 25.82,
      "learning_rate": 7.096080334931134e-06,
      "loss": 0.1315,
      "step": 425500
    },
    {
      "epoch": 25.85,
      "learning_rate": 7.080911352466477e-06,
      "loss": 0.1305,
      "step": 426000
    },
    {
      "epoch": 25.88,
      "learning_rate": 7.065742370001821e-06,
      "loss": 0.1303,
      "step": 426500
    },
    {
      "epoch": 25.91,
      "learning_rate": 7.0505733875371654e-06,
      "loss": 0.1327,
      "step": 427000
    },
    {
      "epoch": 25.94,
      "learning_rate": 7.035404405072508e-06,
      "loss": 0.1303,
      "step": 427500
    },
    {
      "epoch": 25.97,
      "learning_rate": 7.0202657605727804e-06,
      "loss": 0.1306,
      "step": 428000
    },
    {
      "epoch": 26.0,
      "learning_rate": 7.005096778108125e-06,
      "loss": 0.1325,
      "step": 428500
    },
    {
      "epoch": 26.0,
      "eval_bleu": 81.0978,
      "eval_gen_len": 14.0985,
      "eval_loss": 0.16260042786598206,
      "eval_runtime": 168.279,
      "eval_samples_per_second": 95.817,
      "eval_steps_per_second": 2.995,
      "step": 428506
    },
    {
      "epoch": 26.03,
      "learning_rate": 6.989927795643469e-06,
      "loss": 0.1257,
      "step": 429000
    },
    {
      "epoch": 26.06,
      "learning_rate": 6.974758813178812e-06,
      "loss": 0.1238,
      "step": 429500
    },
    {
      "epoch": 26.09,
      "learning_rate": 6.959589830714156e-06,
      "loss": 0.1316,
      "step": 430000
    },
    {
      "epoch": 26.12,
      "learning_rate": 6.944451186214429e-06,
      "loss": 0.1319,
      "step": 430500
    },
    {
      "epoch": 26.15,
      "learning_rate": 6.929282203749773e-06,
      "loss": 0.1305,
      "step": 431000
    },
    {
      "epoch": 26.18,
      "learning_rate": 6.914113221285117e-06,
      "loss": 0.1303,
      "step": 431500
    },
    {
      "epoch": 26.21,
      "learning_rate": 6.8989442388204606e-06,
      "loss": 0.1297,
      "step": 432000
    },
    {
      "epoch": 26.24,
      "learning_rate": 6.883835932285663e-06,
      "loss": 0.1284,
      "step": 432500
    },
    {
      "epoch": 26.27,
      "learning_rate": 6.8686669498210064e-06,
      "loss": 0.132,
      "step": 433000
    },
    {
      "epoch": 26.3,
      "learning_rate": 6.853497967356351e-06,
      "loss": 0.1277,
      "step": 433500
    },
    {
      "epoch": 26.33,
      "learning_rate": 6.838328984891695e-06,
      "loss": 0.1302,
      "step": 434000
    },
    {
      "epoch": 26.36,
      "learning_rate": 6.823160002427037e-06,
      "loss": 0.1287,
      "step": 434500
    },
    {
      "epoch": 26.39,
      "learning_rate": 6.8079910199623815e-06,
      "loss": 0.1277,
      "step": 435000
    },
    {
      "epoch": 26.42,
      "learning_rate": 6.792822037497725e-06,
      "loss": 0.128,
      "step": 435500
    },
    {
      "epoch": 26.45,
      "learning_rate": 6.777653055033069e-06,
      "loss": 0.1283,
      "step": 436000
    },
    {
      "epoch": 26.49,
      "learning_rate": 6.762484072568412e-06,
      "loss": 0.1314,
      "step": 436500
    },
    {
      "epoch": 26.52,
      "learning_rate": 6.7473150901037565e-06,
      "loss": 0.1307,
      "step": 437000
    },
    {
      "epoch": 26.55,
      "learning_rate": 6.73217644560403e-06,
      "loss": 0.1316,
      "step": 437500
    },
    {
      "epoch": 26.58,
      "learning_rate": 6.717007463139373e-06,
      "loss": 0.1291,
      "step": 438000
    },
    {
      "epoch": 26.61,
      "learning_rate": 6.701838480674717e-06,
      "loss": 0.1313,
      "step": 438500
    },
    {
      "epoch": 26.64,
      "learning_rate": 6.686669498210061e-06,
      "loss": 0.1282,
      "step": 439000
    },
    {
      "epoch": 26.67,
      "learning_rate": 6.671530853710334e-06,
      "loss": 0.1304,
      "step": 439500
    },
    {
      "epoch": 26.7,
      "learning_rate": 6.656361871245678e-06,
      "loss": 0.1272,
      "step": 440000
    },
    {
      "epoch": 26.73,
      "learning_rate": 6.641192888781021e-06,
      "loss": 0.1255,
      "step": 440500
    },
    {
      "epoch": 26.76,
      "learning_rate": 6.626023906316364e-06,
      "loss": 0.1308,
      "step": 441000
    },
    {
      "epoch": 26.79,
      "learning_rate": 6.610854923851708e-06,
      "loss": 0.1294,
      "step": 441500
    },
    {
      "epoch": 26.82,
      "learning_rate": 6.5956859413870525e-06,
      "loss": 0.1313,
      "step": 442000
    },
    {
      "epoch": 26.85,
      "learning_rate": 6.580516958922396e-06,
      "loss": 0.1313,
      "step": 442500
    },
    {
      "epoch": 26.88,
      "learning_rate": 6.56534797645774e-06,
      "loss": 0.1279,
      "step": 443000
    },
    {
      "epoch": 26.91,
      "learning_rate": 6.550178993993083e-06,
      "loss": 0.1289,
      "step": 443500
    },
    {
      "epoch": 26.94,
      "learning_rate": 6.535070687458286e-06,
      "loss": 0.1302,
      "step": 444000
    },
    {
      "epoch": 26.97,
      "learning_rate": 6.51990170499363e-06,
      "loss": 0.1308,
      "step": 444500
    },
    {
      "epoch": 27.0,
      "eval_bleu": 81.1159,
      "eval_gen_len": 14.0921,
      "eval_loss": 0.16248230636119843,
      "eval_runtime": 170.0823,
      "eval_samples_per_second": 94.801,
      "eval_steps_per_second": 2.963,
      "step": 444987
    },
    {
      "epoch": 27.0,
      "learning_rate": 6.504732722528973e-06,
      "loss": 0.1315,
      "step": 445000
    },
    {
      "epoch": 27.03,
      "learning_rate": 1.3244781870032159e-05,
      "loss": 0.1289,
      "step": 445500
    },
    {
      "epoch": 27.06,
      "learning_rate": 1.3237197378799832e-05,
      "loss": 0.127,
      "step": 446000
    },
    {
      "epoch": 27.09,
      "learning_rate": 1.3229612887567503e-05,
      "loss": 0.1293,
      "step": 446500
    },
    {
      "epoch": 27.12,
      "learning_rate": 1.3222028396335176e-05,
      "loss": 0.13,
      "step": 447000
    },
    {
      "epoch": 27.15,
      "learning_rate": 1.3214443905102847e-05,
      "loss": 0.132,
      "step": 447500
    },
    {
      "epoch": 27.18,
      "learning_rate": 1.3206859413870518e-05,
      "loss": 0.1298,
      "step": 448000
    },
    {
      "epoch": 27.21,
      "learning_rate": 1.319930526060312e-05,
      "loss": 0.1287,
      "step": 448500
    },
    {
      "epoch": 27.24,
      "learning_rate": 1.3191720769370793e-05,
      "loss": 0.131,
      "step": 449000
    },
    {
      "epoch": 27.27,
      "learning_rate": 1.3184136278138464e-05,
      "loss": 0.1299,
      "step": 449500
    },
    {
      "epoch": 27.3,
      "learning_rate": 1.3176551786906135e-05,
      "loss": 0.1285,
      "step": 450000
    },
    {
      "epoch": 27.33,
      "learning_rate": 1.3168967295673806e-05,
      "loss": 0.1283,
      "step": 450500
    },
    {
      "epoch": 27.36,
      "learning_rate": 1.3161382804441478e-05,
      "loss": 0.1282,
      "step": 451000
    },
    {
      "epoch": 27.4,
      "learning_rate": 1.3153798313209152e-05,
      "loss": 0.1314,
      "step": 451500
    },
    {
      "epoch": 27.43,
      "learning_rate": 1.3146213821976823e-05,
      "loss": 0.1305,
      "step": 452000
    },
    {
      "epoch": 27.46,
      "learning_rate": 1.3138629330744495e-05,
      "loss": 0.1315,
      "step": 452500
    },
    {
      "epoch": 27.49,
      "learning_rate": 1.3131044839512166e-05,
      "loss": 0.1289,
      "step": 453000
    },
    {
      "epoch": 27.52,
      "learning_rate": 1.3123460348279839e-05,
      "loss": 0.1283,
      "step": 453500
    },
    {
      "epoch": 27.55,
      "learning_rate": 1.311587585704751e-05,
      "loss": 0.1302,
      "step": 454000
    },
    {
      "epoch": 27.58,
      "learning_rate": 1.3108306534797647e-05,
      "loss": 0.1299,
      "step": 454500
    },
    {
      "epoch": 27.61,
      "learning_rate": 1.3100722043565318e-05,
      "loss": 0.1259,
      "step": 455000
    },
    {
      "epoch": 27.64,
      "learning_rate": 1.3093152721315456e-05,
      "loss": 0.1309,
      "step": 455500
    },
    {
      "epoch": 27.67,
      "learning_rate": 1.3085568230083129e-05,
      "loss": 0.1307,
      "step": 456000
    },
    {
      "epoch": 27.7,
      "learning_rate": 1.30779837388508e-05,
      "loss": 0.1298,
      "step": 456500
    },
    {
      "epoch": 27.73,
      "learning_rate": 1.3070399247618471e-05,
      "loss": 0.1303,
      "step": 457000
    },
    {
      "epoch": 27.76,
      "learning_rate": 1.3062814756386142e-05,
      "loss": 0.1308,
      "step": 457500
    },
    {
      "epoch": 27.79,
      "learning_rate": 1.3055230265153815e-05,
      "loss": 0.1297,
      "step": 458000
    },
    {
      "epoch": 27.82,
      "learning_rate": 1.3047645773921486e-05,
      "loss": 0.1306,
      "step": 458500
    },
    {
      "epoch": 27.85,
      "learning_rate": 1.3040076451671624e-05,
      "loss": 0.1315,
      "step": 459000
    },
    {
      "epoch": 27.88,
      "learning_rate": 1.3032491960439295e-05,
      "loss": 0.1326,
      "step": 459500
    },
    {
      "epoch": 27.91,
      "learning_rate": 1.3024907469206966e-05,
      "loss": 0.1303,
      "step": 460000
    },
    {
      "epoch": 27.94,
      "learning_rate": 1.3017322977974637e-05,
      "loss": 0.1307,
      "step": 460500
    },
    {
      "epoch": 27.97,
      "learning_rate": 1.3009738486742309e-05,
      "loss": 0.1278,
      "step": 461000
    },
    {
      "epoch": 28.0,
      "eval_bleu": 81.1163,
      "eval_gen_len": 14.0657,
      "eval_loss": 0.16175536811351776,
      "eval_runtime": 180.1879,
      "eval_samples_per_second": 89.484,
      "eval_steps_per_second": 2.797,
      "step": 461468
    },
    {
      "epoch": 28.0,
      "learning_rate": 1.3002153995509983e-05,
      "loss": 0.1301,
      "step": 461500
    },
    {
      "epoch": 28.03,
      "learning_rate": 1.2994569504277654e-05,
      "loss": 0.128,
      "step": 462000
    },
    {
      "epoch": 28.06,
      "learning_rate": 1.2986985013045326e-05,
      "loss": 0.1277,
      "step": 462500
    },
    {
      "epoch": 28.09,
      "learning_rate": 1.2979415690795463e-05,
      "loss": 0.1279,
      "step": 463000
    },
    {
      "epoch": 28.12,
      "learning_rate": 1.29718463685456e-05,
      "loss": 0.1274,
      "step": 463500
    },
    {
      "epoch": 28.15,
      "learning_rate": 1.2964261877313271e-05,
      "loss": 0.1287,
      "step": 464000
    },
    {
      "epoch": 28.18,
      "learning_rate": 1.2956677386080942e-05,
      "loss": 0.124,
      "step": 464500
    },
    {
      "epoch": 28.21,
      "learning_rate": 1.2949092894848614e-05,
      "loss": 0.1281,
      "step": 465000
    },
    {
      "epoch": 28.24,
      "learning_rate": 1.2941508403616288e-05,
      "loss": 0.1265,
      "step": 465500
    },
    {
      "epoch": 28.27,
      "learning_rate": 1.293392391238396e-05,
      "loss": 0.1277,
      "step": 466000
    },
    {
      "epoch": 28.31,
      "learning_rate": 1.292633942115163e-05,
      "loss": 0.1294,
      "step": 466500
    },
    {
      "epoch": 28.34,
      "learning_rate": 1.2918754929919302e-05,
      "loss": 0.1259,
      "step": 467000
    },
    {
      "epoch": 28.37,
      "learning_rate": 1.2911185607669439e-05,
      "loss": 0.1259,
      "step": 467500
    },
    {
      "epoch": 28.4,
      "learning_rate": 1.290360111643711e-05,
      "loss": 0.1273,
      "step": 468000
    },
    {
      "epoch": 28.43,
      "learning_rate": 1.2896016625204782e-05,
      "loss": 0.1297,
      "step": 468500
    },
    {
      "epoch": 28.46,
      "learning_rate": 1.2888432133972455e-05,
      "loss": 0.1271,
      "step": 469000
    },
    {
      "epoch": 28.49,
      "learning_rate": 1.2880847642740126e-05,
      "loss": 0.126,
      "step": 469500
    },
    {
      "epoch": 28.52,
      "learning_rate": 1.2873263151507797e-05,
      "loss": 0.1317,
      "step": 470000
    },
    {
      "epoch": 28.55,
      "learning_rate": 1.2865678660275468e-05,
      "loss": 0.1267,
      "step": 470500
    },
    {
      "epoch": 28.58,
      "learning_rate": 1.2858109338025605e-05,
      "loss": 0.1259,
      "step": 471000
    },
    {
      "epoch": 28.61,
      "learning_rate": 1.2850524846793278e-05,
      "loss": 0.1288,
      "step": 471500
    },
    {
      "epoch": 28.64,
      "learning_rate": 1.2842940355560951e-05,
      "loss": 0.1264,
      "step": 472000
    },
    {
      "epoch": 28.67,
      "learning_rate": 1.2835355864328622e-05,
      "loss": 0.1278,
      "step": 472500
    },
    {
      "epoch": 28.7,
      "learning_rate": 1.2827771373096294e-05,
      "loss": 0.1289,
      "step": 473000
    },
    {
      "epoch": 28.73,
      "learning_rate": 1.282020205084643e-05,
      "loss": 0.128,
      "step": 473500
    },
    {
      "epoch": 28.76,
      "learning_rate": 1.2812617559614102e-05,
      "loss": 0.1254,
      "step": 474000
    },
    {
      "epoch": 28.79,
      "learning_rate": 1.2805033068381773e-05,
      "loss": 0.1273,
      "step": 474500
    },
    {
      "epoch": 28.82,
      "learning_rate": 1.2797448577149445e-05,
      "loss": 0.1245,
      "step": 475000
    },
    {
      "epoch": 28.85,
      "learning_rate": 1.278986408591712e-05,
      "loss": 0.1278,
      "step": 475500
    },
    {
      "epoch": 28.88,
      "learning_rate": 1.278227959468479e-05,
      "loss": 0.1289,
      "step": 476000
    },
    {
      "epoch": 28.91,
      "learning_rate": 1.2774710272434928e-05,
      "loss": 0.1273,
      "step": 476500
    },
    {
      "epoch": 28.94,
      "learning_rate": 1.2767125781202599e-05,
      "loss": 0.1283,
      "step": 477000
    },
    {
      "epoch": 28.97,
      "learning_rate": 1.275954128997027e-05,
      "loss": 0.1317,
      "step": 477500
    },
    {
      "epoch": 29.0,
      "eval_bleu": 81.0592,
      "eval_gen_len": 14.0958,
      "eval_loss": 0.163426473736763,
      "eval_runtime": 179.0747,
      "eval_samples_per_second": 90.041,
      "eval_steps_per_second": 2.814,
      "step": 477949
    },
    {
      "epoch": 29.0,
      "learning_rate": 1.2751956798737941e-05,
      "loss": 0.1268,
      "step": 478000
    },
    {
      "epoch": 29.03,
      "learning_rate": 1.2744372307505613e-05,
      "loss": 0.1252,
      "step": 478500
    },
    {
      "epoch": 29.06,
      "learning_rate": 1.2736787816273285e-05,
      "loss": 0.1219,
      "step": 479000
    },
    {
      "epoch": 29.09,
      "learning_rate": 1.2729203325040957e-05,
      "loss": 0.1253,
      "step": 479500
    },
    {
      "epoch": 29.12,
      "learning_rate": 1.2721634002791094e-05,
      "loss": 0.1198,
      "step": 480000
    },
    {
      "epoch": 29.15,
      "learning_rate": 1.2714049511558765e-05,
      "loss": 0.124,
      "step": 480500
    },
    {
      "epoch": 29.19,
      "learning_rate": 1.2706480189308902e-05,
      "loss": 0.1242,
      "step": 481000
    },
    {
      "epoch": 29.22,
      "learning_rate": 1.2698895698076575e-05,
      "loss": 0.1247,
      "step": 481500
    },
    {
      "epoch": 29.25,
      "learning_rate": 1.2691311206844246e-05,
      "loss": 0.1254,
      "step": 482000
    },
    {
      "epoch": 29.28,
      "learning_rate": 1.2683741884594383e-05,
      "loss": 0.1258,
      "step": 482500
    },
    {
      "epoch": 29.31,
      "learning_rate": 1.2676157393362055e-05,
      "loss": 0.1269,
      "step": 483000
    },
    {
      "epoch": 29.34,
      "learning_rate": 1.2668572902129726e-05,
      "loss": 0.1234,
      "step": 483500
    },
    {
      "epoch": 29.37,
      "learning_rate": 1.2660988410897399e-05,
      "loss": 0.1262,
      "step": 484000
    },
    {
      "epoch": 29.4,
      "learning_rate": 1.265340391966507e-05,
      "loss": 0.1248,
      "step": 484500
    },
    {
      "epoch": 29.43,
      "learning_rate": 1.2645819428432741e-05,
      "loss": 0.1247,
      "step": 485000
    },
    {
      "epoch": 29.46,
      "learning_rate": 1.2638234937200413e-05,
      "loss": 0.127,
      "step": 485500
    },
    {
      "epoch": 29.49,
      "learning_rate": 1.2630650445968084e-05,
      "loss": 0.1259,
      "step": 486000
    },
    {
      "epoch": 29.52,
      "learning_rate": 1.2623065954735759e-05,
      "loss": 0.1265,
      "step": 486500
    },
    {
      "epoch": 29.55,
      "learning_rate": 1.2615496632485892e-05,
      "loss": 0.1249,
      "step": 487000
    },
    {
      "epoch": 29.58,
      "learning_rate": 1.2607912141253567e-05,
      "loss": 0.1268,
      "step": 487500
    },
    {
      "epoch": 29.61,
      "learning_rate": 1.2600327650021238e-05,
      "loss": 0.1249,
      "step": 488000
    },
    {
      "epoch": 29.64,
      "learning_rate": 1.259274315878891e-05,
      "loss": 0.1256,
      "step": 488500
    },
    {
      "epoch": 29.67,
      "learning_rate": 1.258515866755658e-05,
      "loss": 0.1258,
      "step": 489000
    },
    {
      "epoch": 29.7,
      "learning_rate": 1.2577574176324254e-05,
      "loss": 0.1274,
      "step": 489500
    },
    {
      "epoch": 29.73,
      "learning_rate": 1.2569989685091926e-05,
      "loss": 0.1253,
      "step": 490000
    },
    {
      "epoch": 29.76,
      "learning_rate": 1.2562405193859598e-05,
      "loss": 0.1274,
      "step": 490500
    },
    {
      "epoch": 29.79,
      "learning_rate": 1.2554820702627269e-05,
      "loss": 0.1259,
      "step": 491000
    },
    {
      "epoch": 29.82,
      "learning_rate": 1.254723621139494e-05,
      "loss": 0.1251,
      "step": 491500
    },
    {
      "epoch": 29.85,
      "learning_rate": 1.2539666889145077e-05,
      "loss": 0.1261,
      "step": 492000
    },
    {
      "epoch": 29.88,
      "learning_rate": 1.2532082397912749e-05,
      "loss": 0.1282,
      "step": 492500
    },
    {
      "epoch": 29.91,
      "learning_rate": 1.2524497906680421e-05,
      "loss": 0.126,
      "step": 493000
    },
    {
      "epoch": 29.94,
      "learning_rate": 1.2516913415448093e-05,
      "loss": 0.1266,
      "step": 493500
    },
    {
      "epoch": 29.97,
      "learning_rate": 1.2509328924215764e-05,
      "loss": 0.1266,
      "step": 494000
    },
    {
      "epoch": 30.0,
      "eval_bleu": 81.1592,
      "eval_gen_len": 14.0861,
      "eval_loss": 0.16239352524280548,
      "eval_runtime": 179.0019,
      "eval_samples_per_second": 90.077,
      "eval_steps_per_second": 2.816,
      "step": 494430
    },
    {
      "epoch": 30.0,
      "learning_rate": 1.2501759601965901e-05,
      "loss": 0.1257,
      "step": 494500
    },
    {
      "epoch": 30.03,
      "learning_rate": 1.2494175110733572e-05,
      "loss": 0.1209,
      "step": 495000
    },
    {
      "epoch": 30.06,
      "learning_rate": 1.2486590619501244e-05,
      "loss": 0.1227,
      "step": 495500
    },
    {
      "epoch": 30.1,
      "learning_rate": 1.2479006128268915e-05,
      "loss": 0.1234,
      "step": 496000
    },
    {
      "epoch": 30.13,
      "learning_rate": 1.247142163703659e-05,
      "loss": 0.1218,
      "step": 496500
    },
    {
      "epoch": 30.16,
      "learning_rate": 1.2463852314786725e-05,
      "loss": 0.1228,
      "step": 497000
    },
    {
      "epoch": 30.19,
      "learning_rate": 1.2456267823554398e-05,
      "loss": 0.1226,
      "step": 497500
    },
    {
      "epoch": 30.22,
      "learning_rate": 1.2448683332322069e-05,
      "loss": 0.122,
      "step": 498000
    },
    {
      "epoch": 30.25,
      "learning_rate": 1.244109884108974e-05,
      "loss": 0.1225,
      "step": 498500
    },
    {
      "epoch": 30.28,
      "learning_rate": 1.2433514349857412e-05,
      "loss": 0.1223,
      "step": 499000
    },
    {
      "epoch": 30.31,
      "learning_rate": 1.2425945027607549e-05,
      "loss": 0.1232,
      "step": 499500
    },
    {
      "epoch": 30.34,
      "learning_rate": 1.241836053637522e-05,
      "loss": 0.1228,
      "step": 500000
    },
    {
      "epoch": 30.37,
      "learning_rate": 1.2410776045142895e-05,
      "loss": 0.1199,
      "step": 500500
    },
    {
      "epoch": 30.4,
      "learning_rate": 1.2403191553910566e-05,
      "loss": 0.1235,
      "step": 501000
    },
    {
      "epoch": 30.43,
      "learning_rate": 1.2395607062678237e-05,
      "loss": 0.1229,
      "step": 501500
    },
    {
      "epoch": 30.46,
      "learning_rate": 1.2388037740428374e-05,
      "loss": 0.1222,
      "step": 502000
    },
    {
      "epoch": 30.49,
      "learning_rate": 1.2380453249196045e-05,
      "loss": 0.121,
      "step": 502500
    },
    {
      "epoch": 30.52,
      "learning_rate": 1.2372868757963717e-05,
      "loss": 0.1235,
      "step": 503000
    },
    {
      "epoch": 30.55,
      "learning_rate": 1.2365284266731388e-05,
      "loss": 0.1218,
      "step": 503500
    },
    {
      "epoch": 30.58,
      "learning_rate": 1.235769977549906e-05,
      "loss": 0.1248,
      "step": 504000
    },
    {
      "epoch": 30.61,
      "learning_rate": 1.2350115284266732e-05,
      "loss": 0.1224,
      "step": 504500
    },
    {
      "epoch": 30.64,
      "learning_rate": 1.2342530793034403e-05,
      "loss": 0.1252,
      "step": 505000
    },
    {
      "epoch": 30.67,
      "learning_rate": 1.233496147078454e-05,
      "loss": 0.122,
      "step": 505500
    },
    {
      "epoch": 30.7,
      "learning_rate": 1.2327376979552212e-05,
      "loss": 0.1234,
      "step": 506000
    },
    {
      "epoch": 30.73,
      "learning_rate": 1.2319792488319885e-05,
      "loss": 0.1215,
      "step": 506500
    },
    {
      "epoch": 30.76,
      "learning_rate": 1.2312207997087558e-05,
      "loss": 0.1224,
      "step": 507000
    },
    {
      "epoch": 30.79,
      "learning_rate": 1.2304623505855229e-05,
      "loss": 0.1232,
      "step": 507500
    },
    {
      "epoch": 30.82,
      "learning_rate": 1.22970390146229e-05,
      "loss": 0.1266,
      "step": 508000
    },
    {
      "epoch": 30.85,
      "learning_rate": 1.2289454523390571e-05,
      "loss": 0.1274,
      "step": 508500
    },
    {
      "epoch": 30.88,
      "learning_rate": 1.2281870032158243e-05,
      "loss": 0.1242,
      "step": 509000
    },
    {
      "epoch": 30.91,
      "learning_rate": 1.227430070990838e-05,
      "loss": 0.1242,
      "step": 509500
    },
    {
      "epoch": 30.94,
      "learning_rate": 1.2266716218676051e-05,
      "loss": 0.1241,
      "step": 510000
    },
    {
      "epoch": 30.98,
      "learning_rate": 1.2259131727443725e-05,
      "loss": 0.1241,
      "step": 510500
    },
    {
      "epoch": 31.0,
      "eval_bleu": 81.1058,
      "eval_gen_len": 14.1131,
      "eval_loss": 0.16349713504314423,
      "eval_runtime": 179.2239,
      "eval_samples_per_second": 89.966,
      "eval_steps_per_second": 2.812,
      "step": 510911
    },
    {
      "epoch": 31.01,
      "learning_rate": 1.2251547236211397e-05,
      "loss": 0.1198,
      "step": 511000
    },
    {
      "epoch": 31.04,
      "learning_rate": 1.2243962744979068e-05,
      "loss": 0.1203,
      "step": 511500
    },
    {
      "epoch": 31.07,
      "learning_rate": 1.223637825374674e-05,
      "loss": 0.1183,
      "step": 512000
    },
    {
      "epoch": 31.1,
      "learning_rate": 1.2228808931496876e-05,
      "loss": 0.119,
      "step": 512500
    },
    {
      "epoch": 31.13,
      "learning_rate": 1.2221224440264548e-05,
      "loss": 0.1191,
      "step": 513000
    },
    {
      "epoch": 31.16,
      "learning_rate": 1.2213655118014685e-05,
      "loss": 0.12,
      "step": 513500
    },
    {
      "epoch": 31.19,
      "learning_rate": 1.2206070626782356e-05,
      "loss": 0.1192,
      "step": 514000
    },
    {
      "epoch": 31.22,
      "learning_rate": 1.2198486135550027e-05,
      "loss": 0.1182,
      "step": 514500
    },
    {
      "epoch": 31.25,
      "learning_rate": 1.21909016443177e-05,
      "loss": 0.1197,
      "step": 515000
    },
    {
      "epoch": 31.28,
      "learning_rate": 1.2183317153085373e-05,
      "loss": 0.1194,
      "step": 515500
    },
    {
      "epoch": 31.31,
      "learning_rate": 1.2175732661853044e-05,
      "loss": 0.1199,
      "step": 516000
    },
    {
      "epoch": 31.34,
      "learning_rate": 1.2168148170620716e-05,
      "loss": 0.1215,
      "step": 516500
    },
    {
      "epoch": 31.37,
      "learning_rate": 1.2160563679388388e-05,
      "loss": 0.1226,
      "step": 517000
    },
    {
      "epoch": 31.4,
      "learning_rate": 1.215297918815606e-05,
      "loss": 0.1214,
      "step": 517500
    },
    {
      "epoch": 31.43,
      "learning_rate": 1.2145409865906197e-05,
      "loss": 0.1203,
      "step": 518000
    },
    {
      "epoch": 31.46,
      "learning_rate": 1.2137825374673868e-05,
      "loss": 0.1202,
      "step": 518500
    },
    {
      "epoch": 31.49,
      "learning_rate": 1.213024088344154e-05,
      "loss": 0.1209,
      "step": 519000
    },
    {
      "epoch": 31.52,
      "learning_rate": 1.212265639220921e-05,
      "loss": 0.1223,
      "step": 519500
    },
    {
      "epoch": 31.55,
      "learning_rate": 1.2115071900976882e-05,
      "loss": 0.1221,
      "step": 520000
    },
    {
      "epoch": 31.58,
      "learning_rate": 1.2107487409744556e-05,
      "loss": 0.1204,
      "step": 520500
    },
    {
      "epoch": 31.61,
      "learning_rate": 1.2099902918512228e-05,
      "loss": 0.1206,
      "step": 521000
    },
    {
      "epoch": 31.64,
      "learning_rate": 1.2092318427279899e-05,
      "loss": 0.1194,
      "step": 521500
    },
    {
      "epoch": 31.67,
      "learning_rate": 1.2084749105030036e-05,
      "loss": 0.1212,
      "step": 522000
    },
    {
      "epoch": 31.7,
      "learning_rate": 1.2077164613797707e-05,
      "loss": 0.1207,
      "step": 522500
    },
    {
      "epoch": 31.73,
      "learning_rate": 1.2069580122565379e-05,
      "loss": 0.1173,
      "step": 523000
    },
    {
      "epoch": 31.76,
      "learning_rate": 1.2062010800315516e-05,
      "loss": 0.1198,
      "step": 523500
    },
    {
      "epoch": 31.79,
      "learning_rate": 1.2054426309083187e-05,
      "loss": 0.1219,
      "step": 524000
    },
    {
      "epoch": 31.82,
      "learning_rate": 1.204684181785086e-05,
      "loss": 0.122,
      "step": 524500
    },
    {
      "epoch": 31.85,
      "learning_rate": 1.2039257326618533e-05,
      "loss": 0.1208,
      "step": 525000
    },
    {
      "epoch": 31.89,
      "learning_rate": 1.2031672835386204e-05,
      "loss": 0.1227,
      "step": 525500
    },
    {
      "epoch": 31.92,
      "learning_rate": 1.2024088344153875e-05,
      "loss": 0.1218,
      "step": 526000
    },
    {
      "epoch": 31.95,
      "learning_rate": 1.2016503852921546e-05,
      "loss": 0.1238,
      "step": 526500
    },
    {
      "epoch": 31.98,
      "learning_rate": 1.2008934530671684e-05,
      "loss": 0.1233,
      "step": 527000
    },
    {
      "epoch": 32.0,
      "eval_bleu": 81.231,
      "eval_gen_len": 14.1063,
      "eval_loss": 0.162692591547966,
      "eval_runtime": 178.4186,
      "eval_samples_per_second": 90.372,
      "eval_steps_per_second": 2.825,
      "step": 527392
    },
    {
      "epoch": 32.01,
      "learning_rate": 1.2001350039439355e-05,
      "loss": 0.1201,
      "step": 527500
    },
    {
      "epoch": 32.04,
      "learning_rate": 1.1993765548207028e-05,
      "loss": 0.1185,
      "step": 528000
    },
    {
      "epoch": 32.07,
      "learning_rate": 1.1986181056974699e-05,
      "loss": 0.1199,
      "step": 528500
    },
    {
      "epoch": 32.1,
      "learning_rate": 1.197859656574237e-05,
      "loss": 0.1172,
      "step": 529000
    },
    {
      "epoch": 32.13,
      "learning_rate": 1.1971012074510042e-05,
      "loss": 0.117,
      "step": 529500
    },
    {
      "epoch": 32.16,
      "learning_rate": 1.1963427583277716e-05,
      "loss": 0.121,
      "step": 530000
    },
    {
      "epoch": 32.19,
      "learning_rate": 1.1955843092045387e-05,
      "loss": 0.1139,
      "step": 530500
    },
    {
      "epoch": 32.22,
      "learning_rate": 1.1948273769795523e-05,
      "loss": 0.1178,
      "step": 531000
    },
    {
      "epoch": 32.25,
      "learning_rate": 1.1940689278563196e-05,
      "loss": 0.118,
      "step": 531500
    },
    {
      "epoch": 32.28,
      "learning_rate": 1.1933104787330867e-05,
      "loss": 0.1152,
      "step": 532000
    },
    {
      "epoch": 32.31,
      "learning_rate": 1.1925520296098538e-05,
      "loss": 0.1178,
      "step": 532500
    },
    {
      "epoch": 32.34,
      "learning_rate": 1.191793580486621e-05,
      "loss": 0.119,
      "step": 533000
    },
    {
      "epoch": 32.37,
      "learning_rate": 1.1910366482616347e-05,
      "loss": 0.1164,
      "step": 533500
    },
    {
      "epoch": 32.4,
      "learning_rate": 1.1902781991384018e-05,
      "loss": 0.1202,
      "step": 534000
    },
    {
      "epoch": 32.43,
      "learning_rate": 1.1895197500151692e-05,
      "loss": 0.1187,
      "step": 534500
    },
    {
      "epoch": 32.46,
      "learning_rate": 1.1887613008919364e-05,
      "loss": 0.1176,
      "step": 535000
    },
    {
      "epoch": 32.49,
      "learning_rate": 1.1880028517687035e-05,
      "loss": 0.1178,
      "step": 535500
    },
    {
      "epoch": 32.52,
      "learning_rate": 1.1872444026454706e-05,
      "loss": 0.1192,
      "step": 536000
    },
    {
      "epoch": 32.55,
      "learning_rate": 1.1864874704204843e-05,
      "loss": 0.1172,
      "step": 536500
    },
    {
      "epoch": 32.58,
      "learning_rate": 1.1857290212972515e-05,
      "loss": 0.1203,
      "step": 537000
    },
    {
      "epoch": 32.61,
      "learning_rate": 1.1849705721740186e-05,
      "loss": 0.1174,
      "step": 537500
    },
    {
      "epoch": 32.64,
      "learning_rate": 1.1842121230507859e-05,
      "loss": 0.1171,
      "step": 538000
    },
    {
      "epoch": 32.67,
      "learning_rate": 1.183453673927553e-05,
      "loss": 0.1174,
      "step": 538500
    },
    {
      "epoch": 32.7,
      "learning_rate": 1.1826967417025667e-05,
      "loss": 0.1196,
      "step": 539000
    },
    {
      "epoch": 32.73,
      "learning_rate": 1.1819382925793338e-05,
      "loss": 0.1188,
      "step": 539500
    },
    {
      "epoch": 32.77,
      "learning_rate": 1.181179843456101e-05,
      "loss": 0.1184,
      "step": 540000
    },
    {
      "epoch": 32.8,
      "learning_rate": 1.1804213943328683e-05,
      "loss": 0.1192,
      "step": 540500
    },
    {
      "epoch": 32.83,
      "learning_rate": 1.1796629452096355e-05,
      "loss": 0.118,
      "step": 541000
    },
    {
      "epoch": 32.86,
      "learning_rate": 1.1789044960864027e-05,
      "loss": 0.1175,
      "step": 541500
    },
    {
      "epoch": 32.89,
      "learning_rate": 1.1781475638614164e-05,
      "loss": 0.1195,
      "step": 542000
    },
    {
      "epoch": 32.92,
      "learning_rate": 1.1773891147381835e-05,
      "loss": 0.1181,
      "step": 542500
    },
    {
      "epoch": 32.95,
      "learning_rate": 1.1766306656149506e-05,
      "loss": 0.1188,
      "step": 543000
    },
    {
      "epoch": 32.98,
      "learning_rate": 1.1758737333899643e-05,
      "loss": 0.1206,
      "step": 543500
    },
    {
      "epoch": 33.0,
      "eval_bleu": 81.2442,
      "eval_gen_len": 14.0953,
      "eval_loss": 0.16174831986427307,
      "eval_runtime": 179.0701,
      "eval_samples_per_second": 90.043,
      "eval_steps_per_second": 2.815,
      "step": 543873
    },
    {
      "epoch": 33.01,
      "learning_rate": 1.1751152842667315e-05,
      "loss": 0.119,
      "step": 544000
    },
    {
      "epoch": 33.04,
      "learning_rate": 1.1743568351434986e-05,
      "loss": 0.1132,
      "step": 544500
    },
    {
      "epoch": 33.07,
      "learning_rate": 1.1735983860202657e-05,
      "loss": 0.1148,
      "step": 545000
    },
    {
      "epoch": 33.1,
      "learning_rate": 1.1728399368970332e-05,
      "loss": 0.1156,
      "step": 545500
    },
    {
      "epoch": 33.13,
      "learning_rate": 1.1720814877738003e-05,
      "loss": 0.1142,
      "step": 546000
    },
    {
      "epoch": 33.16,
      "learning_rate": 1.171324555548814e-05,
      "loss": 0.1159,
      "step": 546500
    },
    {
      "epoch": 33.19,
      "learning_rate": 1.1705661064255811e-05,
      "loss": 0.1154,
      "step": 547000
    },
    {
      "epoch": 33.22,
      "learning_rate": 1.1698076573023483e-05,
      "loss": 0.1159,
      "step": 547500
    },
    {
      "epoch": 33.25,
      "learning_rate": 1.1690492081791154e-05,
      "loss": 0.1155,
      "step": 548000
    },
    {
      "epoch": 33.28,
      "learning_rate": 1.1682907590558825e-05,
      "loss": 0.115,
      "step": 548500
    },
    {
      "epoch": 33.31,
      "learning_rate": 1.1675338268308962e-05,
      "loss": 0.116,
      "step": 549000
    },
    {
      "epoch": 33.34,
      "learning_rate": 1.1667753777076633e-05,
      "loss": 0.117,
      "step": 549500
    },
    {
      "epoch": 33.37,
      "learning_rate": 1.166018445482677e-05,
      "loss": 0.1171,
      "step": 550000
    },
    {
      "epoch": 33.4,
      "learning_rate": 1.1652599963594442e-05,
      "loss": 0.1201,
      "step": 550500
    },
    {
      "epoch": 33.43,
      "learning_rate": 1.1645015472362116e-05,
      "loss": 0.1169,
      "step": 551000
    },
    {
      "epoch": 33.46,
      "learning_rate": 1.1637430981129788e-05,
      "loss": 0.1157,
      "step": 551500
    },
    {
      "epoch": 33.49,
      "learning_rate": 1.1629846489897459e-05,
      "loss": 0.1159,
      "step": 552000
    },
    {
      "epoch": 33.52,
      "learning_rate": 1.162226199866513e-05,
      "loss": 0.1144,
      "step": 552500
    },
    {
      "epoch": 33.55,
      "learning_rate": 1.1614677507432803e-05,
      "loss": 0.1186,
      "step": 553000
    },
    {
      "epoch": 33.58,
      "learning_rate": 1.1607093016200474e-05,
      "loss": 0.1142,
      "step": 553500
    },
    {
      "epoch": 33.61,
      "learning_rate": 1.1599508524968146e-05,
      "loss": 0.1179,
      "step": 554000
    },
    {
      "epoch": 33.64,
      "learning_rate": 1.1591924033735817e-05,
      "loss": 0.119,
      "step": 554500
    },
    {
      "epoch": 33.68,
      "learning_rate": 1.1584339542503488e-05,
      "loss": 0.1173,
      "step": 555000
    },
    {
      "epoch": 33.71,
      "learning_rate": 1.1576755051271163e-05,
      "loss": 0.1205,
      "step": 555500
    },
    {
      "epoch": 33.74,
      "learning_rate": 1.1569170560038834e-05,
      "loss": 0.1139,
      "step": 556000
    },
    {
      "epoch": 33.77,
      "learning_rate": 1.1561601237788971e-05,
      "loss": 0.119,
      "step": 556500
    },
    {
      "epoch": 33.8,
      "learning_rate": 1.1554016746556642e-05,
      "loss": 0.1156,
      "step": 557000
    },
    {
      "epoch": 33.83,
      "learning_rate": 1.1546432255324314e-05,
      "loss": 0.1152,
      "step": 557500
    },
    {
      "epoch": 33.86,
      "learning_rate": 1.1538847764091985e-05,
      "loss": 0.1155,
      "step": 558000
    },
    {
      "epoch": 33.89,
      "learning_rate": 1.1531263272859658e-05,
      "loss": 0.1154,
      "step": 558500
    },
    {
      "epoch": 33.92,
      "learning_rate": 1.152367878162733e-05,
      "loss": 0.1155,
      "step": 559000
    },
    {
      "epoch": 33.95,
      "learning_rate": 1.1516094290395002e-05,
      "loss": 0.117,
      "step": 559500
    },
    {
      "epoch": 33.98,
      "learning_rate": 1.1508509799162673e-05,
      "loss": 0.1184,
      "step": 560000
    },
    {
      "epoch": 34.0,
      "eval_bleu": 81.2715,
      "eval_gen_len": 14.1176,
      "eval_loss": 0.16308197379112244,
      "eval_runtime": 178.7834,
      "eval_samples_per_second": 90.187,
      "eval_steps_per_second": 2.819,
      "step": 560354
    },
    {
      "epoch": 34.01,
      "learning_rate": 1.1500955645895276e-05,
      "loss": 0.1148,
      "step": 560500
    },
    {
      "epoch": 34.04,
      "learning_rate": 1.149338632364541e-05,
      "loss": 0.1118,
      "step": 561000
    },
    {
      "epoch": 34.07,
      "learning_rate": 1.1485801832413084e-05,
      "loss": 0.1116,
      "step": 561500
    },
    {
      "epoch": 34.1,
      "learning_rate": 1.1478217341180756e-05,
      "loss": 0.1146,
      "step": 562000
    },
    {
      "epoch": 34.13,
      "learning_rate": 1.1470632849948427e-05,
      "loss": 0.113,
      "step": 562500
    },
    {
      "epoch": 34.16,
      "learning_rate": 1.1463048358716098e-05,
      "loss": 0.1133,
      "step": 563000
    },
    {
      "epoch": 34.19,
      "learning_rate": 1.145546386748377e-05,
      "loss": 0.1118,
      "step": 563500
    },
    {
      "epoch": 34.22,
      "learning_rate": 1.1447879376251442e-05,
      "loss": 0.1151,
      "step": 564000
    },
    {
      "epoch": 34.25,
      "learning_rate": 1.1440294885019114e-05,
      "loss": 0.1117,
      "step": 564500
    },
    {
      "epoch": 34.28,
      "learning_rate": 1.1432710393786785e-05,
      "loss": 0.1139,
      "step": 565000
    },
    {
      "epoch": 34.31,
      "learning_rate": 1.1425141071536922e-05,
      "loss": 0.1156,
      "step": 565500
    },
    {
      "epoch": 34.34,
      "learning_rate": 1.1417556580304593e-05,
      "loss": 0.1155,
      "step": 566000
    },
    {
      "epoch": 34.37,
      "learning_rate": 1.1409972089072266e-05,
      "loss": 0.1167,
      "step": 566500
    },
    {
      "epoch": 34.4,
      "learning_rate": 1.1402402766822402e-05,
      "loss": 0.1116,
      "step": 567000
    },
    {
      "epoch": 34.43,
      "learning_rate": 1.1394818275590075e-05,
      "loss": 0.1132,
      "step": 567500
    },
    {
      "epoch": 34.46,
      "learning_rate": 1.1387233784357746e-05,
      "loss": 0.1146,
      "step": 568000
    },
    {
      "epoch": 34.49,
      "learning_rate": 1.1379649293125419e-05,
      "loss": 0.1144,
      "step": 568500
    },
    {
      "epoch": 34.52,
      "learning_rate": 1.137206480189309e-05,
      "loss": 0.1155,
      "step": 569000
    },
    {
      "epoch": 34.55,
      "learning_rate": 1.1364480310660761e-05,
      "loss": 0.1173,
      "step": 569500
    },
    {
      "epoch": 34.59,
      "learning_rate": 1.1356910988410898e-05,
      "loss": 0.112,
      "step": 570000
    },
    {
      "epoch": 34.62,
      "learning_rate": 1.134932649717857e-05,
      "loss": 0.114,
      "step": 570500
    },
    {
      "epoch": 34.65,
      "learning_rate": 1.134174200594624e-05,
      "loss": 0.1137,
      "step": 571000
    },
    {
      "epoch": 34.68,
      "learning_rate": 1.1334157514713915e-05,
      "loss": 0.1157,
      "step": 571500
    },
    {
      "epoch": 34.71,
      "learning_rate": 1.1326573023481587e-05,
      "loss": 0.1154,
      "step": 572000
    },
    {
      "epoch": 34.74,
      "learning_rate": 1.1318988532249258e-05,
      "loss": 0.1176,
      "step": 572500
    },
    {
      "epoch": 34.77,
      "learning_rate": 1.1311419209999395e-05,
      "loss": 0.1134,
      "step": 573000
    },
    {
      "epoch": 34.8,
      "learning_rate": 1.1303834718767066e-05,
      "loss": 0.1145,
      "step": 573500
    },
    {
      "epoch": 34.83,
      "learning_rate": 1.1296250227534738e-05,
      "loss": 0.1155,
      "step": 574000
    },
    {
      "epoch": 34.86,
      "learning_rate": 1.1288665736302409e-05,
      "loss": 0.1136,
      "step": 574500
    },
    {
      "epoch": 34.89,
      "learning_rate": 1.1281081245070082e-05,
      "loss": 0.1147,
      "step": 575000
    },
    {
      "epoch": 34.92,
      "learning_rate": 1.1273496753837753e-05,
      "loss": 0.1145,
      "step": 575500
    },
    {
      "epoch": 34.95,
      "learning_rate": 1.1265912262605426e-05,
      "loss": 0.1143,
      "step": 576000
    },
    {
      "epoch": 34.98,
      "learning_rate": 1.1258327771373097e-05,
      "loss": 0.1148,
      "step": 576500
    },
    {
      "epoch": 35.0,
      "eval_bleu": 81.1501,
      "eval_gen_len": 14.0923,
      "eval_loss": 0.16266627609729767,
      "eval_runtime": 177.3751,
      "eval_samples_per_second": 90.903,
      "eval_steps_per_second": 2.841,
      "step": 576835
    },
    {
      "epoch": 35.01,
      "learning_rate": 1.125074328014077e-05,
      "loss": 0.1122,
      "step": 577000
    },
    {
      "epoch": 35.04,
      "learning_rate": 1.1243158788908441e-05,
      "loss": 0.1116,
      "step": 577500
    },
    {
      "epoch": 35.07,
      "learning_rate": 1.1235589466658578e-05,
      "loss": 0.1094,
      "step": 578000
    },
    {
      "epoch": 35.1,
      "learning_rate": 1.122800497542625e-05,
      "loss": 0.1106,
      "step": 578500
    },
    {
      "epoch": 35.13,
      "learning_rate": 1.1220435653176387e-05,
      "loss": 0.111,
      "step": 579000
    },
    {
      "epoch": 35.16,
      "learning_rate": 1.1212851161944058e-05,
      "loss": 0.1108,
      "step": 579500
    },
    {
      "epoch": 35.19,
      "learning_rate": 1.120526667071173e-05,
      "loss": 0.1088,
      "step": 580000
    },
    {
      "epoch": 35.22,
      "learning_rate": 1.11976821794794e-05,
      "loss": 0.1136,
      "step": 580500
    },
    {
      "epoch": 35.25,
      "learning_rate": 1.1190097688247072e-05,
      "loss": 0.1108,
      "step": 581000
    },
    {
      "epoch": 35.28,
      "learning_rate": 1.1182513197014746e-05,
      "loss": 0.1117,
      "step": 581500
    },
    {
      "epoch": 35.31,
      "learning_rate": 1.1174928705782418e-05,
      "loss": 0.1126,
      "step": 582000
    },
    {
      "epoch": 35.34,
      "learning_rate": 1.1167344214550089e-05,
      "loss": 0.1119,
      "step": 582500
    },
    {
      "epoch": 35.37,
      "learning_rate": 1.115975972331776e-05,
      "loss": 0.1165,
      "step": 583000
    },
    {
      "epoch": 35.4,
      "learning_rate": 1.1152205570050363e-05,
      "loss": 0.1123,
      "step": 583500
    },
    {
      "epoch": 35.43,
      "learning_rate": 1.1144621078818034e-05,
      "loss": 0.1094,
      "step": 584000
    },
    {
      "epoch": 35.47,
      "learning_rate": 1.1137036587585706e-05,
      "loss": 0.1129,
      "step": 584500
    },
    {
      "epoch": 35.5,
      "learning_rate": 1.1129452096353377e-05,
      "loss": 0.1117,
      "step": 585000
    },
    {
      "epoch": 35.53,
      "learning_rate": 1.1121867605121048e-05,
      "loss": 0.1128,
      "step": 585500
    },
    {
      "epoch": 35.56,
      "learning_rate": 1.1114283113888723e-05,
      "loss": 0.1143,
      "step": 586000
    },
    {
      "epoch": 35.59,
      "learning_rate": 1.1106698622656394e-05,
      "loss": 0.111,
      "step": 586500
    },
    {
      "epoch": 35.62,
      "learning_rate": 1.1099114131424065e-05,
      "loss": 0.1139,
      "step": 587000
    },
    {
      "epoch": 35.65,
      "learning_rate": 1.1091529640191736e-05,
      "loss": 0.1128,
      "step": 587500
    },
    {
      "epoch": 35.68,
      "learning_rate": 1.108394514895941e-05,
      "loss": 0.1109,
      "step": 588000
    },
    {
      "epoch": 35.71,
      "learning_rate": 1.107636065772708e-05,
      "loss": 0.1126,
      "step": 588500
    },
    {
      "epoch": 35.74,
      "learning_rate": 1.1068791335477218e-05,
      "loss": 0.1118,
      "step": 589000
    },
    {
      "epoch": 35.77,
      "learning_rate": 1.1061206844244889e-05,
      "loss": 0.1145,
      "step": 589500
    },
    {
      "epoch": 35.8,
      "learning_rate": 1.105362235301256e-05,
      "loss": 0.1114,
      "step": 590000
    },
    {
      "epoch": 35.83,
      "learning_rate": 1.1046037861780231e-05,
      "loss": 0.1086,
      "step": 590500
    },
    {
      "epoch": 35.86,
      "learning_rate": 1.1038453370547903e-05,
      "loss": 0.1159,
      "step": 591000
    },
    {
      "epoch": 35.89,
      "learning_rate": 1.1030868879315577e-05,
      "loss": 0.114,
      "step": 591500
    },
    {
      "epoch": 35.92,
      "learning_rate": 1.1023284388083249e-05,
      "loss": 0.1137,
      "step": 592000
    },
    {
      "epoch": 35.95,
      "learning_rate": 1.1015715065833386e-05,
      "loss": 0.11,
      "step": 592500
    },
    {
      "epoch": 35.98,
      "learning_rate": 1.1008130574601057e-05,
      "loss": 0.1132,
      "step": 593000
    },
    {
      "epoch": 36.0,
      "eval_bleu": 81.3267,
      "eval_gen_len": 14.11,
      "eval_loss": 0.16219820082187653,
      "eval_runtime": 176.9165,
      "eval_samples_per_second": 91.139,
      "eval_steps_per_second": 2.849,
      "step": 593316
    },
    {
      "epoch": 36.01,
      "learning_rate": 1.1000546083368728e-05,
      "loss": 0.1134,
      "step": 593500
    },
    {
      "epoch": 36.04,
      "learning_rate": 1.09929615921364e-05,
      "loss": 0.1088,
      "step": 594000
    },
    {
      "epoch": 36.07,
      "learning_rate": 1.0985377100904074e-05,
      "loss": 0.1086,
      "step": 594500
    },
    {
      "epoch": 36.1,
      "learning_rate": 1.0977792609671745e-05,
      "loss": 0.1081,
      "step": 595000
    },
    {
      "epoch": 36.13,
      "learning_rate": 1.0970223287421882e-05,
      "loss": 0.11,
      "step": 595500
    },
    {
      "epoch": 36.16,
      "learning_rate": 1.0962638796189554e-05,
      "loss": 0.1076,
      "step": 596000
    },
    {
      "epoch": 36.19,
      "learning_rate": 1.0955054304957225e-05,
      "loss": 0.1124,
      "step": 596500
    },
    {
      "epoch": 36.22,
      "learning_rate": 1.0947469813724896e-05,
      "loss": 0.1113,
      "step": 597000
    },
    {
      "epoch": 36.25,
      "learning_rate": 1.0939885322492567e-05,
      "loss": 0.11,
      "step": 597500
    },
    {
      "epoch": 36.28,
      "learning_rate": 1.093230083126024e-05,
      "loss": 0.1116,
      "step": 598000
    },
    {
      "epoch": 36.31,
      "learning_rate": 1.0924716340027912e-05,
      "loss": 0.1089,
      "step": 598500
    },
    {
      "epoch": 36.34,
      "learning_rate": 1.0917147017778049e-05,
      "loss": 0.1083,
      "step": 599000
    },
    {
      "epoch": 36.38,
      "learning_rate": 1.090956252654572e-05,
      "loss": 0.1105,
      "step": 599500
    },
    {
      "epoch": 36.41,
      "learning_rate": 1.0901978035313391e-05,
      "loss": 0.1121,
      "step": 600000
    },
    {
      "epoch": 36.44,
      "learning_rate": 1.0894393544081064e-05,
      "loss": 0.1101,
      "step": 600500
    },
    {
      "epoch": 36.47,
      "learning_rate": 1.0886809052848737e-05,
      "loss": 0.1082,
      "step": 601000
    },
    {
      "epoch": 36.5,
      "learning_rate": 1.0879224561616408e-05,
      "loss": 0.1109,
      "step": 601500
    },
    {
      "epoch": 36.53,
      "learning_rate": 1.087164007038408e-05,
      "loss": 0.1074,
      "step": 602000
    },
    {
      "epoch": 36.56,
      "learning_rate": 1.086405557915175e-05,
      "loss": 0.1113,
      "step": 602500
    },
    {
      "epoch": 36.59,
      "learning_rate": 1.0856486256901888e-05,
      "loss": 0.1108,
      "step": 603000
    },
    {
      "epoch": 36.62,
      "learning_rate": 1.084890176566956e-05,
      "loss": 0.1108,
      "step": 603500
    },
    {
      "epoch": 36.65,
      "learning_rate": 1.084131727443723e-05,
      "loss": 0.1084,
      "step": 604000
    },
    {
      "epoch": 36.68,
      "learning_rate": 1.0833732783204905e-05,
      "loss": 0.1094,
      "step": 604500
    },
    {
      "epoch": 36.71,
      "learning_rate": 1.0826163460955039e-05,
      "loss": 0.1086,
      "step": 605000
    },
    {
      "epoch": 36.74,
      "learning_rate": 1.0818594138705176e-05,
      "loss": 0.1101,
      "step": 605500
    },
    {
      "epoch": 36.77,
      "learning_rate": 1.0811009647472847e-05,
      "loss": 0.1124,
      "step": 606000
    },
    {
      "epoch": 36.8,
      "learning_rate": 1.0803425156240522e-05,
      "loss": 0.1128,
      "step": 606500
    },
    {
      "epoch": 36.83,
      "learning_rate": 1.0795840665008193e-05,
      "loss": 0.1106,
      "step": 607000
    },
    {
      "epoch": 36.86,
      "learning_rate": 1.0788256173775864e-05,
      "loss": 0.1103,
      "step": 607500
    },
    {
      "epoch": 36.89,
      "learning_rate": 1.0780671682543535e-05,
      "loss": 0.1125,
      "step": 608000
    },
    {
      "epoch": 36.92,
      "learning_rate": 1.0773087191311207e-05,
      "loss": 0.1079,
      "step": 608500
    },
    {
      "epoch": 36.95,
      "learning_rate": 1.076550270007888e-05,
      "loss": 0.1143,
      "step": 609000
    },
    {
      "epoch": 36.98,
      "learning_rate": 1.0757948546811481e-05,
      "loss": 0.1133,
      "step": 609500
    },
    {
      "epoch": 37.0,
      "eval_bleu": 81.3249,
      "eval_gen_len": 14.0937,
      "eval_loss": 0.16307313740253448,
      "eval_runtime": 177.1538,
      "eval_samples_per_second": 91.017,
      "eval_steps_per_second": 2.845,
      "step": 609797
    },
    {
      "epoch": 37.01,
      "learning_rate": 1.0750364055579152e-05,
      "loss": 0.1098,
      "step": 610000
    },
    {
      "epoch": 37.04,
      "learning_rate": 1.0742779564346823e-05,
      "loss": 0.1089,
      "step": 610500
    },
    {
      "epoch": 37.07,
      "learning_rate": 1.0735195073114496e-05,
      "loss": 0.1049,
      "step": 611000
    },
    {
      "epoch": 37.1,
      "learning_rate": 1.072761058188217e-05,
      "loss": 0.1083,
      "step": 611500
    },
    {
      "epoch": 37.13,
      "learning_rate": 1.072002609064984e-05,
      "loss": 0.108,
      "step": 612000
    },
    {
      "epoch": 37.16,
      "learning_rate": 1.0712441599417512e-05,
      "loss": 0.1036,
      "step": 612500
    },
    {
      "epoch": 37.19,
      "learning_rate": 1.0704857108185185e-05,
      "loss": 0.1112,
      "step": 613000
    },
    {
      "epoch": 37.22,
      "learning_rate": 1.069728778593532e-05,
      "loss": 0.107,
      "step": 613500
    },
    {
      "epoch": 37.26,
      "learning_rate": 1.0689703294702993e-05,
      "loss": 0.1078,
      "step": 614000
    },
    {
      "epoch": 37.29,
      "learning_rate": 1.0682149141435594e-05,
      "loss": 0.1092,
      "step": 614500
    },
    {
      "epoch": 37.32,
      "learning_rate": 1.0674564650203266e-05,
      "loss": 0.1054,
      "step": 615000
    },
    {
      "epoch": 37.35,
      "learning_rate": 1.0666980158970937e-05,
      "loss": 0.1072,
      "step": 615500
    },
    {
      "epoch": 37.38,
      "learning_rate": 1.0659395667738608e-05,
      "loss": 0.1114,
      "step": 616000
    },
    {
      "epoch": 37.41,
      "learning_rate": 1.0651811176506281e-05,
      "loss": 0.1099,
      "step": 616500
    },
    {
      "epoch": 37.44,
      "learning_rate": 1.0644226685273952e-05,
      "loss": 0.1072,
      "step": 617000
    },
    {
      "epoch": 37.47,
      "learning_rate": 1.0636642194041624e-05,
      "loss": 0.1109,
      "step": 617500
    },
    {
      "epoch": 37.5,
      "learning_rate": 1.0629057702809295e-05,
      "loss": 0.1071,
      "step": 618000
    },
    {
      "epoch": 37.53,
      "learning_rate": 1.062147321157697e-05,
      "loss": 0.111,
      "step": 618500
    },
    {
      "epoch": 37.56,
      "learning_rate": 1.061388872034464e-05,
      "loss": 0.1088,
      "step": 619000
    },
    {
      "epoch": 37.59,
      "learning_rate": 1.0606304229112312e-05,
      "loss": 0.1097,
      "step": 619500
    },
    {
      "epoch": 37.62,
      "learning_rate": 1.0598719737879983e-05,
      "loss": 0.1075,
      "step": 620000
    },
    {
      "epoch": 37.65,
      "learning_rate": 1.059115041563012e-05,
      "loss": 0.1083,
      "step": 620500
    },
    {
      "epoch": 37.68,
      "learning_rate": 1.0583565924397791e-05,
      "loss": 0.1095,
      "step": 621000
    },
    {
      "epoch": 37.71,
      "learning_rate": 1.0575996602147929e-05,
      "loss": 0.1106,
      "step": 621500
    },
    {
      "epoch": 37.74,
      "learning_rate": 1.05684121109156e-05,
      "loss": 0.1096,
      "step": 622000
    },
    {
      "epoch": 37.77,
      "learning_rate": 1.0560827619683271e-05,
      "loss": 0.1089,
      "step": 622500
    },
    {
      "epoch": 37.8,
      "learning_rate": 1.0553243128450946e-05,
      "loss": 0.1091,
      "step": 623000
    },
    {
      "epoch": 37.83,
      "learning_rate": 1.0545658637218617e-05,
      "loss": 0.1117,
      "step": 623500
    },
    {
      "epoch": 37.86,
      "learning_rate": 1.0538089314968754e-05,
      "loss": 0.1096,
      "step": 624000
    },
    {
      "epoch": 37.89,
      "learning_rate": 1.0530504823736425e-05,
      "loss": 0.108,
      "step": 624500
    },
    {
      "epoch": 37.92,
      "learning_rate": 1.0522920332504097e-05,
      "loss": 0.1094,
      "step": 625000
    },
    {
      "epoch": 37.95,
      "learning_rate": 1.0515335841271768e-05,
      "loss": 0.1094,
      "step": 625500
    },
    {
      "epoch": 37.98,
      "learning_rate": 1.050775135003944e-05,
      "loss": 0.1083,
      "step": 626000
    },
    {
      "epoch": 38.0,
      "eval_bleu": 81.212,
      "eval_gen_len": 14.1108,
      "eval_loss": 0.16392718255519867,
      "eval_runtime": 179.1355,
      "eval_samples_per_second": 90.01,
      "eval_steps_per_second": 2.814,
      "step": 626278
    },
    {
      "epoch": 38.01,
      "learning_rate": 1.0500166858807112e-05,
      "loss": 0.1056,
      "step": 626500
    },
    {
      "epoch": 38.04,
      "learning_rate": 1.0492597536557249e-05,
      "loss": 0.1035,
      "step": 627000
    },
    {
      "epoch": 38.07,
      "learning_rate": 1.048501304532492e-05,
      "loss": 0.1055,
      "step": 627500
    },
    {
      "epoch": 38.1,
      "learning_rate": 1.0477428554092592e-05,
      "loss": 0.1067,
      "step": 628000
    },
    {
      "epoch": 38.13,
      "learning_rate": 1.0469844062860265e-05,
      "loss": 0.1059,
      "step": 628500
    },
    {
      "epoch": 38.17,
      "learning_rate": 1.0462259571627936e-05,
      "loss": 0.1047,
      "step": 629000
    },
    {
      "epoch": 38.2,
      "learning_rate": 1.0454690249378073e-05,
      "loss": 0.1067,
      "step": 629500
    },
    {
      "epoch": 38.23,
      "learning_rate": 1.0447105758145744e-05,
      "loss": 0.1056,
      "step": 630000
    },
    {
      "epoch": 38.26,
      "learning_rate": 1.0439521266913417e-05,
      "loss": 0.1079,
      "step": 630500
    },
    {
      "epoch": 38.29,
      "learning_rate": 1.0431936775681088e-05,
      "loss": 0.1036,
      "step": 631000
    },
    {
      "epoch": 38.32,
      "learning_rate": 1.0424367453431225e-05,
      "loss": 0.1068,
      "step": 631500
    },
    {
      "epoch": 38.35,
      "learning_rate": 1.0416782962198897e-05,
      "loss": 0.1068,
      "step": 632000
    },
    {
      "epoch": 38.38,
      "learning_rate": 1.0409198470966568e-05,
      "loss": 0.1078,
      "step": 632500
    },
    {
      "epoch": 38.41,
      "learning_rate": 1.0401613979734239e-05,
      "loss": 0.1053,
      "step": 633000
    },
    {
      "epoch": 38.44,
      "learning_rate": 1.039402948850191e-05,
      "loss": 0.1061,
      "step": 633500
    },
    {
      "epoch": 38.47,
      "learning_rate": 1.0386460166252047e-05,
      "loss": 0.1077,
      "step": 634000
    },
    {
      "epoch": 38.5,
      "learning_rate": 1.0378875675019719e-05,
      "loss": 0.1079,
      "step": 634500
    },
    {
      "epoch": 38.53,
      "learning_rate": 1.0371291183787393e-05,
      "loss": 0.1095,
      "step": 635000
    },
    {
      "epoch": 38.56,
      "learning_rate": 1.0363706692555065e-05,
      "loss": 0.1091,
      "step": 635500
    },
    {
      "epoch": 38.59,
      "learning_rate": 1.0356122201322736e-05,
      "loss": 0.1058,
      "step": 636000
    },
    {
      "epoch": 38.62,
      "learning_rate": 1.0348537710090407e-05,
      "loss": 0.109,
      "step": 636500
    },
    {
      "epoch": 38.65,
      "learning_rate": 1.0340968387840544e-05,
      "loss": 0.1074,
      "step": 637000
    },
    {
      "epoch": 38.68,
      "learning_rate": 1.0333383896608215e-05,
      "loss": 0.1058,
      "step": 637500
    },
    {
      "epoch": 38.71,
      "learning_rate": 1.0325799405375888e-05,
      "loss": 0.1058,
      "step": 638000
    },
    {
      "epoch": 38.74,
      "learning_rate": 1.0318214914143561e-05,
      "loss": 0.1089,
      "step": 638500
    },
    {
      "epoch": 38.77,
      "learning_rate": 1.0310645591893698e-05,
      "loss": 0.1079,
      "step": 639000
    },
    {
      "epoch": 38.8,
      "learning_rate": 1.030306110066137e-05,
      "loss": 0.1065,
      "step": 639500
    },
    {
      "epoch": 38.83,
      "learning_rate": 1.0295476609429041e-05,
      "loss": 0.1056,
      "step": 640000
    },
    {
      "epoch": 38.86,
      "learning_rate": 1.0287892118196712e-05,
      "loss": 0.1068,
      "step": 640500
    },
    {
      "epoch": 38.89,
      "learning_rate": 1.028032279594685e-05,
      "loss": 0.1071,
      "step": 641000
    },
    {
      "epoch": 38.92,
      "learning_rate": 1.027273830471452e-05,
      "loss": 0.1077,
      "step": 641500
    },
    {
      "epoch": 38.95,
      "learning_rate": 1.0265153813482192e-05,
      "loss": 0.1078,
      "step": 642000
    },
    {
      "epoch": 38.98,
      "learning_rate": 1.0257569322249865e-05,
      "loss": 0.1067,
      "step": 642500
    },
    {
      "epoch": 39.0,
      "eval_bleu": 81.2594,
      "eval_gen_len": 14.1177,
      "eval_loss": 0.16316094994544983,
      "eval_runtime": 176.9924,
      "eval_samples_per_second": 91.1,
      "eval_steps_per_second": 2.848,
      "step": 642759
    },
    {
      "epoch": 39.01,
      "learning_rate": 1.0249984831017536e-05,
      "loss": 0.1061,
      "step": 643000
    },
    {
      "epoch": 39.04,
      "learning_rate": 1.0242400339785207e-05,
      "loss": 0.1052,
      "step": 643500
    },
    {
      "epoch": 39.08,
      "learning_rate": 1.0234831017535344e-05,
      "loss": 0.1055,
      "step": 644000
    },
    {
      "epoch": 39.11,
      "learning_rate": 1.0227246526303016e-05,
      "loss": 0.1047,
      "step": 644500
    },
    {
      "epoch": 39.14,
      "learning_rate": 1.0219662035070688e-05,
      "loss": 0.1047,
      "step": 645000
    },
    {
      "epoch": 39.17,
      "learning_rate": 1.0212077543838361e-05,
      "loss": 0.1046,
      "step": 645500
    },
    {
      "epoch": 39.2,
      "learning_rate": 1.0204493052606033e-05,
      "loss": 0.1053,
      "step": 646000
    },
    {
      "epoch": 39.23,
      "learning_rate": 1.0196908561373704e-05,
      "loss": 0.1046,
      "step": 646500
    },
    {
      "epoch": 39.26,
      "learning_rate": 1.0189339239123841e-05,
      "loss": 0.1035,
      "step": 647000
    },
    {
      "epoch": 39.29,
      "learning_rate": 1.0181754747891512e-05,
      "loss": 0.1025,
      "step": 647500
    },
    {
      "epoch": 39.32,
      "learning_rate": 1.0174170256659184e-05,
      "loss": 0.1069,
      "step": 648000
    },
    {
      "epoch": 39.35,
      "learning_rate": 1.0166585765426855e-05,
      "loss": 0.1038,
      "step": 648500
    },
    {
      "epoch": 39.38,
      "learning_rate": 1.015900127419453e-05,
      "loss": 0.1044,
      "step": 649000
    },
    {
      "epoch": 39.41,
      "learning_rate": 1.01514167829622e-05,
      "loss": 0.1055,
      "step": 649500
    },
    {
      "epoch": 39.44,
      "learning_rate": 1.0143832291729872e-05,
      "loss": 0.1039,
      "step": 650000
    },
    {
      "epoch": 39.47,
      "learning_rate": 1.0136262969480009e-05,
      "loss": 0.1057,
      "step": 650500
    },
    {
      "epoch": 39.5,
      "learning_rate": 1.012867847824768e-05,
      "loss": 0.1059,
      "step": 651000
    },
    {
      "epoch": 39.53,
      "learning_rate": 1.0121093987015351e-05,
      "loss": 0.1053,
      "step": 651500
    },
    {
      "epoch": 39.56,
      "learning_rate": 1.0113509495783023e-05,
      "loss": 0.1038,
      "step": 652000
    },
    {
      "epoch": 39.59,
      "learning_rate": 1.010594017353316e-05,
      "loss": 0.1049,
      "step": 652500
    },
    {
      "epoch": 39.62,
      "learning_rate": 1.0098355682300831e-05,
      "loss": 0.1046,
      "step": 653000
    },
    {
      "epoch": 39.65,
      "learning_rate": 1.0090771191068504e-05,
      "loss": 0.1033,
      "step": 653500
    },
    {
      "epoch": 39.68,
      "learning_rate": 1.0083186699836175e-05,
      "loss": 0.1063,
      "step": 654000
    },
    {
      "epoch": 39.71,
      "learning_rate": 1.0075602208603848e-05,
      "loss": 0.1053,
      "step": 654500
    },
    {
      "epoch": 39.74,
      "learning_rate": 1.0068032886353985e-05,
      "loss": 0.1048,
      "step": 655000
    },
    {
      "epoch": 39.77,
      "learning_rate": 1.0060448395121657e-05,
      "loss": 0.1078,
      "step": 655500
    },
    {
      "epoch": 39.8,
      "learning_rate": 1.0052863903889328e-05,
      "loss": 0.1056,
      "step": 656000
    },
    {
      "epoch": 39.83,
      "learning_rate": 1.0045279412657e-05,
      "loss": 0.1046,
      "step": 656500
    },
    {
      "epoch": 39.86,
      "learning_rate": 1.0037694921424672e-05,
      "loss": 0.1048,
      "step": 657000
    },
    {
      "epoch": 39.89,
      "learning_rate": 1.0030110430192343e-05,
      "loss": 0.1053,
      "step": 657500
    },
    {
      "epoch": 39.92,
      "learning_rate": 1.002254110794248e-05,
      "loss": 0.105,
      "step": 658000
    },
    {
      "epoch": 39.96,
      "learning_rate": 1.0014956616710152e-05,
      "loss": 0.1042,
      "step": 658500
    },
    {
      "epoch": 39.99,
      "learning_rate": 1.0007372125477823e-05,
      "loss": 0.1033,
      "step": 659000
    },
    {
      "epoch": 40.0,
      "eval_bleu": 81.214,
      "eval_gen_len": 14.1179,
      "eval_loss": 0.16460604965686798,
      "eval_runtime": 177.2705,
      "eval_samples_per_second": 90.957,
      "eval_steps_per_second": 2.843,
      "step": 659240
    },
    {
      "epoch": 40.02,
      "learning_rate": 9.999787634245496e-06,
      "loss": 0.1036,
      "step": 659500
    },
    {
      "epoch": 40.05,
      "learning_rate": 9.992218311995631e-06,
      "loss": 0.0997,
      "step": 660000
    },
    {
      "epoch": 40.08,
      "learning_rate": 9.984633820763304e-06,
      "loss": 0.1017,
      "step": 660500
    },
    {
      "epoch": 40.11,
      "learning_rate": 9.977049329530975e-06,
      "loss": 0.1038,
      "step": 661000
    },
    {
      "epoch": 40.14,
      "learning_rate": 9.969464838298648e-06,
      "loss": 0.1001,
      "step": 661500
    },
    {
      "epoch": 40.17,
      "learning_rate": 9.96188034706632e-06,
      "loss": 0.1035,
      "step": 662000
    },
    {
      "epoch": 40.2,
      "learning_rate": 9.954295855833992e-06,
      "loss": 0.1037,
      "step": 662500
    },
    {
      "epoch": 40.23,
      "learning_rate": 9.946711364601664e-06,
      "loss": 0.102,
      "step": 663000
    },
    {
      "epoch": 40.26,
      "learning_rate": 9.9391420423518e-06,
      "loss": 0.1026,
      "step": 663500
    },
    {
      "epoch": 40.29,
      "learning_rate": 9.931557551119472e-06,
      "loss": 0.1033,
      "step": 664000
    },
    {
      "epoch": 40.32,
      "learning_rate": 9.923973059887143e-06,
      "loss": 0.1034,
      "step": 664500
    },
    {
      "epoch": 40.35,
      "learning_rate": 9.916388568654816e-06,
      "loss": 0.1009,
      "step": 665000
    },
    {
      "epoch": 40.38,
      "learning_rate": 9.908804077422488e-06,
      "loss": 0.1039,
      "step": 665500
    },
    {
      "epoch": 40.41,
      "learning_rate": 9.901234755172625e-06,
      "loss": 0.1046,
      "step": 666000
    },
    {
      "epoch": 40.44,
      "learning_rate": 9.893650263940296e-06,
      "loss": 0.1043,
      "step": 666500
    },
    {
      "epoch": 40.47,
      "learning_rate": 9.886065772707967e-06,
      "loss": 0.1007,
      "step": 667000
    },
    {
      "epoch": 40.5,
      "learning_rate": 9.87848128147564e-06,
      "loss": 0.1035,
      "step": 667500
    },
    {
      "epoch": 40.53,
      "learning_rate": 9.870911959225775e-06,
      "loss": 0.104,
      "step": 668000
    },
    {
      "epoch": 40.56,
      "learning_rate": 9.863327467993448e-06,
      "loss": 0.104,
      "step": 668500
    },
    {
      "epoch": 40.59,
      "learning_rate": 9.85574297676112e-06,
      "loss": 0.1037,
      "step": 669000
    },
    {
      "epoch": 40.62,
      "learning_rate": 9.848158485528791e-06,
      "loss": 0.1018,
      "step": 669500
    },
    {
      "epoch": 40.65,
      "learning_rate": 9.840573994296462e-06,
      "loss": 0.1027,
      "step": 670000
    },
    {
      "epoch": 40.68,
      "learning_rate": 9.832989503064135e-06,
      "loss": 0.1008,
      "step": 670500
    },
    {
      "epoch": 40.71,
      "learning_rate": 9.825405011831806e-06,
      "loss": 0.1043,
      "step": 671000
    },
    {
      "epoch": 40.74,
      "learning_rate": 9.81782052059948e-06,
      "loss": 0.1028,
      "step": 671500
    },
    {
      "epoch": 40.77,
      "learning_rate": 9.810251198349615e-06,
      "loss": 0.1049,
      "step": 672000
    },
    {
      "epoch": 40.8,
      "learning_rate": 9.802681876099752e-06,
      "loss": 0.1061,
      "step": 672500
    },
    {
      "epoch": 40.83,
      "learning_rate": 9.795097384867423e-06,
      "loss": 0.1042,
      "step": 673000
    },
    {
      "epoch": 40.87,
      "learning_rate": 9.787512893635096e-06,
      "loss": 0.1055,
      "step": 673500
    },
    {
      "epoch": 40.9,
      "learning_rate": 9.779928402402767e-06,
      "loss": 0.1029,
      "step": 674000
    },
    {
      "epoch": 40.93,
      "learning_rate": 9.772359080152904e-06,
      "loss": 0.1039,
      "step": 674500
    },
    {
      "epoch": 40.96,
      "learning_rate": 9.764774588920576e-06,
      "loss": 0.1074,
      "step": 675000
    },
    {
      "epoch": 40.99,
      "learning_rate": 9.757190097688248e-06,
      "loss": 0.1039,
      "step": 675500
    },
    {
      "epoch": 41.0,
      "eval_bleu": 81.2844,
      "eval_gen_len": 14.0989,
      "eval_loss": 0.16462182998657227,
      "eval_runtime": 177.1935,
      "eval_samples_per_second": 90.997,
      "eval_steps_per_second": 2.844,
      "step": 675721
    },
    {
      "epoch": 41.02,
      "learning_rate": 9.74960560645592e-06,
      "loss": 0.1037,
      "step": 676000
    },
    {
      "epoch": 41.05,
      "learning_rate": 9.742021115223591e-06,
      "loss": 0.0975,
      "step": 676500
    },
    {
      "epoch": 41.08,
      "learning_rate": 9.734436623991264e-06,
      "loss": 0.0995,
      "step": 677000
    },
    {
      "epoch": 41.11,
      "learning_rate": 9.726852132758935e-06,
      "loss": 0.1018,
      "step": 677500
    },
    {
      "epoch": 41.14,
      "learning_rate": 9.719267641526608e-06,
      "loss": 0.1007,
      "step": 678000
    },
    {
      "epoch": 41.17,
      "learning_rate": 9.711698319276744e-06,
      "loss": 0.1005,
      "step": 678500
    },
    {
      "epoch": 41.2,
      "learning_rate": 9.70412899702688e-06,
      "loss": 0.1025,
      "step": 679000
    },
    {
      "epoch": 41.23,
      "learning_rate": 9.696544505794552e-06,
      "loss": 0.1027,
      "step": 679500
    },
    {
      "epoch": 41.26,
      "learning_rate": 9.688960014562225e-06,
      "loss": 0.1008,
      "step": 680000
    },
    {
      "epoch": 41.29,
      "learning_rate": 9.681375523329896e-06,
      "loss": 0.1006,
      "step": 680500
    },
    {
      "epoch": 41.32,
      "learning_rate": 9.673791032097567e-06,
      "loss": 0.1012,
      "step": 681000
    },
    {
      "epoch": 41.35,
      "learning_rate": 9.666221709847704e-06,
      "loss": 0.1013,
      "step": 681500
    },
    {
      "epoch": 41.38,
      "learning_rate": 9.658637218615377e-06,
      "loss": 0.1035,
      "step": 682000
    },
    {
      "epoch": 41.41,
      "learning_rate": 9.651052727383049e-06,
      "loss": 0.1018,
      "step": 682500
    },
    {
      "epoch": 41.44,
      "learning_rate": 9.64346823615072e-06,
      "loss": 0.1001,
      "step": 683000
    },
    {
      "epoch": 41.47,
      "learning_rate": 9.635898913900857e-06,
      "loss": 0.1018,
      "step": 683500
    },
    {
      "epoch": 41.5,
      "learning_rate": 9.628314422668528e-06,
      "loss": 0.1005,
      "step": 684000
    },
    {
      "epoch": 41.53,
      "learning_rate": 9.6207299314362e-06,
      "loss": 0.1013,
      "step": 684500
    },
    {
      "epoch": 41.56,
      "learning_rate": 9.613145440203872e-06,
      "loss": 0.1012,
      "step": 685000
    },
    {
      "epoch": 41.59,
      "learning_rate": 9.605560948971544e-06,
      "loss": 0.1009,
      "step": 685500
    },
    {
      "epoch": 41.62,
      "learning_rate": 9.59799162672168e-06,
      "loss": 0.104,
      "step": 686000
    },
    {
      "epoch": 41.65,
      "learning_rate": 9.590407135489352e-06,
      "loss": 0.1023,
      "step": 686500
    },
    {
      "epoch": 41.68,
      "learning_rate": 9.582822644257023e-06,
      "loss": 0.1012,
      "step": 687000
    },
    {
      "epoch": 41.71,
      "learning_rate": 9.575238153024696e-06,
      "loss": 0.1013,
      "step": 687500
    },
    {
      "epoch": 41.75,
      "learning_rate": 9.567653661792367e-06,
      "loss": 0.1018,
      "step": 688000
    },
    {
      "epoch": 41.78,
      "learning_rate": 9.56006917056004e-06,
      "loss": 0.1026,
      "step": 688500
    },
    {
      "epoch": 41.81,
      "learning_rate": 9.552484679327712e-06,
      "loss": 0.103,
      "step": 689000
    },
    {
      "epoch": 41.84,
      "learning_rate": 9.544900188095383e-06,
      "loss": 0.1029,
      "step": 689500
    },
    {
      "epoch": 41.87,
      "learning_rate": 9.53733086584552e-06,
      "loss": 0.103,
      "step": 690000
    },
    {
      "epoch": 41.9,
      "learning_rate": 9.529746374613191e-06,
      "loss": 0.1027,
      "step": 690500
    },
    {
      "epoch": 41.93,
      "learning_rate": 9.522161883380864e-06,
      "loss": 0.0986,
      "step": 691000
    },
    {
      "epoch": 41.96,
      "learning_rate": 9.514592561131e-06,
      "loss": 0.1012,
      "step": 691500
    },
    {
      "epoch": 41.99,
      "learning_rate": 9.507008069898672e-06,
      "loss": 0.106,
      "step": 692000
    },
    {
      "epoch": 42.0,
      "eval_bleu": 81.2701,
      "eval_gen_len": 14.0995,
      "eval_loss": 0.16560077667236328,
      "eval_runtime": 176.936,
      "eval_samples_per_second": 91.129,
      "eval_steps_per_second": 2.848,
      "step": 692202
    },
    {
      "epoch": 42.02,
      "learning_rate": 9.499423578666344e-06,
      "loss": 0.1025,
      "step": 692500
    },
    {
      "epoch": 42.05,
      "learning_rate": 9.491839087434017e-06,
      "loss": 0.0978,
      "step": 693000
    },
    {
      "epoch": 42.08,
      "learning_rate": 9.484254596201688e-06,
      "loss": 0.0994,
      "step": 693500
    },
    {
      "epoch": 42.11,
      "learning_rate": 9.476685273951825e-06,
      "loss": 0.1013,
      "step": 694000
    },
    {
      "epoch": 42.14,
      "learning_rate": 9.469100782719496e-06,
      "loss": 0.1,
      "step": 694500
    },
    {
      "epoch": 42.17,
      "learning_rate": 9.461516291487167e-06,
      "loss": 0.0976,
      "step": 695000
    },
    {
      "epoch": 42.2,
      "learning_rate": 9.45393180025484e-06,
      "loss": 0.1008,
      "step": 695500
    },
    {
      "epoch": 42.23,
      "learning_rate": 9.446347309022512e-06,
      "loss": 0.0973,
      "step": 696000
    },
    {
      "epoch": 42.26,
      "learning_rate": 9.438762817790183e-06,
      "loss": 0.099,
      "step": 696500
    },
    {
      "epoch": 42.29,
      "learning_rate": 9.431178326557854e-06,
      "loss": 0.0995,
      "step": 697000
    },
    {
      "epoch": 42.32,
      "learning_rate": 9.423609004307991e-06,
      "loss": 0.1004,
      "step": 697500
    },
    {
      "epoch": 42.35,
      "learning_rate": 9.416024513075663e-06,
      "loss": 0.1004,
      "step": 698000
    },
    {
      "epoch": 42.38,
      "learning_rate": 9.408440021843335e-06,
      "loss": 0.1006,
      "step": 698500
    },
    {
      "epoch": 42.41,
      "learning_rate": 9.400855530611007e-06,
      "loss": 0.1003,
      "step": 699000
    },
    {
      "epoch": 42.44,
      "learning_rate": 9.39327103937868e-06,
      "loss": 0.1005,
      "step": 699500
    },
    {
      "epoch": 42.47,
      "learning_rate": 9.385686548146351e-06,
      "loss": 0.1009,
      "step": 700000
    },
    {
      "epoch": 42.5,
      "learning_rate": 9.378117225896488e-06,
      "loss": 0.1005,
      "step": 700500
    },
    {
      "epoch": 42.53,
      "learning_rate": 9.37053273466416e-06,
      "loss": 0.1015,
      "step": 701000
    },
    {
      "epoch": 42.56,
      "learning_rate": 9.36294824343183e-06,
      "loss": 0.1017,
      "step": 701500
    },
    {
      "epoch": 42.59,
      "learning_rate": 9.355363752199503e-06,
      "loss": 0.1009,
      "step": 702000
    },
    {
      "epoch": 42.62,
      "learning_rate": 9.347779260967175e-06,
      "loss": 0.0989,
      "step": 702500
    },
    {
      "epoch": 42.66,
      "learning_rate": 9.340194769734848e-06,
      "loss": 0.1006,
      "step": 703000
    },
    {
      "epoch": 42.69,
      "learning_rate": 9.332625447484983e-06,
      "loss": 0.1004,
      "step": 703500
    },
    {
      "epoch": 42.72,
      "learning_rate": 9.325040956252656e-06,
      "loss": 0.0999,
      "step": 704000
    },
    {
      "epoch": 42.75,
      "learning_rate": 9.317456465020327e-06,
      "loss": 0.1012,
      "step": 704500
    },
    {
      "epoch": 42.78,
      "learning_rate": 9.309887142770464e-06,
      "loss": 0.0996,
      "step": 705000
    },
    {
      "epoch": 42.81,
      "learning_rate": 9.302302651538136e-06,
      "loss": 0.0981,
      "step": 705500
    },
    {
      "epoch": 42.84,
      "learning_rate": 9.294718160305808e-06,
      "loss": 0.1001,
      "step": 706000
    },
    {
      "epoch": 42.87,
      "learning_rate": 9.28713366907348e-06,
      "loss": 0.0996,
      "step": 706500
    },
    {
      "epoch": 42.9,
      "learning_rate": 9.279549177841151e-06,
      "loss": 0.0994,
      "step": 707000
    },
    {
      "epoch": 42.93,
      "learning_rate": 9.271964686608824e-06,
      "loss": 0.0998,
      "step": 707500
    },
    {
      "epoch": 42.96,
      "learning_rate": 9.264380195376495e-06,
      "loss": 0.1009,
      "step": 708000
    },
    {
      "epoch": 42.99,
      "learning_rate": 9.256795704144166e-06,
      "loss": 0.1016,
      "step": 708500
    },
    {
      "epoch": 43.0,
      "eval_bleu": 81.3319,
      "eval_gen_len": 14.1486,
      "eval_loss": 0.16639186441898346,
      "eval_runtime": 176.8975,
      "eval_samples_per_second": 91.149,
      "eval_steps_per_second": 2.849,
      "step": 708683
    },
    {
      "epoch": 43.02,
      "learning_rate": 9.249211212911838e-06,
      "loss": 0.0985,
      "step": 709000
    },
    {
      "epoch": 43.05,
      "learning_rate": 9.24162672167951e-06,
      "loss": 0.097,
      "step": 709500
    },
    {
      "epoch": 43.08,
      "learning_rate": 9.234042230447182e-06,
      "loss": 0.0971,
      "step": 710000
    },
    {
      "epoch": 43.11,
      "learning_rate": 9.226457739214855e-06,
      "loss": 0.0939,
      "step": 710500
    },
    {
      "epoch": 43.14,
      "learning_rate": 9.21888841696499e-06,
      "loss": 0.0995,
      "step": 711000
    },
    {
      "epoch": 43.17,
      "learning_rate": 9.211303925732663e-06,
      "loss": 0.0955,
      "step": 711500
    },
    {
      "epoch": 43.2,
      "learning_rate": 9.203719434500334e-06,
      "loss": 0.0976,
      "step": 712000
    },
    {
      "epoch": 43.23,
      "learning_rate": 9.196134943268006e-06,
      "loss": 0.0969,
      "step": 712500
    },
    {
      "epoch": 43.26,
      "learning_rate": 9.188565621018143e-06,
      "loss": 0.098,
      "step": 713000
    },
    {
      "epoch": 43.29,
      "learning_rate": 9.180981129785814e-06,
      "loss": 0.0982,
      "step": 713500
    },
    {
      "epoch": 43.32,
      "learning_rate": 9.173396638553487e-06,
      "loss": 0.0977,
      "step": 714000
    },
    {
      "epoch": 43.35,
      "learning_rate": 9.165812147321158e-06,
      "loss": 0.098,
      "step": 714500
    },
    {
      "epoch": 43.38,
      "learning_rate": 9.158242825071295e-06,
      "loss": 0.0975,
      "step": 715000
    },
    {
      "epoch": 43.41,
      "learning_rate": 9.15067350282143e-06,
      "loss": 0.0994,
      "step": 715500
    },
    {
      "epoch": 43.44,
      "learning_rate": 9.143089011589104e-06,
      "loss": 0.0996,
      "step": 716000
    },
    {
      "epoch": 43.47,
      "learning_rate": 9.135504520356775e-06,
      "loss": 0.0983,
      "step": 716500
    },
    {
      "epoch": 43.5,
      "learning_rate": 9.127920029124448e-06,
      "loss": 0.0997,
      "step": 717000
    },
    {
      "epoch": 43.53,
      "learning_rate": 9.120335537892119e-06,
      "loss": 0.0983,
      "step": 717500
    },
    {
      "epoch": 43.57,
      "learning_rate": 9.112766215642256e-06,
      "loss": 0.099,
      "step": 718000
    },
    {
      "epoch": 43.6,
      "learning_rate": 9.105196893392392e-06,
      "loss": 0.0987,
      "step": 718500
    },
    {
      "epoch": 43.63,
      "learning_rate": 9.097612402160064e-06,
      "loss": 0.0992,
      "step": 719000
    },
    {
      "epoch": 43.66,
      "learning_rate": 9.090027910927736e-06,
      "loss": 0.0989,
      "step": 719500
    },
    {
      "epoch": 43.69,
      "learning_rate": 9.082443419695409e-06,
      "loss": 0.1004,
      "step": 720000
    },
    {
      "epoch": 43.72,
      "learning_rate": 9.07485892846308e-06,
      "loss": 0.0998,
      "step": 720500
    },
    {
      "epoch": 43.75,
      "learning_rate": 9.067274437230751e-06,
      "loss": 0.1005,
      "step": 721000
    },
    {
      "epoch": 43.78,
      "learning_rate": 9.059689945998424e-06,
      "loss": 0.0978,
      "step": 721500
    },
    {
      "epoch": 43.81,
      "learning_rate": 9.052105454766095e-06,
      "loss": 0.0998,
      "step": 722000
    },
    {
      "epoch": 43.84,
      "learning_rate": 9.044536132516232e-06,
      "loss": 0.0995,
      "step": 722500
    },
    {
      "epoch": 43.87,
      "learning_rate": 9.036951641283904e-06,
      "loss": 0.1005,
      "step": 723000
    },
    {
      "epoch": 43.9,
      "learning_rate": 9.029367150051575e-06,
      "loss": 0.1,
      "step": 723500
    },
    {
      "epoch": 43.93,
      "learning_rate": 9.021782658819246e-06,
      "loss": 0.0979,
      "step": 724000
    },
    {
      "epoch": 43.96,
      "learning_rate": 9.014198167586919e-06,
      "loss": 0.0997,
      "step": 724500
    },
    {
      "epoch": 43.99,
      "learning_rate": 9.00661367635459e-06,
      "loss": 0.0992,
      "step": 725000
    },
    {
      "epoch": 44.0,
      "eval_bleu": 81.3473,
      "eval_gen_len": 14.1242,
      "eval_loss": 0.1655581146478653,
      "eval_runtime": 178.9799,
      "eval_samples_per_second": 90.088,
      "eval_steps_per_second": 2.816,
      "step": 725164
    },
    {
      "epoch": 44.02,
      "learning_rate": 8.999029185122262e-06,
      "loss": 0.0972,
      "step": 725500
    },
    {
      "epoch": 44.05,
      "learning_rate": 8.991444693889935e-06,
      "loss": 0.0954,
      "step": 726000
    },
    {
      "epoch": 44.08,
      "learning_rate": 8.98387537164007e-06,
      "loss": 0.0954,
      "step": 726500
    },
    {
      "epoch": 44.11,
      "learning_rate": 8.976290880407743e-06,
      "loss": 0.0961,
      "step": 727000
    },
    {
      "epoch": 44.14,
      "learning_rate": 8.968706389175414e-06,
      "loss": 0.0941,
      "step": 727500
    },
    {
      "epoch": 44.17,
      "learning_rate": 8.961121897943087e-06,
      "loss": 0.0952,
      "step": 728000
    },
    {
      "epoch": 44.2,
      "learning_rate": 8.953552575693223e-06,
      "loss": 0.0993,
      "step": 728500
    },
    {
      "epoch": 44.23,
      "learning_rate": 8.945968084460895e-06,
      "loss": 0.0966,
      "step": 729000
    },
    {
      "epoch": 44.26,
      "learning_rate": 8.938383593228567e-06,
      "loss": 0.0966,
      "step": 729500
    },
    {
      "epoch": 44.29,
      "learning_rate": 8.93079910199624e-06,
      "loss": 0.0968,
      "step": 730000
    },
    {
      "epoch": 44.32,
      "learning_rate": 8.923229779746375e-06,
      "loss": 0.0987,
      "step": 730500
    },
    {
      "epoch": 44.35,
      "learning_rate": 8.915660457496512e-06,
      "loss": 0.0982,
      "step": 731000
    },
    {
      "epoch": 44.38,
      "learning_rate": 8.908091135246648e-06,
      "loss": 0.0954,
      "step": 731500
    },
    {
      "epoch": 44.41,
      "learning_rate": 8.90050664401432e-06,
      "loss": 0.0973,
      "step": 732000
    },
    {
      "epoch": 44.45,
      "learning_rate": 8.892922152781992e-06,
      "loss": 0.0968,
      "step": 732500
    },
    {
      "epoch": 44.48,
      "learning_rate": 8.885337661549665e-06,
      "loss": 0.0966,
      "step": 733000
    },
    {
      "epoch": 44.51,
      "learning_rate": 8.877753170317336e-06,
      "loss": 0.0962,
      "step": 733500
    },
    {
      "epoch": 44.54,
      "learning_rate": 8.870168679085007e-06,
      "loss": 0.0946,
      "step": 734000
    },
    {
      "epoch": 44.57,
      "learning_rate": 8.86258418785268e-06,
      "loss": 0.1004,
      "step": 734500
    },
    {
      "epoch": 44.6,
      "learning_rate": 8.854999696620351e-06,
      "loss": 0.0983,
      "step": 735000
    },
    {
      "epoch": 44.63,
      "learning_rate": 8.847415205388024e-06,
      "loss": 0.0979,
      "step": 735500
    },
    {
      "epoch": 44.66,
      "learning_rate": 8.839830714155696e-06,
      "loss": 0.0976,
      "step": 736000
    },
    {
      "epoch": 44.69,
      "learning_rate": 8.832246222923367e-06,
      "loss": 0.0984,
      "step": 736500
    },
    {
      "epoch": 44.72,
      "learning_rate": 8.824661731691038e-06,
      "loss": 0.099,
      "step": 737000
    },
    {
      "epoch": 44.75,
      "learning_rate": 8.817092409441175e-06,
      "loss": 0.0983,
      "step": 737500
    },
    {
      "epoch": 44.78,
      "learning_rate": 8.809507918208846e-06,
      "loss": 0.0969,
      "step": 738000
    },
    {
      "epoch": 44.81,
      "learning_rate": 8.80192342697652e-06,
      "loss": 0.0979,
      "step": 738500
    },
    {
      "epoch": 44.84,
      "learning_rate": 8.794354104726656e-06,
      "loss": 0.0963,
      "step": 739000
    },
    {
      "epoch": 44.87,
      "learning_rate": 8.786769613494328e-06,
      "loss": 0.098,
      "step": 739500
    },
    {
      "epoch": 44.9,
      "learning_rate": 8.779185122261999e-06,
      "loss": 0.0979,
      "step": 740000
    },
    {
      "epoch": 44.93,
      "learning_rate": 8.77160063102967e-06,
      "loss": 0.0995,
      "step": 740500
    },
    {
      "epoch": 44.96,
      "learning_rate": 8.764016139797343e-06,
      "loss": 0.0956,
      "step": 741000
    },
    {
      "epoch": 44.99,
      "learning_rate": 8.756446817547479e-06,
      "loss": 0.1002,
      "step": 741500
    },
    {
      "epoch": 45.0,
      "eval_bleu": 81.3575,
      "eval_gen_len": 14.1571,
      "eval_loss": 0.16723676025867462,
      "eval_runtime": 178.3486,
      "eval_samples_per_second": 90.407,
      "eval_steps_per_second": 2.826,
      "step": 741645
    },
    {
      "epoch": 45.02,
      "learning_rate": 8.748862326315151e-06,
      "loss": 0.0968,
      "step": 742000
    },
    {
      "epoch": 45.05,
      "learning_rate": 8.741277835082823e-06,
      "loss": 0.0942,
      "step": 742500
    },
    {
      "epoch": 45.08,
      "learning_rate": 8.733693343850496e-06,
      "loss": 0.0955,
      "step": 743000
    },
    {
      "epoch": 45.11,
      "learning_rate": 8.726108852618167e-06,
      "loss": 0.0939,
      "step": 743500
    },
    {
      "epoch": 45.14,
      "learning_rate": 8.71852436138584e-06,
      "loss": 0.0937,
      "step": 744000
    },
    {
      "epoch": 45.17,
      "learning_rate": 8.710939870153511e-06,
      "loss": 0.0963,
      "step": 744500
    },
    {
      "epoch": 45.2,
      "learning_rate": 8.703355378921182e-06,
      "loss": 0.0956,
      "step": 745000
    },
    {
      "epoch": 45.23,
      "learning_rate": 8.69578605667132e-06,
      "loss": 0.097,
      "step": 745500
    },
    {
      "epoch": 45.26,
      "learning_rate": 8.688216734421455e-06,
      "loss": 0.0942,
      "step": 746000
    },
    {
      "epoch": 45.29,
      "learning_rate": 8.680632243189128e-06,
      "loss": 0.0945,
      "step": 746500
    },
    {
      "epoch": 45.32,
      "learning_rate": 8.673047751956799e-06,
      "loss": 0.0945,
      "step": 747000
    },
    {
      "epoch": 45.36,
      "learning_rate": 8.665463260724472e-06,
      "loss": 0.0956,
      "step": 747500
    },
    {
      "epoch": 45.39,
      "learning_rate": 8.657878769492143e-06,
      "loss": 0.0974,
      "step": 748000
    },
    {
      "epoch": 45.42,
      "learning_rate": 8.65030944724228e-06,
      "loss": 0.0963,
      "step": 748500
    },
    {
      "epoch": 45.45,
      "learning_rate": 8.642724956009952e-06,
      "loss": 0.0948,
      "step": 749000
    },
    {
      "epoch": 45.48,
      "learning_rate": 8.635140464777624e-06,
      "loss": 0.0976,
      "step": 749500
    },
    {
      "epoch": 45.51,
      "learning_rate": 8.627555973545296e-06,
      "loss": 0.0956,
      "step": 750000
    },
    {
      "epoch": 45.54,
      "learning_rate": 8.619971482312967e-06,
      "loss": 0.0947,
      "step": 750500
    },
    {
      "epoch": 45.57,
      "learning_rate": 8.612386991080638e-06,
      "loss": 0.097,
      "step": 751000
    },
    {
      "epoch": 45.6,
      "learning_rate": 8.604802499848311e-06,
      "loss": 0.0932,
      "step": 751500
    },
    {
      "epoch": 45.63,
      "learning_rate": 8.597218008615982e-06,
      "loss": 0.094,
      "step": 752000
    },
    {
      "epoch": 45.66,
      "learning_rate": 8.589663855348584e-06,
      "loss": 0.0953,
      "step": 752500
    },
    {
      "epoch": 45.69,
      "learning_rate": 8.582079364116257e-06,
      "loss": 0.0957,
      "step": 753000
    },
    {
      "epoch": 45.72,
      "learning_rate": 8.574510041866392e-06,
      "loss": 0.0981,
      "step": 753500
    },
    {
      "epoch": 45.75,
      "learning_rate": 8.566925550634065e-06,
      "loss": 0.0956,
      "step": 754000
    },
    {
      "epoch": 45.78,
      "learning_rate": 8.559341059401736e-06,
      "loss": 0.0955,
      "step": 754500
    },
    {
      "epoch": 45.81,
      "learning_rate": 8.551756568169407e-06,
      "loss": 0.1007,
      "step": 755000
    },
    {
      "epoch": 45.84,
      "learning_rate": 8.544172076937079e-06,
      "loss": 0.0996,
      "step": 755500
    },
    {
      "epoch": 45.87,
      "learning_rate": 8.536587585704752e-06,
      "loss": 0.0957,
      "step": 756000
    },
    {
      "epoch": 45.9,
      "learning_rate": 8.529003094472423e-06,
      "loss": 0.0977,
      "step": 756500
    },
    {
      "epoch": 45.93,
      "learning_rate": 8.521418603240096e-06,
      "loss": 0.0952,
      "step": 757000
    },
    {
      "epoch": 45.96,
      "learning_rate": 8.513834112007767e-06,
      "loss": 0.0966,
      "step": 757500
    },
    {
      "epoch": 45.99,
      "learning_rate": 8.506249620775438e-06,
      "loss": 0.0957,
      "step": 758000
    },
    {
      "epoch": 46.0,
      "eval_bleu": 81.2624,
      "eval_gen_len": 14.1363,
      "eval_loss": 0.16791266202926636,
      "eval_runtime": 178.4651,
      "eval_samples_per_second": 90.348,
      "eval_steps_per_second": 2.824,
      "step": 758126
    },
    {
      "epoch": 46.02,
      "learning_rate": 8.498680298525575e-06,
      "loss": 0.0937,
      "step": 758500
    },
    {
      "epoch": 46.05,
      "learning_rate": 8.491095807293247e-06,
      "loss": 0.0933,
      "step": 759000
    },
    {
      "epoch": 46.08,
      "learning_rate": 8.48351131606092e-06,
      "loss": 0.0949,
      "step": 759500
    },
    {
      "epoch": 46.11,
      "learning_rate": 8.47592682482859e-06,
      "loss": 0.094,
      "step": 760000
    },
    {
      "epoch": 46.14,
      "learning_rate": 8.468357502578728e-06,
      "loss": 0.0919,
      "step": 760500
    },
    {
      "epoch": 46.17,
      "learning_rate": 8.4607730113464e-06,
      "loss": 0.0934,
      "step": 761000
    },
    {
      "epoch": 46.2,
      "learning_rate": 8.453188520114072e-06,
      "loss": 0.0947,
      "step": 761500
    },
    {
      "epoch": 46.24,
      "learning_rate": 8.445604028881743e-06,
      "loss": 0.0951,
      "step": 762000
    },
    {
      "epoch": 46.27,
      "learning_rate": 8.438019537649416e-06,
      "loss": 0.094,
      "step": 762500
    },
    {
      "epoch": 46.3,
      "learning_rate": 8.430450215399552e-06,
      "loss": 0.0931,
      "step": 763000
    },
    {
      "epoch": 46.33,
      "learning_rate": 8.422865724167225e-06,
      "loss": 0.0947,
      "step": 763500
    },
    {
      "epoch": 46.36,
      "learning_rate": 8.415281232934896e-06,
      "loss": 0.094,
      "step": 764000
    },
    {
      "epoch": 46.39,
      "learning_rate": 8.407696741702567e-06,
      "loss": 0.0927,
      "step": 764500
    },
    {
      "epoch": 46.42,
      "learning_rate": 8.40011225047024e-06,
      "loss": 0.0945,
      "step": 765000
    },
    {
      "epoch": 46.45,
      "learning_rate": 8.392527759237911e-06,
      "loss": 0.0951,
      "step": 765500
    },
    {
      "epoch": 46.48,
      "learning_rate": 8.384958436988048e-06,
      "loss": 0.0933,
      "step": 766000
    },
    {
      "epoch": 46.51,
      "learning_rate": 8.37737394575572e-06,
      "loss": 0.0941,
      "step": 766500
    },
    {
      "epoch": 46.54,
      "learning_rate": 8.369804623505857e-06,
      "loss": 0.0952,
      "step": 767000
    },
    {
      "epoch": 46.57,
      "learning_rate": 8.362220132273528e-06,
      "loss": 0.093,
      "step": 767500
    },
    {
      "epoch": 46.6,
      "learning_rate": 8.3546356410412e-06,
      "loss": 0.0954,
      "step": 768000
    },
    {
      "epoch": 46.63,
      "learning_rate": 8.34705114980887e-06,
      "loss": 0.0955,
      "step": 768500
    },
    {
      "epoch": 46.66,
      "learning_rate": 8.339466658576543e-06,
      "loss": 0.0932,
      "step": 769000
    },
    {
      "epoch": 46.69,
      "learning_rate": 8.331882167344215e-06,
      "loss": 0.0934,
      "step": 769500
    },
    {
      "epoch": 46.72,
      "learning_rate": 8.324297676111886e-06,
      "loss": 0.0939,
      "step": 770000
    },
    {
      "epoch": 46.75,
      "learning_rate": 8.316713184879559e-06,
      "loss": 0.0941,
      "step": 770500
    },
    {
      "epoch": 46.78,
      "learning_rate": 8.30912869364723e-06,
      "loss": 0.0966,
      "step": 771000
    },
    {
      "epoch": 46.81,
      "learning_rate": 8.301559371397367e-06,
      "loss": 0.0963,
      "step": 771500
    },
    {
      "epoch": 46.84,
      "learning_rate": 8.293974880165039e-06,
      "loss": 0.0924,
      "step": 772000
    },
    {
      "epoch": 46.87,
      "learning_rate": 8.286390388932711e-06,
      "loss": 0.0957,
      "step": 772500
    },
    {
      "epoch": 46.9,
      "learning_rate": 8.278805897700383e-06,
      "loss": 0.0963,
      "step": 773000
    },
    {
      "epoch": 46.93,
      "learning_rate": 8.271221406468056e-06,
      "loss": 0.0948,
      "step": 773500
    },
    {
      "epoch": 46.96,
      "learning_rate": 8.263636915235727e-06,
      "loss": 0.0978,
      "step": 774000
    },
    {
      "epoch": 46.99,
      "learning_rate": 8.256067592985864e-06,
      "loss": 0.0963,
      "step": 774500
    },
    {
      "epoch": 47.0,
      "eval_bleu": 81.339,
      "eval_gen_len": 14.1472,
      "eval_loss": 0.16813451051712036,
      "eval_runtime": 178.5484,
      "eval_samples_per_second": 90.306,
      "eval_steps_per_second": 2.823,
      "step": 774607
    },
    {
      "epoch": 47.02,
      "learning_rate": 8.248483101753535e-06,
      "loss": 0.0917,
      "step": 775000
    },
    {
      "epoch": 47.05,
      "learning_rate": 8.240898610521208e-06,
      "loss": 0.0903,
      "step": 775500
    },
    {
      "epoch": 47.08,
      "learning_rate": 8.23331411928888e-06,
      "loss": 0.094,
      "step": 776000
    },
    {
      "epoch": 47.11,
      "learning_rate": 8.225744797039017e-06,
      "loss": 0.0927,
      "step": 776500
    },
    {
      "epoch": 47.15,
      "learning_rate": 8.218160305806688e-06,
      "loss": 0.0906,
      "step": 777000
    },
    {
      "epoch": 47.18,
      "learning_rate": 8.210575814574359e-06,
      "loss": 0.0925,
      "step": 777500
    },
    {
      "epoch": 47.21,
      "learning_rate": 8.20299132334203e-06,
      "loss": 0.0925,
      "step": 778000
    },
    {
      "epoch": 47.24,
      "learning_rate": 8.195406832109703e-06,
      "loss": 0.0932,
      "step": 778500
    },
    {
      "epoch": 47.27,
      "learning_rate": 8.187822340877374e-06,
      "loss": 0.0928,
      "step": 779000
    },
    {
      "epoch": 47.3,
      "learning_rate": 8.180237849645046e-06,
      "loss": 0.0941,
      "step": 779500
    },
    {
      "epoch": 47.33,
      "learning_rate": 8.172668527395183e-06,
      "loss": 0.0902,
      "step": 780000
    },
    {
      "epoch": 47.36,
      "learning_rate": 8.165084036162854e-06,
      "loss": 0.0922,
      "step": 780500
    },
    {
      "epoch": 47.39,
      "learning_rate": 8.157514713912991e-06,
      "loss": 0.0929,
      "step": 781000
    },
    {
      "epoch": 47.42,
      "learning_rate": 8.149930222680662e-06,
      "loss": 0.0939,
      "step": 781500
    },
    {
      "epoch": 47.45,
      "learning_rate": 8.142345731448335e-06,
      "loss": 0.0942,
      "step": 782000
    },
    {
      "epoch": 47.48,
      "learning_rate": 8.134761240216007e-06,
      "loss": 0.093,
      "step": 782500
    },
    {
      "epoch": 47.51,
      "learning_rate": 8.127176748983678e-06,
      "loss": 0.0916,
      "step": 783000
    },
    {
      "epoch": 47.54,
      "learning_rate": 8.11959225775135e-06,
      "loss": 0.0931,
      "step": 783500
    },
    {
      "epoch": 47.57,
      "learning_rate": 8.112007766519022e-06,
      "loss": 0.0923,
      "step": 784000
    },
    {
      "epoch": 47.6,
      "learning_rate": 8.104423275286695e-06,
      "loss": 0.0928,
      "step": 784500
    },
    {
      "epoch": 47.63,
      "learning_rate": 8.096838784054366e-06,
      "loss": 0.0933,
      "step": 785000
    },
    {
      "epoch": 47.66,
      "learning_rate": 8.089254292822039e-06,
      "loss": 0.0935,
      "step": 785500
    },
    {
      "epoch": 47.69,
      "learning_rate": 8.08166980158971e-06,
      "loss": 0.0922,
      "step": 786000
    },
    {
      "epoch": 47.72,
      "learning_rate": 8.074085310357382e-06,
      "loss": 0.0941,
      "step": 786500
    },
    {
      "epoch": 47.75,
      "learning_rate": 8.066515988107519e-06,
      "loss": 0.0933,
      "step": 787000
    },
    {
      "epoch": 47.78,
      "learning_rate": 8.05893149687519e-06,
      "loss": 0.0939,
      "step": 787500
    },
    {
      "epoch": 47.81,
      "learning_rate": 8.051347005642863e-06,
      "loss": 0.093,
      "step": 788000
    },
    {
      "epoch": 47.84,
      "learning_rate": 8.043762514410534e-06,
      "loss": 0.095,
      "step": 788500
    },
    {
      "epoch": 47.87,
      "learning_rate": 8.036193192160671e-06,
      "loss": 0.0941,
      "step": 789000
    },
    {
      "epoch": 47.9,
      "learning_rate": 8.028608700928342e-06,
      "loss": 0.0957,
      "step": 789500
    },
    {
      "epoch": 47.93,
      "learning_rate": 8.02103937867848e-06,
      "loss": 0.0935,
      "step": 790000
    },
    {
      "epoch": 47.96,
      "learning_rate": 8.01345488744615e-06,
      "loss": 0.0941,
      "step": 790500
    },
    {
      "epoch": 47.99,
      "learning_rate": 8.005885565196288e-06,
      "loss": 0.0929,
      "step": 791000
    },
    {
      "epoch": 48.0,
      "eval_bleu": 81.3094,
      "eval_gen_len": 14.1392,
      "eval_loss": 0.16808539628982544,
      "eval_runtime": 178.2856,
      "eval_samples_per_second": 90.439,
      "eval_steps_per_second": 2.827,
      "step": 791088
    },
    {
      "epoch": 48.02,
      "learning_rate": 7.99830107396396e-06,
      "loss": 0.0911,
      "step": 791500
    },
    {
      "epoch": 48.06,
      "learning_rate": 7.990716582731632e-06,
      "loss": 0.0914,
      "step": 792000
    },
    {
      "epoch": 48.09,
      "learning_rate": 7.983132091499303e-06,
      "loss": 0.0919,
      "step": 792500
    },
    {
      "epoch": 48.12,
      "learning_rate": 7.975547600266975e-06,
      "loss": 0.0893,
      "step": 793000
    },
    {
      "epoch": 48.15,
      "learning_rate": 7.967963109034646e-06,
      "loss": 0.089,
      "step": 793500
    },
    {
      "epoch": 48.18,
      "learning_rate": 7.960378617802319e-06,
      "loss": 0.0903,
      "step": 794000
    },
    {
      "epoch": 48.21,
      "learning_rate": 7.95279412656999e-06,
      "loss": 0.0927,
      "step": 794500
    },
    {
      "epoch": 48.24,
      "learning_rate": 7.945209635337661e-06,
      "loss": 0.0933,
      "step": 795000
    },
    {
      "epoch": 48.27,
      "learning_rate": 7.937640313087798e-06,
      "loss": 0.0919,
      "step": 795500
    },
    {
      "epoch": 48.3,
      "learning_rate": 7.93005582185547e-06,
      "loss": 0.0903,
      "step": 796000
    },
    {
      "epoch": 48.33,
      "learning_rate": 7.922471330623143e-06,
      "loss": 0.0928,
      "step": 796500
    },
    {
      "epoch": 48.36,
      "learning_rate": 7.914886839390814e-06,
      "loss": 0.0925,
      "step": 797000
    },
    {
      "epoch": 48.39,
      "learning_rate": 7.907302348158487e-06,
      "loss": 0.0916,
      "step": 797500
    },
    {
      "epoch": 48.42,
      "learning_rate": 7.899717856926158e-06,
      "loss": 0.0943,
      "step": 798000
    },
    {
      "epoch": 48.45,
      "learning_rate": 7.892148534676295e-06,
      "loss": 0.0897,
      "step": 798500
    },
    {
      "epoch": 48.48,
      "learning_rate": 7.884564043443966e-06,
      "loss": 0.0908,
      "step": 799000
    },
    {
      "epoch": 48.51,
      "learning_rate": 7.87697955221164e-06,
      "loss": 0.0933,
      "step": 799500
    },
    {
      "epoch": 48.54,
      "learning_rate": 7.86939506097931e-06,
      "loss": 0.0925,
      "step": 800000
    },
    {
      "epoch": 48.57,
      "learning_rate": 7.861810569746982e-06,
      "loss": 0.0923,
      "step": 800500
    },
    {
      "epoch": 48.6,
      "learning_rate": 7.854241247497119e-06,
      "loss": 0.0923,
      "step": 801000
    },
    {
      "epoch": 48.63,
      "learning_rate": 7.84665675626479e-06,
      "loss": 0.091,
      "step": 801500
    },
    {
      "epoch": 48.66,
      "learning_rate": 7.839072265032463e-06,
      "loss": 0.0929,
      "step": 802000
    },
    {
      "epoch": 48.69,
      "learning_rate": 7.831487773800134e-06,
      "loss": 0.0954,
      "step": 802500
    },
    {
      "epoch": 48.72,
      "learning_rate": 7.823918451550271e-06,
      "loss": 0.092,
      "step": 803000
    },
    {
      "epoch": 48.75,
      "learning_rate": 7.816333960317943e-06,
      "loss": 0.092,
      "step": 803500
    },
    {
      "epoch": 48.78,
      "learning_rate": 7.808749469085614e-06,
      "loss": 0.0893,
      "step": 804000
    },
    {
      "epoch": 48.81,
      "learning_rate": 7.801164977853287e-06,
      "loss": 0.0913,
      "step": 804500
    },
    {
      "epoch": 48.84,
      "learning_rate": 7.793580486620958e-06,
      "loss": 0.0918,
      "step": 805000
    },
    {
      "epoch": 48.87,
      "learning_rate": 7.786011164371095e-06,
      "loss": 0.093,
      "step": 805500
    },
    {
      "epoch": 48.9,
      "learning_rate": 7.778426673138766e-06,
      "loss": 0.0937,
      "step": 806000
    },
    {
      "epoch": 48.94,
      "learning_rate": 7.770842181906438e-06,
      "loss": 0.0904,
      "step": 806500
    },
    {
      "epoch": 48.97,
      "learning_rate": 7.763257690674109e-06,
      "loss": 0.0962,
      "step": 807000
    },
    {
      "epoch": 49.0,
      "learning_rate": 7.755673199441782e-06,
      "loss": 0.0916,
      "step": 807500
    },
    {
      "epoch": 49.0,
      "eval_bleu": 81.294,
      "eval_gen_len": 14.1299,
      "eval_loss": 0.16902963817119598,
      "eval_runtime": 178.1975,
      "eval_samples_per_second": 90.484,
      "eval_steps_per_second": 2.828,
      "step": 807569
    },
    {
      "epoch": 49.03,
      "learning_rate": 7.748103877191917e-06,
      "loss": 0.0899,
      "step": 808000
    },
    {
      "epoch": 49.06,
      "learning_rate": 7.74051938595959e-06,
      "loss": 0.0887,
      "step": 808500
    },
    {
      "epoch": 49.09,
      "learning_rate": 7.732934894727261e-06,
      "loss": 0.0899,
      "step": 809000
    },
    {
      "epoch": 49.12,
      "learning_rate": 7.725350403494934e-06,
      "loss": 0.0889,
      "step": 809500
    },
    {
      "epoch": 49.15,
      "learning_rate": 7.71778108124507e-06,
      "loss": 0.0909,
      "step": 810000
    },
    {
      "epoch": 49.18,
      "learning_rate": 7.710196590012743e-06,
      "loss": 0.0898,
      "step": 810500
    },
    {
      "epoch": 49.21,
      "learning_rate": 7.702612098780414e-06,
      "loss": 0.0903,
      "step": 811000
    },
    {
      "epoch": 49.24,
      "learning_rate": 7.695027607548087e-06,
      "loss": 0.0886,
      "step": 811500
    },
    {
      "epoch": 49.27,
      "learning_rate": 7.687443116315758e-06,
      "loss": 0.0909,
      "step": 812000
    },
    {
      "epoch": 49.3,
      "learning_rate": 7.67985862508343e-06,
      "loss": 0.0901,
      "step": 812500
    },
    {
      "epoch": 49.33,
      "learning_rate": 7.672289302833567e-06,
      "loss": 0.0901,
      "step": 813000
    },
    {
      "epoch": 49.36,
      "learning_rate": 7.664704811601238e-06,
      "loss": 0.0913,
      "step": 813500
    },
    {
      "epoch": 49.39,
      "learning_rate": 7.65712032036891e-06,
      "loss": 0.0912,
      "step": 814000
    },
    {
      "epoch": 49.42,
      "learning_rate": 7.649535829136582e-06,
      "loss": 0.0903,
      "step": 814500
    },
    {
      "epoch": 49.45,
      "learning_rate": 7.641951337904255e-06,
      "loss": 0.0917,
      "step": 815000
    },
    {
      "epoch": 49.48,
      "learning_rate": 7.634366846671926e-06,
      "loss": 0.0896,
      "step": 815500
    },
    {
      "epoch": 49.51,
      "learning_rate": 7.626782355439598e-06,
      "loss": 0.0912,
      "step": 816000
    },
    {
      "epoch": 49.54,
      "learning_rate": 7.6191978642072695e-06,
      "loss": 0.089,
      "step": 816500
    },
    {
      "epoch": 49.57,
      "learning_rate": 7.611628541957407e-06,
      "loss": 0.0919,
      "step": 817000
    },
    {
      "epoch": 49.6,
      "learning_rate": 7.604044050725078e-06,
      "loss": 0.092,
      "step": 817500
    },
    {
      "epoch": 49.63,
      "learning_rate": 7.596459559492751e-06,
      "loss": 0.0916,
      "step": 818000
    },
    {
      "epoch": 49.66,
      "learning_rate": 7.588875068260422e-06,
      "loss": 0.0882,
      "step": 818500
    },
    {
      "epoch": 49.69,
      "learning_rate": 7.5813057460105575e-06,
      "loss": 0.0918,
      "step": 819000
    },
    {
      "epoch": 49.72,
      "learning_rate": 7.57372125477823e-06,
      "loss": 0.0904,
      "step": 819500
    },
    {
      "epoch": 49.75,
      "learning_rate": 7.566136763545902e-06,
      "loss": 0.0916,
      "step": 820000
    },
    {
      "epoch": 49.78,
      "learning_rate": 7.558567441296039e-06,
      "loss": 0.0902,
      "step": 820500
    },
    {
      "epoch": 49.81,
      "learning_rate": 7.55098295006371e-06,
      "loss": 0.0918,
      "step": 821000
    },
    {
      "epoch": 49.85,
      "learning_rate": 7.543398458831382e-06,
      "loss": 0.0892,
      "step": 821500
    },
    {
      "epoch": 49.88,
      "learning_rate": 7.535813967599054e-06,
      "loss": 0.0914,
      "step": 822000
    },
    {
      "epoch": 49.91,
      "learning_rate": 7.528229476366726e-06,
      "loss": 0.0906,
      "step": 822500
    },
    {
      "epoch": 49.94,
      "learning_rate": 7.5206601541168625e-06,
      "loss": 0.0915,
      "step": 823000
    },
    {
      "epoch": 49.97,
      "learning_rate": 7.513075662884535e-06,
      "loss": 0.0919,
      "step": 823500
    },
    {
      "epoch": 50.0,
      "learning_rate": 7.505491171652206e-06,
      "loss": 0.0918,
      "step": 824000
    },
    {
      "epoch": 50.0,
      "eval_bleu": 81.2345,
      "eval_gen_len": 14.1368,
      "eval_loss": 0.16936491429805756,
      "eval_runtime": 178.0893,
      "eval_samples_per_second": 90.539,
      "eval_steps_per_second": 2.83,
      "step": 824050
    },
    {
      "epoch": 50.03,
      "learning_rate": 7.497906680419879e-06,
      "loss": 0.0893,
      "step": 824500
    },
    {
      "epoch": 50.06,
      "learning_rate": 7.49032218918755e-06,
      "loss": 0.0881,
      "step": 825000
    },
    {
      "epoch": 50.09,
      "learning_rate": 7.482737697955221e-06,
      "loss": 0.0873,
      "step": 825500
    },
    {
      "epoch": 50.12,
      "learning_rate": 7.475168375705358e-06,
      "loss": 0.0892,
      "step": 826000
    },
    {
      "epoch": 50.15,
      "learning_rate": 7.46758388447303e-06,
      "loss": 0.0892,
      "step": 826500
    },
    {
      "epoch": 50.18,
      "learning_rate": 7.459999393240703e-06,
      "loss": 0.0907,
      "step": 827000
    },
    {
      "epoch": 50.21,
      "learning_rate": 7.452414902008374e-06,
      "loss": 0.0877,
      "step": 827500
    },
    {
      "epoch": 50.24,
      "learning_rate": 7.444830410776046e-06,
      "loss": 0.0893,
      "step": 828000
    },
    {
      "epoch": 50.27,
      "learning_rate": 7.437245919543717e-06,
      "loss": 0.0901,
      "step": 828500
    },
    {
      "epoch": 50.3,
      "learning_rate": 7.42966142831139e-06,
      "loss": 0.09,
      "step": 829000
    },
    {
      "epoch": 50.33,
      "learning_rate": 7.422076937079061e-06,
      "loss": 0.0872,
      "step": 829500
    },
    {
      "epoch": 50.36,
      "learning_rate": 7.414522783811663e-06,
      "loss": 0.0892,
      "step": 830000
    },
    {
      "epoch": 50.39,
      "learning_rate": 7.406938292579334e-06,
      "loss": 0.0883,
      "step": 830500
    },
    {
      "epoch": 50.42,
      "learning_rate": 7.399353801347007e-06,
      "loss": 0.0896,
      "step": 831000
    },
    {
      "epoch": 50.45,
      "learning_rate": 7.391769310114678e-06,
      "loss": 0.0871,
      "step": 831500
    },
    {
      "epoch": 50.48,
      "learning_rate": 7.384184818882349e-06,
      "loss": 0.0913,
      "step": 832000
    },
    {
      "epoch": 50.51,
      "learning_rate": 7.376600327650022e-06,
      "loss": 0.0898,
      "step": 832500
    },
    {
      "epoch": 50.54,
      "learning_rate": 7.3690158364176935e-06,
      "loss": 0.0899,
      "step": 833000
    },
    {
      "epoch": 50.57,
      "learning_rate": 7.3614313451853656e-06,
      "loss": 0.0902,
      "step": 833500
    },
    {
      "epoch": 50.6,
      "learning_rate": 7.353862022935502e-06,
      "loss": 0.0916,
      "step": 834000
    },
    {
      "epoch": 50.63,
      "learning_rate": 7.346277531703174e-06,
      "loss": 0.0918,
      "step": 834500
    },
    {
      "epoch": 50.66,
      "learning_rate": 7.338693040470846e-06,
      "loss": 0.0907,
      "step": 835000
    },
    {
      "epoch": 50.69,
      "learning_rate": 7.331108549238518e-06,
      "loss": 0.0891,
      "step": 835500
    },
    {
      "epoch": 50.73,
      "learning_rate": 7.323524058006189e-06,
      "loss": 0.0898,
      "step": 836000
    },
    {
      "epoch": 50.76,
      "learning_rate": 7.315939566773861e-06,
      "loss": 0.0908,
      "step": 836500
    },
    {
      "epoch": 50.79,
      "learning_rate": 7.3083550755415335e-06,
      "loss": 0.0904,
      "step": 837000
    },
    {
      "epoch": 50.82,
      "learning_rate": 7.300770584309205e-06,
      "loss": 0.0899,
      "step": 837500
    },
    {
      "epoch": 50.85,
      "learning_rate": 7.293186093076877e-06,
      "loss": 0.0902,
      "step": 838000
    },
    {
      "epoch": 50.88,
      "learning_rate": 7.285601601844549e-06,
      "loss": 0.0899,
      "step": 838500
    },
    {
      "epoch": 50.91,
      "learning_rate": 7.278032279594685e-06,
      "loss": 0.0891,
      "step": 839000
    },
    {
      "epoch": 50.94,
      "learning_rate": 7.270447788362357e-06,
      "loss": 0.0913,
      "step": 839500
    },
    {
      "epoch": 50.97,
      "learning_rate": 7.262863297130029e-06,
      "loss": 0.0903,
      "step": 840000
    },
    {
      "epoch": 51.0,
      "learning_rate": 7.255278805897701e-06,
      "loss": 0.0898,
      "step": 840500
    },
    {
      "epoch": 51.0,
      "eval_bleu": 81.3532,
      "eval_gen_len": 14.1407,
      "eval_loss": 0.1701522320508957,
      "eval_runtime": 178.4826,
      "eval_samples_per_second": 90.339,
      "eval_steps_per_second": 2.824,
      "step": 840531
    },
    {
      "epoch": 51.03,
      "learning_rate": 7.247694314665374e-06,
      "loss": 0.0886,
      "step": 841000
    },
    {
      "epoch": 51.06,
      "learning_rate": 7.240109823433045e-06,
      "loss": 0.088,
      "step": 841500
    },
    {
      "epoch": 51.09,
      "learning_rate": 7.232540501183182e-06,
      "loss": 0.089,
      "step": 842000
    },
    {
      "epoch": 51.12,
      "learning_rate": 7.224956009950853e-06,
      "loss": 0.0868,
      "step": 842500
    },
    {
      "epoch": 51.15,
      "learning_rate": 7.2173715187185244e-06,
      "loss": 0.0882,
      "step": 843000
    },
    {
      "epoch": 51.18,
      "learning_rate": 7.209787027486197e-06,
      "loss": 0.0886,
      "step": 843500
    },
    {
      "epoch": 51.21,
      "learning_rate": 7.202202536253869e-06,
      "loss": 0.0867,
      "step": 844000
    },
    {
      "epoch": 51.24,
      "learning_rate": 7.194618045021541e-06,
      "loss": 0.0873,
      "step": 844500
    },
    {
      "epoch": 51.27,
      "learning_rate": 7.187033553789212e-06,
      "loss": 0.0886,
      "step": 845000
    },
    {
      "epoch": 51.3,
      "learning_rate": 7.179449062556885e-06,
      "loss": 0.0872,
      "step": 845500
    },
    {
      "epoch": 51.33,
      "learning_rate": 7.17187974030702e-06,
      "loss": 0.0874,
      "step": 846000
    },
    {
      "epoch": 51.36,
      "learning_rate": 7.164295249074693e-06,
      "loss": 0.0881,
      "step": 846500
    },
    {
      "epoch": 51.39,
      "learning_rate": 7.1567107578423645e-06,
      "loss": 0.0867,
      "step": 847000
    },
    {
      "epoch": 51.42,
      "learning_rate": 7.149126266610036e-06,
      "loss": 0.0882,
      "step": 847500
    },
    {
      "epoch": 51.45,
      "learning_rate": 7.141572113342638e-06,
      "loss": 0.0897,
      "step": 848000
    },
    {
      "epoch": 51.48,
      "learning_rate": 7.13398762211031e-06,
      "loss": 0.0875,
      "step": 848500
    },
    {
      "epoch": 51.51,
      "learning_rate": 7.126403130877981e-06,
      "loss": 0.0874,
      "step": 849000
    },
    {
      "epoch": 51.54,
      "learning_rate": 7.1188186396456524e-06,
      "loss": 0.0894,
      "step": 849500
    },
    {
      "epoch": 51.57,
      "learning_rate": 7.111234148413325e-06,
      "loss": 0.0878,
      "step": 850000
    },
    {
      "epoch": 51.6,
      "learning_rate": 7.103649657180997e-06,
      "loss": 0.0886,
      "step": 850500
    },
    {
      "epoch": 51.64,
      "learning_rate": 7.096065165948669e-06,
      "loss": 0.09,
      "step": 851000
    },
    {
      "epoch": 51.67,
      "learning_rate": 7.08848067471634e-06,
      "loss": 0.0897,
      "step": 851500
    },
    {
      "epoch": 51.7,
      "learning_rate": 7.080926521448942e-06,
      "loss": 0.0896,
      "step": 852000
    },
    {
      "epoch": 51.73,
      "learning_rate": 7.073342030216613e-06,
      "loss": 0.0877,
      "step": 852500
    },
    {
      "epoch": 51.76,
      "learning_rate": 7.065757538984286e-06,
      "loss": 0.089,
      "step": 853000
    },
    {
      "epoch": 51.79,
      "learning_rate": 7.0581730477519575e-06,
      "loss": 0.0893,
      "step": 853500
    },
    {
      "epoch": 51.82,
      "learning_rate": 7.05058855651963e-06,
      "loss": 0.0897,
      "step": 854000
    },
    {
      "epoch": 51.85,
      "learning_rate": 7.043004065287301e-06,
      "loss": 0.0872,
      "step": 854500
    },
    {
      "epoch": 51.88,
      "learning_rate": 7.035419574054972e-06,
      "loss": 0.0877,
      "step": 855000
    },
    {
      "epoch": 51.91,
      "learning_rate": 7.027835082822645e-06,
      "loss": 0.0901,
      "step": 855500
    },
    {
      "epoch": 51.94,
      "learning_rate": 7.0202657605727804e-06,
      "loss": 0.0878,
      "step": 856000
    },
    {
      "epoch": 51.97,
      "learning_rate": 7.012681269340453e-06,
      "loss": 0.0901,
      "step": 856500
    },
    {
      "epoch": 52.0,
      "learning_rate": 7.005096778108125e-06,
      "loss": 0.0889,
      "step": 857000
    },
    {
      "epoch": 52.0,
      "eval_bleu": 81.286,
      "eval_gen_len": 14.1467,
      "eval_loss": 0.17058435082435608,
      "eval_runtime": 178.2603,
      "eval_samples_per_second": 90.452,
      "eval_steps_per_second": 2.827,
      "step": 857012
    },
    {
      "epoch": 52.03,
      "learning_rate": 6.9975122868757976e-06,
      "loss": 0.0847,
      "step": 857500
    },
    {
      "epoch": 52.06,
      "learning_rate": 6.989942964625933e-06,
      "loss": 0.0872,
      "step": 858000
    },
    {
      "epoch": 52.09,
      "learning_rate": 6.982358473393606e-06,
      "loss": 0.0868,
      "step": 858500
    },
    {
      "epoch": 52.12,
      "learning_rate": 6.974773982161277e-06,
      "loss": 0.0842,
      "step": 859000
    },
    {
      "epoch": 52.15,
      "learning_rate": 6.967204659911414e-06,
      "loss": 0.0865,
      "step": 859500
    },
    {
      "epoch": 52.18,
      "learning_rate": 6.9596201686790855e-06,
      "loss": 0.0862,
      "step": 860000
    },
    {
      "epoch": 52.21,
      "learning_rate": 6.952035677446758e-06,
      "loss": 0.0874,
      "step": 860500
    },
    {
      "epoch": 52.24,
      "learning_rate": 6.944451186214429e-06,
      "loss": 0.0897,
      "step": 861000
    },
    {
      "epoch": 52.27,
      "learning_rate": 6.936866694982101e-06,
      "loss": 0.0854,
      "step": 861500
    },
    {
      "epoch": 52.3,
      "learning_rate": 6.929282203749773e-06,
      "loss": 0.0866,
      "step": 862000
    },
    {
      "epoch": 52.33,
      "learning_rate": 6.921697712517444e-06,
      "loss": 0.0878,
      "step": 862500
    },
    {
      "epoch": 52.36,
      "learning_rate": 6.914128390267581e-06,
      "loss": 0.0867,
      "step": 863000
    },
    {
      "epoch": 52.39,
      "learning_rate": 6.906543899035253e-06,
      "loss": 0.0877,
      "step": 863500
    },
    {
      "epoch": 52.42,
      "learning_rate": 6.8989594078029256e-06,
      "loss": 0.0879,
      "step": 864000
    },
    {
      "epoch": 52.45,
      "learning_rate": 6.891374916570597e-06,
      "loss": 0.0893,
      "step": 864500
    },
    {
      "epoch": 52.48,
      "learning_rate": 6.883790425338269e-06,
      "loss": 0.0879,
      "step": 865000
    },
    {
      "epoch": 52.52,
      "learning_rate": 6.876205934105941e-06,
      "loss": 0.0851,
      "step": 865500
    },
    {
      "epoch": 52.55,
      "learning_rate": 6.868636611856077e-06,
      "loss": 0.0883,
      "step": 866000
    },
    {
      "epoch": 52.58,
      "learning_rate": 6.861052120623749e-06,
      "loss": 0.089,
      "step": 866500
    },
    {
      "epoch": 52.61,
      "learning_rate": 6.8534676293914214e-06,
      "loss": 0.0892,
      "step": 867000
    },
    {
      "epoch": 52.64,
      "learning_rate": 6.845883138159093e-06,
      "loss": 0.0878,
      "step": 867500
    },
    {
      "epoch": 52.67,
      "learning_rate": 6.838298646926764e-06,
      "loss": 0.0846,
      "step": 868000
    },
    {
      "epoch": 52.7,
      "learning_rate": 6.830714155694437e-06,
      "loss": 0.0863,
      "step": 868500
    },
    {
      "epoch": 52.73,
      "learning_rate": 6.823129664462108e-06,
      "loss": 0.0883,
      "step": 869000
    },
    {
      "epoch": 52.76,
      "learning_rate": 6.81554517322978e-06,
      "loss": 0.0879,
      "step": 869500
    },
    {
      "epoch": 52.79,
      "learning_rate": 6.8079758509799165e-06,
      "loss": 0.0882,
      "step": 870000
    },
    {
      "epoch": 52.82,
      "learning_rate": 6.800391359747589e-06,
      "loss": 0.0866,
      "step": 870500
    },
    {
      "epoch": 52.85,
      "learning_rate": 6.792806868515261e-06,
      "loss": 0.0883,
      "step": 871000
    },
    {
      "epoch": 52.88,
      "learning_rate": 6.785222377282933e-06,
      "loss": 0.0874,
      "step": 871500
    },
    {
      "epoch": 52.91,
      "learning_rate": 6.777653055033069e-06,
      "loss": 0.0852,
      "step": 872000
    },
    {
      "epoch": 52.94,
      "learning_rate": 6.770068563800741e-06,
      "loss": 0.0867,
      "step": 872500
    },
    {
      "epoch": 52.97,
      "learning_rate": 6.762484072568412e-06,
      "loss": 0.0876,
      "step": 873000
    },
    {
      "epoch": 53.0,
      "eval_bleu": 81.2699,
      "eval_gen_len": 14.1363,
      "eval_loss": 0.1710740476846695,
      "eval_runtime": 178.2258,
      "eval_samples_per_second": 90.47,
      "eval_steps_per_second": 2.828,
      "step": 873493
    },
    {
      "epoch": 53.0,
      "learning_rate": 6.7548995813360844e-06,
      "loss": 0.0885,
      "step": 873500
    },
    {
      "epoch": 53.03,
      "learning_rate": 6.747330259086221e-06,
      "loss": 0.0851,
      "step": 874000
    },
    {
      "epoch": 53.06,
      "learning_rate": 6.739745767853893e-06,
      "loss": 0.0841,
      "step": 874500
    },
    {
      "epoch": 53.09,
      "learning_rate": 6.732161276621565e-06,
      "loss": 0.0838,
      "step": 875000
    },
    {
      "epoch": 53.12,
      "learning_rate": 6.724576785389236e-06,
      "loss": 0.0861,
      "step": 875500
    },
    {
      "epoch": 53.15,
      "learning_rate": 6.717007463139373e-06,
      "loss": 0.0841,
      "step": 876000
    },
    {
      "epoch": 53.18,
      "learning_rate": 6.7094229719070445e-06,
      "loss": 0.0842,
      "step": 876500
    },
    {
      "epoch": 53.21,
      "learning_rate": 6.701838480674717e-06,
      "loss": 0.0843,
      "step": 877000
    },
    {
      "epoch": 53.24,
      "learning_rate": 6.694253989442389e-06,
      "loss": 0.0868,
      "step": 877500
    },
    {
      "epoch": 53.27,
      "learning_rate": 6.686669498210061e-06,
      "loss": 0.0848,
      "step": 878000
    },
    {
      "epoch": 53.3,
      "learning_rate": 6.679085006977733e-06,
      "loss": 0.0865,
      "step": 878500
    },
    {
      "epoch": 53.33,
      "learning_rate": 6.671500515745404e-06,
      "loss": 0.0859,
      "step": 879000
    },
    {
      "epoch": 53.36,
      "learning_rate": 6.663916024513076e-06,
      "loss": 0.0873,
      "step": 879500
    },
    {
      "epoch": 53.39,
      "learning_rate": 6.656361871245678e-06,
      "loss": 0.087,
      "step": 880000
    },
    {
      "epoch": 53.43,
      "learning_rate": 6.6487773800133495e-06,
      "loss": 0.0869,
      "step": 880500
    },
    {
      "epoch": 53.46,
      "learning_rate": 6.641192888781021e-06,
      "loss": 0.0862,
      "step": 881000
    },
    {
      "epoch": 53.49,
      "learning_rate": 6.633608397548693e-06,
      "loss": 0.0869,
      "step": 881500
    },
    {
      "epoch": 53.52,
      "learning_rate": 6.626023906316364e-06,
      "loss": 0.0854,
      "step": 882000
    },
    {
      "epoch": 53.55,
      "learning_rate": 6.618439415084037e-06,
      "loss": 0.0861,
      "step": 882500
    },
    {
      "epoch": 53.58,
      "learning_rate": 6.610854923851708e-06,
      "loss": 0.0872,
      "step": 883000
    },
    {
      "epoch": 53.61,
      "learning_rate": 6.603270432619381e-06,
      "loss": 0.0857,
      "step": 883500
    },
    {
      "epoch": 53.64,
      "learning_rate": 6.595701110369517e-06,
      "loss": 0.0866,
      "step": 884000
    },
    {
      "epoch": 53.67,
      "learning_rate": 6.58811661913719e-06,
      "loss": 0.0871,
      "step": 884500
    },
    {
      "epoch": 53.7,
      "learning_rate": 6.580532127904861e-06,
      "loss": 0.0858,
      "step": 885000
    },
    {
      "epoch": 53.73,
      "learning_rate": 6.572947636672532e-06,
      "loss": 0.0857,
      "step": 885500
    },
    {
      "epoch": 53.76,
      "learning_rate": 6.565378314422669e-06,
      "loss": 0.0877,
      "step": 886000
    },
    {
      "epoch": 53.79,
      "learning_rate": 6.5577938231903404e-06,
      "loss": 0.0879,
      "step": 886500
    },
    {
      "epoch": 53.82,
      "learning_rate": 6.5502093319580125e-06,
      "loss": 0.0882,
      "step": 887000
    },
    {
      "epoch": 53.85,
      "learning_rate": 6.542640009708149e-06,
      "loss": 0.0853,
      "step": 887500
    },
    {
      "epoch": 53.88,
      "learning_rate": 6.535055518475822e-06,
      "loss": 0.0861,
      "step": 888000
    },
    {
      "epoch": 53.91,
      "learning_rate": 6.527471027243493e-06,
      "loss": 0.0875,
      "step": 888500
    },
    {
      "epoch": 53.94,
      "learning_rate": 6.519886536011165e-06,
      "loss": 0.0883,
      "step": 889000
    },
    {
      "epoch": 53.97,
      "learning_rate": 6.512302044778836e-06,
      "loss": 0.0864,
      "step": 889500
    },
    {
      "epoch": 54.0,
      "eval_bleu": 81.2685,
      "eval_gen_len": 14.1365,
      "eval_loss": 0.1724194884300232,
      "eval_runtime": 178.1859,
      "eval_samples_per_second": 90.49,
      "eval_steps_per_second": 2.829,
      "step": 889974
    }
  ],
  "max_steps": 1318480,
  "num_train_epochs": 80,
  "total_flos": 1.2180001336815514e+18,
  "trial_name": null,
  "trial_params": null
}