{
  "best_metric": null,
  "best_model_checkpoint": null,
  "epoch": 22.0,
  "eval_steps": 500,
  "global_step": 1254,
  "is_hyper_param_search": false,
  "is_local_process_zero": true,
  "is_world_process_zero": true,
  "log_history": [
    {
      "epoch": 1.58,
      "learning_rate": 5.2631578947368424e-05,
      "loss": 1.9248,
      "step": 90
    },
    {
      "epoch": 3.16,
      "learning_rate": 9.941520467836257e-05,
      "loss": 1.7483,
      "step": 180
    },
    {
      "epoch": 4.74,
      "learning_rate": 9.35672514619883e-05,
      "loss": 1.7166,
      "step": 270
    },
    {
      "epoch": 6.32,
      "learning_rate": 8.771929824561403e-05,
      "loss": 1.6977,
      "step": 360
    },
    {
      "epoch": 7.89,
      "learning_rate": 8.187134502923976e-05,
      "loss": 1.6843,
      "step": 450
    },
    {
      "epoch": 9.47,
      "learning_rate": 7.602339181286549e-05,
      "loss": 1.6687,
      "step": 540
    },
    {
      "epoch": 11.05,
      "learning_rate": 7.017543859649122e-05,
      "loss": 1.6573,
      "step": 630
    },
    {
      "epoch": 12.63,
      "learning_rate": 6.432748538011695e-05,
      "loss": 1.6444,
      "step": 720
    },
    {
      "epoch": 14.21,
      "learning_rate": 5.847953216374269e-05,
      "loss": 1.6323,
      "step": 810
    },
    {
      "epoch": 15.79,
      "learning_rate": 5.2631578947368424e-05,
      "loss": 1.6228,
      "step": 900
    },
    {
      "epoch": 17.37,
      "learning_rate": 4.678362573099415e-05,
      "loss": 1.6109,
      "step": 990
    },
    {
      "epoch": 18.95,
      "learning_rate": 4.093567251461988e-05,
      "loss": 1.6058,
      "step": 1080
    },
    {
      "epoch": 20.53,
      "learning_rate": 3.508771929824561e-05,
      "loss": 1.5961,
      "step": 1170
    }
  ],
  "logging_steps": 90,
  "max_steps": 1710,
  "num_train_epochs": 30,
  "save_steps": 500,
  "total_flos": 7.019152996156047e+18,
  "trial_name": null,
  "trial_params": null
}