{
    "epoch": 1.0,
    "eval_loss": 2.172133445739746,
    "eval_runtime": 24239.0476,
    "eval_samples_per_second": 4.285,
    "eval_steps_per_second": 0.268,
    "perplexity": 8.776989310759461,
    "total_flos": 7.322050088623145e+18,
    "train_loss": 2.3946414439395287,
    "train_runtime": 14836.2948,
    "train_samples_per_second": 52.513,
    "train_steps_per_second": 3.282
}