{'loss': 4.6573, 'learning_rate': 9.914549390452318e-07, 'epoch': 0.1}
{'loss': 4.1911, 'learning_rate': 9.77213170787285e-07, 'epoch': 0.2}
{'loss': 4.1368, 'learning_rate': 9.62971402529338e-07, 'epoch': 0.3}
{'loss': 4.0957, 'learning_rate': 9.487296342713911e-07, 'epoch': 0.4}
{'eval_loss': 4.06580114364624, 'eval_runtime': 962.1135, 'eval_samples_per_second': 42.075, 'eval_steps_per_second': 2.631, 'epoch': 0.4}
{'loss': 4.0586, 'learning_rate': 9.344878660134443e-07, 'epoch': 0.5}
{'loss': 4.022, 'learning_rate': 9.202460977554973e-07, 'epoch': 0.59}
{'loss': 4.0038, 'learning_rate': 9.060043294975503e-07, 'epoch': 0.69}
{'loss': 3.9852, 'learning_rate': 8.917625612396035e-07, 'epoch': 0.79}