{'loss': 1.3816, 'grad_norm': 1.4503111839294434, 'learning_rate': 4.708318749270797e-05, 'epoch': 0.18} {'loss': 1.3642, 'grad_norm': 1.2277671098709106, 'learning_rate': 4.416637498541594e-05, 'epoch': 0.35} {'loss': 1.3505, 'grad_norm': 1.8225963115692139, 'learning_rate': 4.124956247812391e-05, 'epoch': 0.53} {'loss': 1.3362, 'grad_norm': 1.5222986936569214, 'learning_rate': 3.8332749970831875e-05, 'epoch': 0.7} {'loss': 1.321, 'grad_norm': 2.3339385986328125, 'learning_rate': 3.5415937463539846e-05, 'epoch': 0.88}