{'loss': 1.3893, 'grad_norm': 1.0231168270111084, 'learning_rate': 4.708318749270797e-05, 'epoch': 0.18} {'loss': 1.3887, 'grad_norm': 0.603848934173584, 'learning_rate': 4.416637498541594e-05, 'epoch': 0.35} {'loss': 1.389, 'grad_norm': 0.6142033338546753, 'learning_rate': 4.124956247812391e-05, 'epoch': 0.53} {'loss': 1.3882, 'grad_norm': 0.6350305676460266, 'learning_rate': 3.8332749970831875e-05, 'epoch': 0.7} {'loss': 1.388, 'grad_norm': 0.5414144396781921, 'learning_rate': 3.5415937463539846e-05, 'epoch': 0.88}