Saiga-7b-lora-2epochs-1024 / trainer_log.jsonl

Upload 13 files

1efaf4d verified 7 months ago

No virus

6.4 kB

	{"current_steps": 10, "total_steps": 250, "loss": 1.3192, "eval_loss": null, "predict_loss": null, "reward": null, "learning_rate": 4.980286753286195e-05, "epoch": 0.08, "percentage": 4.0, "elapsed_time": "0:03:57", "remaining_time": "1:34:58"}
	{"current_steps": 20, "total_steps": 250, "loss": 1.2281, "eval_loss": null, "predict_loss": null, "reward": null, "learning_rate": 4.9214579028215776e-05, "epoch": 0.16, "percentage": 8.0, "elapsed_time": "0:07:50", "remaining_time": "1:30:06"}
	{"current_steps": 30, "total_steps": 250, "loss": 1.1693, "eval_loss": null, "predict_loss": null, "reward": null, "learning_rate": 4.8244412147206284e-05, "epoch": 0.24, "percentage": 12.0, "elapsed_time": "0:11:41", "remaining_time": "1:25:42"}
	{"current_steps": 40, "total_steps": 250, "loss": 1.1378, "eval_loss": null, "predict_loss": null, "reward": null, "learning_rate": 4.690766700109659e-05, "epoch": 0.32, "percentage": 16.0, "elapsed_time": "0:15:32", "remaining_time": "1:21:33"}
	{"current_steps": 50, "total_steps": 250, "loss": 1.1255, "eval_loss": null, "predict_loss": null, "reward": null, "learning_rate": 4.522542485937369e-05, "epoch": 0.4, "percentage": 20.0, "elapsed_time": "0:19:23", "remaining_time": "1:17:33"}
	{"current_steps": 60, "total_steps": 250, "loss": 1.077, "eval_loss": null, "predict_loss": null, "reward": null, "learning_rate": 4.3224215685535294e-05, "epoch": 0.48, "percentage": 24.0, "elapsed_time": "0:23:14", "remaining_time": "1:13:36"}
	{"current_steps": 70, "total_steps": 250, "loss": 1.1089, "eval_loss": null, "predict_loss": null, "reward": null, "learning_rate": 4.093559974371725e-05, "epoch": 0.56, "percentage": 28.0, "elapsed_time": "0:27:06", "remaining_time": "1:09:41"}
	{"current_steps": 80, "total_steps": 250, "loss": 1.0634, "eval_loss": null, "predict_loss": null, "reward": null, "learning_rate": 3.8395669874474915e-05, "epoch": 0.64, "percentage": 32.0, "elapsed_time": "0:30:57", "remaining_time": "1:05:46"}
	{"current_steps": 90, "total_steps": 250, "loss": 1.0618, "eval_loss": null, "predict_loss": null, "reward": null, "learning_rate": 3.564448228912682e-05, "epoch": 0.72, "percentage": 36.0, "elapsed_time": "0:34:48", "remaining_time": "1:01:52"}
	{"current_steps": 100, "total_steps": 250, "loss": 1.0099, "eval_loss": null, "predict_loss": null, "reward": null, "learning_rate": 3.302359024518024e-05, "epoch": 0.8, "percentage": 40.0, "elapsed_time": "0:38:38", "remaining_time": "0:57:57"}
	{"current_steps": 110, "total_steps": 250, "loss": 1.0095, "eval_loss": null, "predict_loss": null, "reward": null, "learning_rate": 2.9992749512860173e-05, "epoch": 0.88, "percentage": 44.0, "elapsed_time": "0:42:28", "remaining_time": "0:54:04"}
	{"current_steps": 120, "total_steps": 250, "loss": 1.0568, "eval_loss": null, "predict_loss": null, "reward": null, "learning_rate": 2.6883170138198323e-05, "epoch": 0.96, "percentage": 48.0, "elapsed_time": "0:46:19", "remaining_time": "0:50:11"}
	{"current_steps": 130, "total_steps": 250, "loss": 0.939, "eval_loss": null, "predict_loss": null, "reward": null, "learning_rate": 2.3743892045505764e-05, "epoch": 1.04, "percentage": 52.0, "elapsed_time": "0:50:10", "remaining_time": "0:46:19"}
	{"current_steps": 140, "total_steps": 250, "loss": 0.8439, "eval_loss": null, "predict_loss": null, "reward": null, "learning_rate": 2.0624423525618098e-05, "epoch": 1.12, "percentage": 56.0, "elapsed_time": "0:54:01", "remaining_time": "0:42:27"}
	{"current_steps": 150, "total_steps": 250, "loss": 0.8464, "eval_loss": null, "predict_loss": null, "reward": null, "learning_rate": 1.7573960460574133e-05, "epoch": 1.2, "percentage": 60.0, "elapsed_time": "0:57:52", "remaining_time": "0:38:35"}
	{"current_steps": 160, "total_steps": 250, "loss": 0.8446, "eval_loss": null, "predict_loss": null, "reward": null, "learning_rate": 1.4640610475167898e-05, "epoch": 1.28, "percentage": 64.0, "elapsed_time": "1:01:43", "remaining_time": "0:34:43"}
	{"current_steps": 170, "total_steps": 250, "loss": 0.8545, "eval_loss": null, "predict_loss": null, "reward": null, "learning_rate": 1.1870634250967605e-05, "epoch": 1.36, "percentage": 68.0, "elapsed_time": "1:05:35", "remaining_time": "0:30:51"}
	{"current_steps": 180, "total_steps": 250, "loss": 0.8518, "eval_loss": null, "predict_loss": null, "reward": null, "learning_rate": 9.553509672741645e-06, "epoch": 1.44, "percentage": 72.0, "elapsed_time": "1:09:25", "remaining_time": "0:27:00"}
	{"current_steps": 190, "total_steps": 250, "loss": 0.8015, "eval_loss": null, "predict_loss": null, "reward": null, "learning_rate": 7.211608069767867e-06, "epoch": 1.52, "percentage": 76.0, "elapsed_time": "1:13:16", "remaining_time": "0:23:08"}
	{"current_steps": 200, "total_steps": 250, "loss": 0.8429, "eval_loss": null, "predict_loss": null, "reward": null, "learning_rate": 5.150240033804116e-06, "epoch": 1.6, "percentage": 80.0, "elapsed_time": "1:17:07", "remaining_time": "0:19:16"}
	{"current_steps": 210, "total_steps": 250, "loss": 0.8786, "eval_loss": null, "predict_loss": null, "reward": null, "learning_rate": 3.4019145701791184e-06, "epoch": 1.68, "percentage": 84.0, "elapsed_time": "1:20:58", "remaining_time": "0:15:25"}
	{"current_steps": 220, "total_steps": 250, "loss": 0.8469, "eval_loss": null, "predict_loss": null, "reward": null, "learning_rate": 1.9942038158532407e-06, "epoch": 1.76, "percentage": 88.0, "elapsed_time": "1:24:49", "remaining_time": "0:11:34"}
	{"current_steps": 230, "total_steps": 250, "loss": 0.8525, "eval_loss": null, "predict_loss": null, "reward": null, "learning_rate": 9.493082103478517e-07, "epoch": 1.84, "percentage": 92.0, "elapsed_time": "1:28:39", "remaining_time": "0:07:42"}
	{"current_steps": 240, "total_steps": 250, "loss": 0.8663, "eval_loss": null, "predict_loss": null, "reward": null, "learning_rate": 2.8370638155215123e-07, "epoch": 1.92, "percentage": 96.0, "elapsed_time": "1:32:30", "remaining_time": "0:03:51"}
	{"current_steps": 250, "total_steps": 250, "loss": 0.8084, "eval_loss": null, "predict_loss": null, "reward": null, "learning_rate": 7.895267917501504e-09, "epoch": 2.0, "percentage": 100.0, "elapsed_time": "1:36:21", "remaining_time": "0:00:00"}
	{"current_steps": 250, "total_steps": 250, "loss": null, "eval_loss": null, "predict_loss": null, "reward": null, "learning_rate": null, "epoch": 2.0, "percentage": 100.0, "elapsed_time": "1:36:21", "remaining_time": "0:00:00"}