mistral-7b-ocn-v2 / trainer_log.jsonl

Upload folder using huggingface_hub

0211621 verified 9 months ago

5.16 kB

	{"current_steps": 10, "total_steps": 203, "loss": 0.7003, "eval_loss": null, "predict_loss": null, "reward": null, "learning_rate": 0.0005, "epoch": 0.05, "percentage": 4.93, "elapsed_time": "0:00:42", "remaining_time": "0:13:30"}
	{"current_steps": 20, "total_steps": 203, "loss": 0.1884, "eval_loss": null, "predict_loss": null, "reward": null, "learning_rate": 0.0004966952699028185, "epoch": 0.1, "percentage": 9.85, "elapsed_time": "0:01:21", "remaining_time": "0:12:25"}
	{"current_steps": 30, "total_steps": 203, "loss": 0.1689, "eval_loss": null, "predict_loss": null, "reward": null, "learning_rate": 0.0004868684495393958, "epoch": 0.15, "percentage": 14.78, "elapsed_time": "0:02:00", "remaining_time": "0:11:32"}
	{"current_steps": 40, "total_steps": 203, "loss": 0.1579, "eval_loss": null, "predict_loss": null, "reward": null, "learning_rate": 0.00047077933882184867, "epoch": 0.2, "percentage": 19.7, "elapsed_time": "0:02:40", "remaining_time": "0:10:55"}
	{"current_steps": 50, "total_steps": 203, "loss": 0.1475, "eval_loss": null, "predict_loss": null, "reward": null, "learning_rate": 0.00044885329909757834, "epoch": 0.25, "percentage": 24.63, "elapsed_time": "0:03:20", "remaining_time": "0:10:14"}
	{"current_steps": 60, "total_steps": 203, "loss": 0.1588, "eval_loss": null, "predict_loss": null, "reward": null, "learning_rate": 0.0004216700075136953, "epoch": 0.29, "percentage": 29.56, "elapsed_time": "0:04:02", "remaining_time": "0:09:37"}
	{"current_steps": 70, "total_steps": 203, "loss": 0.1259, "eval_loss": null, "predict_loss": null, "reward": null, "learning_rate": 0.00038994813160490117, "epoch": 0.34, "percentage": 34.48, "elapsed_time": "0:04:43", "remaining_time": "0:08:58"}
	{"current_steps": 80, "total_steps": 203, "loss": 0.1527, "eval_loss": null, "predict_loss": null, "reward": null, "learning_rate": 0.0003545263292756348, "epoch": 0.39, "percentage": 39.41, "elapsed_time": "0:05:24", "remaining_time": "0:08:18"}
	{"current_steps": 90, "total_steps": 203, "loss": 0.1421, "eval_loss": null, "predict_loss": null, "reward": null, "learning_rate": 0.0003163410764959277, "epoch": 0.44, "percentage": 44.33, "elapsed_time": "0:06:03", "remaining_time": "0:07:36"}
	{"current_steps": 100, "total_steps": 203, "loss": 0.1336, "eval_loss": null, "predict_loss": null, "reward": null, "learning_rate": 0.0002764019088988165, "epoch": 0.49, "percentage": 49.26, "elapsed_time": "0:06:41", "remaining_time": "0:06:53"}
	{"current_steps": 110, "total_steps": 203, "loss": 0.1283, "eval_loss": null, "predict_loss": null, "reward": null, "learning_rate": 0.00023576473183801758, "epoch": 0.54, "percentage": 54.19, "elapsed_time": "0:07:21", "remaining_time": "0:06:13"}
	{"current_steps": 120, "total_steps": 203, "loss": 0.128, "eval_loss": null, "predict_loss": null, "reward": null, "learning_rate": 0.00019550390453030946, "epoch": 0.59, "percentage": 59.11, "elapsed_time": "0:08:05", "remaining_time": "0:05:36"}
	{"current_steps": 130, "total_steps": 203, "loss": 0.1258, "eval_loss": null, "predict_loss": null, "reward": null, "learning_rate": 0.0001566838363176219, "epoch": 0.64, "percentage": 64.04, "elapsed_time": "0:08:46", "remaining_time": "0:04:55"}
	{"current_steps": 140, "total_steps": 203, "loss": 0.1565, "eval_loss": null, "predict_loss": null, "reward": null, "learning_rate": 0.00012033084598233163, "epoch": 0.69, "percentage": 68.97, "elapsed_time": "0:09:27", "remaining_time": "0:04:15"}
	{"current_steps": 150, "total_steps": 203, "loss": 0.1348, "eval_loss": null, "predict_loss": null, "reward": null, "learning_rate": 8.740602809470736e-05, "epoch": 0.74, "percentage": 73.89, "elapsed_time": "0:10:08", "remaining_time": "0:03:34"}
	{"current_steps": 160, "total_steps": 203, "loss": 0.1349, "eval_loss": null, "predict_loss": null, "reward": null, "learning_rate": 5.877984374768877e-05, "epoch": 0.79, "percentage": 78.82, "elapsed_time": "0:10:49", "remaining_time": "0:02:54"}
	{"current_steps": 170, "total_steps": 203, "loss": 0.1232, "eval_loss": null, "predict_loss": null, "reward": null, "learning_rate": 3.520910744510819e-05, "epoch": 0.84, "percentage": 83.74, "elapsed_time": "0:11:30", "remaining_time": "0:02:14"}
	{"current_steps": 180, "total_steps": 203, "loss": 0.123, "eval_loss": null, "predict_loss": null, "reward": null, "learning_rate": 1.7316978560340647e-05, "epoch": 0.88, "percentage": 88.67, "elapsed_time": "0:12:11", "remaining_time": "0:01:33"}
	{"current_steps": 190, "total_steps": 203, "loss": 0.1315, "eval_loss": null, "predict_loss": null, "reward": null, "learning_rate": 5.576486348011222e-06, "epoch": 0.93, "percentage": 93.6, "elapsed_time": "0:12:50", "remaining_time": "0:00:52"}
	{"current_steps": 200, "total_steps": 203, "loss": 0.1053, "eval_loss": null, "predict_loss": null, "reward": null, "learning_rate": 2.980240718784277e-07, "epoch": 0.98, "percentage": 98.52, "elapsed_time": "0:13:30", "remaining_time": "0:00:12"}
	{"current_steps": 203, "total_steps": 203, "loss": null, "eval_loss": null, "predict_loss": null, "reward": null, "learning_rate": null, "epoch": 1.0, "percentage": 100.0, "elapsed_time": "0:13:43", "remaining_time": "0:00:00"}