chchen
/

Vicuna-7B-v1.5-ORPO

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:240273fc9717e5f6cbc1d4e3a733d3e82882a38371ba5b623db6adc58b1fd404
 size 80013120

 version https://git-lfs.github.com/spec/v1
+oid sha256:eaeb1fe72a66ccc5854ca5daaeed22ef9120118fb3d45ad628ba180d46293892
 size 80013120

trainer_log.jsonl CHANGED Viewed

@@ -100,3 +100,54 @@
 {"current_steps": 990, "total_steps": 1686, "loss": 0.9826, "accuracy": 0.48750001192092896, "learning_rate": 1.8239381598343576e-06, "epoch": 1.76039119804401, "percentage": 58.72, "elapsed_time": "2:43:51", "remaining_time": "1:55:12"}
 {"current_steps": 1000, "total_steps": 1686, "loss": 1.0328, "accuracy": 0.46875, "learning_rate": 1.779207600392312e-06, "epoch": 1.7781729273171816, "percentage": 59.31, "elapsed_time": "2:45:32", "remaining_time": "1:53:33"}
 {"current_steps": 1000, "total_steps": 1686, "eval_loss": 1.0125839710235596, "epoch": 1.7781729273171816, "percentage": 59.31, "elapsed_time": "2:48:38", "remaining_time": "1:55:41"}

 {"current_steps": 990, "total_steps": 1686, "loss": 0.9826, "accuracy": 0.48750001192092896, "learning_rate": 1.8239381598343576e-06, "epoch": 1.76039119804401, "percentage": 58.72, "elapsed_time": "2:43:51", "remaining_time": "1:55:12"}
 {"current_steps": 1000, "total_steps": 1686, "loss": 1.0328, "accuracy": 0.46875, "learning_rate": 1.779207600392312e-06, "epoch": 1.7781729273171816, "percentage": 59.31, "elapsed_time": "2:45:32", "remaining_time": "1:53:33"}
 {"current_steps": 1000, "total_steps": 1686, "eval_loss": 1.0125839710235596, "epoch": 1.7781729273171816, "percentage": 59.31, "elapsed_time": "2:48:38", "remaining_time": "1:55:41"}
+{"current_steps": 1010, "total_steps": 1686, "loss": 0.9932, "accuracy": 0.4749999940395355, "learning_rate": 1.7347273253353552e-06, "epoch": 1.7959546565903532, "percentage": 59.91, "elapsed_time": "2:50:17", "remaining_time": "1:53:58"}
+{"current_steps": 1020, "total_steps": 1686, "loss": 1.037, "accuracy": 0.543749988079071, "learning_rate": 1.690512779774029e-06, "epoch": 1.8137363858635251, "percentage": 60.5, "elapsed_time": "2:51:55", "remaining_time": "1:52:15"}
+{"current_steps": 1030, "total_steps": 1686, "loss": 1.0376, "accuracy": 0.5249999761581421, "learning_rate": 1.6465793165482838e-06, "epoch": 1.831518115136697, "percentage": 61.09, "elapsed_time": "2:53:34", "remaining_time": "1:50:32"}
+{"current_steps": 1040, "total_steps": 1686, "loss": 0.9502, "accuracy": 0.550000011920929, "learning_rate": 1.6029421908964305e-06, "epoch": 1.849299844409869, "percentage": 61.68, "elapsed_time": "2:55:06", "remaining_time": "1:48:45"}
+{"current_steps": 1050, "total_steps": 1686, "loss": 1.0066, "accuracy": 0.46875, "learning_rate": 1.559616555157985e-06, "epoch": 1.8670815736830408, "percentage": 62.28, "elapsed_time": "2:56:45", "remaining_time": "1:47:04"}
+{"current_steps": 1060, "total_steps": 1686, "loss": 1.0338, "accuracy": 0.48750001192092896, "learning_rate": 1.516617453512252e-06, "epoch": 1.8848633029562125, "percentage": 62.87, "elapsed_time": "2:58:23", "remaining_time": "1:45:21"}
+{"current_steps": 1070, "total_steps": 1686, "loss": 0.9942, "accuracy": 0.44999998807907104, "learning_rate": 1.473959816754449e-06, "epoch": 1.9026450322293842, "percentage": 63.46, "elapsed_time": "2:59:58", "remaining_time": "1:43:36"}
+{"current_steps": 1080, "total_steps": 1686, "loss": 1.022, "accuracy": 0.4937500059604645, "learning_rate": 1.4316584571112213e-06, "epoch": 1.920426761502556, "percentage": 64.06, "elapsed_time": "3:01:36", "remaining_time": "1:41:54"}
+{"current_steps": 1090, "total_steps": 1686, "loss": 1.0118, "accuracy": 0.512499988079071, "learning_rate": 1.389728063097306e-06, "epoch": 1.938208490775728, "percentage": 64.65, "elapsed_time": "3:03:15", "remaining_time": "1:40:11"}
+{"current_steps": 1100, "total_steps": 1686, "loss": 1.0005, "accuracy": 0.574999988079071, "learning_rate": 1.348183194415179e-06, "epoch": 1.9559902200488999, "percentage": 65.24, "elapsed_time": "3:04:48", "remaining_time": "1:38:27"}
+{"current_steps": 1110, "total_steps": 1686, "loss": 0.9898, "accuracy": 0.45625001192092896, "learning_rate": 1.3070382768994015e-06, "epoch": 1.9737719493220716, "percentage": 65.84, "elapsed_time": "3:06:28", "remaining_time": "1:36:45"}
+{"current_steps": 1120, "total_steps": 1686, "loss": 0.9734, "accuracy": 0.5062500238418579, "learning_rate": 1.2663075975074746e-06, "epoch": 1.9915536785952432, "percentage": 66.43, "elapsed_time": "3:08:06", "remaining_time": "1:35:03"}
+{"current_steps": 1130, "total_steps": 1686, "loss": 1.1183, "accuracy": 0.46875, "learning_rate": 1.2260052993589034e-06, "epoch": 2.009335407868415, "percentage": 67.02, "elapsed_time": "3:09:45", "remaining_time": "1:33:21"}
+{"current_steps": 1140, "total_steps": 1686, "loss": 0.9749, "accuracy": 0.5249999761581421, "learning_rate": 1.1861453768242099e-06, "epoch": 2.027117137141587, "percentage": 67.62, "elapsed_time": "3:11:23", "remaining_time": "1:31:40"}
+{"current_steps": 1150, "total_steps": 1686, "loss": 1.0522, "accuracy": 0.4937500059604645, "learning_rate": 1.1467416706655982e-06, "epoch": 2.044898866414759, "percentage": 68.21, "elapsed_time": "3:13:05", "remaining_time": "1:29:59"}
+{"current_steps": 1160, "total_steps": 1686, "loss": 0.9808, "accuracy": 0.53125, "learning_rate": 1.1078078632309559e-06, "epoch": 2.062680595687931, "percentage": 68.8, "elapsed_time": "3:14:41", "remaining_time": "1:28:17"}
+{"current_steps": 1170, "total_steps": 1686, "loss": 0.9946, "accuracy": 0.4625000059604645, "learning_rate": 1.0693574737028627e-06, "epoch": 2.0804623249611023, "percentage": 69.4, "elapsed_time": "3:16:22", "remaining_time": "1:26:36"}
+{"current_steps": 1180, "total_steps": 1686, "loss": 0.9964, "accuracy": 0.5, "learning_rate": 1.0314038534042586e-06, "epoch": 2.098244054234274, "percentage": 69.99, "elapsed_time": "3:18:01", "remaining_time": "1:24:54"}
+{"current_steps": 1190, "total_steps": 1686, "loss": 1.0084, "accuracy": 0.4749999940395355, "learning_rate": 9.939601811623946e-07, "epoch": 2.116025783507446, "percentage": 70.58, "elapsed_time": "3:19:36", "remaining_time": "1:23:11"}
+{"current_steps": 1200, "total_steps": 1686, "loss": 1.0093, "accuracy": 0.59375, "learning_rate": 9.570394587326825e-07, "epoch": 2.133807512780618, "percentage": 71.17, "elapsed_time": "3:21:13", "remaining_time": "1:21:29"}
+{"current_steps": 1210, "total_steps": 1686, "loss": 0.9575, "accuracy": 0.5874999761581421, "learning_rate": 9.206545062840302e-07, "epoch": 2.15158924205379, "percentage": 71.77, "elapsed_time": "3:22:50", "remaining_time": "1:19:47"}
+{"current_steps": 1220, "total_steps": 1686, "loss": 0.9795, "accuracy": 0.512499988079071, "learning_rate": 8.848179579472285e-07, "epoch": 2.1693709713269618, "percentage": 72.36, "elapsed_time": "3:24:27", "remaining_time": "1:18:05"}
+{"current_steps": 1230, "total_steps": 1686, "loss": 0.9135, "accuracy": 0.5874999761581421, "learning_rate": 8.495422574279403e-07, "epoch": 2.1871527006001332, "percentage": 72.95, "elapsed_time": "3:26:02", "remaining_time": "1:16:23"}
+{"current_steps": 1240, "total_steps": 1686, "loss": 1.0672, "accuracy": 0.53125, "learning_rate": 8.148396536858063e-07, "epoch": 2.204934429873305, "percentage": 73.55, "elapsed_time": "3:27:40", "remaining_time": "1:14:41"}
+{"current_steps": 1250, "total_steps": 1686, "loss": 1.0181, "accuracy": 0.4937500059604645, "learning_rate": 7.807221966811815e-07, "epoch": 2.222716159146477, "percentage": 74.14, "elapsed_time": "3:29:19", "remaining_time": "1:13:00"}
+{"current_steps": 1260, "total_steps": 1686, "loss": 0.9669, "accuracy": 0.5, "learning_rate": 7.47201733190962e-07, "epoch": 2.240497888419649, "percentage": 74.73, "elapsed_time": "3:30:58", "remaining_time": "1:11:19"}
+{"current_steps": 1270, "total_steps": 1686, "loss": 0.9798, "accuracy": 0.5562499761581421, "learning_rate": 7.142899026949721e-07, "epoch": 2.258279617692821, "percentage": 75.33, "elapsed_time": "3:32:36", "remaining_time": "1:09:38"}
+{"current_steps": 1280, "total_steps": 1686, "loss": 1.003, "accuracy": 0.5249999761581421, "learning_rate": 6.819981333343273e-07, "epoch": 2.2760613469659923, "percentage": 75.92, "elapsed_time": "3:34:11", "remaining_time": "1:07:56"}
+{"current_steps": 1290, "total_steps": 1686, "loss": 1.068, "accuracy": 0.41874998807907104, "learning_rate": 6.503376379431839e-07, "epoch": 2.293843076239164, "percentage": 76.51, "elapsed_time": "3:35:47", "remaining_time": "1:06:14"}
+{"current_steps": 1300, "total_steps": 1686, "loss": 1.002, "accuracy": 0.518750011920929, "learning_rate": 6.193194101552502e-07, "epoch": 2.311624805512336, "percentage": 77.11, "elapsed_time": "3:37:27", "remaining_time": "1:04:34"}
+{"current_steps": 1310, "total_steps": 1686, "loss": 1.0205, "accuracy": 0.5687500238418579, "learning_rate": 5.889542205864083e-07, "epoch": 2.329406534785508, "percentage": 77.7, "elapsed_time": "3:39:01", "remaining_time": "1:02:51"}
+{"current_steps": 1320, "total_steps": 1686, "loss": 1.0056, "accuracy": 0.45625001192092896, "learning_rate": 5.592526130947862e-07, "epoch": 2.34718826405868, "percentage": 78.29, "elapsed_time": "3:40:40", "remaining_time": "1:01:11"}
+{"current_steps": 1330, "total_steps": 1686, "loss": 1.015, "accuracy": 0.4749999940395355, "learning_rate": 5.302249011195507e-07, "epoch": 2.3649699933318518, "percentage": 78.88, "elapsed_time": "3:42:11", "remaining_time": "0:59:28"}
+{"current_steps": 1340, "total_steps": 1686, "loss": 1.0409, "accuracy": 0.543749988079071, "learning_rate": 5.018811640997307e-07, "epoch": 2.382751722605023, "percentage": 79.48, "elapsed_time": "3:43:52", "remaining_time": "0:57:48"}
+{"current_steps": 1350, "total_steps": 1686, "loss": 1.0256, "accuracy": 0.4749999940395355, "learning_rate": 4.7423124397427105e-07, "epoch": 2.400533451878195, "percentage": 80.07, "elapsed_time": "3:45:22", "remaining_time": "0:56:05"}
+{"current_steps": 1360, "total_steps": 1686, "loss": 0.9877, "accuracy": 0.543749988079071, "learning_rate": 4.472847417645787e-07, "epoch": 2.418315181151367, "percentage": 80.66, "elapsed_time": "3:46:56", "remaining_time": "0:54:23"}
+{"current_steps": 1370, "total_steps": 1686, "loss": 0.977, "accuracy": 0.5062500238418579, "learning_rate": 4.210510142406993e-07, "epoch": 2.436096910424539, "percentage": 81.26, "elapsed_time": "3:48:31", "remaining_time": "0:52:42"}
+{"current_steps": 1380, "total_steps": 1686, "loss": 1.0133, "accuracy": 0.5, "learning_rate": 3.9553917067232966e-07, "epoch": 2.4538786396977104, "percentage": 81.85, "elapsed_time": "3:50:06", "remaining_time": "0:51:01"}
+{"current_steps": 1390, "total_steps": 1686, "loss": 0.9844, "accuracy": 0.4937500059604645, "learning_rate": 3.707580696657509e-07, "epoch": 2.4716603689708823, "percentage": 82.44, "elapsed_time": "3:51:40", "remaining_time": "0:49:20"}
+{"current_steps": 1400, "total_steps": 1686, "loss": 1.0439, "accuracy": 0.46875, "learning_rate": 3.4671631608781815e-07, "epoch": 2.489442098244054, "percentage": 83.04, "elapsed_time": "3:53:11", "remaining_time": "0:47:38"}
+{"current_steps": 1410, "total_steps": 1686, "loss": 1.0153, "accuracy": 0.5062500238418579, "learning_rate": 3.234222580780405e-07, "epoch": 2.507223827517226, "percentage": 83.63, "elapsed_time": "3:54:43", "remaining_time": "0:45:56"}
+{"current_steps": 1420, "total_steps": 1686, "loss": 1.0238, "accuracy": 0.48124998807907104, "learning_rate": 3.0088398414982375e-07, "epoch": 2.525005556790398, "percentage": 84.22, "elapsed_time": "3:56:19", "remaining_time": "0:44:16"}
+{"current_steps": 1430, "total_steps": 1686, "loss": 1.0219, "accuracy": 0.5874999761581421, "learning_rate": 2.7910932038184487e-07, "epoch": 2.54278728606357, "percentage": 84.82, "elapsed_time": "3:57:54", "remaining_time": "0:42:35"}
+{"current_steps": 1440, "total_steps": 1686, "loss": 0.9827, "accuracy": 0.5062500238418579, "learning_rate": 2.5810582770057325e-07, "epoch": 2.5605690153367417, "percentage": 85.41, "elapsed_time": "3:59:35", "remaining_time": "0:40:55"}
+{"current_steps": 1450, "total_steps": 1686, "loss": 1.054, "accuracy": 0.4749999940395355, "learning_rate": 2.3788079925484402e-07, "epoch": 2.578350744609913, "percentage": 86.0, "elapsed_time": "4:01:16", "remaining_time": "0:39:16"}
+{"current_steps": 1460, "total_steps": 1686, "loss": 0.966, "accuracy": 0.5562499761581421, "learning_rate": 2.1844125788342661e-07, "epoch": 2.596132473883085, "percentage": 86.6, "elapsed_time": "4:02:49", "remaining_time": "0:37:35"}
+{"current_steps": 1470, "total_steps": 1686, "loss": 0.9502, "accuracy": 0.5375000238418579, "learning_rate": 1.9979395367644428e-07, "epoch": 2.613914203156257, "percentage": 87.19, "elapsed_time": "4:04:27", "remaining_time": "0:35:55"}
+{"current_steps": 1480, "total_steps": 1686, "loss": 1.0003, "accuracy": 0.5, "learning_rate": 1.81945361631512e-07, "epoch": 2.631695932429429, "percentage": 87.78, "elapsed_time": "4:06:02", "remaining_time": "0:34:14"}
+{"current_steps": 1490, "total_steps": 1686, "loss": 1.0255, "accuracy": 0.48750001192092896, "learning_rate": 1.6490167940538343e-07, "epoch": 2.6494776617026004, "percentage": 88.37, "elapsed_time": "4:07:41", "remaining_time": "0:32:34"}
+{"current_steps": 1500, "total_steps": 1686, "loss": 0.9998, "accuracy": 0.5249999761581421, "learning_rate": 1.4866882516191339e-07, "epoch": 2.6672593909757722, "percentage": 88.97, "elapsed_time": "4:09:20", "remaining_time": "0:30:55"}
+{"current_steps": 1500, "total_steps": 1686, "eval_loss": 1.0073015689849854, "epoch": 2.6672593909757722, "percentage": 88.97, "elapsed_time": "4:12:26", "remaining_time": "0:31:18"}