Spaces:

PauloFN
/

draft-estimation

Sleeping

App Files Files Community

draft-estimation / draft_computation /ocr /ocr_model_output /checkpoint-441 /trainer_state.json

PauloFN

first

6a6918c 3 months ago

raw

history blame

70.5 kB

	{
	"best_global_step": 2793,
	"best_metric": 0.2159090909090909,
	"best_model_checkpoint": "./ocr_model_output/checkpoint-2793",
	"epoch": 25.0,
	"eval_steps": 500,
	"global_step": 3675,
	"is_hyper_param_search": false,
	"is_local_process_zero": true,
	"is_world_process_zero": true,
	"log_history": [
	{
	"epoch": 0.06802721088435375,
	"grad_norm": 65.23433685302734,
	"learning_rate": 4.9877551020408165e-05,
	"loss": 8.6208,
	"step": 10
	},
	{
	"epoch": 0.1360544217687075,
	"grad_norm": 70.44102478027344,
	"learning_rate": 4.974149659863946e-05,
	"loss": 4.5903,
	"step": 20
	},
	{
	"epoch": 0.20408163265306123,
	"grad_norm": 35.348358154296875,
	"learning_rate": 4.960544217687075e-05,
	"loss": 1.9034,
	"step": 30
	},
	{
	"epoch": 0.272108843537415,
	"grad_norm": 22.223546981811523,
	"learning_rate": 4.9469387755102045e-05,
	"loss": 1.3092,
	"step": 40
	},
	{
	"epoch": 0.3401360544217687,
	"grad_norm": 35.46092987060547,
	"learning_rate": 4.933333333333334e-05,
	"loss": 1.0594,
	"step": 50
	},
	{
	"epoch": 0.40816326530612246,
	"grad_norm": 22.021345138549805,
	"learning_rate": 4.9197278911564624e-05,
	"loss": 1.0721,
	"step": 60
	},
	{
	"epoch": 0.47619047619047616,
	"grad_norm": 16.65888214111328,
	"learning_rate": 4.9061224489795924e-05,
	"loss": 0.825,
	"step": 70
	},
	{
	"epoch": 0.54421768707483,
	"grad_norm": 13.323294639587402,
	"learning_rate": 4.892517006802722e-05,
	"loss": 0.8588,
	"step": 80
	},
	{
	"epoch": 0.6122448979591837,
	"grad_norm": 16.98369598388672,
	"learning_rate": 4.87891156462585e-05,
	"loss": 0.6796,
	"step": 90
	},
	{
	"epoch": 0.6802721088435374,
	"grad_norm": 14.879609107971191,
	"learning_rate": 4.8653061224489796e-05,
	"loss": 0.715,
	"step": 100
	},
	{
	"epoch": 0.7482993197278912,
	"grad_norm": 13.820905685424805,
	"learning_rate": 4.8517006802721096e-05,
	"loss": 0.6773,
	"step": 110
	},
	{
	"epoch": 0.8163265306122449,
	"grad_norm": 14.802565574645996,
	"learning_rate": 4.838095238095238e-05,
	"loss": 0.6992,
	"step": 120
	},
	{
	"epoch": 0.8843537414965986,
	"grad_norm": 15.70506763458252,
	"learning_rate": 4.8244897959183675e-05,
	"loss": 0.7254,
	"step": 130
	},
	{
	"epoch": 0.9523809523809523,
	"grad_norm": 16.910625457763672,
	"learning_rate": 4.810884353741497e-05,
	"loss": 0.8015,
	"step": 140
	},
	{
	"epoch": 1.0,
	"eval_cer": 0.8118686868686869,
	"eval_loss": 0.8795642256736755,
	"eval_runtime": 3.4405,
	"eval_samples_per_second": 85.161,
	"eval_steps_per_second": 42.726,
	"step": 147
	},
	{
	"epoch": 1.0204081632653061,
	"grad_norm": 12.733670234680176,
	"learning_rate": 4.797278911564626e-05,
	"loss": 0.6511,
	"step": 150
	},
	{
	"epoch": 1.08843537414966,
	"grad_norm": 13.70749568939209,
	"learning_rate": 4.7836734693877554e-05,
	"loss": 0.7377,
	"step": 160
	},
	{
	"epoch": 1.1564625850340136,
	"grad_norm": 15.44306468963623,
	"learning_rate": 4.770068027210885e-05,
	"loss": 0.6797,
	"step": 170
	},
	{
	"epoch": 1.2244897959183674,
	"grad_norm": 19.31881332397461,
	"learning_rate": 4.756462585034014e-05,
	"loss": 0.6719,
	"step": 180
	},
	{
	"epoch": 1.2925170068027212,
	"grad_norm": 12.049680709838867,
	"learning_rate": 4.742857142857143e-05,
	"loss": 0.6491,
	"step": 190
	},
	{
	"epoch": 1.3605442176870748,
	"grad_norm": 14.28982925415039,
	"learning_rate": 4.729251700680272e-05,
	"loss": 0.7678,
	"step": 200
	},
	{
	"epoch": 1.4285714285714286,
	"grad_norm": 25.51521110534668,
	"learning_rate": 4.715646258503402e-05,
	"loss": 0.7534,
	"step": 210
	},
	{
	"epoch": 1.4965986394557822,
	"grad_norm": 14.158224105834961,
	"learning_rate": 4.7020408163265306e-05,
	"loss": 0.5653,
	"step": 220
	},
	{
	"epoch": 1.564625850340136,
	"grad_norm": 10.563309669494629,
	"learning_rate": 4.68843537414966e-05,
	"loss": 0.6038,
	"step": 230
	},
	{
	"epoch": 1.6326530612244898,
	"grad_norm": 14.436025619506836,
	"learning_rate": 4.67482993197279e-05,
	"loss": 0.5794,
	"step": 240
	},
	{
	"epoch": 1.7006802721088436,
	"grad_norm": 14.293322563171387,
	"learning_rate": 4.6612244897959185e-05,
	"loss": 0.6102,
	"step": 250
	},
	{
	"epoch": 1.7687074829931972,
	"grad_norm": 6.588962078094482,
	"learning_rate": 4.647619047619048e-05,
	"loss": 0.6853,
	"step": 260
	},
	{
	"epoch": 1.836734693877551,
	"grad_norm": 16.505081176757812,
	"learning_rate": 4.634013605442177e-05,
	"loss": 0.554,
	"step": 270
	},
	{
	"epoch": 1.9047619047619047,
	"grad_norm": 16.433975219726562,
	"learning_rate": 4.6204081632653064e-05,
	"loss": 0.5481,
	"step": 280
	},
	{
	"epoch": 1.9727891156462585,
	"grad_norm": 14.68355655670166,
	"learning_rate": 4.606802721088436e-05,
	"loss": 0.4728,
	"step": 290
	},
	{
	"epoch": 2.0,
	"eval_cer": 0.571969696969697,
	"eval_loss": 0.6962071061134338,
	"eval_runtime": 3.8738,
	"eval_samples_per_second": 75.637,
	"eval_steps_per_second": 37.948,
	"step": 294
	},
	{
	"epoch": 2.0408163265306123,
	"grad_norm": 9.795095443725586,
	"learning_rate": 4.593197278911564e-05,
	"loss": 0.4635,
	"step": 300
	},
	{
	"epoch": 2.108843537414966,
	"grad_norm": 17.107149124145508,
	"learning_rate": 4.579591836734694e-05,
	"loss": 0.4794,
	"step": 310
	},
	{
	"epoch": 2.17687074829932,
	"grad_norm": 11.940792083740234,
	"learning_rate": 4.5659863945578236e-05,
	"loss": 0.677,
	"step": 320
	},
	{
	"epoch": 2.2448979591836733,
	"grad_norm": 8.351872444152832,
	"learning_rate": 4.552380952380952e-05,
	"loss": 0.6732,
	"step": 330
	},
	{
	"epoch": 2.312925170068027,
	"grad_norm": 2.6622140407562256,
	"learning_rate": 4.538775510204082e-05,
	"loss": 0.3907,
	"step": 340
	},
	{
	"epoch": 2.380952380952381,
	"grad_norm": 10.555298805236816,
	"learning_rate": 4.5251700680272115e-05,
	"loss": 0.5443,
	"step": 350
	},
	{
	"epoch": 2.4489795918367347,
	"grad_norm": 7.857567310333252,
	"learning_rate": 4.51156462585034e-05,
	"loss": 0.5688,
	"step": 360
	},
	{
	"epoch": 2.5170068027210886,
	"grad_norm": 15.215005874633789,
	"learning_rate": 4.4979591836734694e-05,
	"loss": 0.5548,
	"step": 370
	},
	{
	"epoch": 2.5850340136054424,
	"grad_norm": 8.438752174377441,
	"learning_rate": 4.484353741496599e-05,
	"loss": 0.3828,
	"step": 380
	},
	{
	"epoch": 2.6530612244897958,
	"grad_norm": 9.824787139892578,
	"learning_rate": 4.470748299319728e-05,
	"loss": 0.3945,
	"step": 390
	},
	{
	"epoch": 2.7210884353741496,
	"grad_norm": 13.708135604858398,
	"learning_rate": 4.4571428571428574e-05,
	"loss": 0.3751,
	"step": 400
	},
	{
	"epoch": 2.7891156462585034,
	"grad_norm": 10.32359790802002,
	"learning_rate": 4.4435374149659867e-05,
	"loss": 0.4604,
	"step": 410
	},
	{
	"epoch": 2.857142857142857,
	"grad_norm": 4.256906509399414,
	"learning_rate": 4.429931972789116e-05,
	"loss": 0.4558,
	"step": 420
	},
	{
	"epoch": 2.925170068027211,
	"grad_norm": 12.131647109985352,
	"learning_rate": 4.416326530612245e-05,
	"loss": 0.4292,
	"step": 430
	},
	{
	"epoch": 2.9931972789115644,
	"grad_norm": 14.156941413879395,
	"learning_rate": 4.4027210884353746e-05,
	"loss": 0.3713,
	"step": 440
	},
	{
	"epoch": 3.0,
	"eval_cer": 0.5454545454545454,
	"eval_loss": 0.5351251363754272,
	"eval_runtime": 3.9015,
	"eval_samples_per_second": 75.099,
	"eval_steps_per_second": 37.678,
	"step": 441
	},
	{
	"epoch": 3.061224489795918,
	"grad_norm": 5.429965496063232,
	"learning_rate": 4.389115646258504e-05,
	"loss": 0.6159,
	"step": 450
	},
	{
	"epoch": 3.129251700680272,
	"grad_norm": 11.695433616638184,
	"learning_rate": 4.3755102040816325e-05,
	"loss": 0.4156,
	"step": 460
	},
	{
	"epoch": 3.197278911564626,
	"grad_norm": 14.333072662353516,
	"learning_rate": 4.361904761904762e-05,
	"loss": 0.4372,
	"step": 470
	},
	{
	"epoch": 3.2653061224489797,
	"grad_norm": 14.760481834411621,
	"learning_rate": 4.348299319727892e-05,
	"loss": 0.4279,
	"step": 480
	},
	{
	"epoch": 3.3333333333333335,
	"grad_norm": 12.052332878112793,
	"learning_rate": 4.3346938775510204e-05,
	"loss": 0.3854,
	"step": 490
	},
	{
	"epoch": 3.4013605442176873,
	"grad_norm": 14.331747055053711,
	"learning_rate": 4.32108843537415e-05,
	"loss": 0.3839,
	"step": 500
	},
	{
	"epoch": 3.4693877551020407,
	"grad_norm": 21.911863327026367,
	"learning_rate": 4.307482993197279e-05,
	"loss": 0.4815,
	"step": 510
	},
	{
	"epoch": 3.5374149659863945,
	"grad_norm": 6.438183307647705,
	"learning_rate": 4.293877551020408e-05,
	"loss": 0.2597,
	"step": 520
	},
	{
	"epoch": 3.6054421768707483,
	"grad_norm": 13.568741798400879,
	"learning_rate": 4.2802721088435376e-05,
	"loss": 0.3735,
	"step": 530
	},
	{
	"epoch": 3.673469387755102,
	"grad_norm": 0.18484297394752502,
	"learning_rate": 4.266666666666667e-05,
	"loss": 0.3343,
	"step": 540
	},
	{
	"epoch": 3.741496598639456,
	"grad_norm": 0.7180817127227783,
	"learning_rate": 4.253061224489796e-05,
	"loss": 0.1867,
	"step": 550
	},
	{
	"epoch": 3.8095238095238093,
	"grad_norm": 0.15185348689556122,
	"learning_rate": 4.2394557823129255e-05,
	"loss": 0.4185,
	"step": 560
	},
	{
	"epoch": 3.877551020408163,
	"grad_norm": 10.095551490783691,
	"learning_rate": 4.225850340136054e-05,
	"loss": 0.1698,
	"step": 570
	},
	{
	"epoch": 3.945578231292517,
	"grad_norm": 15.650616645812988,
	"learning_rate": 4.212244897959184e-05,
	"loss": 0.4307,
	"step": 580
	},
	{
	"epoch": 4.0,
	"eval_cer": 0.4911616161616162,
	"eval_loss": 0.4221580922603607,
	"eval_runtime": 3.8592,
	"eval_samples_per_second": 75.922,
	"eval_steps_per_second": 38.091,
	"step": 588
	},
	{
	"epoch": 4.01360544217687,
	"grad_norm": 8.345415115356445,
	"learning_rate": 4.1986394557823134e-05,
	"loss": 0.2111,
	"step": 590
	},
	{
	"epoch": 4.081632653061225,
	"grad_norm": 4.688040256500244,
	"learning_rate": 4.185034013605442e-05,
	"loss": 0.3211,
	"step": 600
	},
	{
	"epoch": 4.149659863945578,
	"grad_norm": 19.075292587280273,
	"learning_rate": 4.1714285714285714e-05,
	"loss": 0.3103,
	"step": 610
	},
	{
	"epoch": 4.217687074829932,
	"grad_norm": 7.607833385467529,
	"learning_rate": 4.1578231292517014e-05,
	"loss": 0.2308,
	"step": 620
	},
	{
	"epoch": 4.285714285714286,
	"grad_norm": 8.69675350189209,
	"learning_rate": 4.14421768707483e-05,
	"loss": 0.2981,
	"step": 630
	},
	{
	"epoch": 4.35374149659864,
	"grad_norm": 2.994023323059082,
	"learning_rate": 4.130612244897959e-05,
	"loss": 0.2922,
	"step": 640
	},
	{
	"epoch": 4.421768707482993,
	"grad_norm": 6.535342693328857,
	"learning_rate": 4.1170068027210886e-05,
	"loss": 0.3441,
	"step": 650
	},
	{
	"epoch": 4.489795918367347,
	"grad_norm": 0.3404290974140167,
	"learning_rate": 4.103401360544218e-05,
	"loss": 0.3523,
	"step": 660
	},
	{
	"epoch": 4.557823129251701,
	"grad_norm": 10.70188045501709,
	"learning_rate": 4.089795918367347e-05,
	"loss": 0.4148,
	"step": 670
	},
	{
	"epoch": 4.625850340136054,
	"grad_norm": 14.900300979614258,
	"learning_rate": 4.0761904761904765e-05,
	"loss": 0.4041,
	"step": 680
	},
	{
	"epoch": 4.6938775510204085,
	"grad_norm": 14.758822441101074,
	"learning_rate": 4.062585034013606e-05,
	"loss": 0.2453,
	"step": 690
	},
	{
	"epoch": 4.761904761904762,
	"grad_norm": 0.7187572717666626,
	"learning_rate": 4.048979591836735e-05,
	"loss": 0.3703,
	"step": 700
	},
	{
	"epoch": 4.829931972789115,
	"grad_norm": 9.603391647338867,
	"learning_rate": 4.035374149659864e-05,
	"loss": 0.3354,
	"step": 710
	},
	{
	"epoch": 4.8979591836734695,
	"grad_norm": 1.358739972114563,
	"learning_rate": 4.021768707482994e-05,
	"loss": 0.3297,
	"step": 720
	},
	{
	"epoch": 4.965986394557823,
	"grad_norm": 0.37522122263908386,
	"learning_rate": 4.008163265306122e-05,
	"loss": 0.2072,
	"step": 730
	},
	{
	"epoch": 5.0,
	"eval_cer": 0.5921717171717171,
	"eval_loss": 0.358783096075058,
	"eval_runtime": 3.5411,
	"eval_samples_per_second": 82.742,
	"eval_steps_per_second": 41.512,
	"step": 735
	},
	{
	"epoch": 5.034013605442177,
	"grad_norm": 3.8917222023010254,
	"learning_rate": 3.9945578231292516e-05,
	"loss": 0.2488,
	"step": 740
	},
	{
	"epoch": 5.1020408163265305,
	"grad_norm": 16.159465789794922,
	"learning_rate": 3.9809523809523816e-05,
	"loss": 0.3769,
	"step": 750
	},
	{
	"epoch": 5.170068027210885,
	"grad_norm": 17.226072311401367,
	"learning_rate": 3.96734693877551e-05,
	"loss": 0.2559,
	"step": 760
	},
	{
	"epoch": 5.238095238095238,
	"grad_norm": 0.8567410707473755,
	"learning_rate": 3.9537414965986396e-05,
	"loss": 0.248,
	"step": 770
	},
	{
	"epoch": 5.3061224489795915,
	"grad_norm": 1.5087652206420898,
	"learning_rate": 3.940136054421769e-05,
	"loss": 0.2737,
	"step": 780
	},
	{
	"epoch": 5.374149659863946,
	"grad_norm": 3.331455945968628,
	"learning_rate": 3.926530612244898e-05,
	"loss": 0.1665,
	"step": 790
	},
	{
	"epoch": 5.442176870748299,
	"grad_norm": 11.933197021484375,
	"learning_rate": 3.9129251700680275e-05,
	"loss": 0.322,
	"step": 800
	},
	{
	"epoch": 5.510204081632653,
	"grad_norm": 13.032449722290039,
	"learning_rate": 3.899319727891156e-05,
	"loss": 0.239,
	"step": 810
	},
	{
	"epoch": 5.578231292517007,
	"grad_norm": 5.0442047119140625,
	"learning_rate": 3.885714285714286e-05,
	"loss": 0.157,
	"step": 820
	},
	{
	"epoch": 5.646258503401361,
	"grad_norm": 1.6076925992965698,
	"learning_rate": 3.8721088435374154e-05,
	"loss": 0.1926,
	"step": 830
	},
	{
	"epoch": 5.714285714285714,
	"grad_norm": 22.085569381713867,
	"learning_rate": 3.858503401360544e-05,
	"loss": 0.3699,
	"step": 840
	},
	{
	"epoch": 5.782312925170068,
	"grad_norm": 10.831768989562988,
	"learning_rate": 3.844897959183674e-05,
	"loss": 0.291,
	"step": 850
	},
	{
	"epoch": 5.850340136054422,
	"grad_norm": 0.5946142077445984,
	"learning_rate": 3.831292517006803e-05,
	"loss": 0.2154,
	"step": 860
	},
	{
	"epoch": 5.918367346938775,
	"grad_norm": 1.5171136856079102,
	"learning_rate": 3.817687074829932e-05,
	"loss": 0.212,
	"step": 870
	},
	{
	"epoch": 5.986394557823129,
	"grad_norm": 18.592945098876953,
	"learning_rate": 3.804081632653061e-05,
	"loss": 0.2963,
	"step": 880
	},
	{
	"epoch": 6.0,
	"eval_cer": 0.5151515151515151,
	"eval_loss": 0.2578863501548767,
	"eval_runtime": 3.7328,
	"eval_samples_per_second": 78.493,
	"eval_steps_per_second": 39.38,
	"step": 882
	},
	{
	"epoch": 6.054421768707483,
	"grad_norm": 0.10681638866662979,
	"learning_rate": 3.7904761904761905e-05,
	"loss": 0.1761,
	"step": 890
	},
	{
	"epoch": 6.122448979591836,
	"grad_norm": 7.661993503570557,
	"learning_rate": 3.77687074829932e-05,
	"loss": 0.2027,
	"step": 900
	},
	{
	"epoch": 6.190476190476191,
	"grad_norm": 12.70997428894043,
	"learning_rate": 3.763265306122449e-05,
	"loss": 0.1828,
	"step": 910
	},
	{
	"epoch": 6.258503401360544,
	"grad_norm": 0.06931126117706299,
	"learning_rate": 3.7496598639455784e-05,
	"loss": 0.1242,
	"step": 920
	},
	{
	"epoch": 6.326530612244898,
	"grad_norm": 17.21261215209961,
	"learning_rate": 3.736054421768708e-05,
	"loss": 0.3785,
	"step": 930
	},
	{
	"epoch": 6.394557823129252,
	"grad_norm": 0.10957188904285431,
	"learning_rate": 3.722448979591837e-05,
	"loss": 0.1184,
	"step": 940
	},
	{
	"epoch": 6.462585034013605,
	"grad_norm": 14.104228019714355,
	"learning_rate": 3.7088435374149663e-05,
	"loss": 0.2253,
	"step": 950
	},
	{
	"epoch": 6.530612244897959,
	"grad_norm": 0.2823491394519806,
	"learning_rate": 3.6952380952380956e-05,
	"loss": 0.1337,
	"step": 960
	},
	{
	"epoch": 6.598639455782313,
	"grad_norm": 0.17527176439762115,
	"learning_rate": 3.681632653061224e-05,
	"loss": 0.1745,
	"step": 970
	},
	{
	"epoch": 6.666666666666667,
	"grad_norm": 12.178832054138184,
	"learning_rate": 3.6680272108843536e-05,
	"loss": 0.3322,
	"step": 980
	},
	{
	"epoch": 6.73469387755102,
	"grad_norm": 18.27240753173828,
	"learning_rate": 3.6544217687074836e-05,
	"loss": 0.245,
	"step": 990
	},
	{
	"epoch": 6.802721088435375,
	"grad_norm": 8.510261535644531,
	"learning_rate": 3.640816326530612e-05,
	"loss": 0.2928,
	"step": 1000
	},
	{
	"epoch": 6.870748299319728,
	"grad_norm": 8.47603988647461,
	"learning_rate": 3.6272108843537415e-05,
	"loss": 0.2048,
	"step": 1010
	},
	{
	"epoch": 6.938775510204081,
	"grad_norm": 9.21681022644043,
	"learning_rate": 3.6136054421768715e-05,
	"loss": 0.1416,
	"step": 1020
	},
	{
	"epoch": 7.0,
	"eval_cer": 0.4166666666666667,
	"eval_loss": 0.1848345547914505,
	"eval_runtime": 4.0307,
	"eval_samples_per_second": 72.692,
	"eval_steps_per_second": 36.47,
	"step": 1029
	},
	{
	"epoch": 7.006802721088436,
	"grad_norm": 8.593953132629395,
	"learning_rate": 3.6e-05,
	"loss": 0.1307,
	"step": 1030
	},
	{
	"epoch": 7.074829931972789,
	"grad_norm": 6.022789001464844,
	"learning_rate": 3.5863945578231294e-05,
	"loss": 0.1292,
	"step": 1040
	},
	{
	"epoch": 7.142857142857143,
	"grad_norm": 10.953206062316895,
	"learning_rate": 3.572789115646259e-05,
	"loss": 0.0853,
	"step": 1050
	},
	{
	"epoch": 7.210884353741497,
	"grad_norm": 5.332366943359375,
	"learning_rate": 3.559183673469388e-05,
	"loss": 0.112,
	"step": 1060
	},
	{
	"epoch": 7.27891156462585,
	"grad_norm": 12.159287452697754,
	"learning_rate": 3.545578231292517e-05,
	"loss": 0.1007,
	"step": 1070
	},
	{
	"epoch": 7.346938775510204,
	"grad_norm": 0.3854842483997345,
	"learning_rate": 3.531972789115646e-05,
	"loss": 0.2318,
	"step": 1080
	},
	{
	"epoch": 7.414965986394558,
	"grad_norm": 11.151751518249512,
	"learning_rate": 3.518367346938776e-05,
	"loss": 0.1768,
	"step": 1090
	},
	{
	"epoch": 7.482993197278912,
	"grad_norm": 20.415531158447266,
	"learning_rate": 3.504761904761905e-05,
	"loss": 0.1839,
	"step": 1100
	},
	{
	"epoch": 7.551020408163265,
	"grad_norm": 0.7234401106834412,
	"learning_rate": 3.491156462585034e-05,
	"loss": 0.2944,
	"step": 1110
	},
	{
	"epoch": 7.619047619047619,
	"grad_norm": 0.522950291633606,
	"learning_rate": 3.477551020408164e-05,
	"loss": 0.087,
	"step": 1120
	},
	{
	"epoch": 7.687074829931973,
	"grad_norm": 8.606940269470215,
	"learning_rate": 3.463945578231293e-05,
	"loss": 0.1253,
	"step": 1130
	},
	{
	"epoch": 7.755102040816326,
	"grad_norm": 22.922000885009766,
	"learning_rate": 3.450340136054422e-05,
	"loss": 0.2799,
	"step": 1140
	},
	{
	"epoch": 7.8231292517006805,
	"grad_norm": 21.035017013549805,
	"learning_rate": 3.436734693877551e-05,
	"loss": 0.1441,
	"step": 1150
	},
	{
	"epoch": 7.891156462585034,
	"grad_norm": 5.825491905212402,
	"learning_rate": 3.4231292517006804e-05,
	"loss": 0.0218,
	"step": 1160
	},
	{
	"epoch": 7.959183673469388,
	"grad_norm": 12.801454544067383,
	"learning_rate": 3.40952380952381e-05,
	"loss": 0.2319,
	"step": 1170
	},
	{
	"epoch": 8.0,
	"eval_cer": 0.42424242424242425,
	"eval_loss": 0.13813678920269012,
	"eval_runtime": 4.039,
	"eval_samples_per_second": 72.542,
	"eval_steps_per_second": 36.395,
	"step": 1176
	},
	{
	"epoch": 8.02721088435374,
	"grad_norm": 1.3456509113311768,
	"learning_rate": 3.395918367346939e-05,
	"loss": 0.1622,
	"step": 1180
	},
	{
	"epoch": 8.095238095238095,
	"grad_norm": 0.21156376600265503,
	"learning_rate": 3.382312925170068e-05,
	"loss": 0.0447,
	"step": 1190
	},
	{
	"epoch": 8.16326530612245,
	"grad_norm": 0.08529641479253769,
	"learning_rate": 3.3687074829931976e-05,
	"loss": 0.3241,
	"step": 1200
	},
	{
	"epoch": 8.231292517006803,
	"grad_norm": 8.225408554077148,
	"learning_rate": 3.355102040816327e-05,
	"loss": 0.1136,
	"step": 1210
	},
	{
	"epoch": 8.299319727891156,
	"grad_norm": 0.0486108660697937,
	"learning_rate": 3.341496598639456e-05,
	"loss": 0.2109,
	"step": 1220
	},
	{
	"epoch": 8.36734693877551,
	"grad_norm": 0.3150612413883209,
	"learning_rate": 3.3278911564625855e-05,
	"loss": 0.0678,
	"step": 1230
	},
	{
	"epoch": 8.435374149659864,
	"grad_norm": 2.7837414741516113,
	"learning_rate": 3.314285714285714e-05,
	"loss": 0.0582,
	"step": 1240
	},
	{
	"epoch": 8.503401360544217,
	"grad_norm": 0.08137867599725723,
	"learning_rate": 3.3006802721088434e-05,
	"loss": 0.2023,
	"step": 1250
	},
	{
	"epoch": 8.571428571428571,
	"grad_norm": 0.12031784653663635,
	"learning_rate": 3.2870748299319734e-05,
	"loss": 0.2334,
	"step": 1260
	},
	{
	"epoch": 8.639455782312925,
	"grad_norm": 0.7248769998550415,
	"learning_rate": 3.273469387755102e-05,
	"loss": 0.0562,
	"step": 1270
	},
	{
	"epoch": 8.70748299319728,
	"grad_norm": 9.878806114196777,
	"learning_rate": 3.259863945578231e-05,
	"loss": 0.1711,
	"step": 1280
	},
	{
	"epoch": 8.775510204081632,
	"grad_norm": 11.397530555725098,
	"learning_rate": 3.2462585034013606e-05,
	"loss": 0.2418,
	"step": 1290
	},
	{
	"epoch": 8.843537414965986,
	"grad_norm": 13.183833122253418,
	"learning_rate": 3.23265306122449e-05,
	"loss": 0.056,
	"step": 1300
	},
	{
	"epoch": 8.91156462585034,
	"grad_norm": 0.8917256593704224,
	"learning_rate": 3.219047619047619e-05,
	"loss": 0.0436,
	"step": 1310
	},
	{
	"epoch": 8.979591836734693,
	"grad_norm": 7.448833465576172,
	"learning_rate": 3.2054421768707485e-05,
	"loss": 0.0476,
	"step": 1320
	},
	{
	"epoch": 9.0,
	"eval_cer": 0.37752525252525254,
	"eval_loss": 0.11764977127313614,
	"eval_runtime": 3.9588,
	"eval_samples_per_second": 74.013,
	"eval_steps_per_second": 37.133,
	"step": 1323
	},
	{
	"epoch": 9.047619047619047,
	"grad_norm": 7.476083278656006,
	"learning_rate": 3.191836734693878e-05,
	"loss": 0.098,
	"step": 1330
	},
	{
	"epoch": 9.115646258503402,
	"grad_norm": 0.2827729880809784,
	"learning_rate": 3.178231292517007e-05,
	"loss": 0.1332,
	"step": 1340
	},
	{
	"epoch": 9.183673469387756,
	"grad_norm": 1.02791166305542,
	"learning_rate": 3.164625850340136e-05,
	"loss": 0.0211,
	"step": 1350
	},
	{
	"epoch": 9.251700680272108,
	"grad_norm": 14.376386642456055,
	"learning_rate": 3.151020408163266e-05,
	"loss": 0.1141,
	"step": 1360
	},
	{
	"epoch": 9.319727891156463,
	"grad_norm": 0.9921436309814453,
	"learning_rate": 3.137414965986395e-05,
	"loss": 0.0931,
	"step": 1370
	},
	{
	"epoch": 9.387755102040817,
	"grad_norm": 0.1799956113100052,
	"learning_rate": 3.123809523809524e-05,
	"loss": 0.0095,
	"step": 1380
	},
	{
	"epoch": 9.45578231292517,
	"grad_norm": 0.05473727360367775,
	"learning_rate": 3.110204081632653e-05,
	"loss": 0.1565,
	"step": 1390
	},
	{
	"epoch": 9.523809523809524,
	"grad_norm": 0.5269390344619751,
	"learning_rate": 3.096598639455782e-05,
	"loss": 0.0674,
	"step": 1400
	},
	{
	"epoch": 9.591836734693878,
	"grad_norm": 2.706407070159912,
	"learning_rate": 3.0829931972789116e-05,
	"loss": 0.0966,
	"step": 1410
	},
	{
	"epoch": 9.65986394557823,
	"grad_norm": 0.16416242718696594,
	"learning_rate": 3.069387755102041e-05,
	"loss": 0.0667,
	"step": 1420
	},
	{
	"epoch": 9.727891156462585,
	"grad_norm": 15.035467147827148,
	"learning_rate": 3.05578231292517e-05,
	"loss": 0.1272,
	"step": 1430
	},
	{
	"epoch": 9.795918367346939,
	"grad_norm": 0.19053949415683746,
	"learning_rate": 3.0421768707482995e-05,
	"loss": 0.2847,
	"step": 1440
	},
	{
	"epoch": 9.863945578231293,
	"grad_norm": 0.12774477899074554,
	"learning_rate": 3.0285714285714288e-05,
	"loss": 0.1103,
	"step": 1450
	},
	{
	"epoch": 9.931972789115646,
	"grad_norm": 0.474401593208313,
	"learning_rate": 3.0149659863945578e-05,
	"loss": 0.0972,
	"step": 1460
	},
	{
	"epoch": 10.0,
	"grad_norm": 0.0236662644892931,
	"learning_rate": 3.0013605442176874e-05,
	"loss": 0.0626,
	"step": 1470
	},
	{
	"epoch": 10.0,
	"eval_cer": 0.4305555555555556,
	"eval_loss": 0.09693024307489395,
	"eval_runtime": 4.1253,
	"eval_samples_per_second": 71.025,
	"eval_steps_per_second": 35.633,
	"step": 1470
	},
	{
	"epoch": 10.068027210884354,
	"grad_norm": 0.03369349241256714,
	"learning_rate": 2.987755102040816e-05,
	"loss": 0.0542,
	"step": 1480
	},
	{
	"epoch": 10.136054421768707,
	"grad_norm": 0.2802339792251587,
	"learning_rate": 2.9741496598639457e-05,
	"loss": 0.1356,
	"step": 1490
	},
	{
	"epoch": 10.204081632653061,
	"grad_norm": 0.48600488901138306,
	"learning_rate": 2.960544217687075e-05,
	"loss": 0.1529,
	"step": 1500
	},
	{
	"epoch": 10.272108843537415,
	"grad_norm": 2.2791683673858643,
	"learning_rate": 2.946938775510204e-05,
	"loss": 0.1232,
	"step": 1510
	},
	{
	"epoch": 10.34013605442177,
	"grad_norm": 6.162140369415283,
	"learning_rate": 2.9333333333333336e-05,
	"loss": 0.1948,
	"step": 1520
	},
	{
	"epoch": 10.408163265306122,
	"grad_norm": 1.365488886833191,
	"learning_rate": 2.919727891156463e-05,
	"loss": 0.0417,
	"step": 1530
	},
	{
	"epoch": 10.476190476190476,
	"grad_norm": 14.345423698425293,
	"learning_rate": 2.906122448979592e-05,
	"loss": 0.0859,
	"step": 1540
	},
	{
	"epoch": 10.54421768707483,
	"grad_norm": 0.1597384810447693,
	"learning_rate": 2.892517006802721e-05,
	"loss": 0.0376,
	"step": 1550
	},
	{
	"epoch": 10.612244897959183,
	"grad_norm": 0.24928878247737885,
	"learning_rate": 2.87891156462585e-05,
	"loss": 0.5477,
	"step": 1560
	},
	{
	"epoch": 10.680272108843537,
	"grad_norm": 0.3629794418811798,
	"learning_rate": 2.8653061224489798e-05,
	"loss": 0.0102,
	"step": 1570
	},
	{
	"epoch": 10.748299319727892,
	"grad_norm": 17.98668098449707,
	"learning_rate": 2.851700680272109e-05,
	"loss": 0.0821,
	"step": 1580
	},
	{
	"epoch": 10.816326530612244,
	"grad_norm": 5.073668479919434,
	"learning_rate": 2.838095238095238e-05,
	"loss": 0.053,
	"step": 1590
	},
	{
	"epoch": 10.884353741496598,
	"grad_norm": 12.528962135314941,
	"learning_rate": 2.8244897959183673e-05,
	"loss": 0.0463,
	"step": 1600
	},
	{
	"epoch": 10.952380952380953,
	"grad_norm": 1.0358648300170898,
	"learning_rate": 2.810884353741497e-05,
	"loss": 0.0124,
	"step": 1610
	},
	{
	"epoch": 11.0,
	"eval_cer": 0.39646464646464646,
	"eval_loss": 0.08722148090600967,
	"eval_runtime": 3.8388,
	"eval_samples_per_second": 76.326,
	"eval_steps_per_second": 38.293,
	"step": 1617
	},
	{
	"epoch": 11.020408163265307,
	"grad_norm": 0.19600285589694977,
	"learning_rate": 2.797278911564626e-05,
	"loss": 0.118,
	"step": 1620
	},
	{
	"epoch": 11.08843537414966,
	"grad_norm": 26.618637084960938,
	"learning_rate": 2.7836734693877553e-05,
	"loss": 0.3147,
	"step": 1630
	},
	{
	"epoch": 11.156462585034014,
	"grad_norm": 0.05680645629763603,
	"learning_rate": 2.7700680272108842e-05,
	"loss": 0.2198,
	"step": 1640
	},
	{
	"epoch": 11.224489795918368,
	"grad_norm": 13.787897109985352,
	"learning_rate": 2.7564625850340135e-05,
	"loss": 0.2091,
	"step": 1650
	},
	{
	"epoch": 11.29251700680272,
	"grad_norm": 1.339880108833313,
	"learning_rate": 2.742857142857143e-05,
	"loss": 0.0221,
	"step": 1660
	},
	{
	"epoch": 11.360544217687075,
	"grad_norm": 0.18231110274791718,
	"learning_rate": 2.729251700680272e-05,
	"loss": 0.0567,
	"step": 1670
	},
	{
	"epoch": 11.428571428571429,
	"grad_norm": 0.15762682259082794,
	"learning_rate": 2.7156462585034014e-05,
	"loss": 0.0118,
	"step": 1680
	},
	{
	"epoch": 11.496598639455783,
	"grad_norm": 0.19339053332805634,
	"learning_rate": 2.702040816326531e-05,
	"loss": 0.0082,
	"step": 1690
	},
	{
	"epoch": 11.564625850340136,
	"grad_norm": 11.242050170898438,
	"learning_rate": 2.6884353741496597e-05,
	"loss": 0.0398,
	"step": 1700
	},
	{
	"epoch": 11.63265306122449,
	"grad_norm": 0.104960598051548,
	"learning_rate": 2.6748299319727893e-05,
	"loss": 0.0745,
	"step": 1710
	},
	{
	"epoch": 11.700680272108844,
	"grad_norm": 0.4059283137321472,
	"learning_rate": 2.6612244897959187e-05,
	"loss": 0.0854,
	"step": 1720
	},
	{
	"epoch": 11.768707482993197,
	"grad_norm": 0.11370517313480377,
	"learning_rate": 2.6476190476190476e-05,
	"loss": 0.084,
	"step": 1730
	},
	{
	"epoch": 11.83673469387755,
	"grad_norm": 6.6930365562438965,
	"learning_rate": 2.6340136054421773e-05,
	"loss": 0.082,
	"step": 1740
	},
	{
	"epoch": 11.904761904761905,
	"grad_norm": 0.035495854914188385,
	"learning_rate": 2.620408163265306e-05,
	"loss": 0.0704,
	"step": 1750
	},
	{
	"epoch": 11.972789115646258,
	"grad_norm": 0.19433455169200897,
	"learning_rate": 2.6068027210884355e-05,
	"loss": 0.0755,
	"step": 1760
	},
	{
	"epoch": 12.0,
	"eval_cer": 0.4090909090909091,
	"eval_loss": 0.06354419887065887,
	"eval_runtime": 3.8826,
	"eval_samples_per_second": 75.466,
	"eval_steps_per_second": 37.862,
	"step": 1764
	},
	{
	"epoch": 12.040816326530612,
	"grad_norm": 0.22618860006332397,
	"learning_rate": 2.593197278911565e-05,
	"loss": 0.0842,
	"step": 1770
	},
	{
	"epoch": 12.108843537414966,
	"grad_norm": 0.2526053786277771,
	"learning_rate": 2.5795918367346938e-05,
	"loss": 0.0257,
	"step": 1780
	},
	{
	"epoch": 12.17687074829932,
	"grad_norm": 5.3073649406433105,
	"learning_rate": 2.5659863945578234e-05,
	"loss": 0.0723,
	"step": 1790
	},
	{
	"epoch": 12.244897959183673,
	"grad_norm": 0.07300838083028793,
	"learning_rate": 2.5523809523809527e-05,
	"loss": 0.0447,
	"step": 1800
	},
	{
	"epoch": 12.312925170068027,
	"grad_norm": 1.9569120407104492,
	"learning_rate": 2.5387755102040817e-05,
	"loss": 0.0437,
	"step": 1810
	},
	{
	"epoch": 12.380952380952381,
	"grad_norm": 4.616933822631836,
	"learning_rate": 2.525170068027211e-05,
	"loss": 0.0802,
	"step": 1820
	},
	{
	"epoch": 12.448979591836734,
	"grad_norm": 0.09218256920576096,
	"learning_rate": 2.51156462585034e-05,
	"loss": 0.0345,
	"step": 1830
	},
	{
	"epoch": 12.517006802721088,
	"grad_norm": 0.10980120301246643,
	"learning_rate": 2.4979591836734696e-05,
	"loss": 0.0167,
	"step": 1840
	},
	{
	"epoch": 12.585034013605442,
	"grad_norm": 1.9402213096618652,
	"learning_rate": 2.4843537414965986e-05,
	"loss": 0.0189,
	"step": 1850
	},
	{
	"epoch": 12.653061224489797,
	"grad_norm": 0.28110960125923157,
	"learning_rate": 2.4707482993197282e-05,
	"loss": 0.0939,
	"step": 1860
	},
	{
	"epoch": 12.72108843537415,
	"grad_norm": 14.07165813446045,
	"learning_rate": 2.4571428571428572e-05,
	"loss": 0.1164,
	"step": 1870
	},
	{
	"epoch": 12.789115646258503,
	"grad_norm": 0.09300262480974197,
	"learning_rate": 2.4435374149659865e-05,
	"loss": 0.0511,
	"step": 1880
	},
	{
	"epoch": 12.857142857142858,
	"grad_norm": 0.08766383677721024,
	"learning_rate": 2.4299319727891158e-05,
	"loss": 0.0821,
	"step": 1890
	},
	{
	"epoch": 12.92517006802721,
	"grad_norm": 4.915824890136719,
	"learning_rate": 2.416326530612245e-05,
	"loss": 0.0425,
	"step": 1900
	},
	{
	"epoch": 12.993197278911564,
	"grad_norm": 0.25317126512527466,
	"learning_rate": 2.4027210884353744e-05,
	"loss": 0.048,
	"step": 1910
	},
	{
	"epoch": 13.0,
	"eval_cer": 0.43813131313131315,
	"eval_loss": 0.044823333621025085,
	"eval_runtime": 3.9907,
	"eval_samples_per_second": 73.42,
	"eval_steps_per_second": 36.835,
	"step": 1911
	},
	{
	"epoch": 13.061224489795919,
	"grad_norm": 11.498345375061035,
	"learning_rate": 2.3891156462585034e-05,
	"loss": 0.0573,
	"step": 1920
	},
	{
	"epoch": 13.129251700680273,
	"grad_norm": 9.521465301513672,
	"learning_rate": 2.3755102040816327e-05,
	"loss": 0.0186,
	"step": 1930
	},
	{
	"epoch": 13.197278911564625,
	"grad_norm": 5.737509250640869,
	"learning_rate": 2.361904761904762e-05,
	"loss": 0.0189,
	"step": 1940
	},
	{
	"epoch": 13.26530612244898,
	"grad_norm": 0.3337570130825043,
	"learning_rate": 2.3482993197278913e-05,
	"loss": 0.0249,
	"step": 1950
	},
	{
	"epoch": 13.333333333333334,
	"grad_norm": 0.21208225190639496,
	"learning_rate": 2.3346938775510206e-05,
	"loss": 0.0266,
	"step": 1960
	},
	{
	"epoch": 13.401360544217686,
	"grad_norm": 0.034205980598926544,
	"learning_rate": 2.3210884353741495e-05,
	"loss": 0.0062,
	"step": 1970
	},
	{
	"epoch": 13.46938775510204,
	"grad_norm": 6.113767623901367,
	"learning_rate": 2.3074829931972792e-05,
	"loss": 0.1134,
	"step": 1980
	},
	{
	"epoch": 13.537414965986395,
	"grad_norm": 1.1116629838943481,
	"learning_rate": 2.293877551020408e-05,
	"loss": 0.0873,
	"step": 1990
	},
	{
	"epoch": 13.60544217687075,
	"grad_norm": 8.336064338684082,
	"learning_rate": 2.2802721088435375e-05,
	"loss": 0.0285,
	"step": 2000
	},
	{
	"epoch": 13.673469387755102,
	"grad_norm": 0.6493708491325378,
	"learning_rate": 2.2666666666666668e-05,
	"loss": 0.0107,
	"step": 2010
	},
	{
	"epoch": 13.741496598639456,
	"grad_norm": 4.806843280792236,
	"learning_rate": 2.253061224489796e-05,
	"loss": 0.0163,
	"step": 2020
	},
	{
	"epoch": 13.80952380952381,
	"grad_norm": 0.049966610968112946,
	"learning_rate": 2.2394557823129254e-05,
	"loss": 0.01,
	"step": 2030
	},
	{
	"epoch": 13.877551020408163,
	"grad_norm": 0.1961314082145691,
	"learning_rate": 2.2258503401360543e-05,
	"loss": 0.107,
	"step": 2040
	},
	{
	"epoch": 13.945578231292517,
	"grad_norm": 0.04836405813694,
	"learning_rate": 2.2122448979591836e-05,
	"loss": 0.0518,
	"step": 2050
	},
	{
	"epoch": 14.0,
	"eval_cer": 0.37752525252525254,
	"eval_loss": 0.04542345553636551,
	"eval_runtime": 3.7709,
	"eval_samples_per_second": 77.701,
	"eval_steps_per_second": 38.983,
	"step": 2058
	},
	{
	"epoch": 14.013605442176871,
	"grad_norm": 0.12112589925527573,
	"learning_rate": 2.1986394557823133e-05,
	"loss": 0.007,
	"step": 2060
	},
	{
	"epoch": 14.081632653061224,
	"grad_norm": 0.18053178489208221,
	"learning_rate": 2.1850340136054422e-05,
	"loss": 0.1291,
	"step": 2070
	},
	{
	"epoch": 14.149659863945578,
	"grad_norm": 0.2066822201013565,
	"learning_rate": 2.1714285714285715e-05,
	"loss": 0.0257,
	"step": 2080
	},
	{
	"epoch": 14.217687074829932,
	"grad_norm": 0.11014904081821442,
	"learning_rate": 2.1578231292517005e-05,
	"loss": 0.0535,
	"step": 2090
	},
	{
	"epoch": 14.285714285714286,
	"grad_norm": 12.59344482421875,
	"learning_rate": 2.14421768707483e-05,
	"loss": 0.1287,
	"step": 2100
	},
	{
	"epoch": 14.353741496598639,
	"grad_norm": 0.045586470514535904,
	"learning_rate": 2.1306122448979595e-05,
	"loss": 0.0348,
	"step": 2110
	},
	{
	"epoch": 14.421768707482993,
	"grad_norm": 0.16031715273857117,
	"learning_rate": 2.1170068027210884e-05,
	"loss": 0.0664,
	"step": 2120
	},
	{
	"epoch": 14.489795918367347,
	"grad_norm": 2.561408281326294,
	"learning_rate": 2.1034013605442177e-05,
	"loss": 0.04,
	"step": 2130
	},
	{
	"epoch": 14.5578231292517,
	"grad_norm": 0.2670551538467407,
	"learning_rate": 2.089795918367347e-05,
	"loss": 0.0092,
	"step": 2140
	},
	{
	"epoch": 14.625850340136054,
	"grad_norm": 0.12540097534656525,
	"learning_rate": 2.0761904761904763e-05,
	"loss": 0.0111,
	"step": 2150
	},
	{
	"epoch": 14.693877551020408,
	"grad_norm": 1.2808445692062378,
	"learning_rate": 2.0625850340136056e-05,
	"loss": 0.0595,
	"step": 2160
	},
	{
	"epoch": 14.761904761904763,
	"grad_norm": 0.03977341949939728,
	"learning_rate": 2.0489795918367346e-05,
	"loss": 0.0437,
	"step": 2170
	},
	{
	"epoch": 14.829931972789115,
	"grad_norm": 0.40472060441970825,
	"learning_rate": 2.0353741496598642e-05,
	"loss": 0.0268,
	"step": 2180
	},
	{
	"epoch": 14.89795918367347,
	"grad_norm": 0.08766451478004456,
	"learning_rate": 2.0217687074829932e-05,
	"loss": 0.0072,
	"step": 2190
	},
	{
	"epoch": 14.965986394557824,
	"grad_norm": 0.34755828976631165,
	"learning_rate": 2.0081632653061225e-05,
	"loss": 0.0482,
	"step": 2200
	},
	{
	"epoch": 15.0,
	"eval_cer": 0.38257575757575757,
	"eval_loss": 0.03393391892313957,
	"eval_runtime": 3.9624,
	"eval_samples_per_second": 73.945,
	"eval_steps_per_second": 37.098,
	"step": 2205
	},
	{
	"epoch": 15.034013605442176,
	"grad_norm": 0.07853918522596359,
	"learning_rate": 1.9945578231292518e-05,
	"loss": 0.0218,
	"step": 2210
	},
	{
	"epoch": 15.10204081632653,
	"grad_norm": 0.08187614381313324,
	"learning_rate": 1.980952380952381e-05,
	"loss": 0.0059,
	"step": 2220
	},
	{
	"epoch": 15.170068027210885,
	"grad_norm": 0.5369409918785095,
	"learning_rate": 1.9673469387755104e-05,
	"loss": 0.0105,
	"step": 2230
	},
	{
	"epoch": 15.238095238095237,
	"grad_norm": 0.46228042244911194,
	"learning_rate": 1.9537414965986394e-05,
	"loss": 0.0028,
	"step": 2240
	},
	{
	"epoch": 15.306122448979592,
	"grad_norm": 0.1829945147037506,
	"learning_rate": 1.940136054421769e-05,
	"loss": 0.0355,
	"step": 2250
	},
	{
	"epoch": 15.374149659863946,
	"grad_norm": 0.08586379885673523,
	"learning_rate": 1.926530612244898e-05,
	"loss": 0.0096,
	"step": 2260
	},
	{
	"epoch": 15.4421768707483,
	"grad_norm": 0.13552436232566833,
	"learning_rate": 1.9129251700680273e-05,
	"loss": 0.1455,
	"step": 2270
	},
	{
	"epoch": 15.510204081632653,
	"grad_norm": 0.3371906876564026,
	"learning_rate": 1.8993197278911566e-05,
	"loss": 0.0229,
	"step": 2280
	},
	{
	"epoch": 15.578231292517007,
	"grad_norm": 0.03920818492770195,
	"learning_rate": 1.885714285714286e-05,
	"loss": 0.0224,
	"step": 2290
	},
	{
	"epoch": 15.646258503401361,
	"grad_norm": 0.8000497817993164,
	"learning_rate": 1.8721088435374152e-05,
	"loss": 0.0681,
	"step": 2300
	},
	{
	"epoch": 15.714285714285714,
	"grad_norm": 0.15928244590759277,
	"learning_rate": 1.8585034013605442e-05,
	"loss": 0.0338,
	"step": 2310
	},
	{
	"epoch": 15.782312925170068,
	"grad_norm": 2.3006467819213867,
	"learning_rate": 1.8448979591836735e-05,
	"loss": 0.0085,
	"step": 2320
	},
	{
	"epoch": 15.850340136054422,
	"grad_norm": 0.3312649726867676,
	"learning_rate": 1.8312925170068028e-05,
	"loss": 0.0015,
	"step": 2330
	},
	{
	"epoch": 15.918367346938776,
	"grad_norm": 11.605361938476562,
	"learning_rate": 1.817687074829932e-05,
	"loss": 0.0616,
	"step": 2340
	},
	{
	"epoch": 15.986394557823129,
	"grad_norm": 0.06783591210842133,
	"learning_rate": 1.8040816326530614e-05,
	"loss": 0.0061,
	"step": 2350
	},
	{
	"epoch": 16.0,
	"eval_cer": 0.36742424242424243,
	"eval_loss": 0.01737603358924389,
	"eval_runtime": 3.7608,
	"eval_samples_per_second": 77.91,
	"eval_steps_per_second": 39.088,
	"step": 2352
	},
	{
	"epoch": 16.05442176870748,
	"grad_norm": 0.03763847053050995,
	"learning_rate": 1.7904761904761904e-05,
	"loss": 0.018,
	"step": 2360
	},
	{
	"epoch": 16.122448979591837,
	"grad_norm": 1.681272268295288,
	"learning_rate": 1.77687074829932e-05,
	"loss": 0.0158,
	"step": 2370
	},
	{
	"epoch": 16.19047619047619,
	"grad_norm": 0.31114622950553894,
	"learning_rate": 1.763265306122449e-05,
	"loss": 0.0045,
	"step": 2380
	},
	{
	"epoch": 16.258503401360546,
	"grad_norm": 3.3073906898498535,
	"learning_rate": 1.7496598639455783e-05,
	"loss": 0.0266,
	"step": 2390
	},
	{
	"epoch": 16.3265306122449,
	"grad_norm": 0.05872774124145508,
	"learning_rate": 1.7360544217687076e-05,
	"loss": 0.0094,
	"step": 2400
	},
	{
	"epoch": 16.39455782312925,
	"grad_norm": 0.36872556805610657,
	"learning_rate": 1.722448979591837e-05,
	"loss": 0.0031,
	"step": 2410
	},
	{
	"epoch": 16.462585034013607,
	"grad_norm": 0.18953841924667358,
	"learning_rate": 1.7088435374149662e-05,
	"loss": 0.0072,
	"step": 2420
	},
	{
	"epoch": 16.53061224489796,
	"grad_norm": 0.053531669080257416,
	"learning_rate": 1.695238095238095e-05,
	"loss": 0.0214,
	"step": 2430
	},
	{
	"epoch": 16.598639455782312,
	"grad_norm": 0.9419485926628113,
	"learning_rate": 1.6816326530612244e-05,
	"loss": 0.0311,
	"step": 2440
	},
	{
	"epoch": 16.666666666666668,
	"grad_norm": 0.10363417118787766,
	"learning_rate": 1.668027210884354e-05,
	"loss": 0.0145,
	"step": 2450
	},
	{
	"epoch": 16.73469387755102,
	"grad_norm": 11.27441692352295,
	"learning_rate": 1.654421768707483e-05,
	"loss": 0.0174,
	"step": 2460
	},
	{
	"epoch": 16.802721088435373,
	"grad_norm": 0.07533001154661179,
	"learning_rate": 1.6408163265306124e-05,
	"loss": 0.0043,
	"step": 2470
	},
	{
	"epoch": 16.87074829931973,
	"grad_norm": 0.09791432321071625,
	"learning_rate": 1.6272108843537413e-05,
	"loss": 0.0192,
	"step": 2480
	},
	{
	"epoch": 16.93877551020408,
	"grad_norm": 1.773054838180542,
	"learning_rate": 1.613605442176871e-05,
	"loss": 0.0846,
	"step": 2490
	},
	{
	"epoch": 17.0,
	"eval_cer": 0.22853535353535354,
	"eval_loss": 0.016882039606571198,
	"eval_runtime": 3.9198,
	"eval_samples_per_second": 74.749,
	"eval_steps_per_second": 37.502,
	"step": 2499
	},
	{
	"epoch": 17.006802721088434,
	"grad_norm": 0.08635395020246506,
	"learning_rate": 1.6000000000000003e-05,
	"loss": 0.0117,
	"step": 2500
	},
	{
	"epoch": 17.07482993197279,
	"grad_norm": 0.04216604679822922,
	"learning_rate": 1.5863945578231292e-05,
	"loss": 0.0075,
	"step": 2510
	},
	{
	"epoch": 17.142857142857142,
	"grad_norm": 0.3129735589027405,
	"learning_rate": 1.5727891156462585e-05,
	"loss": 0.0024,
	"step": 2520
	},
	{
	"epoch": 17.2108843537415,
	"grad_norm": 0.0337909497320652,
	"learning_rate": 1.559183673469388e-05,
	"loss": 0.0032,
	"step": 2530
	},
	{
	"epoch": 17.27891156462585,
	"grad_norm": 0.3642733097076416,
	"learning_rate": 1.545578231292517e-05,
	"loss": 0.1344,
	"step": 2540
	},
	{
	"epoch": 17.346938775510203,
	"grad_norm": 0.06059624254703522,
	"learning_rate": 1.5319727891156464e-05,
	"loss": 0.0039,
	"step": 2550
	},
	{
	"epoch": 17.41496598639456,
	"grad_norm": 0.5465549826622009,
	"learning_rate": 1.5183673469387754e-05,
	"loss": 0.0395,
	"step": 2560
	},
	{
	"epoch": 17.482993197278912,
	"grad_norm": 0.048258326947689056,
	"learning_rate": 1.5047619047619049e-05,
	"loss": 0.0226,
	"step": 2570
	},
	{
	"epoch": 17.551020408163264,
	"grad_norm": 0.5764261484146118,
	"learning_rate": 1.4911564625850342e-05,
	"loss": 0.0348,
	"step": 2580
	},
	{
	"epoch": 17.61904761904762,
	"grad_norm": 1.802079439163208,
	"learning_rate": 1.4775510204081633e-05,
	"loss": 0.004,
	"step": 2590
	},
	{
	"epoch": 17.687074829931973,
	"grad_norm": 0.03979931399226189,
	"learning_rate": 1.4639455782312925e-05,
	"loss": 0.004,
	"step": 2600
	},
	{
	"epoch": 17.755102040816325,
	"grad_norm": 0.25388839840888977,
	"learning_rate": 1.450340136054422e-05,
	"loss": 0.0039,
	"step": 2610
	},
	{
	"epoch": 17.82312925170068,
	"grad_norm": 0.44963565468788147,
	"learning_rate": 1.436734693877551e-05,
	"loss": 0.006,
	"step": 2620
	},
	{
	"epoch": 17.891156462585034,
	"grad_norm": 0.0887552797794342,
	"learning_rate": 1.4231292517006804e-05,
	"loss": 0.0042,
	"step": 2630
	},
	{
	"epoch": 17.959183673469386,
	"grad_norm": 0.11289983987808228,
	"learning_rate": 1.4095238095238095e-05,
	"loss": 0.0034,
	"step": 2640
	},
	{
	"epoch": 18.0,
	"eval_cer": 0.24242424242424243,
	"eval_loss": 0.013762996532022953,
	"eval_runtime": 3.9761,
	"eval_samples_per_second": 73.691,
	"eval_steps_per_second": 36.971,
	"step": 2646
	},
	{
	"epoch": 18.027210884353742,
	"grad_norm": 0.06268062442541122,
	"learning_rate": 1.395918367346939e-05,
	"loss": 0.0031,
	"step": 2650
	},
	{
	"epoch": 18.095238095238095,
	"grad_norm": 0.03095332533121109,
	"learning_rate": 1.3823129251700681e-05,
	"loss": 0.0356,
	"step": 2660
	},
	{
	"epoch": 18.163265306122447,
	"grad_norm": 0.6670628786087036,
	"learning_rate": 1.3687074829931972e-05,
	"loss": 0.004,
	"step": 2670
	},
	{
	"epoch": 18.231292517006803,
	"grad_norm": 0.09079564362764359,
	"learning_rate": 1.3551020408163265e-05,
	"loss": 0.0036,
	"step": 2680
	},
	{
	"epoch": 18.299319727891156,
	"grad_norm": 0.17814789712429047,
	"learning_rate": 1.3414965986394558e-05,
	"loss": 0.0016,
	"step": 2690
	},
	{
	"epoch": 18.367346938775512,
	"grad_norm": 0.053088486194610596,
	"learning_rate": 1.3278911564625852e-05,
	"loss": 0.0037,
	"step": 2700
	},
	{
	"epoch": 18.435374149659864,
	"grad_norm": 0.05287722125649452,
	"learning_rate": 1.3142857142857143e-05,
	"loss": 0.0031,
	"step": 2710
	},
	{
	"epoch": 18.503401360544217,
	"grad_norm": 0.22168047726154327,
	"learning_rate": 1.3006802721088434e-05,
	"loss": 0.003,
	"step": 2720
	},
	{
	"epoch": 18.571428571428573,
	"grad_norm": 0.2615916430950165,
	"learning_rate": 1.2870748299319729e-05,
	"loss": 0.0022,
	"step": 2730
	},
	{
	"epoch": 18.639455782312925,
	"grad_norm": 0.04484458267688751,
	"learning_rate": 1.273469387755102e-05,
	"loss": 0.083,
	"step": 2740
	},
	{
	"epoch": 18.707482993197278,
	"grad_norm": 0.4530847370624542,
	"learning_rate": 1.2598639455782313e-05,
	"loss": 0.0034,
	"step": 2750
	},
	{
	"epoch": 18.775510204081634,
	"grad_norm": 0.11792109161615372,
	"learning_rate": 1.2462585034013606e-05,
	"loss": 0.0295,
	"step": 2760
	},
	{
	"epoch": 18.843537414965986,
	"grad_norm": 0.049426767975091934,
	"learning_rate": 1.2326530612244898e-05,
	"loss": 0.0019,
	"step": 2770
	},
	{
	"epoch": 18.91156462585034,
	"grad_norm": 0.04500193893909454,
	"learning_rate": 1.219047619047619e-05,
	"loss": 0.0134,
	"step": 2780
	},
	{
	"epoch": 18.979591836734695,
	"grad_norm": 0.14980462193489075,
	"learning_rate": 1.2054421768707484e-05,
	"loss": 0.0032,
	"step": 2790
	},
	{
	"epoch": 19.0,
	"eval_cer": 0.2159090909090909,
	"eval_loss": 0.012968610972166061,
	"eval_runtime": 3.6907,
	"eval_samples_per_second": 79.389,
	"eval_steps_per_second": 39.83,
	"step": 2793
	},
	{
	"epoch": 19.047619047619047,
	"grad_norm": 0.5596031546592712,
	"learning_rate": 1.1918367346938777e-05,
	"loss": 0.004,
	"step": 2800
	},
	{
	"epoch": 19.1156462585034,
	"grad_norm": 0.09450047463178635,
	"learning_rate": 1.178231292517007e-05,
	"loss": 0.0176,
	"step": 2810
	},
	{
	"epoch": 19.183673469387756,
	"grad_norm": 0.030270878225564957,
	"learning_rate": 1.1646258503401361e-05,
	"loss": 0.0031,
	"step": 2820
	},
	{
	"epoch": 19.25170068027211,
	"grad_norm": 0.5096073746681213,
	"learning_rate": 1.1510204081632654e-05,
	"loss": 0.0231,
	"step": 2830
	},
	{
	"epoch": 19.31972789115646,
	"grad_norm": 0.2736698389053345,
	"learning_rate": 1.1374149659863946e-05,
	"loss": 0.0016,
	"step": 2840
	},
	{
	"epoch": 19.387755102040817,
	"grad_norm": 0.06535348296165466,
	"learning_rate": 1.1238095238095239e-05,
	"loss": 0.0013,
	"step": 2850
	},
	{
	"epoch": 19.45578231292517,
	"grad_norm": 0.0859360322356224,
	"learning_rate": 1.1102040816326532e-05,
	"loss": 0.003,
	"step": 2860
	},
	{
	"epoch": 19.523809523809526,
	"grad_norm": 0.037795525044202805,
	"learning_rate": 1.0965986394557825e-05,
	"loss": 0.0026,
	"step": 2870
	},
	{
	"epoch": 19.591836734693878,
	"grad_norm": 1.3488638401031494,
	"learning_rate": 1.0829931972789116e-05,
	"loss": 0.004,
	"step": 2880
	},
	{
	"epoch": 19.65986394557823,
	"grad_norm": 0.05746370553970337,
	"learning_rate": 1.0693877551020409e-05,
	"loss": 0.0192,
	"step": 2890
	},
	{
	"epoch": 19.727891156462587,
	"grad_norm": 0.025979384779930115,
	"learning_rate": 1.05578231292517e-05,
	"loss": 0.0091,
	"step": 2900
	},
	{
	"epoch": 19.79591836734694,
	"grad_norm": 4.972421646118164,
	"learning_rate": 1.0421768707482993e-05,
	"loss": 0.0082,
	"step": 2910
	},
	{
	"epoch": 19.86394557823129,
	"grad_norm": 0.49525704979896545,
	"learning_rate": 1.0285714285714286e-05,
	"loss": 0.0034,
	"step": 2920
	},
	{
	"epoch": 19.931972789115648,
	"grad_norm": 0.02950323186814785,
	"learning_rate": 1.014965986394558e-05,
	"loss": 0.07,
	"step": 2930
	},
	{
	"epoch": 20.0,
	"grad_norm": 0.047243040055036545,
	"learning_rate": 1.001360544217687e-05,
	"loss": 0.0019,
	"step": 2940
	},
	{
	"epoch": 20.0,
	"eval_cer": 0.30176767676767674,
	"eval_loss": 0.011288419365882874,
	"eval_runtime": 4.0348,
	"eval_samples_per_second": 72.618,
	"eval_steps_per_second": 36.433,
	"step": 2940
	},
	{
	"epoch": 20.068027210884352,
	"grad_norm": 8.58004093170166,
	"learning_rate": 9.877551020408164e-06,
	"loss": 0.02,
	"step": 2950
	},
	{
	"epoch": 20.13605442176871,
	"grad_norm": 0.2544482946395874,
	"learning_rate": 9.741496598639455e-06,
	"loss": 0.0156,
	"step": 2960
	},
	{
	"epoch": 20.20408163265306,
	"grad_norm": 0.5715163350105286,
	"learning_rate": 9.60544217687075e-06,
	"loss": 0.0027,
	"step": 2970
	},
	{
	"epoch": 20.272108843537413,
	"grad_norm": 0.134610116481781,
	"learning_rate": 9.469387755102041e-06,
	"loss": 0.0394,
	"step": 2980
	},
	{
	"epoch": 20.34013605442177,
	"grad_norm": 0.23469507694244385,
	"learning_rate": 9.333333333333334e-06,
	"loss": 0.0142,
	"step": 2990
	},
	{
	"epoch": 20.408163265306122,
	"grad_norm": 0.19277207553386688,
	"learning_rate": 9.197278911564626e-06,
	"loss": 0.0214,
	"step": 3000
	},
	{
	"epoch": 20.476190476190474,
	"grad_norm": 0.04216855764389038,
	"learning_rate": 9.061224489795919e-06,
	"loss": 0.0014,
	"step": 3010
	},
	{
	"epoch": 20.54421768707483,
	"grad_norm": 0.02860959619283676,
	"learning_rate": 8.925170068027212e-06,
	"loss": 0.0049,
	"step": 3020
	},
	{
	"epoch": 20.612244897959183,
	"grad_norm": 0.38055145740509033,
	"learning_rate": 8.789115646258505e-06,
	"loss": 0.0193,
	"step": 3030
	},
	{
	"epoch": 20.68027210884354,
	"grad_norm": 0.034134916961193085,
	"learning_rate": 8.653061224489796e-06,
	"loss": 0.0015,
	"step": 3040
	},
	{
	"epoch": 20.74829931972789,
	"grad_norm": 0.6501132845878601,
	"learning_rate": 8.517006802721089e-06,
	"loss": 0.003,
	"step": 3050
	},
	{
	"epoch": 20.816326530612244,
	"grad_norm": 0.26927316188812256,
	"learning_rate": 8.38095238095238e-06,
	"loss": 0.0064,
	"step": 3060
	},
	{
	"epoch": 20.8843537414966,
	"grad_norm": 0.308063805103302,
	"learning_rate": 8.244897959183674e-06,
	"loss": 0.0171,
	"step": 3070
	},
	{
	"epoch": 20.952380952380953,
	"grad_norm": 0.0912749320268631,
	"learning_rate": 8.108843537414967e-06,
	"loss": 0.0034,
	"step": 3080
	},
	{
	"epoch": 21.0,
	"eval_cer": 0.23863636363636365,
	"eval_loss": 0.009314554743468761,
	"eval_runtime": 3.7562,
	"eval_samples_per_second": 78.005,
	"eval_steps_per_second": 39.135,
	"step": 3087
	},
	{
	"epoch": 21.020408163265305,
	"grad_norm": 0.031063944101333618,
	"learning_rate": 7.97278911564626e-06,
	"loss": 0.0025,
	"step": 3090
	},
	{
	"epoch": 21.08843537414966,
	"grad_norm": 0.45678919553756714,
	"learning_rate": 7.836734693877551e-06,
	"loss": 0.0017,
	"step": 3100
	},
	{
	"epoch": 21.156462585034014,
	"grad_norm": 0.06373850256204605,
	"learning_rate": 7.700680272108844e-06,
	"loss": 0.0203,
	"step": 3110
	},
	{
	"epoch": 21.224489795918366,
	"grad_norm": 0.04051206260919571,
	"learning_rate": 7.564625850340136e-06,
	"loss": 0.0028,
	"step": 3120
	},
	{
	"epoch": 21.292517006802722,
	"grad_norm": 0.20778831839561462,
	"learning_rate": 7.428571428571429e-06,
	"loss": 0.0032,
	"step": 3130
	},
	{
	"epoch": 21.360544217687075,
	"grad_norm": 0.23982657492160797,
	"learning_rate": 7.292517006802721e-06,
	"loss": 0.0097,
	"step": 3140
	},
	{
	"epoch": 21.428571428571427,
	"grad_norm": 0.30359897017478943,
	"learning_rate": 7.1564625850340144e-06,
	"loss": 0.002,
	"step": 3150
	},
	{
	"epoch": 21.496598639455783,
	"grad_norm": 0.844930112361908,
	"learning_rate": 7.020408163265306e-06,
	"loss": 0.064,
	"step": 3160
	},
	{
	"epoch": 21.564625850340136,
	"grad_norm": 0.2660425305366516,
	"learning_rate": 6.884353741496599e-06,
	"loss": 0.011,
	"step": 3170
	},
	{
	"epoch": 21.632653061224488,
	"grad_norm": 0.1279953122138977,
	"learning_rate": 6.748299319727891e-06,
	"loss": 0.0027,
	"step": 3180
	},
	{
	"epoch": 21.700680272108844,
	"grad_norm": 0.05603710934519768,
	"learning_rate": 6.612244897959184e-06,
	"loss": 0.0012,
	"step": 3190
	},
	{
	"epoch": 21.768707482993197,
	"grad_norm": 0.05168928578495979,
	"learning_rate": 6.476190476190476e-06,
	"loss": 0.0176,
	"step": 3200
	},
	{
	"epoch": 21.836734693877553,
	"grad_norm": 0.046198636293411255,
	"learning_rate": 6.340136054421769e-06,
	"loss": 0.0013,
	"step": 3210
	},
	{
	"epoch": 21.904761904761905,
	"grad_norm": 0.042502377182245255,
	"learning_rate": 6.2040816326530614e-06,
	"loss": 0.0015,
	"step": 3220
	},
	{
	"epoch": 21.972789115646258,
	"grad_norm": 0.24547749757766724,
	"learning_rate": 6.0680272108843545e-06,
	"loss": 0.0023,
	"step": 3230
	},
	{
	"epoch": 22.0,
	"eval_cer": 0.23106060606060605,
	"eval_loss": 0.009045995771884918,
	"eval_runtime": 3.8812,
	"eval_samples_per_second": 75.492,
	"eval_steps_per_second": 37.875,
	"step": 3234
	},
	{
	"epoch": 22.040816326530614,
	"grad_norm": 1.8699299097061157,
	"learning_rate": 5.931972789115647e-06,
	"loss": 0.0095,
	"step": 3240
	},
	{
	"epoch": 22.108843537414966,
	"grad_norm": 0.028658084571361542,
	"learning_rate": 5.795918367346939e-06,
	"loss": 0.002,
	"step": 3250
	},
	{
	"epoch": 22.17687074829932,
	"grad_norm": 0.11185970157384872,
	"learning_rate": 5.659863945578232e-06,
	"loss": 0.0139,
	"step": 3260
	},
	{
	"epoch": 22.244897959183675,
	"grad_norm": 0.08078885078430176,
	"learning_rate": 5.523809523809524e-06,
	"loss": 0.0093,
	"step": 3270
	},
	{
	"epoch": 22.312925170068027,
	"grad_norm": 0.033784542232751846,
	"learning_rate": 5.387755102040816e-06,
	"loss": 0.0035,
	"step": 3280
	},
	{
	"epoch": 22.38095238095238,
	"grad_norm": 0.04999591037631035,
	"learning_rate": 5.251700680272109e-06,
	"loss": 0.0158,
	"step": 3290
	},
	{
	"epoch": 22.448979591836736,
	"grad_norm": 0.47869572043418884,
	"learning_rate": 5.1156462585034015e-06,
	"loss": 0.002,
	"step": 3300
	},
	{
	"epoch": 22.517006802721088,
	"grad_norm": 0.5939333438873291,
	"learning_rate": 4.9795918367346945e-06,
	"loss": 0.0025,
	"step": 3310
	},
	{
	"epoch": 22.58503401360544,
	"grad_norm": 0.02597820572555065,
	"learning_rate": 4.843537414965987e-06,
	"loss": 0.017,
	"step": 3320
	},
	{
	"epoch": 22.653061224489797,
	"grad_norm": 0.06343343108892441,
	"learning_rate": 4.707482993197279e-06,
	"loss": 0.0414,
	"step": 3330
	},
	{
	"epoch": 22.72108843537415,
	"grad_norm": 0.40962278842926025,
	"learning_rate": 4.571428571428572e-06,
	"loss": 0.0114,
	"step": 3340
	},
	{
	"epoch": 22.7891156462585,
	"grad_norm": 0.29765334725379944,
	"learning_rate": 4.435374149659864e-06,
	"loss": 0.0023,
	"step": 3350
	},
	{
	"epoch": 22.857142857142858,
	"grad_norm": 0.17841386795043945,
	"learning_rate": 4.299319727891156e-06,
	"loss": 0.0016,
	"step": 3360
	},
	{
	"epoch": 22.92517006802721,
	"grad_norm": 0.44667163491249084,
	"learning_rate": 4.163265306122449e-06,
	"loss": 0.0021,
	"step": 3370
	},
	{
	"epoch": 22.993197278911566,
	"grad_norm": 0.19756975769996643,
	"learning_rate": 4.0272108843537416e-06,
	"loss": 0.0073,
	"step": 3380
	},
	{
	"epoch": 23.0,
	"eval_cer": 0.23737373737373738,
	"eval_loss": 0.008361349813640118,
	"eval_runtime": 3.9088,
	"eval_samples_per_second": 74.958,
	"eval_steps_per_second": 37.607,
	"step": 3381
	},
	{
	"epoch": 23.06122448979592,
	"grad_norm": 4.8710503578186035,
	"learning_rate": 3.891156462585034e-06,
	"loss": 0.0383,
	"step": 3390
	},
	{
	"epoch": 23.12925170068027,
	"grad_norm": 0.05327881500124931,
	"learning_rate": 3.7551020408163268e-06,
	"loss": 0.0026,
	"step": 3400
	},
	{
	"epoch": 23.197278911564627,
	"grad_norm": 0.4828534722328186,
	"learning_rate": 3.619047619047619e-06,
	"loss": 0.0024,
	"step": 3410
	},
	{
	"epoch": 23.26530612244898,
	"grad_norm": 0.03481818363070488,
	"learning_rate": 3.4829931972789116e-06,
	"loss": 0.0068,
	"step": 3420
	},
	{
	"epoch": 23.333333333333332,
	"grad_norm": 0.19071730971336365,
	"learning_rate": 3.346938775510204e-06,
	"loss": 0.0171,
	"step": 3430
	},
	{
	"epoch": 23.401360544217688,
	"grad_norm": 0.08115135878324509,
	"learning_rate": 3.210884353741497e-06,
	"loss": 0.0015,
	"step": 3440
	},
	{
	"epoch": 23.46938775510204,
	"grad_norm": 0.13966763019561768,
	"learning_rate": 3.074829931972789e-06,
	"loss": 0.0309,
	"step": 3450
	},
	{
	"epoch": 23.537414965986393,
	"grad_norm": 0.08014482259750366,
	"learning_rate": 2.9387755102040816e-06,
	"loss": 0.0028,
	"step": 3460
	},
	{
	"epoch": 23.60544217687075,
	"grad_norm": 0.7266091108322144,
	"learning_rate": 2.8027210884353742e-06,
	"loss": 0.0019,
	"step": 3470
	},
	{
	"epoch": 23.6734693877551,
	"grad_norm": 0.763943076133728,
	"learning_rate": 2.666666666666667e-06,
	"loss": 0.0029,
	"step": 3480
	},
	{
	"epoch": 23.741496598639454,
	"grad_norm": 0.20366428792476654,
	"learning_rate": 2.5306122448979594e-06,
	"loss": 0.0077,
	"step": 3490
	},
	{
	"epoch": 23.80952380952381,
	"grad_norm": 0.06424231082201004,
	"learning_rate": 2.394557823129252e-06,
	"loss": 0.0048,
	"step": 3500
	},
	{
	"epoch": 23.877551020408163,
	"grad_norm": 0.0471784844994545,
	"learning_rate": 2.2585034013605447e-06,
	"loss": 0.0027,
	"step": 3510
	},
	{
	"epoch": 23.94557823129252,
	"grad_norm": 0.6746675968170166,
	"learning_rate": 2.122448979591837e-06,
	"loss": 0.0022,
	"step": 3520
	},
	{
	"epoch": 24.0,
	"eval_cer": 0.2702020202020202,
	"eval_loss": 0.008024842478334904,
	"eval_runtime": 3.9491,
	"eval_samples_per_second": 74.195,
	"eval_steps_per_second": 37.224,
	"step": 3528
	},
	{
	"epoch": 24.01360544217687,
	"grad_norm": 0.248748779296875,
	"learning_rate": 1.9863945578231295e-06,
	"loss": 0.0013,
	"step": 3530
	},
	{
	"epoch": 24.081632653061224,
	"grad_norm": 5.284445762634277,
	"learning_rate": 1.8503401360544219e-06,
	"loss": 0.0097,
	"step": 3540
	},
	{
	"epoch": 24.14965986394558,
	"grad_norm": 0.07442311942577362,
	"learning_rate": 1.7142857142857145e-06,
	"loss": 0.011,
	"step": 3550
	},
	{
	"epoch": 24.217687074829932,
	"grad_norm": 0.1644800305366516,
	"learning_rate": 1.5782312925170069e-06,
	"loss": 0.0014,
	"step": 3560
	},
	{
	"epoch": 24.285714285714285,
	"grad_norm": 0.05962975695729256,
	"learning_rate": 1.4421768707482995e-06,
	"loss": 0.0018,
	"step": 3570
	},
	{
	"epoch": 24.35374149659864,
	"grad_norm": 0.039682451635599136,
	"learning_rate": 1.306122448979592e-06,
	"loss": 0.0025,
	"step": 3580
	},
	{
	"epoch": 24.421768707482993,
	"grad_norm": 0.0817071795463562,
	"learning_rate": 1.1700680272108845e-06,
	"loss": 0.0032,
	"step": 3590
	},
	{
	"epoch": 24.489795918367346,
	"grad_norm": 0.07747264206409454,
	"learning_rate": 1.034013605442177e-06,
	"loss": 0.015,
	"step": 3600
	},
	{
	"epoch": 24.5578231292517,
	"grad_norm": 0.04547140747308731,
	"learning_rate": 8.979591836734694e-07,
	"loss": 0.0015,
	"step": 3610
	},
	{
	"epoch": 24.625850340136054,
	"grad_norm": 0.04727374389767647,
	"learning_rate": 7.619047619047619e-07,
	"loss": 0.0023,
	"step": 3620
	},
	{
	"epoch": 24.693877551020407,
	"grad_norm": 0.14271779358386993,
	"learning_rate": 6.258503401360544e-07,
	"loss": 0.0025,
	"step": 3630
	},
	{
	"epoch": 24.761904761904763,
	"grad_norm": 0.4749351441860199,
	"learning_rate": 4.897959183673469e-07,
	"loss": 0.0026,
	"step": 3640
	},
	{
	"epoch": 24.829931972789115,
	"grad_norm": 10.92783260345459,
	"learning_rate": 3.537414965986395e-07,
	"loss": 0.0217,
	"step": 3650
	},
	{
	"epoch": 24.897959183673468,
	"grad_norm": 0.14225248992443085,
	"learning_rate": 2.1768707482993197e-07,
	"loss": 0.0016,
	"step": 3660
	},
	{
	"epoch": 24.965986394557824,
	"grad_norm": 0.06080883741378784,
	"learning_rate": 8.16326530612245e-08,
	"loss": 0.0391,
	"step": 3670
	},
	{
	"epoch": 25.0,
	"eval_cer": 0.26515151515151514,
	"eval_loss": 0.007971594110131264,
	"eval_runtime": 3.9963,
	"eval_samples_per_second": 73.317,
	"eval_steps_per_second": 36.784,
	"step": 3675
	}
	],
	"logging_steps": 10,
	"max_steps": 3675,
	"num_input_tokens_seen": 0,
	"num_train_epochs": 25,
	"save_steps": 500,
	"stateful_callbacks": {
	"TrainerControl": {
	"args": {
	"should_epoch_stop": false,
	"should_evaluate": false,
	"should_log": false,
	"should_save": true,
	"should_training_stop": true
	},
	"attributes": {}
	}
	},
	"total_flos": 5.759922930951168e+17,
	"train_batch_size": 2,
	"trial_name": null,
	"trial_params": null
	}