Add model files

Browse files

Files changed (8) hide show

config.json +76 -0
optimizer.pt +3 -0
preprocessor_config.json +8 -0
pytorch_model.bin +3 -0
scheduler.pt +3 -0
trainer_state.json +1570 -0
training_args.bin +3 -0
vocab.json +1 -0

config.json ADDED Viewed

	@@ -0,0 +1,76 @@

+{
+  "_name_or_path": "facebook/wav2vec2-large-xlsr-53",
+  "activation_dropout": 0.0,
+  "apply_spec_augment": true,
+  "architectures": [
+    "Wav2Vec2ForCTC"
+  ],
+  "attention_dropout": 0.1,
+  "bos_token_id": 1,
+  "conv_bias": true,
+  "conv_dim": [
+    512,
+    512,
+    512,
+    512,
+    512,
+    512,
+    512
+  ],
+  "conv_kernel": [
+    10,
+    3,
+    3,
+    3,
+    3,
+    2,
+    2
+  ],
+  "conv_stride": [
+    5,
+    2,
+    2,
+    2,
+    2,
+    2,
+    2
+  ],
+  "ctc_loss_reduction": "mean",
+  "ctc_zero_infinity": false,
+  "do_stable_layer_norm": true,
+  "eos_token_id": 2,
+  "feat_extract_activation": "gelu",
+  "feat_extract_dropout": 0.0,
+  "feat_extract_norm": "layer",
+  "feat_proj_dropout": 0.0,
+  "final_dropout": 0.0,
+  "gradient_checkpointing": true,
+  "hidden_act": "gelu",
+  "hidden_dropout": 0.1,
+  "hidden_size": 1024,
+  "initializer_range": 0.02,
+  "intermediate_size": 4096,
+  "layer_norm_eps": 1e-05,
+  "layerdrop": 0.1,
+  "mask_channel_length": 10,
+  "mask_channel_min_space": 1,
+  "mask_channel_other": 0.0,
+  "mask_channel_prob": 0.0,
+  "mask_channel_selection": "static",
+  "mask_feature_length": 10,
+  "mask_feature_prob": 0.0,
+  "mask_time_length": 10,
+  "mask_time_min_space": 1,
+  "mask_time_other": 0.0,
+  "mask_time_prob": 0.05,
+  "mask_time_selection": "static",
+  "model_type": "wav2vec2",
+  "num_attention_heads": 16,
+  "num_conv_pos_embedding_groups": 16,
+  "num_conv_pos_embeddings": 128,
+  "num_feat_extract_layers": 7,
+  "num_hidden_layers": 24,
+  "pad_token_id": 37,
+  "transformers_version": "4.4.0",
+  "vocab_size": 38
+}

optimizer.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:b1885ba54b1f88b8a70532ae0d8c228ba0a0c5cbbbe7733a2afb92970b5ea592
+size 2490380826

preprocessor_config.json ADDED Viewed

	@@ -0,0 +1,8 @@

+{
+  "do_normalize": true,
+  "feature_size": 1,
+  "padding_side": "right",
+  "padding_value": 0.0,
+  "return_attention_mask": true,
+  "sampling_rate": 16000
+}

pytorch_model.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:d4b38a6977828d09107e72b8a2ddc93fbce4b2a12a03d9f8d3feb03d011c581c
+size 1262085388

scheduler.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:60196e9b4bbb3376d3b5154ad301a76c83588fe7cd19de675a5e110e2ca178b1
+size 623

trainer_state.json ADDED Viewed

	@@ -0,0 +1,1570 @@

+{
+  "best_metric": null,
+  "best_model_checkpoint": null,
+  "epoch": 112.12090680100755,
+  "global_step": 22200,
+  "is_hyper_param_search": false,
+  "is_local_process_zero": true,
+  "is_world_process_zero": true,
+  "log_history": [
+    {
+      "epoch": 1.01,
+      "learning_rate": 0.0003,
+      "loss": 6.4459,
+      "step": 200
+    },
+    {
+      "epoch": 1.01,
+      "eval_loss": 3.1488852500915527,
+      "eval_runtime": 134.1012,
+      "eval_samples_per_second": 4.892,
+      "eval_wer": 1.0,
+      "step": 200
+    },
+    {
+      "epoch": 2.02,
+      "learning_rate": 0.00029898648648648646,
+      "loss": 3.0913,
+      "step": 400
+    },
+    {
+      "epoch": 2.02,
+      "eval_loss": 3.1127500534057617,
+      "eval_runtime": 138.7081,
+      "eval_samples_per_second": 4.729,
+      "eval_wer": 1.0,
+      "step": 400
+    },
+    {
+      "epoch": 3.03,
+      "learning_rate": 0.00029797297297297294,
+      "loss": 3.0716,
+      "step": 600
+    },
+    {
+      "epoch": 3.03,
+      "eval_loss": 3.0870425701141357,
+      "eval_runtime": 138.315,
+      "eval_samples_per_second": 4.743,
+      "eval_wer": 1.0,
+      "step": 600
+    },
+    {
+      "epoch": 4.04,
+      "learning_rate": 0.0002969594594594594,
+      "loss": 3.0298,
+      "step": 800
+    },
+    {
+      "epoch": 4.04,
+      "eval_loss": 3.0003437995910645,
+      "eval_runtime": 134.8731,
+      "eval_samples_per_second": 4.864,
+      "eval_wer": 1.0,
+      "step": 800
+    },
+    {
+      "epoch": 5.05,
+      "learning_rate": 0.0002959459459459459,
+      "loss": 1.728,
+      "step": 1000
+    },
+    {
+      "epoch": 5.05,
+      "eval_loss": 0.805480420589447,
+      "eval_runtime": 135.0581,
+      "eval_samples_per_second": 4.857,
+      "eval_wer": 0.8985599322321051,
+      "step": 1000
+    },
+    {
+      "epoch": 6.06,
+      "learning_rate": 0.0002949324324324324,
+      "loss": 0.6228,
+      "step": 1200
+    },
+    {
+      "epoch": 6.06,
+      "eval_loss": 0.6153338551521301,
+      "eval_runtime": 138.3824,
+      "eval_samples_per_second": 4.74,
+      "eval_wer": 0.8263447691656078,
+      "step": 1200
+    },
+    {
+      "epoch": 7.07,
+      "learning_rate": 0.0002939189189189189,
+      "loss": 0.4109,
+      "step": 1400
+    },
+    {
+      "epoch": 7.07,
+      "eval_loss": 0.5761246085166931,
+      "eval_runtime": 136.2401,
+      "eval_samples_per_second": 4.815,
+      "eval_wer": 0.8009318085556968,
+      "step": 1400
+    },
+    {
+      "epoch": 8.08,
+      "learning_rate": 0.00029290540540540536,
+      "loss": 0.3384,
+      "step": 1600
+    },
+    {
+      "epoch": 8.08,
+      "eval_loss": 0.6021555662155151,
+      "eval_runtime": 135.414,
+      "eval_samples_per_second": 4.844,
+      "eval_wer": 0.7981787378229563,
+      "step": 1600
+    },
+    {
+      "epoch": 9.09,
+      "learning_rate": 0.0002918918918918919,
+      "loss": 0.2676,
+      "step": 1800
+    },
+    {
+      "epoch": 9.09,
+      "eval_loss": 0.556929349899292,
+      "eval_runtime": 136.0159,
+      "eval_samples_per_second": 4.823,
+      "eval_wer": 0.7505294366793731,
+      "step": 1800
+    },
+    {
+      "epoch": 10.1,
+      "learning_rate": 0.0002908783783783784,
+      "loss": 0.2321,
+      "step": 2000
+    },
+    {
+      "epoch": 10.1,
+      "eval_loss": 0.6468214392662048,
+      "eval_runtime": 135.5988,
+      "eval_samples_per_second": 4.838,
+      "eval_wer": 0.7736128759000424,
+      "step": 2000
+    },
+    {
+      "epoch": 11.11,
+      "learning_rate": 0.00028986486486486487,
+      "loss": 0.2031,
+      "step": 2200
+    },
+    {
+      "epoch": 11.11,
+      "eval_loss": 0.6612684726715088,
+      "eval_runtime": 135.8609,
+      "eval_samples_per_second": 4.828,
+      "eval_wer": 0.7884371029224905,
+      "step": 2200
+    },
+    {
+      "epoch": 12.12,
+      "learning_rate": 0.00028885135135135135,
+      "loss": 0.1853,
+      "step": 2400
+    },
+    {
+      "epoch": 12.12,
+      "eval_loss": 0.6352970600128174,
+      "eval_runtime": 135.9654,
+      "eval_samples_per_second": 4.825,
+      "eval_wer": 0.736552308343922,
+      "step": 2400
+    },
+    {
+      "epoch": 13.13,
+      "learning_rate": 0.0002878378378378378,
+      "loss": 0.1826,
+      "step": 2600
+    },
+    {
+      "epoch": 13.13,
+      "eval_loss": 0.6177716851234436,
+      "eval_runtime": 136.1311,
+      "eval_samples_per_second": 4.819,
+      "eval_wer": 0.7238458280389666,
+      "step": 2600
+    },
+    {
+      "epoch": 14.14,
+      "learning_rate": 0.00028682432432432426,
+      "loss": 0.1627,
+      "step": 2800
+    },
+    {
+      "epoch": 14.14,
+      "eval_loss": 0.6629394888877869,
+      "eval_runtime": 135.7236,
+      "eval_samples_per_second": 4.833,
+      "eval_wer": 0.734011012282931,
+      "step": 2800
+    },
+    {
+      "epoch": 15.15,
+      "learning_rate": 0.0002858108108108108,
+      "loss": 0.1506,
+      "step": 3000
+    },
+    {
+      "epoch": 15.15,
+      "eval_loss": 0.6606569886207581,
+      "eval_runtime": 137.5748,
+      "eval_samples_per_second": 4.768,
+      "eval_wer": 0.7272342227869547,
+      "step": 3000
+    },
+    {
+      "epoch": 16.16,
+      "learning_rate": 0.0002847972972972973,
+      "loss": 0.1432,
+      "step": 3200
+    },
+    {
+      "epoch": 16.16,
+      "eval_loss": 0.6748045086860657,
+      "eval_runtime": 135.8657,
+      "eval_samples_per_second": 4.828,
+      "eval_wer": 0.7335874629394324,
+      "step": 3200
+    },
+    {
+      "epoch": 17.17,
+      "learning_rate": 0.00028378378378378377,
+      "loss": 0.1396,
+      "step": 3400
+    },
+    {
+      "epoch": 17.17,
+      "eval_loss": 0.6931908130645752,
+      "eval_runtime": 136.0012,
+      "eval_samples_per_second": 4.823,
+      "eval_wer": 0.7236340533672173,
+      "step": 3400
+    },
+    {
+      "epoch": 18.18,
+      "learning_rate": 0.00028277027027027025,
+      "loss": 0.1397,
+      "step": 3600
+    },
+    {
+      "epoch": 18.18,
+      "eval_loss": 0.6838018894195557,
+      "eval_runtime": 135.7614,
+      "eval_samples_per_second": 4.832,
+      "eval_wer": 0.7316814908936892,
+      "step": 3600
+    },
+    {
+      "epoch": 19.19,
+      "learning_rate": 0.00028175675675675674,
+      "loss": 0.1317,
+      "step": 3800
+    },
+    {
+      "epoch": 19.19,
+      "eval_loss": 0.689399242401123,
+      "eval_runtime": 136.2101,
+      "eval_samples_per_second": 4.816,
+      "eval_wer": 0.7242693773824651,
+      "step": 3800
+    },
+    {
+      "epoch": 20.2,
+      "learning_rate": 0.0002807432432432432,
+      "loss": 0.1225,
+      "step": 4000
+    },
+    {
+      "epoch": 20.2,
+      "eval_loss": 0.7114871144294739,
+      "eval_runtime": 135.7901,
+      "eval_samples_per_second": 4.831,
+      "eval_wer": 0.745446844557391,
+      "step": 4000
+    },
+    {
+      "epoch": 21.21,
+      "learning_rate": 0.0002797297297297297,
+      "loss": 0.121,
+      "step": 4200
+    },
+    {
+      "epoch": 21.21,
+      "eval_loss": 0.7714667916297913,
+      "eval_runtime": 144.4676,
+      "eval_samples_per_second": 4.541,
+      "eval_wer": 0.7439644218551461,
+      "step": 4200
+    },
+    {
+      "epoch": 22.22,
+      "learning_rate": 0.0002787162162162162,
+      "loss": 0.1214,
+      "step": 4400
+    },
+    {
+      "epoch": 22.22,
+      "eval_loss": 0.6892368197441101,
+      "eval_runtime": 141.5565,
+      "eval_samples_per_second": 4.634,
+      "eval_wer": 0.7246929267259635,
+      "step": 4400
+    },
+    {
+      "epoch": 23.23,
+      "learning_rate": 0.00027770270270270267,
+      "loss": 0.1201,
+      "step": 4600
+    },
+    {
+      "epoch": 23.23,
+      "eval_loss": 0.7176805734634399,
+      "eval_runtime": 136.4081,
+      "eval_samples_per_second": 4.809,
+      "eval_wer": 0.7329521389241846,
+      "step": 4600
+    },
+    {
+      "epoch": 24.24,
+      "learning_rate": 0.00027668918918918916,
+      "loss": 0.1144,
+      "step": 4800
+    },
+    {
+      "epoch": 24.24,
+      "eval_loss": 0.7144946455955505,
+      "eval_runtime": 135.6564,
+      "eval_samples_per_second": 4.836,
+      "eval_wer": 0.7143159678102499,
+      "step": 4800
+    },
+    {
+      "epoch": 25.25,
+      "learning_rate": 0.00027567567567567564,
+      "loss": 0.1087,
+      "step": 5000
+    },
+    {
+      "epoch": 25.25,
+      "eval_loss": 0.6824408769607544,
+      "eval_runtime": 146.0202,
+      "eval_samples_per_second": 4.493,
+      "eval_wer": 0.7551884794578568,
+      "step": 5000
+    },
+    {
+      "epoch": 26.26,
+      "learning_rate": 0.0002746621621621621,
+      "loss": 0.1088,
+      "step": 5200
+    },
+    {
+      "epoch": 26.26,
+      "eval_loss": 0.7299026846885681,
+      "eval_runtime": 136.6707,
+      "eval_samples_per_second": 4.8,
+      "eval_wer": 0.7293519695044473,
+      "step": 5200
+    },
+    {
+      "epoch": 27.27,
+      "learning_rate": 0.0002736486486486486,
+      "loss": 0.1033,
+      "step": 5400
+    },
+    {
+      "epoch": 27.27,
+      "eval_loss": 0.7187995910644531,
+      "eval_runtime": 135.6478,
+      "eval_samples_per_second": 4.836,
+      "eval_wer": 0.7187632359169843,
+      "step": 5400
+    },
+    {
+      "epoch": 28.28,
+      "learning_rate": 0.0002726351351351351,
+      "loss": 0.1035,
+      "step": 5600
+    },
+    {
+      "epoch": 28.28,
+      "eval_loss": 0.7574965953826904,
+      "eval_runtime": 135.5201,
+      "eval_samples_per_second": 4.841,
+      "eval_wer": 0.743117323168149,
+      "step": 5600
+    },
+    {
+      "epoch": 29.29,
+      "learning_rate": 0.0002716216216216216,
+      "loss": 0.1052,
+      "step": 5800
+    },
+    {
+      "epoch": 29.29,
+      "eval_loss": 0.7272396683692932,
+      "eval_runtime": 135.608,
+      "eval_samples_per_second": 4.837,
+      "eval_wer": 0.7181279119017365,
+      "step": 5800
+    },
+    {
+      "epoch": 30.3,
+      "learning_rate": 0.00027060810810810806,
+      "loss": 0.1074,
+      "step": 6000
+    },
+    {
+      "epoch": 30.3,
+      "eval_loss": 0.7088936567306519,
+      "eval_runtime": 135.3489,
+      "eval_samples_per_second": 4.847,
+      "eval_wer": 0.7011859381617959,
+      "step": 6000
+    },
+    {
+      "epoch": 31.31,
+      "learning_rate": 0.0002695945945945946,
+      "loss": 0.105,
+      "step": 6200
+    },
+    {
+      "epoch": 31.31,
+      "eval_loss": 0.7318005561828613,
+      "eval_runtime": 136.2308,
+      "eval_samples_per_second": 4.815,
+      "eval_wer": 0.7157983905124947,
+      "step": 6200
+    },
+    {
+      "epoch": 32.32,
+      "learning_rate": 0.0002685810810810811,
+      "loss": 0.0937,
+      "step": 6400
+    },
+    {
+      "epoch": 32.32,
+      "eval_loss": 0.743655264377594,
+      "eval_runtime": 135.8626,
+      "eval_samples_per_second": 4.828,
+      "eval_wer": 0.7115628970775095,
+      "step": 6400
+    },
+    {
+      "epoch": 33.33,
+      "learning_rate": 0.00026756756756756756,
+      "loss": 0.0976,
+      "step": 6600
+    },
+    {
+      "epoch": 33.33,
+      "eval_loss": 0.7406659126281738,
+      "eval_runtime": 136.2332,
+      "eval_samples_per_second": 4.815,
+      "eval_wer": 0.7257518000847099,
+      "step": 6600
+    },
+    {
+      "epoch": 34.34,
+      "learning_rate": 0.00026655405405405405,
+      "loss": 0.0961,
+      "step": 6800
+    },
+    {
+      "epoch": 34.34,
+      "eval_loss": 0.7474074959754944,
+      "eval_runtime": 136.361,
+      "eval_samples_per_second": 4.811,
+      "eval_wer": 0.729987293519695,
+      "step": 6800
+    },
+    {
+      "epoch": 35.35,
+      "learning_rate": 0.0002655405405405405,
+      "loss": 0.0922,
+      "step": 7000
+    },
+    {
+      "epoch": 35.35,
+      "eval_loss": 0.7413117289543152,
+      "eval_runtime": 137.8262,
+      "eval_samples_per_second": 4.76,
+      "eval_wer": 0.7399407030919102,
+      "step": 7000
+    },
+    {
+      "epoch": 36.36,
+      "learning_rate": 0.000264527027027027,
+      "loss": 0.0897,
+      "step": 7200
+    },
+    {
+      "epoch": 36.36,
+      "eval_loss": 0.7571277618408203,
+      "eval_runtime": 135.8962,
+      "eval_samples_per_second": 4.827,
+      "eval_wer": 0.7467174925878864,
+      "step": 7200
+    },
+    {
+      "epoch": 37.37,
+      "learning_rate": 0.0002635135135135135,
+      "loss": 0.0936,
+      "step": 7400
+    },
+    {
+      "epoch": 37.37,
+      "eval_loss": 0.7212100028991699,
+      "eval_runtime": 136.3693,
+      "eval_samples_per_second": 4.81,
+      "eval_wer": 0.7162219398559933,
+      "step": 7400
+    },
+    {
+      "epoch": 38.38,
+      "learning_rate": 0.0002625,
+      "loss": 0.0898,
+      "step": 7600
+    },
+    {
+      "epoch": 38.38,
+      "eval_loss": 0.751598060131073,
+      "eval_runtime": 138.668,
+      "eval_samples_per_second": 4.731,
+      "eval_wer": 0.7210927573062261,
+      "step": 7600
+    },
+    {
+      "epoch": 39.39,
+      "learning_rate": 0.00026148648648648647,
+      "loss": 0.0902,
+      "step": 7800
+    },
+    {
+      "epoch": 39.39,
+      "eval_loss": 0.7493733167648315,
+      "eval_runtime": 136.1591,
+      "eval_samples_per_second": 4.818,
+      "eval_wer": 0.7477763659466328,
+      "step": 7800
+    },
+    {
+      "epoch": 40.4,
+      "learning_rate": 0.00026047297297297295,
+      "loss": 0.0847,
+      "step": 8000
+    },
+    {
+      "epoch": 40.4,
+      "eval_loss": 0.6728424429893494,
+      "eval_runtime": 140.5502,
+      "eval_samples_per_second": 4.667,
+      "eval_wer": 0.7306226175349428,
+      "step": 8000
+    },
+    {
+      "epoch": 41.41,
+      "learning_rate": 0.00025945945945945944,
+      "loss": 0.0866,
+      "step": 8200
+    },
+    {
+      "epoch": 41.41,
+      "eval_loss": 0.749858558177948,
+      "eval_runtime": 146.7628,
+      "eval_samples_per_second": 4.47,
+      "eval_wer": 0.7151630664972469,
+      "step": 8200
+    },
+    {
+      "epoch": 42.42,
+      "learning_rate": 0.0002584459459459459,
+      "loss": 0.0809,
+      "step": 8400
+    },
+    {
+      "epoch": 42.42,
+      "eval_loss": 0.7739278078079224,
+      "eval_runtime": 136.5403,
+      "eval_samples_per_second": 4.804,
+      "eval_wer": 0.7429055484963998,
+      "step": 8400
+    },
+    {
+      "epoch": 43.43,
+      "learning_rate": 0.0002574324324324324,
+      "loss": 0.0847,
+      "step": 8600
+    },
+    {
+      "epoch": 43.43,
+      "eval_loss": 0.7759637236595154,
+      "eval_runtime": 136.7555,
+      "eval_samples_per_second": 4.797,
+      "eval_wer": 0.7244811520542143,
+      "step": 8600
+    },
+    {
+      "epoch": 44.44,
+      "learning_rate": 0.0002564189189189189,
+      "loss": 0.0852,
+      "step": 8800
+    },
+    {
+      "epoch": 44.44,
+      "eval_loss": 0.7829259634017944,
+      "eval_runtime": 139.6603,
+      "eval_samples_per_second": 4.697,
+      "eval_wer": 0.7227869546802203,
+      "step": 8800
+    },
+    {
+      "epoch": 45.45,
+      "learning_rate": 0.00025540540540540537,
+      "loss": 0.0802,
+      "step": 9000
+    },
+    {
+      "epoch": 45.45,
+      "eval_loss": 0.7056646347045898,
+      "eval_runtime": 135.8647,
+      "eval_samples_per_second": 4.828,
+      "eval_wer": 0.7100804743752647,
+      "step": 9000
+    },
+    {
+      "epoch": 46.46,
+      "learning_rate": 0.0002543918918918919,
+      "loss": 0.0794,
+      "step": 9200
+    },
+    {
+      "epoch": 46.46,
+      "eval_loss": 0.7538515329360962,
+      "eval_runtime": 140.8763,
+      "eval_samples_per_second": 4.657,
+      "eval_wer": 0.7098686997035154,
+      "step": 9200
+    },
+    {
+      "epoch": 47.47,
+      "learning_rate": 0.0002533783783783784,
+      "loss": 0.0827,
+      "step": 9400
+    },
+    {
+      "epoch": 47.47,
+      "eval_loss": 0.7439035773277283,
+      "eval_runtime": 143.0424,
+      "eval_samples_per_second": 4.586,
+      "eval_wer": 0.7151630664972469,
+      "step": 9400
+    },
+    {
+      "epoch": 48.48,
+      "learning_rate": 0.0002523648648648648,
+      "loss": 0.0803,
+      "step": 9600
+    },
+    {
+      "epoch": 48.48,
+      "eval_loss": 0.7053723335266113,
+      "eval_runtime": 143.445,
+      "eval_samples_per_second": 4.573,
+      "eval_wer": 0.7075391783142736,
+      "step": 9600
+    },
+    {
+      "epoch": 49.49,
+      "learning_rate": 0.0002513513513513513,
+      "loss": 0.0781,
+      "step": 9800
+    },
+    {
+      "epoch": 49.49,
+      "eval_loss": 0.8703842163085938,
+      "eval_runtime": 143.62,
+      "eval_samples_per_second": 4.568,
+      "eval_wer": 0.7630241423125794,
+      "step": 9800
+    },
+    {
+      "epoch": 50.5,
+      "learning_rate": 0.0002503378378378378,
+      "loss": 0.0766,
+      "step": 10000
+    },
+    {
+      "epoch": 50.5,
+      "eval_loss": 0.7902593612670898,
+      "eval_runtime": 139.0704,
+      "eval_samples_per_second": 4.717,
+      "eval_wer": 0.7130453197797544,
+      "step": 10000
+    },
+    {
+      "epoch": 51.51,
+      "learning_rate": 0.0002493243243243243,
+      "loss": 0.0771,
+      "step": 10200
+    },
+    {
+      "epoch": 51.51,
+      "eval_loss": 0.7181321978569031,
+      "eval_runtime": 138.4984,
+      "eval_samples_per_second": 4.737,
+      "eval_wer": 0.7149512918254977,
+      "step": 10200
+    },
+    {
+      "epoch": 52.52,
+      "learning_rate": 0.0002483108108108108,
+      "loss": 0.0713,
+      "step": 10400
+    },
+    {
+      "epoch": 52.52,
+      "eval_loss": 0.7941905856132507,
+      "eval_runtime": 137.9511,
+      "eval_samples_per_second": 4.755,
+      "eval_wer": 0.7164337145277425,
+      "step": 10400
+    },
+    {
+      "epoch": 53.53,
+      "learning_rate": 0.0002472972972972973,
+      "loss": 0.0761,
+      "step": 10600
+    },
+    {
+      "epoch": 53.53,
+      "eval_loss": 0.8347806334495544,
+      "eval_runtime": 137.6637,
+      "eval_samples_per_second": 4.765,
+      "eval_wer": 0.7100804743752647,
+      "step": 10600
+    },
+    {
+      "epoch": 54.54,
+      "learning_rate": 0.0002462837837837838,
+      "loss": 0.0721,
+      "step": 10800
+    },
+    {
+      "epoch": 54.54,
+      "eval_loss": 0.7271831035614014,
+      "eval_runtime": 137.7418,
+      "eval_samples_per_second": 4.763,
+      "eval_wer": 0.7024565861922915,
+      "step": 10800
+    },
+    {
+      "epoch": 55.55,
+      "learning_rate": 0.00024527027027027026,
+      "loss": 0.0684,
+      "step": 11000
+    },
+    {
+      "epoch": 55.55,
+      "eval_loss": 0.7921620011329651,
+      "eval_runtime": 137.9904,
+      "eval_samples_per_second": 4.754,
+      "eval_wer": 0.6977975434138077,
+      "step": 11000
+    },
+    {
+      "epoch": 56.56,
+      "learning_rate": 0.00024425675675675675,
+      "loss": 0.0733,
+      "step": 11200
+    },
+    {
+      "epoch": 56.56,
+      "eval_loss": 0.782407820224762,
+      "eval_runtime": 138.0874,
+      "eval_samples_per_second": 4.751,
+      "eval_wer": 0.7052096569250318,
+      "step": 11200
+    },
+    {
+      "epoch": 57.57,
+      "learning_rate": 0.00024324324324324323,
+      "loss": 0.0723,
+      "step": 11400
+    },
+    {
+      "epoch": 57.57,
+      "eval_loss": 0.7807161211967468,
+      "eval_runtime": 137.5671,
+      "eval_samples_per_second": 4.769,
+      "eval_wer": 0.6994917407878017,
+      "step": 11400
+    },
+    {
+      "epoch": 58.58,
+      "learning_rate": 0.00024222972972972971,
+      "loss": 0.0701,
+      "step": 11600
+    },
+    {
+      "epoch": 58.58,
+      "eval_loss": 0.7515387535095215,
+      "eval_runtime": 138.0585,
+      "eval_samples_per_second": 4.752,
+      "eval_wer": 0.7085980516730199,
+      "step": 11600
+    },
+    {
+      "epoch": 59.59,
+      "learning_rate": 0.0002412162162162162,
+      "loss": 0.0687,
+      "step": 11800
+    },
+    {
+      "epoch": 59.59,
+      "eval_loss": 0.7535402774810791,
+      "eval_runtime": 137.596,
+      "eval_samples_per_second": 4.768,
+      "eval_wer": 0.688267683185091,
+      "step": 11800
+    },
+    {
+      "epoch": 60.6,
+      "learning_rate": 0.00024020270270270268,
+      "loss": 0.0676,
+      "step": 12000
+    },
+    {
+      "epoch": 60.6,
+      "eval_loss": 0.7971649169921875,
+      "eval_runtime": 138.6186,
+      "eval_samples_per_second": 4.732,
+      "eval_wer": 0.7132570944515036,
+      "step": 12000
+    },
+    {
+      "epoch": 61.61,
+      "learning_rate": 0.00023918918918918917,
+      "loss": 0.0733,
+      "step": 12200
+    },
+    {
+      "epoch": 61.61,
+      "eval_loss": 0.7672501802444458,
+      "eval_runtime": 138.3057,
+      "eval_samples_per_second": 4.743,
+      "eval_wer": 0.711139347734011,
+      "step": 12200
+    },
+    {
+      "epoch": 62.62,
+      "learning_rate": 0.00023817567567567568,
+      "loss": 0.0661,
+      "step": 12400
+    },
+    {
+      "epoch": 62.62,
+      "eval_loss": 0.7474766373634338,
+      "eval_runtime": 138.3209,
+      "eval_samples_per_second": 4.743,
+      "eval_wer": 0.6975857687420585,
+      "step": 12400
+    },
+    {
+      "epoch": 63.63,
+      "learning_rate": 0.00023716216216216216,
+      "loss": 0.0666,
+      "step": 12600
+    },
+    {
+      "epoch": 63.63,
+      "eval_loss": 0.7444884181022644,
+      "eval_runtime": 137.4553,
+      "eval_samples_per_second": 4.772,
+      "eval_wer": 0.7083862770012707,
+      "step": 12600
+    },
+    {
+      "epoch": 64.64,
+      "learning_rate": 0.00023614864864864862,
+      "loss": 0.0712,
+      "step": 12800
+    },
+    {
+      "epoch": 64.64,
+      "eval_loss": 0.7816994190216064,
+      "eval_runtime": 138.1127,
+      "eval_samples_per_second": 4.75,
+      "eval_wer": 0.7210927573062261,
+      "step": 12800
+    },
+    {
+      "epoch": 65.65,
+      "learning_rate": 0.0002351351351351351,
+      "loss": 0.063,
+      "step": 13000
+    },
+    {
+      "epoch": 65.65,
+      "eval_loss": 0.8192810416221619,
+      "eval_runtime": 137.4083,
+      "eval_samples_per_second": 4.774,
+      "eval_wer": 0.7092333756882677,
+      "step": 13000
+    },
+    {
+      "epoch": 66.66,
+      "learning_rate": 0.00023412162162162159,
+      "loss": 0.0681,
+      "step": 13200
+    },
+    {
+      "epoch": 66.66,
+      "eval_loss": 0.7333322763442993,
+      "eval_runtime": 137.9838,
+      "eval_samples_per_second": 4.754,
+      "eval_wer": 0.698009318085557,
+      "step": 13200
+    },
+    {
+      "epoch": 67.68,
+      "learning_rate": 0.00023310810810810807,
+      "loss": 0.0642,
+      "step": 13400
+    },
+    {
+      "epoch": 67.68,
+      "eval_loss": 0.7417888045310974,
+      "eval_runtime": 137.6106,
+      "eval_samples_per_second": 4.767,
+      "eval_wer": 0.7083862770012707,
+      "step": 13400
+    },
+    {
+      "epoch": 68.69,
+      "learning_rate": 0.00023209459459459458,
+      "loss": 0.0622,
+      "step": 13600
+    },
+    {
+      "epoch": 68.69,
+      "eval_loss": 0.7969706654548645,
+      "eval_runtime": 137.6918,
+      "eval_samples_per_second": 4.764,
+      "eval_wer": 0.7329521389241846,
+      "step": 13600
+    },
+    {
+      "epoch": 69.7,
+      "learning_rate": 0.00023108108108108106,
+      "loss": 0.0639,
+      "step": 13800
+    },
+    {
+      "epoch": 69.7,
+      "eval_loss": 0.8013876080513,
+      "eval_runtime": 137.5846,
+      "eval_samples_per_second": 4.768,
+      "eval_wer": 0.6988564167725541,
+      "step": 13800
+    },
+    {
+      "epoch": 70.71,
+      "learning_rate": 0.00023006756756756755,
+      "loss": 0.065,
+      "step": 14000
+    },
+    {
+      "epoch": 70.71,
+      "eval_loss": 0.7792071104049683,
+      "eval_runtime": 137.6266,
+      "eval_samples_per_second": 4.767,
+      "eval_wer": 0.7043625582380347,
+      "step": 14000
+    },
+    {
+      "epoch": 71.72,
+      "learning_rate": 0.00022905405405405403,
+      "loss": 0.0608,
+      "step": 14200
+    },
+    {
+      "epoch": 71.72,
+      "eval_loss": 0.7951736450195312,
+      "eval_runtime": 138.4177,
+      "eval_samples_per_second": 4.739,
+      "eval_wer": 0.6944091486658196,
+      "step": 14200
+    },
+    {
+      "epoch": 72.73,
+      "learning_rate": 0.00022804054054054052,
+      "loss": 0.0557,
+      "step": 14400
+    },
+    {
+      "epoch": 72.73,
+      "eval_loss": 0.8266920447349548,
+      "eval_runtime": 138.5687,
+      "eval_samples_per_second": 4.734,
+      "eval_wer": 0.6977975434138077,
+      "step": 14400
+    },
+    {
+      "epoch": 73.74,
+      "learning_rate": 0.00022702702702702703,
+      "loss": 0.0592,
+      "step": 14600
+    },
+    {
+      "epoch": 73.74,
+      "eval_loss": 0.8056704998016357,
+      "eval_runtime": 137.1892,
+      "eval_samples_per_second": 4.782,
+      "eval_wer": 0.7075391783142736,
+      "step": 14600
+    },
+    {
+      "epoch": 74.75,
+      "learning_rate": 0.0002260135135135135,
+      "loss": 0.064,
+      "step": 14800
+    },
+    {
+      "epoch": 74.75,
+      "eval_loss": 0.815148115158081,
+      "eval_runtime": 137.9946,
+      "eval_samples_per_second": 4.754,
+      "eval_wer": 0.7009741634900466,
+      "step": 14800
+    },
+    {
+      "epoch": 75.76,
+      "learning_rate": 0.000225,
+      "loss": 0.0603,
+      "step": 15000
+    },
+    {
+      "epoch": 75.76,
+      "eval_loss": 0.7697699069976807,
+      "eval_runtime": 138.1754,
+      "eval_samples_per_second": 4.748,
+      "eval_wer": 0.7124099957645066,
+      "step": 15000
+    },
+    {
+      "epoch": 76.77,
+      "learning_rate": 0.00022398648648648645,
+      "loss": 0.0613,
+      "step": 15200
+    },
+    {
+      "epoch": 76.77,
+      "eval_loss": 0.7657320499420166,
+      "eval_runtime": 137.8551,
+      "eval_samples_per_second": 4.759,
+      "eval_wer": 0.7170690385429903,
+      "step": 15200
+    },
+    {
+      "epoch": 77.78,
+      "learning_rate": 0.00022297297297297293,
+      "loss": 0.0602,
+      "step": 15400
+    },
+    {
+      "epoch": 77.78,
+      "eval_loss": 0.7715324759483337,
+      "eval_runtime": 137.9821,
+      "eval_samples_per_second": 4.754,
+      "eval_wer": 0.716857263871241,
+      "step": 15400
+    },
+    {
+      "epoch": 78.79,
+      "learning_rate": 0.00022195945945945945,
+      "loss": 0.0597,
+      "step": 15600
+    },
+    {
+      "epoch": 78.79,
+      "eval_loss": 0.7833596467971802,
+      "eval_runtime": 137.7858,
+      "eval_samples_per_second": 4.761,
+      "eval_wer": 0.7132570944515036,
+      "step": 15600
+    },
+    {
+      "epoch": 79.8,
+      "learning_rate": 0.00022094594594594593,
+      "loss": 0.0585,
+      "step": 15800
+    },
+    {
+      "epoch": 79.8,
+      "eval_loss": 0.8398387432098389,
+      "eval_runtime": 137.7412,
+      "eval_samples_per_second": 4.763,
+      "eval_wer": 0.7088098263447692,
+      "step": 15800
+    },
+    {
+      "epoch": 80.81,
+      "learning_rate": 0.0002199324324324324,
+      "loss": 0.056,
+      "step": 16000
+    },
+    {
+      "epoch": 80.81,
+      "eval_loss": 0.8182487487792969,
+      "eval_runtime": 137.8628,
+      "eval_samples_per_second": 4.758,
+      "eval_wer": 0.7128335451080051,
+      "step": 16000
+    },
+    {
+      "epoch": 81.82,
+      "learning_rate": 0.0002189189189189189,
+      "loss": 0.06,
+      "step": 16200
+    },
+    {
+      "epoch": 81.82,
+      "eval_loss": 0.8023802638053894,
+      "eval_runtime": 137.792,
+      "eval_samples_per_second": 4.761,
+      "eval_wer": 0.6918678526048284,
+      "step": 16200
+    },
+    {
+      "epoch": 82.83,
+      "learning_rate": 0.00021790540540540538,
+      "loss": 0.0542,
+      "step": 16400
+    },
+    {
+      "epoch": 82.83,
+      "eval_loss": 0.7613797187805176,
+      "eval_runtime": 138.0605,
+      "eval_samples_per_second": 4.752,
+      "eval_wer": 0.6916560779330791,
+      "step": 16400
+    },
+    {
+      "epoch": 83.84,
+      "learning_rate": 0.0002168918918918919,
+      "loss": 0.0565,
+      "step": 16600
+    },
+    {
+      "epoch": 83.84,
+      "eval_loss": 0.7780935764312744,
+      "eval_runtime": 138.2761,
+      "eval_samples_per_second": 4.744,
+      "eval_wer": 0.7153748411689962,
+      "step": 16600
+    },
+    {
+      "epoch": 84.85,
+      "learning_rate": 0.00021587837837837838,
+      "loss": 0.0518,
+      "step": 16800
+    },
+    {
+      "epoch": 84.85,
+      "eval_loss": 0.8466140031814575,
+      "eval_runtime": 138.8619,
+      "eval_samples_per_second": 4.724,
+      "eval_wer": 0.7475645912748835,
+      "step": 16800
+    },
+    {
+      "epoch": 85.86,
+      "learning_rate": 0.00021486486486486486,
+      "loss": 0.0566,
+      "step": 17000
+    },
+    {
+      "epoch": 85.86,
+      "eval_loss": 0.8004465699195862,
+      "eval_runtime": 137.4262,
+      "eval_samples_per_second": 4.773,
+      "eval_wer": 0.7064803049555273,
+      "step": 17000
+    },
+    {
+      "epoch": 86.87,
+      "learning_rate": 0.00021385135135135134,
+      "loss": 0.0535,
+      "step": 17200
+    },
+    {
+      "epoch": 86.87,
+      "eval_loss": 0.8326082825660706,
+      "eval_runtime": 137.6615,
+      "eval_samples_per_second": 4.765,
+      "eval_wer": 0.7043625582380347,
+      "step": 17200
+    },
+    {
+      "epoch": 87.88,
+      "learning_rate": 0.0002128378378378378,
+      "loss": 0.0483,
+      "step": 17400
+    },
+    {
+      "epoch": 87.88,
+      "eval_loss": 0.7926554083824158,
+      "eval_runtime": 138.0063,
+      "eval_samples_per_second": 4.753,
+      "eval_wer": 0.7251164760694621,
+      "step": 17400
+    },
+    {
+      "epoch": 88.89,
+      "learning_rate": 0.00021182432432432428,
+      "loss": 0.0486,
+      "step": 17600
+    },
+    {
+      "epoch": 88.89,
+      "eval_loss": 0.7882806062698364,
+      "eval_runtime": 138.7006,
+      "eval_samples_per_second": 4.73,
+      "eval_wer": 0.6899618805590851,
+      "step": 17600
+    },
+    {
+      "epoch": 89.9,
+      "learning_rate": 0.0002108108108108108,
+      "loss": 0.0504,
+      "step": 17800
+    },
+    {
+      "epoch": 89.9,
+      "eval_loss": 0.7685484290122986,
+      "eval_runtime": 138.3804,
+      "eval_samples_per_second": 4.741,
+      "eval_wer": 0.6939855993223211,
+      "step": 17800
+    },
+    {
+      "epoch": 90.91,
+      "learning_rate": 0.00020979729729729728,
+      "loss": 0.056,
+      "step": 18000
+    },
+    {
+      "epoch": 90.91,
+      "eval_loss": 0.848064124584198,
+      "eval_runtime": 137.1191,
+      "eval_samples_per_second": 4.784,
+      "eval_wer": 0.7007623888182973,
+      "step": 18000
+    },
+    {
+      "epoch": 91.92,
+      "learning_rate": 0.00020878378378378376,
+      "loss": 0.049,
+      "step": 18200
+    },
+    {
+      "epoch": 91.92,
+      "eval_loss": 0.845516562461853,
+      "eval_runtime": 137.1172,
+      "eval_samples_per_second": 4.784,
+      "eval_wer": 0.7119864464210081,
+      "step": 18200
+    },
+    {
+      "epoch": 92.93,
+      "learning_rate": 0.00020777027027027025,
+      "loss": 0.0536,
+      "step": 18400
+    },
+    {
+      "epoch": 92.93,
+      "eval_loss": 0.7710561752319336,
+      "eval_runtime": 138.0433,
+      "eval_samples_per_second": 4.752,
+      "eval_wer": 0.6925031766200762,
+      "step": 18400
+    },
+    {
+      "epoch": 93.94,
+      "learning_rate": 0.00020675675675675673,
+      "loss": 0.0503,
+      "step": 18600
+    },
+    {
+      "epoch": 93.94,
+      "eval_loss": 0.8255069851875305,
+      "eval_runtime": 137.6117,
+      "eval_samples_per_second": 4.767,
+      "eval_wer": 0.7174925878864887,
+      "step": 18600
+    },
+    {
+      "epoch": 94.95,
+      "learning_rate": 0.00020574324324324324,
+      "loss": 0.0488,
+      "step": 18800
+    },
+    {
+      "epoch": 94.95,
+      "eval_loss": 0.8600437641143799,
+      "eval_runtime": 137.4326,
+      "eval_samples_per_second": 4.773,
+      "eval_wer": 0.7246929267259635,
+      "step": 18800
+    },
+    {
+      "epoch": 95.96,
+      "learning_rate": 0.00020472972972972972,
+      "loss": 0.0468,
+      "step": 19000
+    },
+    {
+      "epoch": 95.96,
+      "eval_loss": 0.7781614661216736,
+      "eval_runtime": 137.8454,
+      "eval_samples_per_second": 4.759,
+      "eval_wer": 0.7001270648030495,
+      "step": 19000
+    },
+    {
+      "epoch": 96.97,
+      "learning_rate": 0.0002037162162162162,
+      "loss": 0.0486,
+      "step": 19200
+    },
+    {
+      "epoch": 96.97,
+      "eval_loss": 0.7687584161758423,
+      "eval_runtime": 137.2673,
+      "eval_samples_per_second": 4.779,
+      "eval_wer": 0.7054214315967811,
+      "step": 19200
+    },
+    {
+      "epoch": 97.98,
+      "learning_rate": 0.0002027027027027027,
+      "loss": 0.0523,
+      "step": 19400
+    },
+    {
+      "epoch": 97.98,
+      "eval_loss": 0.8229833245277405,
+      "eval_runtime": 137.1013,
+      "eval_samples_per_second": 4.785,
+      "eval_wer": 0.7066920796272765,
+      "step": 19400
+    },
+    {
+      "epoch": 98.99,
+      "learning_rate": 0.00020168918918918915,
+      "loss": 0.0507,
+      "step": 19600
+    },
+    {
+      "epoch": 98.99,
+      "eval_loss": 0.761595606803894,
+      "eval_runtime": 137.3405,
+      "eval_samples_per_second": 4.776,
+      "eval_wer": 0.6910207539178315,
+      "step": 19600
+    },
+    {
+      "epoch": 100.0,
+      "learning_rate": 0.00020067567567567566,
+      "loss": 0.049,
+      "step": 19800
+    },
+    {
+      "epoch": 100.0,
+      "eval_loss": 0.8465907573699951,
+      "eval_runtime": 136.8552,
+      "eval_samples_per_second": 4.793,
+      "eval_wer": 0.704574332909784,
+      "step": 19800
+    },
+    {
+      "epoch": 101.01,
+      "learning_rate": 0.00019966216216216214,
+      "loss": 0.0502,
+      "step": 20000
+    },
+    {
+      "epoch": 101.01,
+      "eval_loss": 0.8005170226097107,
+      "eval_runtime": 137.3151,
+      "eval_samples_per_second": 4.777,
+      "eval_wer": 0.6925031766200762,
+      "step": 20000
+    },
+    {
+      "epoch": 102.02,
+      "learning_rate": 0.00019864864864864863,
+      "loss": 0.0443,
+      "step": 20200
+    },
+    {
+      "epoch": 102.02,
+      "eval_loss": 0.8749315142631531,
+      "eval_runtime": 137.9488,
+      "eval_samples_per_second": 4.755,
+      "eval_wer": 0.6927149512918255,
+      "step": 20200
+    },
+    {
+      "epoch": 103.03,
+      "learning_rate": 0.0001976351351351351,
+      "loss": 0.0486,
+      "step": 20400
+    },
+    {
+      "epoch": 103.03,
+      "eval_loss": 0.7846581339836121,
+      "eval_runtime": 136.7448,
+      "eval_samples_per_second": 4.797,
+      "eval_wer": 0.7124099957645066,
+      "step": 20400
+    },
+    {
+      "epoch": 104.04,
+      "learning_rate": 0.0001966216216216216,
+      "loss": 0.0455,
+      "step": 20600
+    },
+    {
+      "epoch": 104.04,
+      "eval_loss": 0.842466413974762,
+      "eval_runtime": 137.1975,
+      "eval_samples_per_second": 4.781,
+      "eval_wer": 0.7189750105887336,
+      "step": 20600
+    },
+    {
+      "epoch": 105.05,
+      "learning_rate": 0.00019560810810810808,
+      "loss": 0.0435,
+      "step": 20800
+    },
+    {
+      "epoch": 105.05,
+      "eval_loss": 0.8235080242156982,
+      "eval_runtime": 137.1509,
+      "eval_samples_per_second": 4.783,
+      "eval_wer": 0.6927149512918255,
+      "step": 20800
+    },
+    {
+      "epoch": 106.06,
+      "learning_rate": 0.0001945945945945946,
+      "loss": 0.0452,
+      "step": 21000
+    },
+    {
+      "epoch": 106.06,
+      "eval_loss": 0.7949621677398682,
+      "eval_runtime": 137.8819,
+      "eval_samples_per_second": 4.758,
+      "eval_wer": 0.6891147818720881,
+      "step": 21000
+    },
+    {
+      "epoch": 107.07,
+      "learning_rate": 0.00019358108108108107,
+      "loss": 0.0441,
+      "step": 21200
+    },
+    {
+      "epoch": 107.07,
+      "eval_loss": 0.8163775205612183,
+      "eval_runtime": 136.9828,
+      "eval_samples_per_second": 4.789,
+      "eval_wer": 0.6992799661160525,
+      "step": 21200
+    },
+    {
+      "epoch": 108.08,
+      "learning_rate": 0.00019256756756756756,
+      "loss": 0.0433,
+      "step": 21400
+    },
+    {
+      "epoch": 108.08,
+      "eval_loss": 0.9103622436523438,
+      "eval_runtime": 138.0294,
+      "eval_samples_per_second": 4.753,
+      "eval_wer": 0.7009741634900466,
+      "step": 21400
+    },
+    {
+      "epoch": 109.09,
+      "learning_rate": 0.00019155405405405404,
+      "loss": 0.0423,
+      "step": 21600
+    },
+    {
+      "epoch": 109.09,
+      "eval_loss": 0.8365850448608398,
+      "eval_runtime": 137.9595,
+      "eval_samples_per_second": 4.755,
+      "eval_wer": 0.6954680220245658,
+      "step": 21600
+    },
+    {
+      "epoch": 110.1,
+      "learning_rate": 0.0001905405405405405,
+      "loss": 0.0428,
+      "step": 21800
+    },
+    {
+      "epoch": 110.1,
+      "eval_loss": 0.9046308994293213,
+      "eval_runtime": 137.2986,
+      "eval_samples_per_second": 4.778,
+      "eval_wer": 0.6863617111393477,
+      "step": 21800
+    },
+    {
+      "epoch": 111.11,
+      "learning_rate": 0.00018952702702702704,
+      "loss": 0.0389,
+      "step": 22000
+    },
+    {
+      "epoch": 111.11,
+      "eval_loss": 0.8430789709091187,
+      "eval_runtime": 137.4909,
+      "eval_samples_per_second": 4.771,
+      "eval_wer": 0.6869970351545955,
+      "step": 22000
+    },
+    {
+      "epoch": 112.12,
+      "learning_rate": 0.0001885135135135135,
+      "loss": 0.0388,
+      "step": 22200
+    },
+    {
+      "epoch": 112.12,
+      "eval_loss": 0.8418474793434143,
+      "eval_runtime": 138.0347,
+      "eval_samples_per_second": 4.752,
+      "eval_wer": 0.6990681914443032,
+      "step": 22200
+    }
+  ],
+  "max_steps": 59400,
+  "num_train_epochs": 300,
+  "total_flos": 3.071129167748675e+19,
+  "trial_name": null,
+  "trial_params": null
+}

training_args.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:911e066f501a17bc00de61c981dcf019d6204340e764be0f0b60a7c80bf67155
+size 2287

vocab.json ADDED Viewed

	@@ -0,0 +1 @@

+ {"\u201e": 0, "\u10d7": 1, "\u10e7": 2, "\u10ed": 3, "\u10d5": 4, "\u10dd": 5, "\u10d9": 6, "\u10d1": 7, "\u10de": 8, "\u10e6": 9, "\u10e5": 10, "\u10d0": 11, "\u10e2": 12, "\u10d6": 13, "\u10ec": 14, "\u10e4": 15, "\u10e0": 16, "\u10da": 17, "\u10ef": 18, "\u10ea": 19, "\u10e1": 20, "\u10e3": 21, "\u10f0": 22, "\u10d2": 23, "\u10dc": 24, "\u10eb": 25, "\u10e9": 26, "\u2013": 27, "\u10ee": 28, "\u10d8": 29, "\u10db": 30, "\u10d3": 31, "\u10e8": 32, "\u10d4": 33, "\u10df": 34, "|": 35, "[UNK]": 36, "[PAD]": 37}