End of training

Browse files

Files changed (7) hide show

all_results.json +33 -17
config.json +12 -12
eval_results.json +28 -28
pytorch_model.bin +1 -1
train_results.json +5 -5
trainer_state.json +397 -385
training_args.bin +1 -1

all_results.json CHANGED Viewed

@@ -1,18 +1,34 @@
 {
     "epoch": 10.0,
-    "eval_PREDICATE_f1": 0.9727626459143969,
-    "eval_PREDICATE_number": 126,
-    "eval_PREDICATE_precision": 0.9541984732824428,
-    "eval_PREDICATE_recall": 0.9920634920634921,
-    "eval_loss": 0.20896820724010468,
-    "eval_overall_accuracy": 0.9609810479375697,
-    "eval_overall_f1": 0.8588469184890657,
-    "eval_overall_precision": 0.8404669260700389,
-    "eval_overall_recall": 0.8780487804878049,
-    "eval_runtime": 1.8982,
     "eval_samples": 99,
-    "eval_samples_per_second": 52.155,
-    "eval_steps_per_second": 6.849,
     "eval_\u0414\u0420\u0423\u0413\u041e\u0415_f1": 0.0,
     "eval_\u0414\u0420\u0423\u0413\u041e\u0415_number": 1,
     "eval_\u0414\u0420\u0423\u0413\u041e\u0415_precision": 0.0,
@@ -37,9 +53,9 @@
     "eval_\u044d\u043a\u0441\u043f\u0435\u0440\u0438\u0435\u043d\u0446\u0435\u0440_number": 3,
     "eval_\u044d\u043a\u0441\u043f\u0435\u0440\u0438\u0435\u043d\u0446\u0435\u0440_precision": 0.0,
     "eval_\u044d\u043a\u0441\u043f\u0435\u0440\u0438\u0435\u043d\u0446\u0435\u0440_recall": 0.0,
-    "train_loss": 0.11747416195326618,
-    "train_runtime": 191.5912,
-    "train_samples": 884,
-    "train_samples_per_second": 46.14,
-    "train_steps_per_second": 2.923
 }

 {
     "epoch": 10.0,
+    "eval_CAUSATOR_f1": 0.8,
+    "eval_CAUSATOR_number": 91,
+    "eval_CAUSATOR_precision": 0.7676767676767676,
+    "eval_CAUSATOR_recall": 0.8351648351648352,
+    "eval_EXPIRIENCER_f1": 0.9359605911330049,
+    "eval_EXPIRIENCER_number": 98,
+    "eval_EXPIRIENCER_precision": 0.9047619047619048,
+    "eval_EXPIRIENCER_recall": 0.9693877551020408,
+    "eval_INSTRUMENT_f1": 0.7499999999999999,
+    "eval_INSTRUMENT_number": 6,
+    "eval_INSTRUMENT_precision": 0.6,
+    "eval_INSTRUMENT_recall": 1.0,
+    "eval_OTHER_f1": 0.0,
+    "eval_OTHER_number": 1,
+    "eval_OTHER_precision": 0.0,
+    "eval_OTHER_recall": 0.0,
+    "eval_PREDICATE_f1": 0.9477611940298507,
+    "eval_PREDICATE_number": 129,
+    "eval_PREDICATE_precision": 0.9136690647482014,
+    "eval_PREDICATE_recall": 0.9844961240310077,
+    "eval_loss": 0.15370479226112366,
+    "eval_overall_accuracy": 0.9660852713178295,
+    "eval_overall_f1": 0.8967551622418879,
+    "eval_overall_precision": 0.8611898016997167,
+    "eval_overall_recall": 0.9353846153846154,
+    "eval_runtime": 1.9588,
     "eval_samples": 99,
+    "eval_samples_per_second": 50.54,
+    "eval_steps_per_second": 6.637,
     "eval_\u0414\u0420\u0423\u0413\u041e\u0415_f1": 0.0,
     "eval_\u0414\u0420\u0423\u0413\u041e\u0415_number": 1,
     "eval_\u0414\u0420\u0423\u0413\u041e\u0415_precision": 0.0,
     "eval_\u044d\u043a\u0441\u043f\u0435\u0440\u0438\u0435\u043d\u0446\u0435\u0440_number": 3,
     "eval_\u044d\u043a\u0441\u043f\u0435\u0440\u0438\u0435\u043d\u0446\u0435\u0440_precision": 0.0,
     "eval_\u044d\u043a\u0441\u043f\u0435\u0440\u0438\u0435\u043d\u0446\u0435\u0440_recall": 0.0,
+    "train_loss": 0.14471116384956986,
+    "train_runtime": 174.2063,
+    "train_samples": 886,
+    "train_samples_per_second": 50.859,
+    "train_steps_per_second": 3.215
 }

config.json CHANGED Viewed

@@ -11,23 +11,23 @@
   "hidden_dropout_prob": 0.1,
   "hidden_size": 768,
   "id2label": {
-    "0": "B-PREDICATE",
-    "1": "B-\u0414\u0420\u0423\u0413\u041e\u0415",
-    "2": "B-\u0418\u041d\u0421\u0422\u0420\u0423\u041c\u0415\u041d\u0422",
-    "3": "B-\u041a\u0410\u0423\u0417\u0410\u0422\u0418\u0412",
-    "4": "B-\u041a\u0410\u0423\u0417\u0410\u0422\u041e\u0420",
-    "5": "B-\u042d\u041a\u0421\u041f\u0415\u0420\u0418\u0415\u041d\u0426\u0415\u0420",
     "6": "O"
   },
   "initializer_range": 0.02,
   "intermediate_size": 3072,
   "label2id": {
-    "B-PREDICATE": 0,
-    "B-\u0414\u0420\u0423\u0413\u041e\u0415": 1,
-    "B-\u0418\u041d\u0421\u0422\u0420\u0423\u041c\u0415\u041d\u0422": 2,
-    "B-\u041a\u0410\u0423\u0417\u0410\u0422\u0418\u0412": 3,
-    "B-\u041a\u0410\u0423\u0417\u0410\u0422\u041e\u0420": 4,
-    "B-\u042d\u041a\u0421\u041f\u0415\u0420\u0418\u0415\u041d\u0426\u0415\u0420": 5,
     "O": 6
   },
   "layer_norm_eps": 1e-12,

   "hidden_dropout_prob": 0.1,
   "hidden_size": 768,
   "id2label": {
+    "0": "B-CAUSATOR",
+    "1": "B-EXPIRIENCER",
+    "2": "B-INSTRUMENT",
+    "3": "B-OTHER",
+    "4": "B-PREDICATE",
+    "5": "I-CAUSATOR",
     "6": "O"
   },
   "initializer_range": 0.02,
   "intermediate_size": 3072,
   "label2id": {
+    "B-CAUSATOR": 0,
+    "B-EXPIRIENCER": 1,
+    "B-INSTRUMENT": 2,
+    "B-OTHER": 3,
+    "B-PREDICATE": 4,
+    "I-CAUSATOR": 5,
     "O": 6
   },
   "layer_norm_eps": 1e-12,

eval_results.json CHANGED Viewed

@@ -1,32 +1,32 @@
 {
     "epoch": 10.0,
-    "eval_PREDICATE_f1": 0.9727626459143969,
-    "eval_PREDICATE_number": 126,
-    "eval_PREDICATE_precision": 0.9541984732824428,
-    "eval_PREDICATE_recall": 0.9920634920634921,
-    "eval_loss": 0.20896820724010468,
-    "eval_overall_accuracy": 0.9609810479375697,
-    "eval_overall_f1": 0.8588469184890657,
-    "eval_overall_precision": 0.8404669260700389,
-    "eval_overall_recall": 0.8780487804878049,
-    "eval_runtime": 1.8982,
     "eval_samples": 99,
-    "eval_samples_per_second": 52.155,
-    "eval_steps_per_second": 6.849,
-    "eval_\u0414\u0420\u0423\u0413\u041e\u0415_f1": 0.0,
-    "eval_\u0414\u0420\u0423\u0413\u041e\u0415_number": 1,
-    "eval_\u0414\u0420\u0423\u0413\u041e\u0415_precision": 0.0,
-    "eval_\u0414\u0420\u0423\u0413\u041e\u0415_recall": 0.0,
-    "eval_\u0418\u041d\u0421\u0422\u0420\u0423\u041c\u0415\u041d\u0422_f1": 0.0,
-    "eval_\u0418\u041d\u0421\u0422\u0420\u0423\u041c\u0415\u041d\u0422_number": 0,
-    "eval_\u0418\u041d\u0421\u0422\u0420\u0423\u041c\u0415\u041d\u0422_precision": 0.0,
-    "eval_\u0418\u041d\u0421\u0422\u0420\u0423\u041c\u0415\u041d\u0422_recall": 0.0,
-    "eval_\u041a\u0410\u0423\u0417\u0410\u0422\u041e\u0420_f1": 0.7142857142857144,
-    "eval_\u041a\u0410\u0423\u0417\u0410\u0422\u041e\u0420_number": 72,
-    "eval_\u041a\u0410\u0423\u0417\u0410\u0422\u041e\u0420_precision": 0.7352941176470589,
-    "eval_\u041a\u0410\u0423\u0417\u0410\u0422\u041e\u0420_recall": 0.6944444444444444,
-    "eval_\u042d\u041a\u0421\u041f\u0415\u0420\u0418\u0415\u041d\u0426\u0415\u0420_f1": 0.8200000000000001,
-    "eval_\u042d\u041a\u0421\u041f\u0415\u0420\u0418\u0415\u041d\u0426\u0415\u0420_number": 47,
-    "eval_\u042d\u041a\u0421\u041f\u0415\u0420\u0418\u0415\u041d\u0426\u0415\u0420_precision": 0.7735849056603774,
-    "eval_\u042d\u041a\u0421\u041f\u0415\u0420\u0418\u0415\u041d\u0426\u0415\u0420_recall": 0.8723404255319149
 }

 {
     "epoch": 10.0,
+    "eval_CAUSATOR_f1": 0.8,
+    "eval_CAUSATOR_number": 91,
+    "eval_CAUSATOR_precision": 0.7676767676767676,
+    "eval_CAUSATOR_recall": 0.8351648351648352,
+    "eval_EXPIRIENCER_f1": 0.9359605911330049,
+    "eval_EXPIRIENCER_number": 98,
+    "eval_EXPIRIENCER_precision": 0.9047619047619048,
+    "eval_EXPIRIENCER_recall": 0.9693877551020408,
+    "eval_INSTRUMENT_f1": 0.7499999999999999,
+    "eval_INSTRUMENT_number": 6,
+    "eval_INSTRUMENT_precision": 0.6,
+    "eval_INSTRUMENT_recall": 1.0,
+    "eval_OTHER_f1": 0.0,
+    "eval_OTHER_number": 1,
+    "eval_OTHER_precision": 0.0,
+    "eval_OTHER_recall": 0.0,
+    "eval_PREDICATE_f1": 0.9477611940298507,
+    "eval_PREDICATE_number": 129,
+    "eval_PREDICATE_precision": 0.9136690647482014,
+    "eval_PREDICATE_recall": 0.9844961240310077,
+    "eval_loss": 0.15370479226112366,
+    "eval_overall_accuracy": 0.9660852713178295,
+    "eval_overall_f1": 0.8967551622418879,
+    "eval_overall_precision": 0.8611898016997167,
+    "eval_overall_recall": 0.9353846153846154,
+    "eval_runtime": 1.9588,
     "eval_samples": 99,
+    "eval_samples_per_second": 50.54,
+    "eval_steps_per_second": 6.637
 }

pytorch_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:c9b1cd89ef795b2afec3e5af34d3494ffb554c05e4a7697e698196da63d1bde6
 size 710971889

 version https://git-lfs.github.com/spec/v1
+oid sha256:79281edcc0c9c393bbb9682545941dc09ff0978f2ed4385766707aff3105b4b1
 size 710971889

train_results.json CHANGED Viewed

@@ -1,8 +1,8 @@
 {
     "epoch": 10.0,
-    "train_loss": 0.11747416195326618,
-    "train_runtime": 191.5912,
-    "train_samples": 884,
-    "train_samples_per_second": 46.14,
-    "train_steps_per_second": 2.923
 }

 {
     "epoch": 10.0,
+    "train_loss": 0.14471116384956986,
+    "train_runtime": 174.2063,
+    "train_samples": 886,
+    "train_samples_per_second": 50.859,
+    "train_steps_per_second": 3.215
 }

trainer_state.json CHANGED Viewed

@@ -10,913 +10,925 @@
     {
       "epoch": 0.02,
       "learning_rate": 1.4705882352941177e-06,
-      "loss": 1.9437,
       "step": 1
     },
     {
       "epoch": 0.09,
       "learning_rate": 7.3529411764705884e-06,
-      "loss": 1.8725,
       "step": 5
     },
     {
       "epoch": 0.18,
       "learning_rate": 1.4705882352941177e-05,
-      "loss": 1.6377,
       "step": 10
     },
     {
       "epoch": 0.27,
       "learning_rate": 2.2058823529411766e-05,
-      "loss": 1.189,
       "step": 15
     },
     {
       "epoch": 0.36,
       "learning_rate": 2.9411764705882354e-05,
-      "loss": 0.6265,
       "step": 20
     },
     {
       "epoch": 0.45,
       "learning_rate": 3.6764705882352945e-05,
-      "loss": 0.8537,
       "step": 25
     },
     {
       "epoch": 0.54,
       "learning_rate": 4.411764705882353e-05,
-      "loss": 0.4837,
       "step": 30
     },
     {
       "epoch": 0.62,
       "learning_rate": 4.9999554100506465e-05,
-      "loss": 0.3967,
       "step": 35
     },
     {
       "epoch": 0.71,
       "learning_rate": 4.998394928831034e-05,
-      "loss": 0.3544,
       "step": 40
     },
     {
       "epoch": 0.8,
       "learning_rate": 4.9946065404995485e-05,
-      "loss": 0.2233,
       "step": 45
     },
     {
       "epoch": 0.89,
       "learning_rate": 4.988593623296038e-05,
-      "loss": 0.3092,
       "step": 50
     },
     {
       "epoch": 0.98,
       "learning_rate": 4.980361539151416e-05,
-      "loss": 0.2689,
       "step": 55
     },
     {
       "epoch": 1.0,
-      "eval_PREDICATE_f1": 0.9429657794676807,
-      "eval_PREDICATE_number": 126,
-      "eval_PREDICATE_precision": 0.9051094890510949,
-      "eval_PREDICATE_recall": 0.9841269841269841,
-      "eval_loss": 0.1595052033662796,
-      "eval_overall_accuracy": 0.9503901895206243,
-      "eval_overall_f1": 0.8093220338983051,
-      "eval_overall_precision": 0.8451327433628318,
-      "eval_overall_recall": 0.7764227642276422,
-      "eval_runtime": 0.523,
-      "eval_samples_per_second": 189.296,
-      "eval_steps_per_second": 24.857,
-      "eval_\u0414\u0420\u0423\u0413\u041e\u0415_f1": 0.0,
-      "eval_\u0414\u0420\u0423\u0413\u041e\u0415_number": 1,
-      "eval_\u0414\u0420\u0423\u0413\u041e\u0415_precision": 0.0,
-      "eval_\u0414\u0420\u0423\u0413\u041e\u0415_recall": 0.0,
-      "eval_\u041a\u0410\u0423\u0417\u0410\u0422\u041e\u0420_f1": 0.543859649122807,
-      "eval_\u041a\u0410\u0423\u0417\u0410\u0422\u041e\u0420_number": 72,
-      "eval_\u041a\u0410\u0423\u0417\u0410\u0422\u041e\u0420_precision": 0.7380952380952381,
-      "eval_\u041a\u0410\u0423\u0417\u0410\u0422\u041e\u0420_recall": 0.4305555555555556,
-      "eval_\u042d\u041a\u0421\u041f\u0415\u0420\u0418\u0415\u041d\u0426\u0415\u0420_f1": 0.7659574468085105,
-      "eval_\u042d\u041a\u0421\u041f\u0415\u0420\u0418\u0415\u041d\u0426\u0415\u0420_number": 47,
-      "eval_\u042d\u041a\u0421\u041f\u0415\u0420\u0418\u0415\u041d\u0426\u0415\u0420_precision": 0.7659574468085106,
-      "eval_\u042d\u041a\u0421\u041f\u0415\u0420\u0418\u0415\u041d\u0426\u0415\u0420_recall": 0.7659574468085106,
       "step": 56
     },
     {
       "epoch": 1.07,
       "learning_rate": 4.969917628906234e-05,
-      "loss": 0.1956,
       "step": 60
     },
     {
       "epoch": 1.16,
       "learning_rate": 4.9572712057646e-05,
-      "loss": 0.219,
       "step": 65
     },
     {
       "epoch": 1.25,
       "learning_rate": 4.9424335469892594e-05,
-      "loss": 0.1433,
       "step": 70
     },
     {
       "epoch": 1.34,
       "learning_rate": 4.925417883845266e-05,
-      "loss": 0.1429,
       "step": 75
     },
     {
       "epoch": 1.43,
       "learning_rate": 4.9062393898011904e-05,
-      "loss": 0.2062,
       "step": 80
     },
     {
       "epoch": 1.52,
       "learning_rate": 4.884915166998405e-05,
-      "loss": 0.1129,
       "step": 85
     },
     {
       "epoch": 1.61,
       "learning_rate": 4.8614642310004974e-05,
-      "loss": 0.1351,
       "step": 90
     },
     {
       "epoch": 1.7,
       "learning_rate": 4.835907493836421e-05,
-      "loss": 0.2069,
       "step": 95
     },
     {
       "epoch": 1.79,
       "learning_rate": 4.808267745352502e-05,
-      "loss": 0.1009,
       "step": 100
     },
     {
       "epoch": 1.88,
       "learning_rate": 4.778569632889919e-05,
-      "loss": 0.1587,
       "step": 105
     },
     {
       "epoch": 1.96,
       "learning_rate": 4.746839639305808e-05,
-      "loss": 0.1624,
       "step": 110
     },
     {
       "epoch": 2.0,
-      "eval_PREDICATE_f1": 0.9652509652509653,
-      "eval_PREDICATE_number": 126,
       "eval_PREDICATE_precision": 0.9398496240601504,
-      "eval_PREDICATE_recall": 0.9920634920634921,
-      "eval_loss": 0.12706787884235382,
-      "eval_overall_accuracy": 0.9604236343366778,
-      "eval_overall_f1": 0.8565737051792829,
-      "eval_overall_precision": 0.83984375,
-      "eval_overall_recall": 0.8739837398373984,
-      "eval_runtime": 0.5187,
-      "eval_samples_per_second": 190.846,
-      "eval_steps_per_second": 25.061,
-      "eval_\u0414\u0420\u0423\u0413\u041e\u0415_f1": 0.0,
-      "eval_\u0414\u0420\u0423\u0413\u041e\u0415_number": 1,
-      "eval_\u0414\u0420\u0423\u0413\u041e\u0415_precision": 0.0,
-      "eval_\u0414\u0420\u0423\u0413\u041e\u0415_recall": 0.0,
-      "eval_\u041a\u0410\u0423\u0417\u0410\u0422\u041e\u0420_f1": 0.7225806451612904,
-      "eval_\u041a\u0410\u0423\u0417\u0410\u0422\u041e\u0420_number": 72,
-      "eval_\u041a\u0410\u0423\u0417\u0410\u0422\u041e\u0420_precision": 0.6746987951807228,
-      "eval_\u041a\u0410\u0423\u0417\u0410\u0422\u041e\u0420_recall": 0.7777777777777778,
-      "eval_\u042d\u041a\u0421\u041f\u0415\u0420\u0418\u0415\u041d\u0426\u0415\u0420_f1": 0.7816091954022989,
-      "eval_\u042d\u041a\u0421\u041f\u0415\u0420\u0418\u0415\u041d\u0426\u0415\u0420_number": 47,
-      "eval_\u042d\u041a\u0421\u041f\u0415\u0420\u0418\u0415\u041d\u0426\u0415\u0420_precision": 0.85,
-      "eval_\u042d\u041a\u0421\u041f\u0415\u0420\u0418\u0415\u041d\u0426\u0415\u0420_recall": 0.723404255319149,
       "step": 112
     },
     {
       "epoch": 2.05,
       "learning_rate": 4.713106059357554e-05,
-      "loss": 0.0869,
       "step": 115
     },
     {
       "epoch": 2.14,
       "learning_rate": 4.6773989744713596e-05,
-      "loss": 0.1126,
       "step": 120
     },
     {
       "epoch": 2.23,
       "learning_rate": 4.639750225917573e-05,
-      "loss": 0.1287,
       "step": 125
     },
     {
       "epoch": 2.32,
       "learning_rate": 4.600193386416697e-05,
-      "loss": 0.1152,
       "step": 130
     },
     {
       "epoch": 2.41,
       "learning_rate": 4.558763730201413e-05,
-      "loss": 0.1302,
       "step": 135
     },
     {
       "epoch": 2.5,
       "learning_rate": 4.515498201561296e-05,
-      "loss": 0.083,
       "step": 140
     },
     {
       "epoch": 2.59,
       "learning_rate": 4.470435381898287e-05,
-      "loss": 0.0791,
       "step": 145
     },
     {
       "epoch": 2.68,
       "learning_rate": 4.423615455322293e-05,
-      "loss": 0.1257,
       "step": 150
     },
     {
       "epoch": 2.77,
       "learning_rate": 4.375080172817591e-05,
-      "loss": 0.0822,
       "step": 155
     },
     {
       "epoch": 2.86,
       "learning_rate": 4.324872815012005e-05,
-      "loss": 0.0852,
       "step": 160
     },
     {
       "epoch": 2.95,
       "learning_rate": 4.273038153582034e-05,
-      "loss": 0.1288,
       "step": 165
     },
     {
       "epoch": 3.0,
-      "eval_PREDICATE_f1": 0.9727626459143969,
-      "eval_PREDICATE_number": 126,
-      "eval_PREDICATE_precision": 0.9541984732824428,
-      "eval_PREDICATE_recall": 0.9920634920634921,
-      "eval_loss": 0.1378643959760666,
-      "eval_overall_accuracy": 0.9537346711259754,
-      "eval_overall_f1": 0.8415094339622642,
-      "eval_overall_precision": 0.7852112676056338,
-      "eval_overall_recall": 0.9065040650406504,
-      "eval_runtime": 1.8837,
-      "eval_samples_per_second": 52.556,
-      "eval_steps_per_second": 6.901,
-      "eval_\u0414\u0420\u0423\u0413\u041e\u0415_f1": 0.0,
-      "eval_\u0414\u0420\u0423\u0413\u041e\u0415_number": 1,
-      "eval_\u0414\u0420\u0423\u0413\u041e\u0415_precision": 0.0,
-      "eval_\u0414\u0420\u0423\u0413\u041e\u0415_recall": 0.0,
-      "eval_\u041a\u0410\u0423\u0417\u0410\u0422\u041e\u0420_f1": 0.6666666666666666,
-      "eval_\u041a\u0410\u0423\u0417\u0410\u0422\u041e\u0420_number": 72,
-      "eval_\u041a\u0410\u0423\u0417\u0410\u0422\u041e\u0420_precision": 0.5833333333333334,
-      "eval_\u041a\u0410\u0423\u0417\u0410\u0422\u041e\u0420_recall": 0.7777777777777778,
-      "eval_\u042d\u041a\u0421\u041f\u0415\u0420\u0418\u0415\u041d\u0426\u0415\u0420_f1": 0.8076923076923077,
-      "eval_\u042d\u041a\u0421\u041f\u0415\u0420\u0418\u0415\u041d\u0426\u0415\u0420_number": 47,
-      "eval_\u042d\u041a\u0421\u041f\u0415\u0420\u0418\u0415\u041d\u0426\u0415\u0420_precision": 0.7368421052631579,
-      "eval_\u042d\u041a\u0421\u041f\u0415\u0420\u0418\u0415\u041d\u0426\u0415\u0420_recall": 0.8936170212765957,
       "step": 168
     },
     {
       "epoch": 3.04,
       "learning_rate": 4.21962241132837e-05,
-      "loss": 0.0644,
       "step": 170
     },
     {
       "epoch": 3.12,
       "learning_rate": 4.164673220957387e-05,
-      "loss": 0.0634,
       "step": 175
     },
     {
       "epoch": 3.21,
       "learning_rate": 4.108239582605374e-05,
-      "loss": 0.0714,
       "step": 180
     },
     {
       "epoch": 3.3,
       "learning_rate": 4.050371820143384e-05,
-      "loss": 0.0538,
       "step": 185
     },
     {
       "epoch": 3.39,
       "learning_rate": 3.991121536301653e-05,
-      "loss": 0.0776,
       "step": 190
     },
     {
       "epoch": 3.48,
       "learning_rate": 3.9305415666536236e-05,
-      "loss": 0.0338,
       "step": 195
     },
     {
       "epoch": 3.57,
       "learning_rate": 3.868685932500595e-05,
-      "loss": 0.0795,
       "step": 200
     },
     {
       "epoch": 3.66,
       "learning_rate": 3.80560979269902e-05,
-      "loss": 0.083,
       "step": 205
     },
     {
       "epoch": 3.75,
       "learning_rate": 3.7413693944733995e-05,
-      "loss": 0.0322,
       "step": 210
     },
     {
       "epoch": 3.84,
       "learning_rate": 3.676022023258643e-05,
-      "loss": 0.081,
       "step": 215
     },
     {
       "epoch": 3.93,
       "learning_rate": 3.609625951616623e-05,
-      "loss": 0.0829,
       "step": 220
     },
     {
       "epoch": 4.0,
-      "eval_PREDICATE_f1": 0.9689922480620156,
-      "eval_PREDICATE_number": 126,
-      "eval_PREDICATE_precision": 0.946969696969697,
-      "eval_PREDICATE_recall": 0.9920634920634921,
-      "eval_loss": 0.14865602552890778,
-      "eval_overall_accuracy": 0.959866220735786,
-      "eval_overall_f1": 0.8554455445544554,
-      "eval_overall_precision": 0.833976833976834,
-      "eval_overall_recall": 0.8780487804878049,
-      "eval_runtime": 0.5199,
-      "eval_samples_per_second": 190.431,
-      "eval_steps_per_second": 25.006,
-      "eval_\u0414\u0420\u0423\u0413\u041e\u0415_f1": 0.0,
-      "eval_\u0414\u0420\u0423\u0413\u041e\u0415_number": 1,
-      "eval_\u0414\u0420\u0423\u0413\u041e\u0415_precision": 0.0,
-      "eval_\u0414\u0420\u0423\u0413\u041e\u0415_recall": 0.0,
-      "eval_\u0418\u041d\u0421\u0422\u0420\u0423\u041c\u0415\u041d\u0422_f1": 0.0,
-      "eval_\u0418\u041d\u0421\u0422\u0420\u0423\u041c\u0415\u041d\u0422_number": 0,
-      "eval_\u0418\u041d\u0421\u0422\u0420\u0423\u041c\u0415\u041d\u0422_precision": 0.0,
-      "eval_\u0418\u041d\u0421\u0422\u0420\u0423\u041c\u0415\u041d\u0422_recall": 0.0,
-      "eval_\u041a\u0410\u0423\u0417\u0410\u0422\u041e\u0420_f1": 0.6938775510204083,
-      "eval_\u041a\u0410\u0423\u0417\u0410\u0422\u041e\u0420_number": 72,
-      "eval_\u041a\u0410\u0423\u0417\u0410\u0422\u041e\u0420_precision": 0.68,
-      "eval_\u041a\u0410\u0423\u0417\u0410\u0422\u041e\u0420_recall": 0.7083333333333334,
-      "eval_\u042d\u041a\u0421\u041f\u0415\u0420\u0418\u0415\u041d\u0426\u0415\u0420_f1": 0.8163265306122448,
-      "eval_\u042d\u041a\u0421\u041f\u0415\u0420\u0418\u0415\u041d\u0426\u0415\u0420_number": 47,
-      "eval_\u042d\u041a\u0421\u041f\u0415\u0420\u0418\u0415\u041d\u0426\u0415\u0420_precision": 0.7843137254901961,
-      "eval_\u042d\u041a\u0421\u041f\u0415\u0420\u0418\u0415\u041d\u0426\u0415\u0420_recall": 0.851063829787234,
       "step": 224
     },
     {
       "epoch": 4.02,
       "learning_rate": 3.5422403872724686e-05,
-      "loss": 0.0289,
       "step": 225
     },
     {
       "epoch": 4.11,
       "learning_rate": 3.473925420316946e-05,
-      "loss": 0.0402,
       "step": 230
     },
     {
       "epoch": 4.2,
       "learning_rate": 3.404741969621996e-05,
-      "loss": 0.0258,
       "step": 235
     },
     {
       "epoch": 4.29,
       "learning_rate": 3.334751728517223e-05,
-      "loss": 0.0196,
       "step": 240
     },
     {
       "epoch": 4.38,
       "learning_rate": 3.264017109775771e-05,
-      "loss": 0.0444,
       "step": 245
     },
     {
       "epoch": 4.46,
       "learning_rate": 3.1926011899586485e-05,
-      "loss": 0.0362,
       "step": 250
     },
     {
       "epoch": 4.55,
       "learning_rate": 3.120567653167127e-05,
-      "loss": 0.0429,
       "step": 255
     },
     {
       "epoch": 4.64,
       "learning_rate": 3.0479807342533722e-05,
-      "loss": 0.0534,
       "step": 260
     },
     {
       "epoch": 4.73,
       "learning_rate": 2.9749051615399637e-05,
-      "loss": 0.0249,
       "step": 265
     },
     {
       "epoch": 4.82,
       "learning_rate": 2.9014060990993496e-05,
-      "loss": 0.0339,
       "step": 270
     },
     {
       "epoch": 4.91,
       "learning_rate": 2.827549088644748e-05,
-      "loss": 0.0484,
       "step": 275
     },
     {
       "epoch": 5.0,
       "learning_rate": 2.7533999910842766e-05,
-      "loss": 0.0324,
       "step": 280
     },
     {
       "epoch": 5.0,
-      "eval_PREDICATE_f1": 0.96875,
-      "eval_PREDICATE_number": 126,
-      "eval_PREDICATE_precision": 0.9538461538461539,
-      "eval_PREDICATE_recall": 0.9841269841269841,
-      "eval_loss": 0.15630854666233063,
-      "eval_overall_accuracy": 0.9643255295429208,
-      "eval_overall_f1": 0.8702594810379242,
-      "eval_overall_precision": 0.8549019607843137,
-      "eval_overall_recall": 0.8861788617886179,
-      "eval_runtime": 0.5225,
-      "eval_samples_per_second": 189.481,
-      "eval_steps_per_second": 24.881,
-      "eval_\u0414\u0420\u0423\u0413\u041e\u0415_f1": 0.0,
-      "eval_\u0414\u0420\u0423\u0413\u041e\u0415_number": 1,
-      "eval_\u0414\u0420\u0423\u0413\u041e\u0415_precision": 0.0,
-      "eval_\u0414\u0420\u0423\u0413\u041e\u0415_recall": 0.0,
-      "eval_\u0418\u041d\u0421\u0422\u0420\u0423\u041c\u0415\u041d\u0422_f1": 0.0,
-      "eval_\u0418\u041d\u0421\u0422\u0420\u0423\u041c\u0415\u041d\u0422_number": 0,
-      "eval_\u0418\u041d\u0421\u0422\u0420\u0423\u041c\u0415\u041d\u0422_precision": 0.0,
-      "eval_\u0418\u041d\u0421\u0422\u0420\u0423\u041c\u0415\u041d\u0422_recall": 0.0,
-      "eval_\u041a\u0410\u0423\u0417\u0410\u0422\u041e\u0420_f1": 0.7571428571428572,
-      "eval_\u041a\u0410\u0423\u0417\u0410\u0422\u041e\u0420_number": 72,
-      "eval_\u041a\u0410\u0423\u0417\u0410\u0422\u041e\u0420_precision": 0.7794117647058824,
-      "eval_\u041a\u0410\u0423\u0417\u0410\u0422\u041e\u0420_recall": 0.7361111111111112,
-      "eval_\u042d\u041a\u0421\u041f\u0415\u0420\u0418\u0415\u041d\u0426\u0415\u0420_f1": 0.7961165048543688,
-      "eval_\u042d\u041a\u0421\u041f\u0415\u0420\u0418\u0415\u041d\u0426\u0415\u0420_number": 47,
-      "eval_\u042d\u041a\u0421\u041f\u0415\u0420\u0418\u0415\u041d\u0426\u0415\u0420_precision": 0.7321428571428571,
-      "eval_\u042d\u041a\u0421\u041f\u0415\u0420\u0418\u0415\u041d\u0426\u0415\u0420_recall": 0.8723404255319149,
       "step": 280
     },
     {
       "epoch": 5.09,
       "learning_rate": 2.6790249277904582e-05,
-      "loss": 0.0201,
       "step": 285
     },
     {
       "epoch": 5.18,
       "learning_rate": 2.6044902216374496e-05,
-      "loss": 0.0211,
       "step": 290
     },
     {
       "epoch": 5.27,
       "learning_rate": 2.5298623378585884e-05,
-      "loss": 0.0145,
       "step": 295
     },
     {
       "epoch": 5.36,
       "learning_rate": 2.4552078247770007e-05,
-      "loss": 0.0353,
       "step": 300
     },
     {
       "epoch": 5.45,
       "learning_rate": 2.3805932544621002e-05,
-      "loss": 0.0428,
       "step": 305
     },
     {
       "epoch": 5.54,
       "learning_rate": 2.3060851633649245e-05,
-      "loss": 0.0153,
       "step": 310
     },
     {
       "epoch": 5.62,
       "learning_rate": 2.2317499929852273e-05,
-      "loss": 0.0276,
       "step": 315
     },
     {
       "epoch": 5.71,
       "learning_rate": 2.1576540306232418e-05,
-      "loss": 0.02,
       "step": 320
     },
     {
       "epoch": 5.8,
       "learning_rate": 2.0838633502689545e-05,
-      "loss": 0.0382,
       "step": 325
     },
     {
       "epoch": 5.89,
       "learning_rate": 2.0104437536815883e-05,
-      "loss": 0.0295,
       "step": 330
     },
     {
       "epoch": 5.98,
       "learning_rate": 1.9374607117118485e-05,
-      "loss": 0.0361,
       "step": 335
     },
     {
       "epoch": 6.0,
-      "eval_PREDICATE_f1": 0.9727626459143969,
-      "eval_PREDICATE_number": 126,
-      "eval_PREDICATE_precision": 0.9541984732824428,
-      "eval_PREDICATE_recall": 0.9920634920634921,
-      "eval_loss": 0.17225639522075653,
-      "eval_overall_accuracy": 0.9620958751393534,
-      "eval_overall_f1": 0.8617234468937877,
-      "eval_overall_precision": 0.849802371541502,
-      "eval_overall_recall": 0.8739837398373984,
-      "eval_runtime": 0.518,
-      "eval_samples_per_second": 191.119,
-      "eval_steps_per_second": 25.096,
-      "eval_\u0414\u0420\u0423\u0413\u041e\u0415_f1": 0.0,
-      "eval_\u0414\u0420\u0423\u0413\u041e\u0415_number": 1,
-      "eval_\u0414\u0420\u0423\u0413\u041e\u0415_precision": 0.0,
-      "eval_\u0414\u0420\u0423\u0413\u041e\u0415_recall": 0.0,
-      "eval_\u0418\u041d\u0421\u0422\u0420\u0423\u041c\u0415\u041d\u0422_f1": 0.0,
-      "eval_\u0418\u041d\u0421\u0422\u0420\u0423\u041c\u0415\u041d\u0422_number": 0,
-      "eval_\u0418\u041d\u0421\u0422\u0420\u0423\u041c\u0415\u041d\u0422_precision": 0.0,
-      "eval_\u0418\u041d\u0421\u0422\u0420\u0423\u041c\u0415\u041d\u0422_recall": 0.0,
-      "eval_\u041a\u0410\u0423\u0417\u0410\u0422\u041e\u0420_f1": 0.7101449275362319,
-      "eval_\u041a\u0410\u0423\u0417\u0410\u0422\u041e\u0420_number": 72,
-      "eval_\u041a\u0410\u0423\u0417\u0410\u0422\u041e\u0420_precision": 0.7424242424242424,
-      "eval_\u041a\u0410\u0423\u0417\u0410\u0422\u041e\u0420_recall": 0.6805555555555556,
-      "eval_\u042d\u041a\u0421\u041f\u0415\u0420\u0418\u0415\u041d\u0426\u0415\u0420_f1": 0.8367346938775511,
-      "eval_\u042d\u041a\u0421\u041f\u0415\u0420\u0418\u0415\u041d\u0426\u0415\u0420_number": 47,
-      "eval_\u042d\u041a\u0421\u041f\u0415\u0420\u0418\u0415\u041d\u0426\u0415\u0420_precision": 0.803921568627451,
-      "eval_\u042d\u041a\u0421\u041f\u0415\u0420\u0418\u0415\u041d\u0426\u0415\u0420_recall": 0.8723404255319149,
       "step": 336
     },
     {
       "epoch": 6.07,
       "learning_rate": 1.864979305919248e-05,
-      "loss": 0.0098,
       "step": 340
     },
     {
       "epoch": 6.16,
       "learning_rate": 1.7930641705365836e-05,
-      "loss": 0.0277,
       "step": 345
     },
     {
       "epoch": 6.25,
       "learning_rate": 1.721779434833299e-05,
-      "loss": 0.0118,
       "step": 350
     },
     {
       "epoch": 6.34,
       "learning_rate": 1.651188665929151e-05,
-      "loss": 0.0223,
       "step": 355
     },
     {
       "epoch": 6.43,
       "learning_rate": 1.5813548121091622e-05,
-      "loss": 0.0128,
       "step": 360
     },
     {
       "epoch": 6.52,
       "learning_rate": 1.512340146690402e-05,
-      "loss": 0.0121,
       "step": 365
     },
     {
       "epoch": 6.61,
       "learning_rate": 1.4442062124906763e-05,
-      "loss": 0.0243,
       "step": 370
     },
     {
       "epoch": 6.7,
       "learning_rate": 1.3770137669486171e-05,
-      "loss": 0.0216,
       "step": 375
     },
     {
       "epoch": 6.79,
       "learning_rate": 1.3108227279441243e-05,
-      "loss": 0.0093,
       "step": 380
     },
     {
       "epoch": 6.88,
       "learning_rate": 1.2456921203674715e-05,
-      "loss": 0.0208,
       "step": 385
     },
     {
       "epoch": 6.96,
       "learning_rate": 1.1816800234847303e-05,
-      "loss": 0.0074,
       "step": 390
     },
     {
       "epoch": 7.0,
-      "eval_PREDICATE_f1": 0.9727626459143969,
-      "eval_PREDICATE_number": 126,
-      "eval_PREDICATE_precision": 0.9541984732824428,
-      "eval_PREDICATE_recall": 0.9920634920634921,
-      "eval_loss": 0.19959960877895355,
-      "eval_overall_accuracy": 0.959866220735786,
-      "eval_overall_f1": 0.8560157790927021,
-      "eval_overall_precision": 0.8314176245210728,
-      "eval_overall_recall": 0.8821138211382114,
-      "eval_runtime": 0.5027,
-      "eval_samples_per_second": 196.942,
-      "eval_steps_per_second": 25.861,
-      "eval_\u0414\u0420\u0423\u0413\u041e\u0415_f1": 0.0,
-      "eval_\u0414\u0420\u0423\u0413\u041e\u0415_number": 1,
-      "eval_\u0414\u0420\u0423\u0413\u041e\u0415_precision": 0.0,
-      "eval_\u0414\u0420\u0423\u0413\u041e\u0415_recall": 0.0,
-      "eval_\u0418\u041d\u0421\u0422\u0420\u0423\u041c\u0415\u041d\u0422_f1": 0.0,
-      "eval_\u0418\u041d\u0421\u0422\u0420\u0423\u041c\u0415\u041d\u0422_number": 0,
-      "eval_\u0418\u041d\u0421\u0422\u0420\u0423\u041c\u0415\u041d\u0422_precision": 0.0,
-      "eval_\u0418\u041d\u0421\u0422\u0420\u0423\u041c\u0415\u041d\u0422_recall": 0.0,
-      "eval_\u041a\u0410\u0423\u0417\u0410\u0422\u041e\u0420_f1": 0.723404255319149,
-      "eval_\u041a\u0410\u0423\u0417\u0410\u0422\u041e\u0420_number": 72,
-      "eval_\u041a\u0410\u0423\u0417\u0410\u0422\u041e\u0420_precision": 0.7391304347826086,
-      "eval_\u041a\u0410\u0423\u0417\u0410\u0422\u041e\u0420_recall": 0.7083333333333334,
-      "eval_\u042d\u041a\u0421\u041f\u0415\u0420\u0418\u0415\u041d\u0426\u0415\u0420_f1": 0.7884615384615385,
-      "eval_\u042d\u041a\u0421\u041f\u0415\u0420\u0418\u0415\u041d\u0426\u0415\u0420_number": 47,
-      "eval_\u042d\u041a\u0421\u041f\u0415\u0420\u0418\u0415\u041d\u0426\u0415\u0420_precision": 0.7192982456140351,
-      "eval_\u042d\u041a\u0421\u041f\u0415\u0420\u0418\u0415\u041d\u0426\u0415\u0420_recall": 0.8723404255319149,
       "step": 392
     },
     {
       "epoch": 7.05,
       "learning_rate": 1.1188435191464303e-05,
-      "loss": 0.0102,
       "step": 395
     },
     {
       "epoch": 7.14,
       "learning_rate": 1.0572386408856552e-05,
-      "loss": 0.0193,
       "step": 400
     },
     {
       "epoch": 7.23,
       "learning_rate": 9.969203239509592e-06,
-      "loss": 0.0082,
       "step": 405
     },
     {
       "epoch": 7.32,
       "learning_rate": 9.379423563186652e-06,
-      "loss": 0.0076,
       "step": 410
     },
     {
       "epoch": 7.41,
       "learning_rate": 8.803573307282209e-06,
-      "loss": 0.0192,
       "step": 415
     },
     {
       "epoch": 7.5,
       "learning_rate": 8.242165977833974e-06,
-      "loss": 0.0064,
       "step": 420
     },
     {
       "epoch": 7.59,
       "learning_rate": 7.695702201611338e-06,
-      "loss": 0.0206,
       "step": 425
     },
     {
       "epoch": 7.68,
       "learning_rate": 7.1646692796888456e-06,
-      "loss": 0.0041,
       "step": 430
     },
     {
       "epoch": 7.77,
       "learning_rate": 6.649540752902544e-06,
-      "loss": 0.0039,
       "step": 435
     },
     {
       "epoch": 7.86,
       "learning_rate": 6.150775979576906e-06,
-      "loss": 0.0236,
       "step": 440
     },
     {
       "epoch": 7.95,
       "learning_rate": 5.668819725898747e-06,
-      "loss": 0.0073,
       "step": 445
     },
     {
       "epoch": 8.0,
-      "eval_PREDICATE_f1": 0.9727626459143969,
-      "eval_PREDICATE_number": 126,
-      "eval_PREDICATE_precision": 0.9541984732824428,
-      "eval_PREDICATE_recall": 0.9920634920634921,
-      "eval_loss": 0.21042802929878235,
-      "eval_overall_accuracy": 0.9609810479375697,
-      "eval_overall_f1": 0.8599605522682447,
-      "eval_overall_precision": 0.8352490421455939,
-      "eval_overall_recall": 0.8861788617886179,
-      "eval_runtime": 0.5148,
-      "eval_samples_per_second": 192.299,
-      "eval_steps_per_second": 25.251,
-      "eval_\u0414\u0420\u0423\u0413\u041e\u0415_f1": 0.0,
-      "eval_\u0414\u0420\u0423\u0413\u041e\u0415_number": 1,
-      "eval_\u0414\u0420\u0423\u0413\u041e\u0415_precision": 0.0,
-      "eval_\u0414\u0420\u0423\u0413\u041e\u0415_recall": 0.0,
-      "eval_\u0418\u041d\u0421\u0422\u0420\u0423\u041c\u0415\u041d\u0422_f1": 0.0,
-      "eval_\u0418\u041d\u0421\u0422\u0420\u0423\u041c\u0415\u041d\u0422_number": 0,
-      "eval_\u0418\u041d\u0421\u0422\u0420\u0423\u041c\u0415\u041d\u0422_precision": 0.0,
-      "eval_\u0418\u041d\u0421\u0422\u0420\u0423\u041c\u0415\u041d\u0422_recall": 0.0,
-      "eval_\u041a\u0410\u0423\u0417\u0410\u0422\u041e\u0420_f1": 0.7272727272727272,
-      "eval_\u041a\u0410\u0423\u0417\u0410\u0422\u041e\u0420_number": 72,
-      "eval_\u041a\u0410\u0423\u0417\u0410\u0422\u041e\u0420_precision": 0.7323943661971831,
-      "eval_\u041a\u0410\u0423\u0417\u0410\u0422\u041e\u0420_recall": 0.7222222222222222,
-      "eval_\u042d\u041a\u0421\u041f\u0415\u0420\u0418\u0415\u041d\u0426\u0415\u0420_f1": 0.8118811881188118,
-      "eval_\u042d\u041a\u0421\u041f\u0415\u0420\u0418\u0415\u041d\u0426\u0415\u0420_number": 47,
-      "eval_\u042d\u041a\u0421\u041f\u0415\u0420\u0418\u0415\u041d\u0426\u0415\u0420_precision": 0.7592592592592593,
-      "eval_\u042d\u041a\u0421\u041f\u0415\u0420\u0418\u0415\u041d\u0426\u0415\u0420_recall": 0.8723404255319149,
       "step": 448
     },
     {
       "epoch": 8.04,
       "learning_rate": 5.204101769303474e-06,
-      "loss": 0.014,
       "step": 450
     },
     {
       "epoch": 8.12,
       "learning_rate": 4.757036515227381e-06,
-      "loss": 0.0087,
       "step": 455
     },
     {
       "epoch": 8.21,
       "learning_rate": 4.328022627567657e-06,
-      "loss": 0.0103,
       "step": 460
     },
     {
       "epoch": 8.3,
       "learning_rate": 3.91744267317968e-06,
-      "loss": 0.0068,
       "step": 465
     },
     {
       "epoch": 8.39,
       "learning_rate": 3.5256627807286085e-06,
-      "loss": 0.0155,
       "step": 470
     },
     {
       "epoch": 8.48,
       "learning_rate": 3.1530323141995553e-06,
-      "loss": 0.0046,
       "step": 475
     },
     {
       "epoch": 8.57,
       "learning_rate": 2.7998835613573137e-06,
-      "loss": 0.0171,
       "step": 480
     },
     {
       "epoch": 8.66,
       "learning_rate": 2.4665314374336335e-06,
-      "loss": 0.0091,
       "step": 485
     },
     {
       "epoch": 8.75,
       "learning_rate": 2.153273204306153e-06,
-      "loss": 0.0032,
       "step": 490
     },
     {
       "epoch": 8.84,
       "learning_rate": 1.8603882054194915e-06,
-      "loss": 0.0146,
       "step": 495
     },
     {
       "epoch": 8.93,
       "learning_rate": 1.5881376166848149e-06,
-      "loss": 0.0081,
       "step": 500
     },
     {
       "epoch": 9.0,
-      "eval_PREDICATE_f1": 0.9727626459143969,
-      "eval_PREDICATE_number": 126,
-      "eval_PREDICATE_precision": 0.9541984732824428,
-      "eval_PREDICATE_recall": 0.9920634920634921,
-      "eval_loss": 0.20735101401805878,
-      "eval_overall_accuracy": 0.9620958751393534,
-      "eval_overall_f1": 0.8622754491017964,
-      "eval_overall_precision": 0.8470588235294118,
-      "eval_overall_recall": 0.8780487804878049,
-      "eval_runtime": 0.5139,
-      "eval_samples_per_second": 192.63,
-      "eval_steps_per_second": 25.295,
-      "eval_\u0414\u0420\u0423\u0413\u041e\u0415_f1": 0.0,
-      "eval_\u0414\u0420\u0423\u0413\u041e\u0415_number": 1,
-      "eval_\u0414\u0420\u0423\u0413\u041e\u0415_precision": 0.0,
-      "eval_\u0414\u0420\u0423\u0413\u041e\u0415_recall": 0.0,
-      "eval_\u0418\u041d\u0421\u0422\u0420\u0423\u041c\u0415\u041d\u0422_f1": 0.0,
-      "eval_\u0418\u041d\u0421\u0422\u0420\u0423\u041c\u0415\u041d\u0422_number": 0,
-      "eval_\u0418\u041d\u0421\u0422\u0420\u0423\u041c\u0415\u041d\u0422_precision": 0.0,
-      "eval_\u0418\u041d\u0421\u0422\u0420\u0423\u041c\u0415\u041d\u0422_recall": 0.0,
-      "eval_\u041a\u0410\u0423\u0417\u0410\u0422\u041e\u0420_f1": 0.7194244604316546,
-      "eval_\u041a\u0410\u0423\u0417\u0410\u0422\u041e\u0420_number": 72,
-      "eval_\u041a\u0410\u0423\u0417\u0410\u0422\u041e\u0420_precision": 0.746268656716418,
-      "eval_\u041a\u0410\u0423\u0417\u0410\u0422\u041e\u0420_recall": 0.6944444444444444,
-      "eval_\u042d\u041a\u0421\u041f\u0415\u0420\u0418\u0415\u041d\u0426\u0415\u0420_f1": 0.8200000000000001,
-      "eval_\u042d\u041a\u0421\u041f\u0415\u0420\u0418\u0415\u041d\u0426\u0415\u0420_number": 47,
-      "eval_\u042d\u041a\u0421\u041f\u0415\u0420\u0418\u0415\u041d\u0426\u0415\u0420_precision": 0.7735849056603774,
-      "eval_\u042d\u041a\u0421\u041f\u0415\u0420\u0418\u0415\u041d\u0426\u0415\u0420_recall": 0.8723404255319149,
       "step": 504
     },
     {
       "epoch": 9.02,
       "learning_rate": 1.3367642135800329e-06,
-      "loss": 0.0039,
       "step": 505
     },
     {
       "epoch": 9.11,
       "learning_rate": 1.106492154658323e-06,
-      "loss": 0.0094,
       "step": 510
     },
     {
       "epoch": 9.2,
       "learning_rate": 8.975267816580201e-07,
-      "loss": 0.007,
       "step": 515
     },
     {
       "epoch": 9.29,
       "learning_rate": 7.100544363921324e-07,
-      "loss": 0.0045,
       "step": 520
     },
     {
       "epoch": 9.38,
       "learning_rate": 5.442422945807462e-07,
-      "loss": 0.0275,
       "step": 525
     },
     {
@@ -928,84 +940,84 @@
     {
       "epoch": 9.55,
       "learning_rate": 2.781706165022879e-07,
-      "loss": 0.008,
       "step": 535
     },
     {
       "epoch": 9.64,
       "learning_rate": 1.7814834575997363e-07,
-      "loss": 0.0151,
       "step": 540
     },
     {
       "epoch": 9.73,
       "learning_rate": 1.0026059794363551e-07,
-      "loss": 0.0048,
       "step": 545
     },
     {
       "epoch": 9.82,
       "learning_rate": 4.457682831244259e-08,
-      "loss": 0.0038,
       "step": 550
     },
     {
       "epoch": 9.91,
       "learning_rate": 1.114669205298513e-08,
-      "loss": 0.0072,
       "step": 555
     },
     {
       "epoch": 10.0,
       "learning_rate": 0.0,
-      "loss": 0.0126,
       "step": 560
     },
     {
       "epoch": 10.0,
-      "eval_PREDICATE_f1": 0.9727626459143969,
-      "eval_PREDICATE_number": 126,
-      "eval_PREDICATE_precision": 0.9541984732824428,
-      "eval_PREDICATE_recall": 0.9920634920634921,
-      "eval_loss": 0.20896820724010468,
-      "eval_overall_accuracy": 0.9609810479375697,
-      "eval_overall_f1": 0.8588469184890657,
-      "eval_overall_precision": 0.8404669260700389,
-      "eval_overall_recall": 0.8780487804878049,
-      "eval_runtime": 0.4971,
-      "eval_samples_per_second": 199.154,
-      "eval_steps_per_second": 26.152,
-      "eval_\u0414\u0420\u0423\u0413\u041e\u0415_f1": 0.0,
-      "eval_\u0414\u0420\u0423\u0413\u041e\u0415_number": 1,
-      "eval_\u0414\u0420\u0423\u0413\u041e\u0415_precision": 0.0,
-      "eval_\u0414\u0420\u0423\u0413\u041e\u0415_recall": 0.0,
-      "eval_\u0418\u041d\u0421\u0422\u0420\u0423\u041c\u0415\u041d\u0422_f1": 0.0,
-      "eval_\u0418\u041d\u0421\u0422\u0420\u0423\u041c\u0415\u041d\u0422_number": 0,
-      "eval_\u0418\u041d\u0421\u0422\u0420\u0423\u041c\u0415\u041d\u0422_precision": 0.0,
-      "eval_\u0418\u041d\u0421\u0422\u0420\u0423\u041c\u0415\u041d\u0422_recall": 0.0,
-      "eval_\u041a\u0410\u0423\u0417\u0410\u0422\u041e\u0420_f1": 0.7142857142857144,
-      "eval_\u041a\u0410\u0423\u0417\u0410\u0422\u041e\u0420_number": 72,
-      "eval_\u041a\u0410\u0423\u0417\u0410\u0422\u041e\u0420_precision": 0.7352941176470589,
-      "eval_\u041a\u0410\u0423\u0417\u0410\u0422\u041e\u0420_recall": 0.6944444444444444,
-      "eval_\u042d\u041a\u0421\u041f\u0415\u0420\u0418\u0415\u041d\u0426\u0415\u0420_f1": 0.8200000000000001,
-      "eval_\u042d\u041a\u0421\u041f\u0415\u0420\u0418\u0415\u041d\u0426\u0415\u0420_number": 47,
-      "eval_\u042d\u041a\u0421\u041f\u0415\u0420\u0418\u0415\u041d\u0426\u0415\u0420_precision": 0.7735849056603774,
-      "eval_\u042d\u041a\u0421\u041f\u0415\u0420\u0418\u0415\u041d\u0426\u0415\u0420_recall": 0.8723404255319149,
       "step": 560
     },
     {
       "epoch": 10.0,
       "step": 560,
-      "total_flos": 132575310561672.0,
-      "train_loss": 0.11747416195326618,
-      "train_runtime": 191.5912,
-      "train_samples_per_second": 46.14,
-      "train_steps_per_second": 2.923
     }
   ],
   "max_steps": 560,
   "num_train_epochs": 10,
-  "total_flos": 132575310561672.0,
   "trial_name": null,
   "trial_params": null
 }

     {
       "epoch": 0.02,
       "learning_rate": 1.4705882352941177e-06,
+      "loss": 1.9403,
       "step": 1
     },
     {
       "epoch": 0.09,
       "learning_rate": 7.3529411764705884e-06,
+      "loss": 1.8862,
       "step": 5
     },
     {
       "epoch": 0.18,
       "learning_rate": 1.4705882352941177e-05,
+      "loss": 1.7434,
       "step": 10
     },
     {
       "epoch": 0.27,
       "learning_rate": 2.2058823529411766e-05,
+      "loss": 1.3329,
       "step": 15
     },
     {
       "epoch": 0.36,
       "learning_rate": 2.9411764705882354e-05,
+      "loss": 0.9204,
       "step": 20
     },
     {
       "epoch": 0.45,
       "learning_rate": 3.6764705882352945e-05,
+      "loss": 1.1761,
       "step": 25
     },
     {
       "epoch": 0.54,
       "learning_rate": 4.411764705882353e-05,
+      "loss": 0.6574,
       "step": 30
     },
     {
       "epoch": 0.62,
       "learning_rate": 4.9999554100506465e-05,
+      "loss": 0.8733,
       "step": 35
     },
     {
       "epoch": 0.71,
       "learning_rate": 4.998394928831034e-05,
+      "loss": 0.5708,
       "step": 40
     },
     {
       "epoch": 0.8,
       "learning_rate": 4.9946065404995485e-05,
+      "loss": 0.4218,
       "step": 45
     },
     {
       "epoch": 0.89,
       "learning_rate": 4.988593623296038e-05,
+      "loss": 0.4296,
       "step": 50
     },
     {
       "epoch": 0.98,
       "learning_rate": 4.980361539151416e-05,
+      "loss": 0.3043,
       "step": 55
     },
     {
       "epoch": 1.0,
+      "eval_CAUSATOR_f1": 0.6826347305389222,
+      "eval_CAUSATOR_number": 91,
+      "eval_CAUSATOR_precision": 0.75,
+      "eval_CAUSATOR_recall": 0.6263736263736264,
+      "eval_EXPIRIENCER_f1": 0.821782178217822,
+      "eval_EXPIRIENCER_number": 98,
+      "eval_EXPIRIENCER_precision": 0.7980769230769231,
+      "eval_EXPIRIENCER_recall": 0.8469387755102041,
+      "eval_INSTRUMENT_f1": 0.0,
+      "eval_INSTRUMENT_number": 6,
+      "eval_INSTRUMENT_precision": 0.0,
+      "eval_INSTRUMENT_recall": 0.0,
+      "eval_OTHER_f1": 0.0,
+      "eval_OTHER_number": 1,
+      "eval_OTHER_precision": 0.0,
+      "eval_OTHER_recall": 0.0,
+      "eval_PREDICATE_f1": 0.9191176470588236,
+      "eval_PREDICATE_number": 129,
+      "eval_PREDICATE_precision": 0.8741258741258742,
+      "eval_PREDICATE_recall": 0.9689922480620154,
+      "eval_loss": 0.35376405715942383,
+      "eval_overall_accuracy": 0.9142441860465116,
+      "eval_overall_f1": 0.8179012345679012,
+      "eval_overall_precision": 0.8204334365325078,
+      "eval_overall_recall": 0.8153846153846154,
+      "eval_runtime": 0.5833,
+      "eval_samples_per_second": 169.727,
+      "eval_steps_per_second": 22.287,
       "step": 56
     },
     {
       "epoch": 1.07,
       "learning_rate": 4.969917628906234e-05,
+      "loss": 0.2351,
       "step": 60
     },
     {
       "epoch": 1.16,
       "learning_rate": 4.9572712057646e-05,
+      "loss": 0.2885,
       "step": 65
     },
     {
       "epoch": 1.25,
       "learning_rate": 4.9424335469892594e-05,
+      "loss": 0.2677,
       "step": 70
     },
     {
       "epoch": 1.34,
       "learning_rate": 4.925417883845266e-05,
+      "loss": 0.3071,
       "step": 75
     },
     {
       "epoch": 1.43,
       "learning_rate": 4.9062393898011904e-05,
+      "loss": 0.2608,
       "step": 80
     },
     {
       "epoch": 1.52,
       "learning_rate": 4.884915166998405e-05,
+      "loss": 0.2315,
       "step": 85
     },
     {
       "epoch": 1.61,
       "learning_rate": 4.8614642310004974e-05,
+      "loss": 0.2369,
       "step": 90
     },
     {
       "epoch": 1.7,
       "learning_rate": 4.835907493836421e-05,
+      "loss": 0.1395,
       "step": 95
     },
     {
       "epoch": 1.79,
       "learning_rate": 4.808267745352502e-05,
+      "loss": 0.2028,
       "step": 100
     },
     {
       "epoch": 1.88,
       "learning_rate": 4.778569632889919e-05,
+      "loss": 0.2415,
       "step": 105
     },
     {
       "epoch": 1.96,
       "learning_rate": 4.746839639305808e-05,
+      "loss": 0.2664,
       "step": 110
     },
     {
       "epoch": 2.0,
+      "eval_CAUSATOR_f1": 0.787878787878788,
+      "eval_CAUSATOR_number": 91,
+      "eval_CAUSATOR_precision": 0.8783783783783784,
+      "eval_CAUSATOR_recall": 0.7142857142857143,
+      "eval_EXPIRIENCER_f1": 0.9128205128205128,
+      "eval_EXPIRIENCER_number": 98,
+      "eval_EXPIRIENCER_precision": 0.9175257731958762,
+      "eval_EXPIRIENCER_recall": 0.9081632653061225,
+      "eval_INSTRUMENT_f1": 0.7499999999999999,
+      "eval_INSTRUMENT_number": 6,
+      "eval_INSTRUMENT_precision": 0.6,
+      "eval_INSTRUMENT_recall": 1.0,
+      "eval_OTHER_f1": 0.0,
+      "eval_OTHER_number": 1,
+      "eval_OTHER_precision": 0.0,
+      "eval_OTHER_recall": 0.0,
+      "eval_PREDICATE_f1": 0.9541984732824427,
+      "eval_PREDICATE_number": 129,
       "eval_PREDICATE_precision": 0.9398496240601504,
+      "eval_PREDICATE_recall": 0.9689922480620154,
+      "eval_loss": 0.19607584178447723,
+      "eval_overall_accuracy": 0.939922480620155,
+      "eval_overall_f1": 0.8920187793427231,
+      "eval_overall_precision": 0.9076433121019108,
+      "eval_overall_recall": 0.8769230769230769,
+      "eval_runtime": 0.5651,
+      "eval_samples_per_second": 175.19,
+      "eval_steps_per_second": 23.005,
       "step": 112
     },
     {
       "epoch": 2.05,
       "learning_rate": 4.713106059357554e-05,
+      "loss": 0.1366,
       "step": 115
     },
     {
       "epoch": 2.14,
       "learning_rate": 4.6773989744713596e-05,
+      "loss": 0.1735,
       "step": 120
     },
     {
       "epoch": 2.23,
       "learning_rate": 4.639750225917573e-05,
+      "loss": 0.0874,
       "step": 125
     },
     {
       "epoch": 2.32,
       "learning_rate": 4.600193386416697e-05,
+      "loss": 0.114,
       "step": 130
     },
     {
       "epoch": 2.41,
       "learning_rate": 4.558763730201413e-05,
+      "loss": 0.1326,
       "step": 135
     },
     {
       "epoch": 2.5,
       "learning_rate": 4.515498201561296e-05,
+      "loss": 0.1554,
       "step": 140
     },
     {
       "epoch": 2.59,
       "learning_rate": 4.470435381898287e-05,
+      "loss": 0.1238,
       "step": 145
     },
     {
       "epoch": 2.68,
       "learning_rate": 4.423615455322293e-05,
+      "loss": 0.0882,
       "step": 150
     },
     {
       "epoch": 2.77,
       "learning_rate": 4.375080172817591e-05,
+      "loss": 0.0908,
       "step": 155
     },
     {
       "epoch": 2.86,
       "learning_rate": 4.324872815012005e-05,
+      "loss": 0.1086,
       "step": 160
     },
     {
       "epoch": 2.95,
       "learning_rate": 4.273038153582034e-05,
+      "loss": 0.0373,
       "step": 165
     },
     {
       "epoch": 3.0,
+      "eval_CAUSATOR_f1": 0.8409090909090909,
+      "eval_CAUSATOR_number": 91,
+      "eval_CAUSATOR_precision": 0.8705882352941177,
+      "eval_CAUSATOR_recall": 0.8131868131868132,
+      "eval_EXPIRIENCER_f1": 0.9452736318407962,
+      "eval_EXPIRIENCER_number": 98,
+      "eval_EXPIRIENCER_precision": 0.9223300970873787,
+      "eval_EXPIRIENCER_recall": 0.9693877551020408,
+      "eval_INSTRUMENT_f1": 0.7142857142857143,
+      "eval_INSTRUMENT_number": 6,
+      "eval_INSTRUMENT_precision": 0.625,
+      "eval_INSTRUMENT_recall": 0.8333333333333334,
+      "eval_OTHER_f1": 0.0,
+      "eval_OTHER_number": 1,
+      "eval_OTHER_precision": 0.0,
+      "eval_OTHER_recall": 0.0,
+      "eval_PREDICATE_f1": 0.9584905660377359,
+      "eval_PREDICATE_number": 129,
+      "eval_PREDICATE_precision": 0.9338235294117647,
+      "eval_PREDICATE_recall": 0.9844961240310077,
+      "eval_loss": 0.12746019661426544,
+      "eval_overall_accuracy": 0.9641472868217055,
+      "eval_overall_f1": 0.9162861491628614,
+      "eval_overall_precision": 0.9066265060240963,
+      "eval_overall_recall": 0.9261538461538461,
+      "eval_runtime": 1.9297,
+      "eval_samples_per_second": 51.302,
+      "eval_steps_per_second": 6.737,
       "step": 168
     },
     {
       "epoch": 3.04,
       "learning_rate": 4.21962241132837e-05,
+      "loss": 0.0976,
       "step": 170
     },
     {
       "epoch": 3.12,
       "learning_rate": 4.164673220957387e-05,
+      "loss": 0.0896,
       "step": 175
     },
     {
       "epoch": 3.21,
       "learning_rate": 4.108239582605374e-05,
+      "loss": 0.0494,
       "step": 180
     },
     {
       "epoch": 3.3,
       "learning_rate": 4.050371820143384e-05,
+      "loss": 0.0447,
       "step": 185
     },
     {
       "epoch": 3.39,
       "learning_rate": 3.991121536301653e-05,
+      "loss": 0.0834,
       "step": 190
     },
     {
       "epoch": 3.48,
       "learning_rate": 3.9305415666536236e-05,
+      "loss": 0.0545,
       "step": 195
     },
     {
       "epoch": 3.57,
       "learning_rate": 3.868685932500595e-05,
+      "loss": 0.0579,
       "step": 200
     },
     {
       "epoch": 3.66,
       "learning_rate": 3.80560979269902e-05,
+      "loss": 0.0586,
       "step": 205
     },
     {
       "epoch": 3.75,
       "learning_rate": 3.7413693944733995e-05,
+      "loss": 0.0674,
       "step": 210
     },
     {
       "epoch": 3.84,
       "learning_rate": 3.676022023258643e-05,
+      "loss": 0.0553,
       "step": 215
     },
     {
       "epoch": 3.93,
       "learning_rate": 3.609625951616623e-05,
+      "loss": 0.0496,
       "step": 220
     },
     {
       "epoch": 4.0,
+      "eval_CAUSATOR_f1": 0.8172043010752689,
+      "eval_CAUSATOR_number": 91,
+      "eval_CAUSATOR_precision": 0.8,
+      "eval_CAUSATOR_recall": 0.8351648351648352,
+      "eval_EXPIRIENCER_f1": 0.9458128078817734,
+      "eval_EXPIRIENCER_number": 98,
+      "eval_EXPIRIENCER_precision": 0.9142857142857143,
+      "eval_EXPIRIENCER_recall": 0.9795918367346939,
+      "eval_INSTRUMENT_f1": 0.8,
+      "eval_INSTRUMENT_number": 6,
+      "eval_INSTRUMENT_precision": 0.6666666666666666,
+      "eval_INSTRUMENT_recall": 1.0,
+      "eval_OTHER_f1": 0.0,
+      "eval_OTHER_number": 1,
+      "eval_OTHER_precision": 0.0,
+      "eval_OTHER_recall": 0.0,
+      "eval_PREDICATE_f1": 0.9548872180451128,
+      "eval_PREDICATE_number": 129,
+      "eval_PREDICATE_precision": 0.927007299270073,
+      "eval_PREDICATE_recall": 0.9844961240310077,
+      "eval_loss": 0.16831780970096588,
+      "eval_overall_accuracy": 0.9607558139534884,
+      "eval_overall_f1": 0.9090909090909091,
+      "eval_overall_precision": 0.8815028901734104,
+      "eval_overall_recall": 0.9384615384615385,
+      "eval_runtime": 0.569,
+      "eval_samples_per_second": 173.979,
+      "eval_steps_per_second": 22.846,
       "step": 224
     },
     {
       "epoch": 4.02,
       "learning_rate": 3.5422403872724686e-05,
+      "loss": 0.0687,
       "step": 225
     },
     {
       "epoch": 4.11,
       "learning_rate": 3.473925420316946e-05,
+      "loss": 0.0588,
       "step": 230
     },
     {
       "epoch": 4.2,
       "learning_rate": 3.404741969621996e-05,
+      "loss": 0.02,
       "step": 235
     },
     {
       "epoch": 4.29,
       "learning_rate": 3.334751728517223e-05,
+      "loss": 0.0176,
       "step": 240
     },
     {
       "epoch": 4.38,
       "learning_rate": 3.264017109775771e-05,
+      "loss": 0.0414,
       "step": 245
     },
     {
       "epoch": 4.46,
       "learning_rate": 3.1926011899586485e-05,
+      "loss": 0.0142,
       "step": 250
     },
     {
       "epoch": 4.55,
       "learning_rate": 3.120567653167127e-05,
+      "loss": 0.0386,
       "step": 255
     },
     {
       "epoch": 4.64,
       "learning_rate": 3.0479807342533722e-05,
+      "loss": 0.0294,
       "step": 260
     },
     {
       "epoch": 4.73,
       "learning_rate": 2.9749051615399637e-05,
+      "loss": 0.0415,
       "step": 265
     },
     {
       "epoch": 4.82,
       "learning_rate": 2.9014060990993496e-05,
+      "loss": 0.0446,
       "step": 270
     },
     {
       "epoch": 4.91,
       "learning_rate": 2.827549088644748e-05,
+      "loss": 0.0396,
       "step": 275
     },
     {
       "epoch": 5.0,
       "learning_rate": 2.7533999910842766e-05,
+      "loss": 0.0529,
       "step": 280
     },
     {
       "epoch": 5.0,
+      "eval_CAUSATOR_f1": 0.8128342245989305,
+      "eval_CAUSATOR_number": 91,
+      "eval_CAUSATOR_precision": 0.7916666666666666,
+      "eval_CAUSATOR_recall": 0.8351648351648352,
+      "eval_EXPIRIENCER_f1": 0.9468599033816426,
+      "eval_EXPIRIENCER_number": 98,
+      "eval_EXPIRIENCER_precision": 0.8990825688073395,
+      "eval_EXPIRIENCER_recall": 1.0,
+      "eval_INSTRUMENT_f1": 0.7499999999999999,
+      "eval_INSTRUMENT_number": 6,
+      "eval_INSTRUMENT_precision": 0.6,
+      "eval_INSTRUMENT_recall": 1.0,
+      "eval_OTHER_f1": 0.0,
+      "eval_OTHER_number": 1,
+      "eval_OTHER_precision": 0.0,
+      "eval_OTHER_recall": 0.0,
+      "eval_PREDICATE_f1": 0.9513108614232209,
+      "eval_PREDICATE_number": 129,
+      "eval_PREDICATE_precision": 0.9202898550724637,
+      "eval_PREDICATE_recall": 0.9844961240310077,
+      "eval_loss": 0.15264536440372467,
+      "eval_overall_accuracy": 0.9626937984496124,
+      "eval_overall_f1": 0.9056047197640117,
+      "eval_overall_precision": 0.8696883852691218,
+      "eval_overall_recall": 0.9446153846153846,
+      "eval_runtime": 0.5502,
+      "eval_samples_per_second": 179.946,
+      "eval_steps_per_second": 23.629,
       "step": 280
     },
     {
       "epoch": 5.09,
       "learning_rate": 2.6790249277904582e-05,
+      "loss": 0.0221,
       "step": 285
     },
     {
       "epoch": 5.18,
       "learning_rate": 2.6044902216374496e-05,
+      "loss": 0.0136,
       "step": 290
     },
     {
       "epoch": 5.27,
       "learning_rate": 2.5298623378585884e-05,
+      "loss": 0.0125,
       "step": 295
     },
     {
       "epoch": 5.36,
       "learning_rate": 2.4552078247770007e-05,
+      "loss": 0.0184,
       "step": 300
     },
     {
       "epoch": 5.45,
       "learning_rate": 2.3805932544621002e-05,
+      "loss": 0.0111,
       "step": 305
     },
     {
       "epoch": 5.54,
       "learning_rate": 2.3060851633649245e-05,
+      "loss": 0.0317,
       "step": 310
     },
     {
       "epoch": 5.62,
       "learning_rate": 2.2317499929852273e-05,
+      "loss": 0.0472,
       "step": 315
     },
     {
       "epoch": 5.71,
       "learning_rate": 2.1576540306232418e-05,
+      "loss": 0.0183,
       "step": 320
     },
     {
       "epoch": 5.8,
       "learning_rate": 2.0838633502689545e-05,
+      "loss": 0.0412,
       "step": 325
     },
     {
       "epoch": 5.89,
       "learning_rate": 2.0104437536815883e-05,
+      "loss": 0.0283,
       "step": 330
     },
     {
       "epoch": 5.98,
       "learning_rate": 1.9374607117118485e-05,
+      "loss": 0.0419,
       "step": 335
     },
     {
       "epoch": 6.0,
+      "eval_CAUSATOR_f1": 0.8042328042328042,
+      "eval_CAUSATOR_number": 91,
+      "eval_CAUSATOR_precision": 0.7755102040816326,
+      "eval_CAUSATOR_recall": 0.8351648351648352,
+      "eval_EXPIRIENCER_f1": 0.9313725490196079,
+      "eval_EXPIRIENCER_number": 98,
+      "eval_EXPIRIENCER_precision": 0.8962264150943396,
+      "eval_EXPIRIENCER_recall": 0.9693877551020408,
+      "eval_INSTRUMENT_f1": 0.7499999999999999,
+      "eval_INSTRUMENT_number": 6,
+      "eval_INSTRUMENT_precision": 0.6,
+      "eval_INSTRUMENT_recall": 1.0,
+      "eval_OTHER_f1": 0.0,
+      "eval_OTHER_number": 1,
+      "eval_OTHER_precision": 0.0,
+      "eval_OTHER_recall": 0.0,
+      "eval_PREDICATE_f1": 0.9513108614232209,
+      "eval_PREDICATE_number": 129,
+      "eval_PREDICATE_precision": 0.9202898550724637,
+      "eval_PREDICATE_recall": 0.9844961240310077,
+      "eval_loss": 0.14020289480686188,
+      "eval_overall_accuracy": 0.9651162790697675,
+      "eval_overall_f1": 0.8980797636632201,
+      "eval_overall_precision": 0.8636363636363636,
+      "eval_overall_recall": 0.9353846153846154,
+      "eval_runtime": 0.5662,
+      "eval_samples_per_second": 174.839,
+      "eval_steps_per_second": 22.959,
       "step": 336
     },
     {
       "epoch": 6.07,
       "learning_rate": 1.864979305919248e-05,
+      "loss": 0.0176,
       "step": 340
     },
     {
       "epoch": 6.16,
       "learning_rate": 1.7930641705365836e-05,
+      "loss": 0.0194,
       "step": 345
     },
     {
       "epoch": 6.25,
       "learning_rate": 1.721779434833299e-05,
+      "loss": 0.0112,
       "step": 350
     },
     {
       "epoch": 6.34,
       "learning_rate": 1.651188665929151e-05,
+      "loss": 0.017,
       "step": 355
     },
     {
       "epoch": 6.43,
       "learning_rate": 1.5813548121091622e-05,
+      "loss": 0.015,
       "step": 360
     },
     {
       "epoch": 6.52,
       "learning_rate": 1.512340146690402e-05,
+      "loss": 0.0132,
       "step": 365
     },
     {
       "epoch": 6.61,
       "learning_rate": 1.4442062124906763e-05,
+      "loss": 0.0211,
       "step": 370
     },
     {
       "epoch": 6.7,
       "learning_rate": 1.3770137669486171e-05,
+      "loss": 0.007,
       "step": 375
     },
     {
       "epoch": 6.79,
       "learning_rate": 1.3108227279441243e-05,
+      "loss": 0.0163,
       "step": 380
     },
     {
       "epoch": 6.88,
       "learning_rate": 1.2456921203674715e-05,
+      "loss": 0.0308,
       "step": 385
     },
     {
       "epoch": 6.96,
       "learning_rate": 1.1816800234847303e-05,
+      "loss": 0.0156,
       "step": 390
     },
     {
       "epoch": 7.0,
+      "eval_CAUSATOR_f1": 0.8279569892473119,
+      "eval_CAUSATOR_number": 91,
+      "eval_CAUSATOR_precision": 0.8105263157894737,
+      "eval_CAUSATOR_recall": 0.8461538461538461,
+      "eval_EXPIRIENCER_f1": 0.9359605911330049,
+      "eval_EXPIRIENCER_number": 98,
+      "eval_EXPIRIENCER_precision": 0.9047619047619048,
+      "eval_EXPIRIENCER_recall": 0.9693877551020408,
+      "eval_INSTRUMENT_f1": 0.7499999999999999,
+      "eval_INSTRUMENT_number": 6,
+      "eval_INSTRUMENT_precision": 0.6,
+      "eval_INSTRUMENT_recall": 1.0,
+      "eval_OTHER_f1": 0.0,
+      "eval_OTHER_number": 1,
+      "eval_OTHER_precision": 0.0,
+      "eval_OTHER_recall": 0.0,
+      "eval_PREDICATE_f1": 0.9477611940298507,
+      "eval_PREDICATE_number": 129,
+      "eval_PREDICATE_precision": 0.9136690647482014,
+      "eval_PREDICATE_recall": 0.9844961240310077,
+      "eval_loss": 0.14980360865592957,
+      "eval_overall_accuracy": 0.9660852713178295,
+      "eval_overall_f1": 0.9050445103857566,
+      "eval_overall_precision": 0.8739255014326648,
+      "eval_overall_recall": 0.9384615384615385,
+      "eval_runtime": 0.5711,
+      "eval_samples_per_second": 173.35,
+      "eval_steps_per_second": 22.763,
       "step": 392
     },
     {
       "epoch": 7.05,
       "learning_rate": 1.1188435191464303e-05,
+      "loss": 0.0158,
       "step": 395
     },
     {
       "epoch": 7.14,
       "learning_rate": 1.0572386408856552e-05,
+      "loss": 0.0054,
       "step": 400
     },
     {
       "epoch": 7.23,
       "learning_rate": 9.969203239509592e-06,
+      "loss": 0.0063,
       "step": 405
     },
     {
       "epoch": 7.32,
       "learning_rate": 9.379423563186652e-06,
+      "loss": 0.0166,
       "step": 410
     },
     {
       "epoch": 7.41,
       "learning_rate": 8.803573307282209e-06,
+      "loss": 0.0185,
       "step": 415
     },
     {
       "epoch": 7.5,
       "learning_rate": 8.242165977833974e-06,
+      "loss": 0.0097,
       "step": 420
     },
     {
       "epoch": 7.59,
       "learning_rate": 7.695702201611338e-06,
+      "loss": 0.0111,
       "step": 425
     },
     {
       "epoch": 7.68,
       "learning_rate": 7.1646692796888456e-06,
+      "loss": 0.0082,
       "step": 430
     },
     {
       "epoch": 7.77,
       "learning_rate": 6.649540752902544e-06,
+      "loss": 0.0082,
       "step": 435
     },
     {
       "epoch": 7.86,
       "learning_rate": 6.150775979576906e-06,
+      "loss": 0.0208,
       "step": 440
     },
     {
       "epoch": 7.95,
       "learning_rate": 5.668819725898747e-06,
+      "loss": 0.0066,
       "step": 445
     },
     {
       "epoch": 8.0,
+      "eval_CAUSATOR_f1": 0.8085106382978723,
+      "eval_CAUSATOR_number": 91,
+      "eval_CAUSATOR_precision": 0.7835051546391752,
+      "eval_CAUSATOR_recall": 0.8351648351648352,
+      "eval_EXPIRIENCER_f1": 0.9411764705882353,
+      "eval_EXPIRIENCER_number": 98,
+      "eval_EXPIRIENCER_precision": 0.9056603773584906,
+      "eval_EXPIRIENCER_recall": 0.9795918367346939,
+      "eval_INSTRUMENT_f1": 0.7499999999999999,
+      "eval_INSTRUMENT_number": 6,
+      "eval_INSTRUMENT_precision": 0.6,
+      "eval_INSTRUMENT_recall": 1.0,
+      "eval_OTHER_f1": 0.0,
+      "eval_OTHER_number": 1,
+      "eval_OTHER_precision": 0.0,
+      "eval_OTHER_recall": 0.0,
+      "eval_PREDICATE_f1": 0.9477611940298507,
+      "eval_PREDICATE_number": 129,
+      "eval_PREDICATE_precision": 0.9136690647482014,
+      "eval_PREDICATE_recall": 0.9844961240310077,
+      "eval_loss": 0.150935560464859,
+      "eval_overall_accuracy": 0.9680232558139535,
+      "eval_overall_f1": 0.9010339734121122,
+      "eval_overall_precision": 0.8664772727272727,
+      "eval_overall_recall": 0.9384615384615385,
+      "eval_runtime": 0.5698,
+      "eval_samples_per_second": 173.753,
+      "eval_steps_per_second": 22.816,
       "step": 448
     },
     {
       "epoch": 8.04,
       "learning_rate": 5.204101769303474e-06,
+      "loss": 0.0068,
       "step": 450
     },
     {
       "epoch": 8.12,
       "learning_rate": 4.757036515227381e-06,
+      "loss": 0.0055,
       "step": 455
     },
     {
       "epoch": 8.21,
       "learning_rate": 4.328022627567657e-06,
+      "loss": 0.0071,
       "step": 460
     },
     {
       "epoch": 8.3,
       "learning_rate": 3.91744267317968e-06,
+      "loss": 0.0061,
       "step": 465
     },
     {
       "epoch": 8.39,
       "learning_rate": 3.5256627807286085e-06,
+      "loss": 0.017,
       "step": 470
     },
     {
       "epoch": 8.48,
       "learning_rate": 3.1530323141995553e-06,
+      "loss": 0.0042,
       "step": 475
     },
     {
       "epoch": 8.57,
       "learning_rate": 2.7998835613573137e-06,
+      "loss": 0.0103,
       "step": 480
     },
     {
       "epoch": 8.66,
       "learning_rate": 2.4665314374336335e-06,
+      "loss": 0.0056,
       "step": 485
     },
     {
       "epoch": 8.75,
       "learning_rate": 2.153273204306153e-06,
+      "loss": 0.013,
       "step": 490
     },
     {
       "epoch": 8.84,
       "learning_rate": 1.8603882054194915e-06,
+      "loss": 0.0078,
       "step": 495
     },
     {
       "epoch": 8.93,
       "learning_rate": 1.5881376166848149e-06,
+      "loss": 0.0084,
       "step": 500
     },
     {
       "epoch": 9.0,
+      "eval_CAUSATOR_f1": 0.8042328042328042,
+      "eval_CAUSATOR_number": 91,
+      "eval_CAUSATOR_precision": 0.7755102040816326,
+      "eval_CAUSATOR_recall": 0.8351648351648352,
+      "eval_EXPIRIENCER_f1": 0.9359605911330049,
+      "eval_EXPIRIENCER_number": 98,
+      "eval_EXPIRIENCER_precision": 0.9047619047619048,
+      "eval_EXPIRIENCER_recall": 0.9693877551020408,
+      "eval_INSTRUMENT_f1": 0.7499999999999999,
+      "eval_INSTRUMENT_number": 6,
+      "eval_INSTRUMENT_precision": 0.6,
+      "eval_INSTRUMENT_recall": 1.0,
+      "eval_OTHER_f1": 0.0,
+      "eval_OTHER_number": 1,
+      "eval_OTHER_precision": 0.0,
+      "eval_OTHER_recall": 0.0,
+      "eval_PREDICATE_f1": 0.9477611940298507,
+      "eval_PREDICATE_number": 129,
+      "eval_PREDICATE_precision": 0.9136690647482014,
+      "eval_PREDICATE_recall": 0.9844961240310077,
+      "eval_loss": 0.15476951003074646,
+      "eval_overall_accuracy": 0.9656007751937985,
+      "eval_overall_f1": 0.8980797636632201,
+      "eval_overall_precision": 0.8636363636363636,
+      "eval_overall_recall": 0.9353846153846154,
+      "eval_runtime": 0.5704,
+      "eval_samples_per_second": 173.572,
+      "eval_steps_per_second": 22.792,
       "step": 504
     },
     {
       "epoch": 9.02,
       "learning_rate": 1.3367642135800329e-06,
+      "loss": 0.0045,
       "step": 505
     },
     {
       "epoch": 9.11,
       "learning_rate": 1.106492154658323e-06,
+      "loss": 0.0056,
       "step": 510
     },
     {
       "epoch": 9.2,
       "learning_rate": 8.975267816580201e-07,
+      "loss": 0.0123,
       "step": 515
     },
     {
       "epoch": 9.29,
       "learning_rate": 7.100544363921324e-07,
+      "loss": 0.0107,
       "step": 520
     },
     {
       "epoch": 9.38,
       "learning_rate": 5.442422945807462e-07,
+      "loss": 0.0123,
       "step": 525
     },
     {
     {
       "epoch": 9.55,
       "learning_rate": 2.781706165022879e-07,
+      "loss": 0.006,
       "step": 535
     },
     {
       "epoch": 9.64,
       "learning_rate": 1.7814834575997363e-07,
+      "loss": 0.0115,
       "step": 540
     },
     {
       "epoch": 9.73,
       "learning_rate": 1.0026059794363551e-07,
+      "loss": 0.0054,
       "step": 545
     },
     {
       "epoch": 9.82,
       "learning_rate": 4.457682831244259e-08,
+      "loss": 0.0049,
       "step": 550
     },
     {
       "epoch": 9.91,
       "learning_rate": 1.114669205298513e-08,
+      "loss": 0.0036,
       "step": 555
     },
     {
       "epoch": 10.0,
       "learning_rate": 0.0,
+      "loss": 0.0083,
       "step": 560
     },
     {
       "epoch": 10.0,
+      "eval_CAUSATOR_f1": 0.8,
+      "eval_CAUSATOR_number": 91,
+      "eval_CAUSATOR_precision": 0.7676767676767676,
+      "eval_CAUSATOR_recall": 0.8351648351648352,
+      "eval_EXPIRIENCER_f1": 0.9359605911330049,
+      "eval_EXPIRIENCER_number": 98,
+      "eval_EXPIRIENCER_precision": 0.9047619047619048,
+      "eval_EXPIRIENCER_recall": 0.9693877551020408,
+      "eval_INSTRUMENT_f1": 0.7499999999999999,
+      "eval_INSTRUMENT_number": 6,
+      "eval_INSTRUMENT_precision": 0.6,
+      "eval_INSTRUMENT_recall": 1.0,
+      "eval_OTHER_f1": 0.0,
+      "eval_OTHER_number": 1,
+      "eval_OTHER_precision": 0.0,
+      "eval_OTHER_recall": 0.0,
+      "eval_PREDICATE_f1": 0.9477611940298507,
+      "eval_PREDICATE_number": 129,
+      "eval_PREDICATE_precision": 0.9136690647482014,
+      "eval_PREDICATE_recall": 0.9844961240310077,
+      "eval_loss": 0.15370479226112366,
+      "eval_overall_accuracy": 0.9660852713178295,
+      "eval_overall_f1": 0.8967551622418879,
+      "eval_overall_precision": 0.8611898016997167,
+      "eval_overall_recall": 0.9353846153846154,
+      "eval_runtime": 0.5646,
+      "eval_samples_per_second": 175.344,
+      "eval_steps_per_second": 23.025,
       "step": 560
     },
     {
       "epoch": 10.0,
       "step": 560,
+      "total_flos": 130378685407080.0,
+      "train_loss": 0.14471116384956986,
+      "train_runtime": 174.2063,
+      "train_samples_per_second": 50.859,
+      "train_steps_per_second": 3.215
     }
   ],
   "max_steps": 560,
   "num_train_epochs": 10,
+  "total_flos": 130378685407080.0,
   "trial_name": null,
   "trial_params": null
 }

training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:44d086c9d09760d732d84096da922939157e9e704001df2e4a68ec4a53468b21
 size 2927

 version https://git-lfs.github.com/spec/v1
+oid sha256:04d69c64a384636cedd4e94ba08ed7bad19eabb7fb9b4a431041be29be35b690
 size 2927