Training in progress, epoch 15, checkpoint

Browse files

Files changed (12) hide show

checkpoint-615/config.json +61 -0
checkpoint-615/merges.txt +0 -0
checkpoint-615/model.safetensors +3 -0
checkpoint-615/optimizer.pt +3 -0
checkpoint-615/rng_state.pth +3 -0
checkpoint-615/scheduler.pt +3 -0
checkpoint-615/special_tokens_map.json +15 -0
checkpoint-615/tokenizer.json +0 -0
checkpoint-615/tokenizer_config.json +57 -0
checkpoint-615/trainer_state.json +972 -0
checkpoint-615/training_args.bin +3 -0
checkpoint-615/vocab.json +0 -0

checkpoint-615/config.json ADDED Viewed

	@@ -0,0 +1,61 @@

+{
+  "_name_or_path": "allenai/longformer-base-4096",
+  "architectures": [
+    "LongformerForTokenClassification"
+  ],
+  "attention_mode": "longformer",
+  "attention_probs_dropout_prob": 0.1,
+  "attention_window": [
+    700,
+    700,
+    700,
+    700,
+    700,
+    700,
+    700,
+    700,
+    700,
+    700,
+    700,
+    700
+  ],
+  "bos_token_id": 0,
+  "eos_token_id": 2,
+  "gradient_checkpointing": false,
+  "hidden_act": "gelu",
+  "hidden_dropout_prob": 0.1,
+  "hidden_size": 768,
+  "id2label": {
+    "0": "O",
+    "1": "B-MajorClaim",
+    "2": "I-MajorClaim",
+    "3": "B-Claim",
+    "4": "I-Claim",
+    "5": "B-Premise",
+    "6": "I-Premise"
+  },
+  "ignore_attention_mask": false,
+  "initializer_range": 0.02,
+  "intermediate_size": 3072,
+  "label2id": {
+    "B-Claim": 3,
+    "B-MajorClaim": 1,
+    "B-Premise": 5,
+    "I-Claim": 4,
+    "I-MajorClaim": 2,
+    "I-Premise": 6,
+    "O": 0
+  },
+  "layer_norm_eps": 1e-05,
+  "max_position_embeddings": 4098,
+  "model_type": "longformer",
+  "num_attention_heads": 12,
+  "num_hidden_layers": 12,
+  "onnx_export": false,
+  "pad_token_id": 1,
+  "sep_token_id": 2,
+  "torch_dtype": "float32",
+  "transformers_version": "4.37.2",
+  "type_vocab_size": 1,
+  "vocab_size": 50265
+}

checkpoint-615/merges.txt ADDED Viewed

The diff for this file is too large to render. See raw diff

checkpoint-615/model.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:223637ee51e19946ac5c6d217941c49adaa3a2e1ae0f0bb7e0ec85accfc77b35
+size 592330980

checkpoint-615/optimizer.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:ba729b1c786e959b70e1aeb66f44ab4fa9c7c6beb9c545279dad3e175d683742
+size 1014670074

checkpoint-615/rng_state.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:60d73cd4de91f0357130d4e4cf004c9af20e1519786ee889e727d7e40790e3e3
+size 14244

checkpoint-615/scheduler.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:bd51b0c91b998e8eb1af654a99ec608c0d09f203d69a278de7c58661b45b72ab
+size 1064

checkpoint-615/special_tokens_map.json ADDED Viewed

	@@ -0,0 +1,15 @@

+{
+  "bos_token": "<s>",
+  "cls_token": "<s>",
+  "eos_token": "</s>",
+  "mask_token": {
+    "content": "<mask>",
+    "lstrip": true,
+    "normalized": false,
+    "rstrip": false,
+    "single_word": false
+  },
+  "pad_token": "<pad>",
+  "sep_token": "</s>",
+  "unk_token": "<unk>"
+}

checkpoint-615/tokenizer.json ADDED Viewed

The diff for this file is too large to render. See raw diff

checkpoint-615/tokenizer_config.json ADDED Viewed

	@@ -0,0 +1,57 @@

+{
+  "add_prefix_space": true,
+  "added_tokens_decoder": {
+    "0": {
+      "content": "<s>",
+      "lstrip": false,
+      "normalized": true,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "1": {
+      "content": "<pad>",
+      "lstrip": false,
+      "normalized": true,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "2": {
+      "content": "</s>",
+      "lstrip": false,
+      "normalized": true,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "3": {
+      "content": "<unk>",
+      "lstrip": false,
+      "normalized": true,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "50264": {
+      "content": "<mask>",
+      "lstrip": true,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    }
+  },
+  "bos_token": "<s>",
+  "clean_up_tokenization_spaces": true,
+  "cls_token": "<s>",
+  "eos_token": "</s>",
+  "errors": "replace",
+  "mask_token": "<mask>",
+  "model_max_length": 4096,
+  "pad_token": "<pad>",
+  "sep_token": "</s>",
+  "tokenizer_class": "LongformerTokenizer",
+  "trim_offsets": true,
+  "unk_token": "<unk>"
+}

checkpoint-615/trainer_state.json ADDED Viewed

	@@ -0,0 +1,972 @@

+{
+  "best_metric": null,
+  "best_model_checkpoint": null,
+  "epoch": 15.0,
+  "eval_steps": 500,
+  "global_step": 615,
+  "is_hyper_param_search": false,
+  "is_local_process_zero": true,
+  "is_world_process_zero": true,
+  "log_history": [
+    {
+      "epoch": 1.0,
+      "eval_B-Claim": {
+        "f1-score": 0.0,
+        "precision": 0.0,
+        "recall": 0.0,
+        "support": 284.0
+      },
+      "eval_B-MajorClaim": {
+        "f1-score": 0.0,
+        "precision": 0.0,
+        "recall": 0.0,
+        "support": 141.0
+      },
+      "eval_B-Premise": {
+        "f1-score": 0.1548223350253807,
+        "precision": 0.7625,
+        "recall": 0.08615819209039548,
+        "support": 708.0
+      },
+      "eval_I-Claim": {
+        "f1-score": 0.320846509365118,
+        "precision": 0.31821471652593486,
+        "recall": 0.3235221976943831,
+        "support": 4077.0
+      },
+      "eval_I-MajorClaim": {
+        "f1-score": 0.30944741532976827,
+        "precision": 0.5556978233034571,
+        "recall": 0.21442687747035574,
+        "support": 2024.0
+      },
+      "eval_I-Premise": {
+        "f1-score": 0.8325705005167576,
+        "precision": 0.758950201884253,
+        "recall": 0.9220078482668411,
+        "support": 12232.0
+      },
+      "eval_O": {
+        "f1-score": 0.8424700041373604,
+        "precision": 0.8602661596958175,
+        "recall": 0.8253952168625861,
+        "support": 9868.0
+      },
+      "eval_accuracy": 0.7239721824503988,
+      "eval_loss": 0.7399080395698547,
+      "eval_macro avg": {
+        "f1-score": 0.35145096633919787,
+        "precision": 0.4650898430584946,
+        "recall": 0.33878719034065163,
+        "support": 29334.0
+      },
+      "eval_runtime": 1.4174,
+      "eval_samples_per_second": 56.441,
+      "eval_steps_per_second": 7.055,
+      "eval_weighted avg": {
+        "f1-score": 0.7002632905043792,
+        "precision": 0.70684288289933,
+        "recall": 0.7239721824503988,
+        "support": 29334.0
+      },
+      "step": 41
+    },
+    {
+      "epoch": 2.0,
+      "eval_B-Claim": {
+        "f1-score": 0.027491408934707903,
+        "precision": 0.5714285714285714,
+        "recall": 0.014084507042253521,
+        "support": 284.0
+      },
+      "eval_B-MajorClaim": {
+        "f1-score": 0.0,
+        "precision": 0.0,
+        "recall": 0.0,
+        "support": 141.0
+      },
+      "eval_B-Premise": {
+        "f1-score": 0.6804835924006908,
+        "precision": 0.5743440233236151,
+        "recall": 0.8347457627118644,
+        "support": 708.0
+      },
+      "eval_I-Claim": {
+        "f1-score": 0.42355671598491446,
+        "precision": 0.5182818601348953,
+        "recall": 0.35810645082168263,
+        "support": 4077.0
+      },
+      "eval_I-MajorClaim": {
+        "f1-score": 0.5595744680851064,
+        "precision": 0.6059907834101382,
+        "recall": 0.5197628458498024,
+        "support": 2024.0
+      },
+      "eval_I-Premise": {
+        "f1-score": 0.8694257788637754,
+        "precision": 0.8156160458452723,
+        "recall": 0.9308371484630478,
+        "support": 12232.0
+      },
+      "eval_O": {
+        "f1-score": 0.8708085279601078,
+        "precision": 0.8745017884517118,
+        "recall": 0.867146331576814,
+        "support": 9868.0
+      },
+      "eval_accuracy": 0.7857775959637281,
+      "eval_loss": 0.5717769861221313,
+      "eval_macro avg": {
+        "f1-score": 0.4901914988899004,
+        "precision": 0.5657375817991721,
+        "recall": 0.5035261494950664,
+        "support": 29334.0
+      },
+      "eval_runtime": 1.4179,
+      "eval_samples_per_second": 56.421,
+      "eval_steps_per_second": 7.053,
+      "eval_weighted avg": {
+        "f1-score": 0.7696517378810916,
+        "precision": 0.767528495718681,
+        "recall": 0.7857775959637281,
+        "support": 29334.0
+      },
+      "step": 82
+    },
+    {
+      "epoch": 3.0,
+      "eval_B-Claim": {
+        "f1-score": 0.45522388059701496,
+        "precision": 0.48412698412698413,
+        "recall": 0.4295774647887324,
+        "support": 284.0
+      },
+      "eval_B-MajorClaim": {
+        "f1-score": 0.14814814814814814,
+        "precision": 0.5714285714285714,
+        "recall": 0.0851063829787234,
+        "support": 141.0
+      },
+      "eval_B-Premise": {
+        "f1-score": 0.7349014621741894,
+        "precision": 0.6682080924855491,
+        "recall": 0.8163841807909604,
+        "support": 708.0
+      },
+      "eval_I-Claim": {
+        "f1-score": 0.5597381342062193,
+        "precision": 0.504127358490566,
+        "recall": 0.6291390728476821,
+        "support": 4077.0
+      },
+      "eval_I-MajorClaim": {
+        "f1-score": 0.7027804410354747,
+        "precision": 0.6824953445065177,
+        "recall": 0.724308300395257,
+        "support": 2024.0
+      },
+      "eval_I-Premise": {
+        "f1-score": 0.8580818643561399,
+        "precision": 0.8977404661963025,
+        "recall": 0.8217789404839765,
+        "support": 12232.0
+      },
+      "eval_O": {
+        "f1-score": 0.8938923131781367,
+        "precision": 0.8986991703369865,
+        "recall": 0.8891366031617349,
+        "support": 9868.0
+      },
+      "eval_accuracy": 0.8034703756732802,
+      "eval_loss": 0.5305466651916504,
+      "eval_macro avg": {
+        "f1-score": 0.6218237490993319,
+        "precision": 0.6724037125102111,
+        "recall": 0.6279187064924381,
+        "support": 29334.0
+      },
+      "eval_runtime": 1.4138,
+      "eval_samples_per_second": 56.587,
+      "eval_steps_per_second": 7.073,
+      "eval_weighted avg": {
+        "f1-score": 0.8076617373443268,
+        "precision": 0.8173920172765067,
+        "recall": 0.8034703756732802,
+        "support": 29334.0
+      },
+      "step": 123
+    },
+    {
+      "epoch": 4.0,
+      "eval_B-Claim": {
+        "f1-score": 0.48312611012433393,
+        "precision": 0.4874551971326165,
+        "recall": 0.4788732394366197,
+        "support": 284.0
+      },
+      "eval_B-MajorClaim": {
+        "f1-score": 0.6104417670682731,
+        "precision": 0.7037037037037037,
+        "recall": 0.5390070921985816,
+        "support": 141.0
+      },
+      "eval_B-Premise": {
+        "f1-score": 0.7560050568900126,
+        "precision": 0.6842105263157895,
+        "recall": 0.844632768361582,
+        "support": 708.0
+      },
+      "eval_I-Claim": {
+        "f1-score": 0.5483343808925204,
+        "precision": 0.5624033006704486,
+        "recall": 0.5349521707137601,
+        "support": 4077.0
+      },
+      "eval_I-MajorClaim": {
+        "f1-score": 0.7212475633528265,
+        "precision": 0.8264199106573069,
+        "recall": 0.6398221343873518,
+        "support": 2024.0
+      },
+      "eval_I-Premise": {
+        "f1-score": 0.8794421774097699,
+        "precision": 0.8531785686832193,
+        "recall": 0.9073741007194245,
+        "support": 12232.0
+      },
+      "eval_O": {
+        "f1-score": 0.8933134910453123,
+        "precision": 0.9048757667117164,
+        "recall": 0.8820429671665991,
+        "support": 9868.0
+      },
+      "eval_accuracy": 0.8211972455171473,
+      "eval_loss": 0.52641761302948,
+      "eval_macro avg": {
+        "f1-score": 0.6988443638261499,
+        "precision": 0.7174638534106857,
+        "recall": 0.6895292104262741,
+        "support": 29334.0
+      },
+      "eval_runtime": 1.4223,
+      "eval_samples_per_second": 56.246,
+      "eval_steps_per_second": 7.031,
+      "eval_weighted avg": {
+        "f1-score": 0.81906491673643,
+        "precision": 0.8199722855692243,
+        "recall": 0.8211972455171473,
+        "support": 29334.0
+      },
+      "step": 164
+    },
+    {
+      "epoch": 5.0,
+      "eval_B-Claim": {
+        "f1-score": 0.5169230769230769,
+        "precision": 0.45901639344262296,
+        "recall": 0.5915492957746479,
+        "support": 284.0
+      },
+      "eval_B-MajorClaim": {
+        "f1-score": 0.6466165413533834,
+        "precision": 0.688,
+        "recall": 0.6099290780141844,
+        "support": 141.0
+      },
+      "eval_B-Premise": {
+        "f1-score": 0.7462879276952873,
+        "precision": 0.6872770511296076,
+        "recall": 0.8163841807909604,
+        "support": 708.0
+      },
+      "eval_I-Claim": {
+        "f1-score": 0.5599537037037038,
+        "precision": 0.5301336839798378,
+        "recall": 0.5933284277655139,
+        "support": 4077.0
+      },
+      "eval_I-MajorClaim": {
+        "f1-score": 0.7108050847457628,
+        "precision": 0.7659817351598174,
+        "recall": 0.6630434782608695,
+        "support": 2024.0
+      },
+      "eval_I-Premise": {
+        "f1-score": 0.8764307593100111,
+        "precision": 0.864308426073132,
+        "recall": 0.8888979725310661,
+        "support": 12232.0
+      },
+      "eval_O": {
+        "f1-score": 0.8840052700922265,
+        "precision": 0.9209399363127265,
+        "recall": 0.8499189298743413,
+        "support": 9868.0
+      },
+      "eval_accuracy": 0.8131519738187768,
+      "eval_loss": 0.5400775074958801,
+      "eval_macro avg": {
+        "f1-score": 0.7058603376890645,
+        "precision": 0.702236746585392,
+        "recall": 0.7161501947159407,
+        "support": 29334.0
+      },
+      "eval_runtime": 1.4191,
+      "eval_samples_per_second": 56.374,
+      "eval_steps_per_second": 7.047,
+      "eval_weighted avg": {
+        "f1-score": 0.8158388468555539,
+        "precision": 0.8210853899484308,
+        "recall": 0.8131519738187768,
+        "support": 29334.0
+      },
+      "step": 205
+    },
+    {
+      "epoch": 6.0,
+      "eval_B-Claim": {
+        "f1-score": 0.5396290050590219,
+        "precision": 0.517799352750809,
+        "recall": 0.5633802816901409,
+        "support": 284.0
+      },
+      "eval_B-MajorClaim": {
+        "f1-score": 0.6879432624113475,
+        "precision": 0.6879432624113475,
+        "recall": 0.6879432624113475,
+        "support": 141.0
+      },
+      "eval_B-Premise": {
+        "f1-score": 0.7728459530026109,
+        "precision": 0.7184466019417476,
+        "recall": 0.8361581920903954,
+        "support": 708.0
+      },
+      "eval_I-Claim": {
+        "f1-score": 0.5682792406613595,
+        "precision": 0.5675146771037182,
+        "recall": 0.5690458670591121,
+        "support": 4077.0
+      },
+      "eval_I-MajorClaim": {
+        "f1-score": 0.744126659856997,
+        "precision": 0.7700845665961945,
+        "recall": 0.7198616600790514,
+        "support": 2024.0
+      },
+      "eval_I-Premise": {
+        "f1-score": 0.8782814316059476,
+        "precision": 0.8614670964698482,
+        "recall": 0.8957652060170046,
+        "support": 12232.0
+      },
+      "eval_O": {
+        "f1-score": 0.891362005304488,
+        "precision": 0.915500480717872,
+        "recall": 0.8684637211187677,
+        "support": 9868.0
+      },
+      "eval_accuracy": 0.8233790141133156,
+      "eval_loss": 0.5608550906181335,
+      "eval_macro avg": {
+        "f1-score": 0.7260667939859674,
+        "precision": 0.7198222911416482,
+        "recall": 0.7343740272094027,
+        "support": 29334.0
+      },
+      "eval_runtime": 1.42,
+      "eval_samples_per_second": 56.337,
+      "eval_steps_per_second": 7.042,
+      "eval_weighted avg": {
+        "f1-score": 0.8236011159623022,
+        "precision": 0.8248703886084983,
+        "recall": 0.8233790141133156,
+        "support": 29334.0
+      },
+      "step": 246
+    },
+    {
+      "epoch": 7.0,
+      "eval_B-Claim": {
+        "f1-score": 0.5528455284552846,
+        "precision": 0.513595166163142,
+        "recall": 0.5985915492957746,
+        "support": 284.0
+      },
+      "eval_B-MajorClaim": {
+        "f1-score": 0.6936026936026936,
+        "precision": 0.6602564102564102,
+        "recall": 0.7304964539007093,
+        "support": 141.0
+      },
+      "eval_B-Premise": {
+        "f1-score": 0.7722908093278464,
+        "precision": 0.7506666666666667,
+        "recall": 0.7951977401129944,
+        "support": 708.0
+      },
+      "eval_I-Claim": {
+        "f1-score": 0.5735997058463046,
+        "precision": 0.5732484076433121,
+        "recall": 0.5739514348785872,
+        "support": 4077.0
+      },
+      "eval_I-MajorClaim": {
+        "f1-score": 0.7633703329969728,
+        "precision": 0.7798969072164949,
+        "recall": 0.7475296442687747,
+        "support": 2024.0
+      },
+      "eval_I-Premise": {
+        "f1-score": 0.883062701951,
+        "precision": 0.8836048129655398,
+        "recall": 0.8825212557226946,
+        "support": 12232.0
+      },
+      "eval_O": {
+        "f1-score": 0.9022609753624656,
+        "precision": 0.9027186041793467,
+        "recall": 0.901803810295906,
+        "support": 9868.0
+      },
+      "eval_accuracy": 0.8312197450057953,
+      "eval_loss": 0.5639435648918152,
+      "eval_macro avg": {
+        "f1-score": 0.7344332496489382,
+        "precision": 0.7234267107272733,
+        "recall": 0.74715598406792,
+        "support": 29334.0
+      },
+      "eval_runtime": 1.4196,
+      "eval_samples_per_second": 56.355,
+      "eval_steps_per_second": 7.044,
+      "eval_weighted avg": {
+        "f1-score": 0.8314703017913034,
+        "precision": 0.8318795778768913,
+        "recall": 0.8312197450057953,
+        "support": 29334.0
+      },
+      "step": 287
+    },
+    {
+      "epoch": 8.0,
+      "eval_B-Claim": {
+        "f1-score": 0.556836902800659,
+        "precision": 0.5232198142414861,
+        "recall": 0.5950704225352113,
+        "support": 284.0
+      },
+      "eval_B-MajorClaim": {
+        "f1-score": 0.7013888888888888,
+        "precision": 0.6870748299319728,
+        "recall": 0.7163120567375887,
+        "support": 141.0
+      },
+      "eval_B-Premise": {
+        "f1-score": 0.7824296499656829,
+        "precision": 0.7610146862483311,
+        "recall": 0.8050847457627118,
+        "support": 708.0
+      },
+      "eval_I-Claim": {
+        "f1-score": 0.5778475661311753,
+        "precision": 0.5692527367920038,
+        "recall": 0.5867059112092224,
+        "support": 4077.0
+      },
+      "eval_I-MajorClaim": {
+        "f1-score": 0.7583943448624085,
+        "precision": 0.7754259163655137,
+        "recall": 0.7420948616600791,
+        "support": 2024.0
+      },
+      "eval_I-Premise": {
+        "f1-score": 0.8827766863130322,
+        "precision": 0.8839344262295082,
+        "recall": 0.881621975147155,
+        "support": 12232.0
+      },
+      "eval_O": {
+        "f1-score": 0.9058236611688048,
+        "precision": 0.9100859247135843,
+        "recall": 0.9016011349817592,
+        "support": 9868.0
+      },
+      "eval_accuracy": 0.8323106293038794,
+      "eval_loss": 0.5765838623046875,
+      "eval_macro avg": {
+        "f1-score": 0.7379282428758074,
+        "precision": 0.7300011906460572,
+        "recall": 0.7469273011476754,
+        "support": 29334.0
+      },
+      "eval_runtime": 1.4173,
+      "eval_samples_per_second": 56.444,
+      "eval_steps_per_second": 7.056,
+      "eval_weighted avg": {
+        "f1-score": 0.8331173621878202,
+        "precision": 0.834103417381421,
+        "recall": 0.8323106293038794,
+        "support": 29334.0
+      },
+      "step": 328
+    },
+    {
+      "epoch": 9.0,
+      "eval_B-Claim": {
+        "f1-score": 0.5608108108108107,
+        "precision": 0.538961038961039,
+        "recall": 0.5845070422535211,
+        "support": 284.0
+      },
+      "eval_B-MajorClaim": {
+        "f1-score": 0.7062706270627063,
+        "precision": 0.6604938271604939,
+        "recall": 0.7588652482269503,
+        "support": 141.0
+      },
+      "eval_B-Premise": {
+        "f1-score": 0.7868852459016393,
+        "precision": 0.7619047619047619,
+        "recall": 0.8135593220338984,
+        "support": 708.0
+      },
+      "eval_I-Claim": {
+        "f1-score": 0.5757501829714565,
+        "precision": 0.5726765348216453,
+        "recall": 0.5788570026980623,
+        "support": 4077.0
+      },
+      "eval_I-MajorClaim": {
+        "f1-score": 0.7613469985358712,
+        "precision": 0.7521697203471552,
+        "recall": 0.7707509881422925,
+        "support": 2024.0
+      },
+      "eval_I-Premise": {
+        "f1-score": 0.881003613332792,
+        "precision": 0.8750705702072747,
+        "recall": 0.8870176586003924,
+        "support": 12232.0
+      },
+      "eval_O": {
+        "f1-score": 0.8976369827675162,
+        "precision": 0.914336766869876,
+        "recall": 0.8815362788812323,
+        "support": 9868.0
+      },
+      "eval_accuracy": 0.829003886275312,
+      "eval_loss": 0.6423923373222351,
+      "eval_macro avg": {
+        "f1-score": 0.7385292087689704,
+        "precision": 0.725087602896035,
+        "recall": 0.75358479154805,
+        "support": 29334.0
+      },
+      "eval_runtime": 1.4177,
+      "eval_samples_per_second": 56.429,
+      "eval_steps_per_second": 7.054,
+      "eval_weighted avg": {
+        "f1-score": 0.8297056980988704,
+        "precision": 0.8307545957871735,
+        "recall": 0.829003886275312,
+        "support": 29334.0
+      },
+      "step": 369
+    },
+    {
+      "epoch": 10.0,
+      "eval_B-Claim": {
+        "f1-score": 0.5340699815837938,
+        "precision": 0.5598455598455598,
+        "recall": 0.5105633802816901,
+        "support": 284.0
+      },
+      "eval_B-MajorClaim": {
+        "f1-score": 0.6917808219178082,
+        "precision": 0.6688741721854304,
+        "recall": 0.7163120567375887,
+        "support": 141.0
+      },
+      "eval_B-Premise": {
+        "f1-score": 0.7902695595003287,
+        "precision": 0.7392373923739237,
+        "recall": 0.8488700564971752,
+        "support": 708.0
+      },
+      "eval_I-Claim": {
+        "f1-score": 0.5523707473881597,
+        "precision": 0.6084390675715551,
+        "recall": 0.5057640421878833,
+        "support": 4077.0
+      },
+      "eval_I-MajorClaim": {
+        "f1-score": 0.7558022199798183,
+        "precision": 0.7721649484536083,
+        "recall": 0.7401185770750988,
+        "support": 2024.0
+      },
+      "eval_I-Premise": {
+        "f1-score": 0.8884279732321058,
+        "precision": 0.8521132047143608,
+        "recall": 0.92797580117724,
+        "support": 12232.0
+      },
+      "eval_O": {
+        "f1-score": 0.8982358114749858,
+        "precision": 0.9175562836909418,
+        "recall": 0.8797122010539117,
+        "support": 9868.0
+      },
+      "eval_accuracy": 0.8331287925274425,
+      "eval_loss": 0.6874521374702454,
+      "eval_macro avg": {
+        "f1-score": 0.7301367307252857,
+        "precision": 0.7311758041193401,
+        "recall": 0.7327594450015126,
+        "support": 29334.0
+      },
+      "eval_runtime": 1.4184,
+      "eval_samples_per_second": 56.401,
+      "eval_steps_per_second": 7.05,
+      "eval_weighted avg": {
+        "f1-score": 0.8291241905412626,
+        "precision": 0.8283101361138144,
+        "recall": 0.8331287925274425,
+        "support": 29334.0
+      },
+      "step": 410
+    },
+    {
+      "epoch": 11.0,
+      "eval_B-Claim": {
+        "f1-score": 0.539568345323741,
+        "precision": 0.5514705882352942,
+        "recall": 0.528169014084507,
+        "support": 284.0
+      },
+      "eval_B-MajorClaim": {
+        "f1-score": 0.7,
+        "precision": 0.7050359712230215,
+        "recall": 0.6950354609929078,
+        "support": 141.0
+      },
+      "eval_B-Premise": {
+        "f1-score": 0.7853820598006644,
+        "precision": 0.7415307402760352,
+        "recall": 0.8347457627118644,
+        "support": 708.0
+      },
+      "eval_I-Claim": {
+        "f1-score": 0.5730817610062893,
+        "precision": 0.5881745416989413,
+        "recall": 0.5587441746382144,
+        "support": 4077.0
+      },
+      "eval_I-MajorClaim": {
+        "f1-score": 0.7655137334689724,
+        "precision": 0.7887840670859538,
+        "recall": 0.7435770750988142,
+        "support": 2024.0
+      },
+      "eval_I-Premise": {
+        "f1-score": 0.8855510725841887,
+        "precision": 0.8658698539176627,
+        "recall": 0.9061478090255068,
+        "support": 12232.0
+      },
+      "eval_O": {
+        "f1-score": 0.9009890789202555,
+        "precision": 0.9162824811399832,
+        "recall": 0.8861978111066072,
+        "support": 9868.0
+      },
+      "eval_accuracy": 0.8335378741392241,
+      "eval_loss": 0.722274899482727,
+      "eval_macro avg": {
+        "f1-score": 0.7357265787291587,
+        "precision": 0.7367354633681273,
+        "recall": 0.7360881582369173,
+        "support": 29334.0
+      },
+      "eval_runtime": 1.4133,
+      "eval_samples_per_second": 56.605,
+      "eval_steps_per_second": 7.076,
+      "eval_weighted avg": {
+        "f1-score": 0.8323741390608008,
+        "precision": 0.8320963257113063,
+        "recall": 0.8335378741392241,
+        "support": 29334.0
+      },
+      "step": 451
+    },
+    {
+      "epoch": 12.0,
+      "eval_B-Claim": {
+        "f1-score": 0.5542168674698795,
+        "precision": 0.4842105263157895,
+        "recall": 0.647887323943662,
+        "support": 284.0
+      },
+      "eval_B-MajorClaim": {
+        "f1-score": 0.6983050847457627,
+        "precision": 0.6688311688311688,
+        "recall": 0.7304964539007093,
+        "support": 141.0
+      },
+      "eval_B-Premise": {
+        "f1-score": 0.7742837176799442,
+        "precision": 0.7662517289073306,
+        "recall": 0.7824858757062146,
+        "support": 708.0
+      },
+      "eval_I-Claim": {
+        "f1-score": 0.5857796629088069,
+        "precision": 0.5374846374436706,
+        "recall": 0.6436104979151337,
+        "support": 4077.0
+      },
+      "eval_I-MajorClaim": {
+        "f1-score": 0.7506209637357178,
+        "precision": 0.7547452547452548,
+        "recall": 0.7465415019762845,
+        "support": 2024.0
+      },
+      "eval_I-Premise": {
+        "f1-score": 0.8754445455297329,
+        "precision": 0.8857740585774059,
+        "recall": 0.8653531720078482,
+        "support": 12232.0
+      },
+      "eval_O": {
+        "f1-score": 0.8975982418502434,
+        "precision": 0.9279454722492697,
+        "recall": 0.8691730847182814,
+        "support": 9868.0
+      },
+      "eval_accuracy": 0.8228676620985886,
+      "eval_loss": 0.7228854298591614,
+      "eval_macro avg": {
+        "f1-score": 0.7337498691314411,
+        "precision": 0.7178918352956986,
+        "recall": 0.755078272881162,
+        "support": 29334.0
+      },
+      "eval_runtime": 1.4154,
+      "eval_samples_per_second": 56.521,
+      "eval_steps_per_second": 7.065,
+      "eval_weighted avg": {
+        "f1-score": 0.8276221833778615,
+        "precision": 0.8346973026345582,
+        "recall": 0.8228676620985886,
+        "support": 29334.0
+      },
+      "step": 492
+    },
+    {
+      "epoch": 12.2,
+      "learning_rate": 4.75609756097561e-06,
+      "loss": 0.3184,
+      "step": 500
+    },
+    {
+      "epoch": 13.0,
+      "eval_B-Claim": {
+        "f1-score": 0.5582191780821917,
+        "precision": 0.5433333333333333,
+        "recall": 0.573943661971831,
+        "support": 284.0
+      },
+      "eval_B-MajorClaim": {
+        "f1-score": 0.7194244604316545,
+        "precision": 0.7299270072992701,
+        "recall": 0.7092198581560284,
+        "support": 141.0
+      },
+      "eval_B-Premise": {
+        "f1-score": 0.784366576819407,
+        "precision": 0.75,
+        "recall": 0.8220338983050848,
+        "support": 708.0
+      },
+      "eval_I-Claim": {
+        "f1-score": 0.577593563330489,
+        "precision": 0.5741638390693166,
+        "recall": 0.5810645082168261,
+        "support": 4077.0
+      },
+      "eval_I-MajorClaim": {
+        "f1-score": 0.7581699346405228,
+        "precision": 0.8051082731815657,
+        "recall": 0.7164031620553359,
+        "support": 2024.0
+      },
+      "eval_I-Premise": {
+        "f1-score": 0.8835273197542839,
+        "precision": 0.873641304347826,
+        "recall": 0.8936396337475474,
+        "support": 12232.0
+      },
+      "eval_O": {
+        "f1-score": 0.8996419437340154,
+        "precision": 0.9082834125180748,
+        "recall": 0.8911633563032023,
+        "support": 9868.0
+      },
+      "eval_accuracy": 0.8314242858116861,
+      "eval_loss": 0.7460470795631409,
+      "eval_macro avg": {
+        "f1-score": 0.7401347109703663,
+        "precision": 0.7406367385356267,
+        "recall": 0.7410668683936937,
+        "support": 29334.0
+      },
+      "eval_runtime": 1.4168,
+      "eval_samples_per_second": 56.464,
+      "eval_steps_per_second": 7.058,
+      "eval_weighted avg": {
+        "f1-score": 0.8314468675699472,
+        "precision": 0.8320703838894091,
+        "recall": 0.8314242858116861,
+        "support": 29334.0
+      },
+      "step": 533
+    },
+    {
+      "epoch": 14.0,
+      "eval_B-Claim": {
+        "f1-score": 0.5551839464882944,
+        "precision": 0.5286624203821656,
+        "recall": 0.5845070422535211,
+        "support": 284.0
+      },
+      "eval_B-MajorClaim": {
+        "f1-score": 0.7038327526132405,
+        "precision": 0.6917808219178082,
+        "recall": 0.7163120567375887,
+        "support": 141.0
+      },
+      "eval_B-Premise": {
+        "f1-score": 0.7854251012145749,
+        "precision": 0.751937984496124,
+        "recall": 0.8220338983050848,
+        "support": 708.0
+      },
+      "eval_I-Claim": {
+        "f1-score": 0.5741286205203731,
+        "precision": 0.5745517071972488,
+        "recall": 0.5737061564876135,
+        "support": 4077.0
+      },
+      "eval_I-MajorClaim": {
+        "f1-score": 0.7577986304844027,
+        "precision": 0.7785304846274101,
+        "recall": 0.7381422924901185,
+        "support": 2024.0
+      },
+      "eval_I-Premise": {
+        "f1-score": 0.8831628955632499,
+        "precision": 0.8700618752974774,
+        "recall": 0.8966644865925442,
+        "support": 12232.0
+      },
+      "eval_O": {
+        "f1-score": 0.8997522196985339,
+        "precision": 0.9169823232323232,
+        "recall": 0.8831576813944062,
+        "support": 9868.0
+      },
+      "eval_accuracy": 0.830606122588123,
+      "eval_loss": 0.7718554735183716,
+      "eval_macro avg": {
+        "f1-score": 0.7370405952260956,
+        "precision": 0.7303582310215082,
+        "recall": 0.7449319448944111,
+        "support": 29334.0
+      },
+      "eval_runtime": 1.4183,
+      "eval_samples_per_second": 56.405,
+      "eval_steps_per_second": 7.051,
+      "eval_weighted avg": {
+        "f1-score": 0.8307460246491396,
+        "precision": 0.8314455836819585,
+        "recall": 0.830606122588123,
+        "support": 29334.0
+      },
+      "step": 574
+    },
+    {
+      "epoch": 15.0,
+      "eval_B-Claim": {
+        "f1-score": 0.564935064935065,
+        "precision": 0.5240963855421686,
+        "recall": 0.6126760563380281,
+        "support": 284.0
+      },
+      "eval_B-MajorClaim": {
+        "f1-score": 0.7062937062937064,
+        "precision": 0.696551724137931,
+        "recall": 0.7163120567375887,
+        "support": 141.0
+      },
+      "eval_B-Premise": {
+        "f1-score": 0.7829036635006784,
+        "precision": 0.7532637075718016,
+        "recall": 0.8149717514124294,
+        "support": 708.0
+      },
+      "eval_I-Claim": {
+        "f1-score": 0.583969465648855,
+        "precision": 0.5683770605990248,
+        "recall": 0.6004415011037527,
+        "support": 4077.0
+      },
+      "eval_I-MajorClaim": {
+        "f1-score": 0.7649605296664119,
+        "precision": 0.789280084077772,
+        "recall": 0.7420948616600791,
+        "support": 2024.0
+      },
+      "eval_I-Premise": {
+        "f1-score": 0.8827731774638741,
+        "precision": 0.8766526926797807,
+        "recall": 0.8889797253106606,
+        "support": 12232.0
+      },
+      "eval_O": {
+        "f1-score": 0.8997673817523908,
+        "precision": 0.9183285849952516,
+        "recall": 0.8819416295095257,
+        "support": 9868.0
+      },
+      "eval_accuracy": 0.8310833844685348,
+      "eval_loss": 0.773708164691925,
+      "eval_macro avg": {
+        "f1-score": 0.7408004270372831,
+        "precision": 0.7323643199433901,
+        "recall": 0.7510596545817235,
+        "support": 29334.0
+      },
+      "eval_runtime": 1.4104,
+      "eval_samples_per_second": 56.722,
+      "eval_steps_per_second": 7.09,
+      "eval_weighted avg": {
+        "f1-score": 0.8324958893486518,
+        "precision": 0.8345410190013676,
+        "recall": 0.8310833844685348,
+        "support": 29334.0
+      },
+      "step": 615
+    }
+  ],
+  "logging_steps": 500,
+  "max_steps": 656,
+  "num_input_tokens_seen": 0,
+  "num_train_epochs": 16,
+  "save_steps": 500,
+  "total_flos": 2156862190770000.0,
+  "train_batch_size": 8,
+  "trial_name": null,
+  "trial_params": null
+}

checkpoint-615/training_args.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:82ac531ece3e5264f5a6be71a649db6a14a73aa49f10c8ea8f08c0485ea3ffcc
+size 4664

checkpoint-615/vocab.json ADDED Viewed

The diff for this file is too large to render. See raw diff