End of training

Browse files

Files changed (14) hide show

README.md +81 -0
added_tokens.json +7 -0
all_results.json +41 -0
config.json +51 -0
pytorch_model.bin +3 -0
special_tokens_map.json +7 -0
test_results.json +41 -0
tokenizer.json +0 -0
tokenizer_config.json +65 -0
train_results.json +41 -0
trainer_state.json +844 -0
training_args.bin +3 -0
validation_results.json +41 -0
vocab.txt +0 -0

README.md ADDED Viewed

	@@ -0,0 +1,81 @@

+---
+base_model: napsternxg/gte-small-L3-ingredient-v2
+tags:
+- generated_from_trainer
+datasets:
+- nyt_ingredients
+model-index:
+- name: nyt_ingredients-crf-tagger-gte-small-L3-ingredient-v2
+  results: []
+---
+<!-- This model card has been generated automatically according to the information the Trainer had access to. You
+should probably proofread and complete it, then remove this comment. -->
+# nyt_ingredients-crf-tagger-gte-small-L3-ingredient-v2
+This model is a fine-tuned version of [napsternxg/gte-small-L3-ingredient-v2](https://huggingface.co/napsternxg/gte-small-L3-ingredient-v2) on the nyt_ingredients dataset.
+It achieves the following results on the evaluation set:
+- Loss: 1.6099
+- Comment: {'precision': 0.042328042328042326, 'recall': 0.015407896546980328, 'f1': 0.022592032274331823, 'number': 7269}
+- Name: {'precision': 0.1018981018981019, 'recall': 0.03297769156159069, 'f1': 0.049829018075232046, 'number': 9279}
+- Qty: {'precision': 0.15665304220758594, 'recall': 0.9842980705256155, 'f1': 0.27028903423831624, 'number': 7515}
+- Range End: {'precision': 0.0, 'recall': 0.0, 'f1': 0.0, 'number': 90}
+- Unit: {'precision': 0.5, 'recall': 0.00016485328058028355, 'f1': 0.00032959789057350036, 'number': 6066}
+- Overall Precision: 0.1478
+- Overall Recall: 0.2586
+- Overall F1: 0.1881
+- Overall Accuracy: 0.1721
+## Model description
+More information needed
+## Intended uses & limitations
+More information needed
+## Training and evaluation data
+More information needed
+## Training procedure
+### Training hyperparameters
+The following hyperparameters were used during training:
+- learning_rate: 5e-05
+- train_batch_size: 32
+- eval_batch_size: 32
+- seed: 42
+- optimizer: Adam with betas=(0.9,0.999) and epsilon=1e-08
+- lr_scheduler_type: linear
+- num_epochs: 3
+### Training results
+| Training Loss | Epoch | Step  | Validation Loss | Comment                                                                                                         | Name                                                                                                          | Qty                                                                                                         | Range End                                                  | Unit                                                         | Overall Precision | Overall Recall | Overall F1 | Overall Accuracy |
+|:-------------:|:-----:|:-----:|:---------------:|:---------------------------------------------------------------------------------------------------------------:|:-------------------------------------------------------------------------------------------------------------:|:-----------------------------------------------------------------------------------------------------------:|:----------------------------------------------------------:|:------------------------------------------------------------:|:-----------------:|:--------------:|:----------:|:----------------:|
+| 5.3925        | 0.19  | 1000  | 4.7348          | {'precision': 0.040214477211796246, 'recall': 0.010744985673352435, 'f1': 0.016958733747880157, 'number': 1396} | {'precision': 0.10684931506849316, 'recall': 0.04377104377104377, 'f1': 0.06210191082802548, 'number': 1782}  | {'precision': 0.15598917211820437, 'recall': 0.987152034261242, 'f1': 0.26940683744034283, 'number': 1401}  | {'precision': 0.0, 'recall': 0.0, 'f1': 0.0, 'number': 15} | {'precision': 0.0, 'recall': 0.0, 'f1': 0.0, 'number': 1093} | 0.1481            | 0.2595         | 0.1886     | 0.1706           |
+| 4.0783        | 0.38  | 2000  | 3.8413          | {'precision': 0.038560411311053984, 'recall': 0.010744985673352435, 'f1': 0.01680672268907563, 'number': 1396}  | {'precision': 0.10653409090909091, 'recall': 0.04208754208754209, 'f1': 0.06033789219629928, 'number': 1782}  | {'precision': 0.15589396503102088, 'recall': 0.9864382583868665, 'f1': 0.2692382622248198, 'number': 1401}  | {'precision': 0.0, 'recall': 0.0, 'f1': 0.0, 'number': 15} | {'precision': 0.0, 'recall': 0.0, 'f1': 0.0, 'number': 1093} | 0.1478            | 0.2588         | 0.1882     | 0.1701           |
+| 3.6055        | 0.57  | 3000  | 3.3592          | {'precision': 0.038461538461538464, 'recall': 0.012177650429799427, 'f1': 0.018498367791077257, 'number': 1396} | {'precision': 0.10407876230661041, 'recall': 0.04152637485970819, 'f1': 0.05936622543120738, 'number': 1782}  | {'precision': 0.1565937181086291, 'recall': 0.9857244825124911, 'f1': 0.2702544031311155, 'number': 1401}   | {'precision': 0.0, 'recall': 0.0, 'f1': 0.0, 'number': 15} | {'precision': 0.0, 'recall': 0.0, 'f1': 0.0, 'number': 1093} | 0.1476            | 0.2588         | 0.1880     | 0.1708           |
+| 3.2433        | 0.76  | 4000  | 3.0284          | {'precision': 0.03762376237623762, 'recall': 0.013610315186246419, 'f1': 0.019989479221462388, 'number': 1396}  | {'precision': 0.10084033613445378, 'recall': 0.04040404040404041, 'f1': 0.057692307692307696, 'number': 1782} | {'precision': 0.1578404401650619, 'recall': 0.9828693790149893, 'f1': 0.272, 'number': 1401}                | {'precision': 0.0, 'recall': 0.0, 'f1': 0.0, 'number': 15} | {'precision': 0.0, 'recall': 0.0, 'f1': 0.0, 'number': 1093} | 0.1476            | 0.2581         | 0.1878     | 0.1722           |
+| 2.8283        | 0.95  | 5000  | 2.7775          | {'precision': 0.034545454545454546, 'recall': 0.013610315186246419, 'f1': 0.019527235354573486, 'number': 1396} | {'precision': 0.10086455331412104, 'recall': 0.03928170594837262, 'f1': 0.05654281098546042, 'number': 1782}  | {'precision': 0.1570031832651205, 'recall': 0.9857244825124911, 'f1': 0.2708639796018437, 'number': 1401}   | {'precision': 0.0, 'recall': 0.0, 'f1': 0.0, 'number': 15} | {'precision': 0.0, 'recall': 0.0, 'f1': 0.0, 'number': 1093} | 0.1464            | 0.2585         | 0.1869     | 0.1707           |
+| 2.5028        | 1.14  | 6000  | 2.4982          | {'precision': 0.03616636528028933, 'recall': 0.014326647564469915, 'f1': 0.02052334530528476, 'number': 1396}   | {'precision': 0.10099573257467995, 'recall': 0.03984287317620651, 'f1': 0.057142857142857134, 'number': 1782} | {'precision': 0.157134735645253, 'recall': 0.9864382583868665, 'f1': 0.2710867006669282, 'number': 1401}    | {'precision': 0.0, 'recall': 0.0, 'f1': 0.0, 'number': 15} | {'precision': 0.0, 'recall': 0.0, 'f1': 0.0, 'number': 1093} | 0.1466            | 0.2590         | 0.1872     | 0.1716           |
+| 2.3731        | 1.33  | 7000  | 2.3250          | {'precision': 0.037698412698412696, 'recall': 0.013610315186246419, 'f1': 0.02, 'number': 1396}                 | {'precision': 0.09957924263674614, 'recall': 0.03984287317620651, 'f1': 0.05691382765531061, 'number': 1782}  | {'precision': 0.15701254275940707, 'recall': 0.9828693790149893, 'f1': 0.27076983580768854, 'number': 1401} | {'precision': 0.0, 'recall': 0.0, 'f1': 0.0, 'number': 15} | {'precision': 0.0, 'recall': 0.0, 'f1': 0.0, 'number': 1093} | 0.1469            | 0.2580         | 0.1872     | 0.1711           |
+| 2.1459        | 1.52  | 8000  | 2.1464          | {'precision': 0.04007285974499089, 'recall': 0.015759312320916905, 'f1': 0.02262210796915167, 'number': 1396}   | {'precision': 0.10235131396957123, 'recall': 0.04152637485970819, 'f1': 0.0590818363273453, 'number': 1782}   | {'precision': 0.15672235481304694, 'recall': 0.9842969307637401, 'f1': 0.2703921568627451, 'number': 1401}  | {'precision': 0.0, 'recall': 0.0, 'f1': 0.0, 'number': 15} | {'precision': 0.0, 'recall': 0.0, 'f1': 0.0, 'number': 1093} | 0.1465            | 0.2594         | 0.1872     | 0.1714           |
+| 1.9918        | 1.71  | 9000  | 1.9713          | {'precision': 0.04070796460176991, 'recall': 0.0164756446991404, 'f1': 0.023457419683834777, 'number': 1396}    | {'precision': 0.09900990099009901, 'recall': 0.03928170594837262, 'f1': 0.05624748895138609, 'number': 1782}  | {'precision': 0.15779205875602478, 'recall': 0.9814418272662384, 'f1': 0.2718734552644587, 'number': 1401}  | {'precision': 0.0, 'recall': 0.0, 'f1': 0.0, 'number': 15} | {'precision': 0.0, 'recall': 0.0, 'f1': 0.0, 'number': 1093} | 0.1470            | 0.2581         | 0.1873     | 0.1728           |
+| 1.954         | 1.9   | 10000 | 1.8380          | {'precision': 0.04, 'recall': 0.0164756446991404, 'f1': 0.02333840690005073, 'number': 1396}                    | {'precision': 0.10164835164835165, 'recall': 0.04152637485970819, 'f1': 0.058964143426294816, 'number': 1782} | {'precision': 0.1576777739608382, 'recall': 0.9828693790149893, 'f1': 0.27175843694493784, 'number': 1401}  | {'precision': 0.0, 'recall': 0.0, 'f1': 0.0, 'number': 15} | {'precision': 0.0, 'recall': 0.0, 'f1': 0.0, 'number': 1093} | 0.1469            | 0.2592         | 0.1875     | 0.1726           |
+| 1.6977        | 2.09  | 11000 | 1.7403          | {'precision': 0.04013377926421405, 'recall': 0.017191977077363897, 'f1': 0.02407221664994985, 'number': 1396}   | {'precision': 0.10339943342776203, 'recall': 0.0409652076318743, 'f1': 0.058681672025723476, 'number': 1782}  | {'precision': 0.15731749114589283, 'recall': 0.9828693790149893, 'f1': 0.27122316328540474, 'number': 1401} | {'precision': 0.0, 'recall': 0.0, 'f1': 0.0, 'number': 15} | {'precision': 0.0, 'recall': 0.0, 'f1': 0.0, 'number': 1093} | 0.1466            | 0.2592         | 0.1872     | 0.1715           |
+| 1.5499        | 2.28  | 12000 | 1.6569          | {'precision': 0.03861788617886179, 'recall': 0.013610315186246419, 'f1': 0.0201271186440678, 'number': 1396}    | {'precision': 0.10152990264255911, 'recall': 0.0409652076318743, 'f1': 0.058376649340263896, 'number': 1782}  | {'precision': 0.15768394553152534, 'recall': 0.9835831548893648, 'f1': 0.27179487179487183, 'number': 1401} | {'precision': 0.0, 'recall': 0.0, 'f1': 0.0, 'number': 15} | {'precision': 0.0, 'recall': 0.0, 'f1': 0.0, 'number': 1093} | 0.1477            | 0.2585         | 0.1880     | 0.1733           |
+| 1.5793        | 2.47  | 13000 | 1.5988          | {'precision': 0.033582089552238806, 'recall': 0.012893982808022923, 'f1': 0.018633540372670808, 'number': 1396} | {'precision': 0.10198300283286119, 'recall': 0.04040404040404041, 'f1': 0.057877813504823156, 'number': 1782} | {'precision': 0.1576962632841961, 'recall': 0.9850107066381156, 'f1': 0.27186761229314416, 'number': 1401}  | {'precision': 0.0, 'recall': 0.0, 'f1': 0.0, 'number': 15} | {'precision': 0.0, 'recall': 0.0, 'f1': 0.0, 'number': 1093} | 0.1471            | 0.2585         | 0.1875     | 0.1736           |
+| 1.405         | 2.66  | 14000 | 1.5497          | {'precision': 0.03512396694214876, 'recall': 0.012177650429799427, 'f1': 0.018085106382978725, 'number': 1396}  | {'precision': 0.10198300283286119, 'recall': 0.04040404040404041, 'f1': 0.057877813504823156, 'number': 1782} | {'precision': 0.15643407340280924, 'recall': 0.9857244825124911, 'f1': 0.2700166194153876, 'number': 1401}  | {'precision': 0.0, 'recall': 0.0, 'f1': 0.0, 'number': 15} | {'precision': 0.0, 'recall': 0.0, 'f1': 0.0, 'number': 1093} | 0.1467            | 0.2585         | 0.1872     | 0.1713           |
+| 1.4509        | 2.85  | 15000 | 1.5233          | {'precision': 0.03985507246376811, 'recall': 0.015759312320916905, 'f1': 0.022587268993839834, 'number': 1396}  | {'precision': 0.10198300283286119, 'recall': 0.04040404040404041, 'f1': 0.057877813504823156, 'number': 1782} | {'precision': 0.1578525641025641, 'recall': 0.9842969307637401, 'f1': 0.2720726053072901, 'number': 1401}   | {'precision': 0.0, 'recall': 0.0, 'f1': 0.0, 'number': 15} | {'precision': 0.0, 'recall': 0.0, 'f1': 0.0, 'number': 1093} | 0.1474            | 0.2590         | 0.1879     | 0.1727           |
+### Framework versions
+- Transformers 4.34.0
+- Pytorch 2.0.1+cu118
+- Datasets 2.14.5
+- Tokenizers 0.14.1

added_tokens.json ADDED Viewed

	@@ -0,0 +1,7 @@

+{
+  "[CLS]": 101,
+  "[MASK]": 103,
+  "[PAD]": 0,
+  "[SEP]": 102,
+  "[UNK]": 100
+}

all_results.json ADDED Viewed

	@@ -0,0 +1,41 @@

+{
+    "epoch": 3.0,
+    "eval_COMMENT": {
+        "f1": 0.022592032274331823,
+        "number": 7269,
+        "precision": 0.042328042328042326,
+        "recall": 0.015407896546980328
+    },
+    "eval_NAME": {
+        "f1": 0.049829018075232046,
+        "number": 9279,
+        "precision": 0.1018981018981019,
+        "recall": 0.03297769156159069
+    },
+    "eval_QTY": {
+        "f1": 0.27028903423831624,
+        "number": 7515,
+        "precision": 0.15665304220758594,
+        "recall": 0.9842980705256155
+    },
+    "eval_RANGE_END": {
+        "f1": 0.0,
+        "number": 90,
+        "precision": 0.0,
+        "recall": 0.0
+    },
+    "eval_UNIT": {
+        "f1": 0.00032959789057350036,
+        "number": 6066,
+        "precision": 0.5,
+        "recall": 0.00016485328058028355
+    },
+    "eval_loss": 1.6098747253417969,
+    "eval_overall_accuracy": 0.17205696773030468,
+    "eval_overall_f1": 0.1881356136191313,
+    "eval_overall_precision": 0.14783431057310384,
+    "eval_overall_recall": 0.25864522320394456,
+    "eval_runtime": 13.1011,
+    "eval_samples_per_second": 683.452,
+    "eval_steps_per_second": 21.372
+}

config.json ADDED Viewed

	@@ -0,0 +1,51 @@

+{
+  "_name_or_path": "napsternxg/gte-small-L3-ingredient-v2",
+  "architectures": [
+    "PretrainedCRFModel"
+  ],
+  "attention_probs_dropout_prob": 0.1,
+  "classifier_dropout": null,
+  "hidden_act": "gelu",
+  "hidden_dropout_prob": 0.1,
+  "hidden_size": 384,
+  "id2label": {
+    "0": "O",
+    "1": "B-COMMENT",
+    "2": "I-COMMENT",
+    "3": "B-NAME",
+    "4": "I-NAME",
+    "5": "B-RANGE_END",
+    "6": "I-RANGE_END",
+    "7": "B-QTY",
+    "8": "I-QTY",
+    "9": "B-UNIT",
+    "10": "I-UNIT"
+  },
+  "initializer_range": 0.02,
+  "intermediate_size": 1536,
+  "label2id": {
+    "B-COMMENT": 1,
+    "B-NAME": 3,
+    "B-QTY": 7,
+    "B-RANGE_END": 5,
+    "B-UNIT": 9,
+    "I-COMMENT": 2,
+    "I-NAME": 4,
+    "I-QTY": 8,
+    "I-RANGE_END": 6,
+    "I-UNIT": 10,
+    "O": 0
+  },
+  "layer_norm_eps": 1e-12,
+  "max_position_embeddings": 512,
+  "model_type": "bert",
+  "num_attention_heads": 12,
+  "num_hidden_layers": 3,
+  "pad_token_id": 0,
+  "position_embedding_type": "absolute",
+  "torch_dtype": "float32",
+  "transformers_version": "4.34.0",
+  "type_vocab_size": 2,
+  "use_cache": true,
+  "vocab_size": 30522
+}

pytorch_model.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:a39bba0dcf8bd261a2deee2815a6746567d9daeca9426ae6e4f9202475e2b6dc
+size 69005087

special_tokens_map.json ADDED Viewed

	@@ -0,0 +1,7 @@

+{
+  "cls_token": "[CLS]",
+  "mask_token": "[MASK]",
+  "pad_token": "[PAD]",
+  "sep_token": "[SEP]",
+  "unk_token": "[UNK]"
+}

test_results.json ADDED Viewed

	@@ -0,0 +1,41 @@

+{
+    "epoch": 3.0,
+    "eval_COMMENT": {
+        "f1": 0.022592032274331823,
+        "number": 7269,
+        "precision": 0.042328042328042326,
+        "recall": 0.015407896546980328
+    },
+    "eval_NAME": {
+        "f1": 0.049829018075232046,
+        "number": 9279,
+        "precision": 0.1018981018981019,
+        "recall": 0.03297769156159069
+    },
+    "eval_QTY": {
+        "f1": 0.27028903423831624,
+        "number": 7515,
+        "precision": 0.15665304220758594,
+        "recall": 0.9842980705256155
+    },
+    "eval_RANGE_END": {
+        "f1": 0.0,
+        "number": 90,
+        "precision": 0.0,
+        "recall": 0.0
+    },
+    "eval_UNIT": {
+        "f1": 0.00032959789057350036,
+        "number": 6066,
+        "precision": 0.5,
+        "recall": 0.00016485328058028355
+    },
+    "eval_loss": 1.6098747253417969,
+    "eval_overall_accuracy": 0.17205696773030468,
+    "eval_overall_f1": 0.1881356136191313,
+    "eval_overall_precision": 0.14783431057310384,
+    "eval_overall_recall": 0.25864522320394456,
+    "eval_runtime": 13.1011,
+    "eval_samples_per_second": 683.452,
+    "eval_steps_per_second": 21.372
+}

tokenizer.json ADDED Viewed

The diff for this file is too large to render. See raw diff

tokenizer_config.json ADDED Viewed

	@@ -0,0 +1,65 @@

+{
+  "added_tokens_decoder": {
+    "0": {
+      "content": "[PAD]",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "100": {
+      "content": "[UNK]",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "101": {
+      "content": "[CLS]",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "102": {
+      "content": "[SEP]",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "103": {
+      "content": "[MASK]",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    }
+  },
+  "additional_special_tokens": [],
+  "clean_up_tokenization_spaces": true,
+  "cls_token": "[CLS]",
+  "do_basic_tokenize": true,
+  "do_lower_case": true,
+  "mask_token": "[MASK]",
+  "max_length": 128,
+  "model_max_length": 1000000000000000019884624838656,
+  "never_split": null,
+  "pad_to_multiple_of": null,
+  "pad_token": "[PAD]",
+  "pad_token_type_id": 0,
+  "padding_side": "right",
+  "sep_token": "[SEP]",
+  "stride": 0,
+  "strip_accents": null,
+  "tokenize_chinese_chars": true,
+  "tokenizer_class": "BertTokenizer",
+  "truncation_side": "right",
+  "truncation_strategy": "longest_first",
+  "unk_token": "[UNK]"
+}

train_results.json ADDED Viewed

	@@ -0,0 +1,41 @@

+{
+    "epoch": 3.0,
+    "eval_COMMENT": {
+        "f1": 0.02639274279615795,
+        "number": 135123,
+        "precision": 0.04730569849073206,
+        "recall": 0.018301843505546797
+    },
+    "eval_NAME": {
+        "f1": 0.05007133958937708,
+        "number": 174739,
+        "precision": 0.10144978165938864,
+        "recall": 0.033238143745815185
+    },
+    "eval_QTY": {
+        "f1": 0.27320922349688087,
+        "number": 141548,
+        "precision": 0.15865637377387948,
+        "recall": 0.9828326786673072
+    },
+    "eval_RANGE_END": {
+        "f1": 0.0,
+        "number": 1759,
+        "precision": 0.0,
+        "recall": 0.0
+    },
+    "eval_UNIT": {
+        "f1": 0.0003348076618090187,
+        "number": 113394,
+        "precision": 0.18269230769230768,
+        "recall": 0.00016755736635095333
+    },
+    "eval_loss": 1.2795538902282715,
+    "eval_overall_accuracy": 0.17505487764888336,
+    "eval_overall_f1": 0.18984382294138288,
+    "eval_overall_precision": 0.1494381042938442,
+    "eval_overall_recall": 0.260197012512289,
+    "eval_runtime": 205.4105,
+    "eval_samples_per_second": 819.856,
+    "eval_steps_per_second": 25.622
+}

trainer_state.json ADDED Viewed

	@@ -0,0 +1,844 @@

+{
+  "best_metric": null,
+  "best_model_checkpoint": null,
+  "epoch": 3.0,
+  "eval_steps": 1000,
+  "global_step": 15789,
+  "is_hyper_param_search": false,
+  "is_local_process_zero": true,
+  "is_world_process_zero": true,
+  "log_history": [
+    {
+      "epoch": 0.1,
+      "learning_rate": 4.8416619165241625e-05,
+      "loss": 8.4421,
+      "step": 500
+    },
+    {
+      "epoch": 0.19,
+      "learning_rate": 4.683323833048325e-05,
+      "loss": 5.3925,
+      "step": 1000
+    },
+    {
+      "epoch": 0.19,
+      "eval_COMMENT": {
+        "f1": 0.016958733747880157,
+        "number": 1396,
+        "precision": 0.040214477211796246,
+        "recall": 0.010744985673352435
+      },
+      "eval_NAME": {
+        "f1": 0.06210191082802548,
+        "number": 1782,
+        "precision": 0.10684931506849316,
+        "recall": 0.04377104377104377
+      },
+      "eval_QTY": {
+        "f1": 0.26940683744034283,
+        "number": 1401,
+        "precision": 0.15598917211820437,
+        "recall": 0.987152034261242
+      },
+      "eval_RANGE_END": {
+        "f1": 0.0,
+        "number": 15,
+        "precision": 0.0,
+        "recall": 0.0
+      },
+      "eval_UNIT": {
+        "f1": 0.0,
+        "number": 1093,
+        "precision": 0.0,
+        "recall": 0.0
+      },
+      "eval_loss": 4.734821796417236,
+      "eval_overall_accuracy": 0.17059665871121718,
+      "eval_overall_f1": 0.1885539090444558,
+      "eval_overall_precision": 0.14805898284682517,
+      "eval_overall_recall": 0.25953930015825566,
+      "eval_runtime": 2.992,
+      "eval_samples_per_second": 568.847,
+      "eval_steps_per_second": 18.048,
+      "step": 1000
+    },
+    {
+      "epoch": 0.29,
+      "learning_rate": 4.524985749572487e-05,
+      "loss": 4.7949,
+      "step": 1500
+    },
+    {
+      "epoch": 0.38,
+      "learning_rate": 4.36664766609665e-05,
+      "loss": 4.0783,
+      "step": 2000
+    },
+    {
+      "epoch": 0.38,
+      "eval_COMMENT": {
+        "f1": 0.01680672268907563,
+        "number": 1396,
+        "precision": 0.038560411311053984,
+        "recall": 0.010744985673352435
+      },
+      "eval_NAME": {
+        "f1": 0.06033789219629928,
+        "number": 1782,
+        "precision": 0.10653409090909091,
+        "recall": 0.04208754208754209
+      },
+      "eval_QTY": {
+        "f1": 0.2692382622248198,
+        "number": 1401,
+        "precision": 0.15589396503102088,
+        "recall": 0.9864382583868665
+      },
+      "eval_RANGE_END": {
+        "f1": 0.0,
+        "number": 15,
+        "precision": 0.0,
+        "recall": 0.0
+      },
+      "eval_UNIT": {
+        "f1": 0.0,
+        "number": 1093,
+        "precision": 0.0,
+        "recall": 0.0
+      },
+      "eval_loss": 3.8412649631500244,
+      "eval_overall_accuracy": 0.17011933174224345,
+      "eval_overall_f1": 0.1881751358261425,
+      "eval_overall_precision": 0.14782084755975095,
+      "eval_overall_recall": 0.2588359416212414,
+      "eval_runtime": 2.449,
+      "eval_samples_per_second": 694.983,
+      "eval_steps_per_second": 22.05,
+      "step": 2000
+    },
+    {
+      "epoch": 0.48,
+      "learning_rate": 4.2083095826208124e-05,
+      "loss": 3.7302,
+      "step": 2500
+    },
+    {
+      "epoch": 0.57,
+      "learning_rate": 4.049971499144975e-05,
+      "loss": 3.6055,
+      "step": 3000
+    },
+    {
+      "epoch": 0.57,
+      "eval_COMMENT": {
+        "f1": 0.018498367791077257,
+        "number": 1396,
+        "precision": 0.038461538461538464,
+        "recall": 0.012177650429799427
+      },
+      "eval_NAME": {
+        "f1": 0.05936622543120738,
+        "number": 1782,
+        "precision": 0.10407876230661041,
+        "recall": 0.04152637485970819
+      },
+      "eval_QTY": {
+        "f1": 0.2702544031311155,
+        "number": 1401,
+        "precision": 0.1565937181086291,
+        "recall": 0.9857244825124911
+      },
+      "eval_RANGE_END": {
+        "f1": 0.0,
+        "number": 15,
+        "precision": 0.0,
+        "recall": 0.0
+      },
+      "eval_UNIT": {
+        "f1": 0.0,
+        "number": 1093,
+        "precision": 0.0,
+        "recall": 0.0
+      },
+      "eval_loss": 3.3591551780700684,
+      "eval_overall_accuracy": 0.17078758949880668,
+      "eval_overall_f1": 0.1880068969921451,
+      "eval_overall_precision": 0.14761331728840754,
+      "eval_overall_recall": 0.2588359416212414,
+      "eval_runtime": 3.2795,
+      "eval_samples_per_second": 518.989,
+      "eval_steps_per_second": 16.466,
+      "step": 3000
+    },
+    {
+      "epoch": 0.67,
+      "learning_rate": 3.891633415669137e-05,
+      "loss": 3.4413,
+      "step": 3500
+    },
+    {
+      "epoch": 0.76,
+      "learning_rate": 3.733295332193299e-05,
+      "loss": 3.2433,
+      "step": 4000
+    },
+    {
+      "epoch": 0.76,
+      "eval_COMMENT": {
+        "f1": 0.019989479221462388,
+        "number": 1396,
+        "precision": 0.03762376237623762,
+        "recall": 0.013610315186246419
+      },
+      "eval_NAME": {
+        "f1": 0.057692307692307696,
+        "number": 1782,
+        "precision": 0.10084033613445378,
+        "recall": 0.04040404040404041
+      },
+      "eval_QTY": {
+        "f1": 0.272,
+        "number": 1401,
+        "precision": 0.1578404401650619,
+        "recall": 0.9828693790149893
+      },
+      "eval_RANGE_END": {
+        "f1": 0.0,
+        "number": 15,
+        "precision": 0.0,
+        "recall": 0.0
+      },
+      "eval_UNIT": {
+        "f1": 0.0,
+        "number": 1093,
+        "precision": 0.0,
+        "recall": 0.0
+      },
+      "eval_loss": 3.0283868312835693,
+      "eval_overall_accuracy": 0.1722195704057279,
+      "eval_overall_f1": 0.18784388995521434,
+      "eval_overall_precision": 0.14764155687418284,
+      "eval_overall_recall": 0.2581325830842272,
+      "eval_runtime": 2.572,
+      "eval_samples_per_second": 661.731,
+      "eval_steps_per_second": 20.995,
+      "step": 4000
+    },
+    {
+      "epoch": 0.86,
+      "learning_rate": 3.5749572487174616e-05,
+      "loss": 2.9769,
+      "step": 4500
+    },
+    {
+      "epoch": 0.95,
+      "learning_rate": 3.416619165241624e-05,
+      "loss": 2.8283,
+      "step": 5000
+    },
+    {
+      "epoch": 0.95,
+      "eval_COMMENT": {
+        "f1": 0.019527235354573486,
+        "number": 1396,
+        "precision": 0.034545454545454546,
+        "recall": 0.013610315186246419
+      },
+      "eval_NAME": {
+        "f1": 0.05654281098546042,
+        "number": 1782,
+        "precision": 0.10086455331412104,
+        "recall": 0.03928170594837262
+      },
+      "eval_QTY": {
+        "f1": 0.2708639796018437,
+        "number": 1401,
+        "precision": 0.1570031832651205,
+        "recall": 0.9857244825124911
+      },
+      "eval_RANGE_END": {
+        "f1": 0.0,
+        "number": 15,
+        "precision": 0.0,
+        "recall": 0.0
+      },
+      "eval_UNIT": {
+        "f1": 0.0,
+        "number": 1093,
+        "precision": 0.0,
+        "recall": 0.0
+      },
+      "eval_loss": 2.7775347232818604,
+      "eval_overall_accuracy": 0.17069212410501194,
+      "eval_overall_f1": 0.186939657913143,
+      "eval_overall_precision": 0.14641434262948208,
+      "eval_overall_recall": 0.2584842623527343,
+      "eval_runtime": 2.5326,
+      "eval_samples_per_second": 672.042,
+      "eval_steps_per_second": 21.322,
+      "step": 5000
+    },
+    {
+      "epoch": 1.05,
+      "learning_rate": 3.258281081765787e-05,
+      "loss": 2.845,
+      "step": 5500
+    },
+    {
+      "epoch": 1.14,
+      "learning_rate": 3.0999429982899484e-05,
+      "loss": 2.5028,
+      "step": 6000
+    },
+    {
+      "epoch": 1.14,
+      "eval_COMMENT": {
+        "f1": 0.02052334530528476,
+        "number": 1396,
+        "precision": 0.03616636528028933,
+        "recall": 0.014326647564469915
+      },
+      "eval_NAME": {
+        "f1": 0.057142857142857134,
+        "number": 1782,
+        "precision": 0.10099573257467995,
+        "recall": 0.03984287317620651
+      },
+      "eval_QTY": {
+        "f1": 0.2710867006669282,
+        "number": 1401,
+        "precision": 0.157134735645253,
+        "recall": 0.9864382583868665
+      },
+      "eval_RANGE_END": {
+        "f1": 0.0,
+        "number": 15,
+        "precision": 0.0,
+        "recall": 0.0
+      },
+      "eval_UNIT": {
+        "f1": 0.0,
+        "number": 1093,
+        "precision": 0.0,
+        "recall": 0.0
+      },
+      "eval_loss": 2.49822735786438,
+      "eval_overall_accuracy": 0.17155131264916468,
+      "eval_overall_f1": 0.18719024018299657,
+      "eval_overall_precision": 0.14655258183265346,
+      "eval_overall_recall": 0.259011781255495,
+      "eval_runtime": 4.0514,
+      "eval_samples_per_second": 420.1,
+      "eval_steps_per_second": 13.329,
+      "step": 6000
+    },
+    {
+      "epoch": 1.24,
+      "learning_rate": 2.941604914814111e-05,
+      "loss": 2.515,
+      "step": 6500
+    },
+    {
+      "epoch": 1.33,
+      "learning_rate": 2.7832668313382737e-05,
+      "loss": 2.3731,
+      "step": 7000
+    },
+    {
+      "epoch": 1.33,
+      "eval_COMMENT": {
+        "f1": 0.02,
+        "number": 1396,
+        "precision": 0.037698412698412696,
+        "recall": 0.013610315186246419
+      },
+      "eval_NAME": {
+        "f1": 0.05691382765531061,
+        "number": 1782,
+        "precision": 0.09957924263674614,
+        "recall": 0.03984287317620651
+      },
+      "eval_QTY": {
+        "f1": 0.27076983580768854,
+        "number": 1401,
+        "precision": 0.15701254275940707,
+        "recall": 0.9828693790149893
+      },
+      "eval_RANGE_END": {
+        "f1": 0.0,
+        "number": 15,
+        "precision": 0.0,
+        "recall": 0.0
+      },
+      "eval_UNIT": {
+        "f1": 0.0,
+        "number": 1093,
+        "precision": 0.0,
+        "recall": 0.0
+      },
+      "eval_loss": 2.3250303268432617,
+      "eval_overall_accuracy": 0.17107398568019094,
+      "eval_overall_f1": 0.18718897537322954,
+      "eval_overall_precision": 0.14689095824571943,
+      "eval_overall_recall": 0.2579567434499736,
+      "eval_runtime": 2.5162,
+      "eval_samples_per_second": 676.415,
+      "eval_steps_per_second": 21.461,
+      "step": 7000
+    },
+    {
+      "epoch": 1.43,
+      "learning_rate": 2.6249287478624363e-05,
+      "loss": 2.3351,
+      "step": 7500
+    },
+    {
+      "epoch": 1.52,
+      "learning_rate": 2.4665906643865983e-05,
+      "loss": 2.1459,
+      "step": 8000
+    },
+    {
+      "epoch": 1.52,
+      "eval_COMMENT": {
+        "f1": 0.02262210796915167,
+        "number": 1396,
+        "precision": 0.04007285974499089,
+        "recall": 0.015759312320916905
+      },
+      "eval_NAME": {
+        "f1": 0.0590818363273453,
+        "number": 1782,
+        "precision": 0.10235131396957123,
+        "recall": 0.04152637485970819
+      },
+      "eval_QTY": {
+        "f1": 0.2703921568627451,
+        "number": 1401,
+        "precision": 0.15672235481304694,
+        "recall": 0.9842969307637401
+      },
+      "eval_RANGE_END": {
+        "f1": 0.0,
+        "number": 15,
+        "precision": 0.0,
+        "recall": 0.0
+      },
+      "eval_UNIT": {
+        "f1": 0.0,
+        "number": 1093,
+        "precision": 0.0,
+        "recall": 0.0
+      },
+      "eval_loss": 2.1463518142700195,
+      "eval_overall_accuracy": 0.17136038186157518,
+      "eval_overall_f1": 0.1872064982865846,
+      "eval_overall_precision": 0.1464601330553073,
+      "eval_overall_recall": 0.2593634605240021,
+      "eval_runtime": 3.7102,
+      "eval_samples_per_second": 458.735,
+      "eval_steps_per_second": 14.554,
+      "step": 8000
+    },
+    {
+      "epoch": 1.62,
+      "learning_rate": 2.308252580910761e-05,
+      "loss": 2.0879,
+      "step": 8500
+    },
+    {
+      "epoch": 1.71,
+      "learning_rate": 2.1499144974349232e-05,
+      "loss": 1.9918,
+      "step": 9000
+    },
+    {
+      "epoch": 1.71,
+      "eval_COMMENT": {
+        "f1": 0.023457419683834777,
+        "number": 1396,
+        "precision": 0.04070796460176991,
+        "recall": 0.0164756446991404
+      },
+      "eval_NAME": {
+        "f1": 0.05624748895138609,
+        "number": 1782,
+        "precision": 0.09900990099009901,
+        "recall": 0.03928170594837262
+      },
+      "eval_QTY": {
+        "f1": 0.2718734552644587,
+        "number": 1401,
+        "precision": 0.15779205875602478,
+        "recall": 0.9814418272662384
+      },
+      "eval_RANGE_END": {
+        "f1": 0.0,
+        "number": 15,
+        "precision": 0.0,
+        "recall": 0.0
+      },
+      "eval_UNIT": {
+        "f1": 0.0,
+        "number": 1093,
+        "precision": 0.0,
+        "recall": 0.0
+      },
+      "eval_loss": 1.9712719917297363,
+      "eval_overall_accuracy": 0.1727923627684964,
+      "eval_overall_f1": 0.18732852676577555,
+      "eval_overall_precision": 0.14700580813138395,
+      "eval_overall_recall": 0.2581325830842272,
+      "eval_runtime": 2.4728,
+      "eval_samples_per_second": 688.282,
+      "eval_steps_per_second": 21.837,
+      "step": 9000
+    },
+    {
+      "epoch": 1.81,
+      "learning_rate": 1.9915764139590855e-05,
+      "loss": 1.8722,
+      "step": 9500
+    },
+    {
+      "epoch": 1.9,
+      "learning_rate": 1.8332383304832478e-05,
+      "loss": 1.954,
+      "step": 10000
+    },
+    {
+      "epoch": 1.9,
+      "eval_COMMENT": {
+        "f1": 0.02333840690005073,
+        "number": 1396,
+        "precision": 0.04,
+        "recall": 0.0164756446991404
+      },
+      "eval_NAME": {
+        "f1": 0.058964143426294816,
+        "number": 1782,
+        "precision": 0.10164835164835165,
+        "recall": 0.04152637485970819
+      },
+      "eval_QTY": {
+        "f1": 0.27175843694493784,
+        "number": 1401,
+        "precision": 0.1576777739608382,
+        "recall": 0.9828693790149893
+      },
+      "eval_RANGE_END": {
+        "f1": 0.0,
+        "number": 15,
+        "precision": 0.0,
+        "recall": 0.0
+      },
+      "eval_UNIT": {
+        "f1": 0.0,
+        "number": 1093,
+        "precision": 0.0,
+        "recall": 0.0
+      },
+      "eval_loss": 1.8380228281021118,
+      "eval_overall_accuracy": 0.1726014319809069,
+      "eval_overall_f1": 0.18749602493162884,
+      "eval_overall_precision": 0.14687126345157434,
+      "eval_overall_recall": 0.25918762088974856,
+      "eval_runtime": 3.3595,
+      "eval_samples_per_second": 506.628,
+      "eval_steps_per_second": 16.074,
+      "step": 10000
+    },
+    {
+      "epoch": 2.0,
+      "learning_rate": 1.6749002470074104e-05,
+      "loss": 1.8542,
+      "step": 10500
+    },
+    {
+      "epoch": 2.09,
+      "learning_rate": 1.5165621635315727e-05,
+      "loss": 1.6977,
+      "step": 11000
+    },
+    {
+      "epoch": 2.09,
+      "eval_COMMENT": {
+        "f1": 0.02407221664994985,
+        "number": 1396,
+        "precision": 0.04013377926421405,
+        "recall": 0.017191977077363897
+      },
+      "eval_NAME": {
+        "f1": 0.058681672025723476,
+        "number": 1782,
+        "precision": 0.10339943342776203,
+        "recall": 0.0409652076318743
+      },
+      "eval_QTY": {
+        "f1": 0.27122316328540474,
+        "number": 1401,
+        "precision": 0.15731749114589283,
+        "recall": 0.9828693790149893
+      },
+      "eval_RANGE_END": {
+        "f1": 0.0,
+        "number": 15,
+        "precision": 0.0,
+        "recall": 0.0
+      },
+      "eval_UNIT": {
+        "f1": 0.0,
+        "number": 1093,
+        "precision": 0.0,
+        "recall": 0.0
+      },
+      "eval_loss": 1.7402697801589966,
+      "eval_overall_accuracy": 0.17145584725536994,
+      "eval_overall_f1": 0.18724593495934957,
+      "eval_overall_precision": 0.14656458188326538,
+      "eval_overall_recall": 0.25918762088974856,
+      "eval_runtime": 3.1606,
+      "eval_samples_per_second": 538.504,
+      "eval_steps_per_second": 17.085,
+      "step": 11000
+    },
+    {
+      "epoch": 2.19,
+      "learning_rate": 1.358224080055735e-05,
+      "loss": 1.568,
+      "step": 11500
+    },
+    {
+      "epoch": 2.28,
+      "learning_rate": 1.1998859965798973e-05,
+      "loss": 1.5499,
+      "step": 12000
+    },
+    {
+      "epoch": 2.28,
+      "eval_COMMENT": {
+        "f1": 0.0201271186440678,
+        "number": 1396,
+        "precision": 0.03861788617886179,
+        "recall": 0.013610315186246419
+      },
+      "eval_NAME": {
+        "f1": 0.058376649340263896,
+        "number": 1782,
+        "precision": 0.10152990264255911,
+        "recall": 0.0409652076318743
+      },
+      "eval_QTY": {
+        "f1": 0.27179487179487183,
+        "number": 1401,
+        "precision": 0.15768394553152534,
+        "recall": 0.9835831548893648
+      },
+      "eval_RANGE_END": {
+        "f1": 0.0,
+        "number": 15,
+        "precision": 0.0,
+        "recall": 0.0
+      },
+      "eval_UNIT": {
+        "f1": 0.0,
+        "number": 1093,
+        "precision": 0.0,
+        "recall": 0.0
+      },
+      "eval_loss": 1.656908392906189,
+      "eval_overall_accuracy": 0.17326968973747017,
+      "eval_overall_f1": 0.1880156040161156,
+      "eval_overall_precision": 0.14773869346733667,
+      "eval_overall_recall": 0.2584842623527343,
+      "eval_runtime": 2.4637,
+      "eval_samples_per_second": 690.825,
+      "eval_steps_per_second": 21.918,
+      "step": 12000
+    },
+    {
+      "epoch": 2.38,
+      "learning_rate": 1.0415479131040598e-05,
+      "loss": 1.6363,
+      "step": 12500
+    },
+    {
+      "epoch": 2.47,
+      "learning_rate": 8.832098296282222e-06,
+      "loss": 1.5793,
+      "step": 13000
+    },
+    {
+      "epoch": 2.47,
+      "eval_COMMENT": {
+        "f1": 0.018633540372670808,
+        "number": 1396,
+        "precision": 0.033582089552238806,
+        "recall": 0.012893982808022923
+      },
+      "eval_NAME": {
+        "f1": 0.057877813504823156,
+        "number": 1782,
+        "precision": 0.10198300283286119,
+        "recall": 0.04040404040404041
+      },
+      "eval_QTY": {
+        "f1": 0.27186761229314416,
+        "number": 1401,
+        "precision": 0.1576962632841961,
+        "recall": 0.9850107066381156
+      },
+      "eval_RANGE_END": {
+        "f1": 0.0,
+        "number": 15,
+        "precision": 0.0,
+        "recall": 0.0
+      },
+      "eval_UNIT": {
+        "f1": 0.0,
+        "number": 1093,
+        "precision": 0.0,
+        "recall": 0.0
+      },
+      "eval_loss": 1.598816156387329,
+      "eval_overall_accuracy": 0.1735560859188544,
+      "eval_overall_f1": 0.18749999999999997,
+      "eval_overall_precision": 0.1471029720804563,
+      "eval_overall_recall": 0.2584842623527343,
+      "eval_runtime": 3.8605,
+      "eval_samples_per_second": 440.877,
+      "eval_steps_per_second": 13.988,
+      "step": 13000
+    },
+    {
+      "epoch": 2.57,
+      "learning_rate": 7.248717461523846e-06,
+      "loss": 1.5645,
+      "step": 13500
+    },
+    {
+      "epoch": 2.66,
+      "learning_rate": 5.66533662676547e-06,
+      "loss": 1.405,
+      "step": 14000
+    },
+    {
+      "epoch": 2.66,
+      "eval_COMMENT": {
+        "f1": 0.018085106382978725,
+        "number": 1396,
+        "precision": 0.03512396694214876,
+        "recall": 0.012177650429799427
+      },
+      "eval_NAME": {
+        "f1": 0.057877813504823156,
+        "number": 1782,
+        "precision": 0.10198300283286119,
+        "recall": 0.04040404040404041
+      },
+      "eval_QTY": {
+        "f1": 0.2700166194153876,
+        "number": 1401,
+        "precision": 0.15643407340280924,
+        "recall": 0.9857244825124911
+      },
+      "eval_RANGE_END": {
+        "f1": 0.0,
+        "number": 15,
+        "precision": 0.0,
+        "recall": 0.0
+      },
+      "eval_UNIT": {
+        "f1": 0.0,
+        "number": 1093,
+        "precision": 0.0,
+        "recall": 0.0
+      },
+      "eval_loss": 1.549748420715332,
+      "eval_overall_accuracy": 0.17126491646778044,
+      "eval_overall_f1": 0.18720152817574023,
+      "eval_overall_precision": 0.14673587542423638,
+      "eval_overall_recall": 0.2584842623527343,
+      "eval_runtime": 2.4896,
+      "eval_samples_per_second": 683.639,
+      "eval_steps_per_second": 21.69,
+      "step": 14000
+    },
+    {
+      "epoch": 2.76,
+      "learning_rate": 4.081955792007094e-06,
+      "loss": 1.4811,
+      "step": 14500
+    },
+    {
+      "epoch": 2.85,
+      "learning_rate": 2.4985749572487175e-06,
+      "loss": 1.4509,
+      "step": 15000
+    },
+    {
+      "epoch": 2.85,
+      "eval_COMMENT": {
+        "f1": 0.022587268993839834,
+        "number": 1396,
+        "precision": 0.03985507246376811,
+        "recall": 0.015759312320916905
+      },
+      "eval_NAME": {
+        "f1": 0.057877813504823156,
+        "number": 1782,
+        "precision": 0.10198300283286119,
+        "recall": 0.04040404040404041
+      },
+      "eval_QTY": {
+        "f1": 0.2720726053072901,
+        "number": 1401,
+        "precision": 0.1578525641025641,
+        "recall": 0.9842969307637401
+      },
+      "eval_RANGE_END": {
+        "f1": 0.0,
+        "number": 15,
+        "precision": 0.0,
+        "recall": 0.0
+      },
+      "eval_UNIT": {
+        "f1": 0.0,
+        "number": 1093,
+        "precision": 0.0,
+        "recall": 0.0
+      },
+      "eval_loss": 1.5232961177825928,
+      "eval_overall_accuracy": 0.17269689737470167,
+      "eval_overall_f1": 0.18787067151329637,
+      "eval_overall_precision": 0.1473884330598359,
+      "eval_overall_recall": 0.259011781255495,
+      "eval_runtime": 3.8156,
+      "eval_samples_per_second": 446.059,
+      "eval_steps_per_second": 14.152,
+      "step": 15000
+    },
+    {
+      "epoch": 2.95,
+      "learning_rate": 9.151941224903414e-07,
+      "loss": 1.4787,
+      "step": 15500
+    },
+    {
+      "epoch": 3.0,
+      "step": 15789,
+      "total_flos": 486353449919844.0,
+      "train_loss": 2.636403929357464,
+      "train_runtime": 881.1788,
+      "train_samples_per_second": 573.347,
+      "train_steps_per_second": 17.918
+    }
+  ],
+  "logging_steps": 500,
+  "max_steps": 15789,
+  "num_train_epochs": 3,
+  "save_steps": 500,
+  "total_flos": 486353449919844.0,
+  "trial_name": null,
+  "trial_params": null
+}

training_args.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:2e5b422e9ca9f0ecedbcc66ba4e6cbb0826f8ad3b2f17ce70a5b6d864ef26cee
+size 4155

validation_results.json ADDED Viewed

	@@ -0,0 +1,41 @@

+{
+    "epoch": 3.0,
+    "eval_COMMENT": {
+        "f1": 0.022587268993839834,
+        "number": 1396,
+        "precision": 0.03985507246376811,
+        "recall": 0.015759312320916905
+    },
+    "eval_NAME": {
+        "f1": 0.057877813504823156,
+        "number": 1782,
+        "precision": 0.10198300283286119,
+        "recall": 0.04040404040404041
+    },
+    "eval_QTY": {
+        "f1": 0.2720726053072901,
+        "number": 1401,
+        "precision": 0.1578525641025641,
+        "recall": 0.9842969307637401
+    },
+    "eval_RANGE_END": {
+        "f1": 0.0,
+        "number": 15,
+        "precision": 0.0,
+        "recall": 0.0
+    },
+    "eval_UNIT": {
+        "f1": 0.0,
+        "number": 1093,
+        "precision": 0.0,
+        "recall": 0.0
+    },
+    "eval_loss": 1.5058764219284058,
+    "eval_overall_accuracy": 0.17269689737470167,
+    "eval_overall_f1": 0.18787067151329637,
+    "eval_overall_precision": 0.1473884330598359,
+    "eval_overall_recall": 0.259011781255495,
+    "eval_runtime": 2.9379,
+    "eval_samples_per_second": 579.318,
+    "eval_steps_per_second": 18.38
+}

vocab.txt ADDED Viewed

The diff for this file is too large to render. See raw diff