Upload 13 files

Browse files

Files changed (13) hide show

README.md +106 -0
all_results.json +39 -0
config.json +46 -0
eval_results.json +34 -0
merges.txt +0 -0
pytorch_model.bin +3 -0
special_tokens_map.json +15 -0
tokenizer.json +0 -0
tokenizer_config.json +15 -0
train_results.json +8 -0
trainer_state.json +1259 -0
training_args.bin +3 -0
vocab.json +0 -0

README.md ADDED Viewed

	@@ -0,0 +1,106 @@

+---
+license: mit
+base_model: roberta-base
+tags:
+- generated_from_trainer
+metrics:
+- accuracy
+- recall
+- f1
+model-index:
+- name: train
+  results: []
+---
+<!-- This model card has been generated automatically according to the information the Trainer had access to. You
+should probably proofread and complete it, then remove this comment. -->
+# train
+This model is a fine-tuned version of [roberta-base](https://huggingface.co/roberta-base) on an unknown dataset.
+It achieves the following results on the evaluation set:
+- Loss: 0.6648
+- Accuracy: 0.7617
+- B Acc: 0.6394
+- Prec: 0.7595
+- Recall: 0.7617
+- F1: 0.7602
+- Prec Joy: 0.7315
+- Recall Joy: 0.7793
+- F1 Joy: 0.7547
+- Prec Anger: 0.6467
+- Recall Anger: 0.6507
+- F1 Anger: 0.6487
+- Prec Disgust: 0.4710
+- Recall Disgust: 0.45
+- F1 Disgust: 0.4603
+- Prec Fear: 0.6963
+- Recall Fear: 0.6409
+- F1 Fear: 0.6675
+- Prec Neutral: 0.8457
+- Recall Neutral: 0.8490
+- F1 Neutral: 0.8474
+- Prec Sadness: 0.7094
+- Recall Sadness: 0.6738
+- F1 Sadness: 0.6911
+- Prec Surprise: 0.5228
+- Recall Surprise: 0.4323
+- F1 Surprise: 0.4732
+## Model description
+More information needed
+## Intended uses & limitations
+More information needed
+## Training and evaluation data
+More information needed
+## Training procedure
+### Training hyperparameters
+The following hyperparameters were used during training:
+- learning_rate: 5e-05
+- train_batch_size: 128
+- eval_batch_size: 128
+- seed: 42
+- optimizer: Adam with betas=(0.9,0.999) and epsilon=1e-08
+- lr_scheduler_type: linear
+- lr_scheduler_warmup_ratio: 0.1
+- num_epochs: 3.0
+### Training results
+| Training Loss | Epoch | Step | Validation Loss | Accuracy | B Acc  | Prec   | Recall | F1     | Prec Joy | Recall Joy | F1 Joy | Prec Anger | Recall Anger | F1 Anger | Prec Disgust | Recall Disgust | F1 Disgust | Prec Fear | Recall Fear | F1 Fear | Prec Neutral | Recall Neutral | F1 Neutral | Prec Sadness | Recall Sadness | F1 Sadness | Prec Surprise | Recall Surprise | F1 Surprise |
+|:-------------:|:-----:|:----:|:---------------:|:--------:|:------:|:------:|:------:|:------:|:--------:|:----------:|:------:|:----------:|:------------:|:--------:|:------------:|:--------------:|:----------:|:---------:|:-----------:|:-------:|:------------:|:--------------:|:----------:|:------------:|:--------------:|:----------:|:-------------:|:---------------:|:-----------:|
+| 0.9538        | 0.15  | 232  | 0.8701          | 0.6961   | 0.4790 | 0.6837 | 0.6961 | 0.6837 | 0.7401   | 0.6381     | 0.6853 | 0.4622     | 0.5391       | 0.4977   | 0.25         | 0.0018         | 0.0035     | 0.5527    | 0.4292      | 0.4832  | 0.7965       | 0.8618         | 0.8279     | 0.5281       | 0.6431         | 0.5800     | 0.3562        | 0.2398          | 0.2866      |
+| 0.7952        | 0.3   | 464  | 0.8010          | 0.7168   | 0.5242 | 0.7098 | 0.7168 | 0.7025 | 0.8084   | 0.5948     | 0.6853 | 0.5732     | 0.4710       | 0.5171   | 0.4713       | 0.2643         | 0.3387     | 0.6156    | 0.5263      | 0.5675  | 0.7405       | 0.9250         | 0.8226     | 0.6858       | 0.5676         | 0.6211     | 0.4448        | 0.3204          | 0.3725      |
+| 0.7528        | 0.45  | 696  | 0.7560          | 0.7261   | 0.5878 | 0.7309 | 0.7261 | 0.7256 | 0.6969   | 0.7646     | 0.7292 | 0.5550     | 0.5534       | 0.5542   | 0.3409       | 0.4821         | 0.3994     | 0.7225    | 0.4842      | 0.5798  | 0.8476       | 0.8159         | 0.8314     | 0.6118       | 0.7027         | 0.6541     | 0.4957        | 0.3118          | 0.3828      |
+| 0.7334        | 0.6   | 928  | 0.7310          | 0.7370   | 0.5868 | 0.7345 | 0.7370 | 0.7283 | 0.7170   | 0.7458     | 0.7311 | 0.7129     | 0.4116       | 0.5219   | 0.3727       | 0.5696         | 0.4506     | 0.6671    | 0.5626      | 0.6104  | 0.7898       | 0.8859         | 0.8351     | 0.7318       | 0.5844         | 0.6499     | 0.5252        | 0.3473          | 0.4181      |
+| 0.7216        | 0.75  | 1160 | 0.7043          | 0.7448   | 0.6009 | 0.7403 | 0.7448 | 0.7389 | 0.7767   | 0.6826     | 0.7266 | 0.6159     | 0.5386       | 0.5746   | 0.5302       | 0.4393         | 0.4805     | 0.8023    | 0.5602      | 0.6598  | 0.7854       | 0.8926         | 0.8356     | 0.7005       | 0.632          | 0.6645     | 0.4815        | 0.4613          | 0.4712      |
+| 0.7259        | 0.9   | 1392 | 0.6962          | 0.7475   | 0.6082 | 0.7433 | 0.7475 | 0.7412 | 0.7355   | 0.7586     | 0.7469 | 0.6758     | 0.4504       | 0.5405   | 0.3908       | 0.5589         | 0.4600     | 0.6939    | 0.6070      | 0.6475  | 0.8122       | 0.8744         | 0.8421     | 0.6830       | 0.6676         | 0.6752     | 0.5494        | 0.3409          | 0.4207      |
+| 0.6362        | 1.05  | 1624 | 0.6771          | 0.7526   | 0.6055 | 0.7472 | 0.7526 | 0.7484 | 0.7392   | 0.7483     | 0.7437 | 0.5873     | 0.6191       | 0.6028   | 0.5302       | 0.3768         | 0.4405     | 0.7388    | 0.5789      | 0.6492  | 0.8213       | 0.8670         | 0.8435     | 0.7090       | 0.6507         | 0.6786     | 0.5301        | 0.3978          | 0.4545      |
+| 0.621         | 1.2   | 1856 | 0.6779          | 0.7528   | 0.6120 | 0.7494 | 0.7528 | 0.7487 | 0.7107   | 0.7828     | 0.7450 | 0.6508     | 0.5913       | 0.6196   | 0.4980       | 0.4518         | 0.4738     | 0.7963    | 0.5532      | 0.6529  | 0.8165       | 0.8590         | 0.8372     | 0.7499       | 0.6236         | 0.6809     | 0.5078        | 0.4226          | 0.4613      |
+| 0.6241        | 1.35  | 2088 | 0.6849          | 0.7513   | 0.6367 | 0.7526 | 0.7513 | 0.7514 | 0.7429   | 0.7592     | 0.7510 | 0.5795     | 0.6531       | 0.6141   | 0.4372       | 0.4661         | 0.4512     | 0.6462    | 0.6515      | 0.6488  | 0.8492       | 0.8372         | 0.8432     | 0.6887       | 0.6609         | 0.6745     | 0.5271        | 0.4290          | 0.4730      |
+| 0.6188        | 1.5   | 2320 | 0.6713          | 0.7579   | 0.6159 | 0.7539 | 0.7579 | 0.7534 | 0.7071   | 0.7971     | 0.7494 | 0.6343     | 0.6267       | 0.6305   | 0.5877       | 0.3768         | 0.4592     | 0.7247    | 0.6281      | 0.6729  | 0.8361       | 0.8496         | 0.8428     | 0.6943       | 0.6693         | 0.6816     | 0.5919        | 0.3634          | 0.4504      |
+| 0.6182        | 1.65  | 2552 | 0.6608          | 0.7601   | 0.6199 | 0.7567 | 0.7601 | 0.7566 | 0.7143   | 0.7891     | 0.7498 | 0.6163     | 0.6358       | 0.6259   | 0.5607       | 0.3875         | 0.4583     | 0.7591    | 0.6082      | 0.6753  | 0.8375       | 0.8578         | 0.8475     | 0.7324       | 0.6436         | 0.6851     | 0.5381        | 0.4172          | 0.4700      |
+| 0.6392        | 1.8   | 2784 | 0.6542          | 0.7624   | 0.6261 | 0.7593 | 0.7624 | 0.7596 | 0.7513   | 0.7584     | 0.7548 | 0.5970     | 0.6708       | 0.6318   | 0.5711       | 0.3875         | 0.4617     | 0.7482    | 0.6152      | 0.6752  | 0.8379       | 0.8635         | 0.8505     | 0.7076       | 0.668          | 0.6872     | 0.5132        | 0.4194          | 0.4615      |
+| 0.6158        | 1.95  | 3016 | 0.6456          | 0.7649   | 0.6279 | 0.7599 | 0.7649 | 0.7614 | 0.7490   | 0.7548     | 0.7519 | 0.6402     | 0.6378       | 0.6390   | 0.5314       | 0.4232         | 0.4712     | 0.7569    | 0.6117      | 0.6766  | 0.8310       | 0.8753         | 0.8526     | 0.7199       | 0.6627         | 0.6901     | 0.5063        | 0.4301          | 0.4651      |
+| 0.554         | 2.1   | 3248 | 0.6742          | 0.7584   | 0.6346 | 0.7555 | 0.7584 | 0.7564 | 0.7293   | 0.7732     | 0.7506 | 0.6433     | 0.6430       | 0.6432   | 0.5031       | 0.4393         | 0.4690     | 0.7292    | 0.6363      | 0.6796  | 0.8347       | 0.8496         | 0.8421     | 0.7163       | 0.6587         | 0.6863     | 0.5049        | 0.4419          | 0.4713      |
+| 0.5537        | 2.25  | 3480 | 0.6708          | 0.7633   | 0.6283 | 0.7604 | 0.7633 | 0.7605 | 0.7263   | 0.7801     | 0.7523 | 0.6304     | 0.6612       | 0.6455   | 0.5806       | 0.3732         | 0.4543     | 0.7486    | 0.6094      | 0.6718  | 0.8442       | 0.8528         | 0.8485     | 0.6982       | 0.692          | 0.6951     | 0.5356        | 0.4290          | 0.4764      |
+| 0.5375        | 2.4   | 3712 | 0.6712          | 0.7606   | 0.6402 | 0.7592 | 0.7606 | 0.7595 | 0.7373   | 0.7709     | 0.7537 | 0.6245     | 0.6608       | 0.6421   | 0.4827       | 0.4482         | 0.4648     | 0.7319    | 0.6257      | 0.6747  | 0.8454       | 0.8474         | 0.8464     | 0.7006       | 0.6769         | 0.6885     | 0.5204        | 0.4516          | 0.4836      |
+| 0.5175        | 2.55  | 3944 | 0.6625          | 0.7625   | 0.6369 | 0.7600 | 0.7625 | 0.7604 | 0.7422   | 0.7642     | 0.7530 | 0.6335     | 0.6526       | 0.6429   | 0.4481       | 0.4929         | 0.4694     | 0.7482    | 0.6187      | 0.6773  | 0.8374       | 0.8604         | 0.8488     | 0.7252       | 0.6684         | 0.6957     | 0.5321        | 0.4011          | 0.4574      |
+| 0.5182        | 2.7   | 4176 | 0.6621          | 0.7631   | 0.6404 | 0.7602 | 0.7631 | 0.7612 | 0.7343   | 0.7766     | 0.7549 | 0.6491     | 0.6392       | 0.6441   | 0.4739       | 0.4536         | 0.4635     | 0.6784    | 0.6538      | 0.6659  | 0.8444       | 0.8529         | 0.8486     | 0.7109       | 0.684          | 0.6972     | 0.5458        | 0.4226          | 0.4764      |
+| 0.5148        | 2.85  | 4408 | 0.6638          | 0.7637   | 0.6383 | 0.7598 | 0.7637 | 0.7612 | 0.7394   | 0.7741     | 0.7563 | 0.6741     | 0.6205       | 0.6462   | 0.5          | 0.4375         | 0.4667     | 0.6813    | 0.6550      | 0.6679  | 0.8400       | 0.8572         | 0.8485     | 0.6922       | 0.6916         | 0.6919     | 0.5296        | 0.4323          | 0.4760      |
+### Framework versions
+- Transformers 4.31.0
+- Pytorch 2.0.1+cu117
+- Datasets 2.14.2
+- Tokenizers 0.13.3

all_results.json ADDED Viewed

	@@ -0,0 +1,39 @@

+{
+    "epoch": 3.0,
+    "eval_accuracy": 0.7617346477344669,
+    "eval_b_acc": 0.6394282040393414,
+    "eval_f1": 0.7601905030141421,
+    "eval_f1_anger": 0.6486744685932649,
+    "eval_f1_disgust": 0.46027397260273967,
+    "eval_f1_fear": 0.6674786845310596,
+    "eval_f1_joy": 0.7546596434359805,
+    "eval_f1_neutral": 0.8473718729504358,
+    "eval_f1_sadness": 0.6911328926373376,
+    "eval_f1_surprise": 0.47321954090641555,
+    "eval_loss": 0.6647528409957886,
+    "eval_prec": 0.7595317468114701,
+    "eval_prec_anger": 0.6466666666666666,
+    "eval_prec_disgust": 0.47102803738317756,
+    "eval_prec_fear": 0.6963151207115629,
+    "eval_prec_joy": 0.7315396700706991,
+    "eval_prec_neutral": 0.8457078735739667,
+    "eval_prec_sadness": 0.7094057089377632,
+    "eval_prec_surprise": 0.5227568270481144,
+    "eval_recall": 0.7617346477344669,
+    "eval_recall_anger": 0.6506947771921419,
+    "eval_recall_disgust": 0.45,
+    "eval_recall_fear": 0.6409356725146199,
+    "eval_recall_joy": 0.7792887029288703,
+    "eval_recall_neutral": 0.8490424333458505,
+    "eval_recall_sadness": 0.6737777777777778,
+    "eval_recall_surprise": 0.432258064516129,
+    "eval_runtime": 14.5728,
+    "eval_samples": 22114,
+    "eval_samples_per_second": 1517.489,
+    "eval_steps_per_second": 11.871,
+    "train_loss": 0.6570020180521673,
+    "train_runtime": 1377.6596,
+    "train_samples": 197800,
+    "train_samples_per_second": 430.73,
+    "train_steps_per_second": 3.367
+}

config.json ADDED Viewed

	@@ -0,0 +1,46 @@

+{
+  "_name_or_path": "roberta-base",
+  "architectures": [
+    "RobertaForSequenceClassification"
+  ],
+  "attention_probs_dropout_prob": 0.1,
+  "bos_token_id": 0,
+  "classifier_dropout": null,
+  "eos_token_id": 2,
+  "hidden_act": "gelu",
+  "hidden_dropout_prob": 0.1,
+  "hidden_size": 768,
+  "id2label": {
+    "0": "anger",
+    "1": "disgust",
+    "2": "fear",
+    "3": "joy",
+    "4": "neutral",
+    "5": "sadness",
+    "6": "surprise"
+  },
+  "initializer_range": 0.02,
+  "intermediate_size": 3072,
+  "label2id": {
+    "anger": 0,
+    "disgust": 1,
+    "fear": 2,
+    "joy": 3,
+    "neutral": 4,
+    "sadness": 5,
+    "surprise": 6
+  },
+  "layer_norm_eps": 1e-05,
+  "max_position_embeddings": 514,
+  "model_type": "roberta",
+  "num_attention_heads": 12,
+  "num_hidden_layers": 12,
+  "pad_token_id": 1,
+  "position_embedding_type": "absolute",
+  "problem_type": "single_label_classification",
+  "torch_dtype": "float32",
+  "transformers_version": "4.31.0",
+  "type_vocab_size": 1,
+  "use_cache": true,
+  "vocab_size": 50265
+}

eval_results.json ADDED Viewed

	@@ -0,0 +1,34 @@

+{
+    "epoch": 3.0,
+    "eval_accuracy": 0.7617346477344669,
+    "eval_b_acc": 0.6394282040393414,
+    "eval_f1": 0.7601905030141421,
+    "eval_f1_anger": 0.6486744685932649,
+    "eval_f1_disgust": 0.46027397260273967,
+    "eval_f1_fear": 0.6674786845310596,
+    "eval_f1_joy": 0.7546596434359805,
+    "eval_f1_neutral": 0.8473718729504358,
+    "eval_f1_sadness": 0.6911328926373376,
+    "eval_f1_surprise": 0.47321954090641555,
+    "eval_loss": 0.6647528409957886,
+    "eval_prec": 0.7595317468114701,
+    "eval_prec_anger": 0.6466666666666666,
+    "eval_prec_disgust": 0.47102803738317756,
+    "eval_prec_fear": 0.6963151207115629,
+    "eval_prec_joy": 0.7315396700706991,
+    "eval_prec_neutral": 0.8457078735739667,
+    "eval_prec_sadness": 0.7094057089377632,
+    "eval_prec_surprise": 0.5227568270481144,
+    "eval_recall": 0.7617346477344669,
+    "eval_recall_anger": 0.6506947771921419,
+    "eval_recall_disgust": 0.45,
+    "eval_recall_fear": 0.6409356725146199,
+    "eval_recall_joy": 0.7792887029288703,
+    "eval_recall_neutral": 0.8490424333458505,
+    "eval_recall_sadness": 0.6737777777777778,
+    "eval_recall_surprise": 0.432258064516129,
+    "eval_runtime": 14.5728,
+    "eval_samples": 22114,
+    "eval_samples_per_second": 1517.489,
+    "eval_steps_per_second": 11.871
+}

merges.txt ADDED Viewed

The diff for this file is too large to render. See raw diff

pytorch_model.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:52ff68740dbd51618e05d8e926e72bd32831e0cc00fa4d8693a1c4b6ccd39cc0
+size 498673009

special_tokens_map.json ADDED Viewed

	@@ -0,0 +1,15 @@

+{
+  "bos_token": "<s>",
+  "cls_token": "<s>",
+  "eos_token": "</s>",
+  "mask_token": {
+    "content": "<mask>",
+    "lstrip": true,
+    "normalized": false,
+    "rstrip": false,
+    "single_word": false
+  },
+  "pad_token": "<pad>",
+  "sep_token": "</s>",
+  "unk_token": "<unk>"
+}

tokenizer.json ADDED Viewed

The diff for this file is too large to render. See raw diff

tokenizer_config.json ADDED Viewed

	@@ -0,0 +1,15 @@

+{
+  "add_prefix_space": false,
+  "bos_token": "<s>",
+  "clean_up_tokenization_spaces": true,
+  "cls_token": "<s>",
+  "eos_token": "</s>",
+  "errors": "replace",
+  "mask_token": "<mask>",
+  "model_max_length": 512,
+  "pad_token": "<pad>",
+  "sep_token": "</s>",
+  "tokenizer_class": "RobertaTokenizer",
+  "trim_offsets": true,
+  "unk_token": "<unk>"
+}

train_results.json ADDED Viewed

	@@ -0,0 +1,8 @@

+{
+    "epoch": 3.0,
+    "train_loss": 0.6570020180521673,
+    "train_runtime": 1377.6596,
+    "train_samples": 197800,
+    "train_samples_per_second": 430.73,
+    "train_steps_per_second": 3.367
+}

trainer_state.json ADDED Viewed

	@@ -0,0 +1,1259 @@

+{
+  "best_metric": null,
+  "best_model_checkpoint": null,
+  "epoch": 3.0,
+  "global_step": 4638,
+  "is_hyper_param_search": false,
+  "is_local_process_zero": true,
+  "is_world_process_zero": true,
+  "log_history": [
+    {
+      "epoch": 0.03,
+      "learning_rate": 5.064655172413793e-06,
+      "loss": 1.827,
+      "step": 47
+    },
+    {
+      "epoch": 0.06,
+      "learning_rate": 1.0129310344827586e-05,
+      "loss": 1.288,
+      "step": 94
+    },
+    {
+      "epoch": 0.09,
+      "learning_rate": 1.5086206896551724e-05,
+      "loss": 1.0612,
+      "step": 141
+    },
+    {
+      "epoch": 0.12,
+      "learning_rate": 2.0150862068965517e-05,
+      "loss": 0.9538,
+      "step": 188
+    },
+    {
+      "epoch": 0.15,
+      "eval_accuracy": 0.6960748846884327,
+      "eval_b_acc": 0.4789797300032158,
+      "eval_f1": 0.683716357682452,
+      "eval_f1_anger": 0.497677504976775,
+      "eval_f1_disgust": 0.0035460992907801418,
+      "eval_f1_fear": 0.4832126398946675,
+      "eval_f1_joy": 0.685316256600382,
+      "eval_f1_neutral": 0.827884745457005,
+      "eval_f1_sadness": 0.5799599198396794,
+      "eval_f1_surprise": 0.2866323907455013,
+      "eval_loss": 0.8701004981994629,
+      "eval_prec": 0.6836877535141815,
+      "eval_prec_anger": 0.462202136400986,
+      "eval_prec_disgust": 0.25,
+      "eval_prec_fear": 0.552710843373494,
+      "eval_prec_joy": 0.7401116233923805,
+      "eval_prec_neutral": 0.796529284164859,
+      "eval_prec_sadness": 0.5281021897810219,
+      "eval_prec_surprise": 0.3562300319488818,
+      "eval_recall": 0.6960748846884327,
+      "eval_recall_anger": 0.5390512697652132,
+      "eval_recall_disgust": 0.0017857142857142857,
+      "eval_recall_fear": 0.42923976608187137,
+      "eval_recall_joy": 0.6380753138075314,
+      "eval_recall_neutral": 0.86180998873451,
+      "eval_recall_sadness": 0.6431111111111111,
+      "eval_recall_surprise": 0.23978494623655913,
+      "eval_runtime": 16.0297,
+      "eval_samples_per_second": 1379.566,
+      "eval_steps_per_second": 10.792,
+      "step": 232
+    },
+    {
+      "epoch": 0.15,
+      "learning_rate": 2.521551724137931e-05,
+      "loss": 0.8837,
+      "step": 235
+    },
+    {
+      "epoch": 0.18,
+      "learning_rate": 3.0280172413793107e-05,
+      "loss": 0.881,
+      "step": 282
+    },
+    {
+      "epoch": 0.21,
+      "learning_rate": 3.53448275862069e-05,
+      "loss": 0.8462,
+      "step": 329
+    },
+    {
+      "epoch": 0.24,
+      "learning_rate": 4.0409482758620696e-05,
+      "loss": 0.8242,
+      "step": 376
+    },
+    {
+      "epoch": 0.27,
+      "learning_rate": 4.5474137931034485e-05,
+      "loss": 0.7952,
+      "step": 423
+    },
+    {
+      "epoch": 0.3,
+      "eval_accuracy": 0.7168309668083567,
+      "eval_b_acc": 0.5241940962877409,
+      "eval_f1": 0.7025228198992769,
+      "eval_f1_anger": 0.5170962651236192,
+      "eval_f1_disgust": 0.3386727688787185,
+      "eval_f1_fear": 0.5674653215636821,
+      "eval_f1_joy": 0.6853079426298663,
+      "eval_f1_neutral": 0.8225570814375757,
+      "eval_f1_sadness": 0.6211089494163424,
+      "eval_f1_surprise": 0.37250000000000005,
+      "eval_loss": 0.8009697198867798,
+      "eval_prec": 0.7097552640353452,
+      "eval_prec_anger": 0.5731778425655977,
+      "eval_prec_disgust": 0.4713375796178344,
+      "eval_prec_fear": 0.615595075239398,
+      "eval_prec_joy": 0.8083593972135342,
+      "eval_prec_neutral": 0.7405486659150695,
+      "eval_prec_sadness": 0.6858216970998926,
+      "eval_prec_surprise": 0.44477611940298506,
+      "eval_recall": 0.7168309668083567,
+      "eval_recall_anger": 0.4710110206037374,
+      "eval_recall_disgust": 0.2642857142857143,
+      "eval_recall_fear": 0.5263157894736842,
+      "eval_recall_joy": 0.5947698744769875,
+      "eval_recall_neutral": 0.924990612091626,
+      "eval_recall_sadness": 0.5675555555555556,
+      "eval_recall_surprise": 0.3204301075268817,
+      "eval_runtime": 15.1427,
+      "eval_samples_per_second": 1460.377,
+      "eval_steps_per_second": 11.425,
+      "step": 464
+    },
+    {
+      "epoch": 0.3,
+      "learning_rate": 4.9940105414470535e-05,
+      "loss": 0.7998,
+      "step": 470
+    },
+    {
+      "epoch": 0.33,
+      "learning_rate": 4.938907522759943e-05,
+      "loss": 0.7996,
+      "step": 517
+    },
+    {
+      "epoch": 0.36,
+      "learning_rate": 4.882606612362243e-05,
+      "loss": 0.776,
+      "step": 564
+    },
+    {
+      "epoch": 0.4,
+      "learning_rate": 4.826305701964542e-05,
+      "loss": 0.8018,
+      "step": 611
+    },
+    {
+      "epoch": 0.43,
+      "learning_rate": 4.770004791566843e-05,
+      "loss": 0.7528,
+      "step": 658
+    },
+    {
+      "epoch": 0.45,
+      "eval_accuracy": 0.7260558921949896,
+      "eval_b_acc": 0.5878316350938373,
+      "eval_f1": 0.7255951803151626,
+      "eval_f1_anger": 0.5542226487523992,
+      "eval_f1_disgust": 0.3994082840236686,
+      "eval_f1_fear": 0.5798319327731093,
+      "eval_f1_joy": 0.7291770573566084,
+      "eval_f1_neutral": 0.8314359514015114,
+      "eval_f1_sadness": 0.6541166735622672,
+      "eval_f1_surprise": 0.38283828382838286,
+      "eval_loss": 0.7560049891471863,
+      "eval_prec": 0.7309376250219672,
+      "eval_prec_anger": 0.5550216242191254,
+      "eval_prec_disgust": 0.3409090909090909,
+      "eval_prec_fear": 0.7225130890052356,
+      "eval_prec_joy": 0.6968541468064824,
+      "eval_prec_neutral": 0.847571679344646,
+      "eval_prec_sadness": 0.6118421052631579,
+      "eval_prec_surprise": 0.49572649572649574,
+      "eval_recall": 0.7260558921949896,
+      "eval_recall_anger": 0.5534259702922856,
+      "eval_recall_disgust": 0.48214285714285715,
+      "eval_recall_fear": 0.4842105263157895,
+      "eval_recall_joy": 0.7646443514644351,
+      "eval_recall_neutral": 0.8159031167855801,
+      "eval_recall_sadness": 0.7026666666666667,
+      "eval_recall_surprise": 0.3118279569892473,
+      "eval_runtime": 14.7708,
+      "eval_samples_per_second": 1497.143,
+      "eval_steps_per_second": 11.712,
+      "step": 696
+    },
+    {
+      "epoch": 0.46,
+      "learning_rate": 4.713703881169142e-05,
+      "loss": 0.7459,
+      "step": 705
+    },
+    {
+      "epoch": 0.49,
+      "learning_rate": 4.657402970771442e-05,
+      "loss": 0.7599,
+      "step": 752
+    },
+    {
+      "epoch": 0.52,
+      "learning_rate": 4.601102060373742e-05,
+      "loss": 0.7648,
+      "step": 799
+    },
+    {
+      "epoch": 0.55,
+      "learning_rate": 4.544801149976042e-05,
+      "loss": 0.7436,
+      "step": 846
+    },
+    {
+      "epoch": 0.58,
+      "learning_rate": 4.488500239578342e-05,
+      "loss": 0.7334,
+      "step": 893
+    },
+    {
+      "epoch": 0.6,
+      "eval_accuracy": 0.7370444062584788,
+      "eval_b_acc": 0.5867600905079025,
+      "eval_f1": 0.7282740654207969,
+      "eval_f1_anger": 0.5218712029161603,
+      "eval_f1_disgust": 0.4505649717514124,
+      "eval_f1_fear": 0.6104060913705585,
+      "eval_f1_joy": 0.7311320754716981,
+      "eval_f1_neutral": 0.8351327433628318,
+      "eval_f1_sadness": 0.6498640968618731,
+      "eval_f1_surprise": 0.4181229773462783,
+      "eval_loss": 0.7309762835502625,
+      "eval_prec": 0.7344879537976949,
+      "eval_prec_anger": 0.7128630705394191,
+      "eval_prec_disgust": 0.3726635514018692,
+      "eval_prec_fear": 0.6671289875173371,
+      "eval_prec_joy": 0.7170152855993563,
+      "eval_prec_neutral": 0.7898393036491463,
+      "eval_prec_sadness": 0.7317751808569839,
+      "eval_prec_surprise": 0.5252032520325203,
+      "eval_recall": 0.7370444062584788,
+      "eval_recall_anger": 0.411595591758505,
+      "eval_recall_disgust": 0.5696428571428571,
+      "eval_recall_fear": 0.5625730994152047,
+      "eval_recall_joy": 0.74581589958159,
+      "eval_recall_neutral": 0.8859369132557267,
+      "eval_recall_sadness": 0.5844444444444444,
+      "eval_recall_surprise": 0.3473118279569892,
+      "eval_runtime": 14.5647,
+      "eval_samples_per_second": 1518.332,
+      "eval_steps_per_second": 11.878,
+      "step": 928
+    },
+    {
+      "epoch": 0.61,
+      "learning_rate": 4.432199329180642e-05,
+      "loss": 0.7493,
+      "step": 940
+    },
+    {
+      "epoch": 0.64,
+      "learning_rate": 4.375898418782942e-05,
+      "loss": 0.7194,
+      "step": 987
+    },
+    {
+      "epoch": 0.67,
+      "learning_rate": 4.319597508385242e-05,
+      "loss": 0.7158,
+      "step": 1034
+    },
+    {
+      "epoch": 0.7,
+      "learning_rate": 4.263296597987542e-05,
+      "loss": 0.719,
+      "step": 1081
+    },
+    {
+      "epoch": 0.73,
+      "learning_rate": 4.206995687589842e-05,
+      "loss": 0.7216,
+      "step": 1128
+    },
+    {
+      "epoch": 0.75,
+      "eval_accuracy": 0.7448222845256399,
+      "eval_b_acc": 0.6009457685058381,
+      "eval_f1": 0.7388819166581033,
+      "eval_f1_anger": 0.5746421267893661,
+      "eval_f1_disgust": 0.48046875,
+      "eval_f1_fear": 0.6597796143250689,
+      "eval_f1_joy": 0.7266451397394499,
+      "eval_f1_neutral": 0.8355743035416118,
+      "eval_f1_sadness": 0.6644859813084112,
+      "eval_f1_surprise": 0.4711696869851729,
+      "eval_loss": 0.7043296694755554,
+      "eval_prec": 0.7402960337790491,
+      "eval_prec_anger": 0.6158904109589041,
+      "eval_prec_disgust": 0.5301724137931034,
+      "eval_prec_fear": 0.8023450586264657,
+      "eval_prec_joy": 0.7767198286122352,
+      "eval_prec_neutral": 0.7853956715678176,
+      "eval_prec_sadness": 0.7004926108374384,
+      "eval_prec_surprise": 0.48148148148148145,
+      "eval_recall": 0.7448222845256399,
+      "eval_recall_anger": 0.5385721130809775,
+      "eval_recall_disgust": 0.4392857142857143,
+      "eval_recall_fear": 0.560233918128655,
+      "eval_recall_joy": 0.6826359832635983,
+      "eval_recall_neutral": 0.8926023282012767,
+      "eval_recall_sadness": 0.632,
+      "eval_recall_surprise": 0.4612903225806452,
+      "eval_runtime": 14.6801,
+      "eval_samples_per_second": 1506.393,
+      "eval_steps_per_second": 11.785,
+      "step": 1160
+    },
+    {
+      "epoch": 0.76,
+      "learning_rate": 4.150694777192142e-05,
+      "loss": 0.7134,
+      "step": 1175
+    },
+    {
+      "epoch": 0.79,
+      "learning_rate": 4.094393866794442e-05,
+      "loss": 0.7029,
+      "step": 1222
+    },
+    {
+      "epoch": 0.82,
+      "learning_rate": 4.0380929563967415e-05,
+      "loss": 0.6945,
+      "step": 1269
+    },
+    {
+      "epoch": 0.85,
+      "learning_rate": 3.981792045999042e-05,
+      "loss": 0.7033,
+      "step": 1316
+    },
+    {
+      "epoch": 0.88,
+      "learning_rate": 3.9254911356013415e-05,
+      "loss": 0.7259,
+      "step": 1363
+    },
+    {
+      "epoch": 0.9,
+      "eval_accuracy": 0.7475354978746496,
+      "eval_b_acc": 0.6082480515560814,
+      "eval_f1": 0.741168197686153,
+      "eval_f1_anger": 0.5405405405405406,
+      "eval_f1_disgust": 0.4599559147685525,
+      "eval_f1_fear": 0.6475358702432937,
+      "eval_f1_joy": 0.7468589083419156,
+      "eval_f1_neutral": 0.8421338155515371,
+      "eval_f1_sadness": 0.6752079118903124,
+      "eval_f1_surprise": 0.42070338420703385,
+      "eval_loss": 0.6962281465530396,
+      "eval_prec": 0.7432901970674257,
+      "eval_prec_anger": 0.6757728253055356,
+      "eval_prec_disgust": 0.39076154806491886,
+      "eval_prec_fear": 0.6938502673796791,
+      "eval_prec_joy": 0.7354969574036511,
+      "eval_prec_neutral": 0.8121730031391698,
+      "eval_prec_sadness": 0.683037744429286,
+      "eval_prec_surprise": 0.5493934142114385,
+      "eval_recall": 0.7475354978746496,
+      "eval_recall_anger": 0.4504072831816004,
+      "eval_recall_disgust": 0.5589285714285714,
+      "eval_recall_fear": 0.6070175438596491,
+      "eval_recall_joy": 0.7585774058577406,
+      "eval_recall_neutral": 0.8743897859556891,
+      "eval_recall_sadness": 0.6675555555555556,
+      "eval_recall_surprise": 0.34086021505376346,
+      "eval_runtime": 14.6912,
+      "eval_samples_per_second": 1505.258,
+      "eval_steps_per_second": 11.776,
+      "step": 1392
+    },
+    {
+      "epoch": 0.91,
+      "learning_rate": 3.8691902252036415e-05,
+      "loss": 0.7143,
+      "step": 1410
+    },
+    {
+      "epoch": 0.94,
+      "learning_rate": 3.812889314805942e-05,
+      "loss": 0.6903,
+      "step": 1457
+    },
+    {
+      "epoch": 0.97,
+      "learning_rate": 3.7565884044082415e-05,
+      "loss": 0.6812,
+      "step": 1504
+    },
+    {
+      "epoch": 1.0,
+      "learning_rate": 3.7002874940105415e-05,
+      "loss": 0.7182,
+      "step": 1551
+    },
+    {
+      "epoch": 1.03,
+      "learning_rate": 3.6439865836128415e-05,
+      "loss": 0.6362,
+      "step": 1598
+    },
+    {
+      "epoch": 1.05,
+      "eval_accuracy": 0.7526453830152844,
+      "eval_b_acc": 0.6055170494206373,
+      "eval_f1": 0.7483739984911967,
+      "eval_f1_anger": 0.602752507581059,
+      "eval_f1_disgust": 0.4405010438413361,
+      "eval_f1_fear": 0.6491803278688525,
+      "eval_f1_joy": 0.7437363551304709,
+      "eval_f1_neutral": 0.8435330654000731,
+      "eval_f1_sadness": 0.6785631517960602,
+      "eval_f1_surprise": 0.45454545454545453,
+      "eval_loss": 0.6771188974380493,
+      "eval_prec": 0.7472415916170276,
+      "eval_prec_anger": 0.5872727272727273,
+      "eval_prec_disgust": 0.5301507537688442,
+      "eval_prec_fear": 0.7388059701492538,
+      "eval_prec_joy": 0.739202314527795,
+      "eval_prec_neutral": 0.8213269299181786,
+      "eval_prec_sadness": 0.7089588377723971,
+      "eval_prec_surprise": 0.5300859598853869,
+      "eval_recall": 0.7526453830152844,
+      "eval_recall_anger": 0.6190704360325826,
+      "eval_recall_disgust": 0.3767857142857143,
+      "eval_recall_fear": 0.5789473684210527,
+      "eval_recall_joy": 0.748326359832636,
+      "eval_recall_neutral": 0.8669733383402178,
+      "eval_recall_sadness": 0.6506666666666666,
+      "eval_recall_surprise": 0.3978494623655914,
+      "eval_runtime": 14.8683,
+      "eval_samples_per_second": 1487.33,
+      "eval_steps_per_second": 11.636,
+      "step": 1624
+    },
+    {
+      "epoch": 1.06,
+      "learning_rate": 3.5876856732151415e-05,
+      "loss": 0.6432,
+      "step": 1645
+    },
+    {
+      "epoch": 1.09,
+      "learning_rate": 3.5313847628174415e-05,
+      "loss": 0.652,
+      "step": 1692
+    },
+    {
+      "epoch": 1.12,
+      "learning_rate": 3.4750838524197415e-05,
+      "loss": 0.6474,
+      "step": 1739
+    },
+    {
+      "epoch": 1.16,
+      "learning_rate": 3.4187829420220415e-05,
+      "loss": 0.6364,
+      "step": 1786
+    },
+    {
+      "epoch": 1.19,
+      "learning_rate": 3.362482031624341e-05,
+      "loss": 0.621,
+      "step": 1833
+    },
+    {
+      "epoch": 1.2,
+      "eval_accuracy": 0.7528262639052185,
+      "eval_b_acc": 0.6120366345893286,
+      "eval_f1": 0.7487165396015127,
+      "eval_f1_anger": 0.6196334421290485,
+      "eval_f1_disgust": 0.47378277153558057,
+      "eval_f1_fear": 0.6528640441683919,
+      "eval_f1_joy": 0.7450472872075661,
+      "eval_f1_neutral": 0.8372220697227559,
+      "eval_f1_sadness": 0.6809026935209901,
+      "eval_f1_surprise": 0.4612676056338028,
+      "eval_loss": 0.67792809009552,
+      "eval_prec": 0.749407175516463,
+      "eval_prec_anger": 0.6508438818565401,
+      "eval_prec_disgust": 0.49803149606299213,
+      "eval_prec_fear": 0.7962962962962963,
+      "eval_prec_joy": 0.7107312440645774,
+      "eval_prec_neutral": 0.8165268606103873,
+      "eval_prec_sadness": 0.7498663816141101,
+      "eval_prec_surprise": 0.5077519379844961,
+      "eval_recall": 0.7528262639052185,
+      "eval_recall_anger": 0.5912793483469094,
+      "eval_recall_disgust": 0.4517857142857143,
+      "eval_recall_fear": 0.5532163742690058,
+      "eval_recall_joy": 0.7828451882845189,
+      "eval_recall_neutral": 0.8589936162223056,
+      "eval_recall_sadness": 0.6235555555555555,
+      "eval_recall_surprise": 0.42258064516129035,
+      "eval_runtime": 14.7115,
+      "eval_samples_per_second": 1503.179,
+      "eval_steps_per_second": 11.76,
+      "step": 1856
+    },
+    {
+      "epoch": 1.22,
+      "learning_rate": 3.3061811212266415e-05,
+      "loss": 0.6195,
+      "step": 1880
+    },
+    {
+      "epoch": 1.25,
+      "learning_rate": 3.249880210828941e-05,
+      "loss": 0.6332,
+      "step": 1927
+    },
+    {
+      "epoch": 1.28,
+      "learning_rate": 3.1935793004312415e-05,
+      "loss": 0.6251,
+      "step": 1974
+    },
+    {
+      "epoch": 1.31,
+      "learning_rate": 3.1372783900335415e-05,
+      "loss": 0.63,
+      "step": 2021
+    },
+    {
+      "epoch": 1.34,
+      "learning_rate": 3.080977479635841e-05,
+      "loss": 0.6241,
+      "step": 2068
+    },
+    {
+      "epoch": 1.35,
+      "eval_accuracy": 0.7512887763407796,
+      "eval_b_acc": 0.6367091163081916,
+      "eval_f1": 0.7514440246825209,
+      "eval_f1_anger": 0.6141022752872269,
+      "eval_f1_disgust": 0.4511668107173725,
+      "eval_f1_fear": 0.6488060570762958,
+      "eval_f1_joy": 0.7509570615623384,
+      "eval_f1_neutral": 0.843150231634679,
+      "eval_f1_sadness": 0.6745293717396236,
+      "eval_f1_surprise": 0.4730290456431535,
+      "eval_loss": 0.6849319338798523,
+      "eval_prec": 0.7525985800729426,
+      "eval_prec_anger": 0.5795068027210885,
+      "eval_prec_disgust": 0.4371859296482412,
+      "eval_prec_fear": 0.6461716937354989,
+      "eval_prec_joy": 0.7428863868986694,
+      "eval_prec_neutral": 0.849171586364502,
+      "eval_prec_sadness": 0.6887447892542844,
+      "eval_prec_surprise": 0.5270805812417437,
+      "eval_recall": 0.7512887763407796,
+      "eval_recall_anger": 0.6530905606133206,
+      "eval_recall_disgust": 0.4660714285714286,
+      "eval_recall_fear": 0.6514619883040935,
+      "eval_recall_joy": 0.7592050209205021,
+      "eval_recall_neutral": 0.8372136687945926,
+      "eval_recall_sadness": 0.6608888888888889,
+      "eval_recall_surprise": 0.4290322580645161,
+      "eval_runtime": 14.591,
+      "eval_samples_per_second": 1515.587,
+      "eval_steps_per_second": 11.857,
+      "step": 2088
+    },
+    {
+      "epoch": 1.37,
+      "learning_rate": 3.024676569238141e-05,
+      "loss": 0.5997,
+      "step": 2115
+    },
+    {
+      "epoch": 1.4,
+      "learning_rate": 2.968375658840441e-05,
+      "loss": 0.6348,
+      "step": 2162
+    },
+    {
+      "epoch": 1.43,
+      "learning_rate": 2.9120747484427408e-05,
+      "loss": 0.6269,
+      "step": 2209
+    },
+    {
+      "epoch": 1.46,
+      "learning_rate": 2.855773838045041e-05,
+      "loss": 0.6411,
+      "step": 2256
+    },
+    {
+      "epoch": 1.49,
+      "learning_rate": 2.7994729276473408e-05,
+      "loss": 0.6188,
+      "step": 2303
+    },
+    {
+      "epoch": 1.5,
+      "eval_accuracy": 0.7578909288233698,
+      "eval_b_acc": 0.6158634091154939,
+      "eval_f1": 0.7533929534836733,
+      "eval_f1_anger": 0.6305133767172812,
+      "eval_f1_disgust": 0.45919477693144717,
+      "eval_f1_fear": 0.6729323308270676,
+      "eval_f1_joy": 0.7494099134539732,
+      "eval_f1_neutral": 0.84280126653008,
+      "eval_f1_sadness": 0.681602172437203,
+      "eval_f1_surprise": 0.4503664223850767,
+      "eval_loss": 0.6713131070137024,
+      "eval_prec": 0.7538941653702528,
+      "eval_prec_anger": 0.6343355965082444,
+      "eval_prec_disgust": 0.5877437325905293,
+      "eval_prec_fear": 0.7246963562753036,
+      "eval_prec_joy": 0.7071269487750557,
+      "eval_prec_neutral": 0.8361049519586105,
+      "eval_prec_sadness": 0.69432918395574,
+      "eval_prec_surprise": 0.5919439579684763,
+      "eval_recall": 0.7578909288233698,
+      "eval_recall_anger": 0.6267369429803545,
+      "eval_recall_disgust": 0.3767857142857143,
+      "eval_recall_fear": 0.6280701754385964,
+      "eval_recall_joy": 0.797071129707113,
+      "eval_recall_neutral": 0.8496057078482914,
+      "eval_recall_sadness": 0.6693333333333333,
+      "eval_recall_surprise": 0.3634408602150538,
+      "eval_runtime": 14.588,
+      "eval_samples_per_second": 1515.9,
+      "eval_steps_per_second": 11.859,
+      "step": 2320
+    },
+    {
+      "epoch": 1.52,
+      "learning_rate": 2.7431720172496405e-05,
+      "loss": 0.622,
+      "step": 2350
+    },
+    {
+      "epoch": 1.55,
+      "learning_rate": 2.6868711068519408e-05,
+      "loss": 0.6278,
+      "step": 2397
+    },
+    {
+      "epoch": 1.58,
+      "learning_rate": 2.6305701964542405e-05,
+      "loss": 0.6227,
+      "step": 2444
+    },
+    {
+      "epoch": 1.61,
+      "learning_rate": 2.5742692860565405e-05,
+      "loss": 0.6337,
+      "step": 2491
+    },
+    {
+      "epoch": 1.64,
+      "learning_rate": 2.5179683756588408e-05,
+      "loss": 0.6182,
+      "step": 2538
+    },
+    {
+      "epoch": 1.65,
+      "eval_accuracy": 0.760106719725061,
+      "eval_b_acc": 0.6198832054514857,
+      "eval_f1": 0.7565733944354605,
+      "eval_f1_anger": 0.625943396226415,
+      "eval_f1_disgust": 0.4582893347412883,
+      "eval_f1_fear": 0.6753246753246753,
+      "eval_f1_joy": 0.7498260610277309,
+      "eval_f1_neutral": 0.8475095074668398,
+      "eval_f1_sadness": 0.6851194700733381,
+      "eval_f1_surprise": 0.4700181708055723,
+      "eval_loss": 0.6608244180679321,
+      "eval_prec": 0.7566647637236428,
+      "eval_prec_anger": 0.6163492800743149,
+      "eval_prec_disgust": 0.5607235142118863,
+      "eval_prec_fear": 0.7591240875912408,
+      "eval_prec_joy": 0.7142586631319826,
+      "eval_prec_neutral": 0.8374885426214482,
+      "eval_prec_sadness": 0.7324228629236217,
+      "eval_prec_surprise": 0.5381414701803051,
+      "eval_recall": 0.760106719725061,
+      "eval_recall_anger": 0.6358409199808337,
+      "eval_recall_disgust": 0.3875,
+      "eval_recall_fear": 0.6081871345029239,
+      "eval_recall_joy": 0.7891213389121339,
+      "eval_recall_neutral": 0.8577731881336839,
+      "eval_recall_sadness": 0.6435555555555555,
+      "eval_recall_surprise": 0.4172043010752688,
+      "eval_runtime": 14.5162,
+      "eval_samples_per_second": 1523.406,
+      "eval_steps_per_second": 11.918,
+      "step": 2552
+    },
+    {
+      "epoch": 1.67,
+      "learning_rate": 2.4616674652611405e-05,
+      "loss": 0.6078,
+      "step": 2585
+    },
+    {
+      "epoch": 1.7,
+      "learning_rate": 2.4053665548634405e-05,
+      "loss": 0.6167,
+      "step": 2632
+    },
+    {
+      "epoch": 1.73,
+      "learning_rate": 2.3490656444657405e-05,
+      "loss": 0.6329,
+      "step": 2679
+    },
+    {
+      "epoch": 1.76,
+      "learning_rate": 2.29396262577863e-05,
+      "loss": 0.6153,
+      "step": 2726
+    },
+    {
+      "epoch": 1.79,
+      "learning_rate": 2.2376617153809296e-05,
+      "loss": 0.6392,
+      "step": 2773
+    },
+    {
+      "epoch": 1.8,
+      "eval_accuracy": 0.7623677308492358,
+      "eval_b_acc": 0.626106698297278,
+      "eval_f1": 0.7595959808260688,
+      "eval_f1_anger": 0.6317689530685919,
+      "eval_f1_disgust": 0.46170212765957447,
+      "eval_f1_fear": 0.6752246469833119,
+      "eval_f1_joy": 0.7548152004164499,
+      "eval_f1_neutral": 0.8505247584261871,
+      "eval_f1_sadness": 0.6872427983539094,
+      "eval_f1_surprise": 0.4615384615384616,
+      "eval_loss": 0.6541842818260193,
+      "eval_prec": 0.7593266897219236,
+      "eval_prec_anger": 0.5970149253731343,
+      "eval_prec_disgust": 0.5710526315789474,
+      "eval_prec_fear": 0.748221906116643,
+      "eval_prec_joy": 0.7512953367875648,
+      "eval_prec_neutral": 0.8379338617108499,
+      "eval_prec_sadness": 0.7076271186440678,
+      "eval_prec_surprise": 0.5131578947368421,
+      "eval_recall": 0.7623677308492358,
+      "eval_recall_anger": 0.6708193579300431,
+      "eval_recall_disgust": 0.3875,
+      "eval_recall_fear": 0.6152046783625731,
+      "eval_recall_joy": 0.7583682008368201,
+      "eval_recall_neutral": 0.8634998122418325,
+      "eval_recall_sadness": 0.668,
+      "eval_recall_surprise": 0.41935483870967744,
+      "eval_runtime": 14.6661,
+      "eval_samples_per_second": 1507.827,
+      "eval_steps_per_second": 11.796,
+      "step": 2784
+    },
+    {
+      "epoch": 1.82,
+      "learning_rate": 2.1813608049832296e-05,
+      "loss": 0.6221,
+      "step": 2820
+    },
+    {
+      "epoch": 1.85,
+      "learning_rate": 2.1250598945855296e-05,
+      "loss": 0.6109,
+      "step": 2867
+    },
+    {
+      "epoch": 1.88,
+      "learning_rate": 2.0687589841878296e-05,
+      "loss": 0.6029,
+      "step": 2914
+    },
+    {
+      "epoch": 1.92,
+      "learning_rate": 2.0124580737901292e-05,
+      "loss": 0.6243,
+      "step": 2961
+    },
+    {
+      "epoch": 1.95,
+      "learning_rate": 1.9561571633924296e-05,
+      "loss": 0.6158,
+      "step": 3008
+    },
+    {
+      "epoch": 1.95,
+      "eval_accuracy": 0.764854843085828,
+      "eval_b_acc": 0.6279403178124943,
+      "eval_f1": 0.761380516026678,
+      "eval_f1_anger": 0.6389822371579453,
+      "eval_f1_disgust": 0.4711729622266402,
+      "eval_f1_fear": 0.6765847347994824,
+      "eval_f1_joy": 0.751901635927894,
+      "eval_f1_neutral": 0.8525969275786394,
+      "eval_f1_sadness": 0.6901180282342051,
+      "eval_f1_surprise": 0.46511627906976744,
+      "eval_loss": 0.6456097960472107,
+      "eval_prec": 0.7598739530313577,
+      "eval_prec_anger": 0.6402116402116402,
+      "eval_prec_disgust": 0.531390134529148,
+      "eval_prec_fear": 0.7568740955137482,
+      "eval_prec_joy": 0.7490139090720366,
+      "eval_prec_neutral": 0.8310160427807487,
+      "eval_prec_sadness": 0.7199420569773056,
+      "eval_prec_surprise": 0.5063291139240507,
+      "eval_recall": 0.764854843085828,
+      "eval_recall_anger": 0.6377575467177767,
+      "eval_recall_disgust": 0.4232142857142857,
+      "eval_recall_fear": 0.6116959064327485,
+      "eval_recall_joy": 0.7548117154811715,
+      "eval_recall_neutral": 0.8753285767930905,
+      "eval_recall_sadness": 0.6626666666666666,
+      "eval_recall_surprise": 0.43010752688172044,
+      "eval_runtime": 14.622,
+      "eval_samples_per_second": 1512.381,
+      "eval_steps_per_second": 11.832,
+      "step": 3016
+    },
+    {
+      "epoch": 1.98,
+      "learning_rate": 1.8998562529947296e-05,
+      "loss": 0.5901,
+      "step": 3055
+    },
+    {
+      "epoch": 2.01,
+      "learning_rate": 1.8435553425970292e-05,
+      "loss": 0.5923,
+      "step": 3102
+    },
+    {
+      "epoch": 2.04,
+      "learning_rate": 1.7872544321993292e-05,
+      "loss": 0.5239,
+      "step": 3149
+    },
+    {
+      "epoch": 2.07,
+      "learning_rate": 1.7309535218016292e-05,
+      "loss": 0.5329,
+      "step": 3196
+    },
+    {
+      "epoch": 2.1,
+      "learning_rate": 1.6758505031145187e-05,
+      "loss": 0.554,
+      "step": 3243
+    },
+    {
+      "epoch": 2.1,
+      "eval_accuracy": 0.7583883512706883,
+      "eval_b_acc": 0.634571558597101,
+      "eval_f1": 0.7563700086517053,
+      "eval_f1_anger": 0.643182362808531,
+      "eval_f1_disgust": 0.4690181124880839,
+      "eval_f1_fear": 0.6795752654590881,
+      "eval_f1_joy": 0.7506092607636069,
+      "eval_f1_neutral": 0.842095468502838,
+      "eval_f1_sadness": 0.6862699699004399,
+      "eval_f1_surprise": 0.47133027522935783,
+      "eval_loss": 0.6742041707038879,
+      "eval_prec": 0.7554687165264222,
+      "eval_prec_anger": 0.6433365292425696,
+      "eval_prec_disgust": 0.5030674846625767,
+      "eval_prec_fear": 0.7292225201072386,
+      "eval_prec_joy": 0.7292817679558011,
+      "eval_prec_neutral": 0.8347168419110865,
+      "eval_prec_sadness": 0.7162880618656355,
+      "eval_prec_surprise": 0.504914004914005,
+      "eval_recall": 0.7583883512706883,
+      "eval_recall_anger": 0.6430282702443699,
+      "eval_recall_disgust": 0.4392857142857143,
+      "eval_recall_fear": 0.6362573099415205,
+      "eval_recall_joy": 0.7732217573221757,
+      "eval_recall_neutral": 0.8496057078482914,
+      "eval_recall_sadness": 0.6586666666666666,
+      "eval_recall_surprise": 0.44193548387096776,
+      "eval_runtime": 14.8261,
+      "eval_samples_per_second": 1491.559,
+      "eval_steps_per_second": 11.669,
+      "step": 3248
+    },
+    {
+      "epoch": 2.13,
+      "learning_rate": 1.6195495927168187e-05,
+      "loss": 0.5568,
+      "step": 3290
+    },
+    {
+      "epoch": 2.16,
+      "learning_rate": 1.5632486823191184e-05,
+      "loss": 0.5375,
+      "step": 3337
+    },
+    {
+      "epoch": 2.19,
+      "learning_rate": 1.5069477719214184e-05,
+      "loss": 0.5198,
+      "step": 3384
+    },
+    {
+      "epoch": 2.22,
+      "learning_rate": 1.4506468615237184e-05,
+      "loss": 0.5255,
+      "step": 3431
+    },
+    {
+      "epoch": 2.25,
+      "learning_rate": 1.3943459511260182e-05,
+      "loss": 0.5537,
+      "step": 3478
+    },
+    {
+      "epoch": 2.25,
+      "eval_accuracy": 0.7632721352989057,
+      "eval_b_acc": 0.6282518018397625,
+      "eval_f1": 0.7604673635172584,
+      "eval_f1_anger": 0.6454630495790459,
+      "eval_f1_disgust": 0.45434782608695656,
+      "eval_f1_fear": 0.6718246292714378,
+      "eval_f1_joy": 0.7522695178535405,
+      "eval_f1_neutral": 0.8484961703717542,
+      "eval_f1_sadness": 0.6950892857142857,
+      "eval_f1_surprise": 0.47641791044776116,
+      "eval_loss": 0.670791745185852,
+      "eval_prec": 0.7603587760472442,
+      "eval_prec_anger": 0.6304248515303792,
+      "eval_prec_disgust": 0.5805555555555556,
+      "eval_prec_fear": 0.7485632183908046,
+      "eval_prec_joy": 0.726334242306194,
+      "eval_prec_neutral": 0.8442379182156133,
+      "eval_prec_sadness": 0.6982062780269058,
+      "eval_prec_surprise": 0.5355704697986577,
+      "eval_recall": 0.7632721352989057,
+      "eval_recall_anger": 0.6612362242453282,
+      "eval_recall_disgust": 0.3732142857142857,
+      "eval_recall_fear": 0.6093567251461989,
+      "eval_recall_joy": 0.7801255230125523,
+      "eval_recall_neutral": 0.8527975966954563,
+      "eval_recall_sadness": 0.692,
+      "eval_recall_surprise": 0.4290322580645161,
+      "eval_runtime": 14.5517,
+      "eval_samples_per_second": 1519.68,
+      "eval_steps_per_second": 11.889,
+      "step": 3480
+    },
+    {
+      "epoch": 2.28,
+      "learning_rate": 1.3380450407283182e-05,
+      "loss": 0.5305,
+      "step": 3525
+    },
+    {
+      "epoch": 2.31,
+      "learning_rate": 1.2817441303306182e-05,
+      "loss": 0.5313,
+      "step": 3572
+    },
+    {
+      "epoch": 2.34,
+      "learning_rate": 1.2254432199329182e-05,
+      "loss": 0.5182,
+      "step": 3619
+    },
+    {
+      "epoch": 2.37,
+      "learning_rate": 1.169142309535218e-05,
+      "loss": 0.5375,
+      "step": 3666
+    },
+    {
+      "epoch": 2.4,
+      "eval_accuracy": 0.7605589219498959,
+      "eval_b_acc": 0.6402110359246711,
+      "eval_f1": 0.7594675823716318,
+      "eval_f1_anger": 0.6421420256111757,
+      "eval_f1_disgust": 0.4648148148148148,
+      "eval_f1_fear": 0.6746532156368222,
+      "eval_f1_joy": 0.7537328697075065,
+      "eval_f1_neutral": 0.8463990997749438,
+      "eval_f1_sadness": 0.6885171790235082,
+      "eval_f1_surprise": 0.4835924006908463,
+      "eval_loss": 0.671157717704773,
+      "eval_prec": 0.7592351302120464,
+      "eval_prec_anger": 0.6245471014492754,
+      "eval_prec_disgust": 0.4826923076923077,
+      "eval_prec_fear": 0.7318741450068399,
+      "eval_prec_joy": 0.7372949179671868,
+      "eval_prec_neutral": 0.8454477332334207,
+      "eval_prec_sadness": 0.7005519779208832,
+      "eval_prec_surprise": 0.5204460966542751,
+      "eval_recall": 0.7605589219498959,
+      "eval_recall_anger": 0.6607570675610924,
+      "eval_recall_disgust": 0.44821428571428573,
+      "eval_recall_fear": 0.6257309941520468,
+      "eval_recall_joy": 0.7709205020920502,
+      "eval_recall_neutral": 0.847352609838528,
+      "eval_recall_sadness": 0.6768888888888889,
+      "eval_recall_surprise": 0.45161290322580644,
+      "eval_runtime": 14.5753,
+      "eval_samples_per_second": 1517.225,
+      "eval_steps_per_second": 11.869,
+      "step": 3712
+    },
+    {
+      "epoch": 2.4,
+      "learning_rate": 1.112841399137518e-05,
+      "loss": 0.5266,
+      "step": 3713
+    },
+    {
+      "epoch": 2.43,
+      "learning_rate": 1.056540488739818e-05,
+      "loss": 0.5276,
+      "step": 3760
+    },
+    {
+      "epoch": 2.46,
+      "learning_rate": 1.000239578342118e-05,
+      "loss": 0.5432,
+      "step": 3807
+    },
+    {
+      "epoch": 2.49,
+      "learning_rate": 9.439386679444178e-06,
+      "loss": 0.5262,
+      "step": 3854
+    },
+    {
+      "epoch": 2.52,
+      "learning_rate": 8.876377575467178e-06,
+      "loss": 0.5175,
+      "step": 3901
+    },
+    {
+      "epoch": 2.55,
+      "eval_accuracy": 0.7625033915166862,
+      "eval_b_acc": 0.6369042077487537,
+      "eval_f1": 0.7603749093215698,
+      "eval_f1_anger": 0.6429077177248053,
+      "eval_f1_disgust": 0.46938775510204084,
+      "eval_f1_fear": 0.677336747759283,
+      "eval_f1_joy": 0.7530406101834674,
+      "eval_f1_neutral": 0.8487682904241526,
+      "eval_f1_sadness": 0.6956521739130433,
+      "eval_f1_surprise": 0.457388105456775,
+      "eval_loss": 0.66249018907547,
+      "eval_prec": 0.7600295878449174,
+      "eval_prec_anger": 0.6334883720930232,
+      "eval_prec_disgust": 0.44805194805194803,
+      "eval_prec_fear": 0.7482319660537482,
+      "eval_prec_joy": 0.7421779764323446,
+      "eval_prec_neutral": 0.8374451754385965,
+      "eval_prec_sadness": 0.7251687560270009,
+      "eval_prec_surprise": 0.5320970042796006,
+      "eval_recall": 0.7625033915166862,
+      "eval_recall_anger": 0.6526114039290848,
+      "eval_recall_disgust": 0.4928571428571429,
+      "eval_recall_fear": 0.6187134502923977,
+      "eval_recall_joy": 0.7642259414225941,
+      "eval_recall_neutral": 0.8604018024784078,
+      "eval_recall_sadness": 0.6684444444444444,
+      "eval_recall_surprise": 0.4010752688172043,
+      "eval_runtime": 14.6386,
+      "eval_samples_per_second": 1510.666,
+      "eval_steps_per_second": 11.818,
+      "step": 3944
+    },
+    {
+      "epoch": 2.55,
+      "learning_rate": 8.313368471490178e-06,
+      "loss": 0.5337,
+      "step": 3948
+    },
+    {
+      "epoch": 2.58,
+      "learning_rate": 7.750359367513177e-06,
+      "loss": 0.5148,
+      "step": 3995
+    },
+    {
+      "epoch": 2.61,
+      "learning_rate": 7.1873502635361775e-06,
+      "loss": 0.5234,
+      "step": 4042
+    },
+    {
+      "epoch": 2.64,
+      "learning_rate": 6.624341159559177e-06,
+      "loss": 0.5286,
+      "step": 4089
+    },
+    {
+      "epoch": 2.68,
+      "learning_rate": 6.061332055582176e-06,
+      "loss": 0.5182,
+      "step": 4136
+    },
+    {
+      "epoch": 2.7,
+      "eval_accuracy": 0.7631364746314552,
+      "eval_b_acc": 0.6403726819328496,
+      "eval_f1": 0.7611758530200116,
+      "eval_f1_anger": 0.6441332689521971,
+      "eval_f1_disgust": 0.4635036496350365,
+      "eval_f1_fear": 0.6658725431804646,
+      "eval_f1_joy": 0.7548551093035079,
+      "eval_f1_neutral": 0.848629209284947,
+      "eval_f1_sadness": 0.6971687429218574,
+      "eval_f1_surprise": 0.4763636363636364,
+      "eval_loss": 0.6621036529541016,
+      "eval_prec": 0.7602393679680954,
+      "eval_prec_anger": 0.6491484184914842,
+      "eval_prec_disgust": 0.47388059701492535,
+      "eval_prec_fear": 0.6783980582524272,
+      "eval_prec_joy": 0.734322453016815,
+      "eval_prec_neutral": 0.844409331722279,
+      "eval_prec_sadness": 0.7108545034642032,
+      "eval_prec_surprise": 0.5458333333333333,
+      "eval_recall": 0.7631364746314552,
+      "eval_recall_anger": 0.639195016770484,
+      "eval_recall_disgust": 0.45357142857142857,
+      "eval_recall_fear": 0.6538011695906433,
+      "eval_recall_joy": 0.7765690376569038,
+      "eval_recall_neutral": 0.8528914757791964,
+      "eval_recall_sadness": 0.684,
+      "eval_recall_surprise": 0.42258064516129035,
+      "eval_runtime": 14.5758,
+      "eval_samples_per_second": 1517.169,
+      "eval_steps_per_second": 11.869,
+      "step": 4176
+    },
+    {
+      "epoch": 2.71,
+      "learning_rate": 5.498322951605176e-06,
+      "loss": 0.5301,
+      "step": 4183
+    },
+    {
+      "epoch": 2.74,
+      "learning_rate": 4.935313847628174e-06,
+      "loss": 0.5402,
+      "step": 4230
+    },
+    {
+      "epoch": 2.77,
+      "learning_rate": 4.372304743651174e-06,
+      "loss": 0.5167,
+      "step": 4277
+    },
+    {
+      "epoch": 2.8,
+      "learning_rate": 3.8092956396741735e-06,
+      "loss": 0.5004,
+      "step": 4324
+    },
+    {
+      "epoch": 2.83,
+      "learning_rate": 3.246286535697173e-06,
+      "loss": 0.5148,
+      "step": 4371
+    },
+    {
+      "epoch": 2.85,
+      "eval_accuracy": 0.7637243375237406,
+      "eval_b_acc": 0.6382943967754277,
+      "eval_f1": 0.7612453985473553,
+      "eval_f1_anger": 0.6462075848303392,
+      "eval_f1_disgust": 0.4666666666666667,
+      "eval_f1_fear": 0.6678592725104352,
+      "eval_f1_joy": 0.7563368765331154,
+      "eval_f1_neutral": 0.8485270885605427,
+      "eval_f1_sadness": 0.6918630502445532,
+      "eval_f1_surprise": 0.4760213143872114,
+      "eval_loss": 0.6637689471244812,
+      "eval_prec": 0.7597715932015663,
+      "eval_prec_anger": 0.6741280583029672,
+      "eval_prec_disgust": 0.5,
+      "eval_prec_fear": 0.681265206812652,
+      "eval_prec_joy": 0.7394084732214229,
+      "eval_prec_neutral": 0.8400183992640294,
+      "eval_prec_sadness": 0.6921708185053381,
+      "eval_prec_surprise": 0.5296442687747036,
+      "eval_recall": 0.7637243375237406,
+      "eval_recall_anger": 0.6205079060852899,
+      "eval_recall_disgust": 0.4375,
+      "eval_recall_fear": 0.6549707602339181,
+      "eval_recall_joy": 0.7740585774058577,
+      "eval_recall_neutral": 0.857209913631243,
+      "eval_recall_sadness": 0.6915555555555556,
+      "eval_recall_surprise": 0.432258064516129,
+      "eval_runtime": 14.5644,
+      "eval_samples_per_second": 1518.363,
+      "eval_steps_per_second": 11.878,
+      "step": 4408
+    },
+    {
+      "epoch": 2.86,
+      "learning_rate": 2.6832774317201726e-06,
+      "loss": 0.5231,
+      "step": 4418
+    },
+    {
+      "epoch": 2.89,
+      "learning_rate": 2.120268327743172e-06,
+      "loss": 0.5223,
+      "step": 4465
+    },
+    {
+      "epoch": 2.92,
+      "learning_rate": 1.5572592237661715e-06,
+      "loss": 0.525,
+      "step": 4512
+    },
+    {
+      "epoch": 2.95,
+      "learning_rate": 9.942501197891712e-07,
+      "loss": 0.5219,
+      "step": 4559
+    },
+    {
+      "epoch": 2.98,
+      "learning_rate": 4.312410158121706e-07,
+      "loss": 0.516,
+      "step": 4606
+    },
+    {
+      "epoch": 3.0,
+      "step": 4638,
+      "total_flos": 3.903427734912e+16,
+      "train_loss": 0.6570020180521673,
+      "train_runtime": 1377.6596,
+      "train_samples_per_second": 430.73,
+      "train_steps_per_second": 3.367
+    }
+  ],
+  "max_steps": 4638,
+  "num_train_epochs": 3,
+  "total_flos": 3.903427734912e+16,
+  "trial_name": null,
+  "trial_params": null
+}

training_args.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:d8b6d654a0fd9d25c51cd952b5043595530c71ec715e7e1fb0c43d08734c2b34
+size 4027

vocab.json ADDED Viewed

The diff for this file is too large to render. See raw diff