ChrisZeng commited on Apr 6, 2022

Commit

f01d183

1 Parent(s): 54fbaa5

Training in progress, epoch 8

Browse files

Files changed (40) hide show

checkpoint-490/added_tokens.json +1 -0
checkpoint-490/bpe.codes +0 -0
checkpoint-490/config.json +30 -0
checkpoint-490/optimizer.pt +3 -0
checkpoint-490/pytorch_model.bin +3 -0
checkpoint-490/rng_state.pth +3 -0
checkpoint-490/scaler.pt +3 -0
checkpoint-490/scheduler.pt +3 -0
checkpoint-490/special_tokens_map.json +1 -0
checkpoint-490/tokenizer_config.json +1 -0
checkpoint-490/trainer_state.json +128 -0
checkpoint-490/training_args.bin +3 -0
checkpoint-490/vocab.txt +0 -0
checkpoint-560/added_tokens.json +1 -0
checkpoint-560/bpe.codes +0 -0
checkpoint-560/config.json +30 -0
checkpoint-560/optimizer.pt +3 -0
checkpoint-560/pytorch_model.bin +3 -0
checkpoint-560/rng_state.pth +3 -0
checkpoint-560/scaler.pt +3 -0
checkpoint-560/scheduler.pt +3 -0
checkpoint-560/special_tokens_map.json +1 -0
checkpoint-560/tokenizer_config.json +1 -0
checkpoint-560/trainer_state.json +144 -0
checkpoint-560/training_args.bin +3 -0
checkpoint-560/vocab.txt +0 -0
checkpoint-630/added_tokens.json +1 -0
checkpoint-630/bpe.codes +0 -0
checkpoint-630/config.json +30 -0
checkpoint-630/optimizer.pt +3 -0
checkpoint-630/pytorch_model.bin +3 -0
checkpoint-630/rng_state.pth +3 -0
checkpoint-630/scaler.pt +3 -0
checkpoint-630/scheduler.pt +3 -0
checkpoint-630/special_tokens_map.json +1 -0
checkpoint-630/tokenizer_config.json +1 -0
checkpoint-630/trainer_state.json +160 -0
checkpoint-630/training_args.bin +3 -0
checkpoint-630/vocab.txt +0 -0
pytorch_model.bin +1 -1

checkpoint-490/added_tokens.json ADDED Viewed

	@@ -0,0 +1 @@


1	+ {"<mask>": 64000}

checkpoint-490/bpe.codes ADDED Viewed

The diff for this file is too large to render. See raw diff

checkpoint-490/config.json ADDED Viewed

	@@ -0,0 +1,30 @@

+{
+  "_name_or_path": "vinai/bertweet-covid19-base-cased",
+  "architectures": [
+    "RobertaForSequenceClassification"
+  ],
+  "attention_probs_dropout_prob": 0.1,
+  "bos_token_id": 0,
+  "classifier_dropout": null,
+  "eos_token_id": 2,
+  "gradient_checkpointing": false,
+  "hidden_act": "gelu",
+  "hidden_dropout_prob": 0.1,
+  "hidden_size": 768,
+  "initializer_range": 0.02,
+  "intermediate_size": 3072,
+  "layer_norm_eps": 1e-05,
+  "max_position_embeddings": 130,
+  "model_type": "roberta",
+  "num_attention_heads": 12,
+  "num_hidden_layers": 12,
+  "pad_token_id": 1,
+  "position_embedding_type": "absolute",
+  "problem_type": "multi_label_classification",
+  "tokenizer_class": "BertweetTokenizer",
+  "torch_dtype": "float32",
+  "transformers_version": "4.17.0",
+  "type_vocab_size": 1,
+  "use_cache": true,
+  "vocab_size": 64001
+}

checkpoint-490/optimizer.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:4b6cca65e48afd84c968b05ea9d830f649a42c0d8ff900bbfb80f4f13aa085f1
+size 1079327581

checkpoint-490/pytorch_model.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:a73e0815918bf34d607238230fa7e8c1a6b45e3dd18e4e1e7ff27622f92f55c2
+size 539689325

checkpoint-490/rng_state.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:d83257f141c405f56ebf1fd0c66157688c5100db8f619a195f01d84adae4c732
+size 14503

checkpoint-490/scaler.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:11979c764c292bfef1356e2956fd3e04a9906c6b0fade7e93fe8270c7a297284
+size 559

checkpoint-490/scheduler.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:000c8a98942c0dc9ccd77fe00e03af1d353b776ed9e00bef3da51a275dbb6ba9
+size 623

checkpoint-490/special_tokens_map.json ADDED Viewed

	@@ -0,0 +1 @@


1	+ {"bos_token": "<s>", "eos_token": "</s>", "unk_token": "<unk>", "sep_token": "</s>", "pad_token": "<pad>", "cls_token": "<s>", "mask_token": "<mask>"}

checkpoint-490/tokenizer_config.json ADDED Viewed

	@@ -0,0 +1 @@


1	+ {"normalization": true, "bos_token": "<s>", "eos_token": "</s>", "sep_token": "</s>", "cls_token": "<s>", "unk_token": "<unk>", "pad_token": "<pad>", "mask_token": "<mask>", "special_tokens_map_file": null, "name_or_path": "vinai/bertweet-covid19-base-cased", "tokenizer_class": "BertweetTokenizer"}

checkpoint-490/trainer_state.json ADDED Viewed

	@@ -0,0 +1,128 @@

+{
+  "best_metric": 0.7381492469031885,
+  "best_model_checkpoint": "outputs/bertweet/checkpoint-490",
+  "epoch": 6.99290780141844,
+  "global_step": 490,
+  "is_hyper_param_search": false,
+  "is_local_process_zero": true,
+  "is_world_process_zero": true,
+  "log_history": [
+    {
+      "epoch": 0.99,
+      "learning_rate": 9.666666666666666e-07,
+      "loss": 0.6925,
+      "step": 70
+    },
+    {
+      "epoch": 0.99,
+      "eval_accuracy": 0.573,
+      "eval_f1": 0.3642720915448188,
+      "eval_loss": 0.6826930046081543,
+      "eval_runtime": 2.9877,
+      "eval_samples_per_second": 334.703,
+      "eval_steps_per_second": 41.838,
+      "step": 70
+    },
+    {
+      "epoch": 1.99,
+      "learning_rate": 9.333333333333333e-07,
+      "loss": 0.6823,
+      "step": 140
+    },
+    {
+      "epoch": 1.99,
+      "eval_accuracy": 0.573,
+      "eval_f1": 0.3642720915448188,
+      "eval_loss": 0.6736124753952026,
+      "eval_runtime": 3.0497,
+      "eval_samples_per_second": 327.901,
+      "eval_steps_per_second": 40.988,
+      "step": 140
+    },
+    {
+      "epoch": 2.99,
+      "learning_rate": 9e-07,
+      "loss": 0.6713,
+      "step": 210
+    },
+    {
+      "epoch": 2.99,
+      "eval_accuracy": 0.587,
+      "eval_f1": 0.39928932873127865,
+      "eval_loss": 0.656767725944519,
+      "eval_runtime": 3.0012,
+      "eval_samples_per_second": 333.2,
+      "eval_steps_per_second": 41.65,
+      "step": 210
+    },
+    {
+      "epoch": 3.99,
+      "learning_rate": 8.666666666666667e-07,
+      "loss": 0.6468,
+      "step": 280
+    },
+    {
+      "epoch": 3.99,
+      "eval_accuracy": 0.7,
+      "eval_f1": 0.6707623826267894,
+      "eval_loss": 0.6210379600524902,
+      "eval_runtime": 3.0442,
+      "eval_samples_per_second": 328.492,
+      "eval_steps_per_second": 41.062,
+      "step": 280
+    },
+    {
+      "epoch": 4.99,
+      "learning_rate": 8.333333333333333e-07,
+      "loss": 0.6047,
+      "step": 350
+    },
+    {
+      "epoch": 4.99,
+      "eval_accuracy": 0.732,
+      "eval_f1": 0.7285955019767969,
+      "eval_loss": 0.5784569382667542,
+      "eval_runtime": 3.0658,
+      "eval_samples_per_second": 326.18,
+      "eval_steps_per_second": 40.773,
+      "step": 350
+    },
+    {
+      "epoch": 5.99,
+      "learning_rate": 8e-07,
+      "loss": 0.5648,
+      "step": 420
+    },
+    {
+      "epoch": 5.99,
+      "eval_accuracy": 0.733,
+      "eval_f1": 0.7318671386608421,
+      "eval_loss": 0.5537055730819702,
+      "eval_runtime": 3.061,
+      "eval_samples_per_second": 326.692,
+      "eval_steps_per_second": 40.836,
+      "step": 420
+    },
+    {
+      "epoch": 6.99,
+      "learning_rate": 7.666666666666667e-07,
+      "loss": 0.536,
+      "step": 490
+    },
+    {
+      "epoch": 6.99,
+      "eval_accuracy": 0.739,
+      "eval_f1": 0.7381492469031885,
+      "eval_loss": 0.5406165719032288,
+      "eval_runtime": 3.3555,
+      "eval_samples_per_second": 298.016,
+      "eval_steps_per_second": 37.252,
+      "step": 490
+    }
+  ],
+  "max_steps": 2100,
+  "num_train_epochs": 30,
+  "total_flos": 6215998682880000.0,
+  "trial_name": null,
+  "trial_params": null
+}

checkpoint-490/training_args.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:8be60ed58549fe1b3185c4d116e2ed7593eafbe162cc3300999b64c649675d04
+size 3119

checkpoint-490/vocab.txt ADDED Viewed

The diff for this file is too large to render. See raw diff

checkpoint-560/added_tokens.json ADDED Viewed

	@@ -0,0 +1 @@


1	+ {"<mask>": 64000}

checkpoint-560/bpe.codes ADDED Viewed

The diff for this file is too large to render. See raw diff

checkpoint-560/config.json ADDED Viewed

	@@ -0,0 +1,30 @@

+{
+  "_name_or_path": "vinai/bertweet-covid19-base-cased",
+  "architectures": [
+    "RobertaForSequenceClassification"
+  ],
+  "attention_probs_dropout_prob": 0.1,
+  "bos_token_id": 0,
+  "classifier_dropout": null,
+  "eos_token_id": 2,
+  "gradient_checkpointing": false,
+  "hidden_act": "gelu",
+  "hidden_dropout_prob": 0.1,
+  "hidden_size": 768,
+  "initializer_range": 0.02,
+  "intermediate_size": 3072,
+  "layer_norm_eps": 1e-05,
+  "max_position_embeddings": 130,
+  "model_type": "roberta",
+  "num_attention_heads": 12,
+  "num_hidden_layers": 12,
+  "pad_token_id": 1,
+  "position_embedding_type": "absolute",
+  "problem_type": "multi_label_classification",
+  "tokenizer_class": "BertweetTokenizer",
+  "torch_dtype": "float32",
+  "transformers_version": "4.17.0",
+  "type_vocab_size": 1,
+  "use_cache": true,
+  "vocab_size": 64001
+}

checkpoint-560/optimizer.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:ea0af2742714fc9813ca53320a44cae3c405a49e0b36321a924af03f000d43f2
+size 1079327581

checkpoint-560/pytorch_model.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:3392dc2290586b73cc7916fafb51981e5fb4ecb7cda0a83f08409e2a009f33f1
+size 539689325

checkpoint-560/rng_state.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:4ca12a0b1d8dae51670b8290d0295c0b10ee4e96d2d8d15692d929bbab3c8dcf
+size 14503

checkpoint-560/scaler.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:a8ca221068257890306847f8d3ee335b25a16ad3c8d4a625f911e0389b9d1b6f
+size 559

checkpoint-560/scheduler.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:799c60f894579b51eeaadbf08b4332c24ed17d6cd503965f0723d32d97cd600b
+size 623

checkpoint-560/special_tokens_map.json ADDED Viewed

	@@ -0,0 +1 @@


1	+ {"bos_token": "<s>", "eos_token": "</s>", "unk_token": "<unk>", "sep_token": "</s>", "pad_token": "<pad>", "cls_token": "<s>", "mask_token": "<mask>"}

checkpoint-560/tokenizer_config.json ADDED Viewed

	@@ -0,0 +1 @@


1	+ {"normalization": true, "bos_token": "<s>", "eos_token": "</s>", "sep_token": "</s>", "cls_token": "<s>", "unk_token": "<unk>", "pad_token": "<pad>", "mask_token": "<mask>", "special_tokens_map_file": null, "name_or_path": "vinai/bertweet-covid19-base-cased", "tokenizer_class": "BertweetTokenizer"}

checkpoint-560/trainer_state.json ADDED Viewed

	@@ -0,0 +1,144 @@

+{
+  "best_metric": 0.7430750702529104,
+  "best_model_checkpoint": "outputs/bertweet/checkpoint-560",
+  "epoch": 7.99290780141844,
+  "global_step": 560,
+  "is_hyper_param_search": false,
+  "is_local_process_zero": true,
+  "is_world_process_zero": true,
+  "log_history": [
+    {
+      "epoch": 0.99,
+      "learning_rate": 9.666666666666666e-07,
+      "loss": 0.6925,
+      "step": 70
+    },
+    {
+      "epoch": 0.99,
+      "eval_accuracy": 0.573,
+      "eval_f1": 0.3642720915448188,
+      "eval_loss": 0.6826930046081543,
+      "eval_runtime": 2.9877,
+      "eval_samples_per_second": 334.703,
+      "eval_steps_per_second": 41.838,
+      "step": 70
+    },
+    {
+      "epoch": 1.99,
+      "learning_rate": 9.333333333333333e-07,
+      "loss": 0.6823,
+      "step": 140
+    },
+    {
+      "epoch": 1.99,
+      "eval_accuracy": 0.573,
+      "eval_f1": 0.3642720915448188,
+      "eval_loss": 0.6736124753952026,
+      "eval_runtime": 3.0497,
+      "eval_samples_per_second": 327.901,
+      "eval_steps_per_second": 40.988,
+      "step": 140
+    },
+    {
+      "epoch": 2.99,
+      "learning_rate": 9e-07,
+      "loss": 0.6713,
+      "step": 210
+    },
+    {
+      "epoch": 2.99,
+      "eval_accuracy": 0.587,
+      "eval_f1": 0.39928932873127865,
+      "eval_loss": 0.656767725944519,
+      "eval_runtime": 3.0012,
+      "eval_samples_per_second": 333.2,
+      "eval_steps_per_second": 41.65,
+      "step": 210
+    },
+    {
+      "epoch": 3.99,
+      "learning_rate": 8.666666666666667e-07,
+      "loss": 0.6468,
+      "step": 280
+    },
+    {
+      "epoch": 3.99,
+      "eval_accuracy": 0.7,
+      "eval_f1": 0.6707623826267894,
+      "eval_loss": 0.6210379600524902,
+      "eval_runtime": 3.0442,
+      "eval_samples_per_second": 328.492,
+      "eval_steps_per_second": 41.062,
+      "step": 280
+    },
+    {
+      "epoch": 4.99,
+      "learning_rate": 8.333333333333333e-07,
+      "loss": 0.6047,
+      "step": 350
+    },
+    {
+      "epoch": 4.99,
+      "eval_accuracy": 0.732,
+      "eval_f1": 0.7285955019767969,
+      "eval_loss": 0.5784569382667542,
+      "eval_runtime": 3.0658,
+      "eval_samples_per_second": 326.18,
+      "eval_steps_per_second": 40.773,
+      "step": 350
+    },
+    {
+      "epoch": 5.99,
+      "learning_rate": 8e-07,
+      "loss": 0.5648,
+      "step": 420
+    },
+    {
+      "epoch": 5.99,
+      "eval_accuracy": 0.733,
+      "eval_f1": 0.7318671386608421,
+      "eval_loss": 0.5537055730819702,
+      "eval_runtime": 3.061,
+      "eval_samples_per_second": 326.692,
+      "eval_steps_per_second": 40.836,
+      "step": 420
+    },
+    {
+      "epoch": 6.99,
+      "learning_rate": 7.666666666666667e-07,
+      "loss": 0.536,
+      "step": 490
+    },
+    {
+      "epoch": 6.99,
+      "eval_accuracy": 0.739,
+      "eval_f1": 0.7381492469031885,
+      "eval_loss": 0.5406165719032288,
+      "eval_runtime": 3.3555,
+      "eval_samples_per_second": 298.016,
+      "eval_steps_per_second": 37.252,
+      "step": 490
+    },
+    {
+      "epoch": 7.99,
+      "learning_rate": 7.333333333333332e-07,
+      "loss": 0.5175,
+      "step": 560
+    },
+    {
+      "epoch": 7.99,
+      "eval_accuracy": 0.744,
+      "eval_f1": 0.7430750702529104,
+      "eval_loss": 0.5307690501213074,
+      "eval_runtime": 3.1364,
+      "eval_samples_per_second": 318.842,
+      "eval_steps_per_second": 39.855,
+      "step": 560
+    }
+  ],
+  "max_steps": 2100,
+  "num_train_epochs": 30,
+  "total_flos": 7103998494720000.0,
+  "trial_name": null,
+  "trial_params": null
+}

checkpoint-560/training_args.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:8be60ed58549fe1b3185c4d116e2ed7593eafbe162cc3300999b64c649675d04
+size 3119

checkpoint-560/vocab.txt ADDED Viewed

The diff for this file is too large to render. See raw diff

checkpoint-630/added_tokens.json ADDED Viewed

	@@ -0,0 +1 @@


1	+ {"<mask>": 64000}

checkpoint-630/bpe.codes ADDED Viewed

The diff for this file is too large to render. See raw diff

checkpoint-630/config.json ADDED Viewed

	@@ -0,0 +1,30 @@

+{
+  "_name_or_path": "vinai/bertweet-covid19-base-cased",
+  "architectures": [
+    "RobertaForSequenceClassification"
+  ],
+  "attention_probs_dropout_prob": 0.1,
+  "bos_token_id": 0,
+  "classifier_dropout": null,
+  "eos_token_id": 2,
+  "gradient_checkpointing": false,
+  "hidden_act": "gelu",
+  "hidden_dropout_prob": 0.1,
+  "hidden_size": 768,
+  "initializer_range": 0.02,
+  "intermediate_size": 3072,
+  "layer_norm_eps": 1e-05,
+  "max_position_embeddings": 130,
+  "model_type": "roberta",
+  "num_attention_heads": 12,
+  "num_hidden_layers": 12,
+  "pad_token_id": 1,
+  "position_embedding_type": "absolute",
+  "problem_type": "multi_label_classification",
+  "tokenizer_class": "BertweetTokenizer",
+  "torch_dtype": "float32",
+  "transformers_version": "4.17.0",
+  "type_vocab_size": 1,
+  "use_cache": true,
+  "vocab_size": 64001
+}

checkpoint-630/optimizer.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:ed3275b6aa834b6e3731e0c09acb3cc7ce4de1843bb8e285c82980e6e8cdfb24
+size 1079327581

checkpoint-630/pytorch_model.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:340ff4f94bbd81a9356df698f57832fd0cd040d275e66581a4a35af4c555835f
+size 539689325

checkpoint-630/rng_state.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:cf2cef1bd2e8debc8dfd06090f4a9e33703d3bd8a60c5f233ea9bc207d960164
+size 14503

checkpoint-630/scaler.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:62ca5700851802910eef70fadd0dbe9dc923a65ce51e988971904b33dee70ff3
+size 559

checkpoint-630/scheduler.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:c175b756e1d994b8675da4169311fa522310810e074f17bbabbc64f9f178114d
+size 623

checkpoint-630/special_tokens_map.json ADDED Viewed

	@@ -0,0 +1 @@


1	+ {"bos_token": "<s>", "eos_token": "</s>", "unk_token": "<unk>", "sep_token": "</s>", "pad_token": "<pad>", "cls_token": "<s>", "mask_token": "<mask>"}

checkpoint-630/tokenizer_config.json ADDED Viewed

	@@ -0,0 +1 @@


1	+ {"normalization": true, "bos_token": "<s>", "eos_token": "</s>", "sep_token": "</s>", "cls_token": "<s>", "unk_token": "<unk>", "pad_token": "<pad>", "mask_token": "<mask>", "special_tokens_map_file": null, "name_or_path": "vinai/bertweet-covid19-base-cased", "tokenizer_class": "BertweetTokenizer"}

checkpoint-630/trainer_state.json ADDED Viewed

	@@ -0,0 +1,160 @@

+{
+  "best_metric": 0.7504007121097755,
+  "best_model_checkpoint": "outputs/bertweet/checkpoint-630",
+  "epoch": 8.99290780141844,
+  "global_step": 630,
+  "is_hyper_param_search": false,
+  "is_local_process_zero": true,
+  "is_world_process_zero": true,
+  "log_history": [
+    {
+      "epoch": 0.99,
+      "learning_rate": 9.666666666666666e-07,
+      "loss": 0.6925,
+      "step": 70
+    },
+    {
+      "epoch": 0.99,
+      "eval_accuracy": 0.573,
+      "eval_f1": 0.3642720915448188,
+      "eval_loss": 0.6826930046081543,
+      "eval_runtime": 2.9877,
+      "eval_samples_per_second": 334.703,
+      "eval_steps_per_second": 41.838,
+      "step": 70
+    },
+    {
+      "epoch": 1.99,
+      "learning_rate": 9.333333333333333e-07,
+      "loss": 0.6823,
+      "step": 140
+    },
+    {
+      "epoch": 1.99,
+      "eval_accuracy": 0.573,
+      "eval_f1": 0.3642720915448188,
+      "eval_loss": 0.6736124753952026,
+      "eval_runtime": 3.0497,
+      "eval_samples_per_second": 327.901,
+      "eval_steps_per_second": 40.988,
+      "step": 140
+    },
+    {
+      "epoch": 2.99,
+      "learning_rate": 9e-07,
+      "loss": 0.6713,
+      "step": 210
+    },
+    {
+      "epoch": 2.99,
+      "eval_accuracy": 0.587,
+      "eval_f1": 0.39928932873127865,
+      "eval_loss": 0.656767725944519,
+      "eval_runtime": 3.0012,
+      "eval_samples_per_second": 333.2,
+      "eval_steps_per_second": 41.65,
+      "step": 210
+    },
+    {
+      "epoch": 3.99,
+      "learning_rate": 8.666666666666667e-07,
+      "loss": 0.6468,
+      "step": 280
+    },
+    {
+      "epoch": 3.99,
+      "eval_accuracy": 0.7,
+      "eval_f1": 0.6707623826267894,
+      "eval_loss": 0.6210379600524902,
+      "eval_runtime": 3.0442,
+      "eval_samples_per_second": 328.492,
+      "eval_steps_per_second": 41.062,
+      "step": 280
+    },
+    {
+      "epoch": 4.99,
+      "learning_rate": 8.333333333333333e-07,
+      "loss": 0.6047,
+      "step": 350
+    },
+    {
+      "epoch": 4.99,
+      "eval_accuracy": 0.732,
+      "eval_f1": 0.7285955019767969,
+      "eval_loss": 0.5784569382667542,
+      "eval_runtime": 3.0658,
+      "eval_samples_per_second": 326.18,
+      "eval_steps_per_second": 40.773,
+      "step": 350
+    },
+    {
+      "epoch": 5.99,
+      "learning_rate": 8e-07,
+      "loss": 0.5648,
+      "step": 420
+    },
+    {
+      "epoch": 5.99,
+      "eval_accuracy": 0.733,
+      "eval_f1": 0.7318671386608421,
+      "eval_loss": 0.5537055730819702,
+      "eval_runtime": 3.061,
+      "eval_samples_per_second": 326.692,
+      "eval_steps_per_second": 40.836,
+      "step": 420
+    },
+    {
+      "epoch": 6.99,
+      "learning_rate": 7.666666666666667e-07,
+      "loss": 0.536,
+      "step": 490
+    },
+    {
+      "epoch": 6.99,
+      "eval_accuracy": 0.739,
+      "eval_f1": 0.7381492469031885,
+      "eval_loss": 0.5406165719032288,
+      "eval_runtime": 3.3555,
+      "eval_samples_per_second": 298.016,
+      "eval_steps_per_second": 37.252,
+      "step": 490
+    },
+    {
+      "epoch": 7.99,
+      "learning_rate": 7.333333333333332e-07,
+      "loss": 0.5175,
+      "step": 560
+    },
+    {
+      "epoch": 7.99,
+      "eval_accuracy": 0.744,
+      "eval_f1": 0.7430750702529104,
+      "eval_loss": 0.5307690501213074,
+      "eval_runtime": 3.1364,
+      "eval_samples_per_second": 318.842,
+      "eval_steps_per_second": 39.855,
+      "step": 560
+    },
+    {
+      "epoch": 8.99,
+      "learning_rate": 7e-07,
+      "loss": 0.5018,
+      "step": 630
+    },
+    {
+      "epoch": 8.99,
+      "eval_accuracy": 0.751,
+      "eval_f1": 0.7504007121097755,
+      "eval_loss": 0.5235322117805481,
+      "eval_runtime": 2.9996,
+      "eval_samples_per_second": 333.377,
+      "eval_steps_per_second": 41.672,
+      "step": 630
+    }
+  ],
+  "max_steps": 2100,
+  "num_train_epochs": 30,
+  "total_flos": 7991998306560000.0,
+  "trial_name": null,
+  "trial_params": null
+}

checkpoint-630/training_args.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:8be60ed58549fe1b3185c4d116e2ed7593eafbe162cc3300999b64c649675d04
+size 3119

checkpoint-630/vocab.txt ADDED Viewed

The diff for this file is too large to render. See raw diff

pytorch_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:1f0b2f4bffbd4dbbe55e73f71c07bd851c61e243cdee504c191652a7e1e80571
 size 539689325

 version https://git-lfs.github.com/spec/v1
+oid sha256:340ff4f94bbd81a9356df698f57832fd0cd040d275e66581a4a35af4c555835f
 size 539689325