gchhablani commited on Oct 7, 2021

Commit

31092f0

•

1 Parent(s): 814ae32

Update checkpoints

Browse files

Files changed (44) hide show

README.md +76 -0
all_results.json +14 -0
checkpoint-16838/config.json +33 -0
checkpoint-16838/optimizer.pt +3 -0
checkpoint-16838/pytorch_model.bin +3 -0
checkpoint-16838/rng_state.pth +3 -0
checkpoint-16838/scheduler.pt +3 -0
checkpoint-16838/special_tokens_map.json +1 -0
checkpoint-16838/tokenizer.json +0 -0
checkpoint-16838/tokenizer_config.json +1 -0
checkpoint-16838/trainer_state.json +31 -0
checkpoint-16838/training_args.bin +3 -0
checkpoint-33676/config.json +33 -0
checkpoint-33676/optimizer.pt +3 -0
checkpoint-33676/pytorch_model.bin +3 -0
checkpoint-33676/rng_state.pth +3 -0
checkpoint-33676/scheduler.pt +3 -0
checkpoint-33676/special_tokens_map.json +1 -0
checkpoint-33676/tokenizer.json +0 -0
checkpoint-33676/tokenizer_config.json +1 -0
checkpoint-33676/trainer_state.json +46 -0
checkpoint-33676/training_args.bin +3 -0
checkpoint-50514/config.json +33 -0
checkpoint-50514/optimizer.pt +3 -0
checkpoint-50514/pytorch_model.bin +3 -0
checkpoint-50514/rng_state.pth +3 -0
checkpoint-50514/scheduler.pt +3 -0
checkpoint-50514/special_tokens_map.json +1 -0
checkpoint-50514/tokenizer.json +0 -0
checkpoint-50514/tokenizer_config.json +1 -0
checkpoint-50514/trainer_state.json +61 -0
checkpoint-50514/training_args.bin +3 -0
config.json +33 -0
eval_results.json +9 -0
pytorch_model.bin +3 -0
runs/Sep24_12-16-35_patrick-general-gpu/1632485815.4394088/events.out.tfevents.1632485815.patrick-general-gpu.1069019.1 +3 -0
runs/Sep24_12-16-35_patrick-general-gpu/events.out.tfevents.1632485815.patrick-general-gpu.1069019.0 +3 -0
runs/Sep24_12-16-35_patrick-general-gpu/events.out.tfevents.1632500341.patrick-general-gpu.1069019.2 +3 -0
special_tokens_map.json +1 -0
tokenizer.json +0 -0
tokenizer_config.json +1 -0
train_results.json +8 -0
trainer_state.json +70 -0
training_args.bin +3 -0

README.md ADDED Viewed

	@@ -0,0 +1,76 @@

+---
+language:
+- en
+license: apache-2.0
+tags:
+- generated_from_trainer
+datasets:
+- glue
+metrics:
+- accuracy
+model-index:
+- name: fnet-large-finetuned-sst2
+  results:
+  - task:
+      name: Text Classification
+      type: text-classification
+    dataset:
+      name: GLUE SST2
+      type: glue
+      args: sst2
+    metrics:
+    - name: Accuracy
+      type: accuracy
+      value: 0.9048165137614679
+---
+<!-- This model card has been generated automatically according to the information the Trainer had access to. You
+should probably proofread and complete it, then remove this comment. -->
+# fnet-large-finetuned-sst2
+This model is a fine-tuned version of [google/fnet-large](https://huggingface.co/google/fnet-large) on the GLUE SST2 dataset.
+It achieves the following results on the evaluation set:
+- Loss: 0.5240
+- Accuracy: 0.9048
+## Model description
+More information needed
+## Intended uses & limitations
+More information needed
+## Training and evaluation data
+More information needed
+## Training procedure
+### Training hyperparameters
+The following hyperparameters were used during training:
+- learning_rate: 2e-05
+- train_batch_size: 4
+- eval_batch_size: 8
+- seed: 42
+- optimizer: Adam with betas=(0.9,0.999) and epsilon=1e-08
+- lr_scheduler_type: linear
+- num_epochs: 3.0
+### Training results
+| Training Loss | Epoch | Step  | Validation Loss | Accuracy |
+|:-------------:|:-----:|:-----:|:---------------:|:--------:|
+| 0.394         | 1.0   | 16838 | 0.3896          | 0.8968   |
+| 0.2076        | 2.0   | 33676 | 0.5100          | 0.8956   |
+| 0.1148        | 3.0   | 50514 | 0.5240          | 0.9048   |
+### Framework versions
+- Transformers 4.11.0.dev0
+- Pytorch 1.9.0
+- Datasets 1.12.1
+- Tokenizers 0.10.3

all_results.json ADDED Viewed

	@@ -0,0 +1,14 @@

+{
+    "epoch": 3.0,
+    "eval_accuracy": 0.9048165137614679,
+    "eval_loss": 0.5239545702934265,
+    "eval_runtime": 19.0697,
+    "eval_samples": 872,
+    "eval_samples_per_second": 45.727,
+    "eval_steps_per_second": 5.716,
+    "train_loss": 0.23881868657776187,
+    "train_runtime": 14505.0544,
+    "train_samples": 67349,
+    "train_samples_per_second": 13.929,
+    "train_steps_per_second": 3.483
+}

checkpoint-16838/config.json ADDED Viewed

	@@ -0,0 +1,33 @@

+{
+  "_name_or_path": "google/fnet-large",
+  "architectures": [
+    "FNetForSequenceClassification"
+  ],
+  "bos_token_id": 1,
+  "eos_token_id": 2,
+  "finetuning_task": "sst2",
+  "hidden_act": "gelu_new",
+  "hidden_dropout_prob": 0.1,
+  "hidden_size": 1024,
+  "id2label": {
+    "0": "negative",
+    "1": "positive"
+  },
+  "initializer_range": 0.02,
+  "intermediate_size": 4096,
+  "label2id": {
+    "negative": 0,
+    "positive": 1
+  },
+  "layer_norm_eps": 1e-12,
+  "max_position_embeddings": 512,
+  "model_type": "fnet",
+  "num_hidden_layers": 24,
+  "pad_token_id": 3,
+  "torch_dtype": "float32",
+  "tpu_short_seq_length": 512,
+  "transformers_version": "4.11.0.dev0",
+  "type_vocab_size": 4,
+  "use_tpu_fourier_optimizations": false,
+  "vocab_size": 32000
+}

checkpoint-16838/optimizer.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:91a7289f2f2917083eb2ec844bff6b918b1f6fc0a5a37e08f5acb153cd0d024b
+size 1895696981

checkpoint-16838/pytorch_model.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:444cd337752ee912244e41c19d765568f5336754da22d912cf3e46cb31e42985
+size 947877033

checkpoint-16838/rng_state.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:8ff4d8efc54045f93675f588d8af1a465fc39f1f1d547c72b3aaeaae6a4abded
+size 14503

checkpoint-16838/scheduler.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:eae66c884bb33823868cb811e759ca1de834181799cc0072609abd7b9ad7aa91
+size 623

checkpoint-16838/special_tokens_map.json ADDED Viewed

	@@ -0,0 +1 @@


1	+ {"unk_token": "<unk>", "sep_token": "[SEP]", "pad_token": "<pad>", "cls_token": "[CLS]", "mask_token": {"content": "[MASK]", "single_word": false, "lstrip": true, "rstrip": false, "normalized": true}}

checkpoint-16838/tokenizer.json ADDED Viewed

The diff for this file is too large to render. See raw diff

checkpoint-16838/tokenizer_config.json ADDED Viewed

	@@ -0,0 +1 @@

+ {"do_lower_case": false, "remove_space": true, "keep_accents": true, "unk_token": "<unk>", "sep_token": "[SEP]", "pad_token": "<pad>", "cls_token": "[CLS]", "mask_token": {"content": "[MASK]", "single_word": false, "lstrip": true, "rstrip": false, "normalized": true, "__type": "AddedToken"}, "sp_model_kwargs": {}, "model_max_length": 512, "special_tokens_map_file": "/home/gunjan/.cache/huggingface/transformers/9a50cd9b3771023230b1128ab5e112461bf36f5826d5f7eb654348e956979a54.a2cfb41d43ad2ac50fa89998bfa88393398e3bb3439ee99e1b00933bce2eb1ba", "name_or_path": "google/fnet-large", "tokenizer_class": "FNetTokenizer"}

checkpoint-16838/trainer_state.json ADDED Viewed

	@@ -0,0 +1,31 @@

+{
+  "best_metric": null,
+  "best_model_checkpoint": null,
+  "epoch": 1.0,
+  "global_step": 16838,
+  "is_hyper_param_search": false,
+  "is_local_process_zero": true,
+  "is_world_process_zero": true,
+  "log_history": [
+    {
+      "epoch": 1.0,
+      "learning_rate": 1.3333333333333333e-05,
+      "loss": 0.394,
+      "step": 16838
+    },
+    {
+      "epoch": 1.0,
+      "eval_accuracy": 0.8967889908256881,
+      "eval_loss": 0.3896108567714691,
+      "eval_runtime": 19.0439,
+      "eval_samples_per_second": 45.789,
+      "eval_steps_per_second": 5.724,
+      "step": 16838
+    }
+  ],
+  "max_steps": 50514,
+  "num_train_epochs": 3,
+  "total_flos": 4.213461867364147e+16,
+  "trial_name": null,
+  "trial_params": null
+}

checkpoint-16838/training_args.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:fb72553013dd35026c47f6f4467bb571ac0675d6549f1a069d3d19b0c3a66e86
+size 2735

checkpoint-33676/config.json ADDED Viewed

	@@ -0,0 +1,33 @@

+{
+  "_name_or_path": "google/fnet-large",
+  "architectures": [
+    "FNetForSequenceClassification"
+  ],
+  "bos_token_id": 1,
+  "eos_token_id": 2,
+  "finetuning_task": "sst2",
+  "hidden_act": "gelu_new",
+  "hidden_dropout_prob": 0.1,
+  "hidden_size": 1024,
+  "id2label": {
+    "0": "negative",
+    "1": "positive"
+  },
+  "initializer_range": 0.02,
+  "intermediate_size": 4096,
+  "label2id": {
+    "negative": 0,
+    "positive": 1
+  },
+  "layer_norm_eps": 1e-12,
+  "max_position_embeddings": 512,
+  "model_type": "fnet",
+  "num_hidden_layers": 24,
+  "pad_token_id": 3,
+  "torch_dtype": "float32",
+  "tpu_short_seq_length": 512,
+  "transformers_version": "4.11.0.dev0",
+  "type_vocab_size": 4,
+  "use_tpu_fourier_optimizations": false,
+  "vocab_size": 32000
+}

checkpoint-33676/optimizer.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:7a4394bacab91d9b5862d475bf2a8767a0bd3c5a79182d2178c84b61a3039cdd
+size 1895696981

checkpoint-33676/pytorch_model.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:f0464e206160c6380fb98b470a1ba6232eeb2ec4cf5fde9496451b96646ef7bc
+size 947877033

checkpoint-33676/rng_state.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:48b58dab6a05d21f8714b1448dbd1d86d23e1db99fc84ee77e74119b6b23b62f
+size 14503

checkpoint-33676/scheduler.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:0a8e383a96a8477d2d931b1a89e7d5d2676902b87fc0b4a137fe0efa48a132c1
+size 623

checkpoint-33676/special_tokens_map.json ADDED Viewed

	@@ -0,0 +1 @@


1	+ {"unk_token": "<unk>", "sep_token": "[SEP]", "pad_token": "<pad>", "cls_token": "[CLS]", "mask_token": {"content": "[MASK]", "single_word": false, "lstrip": true, "rstrip": false, "normalized": true}}

checkpoint-33676/tokenizer.json ADDED Viewed

The diff for this file is too large to render. See raw diff

checkpoint-33676/tokenizer_config.json ADDED Viewed

	@@ -0,0 +1 @@

checkpoint-33676/trainer_state.json ADDED Viewed

	@@ -0,0 +1,46 @@

+{
+  "best_metric": null,
+  "best_model_checkpoint": null,
+  "epoch": 2.0,
+  "global_step": 33676,
+  "is_hyper_param_search": false,
+  "is_local_process_zero": true,
+  "is_world_process_zero": true,
+  "log_history": [
+    {
+      "epoch": 1.0,
+      "learning_rate": 1.3333333333333333e-05,
+      "loss": 0.394,
+      "step": 16838
+    },
+    {
+      "epoch": 1.0,
+      "eval_accuracy": 0.8967889908256881,
+      "eval_loss": 0.3896108567714691,
+      "eval_runtime": 19.0439,
+      "eval_samples_per_second": 45.789,
+      "eval_steps_per_second": 5.724,
+      "step": 16838
+    },
+    {
+      "epoch": 2.0,
+      "learning_rate": 6.666666666666667e-06,
+      "loss": 0.2076,
+      "step": 33676
+    },
+    {
+      "epoch": 2.0,
+      "eval_accuracy": 0.8956422018348624,
+      "eval_loss": 0.5100129246711731,
+      "eval_runtime": 19.0123,
+      "eval_samples_per_second": 45.865,
+      "eval_steps_per_second": 5.733,
+      "step": 33676
+    }
+  ],
+  "max_steps": 50514,
+  "num_train_epochs": 3,
+  "total_flos": 8.426923734728294e+16,
+  "trial_name": null,
+  "trial_params": null
+}

checkpoint-33676/training_args.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:fb72553013dd35026c47f6f4467bb571ac0675d6549f1a069d3d19b0c3a66e86
+size 2735

checkpoint-50514/config.json ADDED Viewed

	@@ -0,0 +1,33 @@

+{
+  "_name_or_path": "google/fnet-large",
+  "architectures": [
+    "FNetForSequenceClassification"
+  ],
+  "bos_token_id": 1,
+  "eos_token_id": 2,
+  "finetuning_task": "sst2",
+  "hidden_act": "gelu_new",
+  "hidden_dropout_prob": 0.1,
+  "hidden_size": 1024,
+  "id2label": {
+    "0": "negative",
+    "1": "positive"
+  },
+  "initializer_range": 0.02,
+  "intermediate_size": 4096,
+  "label2id": {
+    "negative": 0,
+    "positive": 1
+  },
+  "layer_norm_eps": 1e-12,
+  "max_position_embeddings": 512,
+  "model_type": "fnet",
+  "num_hidden_layers": 24,
+  "pad_token_id": 3,
+  "torch_dtype": "float32",
+  "tpu_short_seq_length": 512,
+  "transformers_version": "4.11.0.dev0",
+  "type_vocab_size": 4,
+  "use_tpu_fourier_optimizations": false,
+  "vocab_size": 32000
+}

checkpoint-50514/optimizer.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:0b64a8365fcbb220d48dd9918cdb17c1becc94b844ae66b2df45e78208013194
+size 1895696981

checkpoint-50514/pytorch_model.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:32a4a707ec45dda50ae24c48ab665b1c512b7af48039f293ad622939063c4d82
+size 947877033

checkpoint-50514/rng_state.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:becedb8d488278c5c8e77dbd4aebdb92b237eccc219fda9b39598148c7a7de40
+size 14503

checkpoint-50514/scheduler.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:55c1c9b0b18973347a64b1087646863f54fde9f321e4adaad62d84eb0b11f7dc
+size 623

checkpoint-50514/special_tokens_map.json ADDED Viewed

	@@ -0,0 +1 @@


1	+ {"unk_token": "<unk>", "sep_token": "[SEP]", "pad_token": "<pad>", "cls_token": "[CLS]", "mask_token": {"content": "[MASK]", "single_word": false, "lstrip": true, "rstrip": false, "normalized": true}}

checkpoint-50514/tokenizer.json ADDED Viewed

The diff for this file is too large to render. See raw diff

checkpoint-50514/tokenizer_config.json ADDED Viewed

	@@ -0,0 +1 @@

checkpoint-50514/trainer_state.json ADDED Viewed

	@@ -0,0 +1,61 @@

+{
+  "best_metric": null,
+  "best_model_checkpoint": null,
+  "epoch": 3.0,
+  "global_step": 50514,
+  "is_hyper_param_search": false,
+  "is_local_process_zero": true,
+  "is_world_process_zero": true,
+  "log_history": [
+    {
+      "epoch": 1.0,
+      "learning_rate": 1.3333333333333333e-05,
+      "loss": 0.394,
+      "step": 16838
+    },
+    {
+      "epoch": 1.0,
+      "eval_accuracy": 0.8967889908256881,
+      "eval_loss": 0.3896108567714691,
+      "eval_runtime": 19.0439,
+      "eval_samples_per_second": 45.789,
+      "eval_steps_per_second": 5.724,
+      "step": 16838
+    },
+    {
+      "epoch": 2.0,
+      "learning_rate": 6.666666666666667e-06,
+      "loss": 0.2076,
+      "step": 33676
+    },
+    {
+      "epoch": 2.0,
+      "eval_accuracy": 0.8956422018348624,
+      "eval_loss": 0.5100129246711731,
+      "eval_runtime": 19.0123,
+      "eval_samples_per_second": 45.865,
+      "eval_steps_per_second": 5.733,
+      "step": 33676
+    },
+    {
+      "epoch": 3.0,
+      "learning_rate": 0.0,
+      "loss": 0.1148,
+      "step": 50514
+    },
+    {
+      "epoch": 3.0,
+      "eval_accuracy": 0.9048165137614679,
+      "eval_loss": 0.5239545702934265,
+      "eval_runtime": 18.9842,
+      "eval_samples_per_second": 45.933,
+      "eval_steps_per_second": 5.742,
+      "step": 50514
+    }
+  ],
+  "max_steps": 50514,
+  "num_train_epochs": 3,
+  "total_flos": 1.2640385602092442e+17,
+  "trial_name": null,
+  "trial_params": null
+}

checkpoint-50514/training_args.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:fb72553013dd35026c47f6f4467bb571ac0675d6549f1a069d3d19b0c3a66e86
+size 2735

config.json ADDED Viewed

	@@ -0,0 +1,33 @@

+{
+  "_name_or_path": "google/fnet-large",
+  "architectures": [
+    "FNetForSequenceClassification"
+  ],
+  "bos_token_id": 1,
+  "eos_token_id": 2,
+  "finetuning_task": "sst2",
+  "hidden_act": "gelu_new",
+  "hidden_dropout_prob": 0.1,
+  "hidden_size": 1024,
+  "id2label": {
+    "0": "negative",
+    "1": "positive"
+  },
+  "initializer_range": 0.02,
+  "intermediate_size": 4096,
+  "label2id": {
+    "negative": 0,
+    "positive": 1
+  },
+  "layer_norm_eps": 1e-12,
+  "max_position_embeddings": 512,
+  "model_type": "fnet",
+  "num_hidden_layers": 24,
+  "pad_token_id": 3,
+  "torch_dtype": "float32",
+  "tpu_short_seq_length": 512,
+  "transformers_version": "4.11.0.dev0",
+  "type_vocab_size": 4,
+  "use_tpu_fourier_optimizations": false,
+  "vocab_size": 32000
+}

eval_results.json ADDED Viewed

	@@ -0,0 +1,9 @@

+{
+    "epoch": 3.0,
+    "eval_accuracy": 0.9048165137614679,
+    "eval_loss": 0.5239545702934265,
+    "eval_runtime": 19.0697,
+    "eval_samples": 872,
+    "eval_samples_per_second": 45.727,
+    "eval_steps_per_second": 5.716
+}

pytorch_model.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:32a4a707ec45dda50ae24c48ab665b1c512b7af48039f293ad622939063c4d82
+size 947877033

runs/Sep24_12-16-35_patrick-general-gpu/1632485815.4394088/events.out.tfevents.1632485815.patrick-general-gpu.1069019.1 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:110e9cee7384b81d73bd6378a712fe6e18362e3184155cf9cc4fd63085e922e8
+size 4349

runs/Sep24_12-16-35_patrick-general-gpu/events.out.tfevents.1632485815.patrick-general-gpu.1069019.0 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:2dfdfa9d92d3ab0cf9eb7f8118f936fd16e1aef1bb2fb84499f9ed3b33a82e03
+size 4994

runs/Sep24_12-16-35_patrick-general-gpu/events.out.tfevents.1632500341.patrick-general-gpu.1069019.2 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:3187ab8c063cb2bad5747b2c00a7946e9f93037965760ba2d58b2adee5b3883f
+size 369

special_tokens_map.json ADDED Viewed

	@@ -0,0 +1 @@


1	+ {"unk_token": "<unk>", "sep_token": "[SEP]", "pad_token": "<pad>", "cls_token": "[CLS]", "mask_token": {"content": "[MASK]", "single_word": false, "lstrip": true, "rstrip": false, "normalized": true}}

tokenizer.json ADDED Viewed

The diff for this file is too large to render. See raw diff

tokenizer_config.json ADDED Viewed

	@@ -0,0 +1 @@

train_results.json ADDED Viewed

	@@ -0,0 +1,8 @@

+{
+    "epoch": 3.0,
+    "train_loss": 0.23881868657776187,
+    "train_runtime": 14505.0544,
+    "train_samples": 67349,
+    "train_samples_per_second": 13.929,
+    "train_steps_per_second": 3.483
+}

trainer_state.json ADDED Viewed

	@@ -0,0 +1,70 @@

+{
+  "best_metric": null,
+  "best_model_checkpoint": null,
+  "epoch": 3.0,
+  "global_step": 50514,
+  "is_hyper_param_search": false,
+  "is_local_process_zero": true,
+  "is_world_process_zero": true,
+  "log_history": [
+    {
+      "epoch": 1.0,
+      "learning_rate": 1.3333333333333333e-05,
+      "loss": 0.394,
+      "step": 16838
+    },
+    {
+      "epoch": 1.0,
+      "eval_accuracy": 0.8967889908256881,
+      "eval_loss": 0.3896108567714691,
+      "eval_runtime": 19.0439,
+      "eval_samples_per_second": 45.789,
+      "eval_steps_per_second": 5.724,
+      "step": 16838
+    },
+    {
+      "epoch": 2.0,
+      "learning_rate": 6.666666666666667e-06,
+      "loss": 0.2076,
+      "step": 33676
+    },
+    {
+      "epoch": 2.0,
+      "eval_accuracy": 0.8956422018348624,
+      "eval_loss": 0.5100129246711731,
+      "eval_runtime": 19.0123,
+      "eval_samples_per_second": 45.865,
+      "eval_steps_per_second": 5.733,
+      "step": 33676
+    },
+    {
+      "epoch": 3.0,
+      "learning_rate": 0.0,
+      "loss": 0.1148,
+      "step": 50514
+    },
+    {
+      "epoch": 3.0,
+      "eval_accuracy": 0.9048165137614679,
+      "eval_loss": 0.5239545702934265,
+      "eval_runtime": 18.9842,
+      "eval_samples_per_second": 45.933,
+      "eval_steps_per_second": 5.742,
+      "step": 50514
+    },
+    {
+      "epoch": 3.0,
+      "step": 50514,
+      "total_flos": 1.2640385602092442e+17,
+      "train_loss": 0.23881868657776187,
+      "train_runtime": 14505.0544,
+      "train_samples_per_second": 13.929,
+      "train_steps_per_second": 3.483
+    }
+  ],
+  "max_steps": 50514,
+  "num_train_epochs": 3,
+  "total_flos": 1.2640385602092442e+17,
+  "trial_name": null,
+  "trial_params": null
+}

training_args.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:fb72553013dd35026c47f6f4467bb571ac0675d6549f1a069d3d19b0c3a66e86
+size 2735