obudzecie commited on Mar 7, 2024

Commit

cb9d2f6

verified ·

1 Parent(s): be0419f

Training in progress, epoch 1

Browse files

Files changed (37) hide show

model.safetensors +1 -1
run-8/checkpoint-56/config.json +34 -0
run-8/checkpoint-56/model.safetensors +3 -0
run-8/checkpoint-56/optimizer.pt +3 -0
run-8/checkpoint-56/rng_state.pth +3 -0
run-8/checkpoint-56/scheduler.pt +3 -0
run-8/checkpoint-56/special_tokens_map.json +7 -0
run-8/checkpoint-56/tokenizer.json +0 -0
run-8/checkpoint-56/tokenizer_config.json +55 -0
run-8/checkpoint-56/trainer_state.json +62 -0
run-8/checkpoint-56/training_args.bin +3 -0
run-8/checkpoint-56/vocab.txt +0 -0
run-8/checkpoint-70/config.json +34 -0
run-8/checkpoint-70/model.safetensors +3 -0
run-8/checkpoint-70/optimizer.pt +3 -0
run-8/checkpoint-70/rng_state.pth +3 -0
run-8/checkpoint-70/scheduler.pt +3 -0
run-8/checkpoint-70/special_tokens_map.json +7 -0
run-8/checkpoint-70/tokenizer.json +0 -0
run-8/checkpoint-70/tokenizer_config.json +55 -0
run-8/checkpoint-70/trainer_state.json +71 -0
run-8/checkpoint-70/training_args.bin +3 -0
run-8/checkpoint-70/vocab.txt +0 -0
run-9/checkpoint-107/config.json +34 -0
run-9/checkpoint-107/model.safetensors +3 -0
run-9/checkpoint-107/optimizer.pt +3 -0
run-9/checkpoint-107/rng_state.pth +3 -0
run-9/checkpoint-107/scheduler.pt +3 -0
run-9/checkpoint-107/special_tokens_map.json +7 -0
run-9/checkpoint-107/tokenizer.json +0 -0
run-9/checkpoint-107/tokenizer_config.json +55 -0
run-9/checkpoint-107/trainer_state.json +35 -0
run-9/checkpoint-107/training_args.bin +3 -0
run-9/checkpoint-107/vocab.txt +0 -0
runs/Mar07_08-06-39_49d4a3166cad/events.out.tfevents.1709800438.49d4a3166cad.3288.13 +3 -0
runs/Mar07_08-06-39_49d4a3166cad/events.out.tfevents.1709800486.49d4a3166cad.3288.14 +3 -0
training_args.bin +1 -1

model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:06dafb1c5e3d70bca74a43c8e112b3b92a3b79a6de98cfef236cf37ddf4af884
 size 98470112

 version https://git-lfs.github.com/spec/v1
+oid sha256:3edbbb614a592d510a068a7f5ee9efef3bf658643ad039ba040de20e691b3da5
 size 98470112

run-8/checkpoint-56/config.json ADDED Viewed

	@@ -0,0 +1,34 @@

+{
+  "_name_or_path": "google/mobilebert-uncased",
+  "architectures": [
+    "MobileBertForSequenceClassification"
+  ],
+  "attention_probs_dropout_prob": 0.1,
+  "classifier_activation": false,
+  "classifier_dropout": null,
+  "embedding_size": 128,
+  "hidden_act": "relu",
+  "hidden_dropout_prob": 0.0,
+  "hidden_size": 512,
+  "initializer_range": 0.02,
+  "intermediate_size": 512,
+  "intra_bottleneck_size": 128,
+  "key_query_shared_bottleneck": true,
+  "layer_norm_eps": 1e-12,
+  "max_position_embeddings": 512,
+  "model_type": "mobilebert",
+  "normalization_type": "no_norm",
+  "num_attention_heads": 4,
+  "num_feedforward_networks": 4,
+  "num_hidden_layers": 24,
+  "pad_token_id": 0,
+  "problem_type": "single_label_classification",
+  "torch_dtype": "float32",
+  "transformers_version": "4.38.2",
+  "trigram_input": true,
+  "true_hidden_size": 128,
+  "type_vocab_size": 2,
+  "use_bottleneck": true,
+  "use_bottleneck_attention": false,
+  "vocab_size": 30522
+}

run-8/checkpoint-56/model.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:a8d2e67179e88233b7bdec60e9461240918f445a2b22e89c82a50748d101cd9d
+size 98470112

run-8/checkpoint-56/optimizer.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:b592d0e16f3172535b85bc0d7b0d362ed40fcae4b18338f9ab19f76b254b3d42
+size 197593757

run-8/checkpoint-56/rng_state.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:a58e4c8d075c7c0a341e1c69bccbaafbf74d1aae9c5ce4f206091db1dce0d472
+size 14244

run-8/checkpoint-56/scheduler.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:5a7adeedbd4f49114a787969e8f008b987b689f3cc8b8c702c0a5c0a3257c60c
+size 1064

run-8/checkpoint-56/special_tokens_map.json ADDED Viewed

	@@ -0,0 +1,7 @@

+{
+  "cls_token": "[CLS]",
+  "mask_token": "[MASK]",
+  "pad_token": "[PAD]",
+  "sep_token": "[SEP]",
+  "unk_token": "[UNK]"
+}

run-8/checkpoint-56/tokenizer.json ADDED Viewed

The diff for this file is too large to render. See raw diff

run-8/checkpoint-56/tokenizer_config.json ADDED Viewed

	@@ -0,0 +1,55 @@

+{
+  "added_tokens_decoder": {
+    "0": {
+      "content": "[PAD]",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "100": {
+      "content": "[UNK]",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "101": {
+      "content": "[CLS]",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "102": {
+      "content": "[SEP]",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "103": {
+      "content": "[MASK]",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    }
+  },
+  "clean_up_tokenization_spaces": true,
+  "cls_token": "[CLS]",
+  "do_lower_case": true,
+  "mask_token": "[MASK]",
+  "model_max_length": 1000000000000000019884624838656,
+  "pad_token": "[PAD]",
+  "sep_token": "[SEP]",
+  "strip_accents": null,
+  "tokenize_chinese_chars": true,
+  "tokenizer_class": "MobileBertTokenizer",
+  "unk_token": "[UNK]"
+}

run-8/checkpoint-56/trainer_state.json ADDED Viewed

	@@ -0,0 +1,62 @@

+{
+  "best_metric": 0.0,
+  "best_model_checkpoint": "mobilebert-uncased-finetuned-cola/run-8/checkpoint-14",
+  "epoch": 4.0,
+  "eval_steps": 500,
+  "global_step": 56,
+  "is_hyper_param_search": true,
+  "is_local_process_zero": true,
+  "is_world_process_zero": true,
+  "log_history": [
+    {
+      "epoch": 1.0,
+      "eval_loss": 1441566.625,
+      "eval_matthews_correlation": 0.0,
+      "eval_runtime": 2.7596,
+      "eval_samples_per_second": 377.953,
+      "eval_steps_per_second": 23.917,
+      "step": 14
+    },
+    {
+      "epoch": 2.0,
+      "eval_loss": 88462.984375,
+      "eval_matthews_correlation": 0.0,
+      "eval_runtime": 2.7775,
+      "eval_samples_per_second": 375.515,
+      "eval_steps_per_second": 23.762,
+      "step": 28
+    },
+    {
+      "epoch": 3.0,
+      "eval_loss": 23446.939453125,
+      "eval_matthews_correlation": 0.0,
+      "eval_runtime": 2.7458,
+      "eval_samples_per_second": 379.85,
+      "eval_steps_per_second": 24.037,
+      "step": 42
+    },
+    {
+      "epoch": 4.0,
+      "eval_loss": 10152.943359375,
+      "eval_matthews_correlation": -0.06375555059959441,
+      "eval_runtime": 2.7564,
+      "eval_samples_per_second": 378.398,
+      "eval_steps_per_second": 23.945,
+      "step": 56
+    }
+  ],
+  "logging_steps": 500,
+  "max_steps": 70,
+  "num_input_tokens_seen": 0,
+  "num_train_epochs": 5,
+  "save_steps": 500,
+  "total_flos": 0,
+  "train_batch_size": 64,
+  "trial_name": null,
+  "trial_params": {
+    "learning_rate": 1.690358131865815e-05,
+    "num_train_epochs": 5,
+    "per_device_train_batch_size": 64,
+    "seed": 5
+  }
+}

run-8/checkpoint-56/training_args.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:e9d8ce71bb58e2b1b63bdb7814d651df78a16f43893be6c36bed8d6382ade922
+size 4920

run-8/checkpoint-56/vocab.txt ADDED Viewed

The diff for this file is too large to render. See raw diff

run-8/checkpoint-70/config.json ADDED Viewed

	@@ -0,0 +1,34 @@

+{
+  "_name_or_path": "google/mobilebert-uncased",
+  "architectures": [
+    "MobileBertForSequenceClassification"
+  ],
+  "attention_probs_dropout_prob": 0.1,
+  "classifier_activation": false,
+  "classifier_dropout": null,
+  "embedding_size": 128,
+  "hidden_act": "relu",
+  "hidden_dropout_prob": 0.0,
+  "hidden_size": 512,
+  "initializer_range": 0.02,
+  "intermediate_size": 512,
+  "intra_bottleneck_size": 128,
+  "key_query_shared_bottleneck": true,
+  "layer_norm_eps": 1e-12,
+  "max_position_embeddings": 512,
+  "model_type": "mobilebert",
+  "normalization_type": "no_norm",
+  "num_attention_heads": 4,
+  "num_feedforward_networks": 4,
+  "num_hidden_layers": 24,
+  "pad_token_id": 0,
+  "problem_type": "single_label_classification",
+  "torch_dtype": "float32",
+  "transformers_version": "4.38.2",
+  "trigram_input": true,
+  "true_hidden_size": 128,
+  "type_vocab_size": 2,
+  "use_bottleneck": true,
+  "use_bottleneck_attention": false,
+  "vocab_size": 30522
+}

run-8/checkpoint-70/model.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:82f56364e6a014665ac27d944da76eb3a305c3fe58a18378f9353d4d3cfe49d0
+size 98470112

run-8/checkpoint-70/optimizer.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:97bec574ece0bebe41f716c7f829c1e6647678a001caf8762a11b6530cf3044f
+size 197593757

run-8/checkpoint-70/rng_state.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:9061fe81d99081359587658cc56c5839d546dd8ad7ca357bc62edba44a483824
+size 14244

run-8/checkpoint-70/scheduler.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:e2e7972d8f16d40e2b404ef4716a1a2b04295543aa7d7ee7a40b0532939aee8e
+size 1064

run-8/checkpoint-70/special_tokens_map.json ADDED Viewed

	@@ -0,0 +1,7 @@

+{
+  "cls_token": "[CLS]",
+  "mask_token": "[MASK]",
+  "pad_token": "[PAD]",
+  "sep_token": "[SEP]",
+  "unk_token": "[UNK]"
+}

run-8/checkpoint-70/tokenizer.json ADDED Viewed

The diff for this file is too large to render. See raw diff

run-8/checkpoint-70/tokenizer_config.json ADDED Viewed

	@@ -0,0 +1,55 @@

+{
+  "added_tokens_decoder": {
+    "0": {
+      "content": "[PAD]",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "100": {
+      "content": "[UNK]",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "101": {
+      "content": "[CLS]",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "102": {
+      "content": "[SEP]",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "103": {
+      "content": "[MASK]",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    }
+  },
+  "clean_up_tokenization_spaces": true,
+  "cls_token": "[CLS]",
+  "do_lower_case": true,
+  "mask_token": "[MASK]",
+  "model_max_length": 1000000000000000019884624838656,
+  "pad_token": "[PAD]",
+  "sep_token": "[SEP]",
+  "strip_accents": null,
+  "tokenize_chinese_chars": true,
+  "tokenizer_class": "MobileBertTokenizer",
+  "unk_token": "[UNK]"
+}

run-8/checkpoint-70/trainer_state.json ADDED Viewed

	@@ -0,0 +1,71 @@

+{
+  "best_metric": 0.0,
+  "best_model_checkpoint": "mobilebert-uncased-finetuned-cola/run-8/checkpoint-14",
+  "epoch": 5.0,
+  "eval_steps": 500,
+  "global_step": 70,
+  "is_hyper_param_search": true,
+  "is_local_process_zero": true,
+  "is_world_process_zero": true,
+  "log_history": [
+    {
+      "epoch": 1.0,
+      "eval_loss": 1441566.625,
+      "eval_matthews_correlation": 0.0,
+      "eval_runtime": 2.7596,
+      "eval_samples_per_second": 377.953,
+      "eval_steps_per_second": 23.917,
+      "step": 14
+    },
+    {
+      "epoch": 2.0,
+      "eval_loss": 88462.984375,
+      "eval_matthews_correlation": 0.0,
+      "eval_runtime": 2.7775,
+      "eval_samples_per_second": 375.515,
+      "eval_steps_per_second": 23.762,
+      "step": 28
+    },
+    {
+      "epoch": 3.0,
+      "eval_loss": 23446.939453125,
+      "eval_matthews_correlation": 0.0,
+      "eval_runtime": 2.7458,
+      "eval_samples_per_second": 379.85,
+      "eval_steps_per_second": 24.037,
+      "step": 42
+    },
+    {
+      "epoch": 4.0,
+      "eval_loss": 10152.943359375,
+      "eval_matthews_correlation": -0.06375555059959441,
+      "eval_runtime": 2.7564,
+      "eval_samples_per_second": 378.398,
+      "eval_steps_per_second": 23.945,
+      "step": 56
+    },
+    {
+      "epoch": 5.0,
+      "eval_loss": 8982.5546875,
+      "eval_matthews_correlation": -0.0018582137243486861,
+      "eval_runtime": 2.7362,
+      "eval_samples_per_second": 381.181,
+      "eval_steps_per_second": 24.121,
+      "step": 70
+    }
+  ],
+  "logging_steps": 500,
+  "max_steps": 70,
+  "num_input_tokens_seen": 0,
+  "num_train_epochs": 5,
+  "save_steps": 500,
+  "total_flos": 0,
+  "train_batch_size": 64,
+  "trial_name": null,
+  "trial_params": {
+    "learning_rate": 1.690358131865815e-05,
+    "num_train_epochs": 5,
+    "per_device_train_batch_size": 64,
+    "seed": 5
+  }
+}

run-8/checkpoint-70/training_args.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:e9d8ce71bb58e2b1b63bdb7814d651df78a16f43893be6c36bed8d6382ade922
+size 4920

run-8/checkpoint-70/vocab.txt ADDED Viewed

The diff for this file is too large to render. See raw diff

run-9/checkpoint-107/config.json ADDED Viewed

	@@ -0,0 +1,34 @@

+{
+  "_name_or_path": "google/mobilebert-uncased",
+  "architectures": [
+    "MobileBertForSequenceClassification"
+  ],
+  "attention_probs_dropout_prob": 0.1,
+  "classifier_activation": false,
+  "classifier_dropout": null,
+  "embedding_size": 128,
+  "hidden_act": "relu",
+  "hidden_dropout_prob": 0.0,
+  "hidden_size": 512,
+  "initializer_range": 0.02,
+  "intermediate_size": 512,
+  "intra_bottleneck_size": 128,
+  "key_query_shared_bottleneck": true,
+  "layer_norm_eps": 1e-12,
+  "max_position_embeddings": 512,
+  "model_type": "mobilebert",
+  "normalization_type": "no_norm",
+  "num_attention_heads": 4,
+  "num_feedforward_networks": 4,
+  "num_hidden_layers": 24,
+  "pad_token_id": 0,
+  "problem_type": "single_label_classification",
+  "torch_dtype": "float32",
+  "transformers_version": "4.38.2",
+  "trigram_input": true,
+  "true_hidden_size": 128,
+  "type_vocab_size": 2,
+  "use_bottleneck": true,
+  "use_bottleneck_attention": false,
+  "vocab_size": 30522
+}

run-9/checkpoint-107/model.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:564f2457fd92892bdbd665eab7fbfb8adbd0063235d28c39a55389676da45baa
+size 98470112

run-9/checkpoint-107/optimizer.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:bdd75310c0a5b6bd39645df3ae29cc16f5e21d7676024b150c5530e589d3d1c6
+size 197593757

run-9/checkpoint-107/rng_state.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:de06f41e723769ef3d342e670def24740df18da41904f6ba9f656f9dbf8a7071
+size 14308

run-9/checkpoint-107/scheduler.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:97dc7ae12a95cf72f03c6c6d529bef5b734039954552cfe91229afd23c319e41
+size 1064

run-9/checkpoint-107/special_tokens_map.json ADDED Viewed

	@@ -0,0 +1,7 @@

+{
+  "cls_token": "[CLS]",
+  "mask_token": "[MASK]",
+  "pad_token": "[PAD]",
+  "sep_token": "[SEP]",
+  "unk_token": "[UNK]"
+}

run-9/checkpoint-107/tokenizer.json ADDED Viewed

The diff for this file is too large to render. See raw diff

run-9/checkpoint-107/tokenizer_config.json ADDED Viewed

	@@ -0,0 +1,55 @@

+{
+  "added_tokens_decoder": {
+    "0": {
+      "content": "[PAD]",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "100": {
+      "content": "[UNK]",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "101": {
+      "content": "[CLS]",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "102": {
+      "content": "[SEP]",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "103": {
+      "content": "[MASK]",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    }
+  },
+  "clean_up_tokenization_spaces": true,
+  "cls_token": "[CLS]",
+  "do_lower_case": true,
+  "mask_token": "[MASK]",
+  "model_max_length": 1000000000000000019884624838656,
+  "pad_token": "[PAD]",
+  "sep_token": "[SEP]",
+  "strip_accents": null,
+  "tokenize_chinese_chars": true,
+  "tokenizer_class": "MobileBertTokenizer",
+  "unk_token": "[UNK]"
+}

run-9/checkpoint-107/trainer_state.json ADDED Viewed

	@@ -0,0 +1,35 @@

+{
+  "best_metric": 0.0,
+  "best_model_checkpoint": "mobilebert-uncased-finetuned-cola/run-9/checkpoint-107",
+  "epoch": 1.0,
+  "eval_steps": 500,
+  "global_step": 107,
+  "is_hyper_param_search": true,
+  "is_local_process_zero": true,
+  "is_world_process_zero": true,
+  "log_history": [
+    {
+      "epoch": 1.0,
+      "eval_loss": 2351.89892578125,
+      "eval_matthews_correlation": 0.0,
+      "eval_runtime": 2.6877,
+      "eval_samples_per_second": 388.069,
+      "eval_steps_per_second": 24.557,
+      "step": 107
+    }
+  ],
+  "logging_steps": 500,
+  "max_steps": 214,
+  "num_input_tokens_seen": 0,
+  "num_train_epochs": 2,
+  "save_steps": 500,
+  "total_flos": 0,
+  "train_batch_size": 8,
+  "trial_name": null,
+  "trial_params": {
+    "learning_rate": 1.1140944916532557e-05,
+    "num_train_epochs": 2,
+    "per_device_train_batch_size": 8,
+    "seed": 31
+  }
+}

run-9/checkpoint-107/training_args.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:44f8c3d5bd96a720b0d19fce182c3ad9128127ea92f5e82d7e16110ec312daee
+size 4920

run-9/checkpoint-107/vocab.txt ADDED Viewed

The diff for this file is too large to render. See raw diff

runs/Mar07_08-06-39_49d4a3166cad/events.out.tfevents.1709800438.49d4a3166cad.3288.13 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:ecf7ded14b6a3d91d1159a709638e97fdb19cefe0ed235f390258b4bf5b48beb
+size 5540

runs/Mar07_08-06-39_49d4a3166cad/events.out.tfevents.1709800486.49d4a3166cad.3288.14 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:48445ae5ee33054ca1608151ae6f1819c9fc3133649c4ddc920f7b61f3fafe25
+size 5203

training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:e9d8ce71bb58e2b1b63bdb7814d651df78a16f43893be6c36bed8d6382ade922
 size 4920

 version https://git-lfs.github.com/spec/v1
+oid sha256:a0926346707a8d66976e74089ae692911018b9e10991497cdb1023e38ec538cc
 size 4920