Training in progress, step 40

Browse files

Files changed (11) hide show

checkpoint-40/config.json +80 -0
checkpoint-40/optimizer.pt +3 -0
checkpoint-40/pytorch_model.bin +3 -0
checkpoint-40/rng_state.pth +3 -0
checkpoint-40/scheduler.pt +3 -0
checkpoint-40/trainer_state.json +324 -0
checkpoint-40/training_args.bin +3 -0
config.json +80 -0
pytorch_model.bin +3 -0
runs/Feb12_06-10-25_robovision.csres.utexas.edu/events.out.tfevents.1707739840.robovision.csres.utexas.edu.2691300.0 +3 -0
training_args.bin +3 -0

checkpoint-40/config.json ADDED Viewed

	@@ -0,0 +1,80 @@

+{
+  "_name_or_path": "nvidia/mit-b0",
+  "architectures": [
+    "SegformerForSemanticSegmentation"
+  ],
+  "attention_probs_dropout_prob": 0.0,
+  "classifier_dropout_prob": 0.1,
+  "decoder_hidden_size": 256,
+  "depths": [
+    2,
+    2,
+    2,
+    2
+  ],
+  "downsampling_rates": [
+    1,
+    4,
+    8,
+    16
+  ],
+  "drop_path_rate": 0.1,
+  "hidden_act": "gelu",
+  "hidden_dropout_prob": 0.0,
+  "hidden_sizes": [
+    32,
+    64,
+    160,
+    256
+  ],
+  "id2label": {
+    "0": "unlabeled",
+    "1": "dropoff",
+    "2": "undropoff"
+  },
+  "image_size": 224,
+  "initializer_range": 0.02,
+  "label2id": {
+    "dropoff": 1,
+    "undropoff": 2,
+    "unlabeled": 0
+  },
+  "layer_norm_eps": 1e-06,
+  "mlp_ratios": [
+    4,
+    4,
+    4,
+    4
+  ],
+  "model_type": "segformer",
+  "num_attention_heads": [
+    1,
+    2,
+    5,
+    8
+  ],
+  "num_channels": 3,
+  "num_encoder_blocks": 4,
+  "patch_sizes": [
+    7,
+    3,
+    3,
+    3
+  ],
+  "reshape_last_stage": true,
+  "semantic_loss_ignore_index": 255,
+  "sr_ratios": [
+    8,
+    4,
+    2,
+    1
+  ],
+  "strides": [
+    4,
+    2,
+    2,
+    2
+  ],
+  "torch_dtype": "float32",
+  "transformers_version": "4.30.2"
+}

checkpoint-40/optimizer.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:f1c8c7774fe4d412140063ded691d51eaaffaa00a2c715d1fdde56633bef5e6f
+size 29838853

checkpoint-40/pytorch_model.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:64371432c385cfab974edfeddb1b38738a843d22d97e8d1aae11dac243e8a43a
+size 14932813

checkpoint-40/rng_state.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:c301550081675e66a540685647726778557f949cb5ced37006a8b1363a534b82
+size 14575

checkpoint-40/scheduler.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:61727a1f75fc4eaa50f03b0ead9f5f2c383e0ecb437e48afb50441923ed9b018
+size 627

checkpoint-40/trainer_state.json ADDED Viewed

	@@ -0,0 +1,324 @@

+{
+  "best_metric": 0.947559118270874,
+  "best_model_checkpoint": "/robodata/smodak/Projects/nspl/scripts/terrainseg/training/models/dropoff-utcustom-train-SF-RGB-b0_3/checkpoint-40",
+  "epoch": 13.333333333333334,
+  "global_step": 40,
+  "is_hyper_param_search": false,
+  "is_local_process_zero": true,
+  "is_world_process_zero": true,
+  "log_history": [
+    {
+      "epoch": 0.33,
+      "learning_rate": 1.111111111111111e-06,
+      "loss": 1.1153,
+      "step": 1
+    },
+    {
+      "epoch": 0.67,
+      "learning_rate": 2.222222222222222e-06,
+      "loss": 1.1199,
+      "step": 2
+    },
+    {
+      "epoch": 1.0,
+      "learning_rate": 3.3333333333333333e-06,
+      "loss": 1.1156,
+      "step": 3
+    },
+    {
+      "epoch": 1.33,
+      "learning_rate": 4.444444444444444e-06,
+      "loss": 1.1182,
+      "step": 4
+    },
+    {
+      "epoch": 1.67,
+      "learning_rate": 5.555555555555557e-06,
+      "loss": 1.1161,
+      "step": 5
+    },
+    {
+      "epoch": 2.0,
+      "learning_rate": 6.666666666666667e-06,
+      "loss": 1.1106,
+      "step": 6
+    },
+    {
+      "epoch": 2.33,
+      "learning_rate": 7.77777777777778e-06,
+      "loss": 1.1141,
+      "step": 7
+    },
+    {
+      "epoch": 2.67,
+      "learning_rate": 8.888888888888888e-06,
+      "loss": 1.1085,
+      "step": 8
+    },
+    {
+      "epoch": 3.0,
+      "learning_rate": 1e-05,
+      "loss": 1.0992,
+      "step": 9
+    },
+    {
+      "epoch": 3.33,
+      "learning_rate": 1.1111111111111113e-05,
+      "loss": 1.1015,
+      "step": 10
+    },
+    {
+      "epoch": 3.33,
+      "eval_accuracy_dropoff": 0.5975256737197602,
+      "eval_accuracy_undropoff": 0.31695782815139334,
+      "eval_accuracy_unlabeled": NaN,
+      "eval_iou_dropoff": 0.04272275097162494,
+      "eval_iou_undropoff": 0.3123742688218148,
+      "eval_iou_unlabeled": 0.0,
+      "eval_loss": 1.0990227460861206,
+      "eval_mean_accuracy": 0.45724175093557673,
+      "eval_mean_iou": 0.1183656732644799,
+      "eval_overall_accuracy": 0.32938079833984374,
+      "eval_runtime": 1.6795,
+      "eval_samples_per_second": 8.931,
+      "eval_steps_per_second": 0.595,
+      "step": 10
+    },
+    {
+      "epoch": 3.67,
+      "learning_rate": 1.2222222222222224e-05,
+      "loss": 1.102,
+      "step": 11
+    },
+    {
+      "epoch": 4.0,
+      "learning_rate": 1.3333333333333333e-05,
+      "loss": 1.0912,
+      "step": 12
+    },
+    {
+      "epoch": 4.33,
+      "learning_rate": 1.4444444444444446e-05,
+      "loss": 1.0939,
+      "step": 13
+    },
+    {
+      "epoch": 4.67,
+      "learning_rate": 1.555555555555556e-05,
+      "loss": 1.0846,
+      "step": 14
+    },
+    {
+      "epoch": 5.0,
+      "learning_rate": 1.6666666666666667e-05,
+      "loss": 1.0804,
+      "step": 15
+    },
+    {
+      "epoch": 5.33,
+      "learning_rate": 1.7777777777777777e-05,
+      "loss": 1.0734,
+      "step": 16
+    },
+    {
+      "epoch": 5.67,
+      "learning_rate": 1.888888888888889e-05,
+      "loss": 1.0642,
+      "step": 17
+    },
+    {
+      "epoch": 6.0,
+      "learning_rate": 2e-05,
+      "loss": 1.0945,
+      "step": 18
+    },
+    {
+      "epoch": 6.33,
+      "learning_rate": 1.994152046783626e-05,
+      "loss": 1.0588,
+      "step": 19
+    },
+    {
+      "epoch": 6.67,
+      "learning_rate": 1.9883040935672515e-05,
+      "loss": 1.0478,
+      "step": 20
+    },
+    {
+      "epoch": 6.67,
+      "eval_accuracy_dropoff": 0.8648482551060261,
+      "eval_accuracy_undropoff": 0.5515245664509166,
+      "eval_accuracy_unlabeled": NaN,
+      "eval_iou_dropoff": 0.08793587759511783,
+      "eval_iou_undropoff": 0.5482206998703943,
+      "eval_iou_unlabeled": 0.0,
+      "eval_loss": 1.0755951404571533,
+      "eval_mean_accuracy": 0.7081864107784714,
+      "eval_mean_iou": 0.21205219248850404,
+      "eval_overall_accuracy": 0.5653978983561198,
+      "eval_runtime": 1.8074,
+      "eval_samples_per_second": 8.299,
+      "eval_steps_per_second": 0.553,
+      "step": 20
+    },
+    {
+      "epoch": 7.0,
+      "learning_rate": 1.9824561403508773e-05,
+      "loss": 1.0748,
+      "step": 21
+    },
+    {
+      "epoch": 7.33,
+      "learning_rate": 1.976608187134503e-05,
+      "loss": 1.0343,
+      "step": 22
+    },
+    {
+      "epoch": 7.67,
+      "learning_rate": 1.970760233918129e-05,
+      "loss": 1.0348,
+      "step": 23
+    },
+    {
+      "epoch": 8.0,
+      "learning_rate": 1.9649122807017544e-05,
+      "loss": 1.0366,
+      "step": 24
+    },
+    {
+      "epoch": 8.33,
+      "learning_rate": 1.9590643274853802e-05,
+      "loss": 1.0351,
+      "step": 25
+    },
+    {
+      "epoch": 8.67,
+      "learning_rate": 1.953216374269006e-05,
+      "loss": 1.0085,
+      "step": 26
+    },
+    {
+      "epoch": 9.0,
+      "learning_rate": 1.9473684210526318e-05,
+      "loss": 1.0048,
+      "step": 27
+    },
+    {
+      "epoch": 9.33,
+      "learning_rate": 1.9415204678362573e-05,
+      "loss": 1.0001,
+      "step": 28
+    },
+    {
+      "epoch": 9.67,
+      "learning_rate": 1.935672514619883e-05,
+      "loss": 0.9877,
+      "step": 29
+    },
+    {
+      "epoch": 10.0,
+      "learning_rate": 1.929824561403509e-05,
+      "loss": 1.0451,
+      "step": 30
+    },
+    {
+      "epoch": 10.0,
+      "eval_accuracy_dropoff": 0.8842327750591586,
+      "eval_accuracy_undropoff": 0.7264455095352592,
+      "eval_accuracy_unlabeled": NaN,
+      "eval_iou_dropoff": 0.1312558881078339,
+      "eval_iou_undropoff": 0.7226098464796189,
+      "eval_iou_unlabeled": 0.0,
+      "eval_loss": 1.026917576789856,
+      "eval_mean_accuracy": 0.8053391422972089,
+      "eval_mean_iou": 0.2846219115291509,
+      "eval_overall_accuracy": 0.7334320068359375,
+      "eval_runtime": 1.7831,
+      "eval_samples_per_second": 8.412,
+      "eval_steps_per_second": 0.561,
+      "step": 30
+    },
+    {
+      "epoch": 10.33,
+      "learning_rate": 1.9239766081871347e-05,
+      "loss": 0.9774,
+      "step": 31
+    },
+    {
+      "epoch": 10.67,
+      "learning_rate": 1.9181286549707602e-05,
+      "loss": 0.9797,
+      "step": 32
+    },
+    {
+      "epoch": 11.0,
+      "learning_rate": 1.912280701754386e-05,
+      "loss": 0.9325,
+      "step": 33
+    },
+    {
+      "epoch": 11.33,
+      "learning_rate": 1.9064327485380118e-05,
+      "loss": 0.9775,
+      "step": 34
+    },
+    {
+      "epoch": 11.67,
+      "learning_rate": 1.9005847953216376e-05,
+      "loss": 0.9393,
+      "step": 35
+    },
+    {
+      "epoch": 12.0,
+      "learning_rate": 1.894736842105263e-05,
+      "loss": 0.9431,
+      "step": 36
+    },
+    {
+      "epoch": 12.33,
+      "learning_rate": 1.888888888888889e-05,
+      "loss": 0.9369,
+      "step": 37
+    },
+    {
+      "epoch": 12.67,
+      "learning_rate": 1.8830409356725147e-05,
+      "loss": 0.9234,
+      "step": 38
+    },
+    {
+      "epoch": 13.0,
+      "learning_rate": 1.8771929824561405e-05,
+      "loss": 1.0184,
+      "step": 39
+    },
+    {
+      "epoch": 13.33,
+      "learning_rate": 1.871345029239766e-05,
+      "loss": 0.9095,
+      "step": 40
+    },
+    {
+      "epoch": 13.33,
+      "eval_accuracy_dropoff": 0.7349346382704988,
+      "eval_accuracy_undropoff": 0.8459984055569215,
+      "eval_accuracy_unlabeled": NaN,
+      "eval_iou_dropoff": 0.17233702408257653,
+      "eval_iou_undropoff": 0.835792668708584,
+      "eval_iou_unlabeled": 0.0,
+      "eval_loss": 0.947559118270874,
+      "eval_mean_accuracy": 0.7904665219137101,
+      "eval_mean_iou": 0.33604323093038685,
+      "eval_overall_accuracy": 0.8410807291666667,
+      "eval_runtime": 1.7664,
+      "eval_samples_per_second": 8.492,
+      "eval_steps_per_second": 0.566,
+      "step": 40
+    }
+  ],
+  "max_steps": 360,
+  "num_train_epochs": 120,
+  "total_flos": 8028359035453440.0,
+  "trial_name": null,
+  "trial_params": null
+}

checkpoint-40/training_args.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:956bf1976427a2f6d5abaeb4217db08d9dd40b4dfb95afeb46f806f35903c20d
+size 4155

config.json ADDED Viewed

	@@ -0,0 +1,80 @@

+{
+  "_name_or_path": "nvidia/mit-b0",
+  "architectures": [
+    "SegformerForSemanticSegmentation"
+  ],
+  "attention_probs_dropout_prob": 0.0,
+  "classifier_dropout_prob": 0.1,
+  "decoder_hidden_size": 256,
+  "depths": [
+    2,
+    2,
+    2,
+    2
+  ],
+  "downsampling_rates": [
+    1,
+    4,
+    8,
+    16
+  ],
+  "drop_path_rate": 0.1,
+  "hidden_act": "gelu",
+  "hidden_dropout_prob": 0.0,
+  "hidden_sizes": [
+    32,
+    64,
+    160,
+    256
+  ],
+  "id2label": {
+    "0": "unlabeled",
+    "1": "dropoff",
+    "2": "undropoff"
+  },
+  "image_size": 224,
+  "initializer_range": 0.02,
+  "label2id": {
+    "dropoff": 1,
+    "undropoff": 2,
+    "unlabeled": 0
+  },
+  "layer_norm_eps": 1e-06,
+  "mlp_ratios": [
+    4,
+    4,
+    4,
+    4
+  ],
+  "model_type": "segformer",
+  "num_attention_heads": [
+    1,
+    2,
+    5,
+    8
+  ],
+  "num_channels": 3,
+  "num_encoder_blocks": 4,
+  "patch_sizes": [
+    7,
+    3,
+    3,
+    3
+  ],
+  "reshape_last_stage": true,
+  "semantic_loss_ignore_index": 255,
+  "sr_ratios": [
+    8,
+    4,
+    2,
+    1
+  ],
+  "strides": [
+    4,
+    2,
+    2,
+    2
+  ],
+  "torch_dtype": "float32",
+  "transformers_version": "4.30.2"
+}

pytorch_model.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:64371432c385cfab974edfeddb1b38738a843d22d97e8d1aae11dac243e8a43a
+size 14932813

runs/Feb12_06-10-25_robovision.csres.utexas.edu/events.out.tfevents.1707739840.robovision.csres.utexas.edu.2691300.0 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:429a8bd5abe7d44f7009d43e1a669f82a2915cdb916c01f728985d2b1e5ba1da
+size 14052

training_args.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:956bf1976427a2f6d5abaeb4217db08d9dd40b4dfb95afeb46f806f35903c20d
+size 4155