Training in progress, epoch 0

Browse files

Files changed (10) hide show

all_results.json +8 -0
config.json +16 -19
preprocessor_config.json +8 -9
pytorch_model.bin +2 -2
runs/Jan21_17-13-54_teesta/events.out.tfevents.1674301465.teesta.3779.0 +2 -2
runs/Jan21_17-25-09_teesta/1674302123.4912503/events.out.tfevents.1674302123.teesta.7894.1 +3 -0
runs/Jan21_17-25-09_teesta/events.out.tfevents.1674302123.teesta.7894.0 +3 -0
train_results.json +8 -0
trainer_state.json +349 -0
training_args.bin +1 -1

all_results.json ADDED Viewed

	@@ -0,0 +1,8 @@

+{
+    "epoch": 20.0,
+    "total_flos": 7.403951867151974e+17,
+    "train_loss": 1.1767685549599785,
+    "train_runtime": 421.2758,
+    "train_samples_per_second": 82.749,
+    "train_steps_per_second": 0.332
+}

config.json CHANGED Viewed

@@ -1,39 +1,36 @@
 {
-  "_name_or_path": "microsoft/resnet-50",
   "architectures": [
-    "ResNetForImageClassification"
-  ],
-  "depths": [
-    3,
-    4,
-    6,
-    3
-  ],
-  "downsample_in_first_stage": false,
-  "embedding_size": 64,
-  "hidden_act": "relu",
-  "hidden_sizes": [
-    256,
-    512,
-    1024,
-    2048
   ],
   "id2label": {
     "0": "angry",
     "1": "happy",
     "2": "neutral",
     "3": "sad"
   },
   "label2id": {
     "angry": "0",
     "happy": "1",
     "neutral": "2",
     "sad": "3"
   },
-  "layer_type": "bottleneck",
-  "model_type": "resnet",
   "num_channels": 3,
   "problem_type": "single_label_classification",
   "torch_dtype": "float32",
   "transformers_version": "4.24.0.dev0"
 }

 {
+  "_name_or_path": "google/vit-base-patch16-224",
   "architectures": [
+    "ViTForImageClassification"
   ],
+  "attention_probs_dropout_prob": 0.0,
+  "encoder_stride": 16,
+  "hidden_act": "gelu",
+  "hidden_dropout_prob": 0.0,
+  "hidden_size": 768,
   "id2label": {
     "0": "angry",
     "1": "happy",
     "2": "neutral",
     "3": "sad"
   },
+  "image_size": 224,
+  "initializer_range": 0.02,
+  "intermediate_size": 3072,
   "label2id": {
     "angry": "0",
     "happy": "1",
     "neutral": "2",
     "sad": "3"
   },
+  "layer_norm_eps": 1e-12,
+  "model_type": "vit",
+  "num_attention_heads": 12,
   "num_channels": 3,
+  "num_hidden_layers": 12,
+  "patch_size": 16,
   "problem_type": "single_label_classification",
+  "qkv_bias": true,
   "torch_dtype": "float32",
   "transformers_version": "4.24.0.dev0"
 }

preprocessor_config.json CHANGED Viewed

@@ -1,18 +1,17 @@
 {
-  "crop_pct": 0.875,
   "do_normalize": true,
   "do_resize": true,
-  "feature_extractor_type": "ConvNextFeatureExtractor",
   "image_mean": [
-    0.485,
-    0.456,
-    0.406
   ],
   "image_std": [
-    0.229,
-    0.224,
-    0.225
   ],
-  "resample": 3,
   "size": 224
 }

 {
   "do_normalize": true,
   "do_resize": true,
+  "feature_extractor_type": "ViTFeatureExtractor",
   "image_mean": [
+    0.5,
+    0.5,
+    0.5
   ],
   "image_std": [
+    0.5,
+    0.5,
+    0.5
   ],
+  "resample": 2,
   "size": 224
 }

pytorch_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:9ef584acc2a5466b4b507dc258c6e8a8cae7e08b4c9e7e6348875e4be3c29d1b
-size 94389057

 version https://git-lfs.github.com/spec/v1
+oid sha256:db408178bedaa6a5998bbb33212b113713f11eca99a0d912b0f908332844cca6
+size 343273137

runs/Jan21_17-13-54_teesta/events.out.tfevents.1674301465.teesta.3779.0 CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:894350261429ceb0c9229a393e93365ccd297025f2982140e736457e8d3b65e2
-size 7630

 version https://git-lfs.github.com/spec/v1
+oid sha256:ac1fbc022de3170b19d2227e0b53ffe7cce1dc5b96de754201894eb433c5e931
+size 15567

runs/Jan21_17-25-09_teesta/1674302123.4912503/events.out.tfevents.1674302123.teesta.7894.1 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:965e196ff0c4b59fda1585981e171208c301e747b37824dd74dc199cc67bee5d
+size 5550

runs/Jan21_17-25-09_teesta/events.out.tfevents.1674302123.teesta.7894.0 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:2d9175c9096796091c491259ff069f27b0176aad150041384a2d7603a97c818f
+size 4327

train_results.json ADDED Viewed

	@@ -0,0 +1,8 @@

+{
+    "epoch": 20.0,
+    "total_flos": 7.403951867151974e+17,
+    "train_loss": 1.1767685549599785,
+    "train_runtime": 421.2758,
+    "train_samples_per_second": 82.749,
+    "train_steps_per_second": 0.332
+}

trainer_state.json ADDED Viewed

	@@ -0,0 +1,349 @@

+{
+  "best_metric": 0.5711009174311926,
+  "best_model_checkpoint": "microsoft-resnet-50-cartoon-emotion-detection/checkpoint-133",
+  "epoch": 20.0,
+  "global_step": 140,
+  "is_hyper_param_search": false,
+  "is_local_process_zero": true,
+  "is_world_process_zero": true,
+  "log_history": [
+    {
+      "epoch": 1.0,
+      "eval_accuracy": 0.25688073394495414,
+      "eval_f1": 0.22448538034486407,
+      "eval_loss": 1.380691409111023,
+      "eval_precision": 0.234238207374522,
+      "eval_recall": 0.25688073394495414,
+      "eval_runtime": 6.8682,
+      "eval_samples_per_second": 63.481,
+      "eval_steps_per_second": 1.019,
+      "step": 7
+    },
+    {
+      "epoch": 1.43,
+      "learning_rate": 8.571428571428571e-05,
+      "loss": 1.3806,
+      "step": 10
+    },
+    {
+      "epoch": 2.0,
+      "eval_accuracy": 0.36009174311926606,
+      "eval_f1": 0.27057592620444176,
+      "eval_loss": 1.3620387315750122,
+      "eval_precision": 0.3636846359984286,
+      "eval_recall": 0.36009174311926606,
+      "eval_runtime": 6.2511,
+      "eval_samples_per_second": 69.748,
+      "eval_steps_per_second": 1.12,
+      "step": 14
+    },
+    {
+      "epoch": 2.86,
+      "learning_rate": 0.00011428571428571428,
+      "loss": 1.3591,
+      "step": 20
+    },
+    {
+      "epoch": 3.0,
+      "eval_accuracy": 0.3669724770642202,
+      "eval_f1": 0.24291286665824255,
+      "eval_loss": 1.3456730842590332,
+      "eval_precision": 0.5651041088181502,
+      "eval_recall": 0.3669724770642202,
+      "eval_runtime": 5.6933,
+      "eval_samples_per_second": 76.582,
+      "eval_steps_per_second": 1.23,
+      "step": 21
+    },
+    {
+      "epoch": 4.0,
+      "eval_accuracy": 0.3738532110091743,
+      "eval_f1": 0.2447258618599714,
+      "eval_loss": 1.3271173238754272,
+      "eval_precision": 0.7011109363353202,
+      "eval_recall": 0.3738532110091743,
+      "eval_runtime": 5.6438,
+      "eval_samples_per_second": 77.253,
+      "eval_steps_per_second": 1.24,
+      "step": 28
+    },
+    {
+      "epoch": 4.29,
+      "learning_rate": 0.00010476190476190477,
+      "loss": 1.3344,
+      "step": 30
+    },
+    {
+      "epoch": 5.0,
+      "eval_accuracy": 0.3922018348623853,
+      "eval_f1": 0.27454202142043693,
+      "eval_loss": 1.3076415061950684,
+      "eval_precision": 0.49126041854050495,
+      "eval_recall": 0.3922018348623853,
+      "eval_runtime": 5.7497,
+      "eval_samples_per_second": 75.83,
+      "eval_steps_per_second": 1.217,
+      "step": 35
+    },
+    {
+      "epoch": 5.71,
+      "learning_rate": 9.523809523809524e-05,
+      "loss": 1.3035,
+      "step": 40
+    },
+    {
+      "epoch": 6.0,
+      "eval_accuracy": 0.4197247706422018,
+      "eval_f1": 0.31223198015887665,
+      "eval_loss": 1.2836155891418457,
+      "eval_precision": 0.4326493440983179,
+      "eval_recall": 0.4197247706422018,
+      "eval_runtime": 6.0675,
+      "eval_samples_per_second": 71.858,
+      "eval_steps_per_second": 1.154,
+      "step": 42
+    },
+    {
+      "epoch": 7.0,
+      "eval_accuracy": 0.4426605504587156,
+      "eval_f1": 0.341877970822925,
+      "eval_loss": 1.2649825811386108,
+      "eval_precision": 0.49930570990337153,
+      "eval_recall": 0.4426605504587156,
+      "eval_runtime": 5.7091,
+      "eval_samples_per_second": 76.37,
+      "eval_steps_per_second": 1.226,
+      "step": 49
+    },
+    {
+      "epoch": 7.14,
+      "learning_rate": 8.571428571428571e-05,
+      "loss": 1.2692,
+      "step": 50
+    },
+    {
+      "epoch": 8.0,
+      "eval_accuracy": 0.4701834862385321,
+      "eval_f1": 0.3759489302967564,
+      "eval_loss": 1.2467858791351318,
+      "eval_precision": 0.47456408321388993,
+      "eval_recall": 0.4701834862385321,
+      "eval_runtime": 5.6802,
+      "eval_samples_per_second": 76.758,
+      "eval_steps_per_second": 1.232,
+      "step": 56
+    },
+    {
+      "epoch": 8.57,
+      "learning_rate": 7.619047619047618e-05,
+      "loss": 1.2271,
+      "step": 60
+    },
+    {
+      "epoch": 9.0,
+      "eval_accuracy": 0.47706422018348627,
+      "eval_f1": 0.38295063344511215,
+      "eval_loss": 1.2168828248977661,
+      "eval_precision": 0.4426797391546095,
+      "eval_recall": 0.47706422018348627,
+      "eval_runtime": 5.7354,
+      "eval_samples_per_second": 76.019,
+      "eval_steps_per_second": 1.22,
+      "step": 63
+    },
+    {
+      "epoch": 10.0,
+      "learning_rate": 6.666666666666667e-05,
+      "loss": 1.1897,
+      "step": 70
+    },
+    {
+      "epoch": 10.0,
+      "eval_accuracy": 0.4908256880733945,
+      "eval_f1": 0.40018913464018235,
+      "eval_loss": 1.1914395093917847,
+      "eval_precision": 0.4465401552610121,
+      "eval_recall": 0.4908256880733945,
+      "eval_runtime": 5.8725,
+      "eval_samples_per_second": 74.244,
+      "eval_steps_per_second": 1.192,
+      "step": 70
+    },
+    {
+      "epoch": 11.0,
+      "eval_accuracy": 0.5137614678899083,
+      "eval_f1": 0.4264259625764651,
+      "eval_loss": 1.1677685976028442,
+      "eval_precision": 0.6977269943419414,
+      "eval_recall": 0.5137614678899083,
+      "eval_runtime": 5.9101,
+      "eval_samples_per_second": 73.772,
+      "eval_steps_per_second": 1.184,
+      "step": 77
+    },
+    {
+      "epoch": 11.43,
+      "learning_rate": 5.714285714285714e-05,
+      "loss": 1.1449,
+      "step": 80
+    },
+    {
+      "epoch": 12.0,
+      "eval_accuracy": 0.5137614678899083,
+      "eval_f1": 0.42019701825907374,
+      "eval_loss": 1.1410157680511475,
+      "eval_precision": 0.4223060434667934,
+      "eval_recall": 0.5137614678899083,
+      "eval_runtime": 5.68,
+      "eval_samples_per_second": 76.761,
+      "eval_steps_per_second": 1.232,
+      "step": 84
+    },
+    {
+      "epoch": 12.86,
+      "learning_rate": 4.761904761904762e-05,
+      "loss": 1.1103,
+      "step": 90
+    },
+    {
+      "epoch": 13.0,
+      "eval_accuracy": 0.5435779816513762,
+      "eval_f1": 0.45463643608379634,
+      "eval_loss": 1.1230803728103638,
+      "eval_precision": 0.4453251266498374,
+      "eval_recall": 0.5435779816513762,
+      "eval_runtime": 5.6703,
+      "eval_samples_per_second": 76.892,
+      "eval_steps_per_second": 1.235,
+      "step": 91
+    },
+    {
+      "epoch": 14.0,
+      "eval_accuracy": 0.5527522935779816,
+      "eval_f1": 0.46754301809966226,
+      "eval_loss": 1.102858066558838,
+      "eval_precision": 0.4585875088630616,
+      "eval_recall": 0.5527522935779816,
+      "eval_runtime": 5.6798,
+      "eval_samples_per_second": 76.764,
+      "eval_steps_per_second": 1.232,
+      "step": 98
+    },
+    {
+      "epoch": 14.29,
+      "learning_rate": 3.809523809523809e-05,
+      "loss": 1.0763,
+      "step": 100
+    },
+    {
+      "epoch": 15.0,
+      "eval_accuracy": 0.5458715596330275,
+      "eval_f1": 0.4634974694985357,
+      "eval_loss": 1.0851385593414307,
+      "eval_precision": 0.6996862082871257,
+      "eval_recall": 0.5458715596330275,
+      "eval_runtime": 6.8058,
+      "eval_samples_per_second": 64.063,
+      "eval_steps_per_second": 1.029,
+      "step": 105
+    },
+    {
+      "epoch": 15.71,
+      "learning_rate": 2.857142857142857e-05,
+      "loss": 1.0496,
+      "step": 110
+    },
+    {
+      "epoch": 16.0,
+      "eval_accuracy": 0.5688073394495413,
+      "eval_f1": 0.48620627733329547,
+      "eval_loss": 1.0685973167419434,
+      "eval_precision": 0.5379831413851768,
+      "eval_recall": 0.5688073394495413,
+      "eval_runtime": 5.6811,
+      "eval_samples_per_second": 76.746,
+      "eval_steps_per_second": 1.232,
+      "step": 112
+    },
+    {
+      "epoch": 17.0,
+      "eval_accuracy": 0.5527522935779816,
+      "eval_f1": 0.4768952189953553,
+      "eval_loss": 1.0685114860534668,
+      "eval_precision": 0.597456441198868,
+      "eval_recall": 0.5527522935779816,
+      "eval_runtime": 5.7578,
+      "eval_samples_per_second": 75.723,
+      "eval_steps_per_second": 1.216,
+      "step": 119
+    },
+    {
+      "epoch": 17.14,
+      "learning_rate": 1.9047619047619046e-05,
+      "loss": 1.0178,
+      "step": 120
+    },
+    {
+      "epoch": 18.0,
+      "eval_accuracy": 0.5435779816513762,
+      "eval_f1": 0.4674479767067327,
+      "eval_loss": 1.0596745014190674,
+      "eval_precision": 0.5879862703091682,
+      "eval_recall": 0.5435779816513762,
+      "eval_runtime": 5.6723,
+      "eval_samples_per_second": 76.865,
+      "eval_steps_per_second": 1.234,
+      "step": 126
+    },
+    {
+      "epoch": 18.57,
+      "learning_rate": 9.523809523809523e-06,
+      "loss": 1.0127,
+      "step": 130
+    },
+    {
+      "epoch": 19.0,
+      "eval_accuracy": 0.5711009174311926,
+      "eval_f1": 0.49584804868136073,
+      "eval_loss": 1.0444973707199097,
+      "eval_precision": 0.6083837079452298,
+      "eval_recall": 0.5711009174311926,
+      "eval_runtime": 5.7997,
+      "eval_samples_per_second": 75.176,
+      "eval_steps_per_second": 1.207,
+      "step": 133
+    },
+    {
+      "epoch": 20.0,
+      "learning_rate": 0.0,
+      "loss": 0.9996,
+      "step": 140
+    },
+    {
+      "epoch": 20.0,
+      "eval_accuracy": 0.5642201834862385,
+      "eval_f1": 0.4813301262382135,
+      "eval_loss": 1.0442301034927368,
+      "eval_precision": 0.5786388539620291,
+      "eval_recall": 0.5642201834862385,
+      "eval_runtime": 5.7325,
+      "eval_samples_per_second": 76.058,
+      "eval_steps_per_second": 1.221,
+      "step": 140
+    },
+    {
+      "epoch": 20.0,
+      "step": 140,
+      "total_flos": 7.403951867151974e+17,
+      "train_loss": 1.1767685549599785,
+      "train_runtime": 421.2758,
+      "train_samples_per_second": 82.749,
+      "train_steps_per_second": 0.332
+    }
+  ],
+  "max_steps": 140,
+  "num_train_epochs": 20,
+  "total_flos": 7.403951867151974e+17,
+  "trial_name": null,
+  "trial_params": null
+}

training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:22dfc15d863743abc224a6966344a36db76a2052ffbe6fa1ac53f6ac1fb592fc
 size 3439

 version https://git-lfs.github.com/spec/v1
+oid sha256:876d7e78c817fe779bc15169c094ee092e47bccd8d6e39205df03f212a0caa14
 size 3439