End of training

Browse files

Files changed (5) hide show

all_results.json +8 -0
pytorch_model.bin +1 -1
runs/Oct21_22-24-56_teesta/events.out.tfevents.1666371324.teesta.31301.0 +2 -2
train_results.json +8 -0
trainer_state.json +505 -0

all_results.json ADDED Viewed

	@@ -0,0 +1,8 @@

+{
+    "epoch": 19.99,
+    "total_flos": 5.432231359979311e+18,
+    "train_loss": 0.6680345350503921,
+    "train_runtime": 1446.6101,
+    "train_samples_per_second": 71.533,
+    "train_steps_per_second": 0.277
+}

pytorch_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:bab4be19cc209032f2b6ff75400cc057632ac91dcddbb19f457262e80c44d500
 size 233549753

 version https://git-lfs.github.com/spec/v1
+oid sha256:ba9137a731f10b5b65349f6bd59255dff66fca1ef6ac1dedd12da9b212cf0703
 size 233549753

runs/Oct21_22-24-56_teesta/events.out.tfevents.1666371324.teesta.31301.0 CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:03921a34f7590f16af4fc9113d2ee9e678e06da0855917703ce430cb0cd6b8ae
-size 19474

 version https://git-lfs.github.com/spec/v1
+oid sha256:2b5dc00af85f6e4b9200adefc729928cb70b4740d4e9e745ee7c23d9810ba4f9
+size 19828

train_results.json ADDED Viewed

	@@ -0,0 +1,8 @@

+{
+    "epoch": 19.99,
+    "total_flos": 5.432231359979311e+18,
+    "train_loss": 0.6680345350503921,
+    "train_runtime": 1446.6101,
+    "train_samples_per_second": 71.533,
+    "train_steps_per_second": 0.277
+}

trainer_state.json ADDED Viewed

	@@ -0,0 +1,505 @@

+{
+  "best_metric": 0.758887171561051,
+  "best_model_checkpoint": "resnet152-FV-finetuned-memes/checkpoint-300",
+  "epoch": 19.987654320987655,
+  "global_step": 400,
+  "is_hyper_param_search": false,
+  "is_local_process_zero": true,
+  "is_world_process_zero": true,
+  "log_history": [
+    {
+      "epoch": 0.49,
+      "learning_rate": 3e-05,
+      "loss": 1.605,
+      "step": 10
+    },
+    {
+      "epoch": 0.99,
+      "learning_rate": 6e-05,
+      "loss": 1.5739,
+      "step": 20
+    },
+    {
+      "epoch": 0.99,
+      "eval_accuracy": 0.4520865533230294,
+      "eval_f1": 0.2879543301590467,
+      "eval_loss": 1.542733907699585,
+      "eval_precision": 0.31310616306027816,
+      "eval_recall": 0.4520865533230294,
+      "eval_runtime": 13.5797,
+      "eval_samples_per_second": 95.289,
+      "eval_steps_per_second": 1.546,
+      "step": 20
+    },
+    {
+      "epoch": 1.49,
+      "learning_rate": 9e-05,
+      "loss": 1.557,
+      "step": 30
+    },
+    {
+      "epoch": 1.99,
+      "learning_rate": 0.00012,
+      "loss": 1.4353,
+      "step": 40
+    },
+    {
+      "epoch": 1.99,
+      "eval_accuracy": 0.44899536321483774,
+      "eval_f1": 0.27913559166246477,
+      "eval_loss": 1.378554105758667,
+      "eval_precision": 0.3849846576082604,
+      "eval_recall": 0.44899536321483774,
+      "eval_runtime": 11.7486,
+      "eval_samples_per_second": 110.141,
+      "eval_steps_per_second": 1.787,
+      "step": 40
+    },
+    {
+      "epoch": 2.49,
+      "learning_rate": 0.00011666666666666667,
+      "loss": 1.3861,
+      "step": 50
+    },
+    {
+      "epoch": 2.99,
+      "learning_rate": 0.00011333333333333333,
+      "loss": 1.3026,
+      "step": 60
+    },
+    {
+      "epoch": 2.99,
+      "eval_accuracy": 0.47990726429675423,
+      "eval_f1": 0.33925239665034806,
+      "eval_loss": 1.2733628749847412,
+      "eval_precision": 0.3072903900501765,
+      "eval_recall": 0.47990726429675423,
+      "eval_runtime": 11.82,
+      "eval_samples_per_second": 109.475,
+      "eval_steps_per_second": 1.777,
+      "step": 60
+    },
+    {
+      "epoch": 3.49,
+      "learning_rate": 0.00011,
+      "loss": 1.2728,
+      "step": 70
+    },
+    {
+      "epoch": 3.99,
+      "learning_rate": 0.00010666666666666667,
+      "loss": 1.1579,
+      "step": 80
+    },
+    {
+      "epoch": 3.99,
+      "eval_accuracy": 0.5278207109737248,
+      "eval_f1": 0.41425802390052474,
+      "eval_loss": 1.137792706489563,
+      "eval_precision": 0.4299797234929115,
+      "eval_recall": 0.5278207109737248,
+      "eval_runtime": 11.7797,
+      "eval_samples_per_second": 109.85,
+      "eval_steps_per_second": 1.783,
+      "step": 80
+    },
+    {
+      "epoch": 4.49,
+      "learning_rate": 0.00010333333333333334,
+      "loss": 1.1096,
+      "step": 90
+    },
+    {
+      "epoch": 4.99,
+      "learning_rate": 0.0001,
+      "loss": 1.0276,
+      "step": 100
+    },
+    {
+      "epoch": 4.99,
+      "eval_accuracy": 0.5734157650695518,
+      "eval_f1": 0.4864664230611172,
+      "eval_loss": 1.0231207609176636,
+      "eval_precision": 0.449744448551538,
+      "eval_recall": 0.5734157650695518,
+      "eval_runtime": 11.7657,
+      "eval_samples_per_second": 109.98,
+      "eval_steps_per_second": 1.785,
+      "step": 100
+    },
+    {
+      "epoch": 5.49,
+      "learning_rate": 9.666666666666667e-05,
+      "loss": 0.9751,
+      "step": 110
+    },
+    {
+      "epoch": 5.99,
+      "learning_rate": 9.333333333333334e-05,
+      "loss": 0.8826,
+      "step": 120
+    },
+    {
+      "epoch": 5.99,
+      "eval_accuracy": 0.625193199381762,
+      "eval_f1": 0.5636892396732486,
+      "eval_loss": 0.9227971434593201,
+      "eval_precision": 0.5982698615367767,
+      "eval_recall": 0.625193199381762,
+      "eval_runtime": 12.7817,
+      "eval_samples_per_second": 101.239,
+      "eval_steps_per_second": 1.643,
+      "step": 120
+    },
+    {
+      "epoch": 6.49,
+      "learning_rate": 9e-05,
+      "loss": 0.8232,
+      "step": 130
+    },
+    {
+      "epoch": 6.99,
+      "learning_rate": 8.666666666666667e-05,
+      "loss": 0.766,
+      "step": 140
+    },
+    {
+      "epoch": 6.99,
+      "eval_accuracy": 0.6661514683153014,
+      "eval_f1": 0.6320349212780727,
+      "eval_loss": 0.8440618515014648,
+      "eval_precision": 0.647375804405681,
+      "eval_recall": 0.6661514683153014,
+      "eval_runtime": 11.8583,
+      "eval_samples_per_second": 109.122,
+      "eval_steps_per_second": 1.771,
+      "step": 140
+    },
+    {
+      "epoch": 7.49,
+      "learning_rate": 8.333333333333333e-05,
+      "loss": 0.7145,
+      "step": 150
+    },
+    {
+      "epoch": 7.99,
+      "learning_rate": 7.999999999999999e-05,
+      "loss": 0.6732,
+      "step": 160
+    },
+    {
+      "epoch": 7.99,
+      "eval_accuracy": 0.6901081916537867,
+      "eval_f1": 0.6704100670249821,
+      "eval_loss": 0.8009499311447144,
+      "eval_precision": 0.6758956033590393,
+      "eval_recall": 0.6901081916537867,
+      "eval_runtime": 11.8229,
+      "eval_samples_per_second": 109.449,
+      "eval_steps_per_second": 1.776,
+      "step": 160
+    },
+    {
+      "epoch": 8.49,
+      "learning_rate": 7.666666666666667e-05,
+      "loss": 0.635,
+      "step": 170
+    },
+    {
+      "epoch": 8.99,
+      "learning_rate": 7.333333333333334e-05,
+      "loss": 0.5653,
+      "step": 180
+    },
+    {
+      "epoch": 8.99,
+      "eval_accuracy": 0.7217928902627512,
+      "eval_f1": 0.7129313347452736,
+      "eval_loss": 0.7535430192947388,
+      "eval_precision": 0.7141409959676454,
+      "eval_recall": 0.7217928902627512,
+      "eval_runtime": 11.8519,
+      "eval_samples_per_second": 109.181,
+      "eval_steps_per_second": 1.772,
+      "step": 180
+    },
+    {
+      "epoch": 9.49,
+      "learning_rate": 7.000000000000001e-05,
+      "loss": 0.5358,
+      "step": 190
+    },
+    {
+      "epoch": 9.99,
+      "learning_rate": 6.666666666666667e-05,
+      "loss": 0.4957,
+      "step": 200
+    },
+    {
+      "epoch": 9.99,
+      "eval_accuracy": 0.7256568778979907,
+      "eval_f1": 0.7199928490312443,
+      "eval_loss": 0.731657087802887,
+      "eval_precision": 0.7247700086876532,
+      "eval_recall": 0.7256568778979907,
+      "eval_runtime": 12.0809,
+      "eval_samples_per_second": 107.111,
+      "eval_steps_per_second": 1.738,
+      "step": 200
+    },
+    {
+      "epoch": 10.49,
+      "learning_rate": 6.333333333333333e-05,
+      "loss": 0.471,
+      "step": 210
+    },
+    {
+      "epoch": 10.99,
+      "learning_rate": 6e-05,
+      "loss": 0.4534,
+      "step": 220
+    },
+    {
+      "epoch": 10.99,
+      "eval_accuracy": 0.7434312210200927,
+      "eval_f1": 0.7389905178601613,
+      "eval_loss": 0.6807736158370972,
+      "eval_precision": 0.7405180153510328,
+      "eval_recall": 0.7434312210200927,
+      "eval_runtime": 12.457,
+      "eval_samples_per_second": 103.877,
+      "eval_steps_per_second": 1.686,
+      "step": 220
+    },
+    {
+      "epoch": 11.49,
+      "learning_rate": 5.6666666666666664e-05,
+      "loss": 0.4102,
+      "step": 230
+    },
+    {
+      "epoch": 11.99,
+      "learning_rate": 5.333333333333333e-05,
+      "loss": 0.3792,
+      "step": 240
+    },
+    {
+      "epoch": 11.99,
+      "eval_accuracy": 0.7449768160741885,
+      "eval_f1": 0.7398936491076405,
+      "eval_loss": 0.694913387298584,
+      "eval_precision": 0.7453650213081748,
+      "eval_recall": 0.7449768160741885,
+      "eval_runtime": 11.855,
+      "eval_samples_per_second": 109.153,
+      "eval_steps_per_second": 1.771,
+      "step": 240
+    },
+    {
+      "epoch": 12.49,
+      "learning_rate": 5e-05,
+      "loss": 0.3766,
+      "step": 250
+    },
+    {
+      "epoch": 12.99,
+      "learning_rate": 4.666666666666667e-05,
+      "loss": 0.3489,
+      "step": 260
+    },
+    {
+      "epoch": 12.99,
+      "eval_accuracy": 0.749613601236476,
+      "eval_f1": 0.7474367490892962,
+      "eval_loss": 0.6745789647102356,
+      "eval_precision": 0.751086737820255,
+      "eval_recall": 0.749613601236476,
+      "eval_runtime": 11.7383,
+      "eval_samples_per_second": 110.237,
+      "eval_steps_per_second": 1.789,
+      "step": 260
+    },
+    {
+      "epoch": 13.49,
+      "learning_rate": 4.3333333333333334e-05,
+      "loss": 0.3487,
+      "step": 270
+    },
+    {
+      "epoch": 13.99,
+      "learning_rate": 3.9999999999999996e-05,
+      "loss": 0.3113,
+      "step": 280
+    },
+    {
+      "epoch": 13.99,
+      "eval_accuracy": 0.7573415765069552,
+      "eval_f1": 0.7578669772980416,
+      "eval_loss": 0.6637156009674072,
+      "eval_precision": 0.7638354392114911,
+      "eval_recall": 0.7573415765069552,
+      "eval_runtime": 11.864,
+      "eval_samples_per_second": 109.069,
+      "eval_steps_per_second": 1.77,
+      "step": 280
+    },
+    {
+      "epoch": 14.49,
+      "learning_rate": 3.666666666666667e-05,
+      "loss": 0.3036,
+      "step": 290
+    },
+    {
+      "epoch": 14.99,
+      "learning_rate": 3.3333333333333335e-05,
+      "loss": 0.2947,
+      "step": 300
+    },
+    {
+      "epoch": 14.99,
+      "eval_accuracy": 0.758887171561051,
+      "eval_f1": 0.7609777447379339,
+      "eval_loss": 0.6451451182365417,
+      "eval_precision": 0.7666890251959252,
+      "eval_recall": 0.758887171561051,
+      "eval_runtime": 11.5648,
+      "eval_samples_per_second": 111.891,
+      "eval_steps_per_second": 1.816,
+      "step": 300
+    },
+    {
+      "epoch": 15.49,
+      "learning_rate": 3e-05,
+      "loss": 0.2748,
+      "step": 310
+    },
+    {
+      "epoch": 15.99,
+      "learning_rate": 2.6666666666666667e-05,
+      "loss": 0.2776,
+      "step": 320
+    },
+    {
+      "epoch": 15.99,
+      "eval_accuracy": 0.7542503863987635,
+      "eval_f1": 0.7525049520726458,
+      "eval_loss": 0.6754108667373657,
+      "eval_precision": 0.7565187938926003,
+      "eval_recall": 0.7542503863987635,
+      "eval_runtime": 12.7697,
+      "eval_samples_per_second": 101.334,
+      "eval_steps_per_second": 1.645,
+      "step": 320
+    },
+    {
+      "epoch": 16.49,
+      "learning_rate": 2.3333333333333336e-05,
+      "loss": 0.272,
+      "step": 330
+    },
+    {
+      "epoch": 16.99,
+      "learning_rate": 1.9999999999999998e-05,
+      "loss": 0.2611,
+      "step": 340
+    },
+    {
+      "epoch": 16.99,
+      "eval_accuracy": 0.7550231839258115,
+      "eval_f1": 0.7529156321916382,
+      "eval_loss": 0.6808292269706726,
+      "eval_precision": 0.7606561956666212,
+      "eval_recall": 0.7550231839258115,
+      "eval_runtime": 11.6273,
+      "eval_samples_per_second": 111.29,
+      "eval_steps_per_second": 1.806,
+      "step": 340
+    },
+    {
+      "epoch": 17.49,
+      "learning_rate": 1.6666666666666667e-05,
+      "loss": 0.2508,
+      "step": 350
+    },
+    {
+      "epoch": 17.99,
+      "learning_rate": 1.3333333333333333e-05,
+      "loss": 0.2428,
+      "step": 360
+    },
+    {
+      "epoch": 17.99,
+      "eval_accuracy": 0.7457496136012365,
+      "eval_f1": 0.7403755418120831,
+      "eval_loss": 0.7005118727684021,
+      "eval_precision": 0.7497269917356472,
+      "eval_recall": 0.7457496136012365,
+      "eval_runtime": 11.7515,
+      "eval_samples_per_second": 110.114,
+      "eval_steps_per_second": 1.787,
+      "step": 360
+    },
+    {
+      "epoch": 18.49,
+      "learning_rate": 9.999999999999999e-06,
+      "loss": 0.2479,
+      "step": 370
+    },
+    {
+      "epoch": 18.99,
+      "learning_rate": 6.666666666666667e-06,
+      "loss": 0.2346,
+      "step": 380
+    },
+    {
+      "epoch": 18.99,
+      "eval_accuracy": 0.7573415765069552,
+      "eval_f1": 0.7590201528020784,
+      "eval_loss": 0.6597253680229187,
+      "eval_precision": 0.7642128778135023,
+      "eval_recall": 0.7573415765069552,
+      "eval_runtime": 11.869,
+      "eval_samples_per_second": 109.024,
+      "eval_steps_per_second": 1.769,
+      "step": 380
+    },
+    {
+      "epoch": 19.49,
+      "learning_rate": 3.3333333333333333e-06,
+      "loss": 0.2312,
+      "step": 390
+    },
+    {
+      "epoch": 19.99,
+      "learning_rate": 0.0,
+      "loss": 0.2367,
+      "step": 400
+    },
+    {
+      "epoch": 19.99,
+      "eval_accuracy": 0.7557959814528593,
+      "eval_f1": 0.7545674798253312,
+      "eval_loss": 0.6771848797798157,
+      "eval_precision": 0.7556690736625777,
+      "eval_recall": 0.7557959814528593,
+      "eval_runtime": 12.018,
+      "eval_samples_per_second": 107.672,
+      "eval_steps_per_second": 1.747,
+      "step": 400
+    },
+    {
+      "epoch": 19.99,
+      "step": 400,
+      "total_flos": 5.432231359979311e+18,
+      "train_loss": 0.6680345350503921,
+      "train_runtime": 1446.6101,
+      "train_samples_per_second": 71.533,
+      "train_steps_per_second": 0.277
+    }
+  ],
+  "max_steps": 400,
+  "num_train_epochs": 20,
+  "total_flos": 5.432231359979311e+18,
+  "trial_name": null,
+  "trial_params": null
+}