Upload 7 files

Browse files

Files changed (7) hide show

optimizer.pt +3 -0
pytorch_model.bin +3 -0
rng_state.pth +3 -0
scaler.pt +3 -0
scheduler.pt +3 -0
trainer_state.json +460 -0
training_args.bin +3 -0

optimizer.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:f14ff405d771a19d42c65e8960e32fae16533f3ac701ce86509191d6acf6eca1
+size 26719

pytorch_model.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:f7da4efa2107e419b748ba6e6d07908c82ba34a61bdda8d5462c547112c47956
+size 498691883

rng_state.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:13ee751c6679dfd93855bd123dd9491ae335784e145c0ba21cf46ffa7cf3d109
+size 14439

scaler.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:5f71fc68a2307b7c9559c27b8b33ab647783de01c671949f94d9448a40a2355e
+size 559

scheduler.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:17c3bf6ff131f71817ef4d9319384e7d13849ee245a4360dbf89ce1daaf630cc
+size 623

trainer_state.json ADDED Viewed

	@@ -0,0 +1,460 @@

+{
+  "best_metric": 1.177585244178772,
+  "best_model_checkpoint": "/content/drive/Shareddrives/flipflow/Desarrollo/Projects/contrastive-product-matching/reports/contrastive-ft-siamese/all-xlarge-all-512-all-0.1-5e-05-frozen-roberta-base/0/checkpoint-25136",
+  "epoch": 9.0,
+  "global_step": 28278,
+  "is_hyper_param_search": false,
+  "is_local_process_zero": true,
+  "is_world_process_zero": true,
+  "log_history": [
+    {
+      "epoch": 0.16,
+      "learning_rate": 7.829408020369192e-07,
+      "loss": 1.7523,
+      "step": 500
+    },
+    {
+      "epoch": 0.32,
+      "learning_rate": 1.5786123488224062e-06,
+      "loss": 1.6241,
+      "step": 1000
+    },
+    {
+      "epoch": 0.48,
+      "learning_rate": 2.374283895607893e-06,
+      "loss": 1.4901,
+      "step": 1500
+    },
+    {
+      "epoch": 0.64,
+      "learning_rate": 3.1699554423933804e-06,
+      "loss": 1.3765,
+      "step": 2000
+    },
+    {
+      "epoch": 0.8,
+      "learning_rate": 3.965626989178867e-06,
+      "loss": 1.2813,
+      "step": 2500
+    },
+    {
+      "epoch": 0.95,
+      "learning_rate": 4.7612985359643546e-06,
+      "loss": 1.2277,
+      "step": 3000
+    },
+    {
+      "epoch": 1.0,
+      "eval_accuracy": 0.822340580767547,
+      "eval_f1": 0.05583559519193486,
+      "eval_loss": 1.2101483345031738,
+      "eval_precision": 0.11464968152866242,
+      "eval_recall": 0.03690415171706817,
+      "eval_runtime": 113.1945,
+      "eval_samples_per_second": 121.084,
+      "eval_steps_per_second": 15.142,
+      "step": 3142
+    },
+    {
+      "epoch": 1.11,
+      "learning_rate": 5.556970082749841e-06,
+      "loss": 1.204,
+      "step": 3500
+    },
+    {
+      "epoch": 1.27,
+      "learning_rate": 6.3526416295353275e-06,
+      "loss": 1.2103,
+      "step": 4000
+    },
+    {
+      "epoch": 1.43,
+      "learning_rate": 7.148313176320815e-06,
+      "loss": 1.1915,
+      "step": 4500
+    },
+    {
+      "epoch": 1.59,
+      "learning_rate": 7.942393380012732e-06,
+      "loss": 1.2112,
+      "step": 5000
+    },
+    {
+      "epoch": 1.75,
+      "learning_rate": 8.738064926798218e-06,
+      "loss": 1.1908,
+      "step": 5500
+    },
+    {
+      "epoch": 1.91,
+      "learning_rate": 9.533736473583705e-06,
+      "loss": 1.1902,
+      "step": 6000
+    },
+    {
+      "epoch": 2.0,
+      "eval_accuracy": 0.8191303078943528,
+      "eval_f1": 0.05561904761904763,
+      "eval_loss": 1.187880039215088,
+      "eval_precision": 0.1083086053412463,
+      "eval_recall": 0.03741670937980523,
+      "eval_runtime": 105.6854,
+      "eval_samples_per_second": 129.687,
+      "eval_steps_per_second": 16.218,
+      "step": 6284
+    },
+    {
+      "epoch": 2.07,
+      "learning_rate": 1.0329408020369192e-05,
+      "loss": 1.1958,
+      "step": 6500
+    },
+    {
+      "epoch": 2.23,
+      "learning_rate": 1.112507956715468e-05,
+      "loss": 1.1903,
+      "step": 7000
+    },
+    {
+      "epoch": 2.39,
+      "learning_rate": 1.1919159770846595e-05,
+      "loss": 1.1805,
+      "step": 7500
+    },
+    {
+      "epoch": 2.55,
+      "learning_rate": 1.271483131763208e-05,
+      "loss": 1.1802,
+      "step": 8000
+    },
+    {
+      "epoch": 2.71,
+      "learning_rate": 1.3510502864417568e-05,
+      "loss": 1.1926,
+      "step": 8500
+    },
+    {
+      "epoch": 2.86,
+      "learning_rate": 1.4306174411203055e-05,
+      "loss": 1.1741,
+      "step": 9000
+    },
+    {
+      "epoch": 3.0,
+      "eval_accuracy": 0.4888370056909383,
+      "eval_f1": 0.24259459459459462,
+      "eval_loss": 1.1829431056976318,
+      "eval_precision": 0.15371968762844226,
+      "eval_recall": 0.5750896975909789,
+      "eval_runtime": 105.5508,
+      "eval_samples_per_second": 129.852,
+      "eval_steps_per_second": 16.239,
+      "step": 9426
+    },
+    {
+      "epoch": 3.02,
+      "learning_rate": 1.5101845957988542e-05,
+      "loss": 1.1848,
+      "step": 9500
+    },
+    {
+      "epoch": 3.18,
+      "learning_rate": 1.589751750477403e-05,
+      "loss": 1.1885,
+      "step": 10000
+    },
+    {
+      "epoch": 3.34,
+      "learning_rate": 1.6693189051559517e-05,
+      "loss": 1.178,
+      "step": 10500
+    },
+    {
+      "epoch": 3.5,
+      "learning_rate": 1.7488860598345004e-05,
+      "loss": 1.1823,
+      "step": 11000
+    },
+    {
+      "epoch": 3.66,
+      "learning_rate": 1.828294080203692e-05,
+      "loss": 1.1783,
+      "step": 11500
+    },
+    {
+      "epoch": 3.82,
+      "learning_rate": 1.9078612348822408e-05,
+      "loss": 1.1807,
+      "step": 12000
+    },
+    {
+      "epoch": 3.98,
+      "learning_rate": 1.9874283895607895e-05,
+      "loss": 1.1737,
+      "step": 12500
+    },
+    {
+      "epoch": 4.0,
+      "eval_accuracy": 0.4849700860936816,
+      "eval_f1": 0.26993484331368295,
+      "eval_loss": 1.1806172132492065,
+      "eval_precision": 0.16908525524747345,
+      "eval_recall": 0.6688877498718606,
+      "eval_runtime": 105.6153,
+      "eval_samples_per_second": 129.773,
+      "eval_steps_per_second": 16.229,
+      "step": 12568
+    },
+    {
+      "epoch": 4.14,
+      "learning_rate": 2.0669955442393383e-05,
+      "loss": 1.1733,
+      "step": 13000
+    },
+    {
+      "epoch": 4.3,
+      "learning_rate": 2.14640356460853e-05,
+      "loss": 1.1763,
+      "step": 13500
+    },
+    {
+      "epoch": 4.46,
+      "learning_rate": 2.2258115849777213e-05,
+      "loss": 1.1767,
+      "step": 14000
+    },
+    {
+      "epoch": 4.61,
+      "learning_rate": 2.30537873965627e-05,
+      "loss": 1.1891,
+      "step": 14500
+    },
+    {
+      "epoch": 4.77,
+      "learning_rate": 2.3849458943348187e-05,
+      "loss": 1.182,
+      "step": 15000
+    },
+    {
+      "epoch": 4.93,
+      "learning_rate": 2.4645130490133675e-05,
+      "loss": 1.1839,
+      "step": 15500
+    },
+    {
+      "epoch": 5.0,
+      "eval_accuracy": 0.4106960455275062,
+      "eval_f1": 0.25550742003871324,
+      "eval_loss": 1.1798352003097534,
+      "eval_precision": 0.1557653405259609,
+      "eval_recall": 0.7104049205535623,
+      "eval_runtime": 105.6302,
+      "eval_samples_per_second": 129.755,
+      "eval_steps_per_second": 16.226,
+      "step": 15710
+    },
+    {
+      "epoch": 5.09,
+      "learning_rate": 2.544080203691916e-05,
+      "loss": 1.1756,
+      "step": 16000
+    },
+    {
+      "epoch": 5.25,
+      "learning_rate": 2.6236473583704646e-05,
+      "loss": 1.1727,
+      "step": 16500
+    },
+    {
+      "epoch": 5.41,
+      "learning_rate": 2.7032145130490133e-05,
+      "loss": 1.1892,
+      "step": 17000
+    },
+    {
+      "epoch": 5.57,
+      "learning_rate": 2.782781667727562e-05,
+      "loss": 1.1792,
+      "step": 17500
+    },
+    {
+      "epoch": 5.73,
+      "learning_rate": 2.8621896880967537e-05,
+      "loss": 1.1858,
+      "step": 18000
+    },
+    {
+      "epoch": 5.89,
+      "learning_rate": 2.941597708465945e-05,
+      "loss": 1.1694,
+      "step": 18500
+    },
+    {
+      "epoch": 6.0,
+      "eval_accuracy": 0.39085072231139645,
+      "eval_f1": 0.25315323374183735,
+      "eval_loss": 1.1799324750900269,
+      "eval_precision": 0.15333766796705678,
+      "eval_recall": 0.7252690927729369,
+      "eval_runtime": 105.6599,
+      "eval_samples_per_second": 129.718,
+      "eval_steps_per_second": 16.222,
+      "step": 18852
+    },
+    {
+      "epoch": 6.05,
+      "learning_rate": 3.0211648631444938e-05,
+      "loss": 1.1804,
+      "step": 19000
+    },
+    {
+      "epoch": 6.21,
+      "learning_rate": 3.100732017823043e-05,
+      "loss": 1.1857,
+      "step": 19500
+    },
+    {
+      "epoch": 6.37,
+      "learning_rate": 3.1802991725015916e-05,
+      "loss": 1.178,
+      "step": 20000
+    },
+    {
+      "epoch": 6.52,
+      "learning_rate": 3.25986632718014e-05,
+      "loss": 1.1785,
+      "step": 20500
+    },
+    {
+      "epoch": 6.68,
+      "learning_rate": 3.339433481858688e-05,
+      "loss": 1.1887,
+      "step": 21000
+    },
+    {
+      "epoch": 6.84,
+      "learning_rate": 3.419000636537237e-05,
+      "loss": 1.1636,
+      "step": 21500
+    },
+    {
+      "epoch": 7.0,
+      "eval_accuracy": 0.4095286735736174,
+      "eval_f1": 0.255816091954023,
+      "eval_loss": 1.1779592037200928,
+      "eval_precision": 0.1558718063648588,
+      "eval_recall": 0.7129677088672476,
+      "eval_runtime": 105.6851,
+      "eval_samples_per_second": 129.687,
+      "eval_steps_per_second": 16.218,
+      "step": 21994
+    },
+    {
+      "epoch": 7.0,
+      "learning_rate": 3.498567791215786e-05,
+      "loss": 1.1821,
+      "step": 22000
+    },
+    {
+      "epoch": 7.16,
+      "learning_rate": 3.5778166772756204e-05,
+      "loss": 1.1688,
+      "step": 22500
+    },
+    {
+      "epoch": 7.32,
+      "learning_rate": 3.657383831954169e-05,
+      "loss": 1.1845,
+      "step": 23000
+    },
+    {
+      "epoch": 7.48,
+      "learning_rate": 3.736950986632718e-05,
+      "loss": 1.1655,
+      "step": 23500
+    },
+    {
+      "epoch": 7.64,
+      "learning_rate": 3.8165181413112666e-05,
+      "loss": 1.19,
+      "step": 24000
+    },
+    {
+      "epoch": 7.8,
+      "learning_rate": 3.896085295989816e-05,
+      "loss": 1.184,
+      "step": 24500
+    },
+    {
+      "epoch": 7.96,
+      "learning_rate": 3.975652450668365e-05,
+      "loss": 1.1808,
+      "step": 25000
+    },
+    {
+      "epoch": 8.0,
+      "eval_accuracy": 0.4719830731066686,
+      "eval_f1": 0.26994855240593163,
+      "eval_loss": 1.177585244178772,
+      "eval_precision": 0.1680482290881688,
+      "eval_recall": 0.6858021527421835,
+      "eval_runtime": 105.6107,
+      "eval_samples_per_second": 129.779,
+      "eval_steps_per_second": 16.229,
+      "step": 25136
+    },
+    {
+      "epoch": 8.12,
+      "learning_rate": 4.0552196053469135e-05,
+      "loss": 1.1774,
+      "step": 25500
+    },
+    {
+      "epoch": 8.27,
+      "learning_rate": 4.134786760025462e-05,
+      "loss": 1.1627,
+      "step": 26000
+    },
+    {
+      "epoch": 8.43,
+      "learning_rate": 4.2141947803946535e-05,
+      "loss": 1.1773,
+      "step": 26500
+    },
+    {
+      "epoch": 8.59,
+      "learning_rate": 4.293761935073202e-05,
+      "loss": 1.1902,
+      "step": 27000
+    },
+    {
+      "epoch": 8.75,
+      "learning_rate": 4.373329089751751e-05,
+      "loss": 1.1792,
+      "step": 27500
+    },
+    {
+      "epoch": 8.91,
+      "learning_rate": 4.4528962444303e-05,
+      "loss": 1.171,
+      "step": 28000
+    },
+    {
+      "epoch": 9.0,
+      "eval_accuracy": 0.40989347730920767,
+      "eval_f1": 0.2570273746095903,
+      "eval_loss": 1.1790105104446411,
+      "eval_precision": 0.1565752658086178,
+      "eval_recall": 0.717068170169144,
+      "eval_runtime": 105.7455,
+      "eval_samples_per_second": 129.613,
+      "eval_steps_per_second": 16.209,
+      "step": 28278
+    }
+  ],
+  "max_steps": 628400,
+  "num_train_epochs": 200,
+  "total_flos": 0.0,
+  "trial_name": null,
+  "trial_params": null
+}

training_args.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:ebfee223d2fca02206e0537a3354f7e3524985d065f4f3059aec69c1a68011c6
+size 3311