Upload folder using huggingface_hub

Browse files

Files changed (7) hide show

config.json +1 -1
optimizer.pt +2 -2
model.safetensors → pytorch_model.bin +2 -2
rng_state.pth +1 -1
scheduler.pt +1 -1
trainer_state.json +126 -375
training_args.bin +2 -2

config.json CHANGED Viewed

@@ -22,7 +22,7 @@
   "position_embedding_type": "absolute",
   "problem_type": "single_label_classification",
   "torch_dtype": "float32",
-  "transformers_version": "4.35.2",
   "type_vocab_size": 1,
   "use_cache": true,
   "vocab_size": 50265

   "position_embedding_type": "absolute",
   "problem_type": "single_label_classification",
   "torch_dtype": "float32",
+  "transformers_version": "4.30.2",
   "type_vocab_size": 1,
   "use_cache": true,
   "vocab_size": 50265

optimizer.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:a2347bb36c75e36892183c95dce50a6b5615a6f578a2f69dc9fa44d40e4f2d99
-size 118173498

 version https://git-lfs.github.com/spec/v1
+oid sha256:6c3c8d0e76911edabda4ab250741c870e4e952b86246bb618567241576ff3478
+size 118164566

model.safetensors → pytorch_model.bin RENAMED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:76be76a15eb7729f4b00b4f1d419d99293a80090099dc1e5fabd15af50a9baac
-size 498612824

 version https://git-lfs.github.com/spec/v1
+oid sha256:6b978135ac2209a82b6de6ae0226ab15107b18f0128625287f32c1f7bf6d1ac7
+size 498662578

rng_state.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:b92896732603661d06d166837c431b32c69a6df4f83079e8f3cf7091b113ad6a
 size 14244

 version https://git-lfs.github.com/spec/v1
+oid sha256:90335df6b4672643597b54508bc69e775017b50d0888af17282b7b0c642b3b53
 size 14244

scheduler.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:0dcb5d1309ade11adef56b51bf410df7ad6a10fac32cf9fd0b45c0dab8f75032
 size 1064

 version https://git-lfs.github.com/spec/v1
+oid sha256:ac73aa17dd42bf751cbba9d5abff2558729f6cf81e85083ea16fd3c5c49619d2
 size 1064

trainer_state.json CHANGED Viewed

@@ -1,445 +1,196 @@
 {
-  "best_metric": 0.9870967741935484,
-  "best_model_checkpoint": "./php_cwe79_codebert_output\\checkpoint-1648",
-  "epoch": 16.99203640500569,
-  "eval_steps": 500,
-  "global_step": 1867,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
   "log_history": [
     {
-      "epoch": 0.46,
-      "learning_rate": 4.587155963302753e-06,
-      "loss": 0.7019,
       "step": 50
     },
     {
-      "epoch": 0.91,
-      "learning_rate": 9.174311926605506e-06,
-      "loss": 0.6915,
       "step": 100
     },
     {
-      "epoch": 0.99,
-      "eval_accuracy": 0.5532258064516129,
-      "eval_f1": 0.4822429906542056,
-      "eval_loss": 0.6805028915405273,
-      "eval_precision": 0.5733333333333334,
-      "eval_recall": 0.4161290322580645,
-      "eval_runtime": 19.9477,
-      "eval_samples_per_second": 62.162,
-      "eval_steps_per_second": 3.91,
-      "step": 109
-    },
-    {
-      "epoch": 1.37,
-      "learning_rate": 1.3761467889908258e-05,
-      "loss": 0.6774,
       "step": 150
     },
     {
-      "epoch": 1.82,
-      "learning_rate": 1.834862385321101e-05,
-      "loss": 0.5408,
-      "step": 200
     },
     {
-      "epoch": 1.99,
-      "eval_accuracy": 0.8362903225806452,
-      "eval_f1": 0.8407843137254902,
-      "eval_loss": 0.35471096634864807,
-      "eval_precision": 0.8183206106870229,
-      "eval_recall": 0.864516129032258,
-      "eval_runtime": 20.4696,
-      "eval_samples_per_second": 60.578,
-      "eval_steps_per_second": 3.811,
-      "step": 219
     },
     {
-      "epoch": 2.28,
-      "learning_rate": 1.9673802242609582e-05,
-      "loss": 0.3461,
       "step": 250
     },
     {
-      "epoch": 2.73,
-      "learning_rate": 1.9164118246687054e-05,
-      "loss": 0.2515,
       "step": 300
     },
     {
-      "epoch": 2.99,
-      "eval_accuracy": 0.9185483870967742,
-      "eval_f1": 0.9144792548687553,
-      "eval_loss": 0.20694807171821594,
-      "eval_precision": 0.9625668449197861,
-      "eval_recall": 0.8709677419354839,
-      "eval_runtime": 31.9108,
-      "eval_samples_per_second": 38.858,
-      "eval_steps_per_second": 2.444,
-      "step": 329
     },
     {
-      "epoch": 3.19,
-      "learning_rate": 1.865443425076453e-05,
-      "loss": 0.211,
       "step": 350
     },
     {
-      "epoch": 3.64,
-      "learning_rate": 1.8144750254841998e-05,
-      "loss": 0.1931,
       "step": 400
     },
     {
-      "epoch": 4.0,
-      "eval_accuracy": 0.9314516129032258,
-      "eval_f1": 0.9280270956816258,
-      "eval_loss": 0.16265422105789185,
-      "eval_precision": 0.9768270944741533,
-      "eval_recall": 0.8838709677419355,
-      "eval_runtime": 36.5458,
-      "eval_samples_per_second": 33.93,
-      "eval_steps_per_second": 2.134,
-      "step": 439
-    },
-    {
-      "epoch": 4.1,
-      "learning_rate": 1.763506625891947e-05,
-      "loss": 0.1447,
       "step": 450
     },
     {
-      "epoch": 4.55,
-      "learning_rate": 1.7125382262996945e-05,
-      "loss": 0.1335,
-      "step": 500
     },
     {
-      "epoch": 5.0,
-      "eval_accuracy": 0.9612903225806452,
-      "eval_f1": 0.9608482871125612,
-      "eval_loss": 0.09464450925588608,
-      "eval_precision": 0.971947194719472,
-      "eval_recall": 0.95,
-      "eval_runtime": 35.2367,
-      "eval_samples_per_second": 35.191,
-      "eval_steps_per_second": 2.214,
-      "step": 549
     },
     {
-      "epoch": 5.01,
-      "learning_rate": 1.6625891946992865e-05,
-      "loss": 0.1333,
       "step": 550
     },
     {
-      "epoch": 5.46,
-      "learning_rate": 1.6116207951070337e-05,
-      "loss": 0.1043,
       "step": 600
     },
     {
-      "epoch": 5.92,
-      "learning_rate": 1.560652395514781e-05,
-      "loss": 0.1057,
       "step": 650
     },
     {
-      "epoch": 6.0,
-      "eval_accuracy": 0.9548387096774194,
-      "eval_f1": 0.9537953795379538,
-      "eval_loss": 0.09458089619874954,
-      "eval_precision": 0.9763513513513513,
-      "eval_recall": 0.932258064516129,
-      "eval_runtime": 36.0845,
-      "eval_samples_per_second": 34.364,
-      "eval_steps_per_second": 2.162,
-      "step": 659
-    },
-    {
-      "epoch": 6.37,
-      "learning_rate": 1.5096839959225283e-05,
-      "loss": 0.1046,
       "step": 700
     },
     {
-      "epoch": 6.83,
-      "learning_rate": 1.4587155963302753e-05,
-      "loss": 0.0887,
       "step": 750
     },
     {
-      "epoch": 7.0,
-      "eval_accuracy": 0.9701612903225807,
-      "eval_f1": 0.9699918896999189,
-      "eval_loss": 0.07421040534973145,
-      "eval_precision": 0.9755301794453507,
-      "eval_recall": 0.964516129032258,
-      "eval_runtime": 37.4354,
-      "eval_samples_per_second": 33.124,
-      "eval_steps_per_second": 2.084,
-      "step": 769
-    },
-    {
-      "epoch": 7.28,
-      "learning_rate": 1.4077471967380225e-05,
-      "loss": 0.0763,
       "step": 800
     },
     {
-      "epoch": 7.74,
-      "learning_rate": 1.3567787971457698e-05,
-      "loss": 0.0916,
       "step": 850
     },
     {
-      "epoch": 8.0,
-      "eval_accuracy": 0.9733870967741935,
-      "eval_f1": 0.9734085414987913,
-      "eval_loss": 0.05636864900588989,
-      "eval_precision": 0.9726247987117552,
-      "eval_recall": 0.9741935483870968,
-      "eval_runtime": 37.5471,
-      "eval_samples_per_second": 33.025,
-      "eval_steps_per_second": 2.077,
-      "step": 879
-    },
-    {
-      "epoch": 8.19,
-      "learning_rate": 1.305810397553517e-05,
-      "loss": 0.0858,
       "step": 900
     },
     {
-      "epoch": 8.65,
-      "learning_rate": 1.254841997961264e-05,
-      "loss": 0.0716,
-      "step": 950
-    },
-    {
-      "epoch": 8.99,
-      "eval_accuracy": 0.9790322580645161,
-      "eval_f1": 0.9790996784565916,
-      "eval_loss": 0.049785859882831573,
-      "eval_precision": 0.9759615384615384,
-      "eval_recall": 0.9822580645161291,
-      "eval_runtime": 39.3971,
-      "eval_samples_per_second": 31.474,
-      "eval_steps_per_second": 1.98,
-      "step": 988
-    },
-    {
-      "epoch": 9.1,
-      "learning_rate": 1.2038735983690114e-05,
-      "loss": 0.0686,
-      "step": 1000
-    },
-    {
-      "epoch": 9.56,
-      "learning_rate": 1.1529051987767585e-05,
-      "loss": 0.0673,
-      "step": 1050
-    },
-    {
-      "epoch": 9.99,
-      "eval_accuracy": 0.9798387096774194,
-      "eval_f1": 0.9799518845228549,
-      "eval_loss": 0.046214405447244644,
-      "eval_precision": 0.9744816586921851,
-      "eval_recall": 0.9854838709677419,
-      "eval_runtime": 29.0256,
-      "eval_samples_per_second": 42.721,
-      "eval_steps_per_second": 2.687,
-      "step": 1098
-    },
-    {
-      "epoch": 10.01,
-      "learning_rate": 1.1019367991845057e-05,
-      "loss": 0.0577,
-      "step": 1100
-    },
-    {
-      "epoch": 10.47,
-      "learning_rate": 1.0509683995922529e-05,
-      "loss": 0.0533,
-      "step": 1150
-    },
-    {
-      "epoch": 10.92,
-      "learning_rate": 1e-05,
-      "loss": 0.0569,
-      "step": 1200
-    },
-    {
-      "epoch": 10.99,
-      "eval_accuracy": 0.9846774193548387,
-      "eval_f1": 0.9847144006436042,
-      "eval_loss": 0.039788804948329926,
-      "eval_precision": 0.9823434991974318,
-      "eval_recall": 0.9870967741935484,
-      "eval_runtime": 29.3619,
-      "eval_samples_per_second": 42.232,
-      "eval_steps_per_second": 2.657,
-      "step": 1208
-    },
-    {
-      "epoch": 11.38,
-      "learning_rate": 9.490316004077473e-06,
-      "loss": 0.0497,
-      "step": 1250
-    },
-    {
-      "epoch": 11.83,
-      "learning_rate": 8.980632008154944e-06,
-      "loss": 0.0532,
-      "step": 1300
-    },
-    {
-      "epoch": 12.0,
-      "eval_accuracy": 0.9854838709677419,
-      "eval_f1": 0.9854604200323102,
-      "eval_loss": 0.034001607447862625,
-      "eval_precision": 0.9870550161812298,
-      "eval_recall": 0.9838709677419355,
-      "eval_runtime": 35.9784,
-      "eval_samples_per_second": 34.465,
-      "eval_steps_per_second": 2.168,
-      "step": 1318
-    },
-    {
-      "epoch": 12.29,
-      "learning_rate": 8.470948012232416e-06,
-      "loss": 0.0517,
-      "step": 1350
-    },
-    {
-      "epoch": 12.74,
-      "learning_rate": 7.961264016309888e-06,
-      "loss": 0.0382,
-      "step": 1400
-    },
-    {
-      "epoch": 13.0,
-      "eval_accuracy": 0.9854838709677419,
-      "eval_f1": 0.9855072463768116,
-      "eval_loss": 0.02894522435963154,
-      "eval_precision": 0.9839228295819936,
-      "eval_recall": 0.9870967741935484,
-      "eval_runtime": 37.3704,
-      "eval_samples_per_second": 33.181,
-      "eval_steps_per_second": 2.087,
-      "step": 1428
-    },
-    {
-      "epoch": 13.2,
-      "learning_rate": 7.45158002038736e-06,
-      "loss": 0.0333,
-      "step": 1450
-    },
-    {
-      "epoch": 13.65,
-      "learning_rate": 6.941896024464833e-06,
-      "loss": 0.0338,
-      "step": 1500
-    },
-    {
-      "epoch": 14.0,
-      "eval_accuracy": 0.9854838709677419,
-      "eval_f1": 0.9854838709677419,
-      "eval_loss": 0.028582246974110603,
-      "eval_precision": 0.9854838709677419,
-      "eval_recall": 0.9854838709677419,
-      "eval_runtime": 34.3893,
-      "eval_samples_per_second": 36.058,
-      "eval_steps_per_second": 2.268,
-      "step": 1538
-    },
-    {
-      "epoch": 14.11,
-      "learning_rate": 6.432212028542304e-06,
-      "loss": 0.0365,
-      "step": 1550
-    },
-    {
-      "epoch": 14.56,
-      "learning_rate": 5.922528032619776e-06,
-      "loss": 0.0332,
-      "step": 1600
-    },
-    {
-      "epoch": 15.0,
-      "eval_accuracy": 0.9870967741935484,
-      "eval_f1": 0.9870967741935484,
-      "eval_loss": 0.02915828675031662,
-      "eval_precision": 0.9870967741935484,
-      "eval_recall": 0.9870967741935484,
-      "eval_runtime": 24.73,
-      "eval_samples_per_second": 50.141,
-      "eval_steps_per_second": 3.154,
-      "step": 1648
-    },
-    {
-      "epoch": 15.02,
-      "learning_rate": 5.412844036697248e-06,
-      "loss": 0.0329,
-      "step": 1650
-    },
-    {
-      "epoch": 15.47,
-      "learning_rate": 4.90316004077472e-06,
-      "loss": 0.029,
-      "step": 1700
-    },
-    {
-      "epoch": 15.93,
-      "learning_rate": 4.393476044852192e-06,
-      "loss": 0.0271,
-      "step": 1750
-    },
-    {
-      "epoch": 16.0,
-      "eval_accuracy": 0.9854838709677419,
-      "eval_f1": 0.9855072463768116,
-      "eval_loss": 0.02873540110886097,
-      "eval_precision": 0.9839228295819936,
-      "eval_recall": 0.9870967741935484,
-      "eval_runtime": 24.9886,
-      "eval_samples_per_second": 49.623,
-      "eval_steps_per_second": 3.121,
-      "step": 1758
-    },
-    {
-      "epoch": 16.38,
-      "learning_rate": 3.8837920489296635e-06,
-      "loss": 0.0233,
-      "step": 1800
-    },
-    {
-      "epoch": 16.84,
-      "learning_rate": 3.3741080530071357e-06,
-      "loss": 0.0264,
-      "step": 1850
-    },
-    {
-      "epoch": 16.99,
-      "eval_accuracy": 0.9854838709677419,
-      "eval_f1": 0.9854838709677419,
-      "eval_loss": 0.026798125356435776,
-      "eval_precision": 0.9854838709677419,
-      "eval_recall": 0.9854838709677419,
-      "eval_runtime": 35.295,
-      "eval_samples_per_second": 35.132,
-      "eval_steps_per_second": 2.21,
-      "step": 1867
     }
   ],
-  "logging_steps": 50,
-  "max_steps": 2180,
   "num_train_epochs": 20,
-  "save_steps": 500,
-  "total_flos": 3.1422037786368e+16,
   "trial_name": null,
   "trial_params": null
 }

 {
+  "best_metric": 0.9907529722589168,
+  "best_model_checkpoint": "./php_cwe79_codebert_output\\checkpoint-627",
+  "epoch": 5.996810207336523,
+  "global_step": 940,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
   "log_history": [
     {
+      "epoch": 0.32,
+      "learning_rate": 3.205128205128206e-06,
+      "loss": 0.6994,
       "step": 50
     },
     {
+      "epoch": 0.64,
+      "learning_rate": 6.410256410256412e-06,
+      "loss": 0.6957,
       "step": 100
     },
     {
+      "epoch": 0.96,
+      "learning_rate": 9.615384615384616e-06,
+      "loss": 0.6873,
       "step": 150
     },
     {
+      "epoch": 1.0,
+      "eval_accuracy": 0.6689265536723163,
+      "eval_f1": 0.6689265536723163,
+      "eval_loss": 0.6734532713890076,
+      "eval_precision": 0.581532416502947,
+      "eval_recall": 0.7872340425531915,
+      "eval_runtime": 11.4008,
+      "eval_samples_per_second": 77.626,
+      "eval_steps_per_second": 4.912,
+      "step": 156
     },
     {
+      "epoch": 1.28,
+      "learning_rate": 1.2820512820512823e-05,
+      "loss": 0.6729,
+      "step": 200
     },
     {
+      "epoch": 1.59,
+      "learning_rate": 1.602564102564103e-05,
+      "loss": 0.5098,
       "step": 250
     },
     {
+      "epoch": 1.91,
+      "learning_rate": 1.923076923076923e-05,
+      "loss": 0.3065,
       "step": 300
     },
     {
+      "epoch": 2.0,
+      "eval_accuracy": 0.9299435028248587,
+      "eval_f1": 0.9146005509641874,
+      "eval_loss": 0.16874603927135468,
+      "eval_precision": 0.9485714285714286,
+      "eval_recall": 0.8829787234042553,
+      "eval_runtime": 11.7337,
+      "eval_samples_per_second": 75.424,
+      "eval_steps_per_second": 4.773,
+      "step": 313
     },
     {
+      "epoch": 2.23,
+      "learning_rate": 1.972934472934473e-05,
+      "loss": 0.2084,
       "step": 350
     },
     {
+      "epoch": 2.55,
+      "learning_rate": 1.9373219373219374e-05,
+      "loss": 0.1386,
       "step": 400
     },
     {
+      "epoch": 2.87,
+      "learning_rate": 1.9017094017094017e-05,
+      "loss": 0.0805,
       "step": 450
     },
     {
+      "epoch": 3.0,
+      "eval_accuracy": 0.9796610169491525,
+      "eval_f1": 0.9757412398921833,
+      "eval_loss": 0.046507738530635834,
+      "eval_precision": 0.9890710382513661,
+      "eval_recall": 0.9627659574468085,
+      "eval_runtime": 11.7373,
+      "eval_samples_per_second": 75.401,
+      "eval_steps_per_second": 4.771,
+      "step": 470
     },
     {
+      "epoch": 3.19,
+      "learning_rate": 1.8660968660968664e-05,
+      "loss": 0.0677,
+      "step": 500
     },
     {
+      "epoch": 3.51,
+      "learning_rate": 1.8304843304843308e-05,
+      "loss": 0.0628,
       "step": 550
     },
     {
+      "epoch": 3.83,
+      "learning_rate": 1.794871794871795e-05,
+      "loss": 0.0359,
       "step": 600
     },
     {
+      "epoch": 4.0,
+      "eval_accuracy": 0.992090395480226,
+      "eval_f1": 0.9907529722589168,
+      "eval_loss": 0.03131083399057388,
+      "eval_precision": 0.984251968503937,
+      "eval_recall": 0.9973404255319149,
+      "eval_runtime": 11.9166,
+      "eval_samples_per_second": 74.266,
+      "eval_steps_per_second": 4.699,
+      "step": 627
+    },
+    {
+      "epoch": 4.15,
+      "learning_rate": 1.7599715099715102e-05,
+      "loss": 0.0412,
       "step": 650
     },
     {
+      "epoch": 4.47,
+      "learning_rate": 1.7243589743589745e-05,
+      "loss": 0.0457,
       "step": 700
     },
     {
+      "epoch": 4.78,
+      "learning_rate": 1.688746438746439e-05,
+      "loss": 0.0316,
       "step": 750
     },
     {
+      "epoch": 5.0,
+      "eval_accuracy": 0.9909604519774011,
+      "eval_f1": 0.9894736842105263,
+      "eval_loss": 0.02798781916499138,
+      "eval_precision": 0.9791666666666666,
+      "eval_recall": 1.0,
+      "eval_runtime": 11.9117,
+      "eval_samples_per_second": 74.297,
+      "eval_steps_per_second": 4.701,
+      "step": 783
+    },
+    {
+      "epoch": 5.1,
+      "learning_rate": 1.6531339031339032e-05,
+      "loss": 0.0355,
       "step": 800
     },
     {
+      "epoch": 5.42,
+      "learning_rate": 1.6175213675213675e-05,
+      "loss": 0.0285,
       "step": 850
     },
     {
+      "epoch": 5.74,
+      "learning_rate": 1.581908831908832e-05,
+      "loss": 0.0285,
       "step": 900
     },
     {
+      "epoch": 6.0,
+      "eval_accuracy": 0.9909604519774011,
+      "eval_f1": 0.9894179894179894,
+      "eval_loss": 0.027588626369833946,
+      "eval_precision": 0.9842105263157894,
+      "eval_recall": 0.9946808510638298,
+      "eval_runtime": 12.0204,
+      "eval_samples_per_second": 73.625,
+      "eval_steps_per_second": 4.659,
+      "step": 940
     }
   ],
+  "max_steps": 3120,
   "num_train_epochs": 20,
+  "total_flos": 7915432989450240.0,
   "trial_name": null,
   "trial_params": null
 }

training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:4a57b4d693922248abedb2c0d9ab60786de92600c7d03e067f28731e3896c892
-size 4600

 version https://git-lfs.github.com/spec/v1
+oid sha256:e7530f4a49a3b0a74f4886f6ce692c31c3798b5bcd57d7107236dc628db13266
+size 4408