Upload folder using huggingface_hub

Browse files

Files changed (7) hide show

config.json +29 -0
model.safetensors +3 -0
optimizer.pt +3 -0
rng_state.pth +3 -0
scheduler.pt +3 -0
trainer_state.json +445 -0
training_args.bin +3 -0

config.json ADDED Viewed

	@@ -0,0 +1,29 @@

+{
+  "_name_or_path": "microsoft/codebert-base",
+  "architectures": [
+    "RobertaForSequenceClassification"
+  ],
+  "attention_probs_dropout_prob": 0.1,
+  "bos_token_id": 0,
+  "classifier_dropout": null,
+  "eos_token_id": 2,
+  "hidden_act": "gelu",
+  "hidden_dropout_prob": 0.1,
+  "hidden_size": 768,
+  "initializer_range": 0.02,
+  "intermediate_size": 3072,
+  "layer_norm_eps": 1e-05,
+  "max_position_embeddings": 514,
+  "model_type": "roberta",
+  "num_attention_heads": 12,
+  "num_hidden_layers": 12,
+  "output_past": true,
+  "pad_token_id": 1,
+  "position_embedding_type": "absolute",
+  "problem_type": "single_label_classification",
+  "torch_dtype": "float32",
+  "transformers_version": "4.35.2",
+  "type_vocab_size": 1,
+  "use_cache": true,
+  "vocab_size": 50265
+}

model.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:76be76a15eb7729f4b00b4f1d419d99293a80090099dc1e5fabd15af50a9baac
+size 498612824

optimizer.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:a2347bb36c75e36892183c95dce50a6b5615a6f578a2f69dc9fa44d40e4f2d99
+size 118173498

rng_state.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:b92896732603661d06d166837c431b32c69a6df4f83079e8f3cf7091b113ad6a
+size 14244

scheduler.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:0dcb5d1309ade11adef56b51bf410df7ad6a10fac32cf9fd0b45c0dab8f75032
+size 1064

trainer_state.json ADDED Viewed

	@@ -0,0 +1,445 @@

+{
+  "best_metric": 0.9870967741935484,
+  "best_model_checkpoint": "./php_cwe79_codebert_output\\checkpoint-1648",
+  "epoch": 16.99203640500569,
+  "eval_steps": 500,
+  "global_step": 1867,
+  "is_hyper_param_search": false,
+  "is_local_process_zero": true,
+  "is_world_process_zero": true,
+  "log_history": [
+    {
+      "epoch": 0.46,
+      "learning_rate": 4.587155963302753e-06,
+      "loss": 0.7019,
+      "step": 50
+    },
+    {
+      "epoch": 0.91,
+      "learning_rate": 9.174311926605506e-06,
+      "loss": 0.6915,
+      "step": 100
+    },
+    {
+      "epoch": 0.99,
+      "eval_accuracy": 0.5532258064516129,
+      "eval_f1": 0.4822429906542056,
+      "eval_loss": 0.6805028915405273,
+      "eval_precision": 0.5733333333333334,
+      "eval_recall": 0.4161290322580645,
+      "eval_runtime": 19.9477,
+      "eval_samples_per_second": 62.162,
+      "eval_steps_per_second": 3.91,
+      "step": 109
+    },
+    {
+      "epoch": 1.37,
+      "learning_rate": 1.3761467889908258e-05,
+      "loss": 0.6774,
+      "step": 150
+    },
+    {
+      "epoch": 1.82,
+      "learning_rate": 1.834862385321101e-05,
+      "loss": 0.5408,
+      "step": 200
+    },
+    {
+      "epoch": 1.99,
+      "eval_accuracy": 0.8362903225806452,
+      "eval_f1": 0.8407843137254902,
+      "eval_loss": 0.35471096634864807,
+      "eval_precision": 0.8183206106870229,
+      "eval_recall": 0.864516129032258,
+      "eval_runtime": 20.4696,
+      "eval_samples_per_second": 60.578,
+      "eval_steps_per_second": 3.811,
+      "step": 219
+    },
+    {
+      "epoch": 2.28,
+      "learning_rate": 1.9673802242609582e-05,
+      "loss": 0.3461,
+      "step": 250
+    },
+    {
+      "epoch": 2.73,
+      "learning_rate": 1.9164118246687054e-05,
+      "loss": 0.2515,
+      "step": 300
+    },
+    {
+      "epoch": 2.99,
+      "eval_accuracy": 0.9185483870967742,
+      "eval_f1": 0.9144792548687553,
+      "eval_loss": 0.20694807171821594,
+      "eval_precision": 0.9625668449197861,
+      "eval_recall": 0.8709677419354839,
+      "eval_runtime": 31.9108,
+      "eval_samples_per_second": 38.858,
+      "eval_steps_per_second": 2.444,
+      "step": 329
+    },
+    {
+      "epoch": 3.19,
+      "learning_rate": 1.865443425076453e-05,
+      "loss": 0.211,
+      "step": 350
+    },
+    {
+      "epoch": 3.64,
+      "learning_rate": 1.8144750254841998e-05,
+      "loss": 0.1931,
+      "step": 400
+    },
+    {
+      "epoch": 4.0,
+      "eval_accuracy": 0.9314516129032258,
+      "eval_f1": 0.9280270956816258,
+      "eval_loss": 0.16265422105789185,
+      "eval_precision": 0.9768270944741533,
+      "eval_recall": 0.8838709677419355,
+      "eval_runtime": 36.5458,
+      "eval_samples_per_second": 33.93,
+      "eval_steps_per_second": 2.134,
+      "step": 439
+    },
+    {
+      "epoch": 4.1,
+      "learning_rate": 1.763506625891947e-05,
+      "loss": 0.1447,
+      "step": 450
+    },
+    {
+      "epoch": 4.55,
+      "learning_rate": 1.7125382262996945e-05,
+      "loss": 0.1335,
+      "step": 500
+    },
+    {
+      "epoch": 5.0,
+      "eval_accuracy": 0.9612903225806452,
+      "eval_f1": 0.9608482871125612,
+      "eval_loss": 0.09464450925588608,
+      "eval_precision": 0.971947194719472,
+      "eval_recall": 0.95,
+      "eval_runtime": 35.2367,
+      "eval_samples_per_second": 35.191,
+      "eval_steps_per_second": 2.214,
+      "step": 549
+    },
+    {
+      "epoch": 5.01,
+      "learning_rate": 1.6625891946992865e-05,
+      "loss": 0.1333,
+      "step": 550
+    },
+    {
+      "epoch": 5.46,
+      "learning_rate": 1.6116207951070337e-05,
+      "loss": 0.1043,
+      "step": 600
+    },
+    {
+      "epoch": 5.92,
+      "learning_rate": 1.560652395514781e-05,
+      "loss": 0.1057,
+      "step": 650
+    },
+    {
+      "epoch": 6.0,
+      "eval_accuracy": 0.9548387096774194,
+      "eval_f1": 0.9537953795379538,
+      "eval_loss": 0.09458089619874954,
+      "eval_precision": 0.9763513513513513,
+      "eval_recall": 0.932258064516129,
+      "eval_runtime": 36.0845,
+      "eval_samples_per_second": 34.364,
+      "eval_steps_per_second": 2.162,
+      "step": 659
+    },
+    {
+      "epoch": 6.37,
+      "learning_rate": 1.5096839959225283e-05,
+      "loss": 0.1046,
+      "step": 700
+    },
+    {
+      "epoch": 6.83,
+      "learning_rate": 1.4587155963302753e-05,
+      "loss": 0.0887,
+      "step": 750
+    },
+    {
+      "epoch": 7.0,
+      "eval_accuracy": 0.9701612903225807,
+      "eval_f1": 0.9699918896999189,
+      "eval_loss": 0.07421040534973145,
+      "eval_precision": 0.9755301794453507,
+      "eval_recall": 0.964516129032258,
+      "eval_runtime": 37.4354,
+      "eval_samples_per_second": 33.124,
+      "eval_steps_per_second": 2.084,
+      "step": 769
+    },
+    {
+      "epoch": 7.28,
+      "learning_rate": 1.4077471967380225e-05,
+      "loss": 0.0763,
+      "step": 800
+    },
+    {
+      "epoch": 7.74,
+      "learning_rate": 1.3567787971457698e-05,
+      "loss": 0.0916,
+      "step": 850
+    },
+    {
+      "epoch": 8.0,
+      "eval_accuracy": 0.9733870967741935,
+      "eval_f1": 0.9734085414987913,
+      "eval_loss": 0.05636864900588989,
+      "eval_precision": 0.9726247987117552,
+      "eval_recall": 0.9741935483870968,
+      "eval_runtime": 37.5471,
+      "eval_samples_per_second": 33.025,
+      "eval_steps_per_second": 2.077,
+      "step": 879
+    },
+    {
+      "epoch": 8.19,
+      "learning_rate": 1.305810397553517e-05,
+      "loss": 0.0858,
+      "step": 900
+    },
+    {
+      "epoch": 8.65,
+      "learning_rate": 1.254841997961264e-05,
+      "loss": 0.0716,
+      "step": 950
+    },
+    {
+      "epoch": 8.99,
+      "eval_accuracy": 0.9790322580645161,
+      "eval_f1": 0.9790996784565916,
+      "eval_loss": 0.049785859882831573,
+      "eval_precision": 0.9759615384615384,
+      "eval_recall": 0.9822580645161291,
+      "eval_runtime": 39.3971,
+      "eval_samples_per_second": 31.474,
+      "eval_steps_per_second": 1.98,
+      "step": 988
+    },
+    {
+      "epoch": 9.1,
+      "learning_rate": 1.2038735983690114e-05,
+      "loss": 0.0686,
+      "step": 1000
+    },
+    {
+      "epoch": 9.56,
+      "learning_rate": 1.1529051987767585e-05,
+      "loss": 0.0673,
+      "step": 1050
+    },
+    {
+      "epoch": 9.99,
+      "eval_accuracy": 0.9798387096774194,
+      "eval_f1": 0.9799518845228549,
+      "eval_loss": 0.046214405447244644,
+      "eval_precision": 0.9744816586921851,
+      "eval_recall": 0.9854838709677419,
+      "eval_runtime": 29.0256,
+      "eval_samples_per_second": 42.721,
+      "eval_steps_per_second": 2.687,
+      "step": 1098
+    },
+    {
+      "epoch": 10.01,
+      "learning_rate": 1.1019367991845057e-05,
+      "loss": 0.0577,
+      "step": 1100
+    },
+    {
+      "epoch": 10.47,
+      "learning_rate": 1.0509683995922529e-05,
+      "loss": 0.0533,
+      "step": 1150
+    },
+    {
+      "epoch": 10.92,
+      "learning_rate": 1e-05,
+      "loss": 0.0569,
+      "step": 1200
+    },
+    {
+      "epoch": 10.99,
+      "eval_accuracy": 0.9846774193548387,
+      "eval_f1": 0.9847144006436042,
+      "eval_loss": 0.039788804948329926,
+      "eval_precision": 0.9823434991974318,
+      "eval_recall": 0.9870967741935484,
+      "eval_runtime": 29.3619,
+      "eval_samples_per_second": 42.232,
+      "eval_steps_per_second": 2.657,
+      "step": 1208
+    },
+    {
+      "epoch": 11.38,
+      "learning_rate": 9.490316004077473e-06,
+      "loss": 0.0497,
+      "step": 1250
+    },
+    {
+      "epoch": 11.83,
+      "learning_rate": 8.980632008154944e-06,
+      "loss": 0.0532,
+      "step": 1300
+    },
+    {
+      "epoch": 12.0,
+      "eval_accuracy": 0.9854838709677419,
+      "eval_f1": 0.9854604200323102,
+      "eval_loss": 0.034001607447862625,
+      "eval_precision": 0.9870550161812298,
+      "eval_recall": 0.9838709677419355,
+      "eval_runtime": 35.9784,
+      "eval_samples_per_second": 34.465,
+      "eval_steps_per_second": 2.168,
+      "step": 1318
+    },
+    {
+      "epoch": 12.29,
+      "learning_rate": 8.470948012232416e-06,
+      "loss": 0.0517,
+      "step": 1350
+    },
+    {
+      "epoch": 12.74,
+      "learning_rate": 7.961264016309888e-06,
+      "loss": 0.0382,
+      "step": 1400
+    },
+    {
+      "epoch": 13.0,
+      "eval_accuracy": 0.9854838709677419,
+      "eval_f1": 0.9855072463768116,
+      "eval_loss": 0.02894522435963154,
+      "eval_precision": 0.9839228295819936,
+      "eval_recall": 0.9870967741935484,
+      "eval_runtime": 37.3704,
+      "eval_samples_per_second": 33.181,
+      "eval_steps_per_second": 2.087,
+      "step": 1428
+    },
+    {
+      "epoch": 13.2,
+      "learning_rate": 7.45158002038736e-06,
+      "loss": 0.0333,
+      "step": 1450
+    },
+    {
+      "epoch": 13.65,
+      "learning_rate": 6.941896024464833e-06,
+      "loss": 0.0338,
+      "step": 1500
+    },
+    {
+      "epoch": 14.0,
+      "eval_accuracy": 0.9854838709677419,
+      "eval_f1": 0.9854838709677419,
+      "eval_loss": 0.028582246974110603,
+      "eval_precision": 0.9854838709677419,
+      "eval_recall": 0.9854838709677419,
+      "eval_runtime": 34.3893,
+      "eval_samples_per_second": 36.058,
+      "eval_steps_per_second": 2.268,
+      "step": 1538
+    },
+    {
+      "epoch": 14.11,
+      "learning_rate": 6.432212028542304e-06,
+      "loss": 0.0365,
+      "step": 1550
+    },
+    {
+      "epoch": 14.56,
+      "learning_rate": 5.922528032619776e-06,
+      "loss": 0.0332,
+      "step": 1600
+    },
+    {
+      "epoch": 15.0,
+      "eval_accuracy": 0.9870967741935484,
+      "eval_f1": 0.9870967741935484,
+      "eval_loss": 0.02915828675031662,
+      "eval_precision": 0.9870967741935484,
+      "eval_recall": 0.9870967741935484,
+      "eval_runtime": 24.73,
+      "eval_samples_per_second": 50.141,
+      "eval_steps_per_second": 3.154,
+      "step": 1648
+    },
+    {
+      "epoch": 15.02,
+      "learning_rate": 5.412844036697248e-06,
+      "loss": 0.0329,
+      "step": 1650
+    },
+    {
+      "epoch": 15.47,
+      "learning_rate": 4.90316004077472e-06,
+      "loss": 0.029,
+      "step": 1700
+    },
+    {
+      "epoch": 15.93,
+      "learning_rate": 4.393476044852192e-06,
+      "loss": 0.0271,
+      "step": 1750
+    },
+    {
+      "epoch": 16.0,
+      "eval_accuracy": 0.9854838709677419,
+      "eval_f1": 0.9855072463768116,
+      "eval_loss": 0.02873540110886097,
+      "eval_precision": 0.9839228295819936,
+      "eval_recall": 0.9870967741935484,
+      "eval_runtime": 24.9886,
+      "eval_samples_per_second": 49.623,
+      "eval_steps_per_second": 3.121,
+      "step": 1758
+    },
+    {
+      "epoch": 16.38,
+      "learning_rate": 3.8837920489296635e-06,
+      "loss": 0.0233,
+      "step": 1800
+    },
+    {
+      "epoch": 16.84,
+      "learning_rate": 3.3741080530071357e-06,
+      "loss": 0.0264,
+      "step": 1850
+    },
+    {
+      "epoch": 16.99,
+      "eval_accuracy": 0.9854838709677419,
+      "eval_f1": 0.9854838709677419,
+      "eval_loss": 0.026798125356435776,
+      "eval_precision": 0.9854838709677419,
+      "eval_recall": 0.9854838709677419,
+      "eval_runtime": 35.295,
+      "eval_samples_per_second": 35.132,
+      "eval_steps_per_second": 2.21,
+      "step": 1867
+    }
+  ],
+  "logging_steps": 50,
+  "max_steps": 2180,
+  "num_train_epochs": 20,
+  "save_steps": 500,
+  "total_flos": 3.1422037786368e+16,
+  "trial_name": null,
+  "trial_params": null
+}

training_args.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:4a57b4d693922248abedb2c0d9ab60786de92600c7d03e067f28731e3896c892
+size 4600