Training in progress, step 60000, checkpoint

Browse files

Files changed (6) hide show

last-checkpoint/adapter_model.safetensors +1 -1
last-checkpoint/optimizer.pt +1 -1
last-checkpoint/rng_state.pth +1 -1
last-checkpoint/scaler.pt +1 -1
last-checkpoint/scheduler.pt +1 -1
last-checkpoint/trainer_state.json +296 -4

last-checkpoint/adapter_model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:722a67a3849c15e216b0363ac3e14756a528f10d48549eada44c7a73a2f1d436
 size 3555504

 version https://git-lfs.github.com/spec/v1
+oid sha256:4431a569e16eb6669f33895a534eefcadcc6125a0fcf8243e551a17cbe6b776e
 size 3555504

last-checkpoint/optimizer.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:9fe2d82a60d86eb55584c63cb21eb22bb6b83639265e9eef0fddd116db74868c
 size 7141515

 version https://git-lfs.github.com/spec/v1
+oid sha256:b5c6c8f3d8741838a0a0349b3de3a3bd22b9e28163b525970af04b332fd7c349
 size 7141515

last-checkpoint/rng_state.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:8d4c8f50583c3aaf473dbb3c038d9d85411cdae997b9d9d7d896c343f0b11ce3
 size 14645

 version https://git-lfs.github.com/spec/v1
+oid sha256:7dc3fe5842c642250bc8fc58f8686955286eff74353ef4cfdb5c91b975ca0c5b
 size 14645

last-checkpoint/scaler.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:703b98d29b3227b33c03f1f3acceddb6d9d0304c7caa04dc7709db0049f62b2f
 size 1383

 version https://git-lfs.github.com/spec/v1
+oid sha256:31d1175317fe37be2b1293cac47d5356f1e200c454ceace1ce4e9dd0eded0aa5
 size 1383

last-checkpoint/scheduler.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:44ba460a6fb5aaf6e3988a2082759c98869c4746962f11e515d182f4694213b2
 size 1465

 version https://git-lfs.github.com/spec/v1
+oid sha256:d63d134ebc965a606838bb6f037c88484af3b1856e8a790a7b2291b1079013ce
 size 1465

last-checkpoint/trainer_state.json CHANGED Viewed

@@ -2,9 +2,9 @@
   "best_global_step": 52000,
   "best_metric": 0.9908199660129274,
   "best_model_checkpoint": "CodeGenDetect-CodeBert_Lora/checkpoint-52000",
-  "epoch": 1.792,
   "eval_steps": 4000,
-  "global_step": 56000,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
@@ -4096,6 +4096,298 @@
       "eval_samples_per_second": 130.777,
       "eval_steps_per_second": 8.174,
       "step": 56000
     }
   ],
   "logging_steps": 100,
@@ -4110,7 +4402,7 @@
         "early_stopping_threshold": 0.0
       },
       "attributes": {
-        "early_stopping_patience_counter": 1
       }
     },
     "TrainerControl": {
@@ -4124,7 +4416,7 @@
       "attributes": {}
     }
   },
-  "total_flos": 2.3781344809356787e+17,
   "train_batch_size": 16,
   "trial_name": null,
   "trial_params": null

   "best_global_step": 52000,
   "best_metric": 0.9908199660129274,
   "best_model_checkpoint": "CodeGenDetect-CodeBert_Lora/checkpoint-52000",
+  "epoch": 1.92,
   "eval_steps": 4000,
+  "global_step": 60000,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
       "eval_samples_per_second": 130.777,
       "eval_steps_per_second": 8.174,
       "step": 56000
+    },
+    {
+      "epoch": 1.7952,
+      "grad_norm": 0.0088375024497509,
+      "learning_rate": 1.2860481540930981e-05,
+      "loss": 0.0303,
+      "step": 56100
+    },
+    {
+      "epoch": 1.7984,
+      "grad_norm": 0.0020017733331769705,
+      "learning_rate": 1.2847640449438204e-05,
+      "loss": 0.0222,
+      "step": 56200
+    },
+    {
+      "epoch": 1.8016,
+      "grad_norm": 0.0033814297057688236,
+      "learning_rate": 1.2834799357945427e-05,
+      "loss": 0.0399,
+      "step": 56300
+    },
+    {
+      "epoch": 1.8048,
+      "grad_norm": 0.09427639096975327,
+      "learning_rate": 1.282195826645265e-05,
+      "loss": 0.0325,
+      "step": 56400
+    },
+    {
+      "epoch": 1.808,
+      "grad_norm": 0.02629452385008335,
+      "learning_rate": 1.2809117174959874e-05,
+      "loss": 0.0265,
+      "step": 56500
+    },
+    {
+      "epoch": 1.8112,
+      "grad_norm": 0.24074454605579376,
+      "learning_rate": 1.2796276083467097e-05,
+      "loss": 0.0473,
+      "step": 56600
+    },
+    {
+      "epoch": 1.8144,
+      "grad_norm": 0.05172184109687805,
+      "learning_rate": 1.278343499197432e-05,
+      "loss": 0.0392,
+      "step": 56700
+    },
+    {
+      "epoch": 1.8176,
+      "grad_norm": 0.042050667107105255,
+      "learning_rate": 1.2770593900481543e-05,
+      "loss": 0.0365,
+      "step": 56800
+    },
+    {
+      "epoch": 1.8208,
+      "grad_norm": 0.011465741321444511,
+      "learning_rate": 1.2757752808988766e-05,
+      "loss": 0.0301,
+      "step": 56900
+    },
+    {
+      "epoch": 1.8239999999999998,
+      "grad_norm": 1.5907392501831055,
+      "learning_rate": 1.274491171749599e-05,
+      "loss": 0.0489,
+      "step": 57000
+    },
+    {
+      "epoch": 1.8272,
+      "grad_norm": 0.01520006824284792,
+      "learning_rate": 1.2732070626003212e-05,
+      "loss": 0.0425,
+      "step": 57100
+    },
+    {
+      "epoch": 1.8304,
+      "grad_norm": 0.03128599748015404,
+      "learning_rate": 1.2719229534510436e-05,
+      "loss": 0.016,
+      "step": 57200
+    },
+    {
+      "epoch": 1.8336000000000001,
+      "grad_norm": 0.07054321467876434,
+      "learning_rate": 1.2706388443017657e-05,
+      "loss": 0.0455,
+      "step": 57300
+    },
+    {
+      "epoch": 1.8368,
+      "grad_norm": 1.4368666410446167,
+      "learning_rate": 1.269354735152488e-05,
+      "loss": 0.0507,
+      "step": 57400
+    },
+    {
+      "epoch": 1.8399999999999999,
+      "grad_norm": 0.012565890327095985,
+      "learning_rate": 1.2680706260032103e-05,
+      "loss": 0.041,
+      "step": 57500
+    },
+    {
+      "epoch": 1.8432,
+      "grad_norm": 1.327050805091858,
+      "learning_rate": 1.2667865168539326e-05,
+      "loss": 0.0167,
+      "step": 57600
+    },
+    {
+      "epoch": 1.8464,
+      "grad_norm": 5.873330593109131,
+      "learning_rate": 1.265502407704655e-05,
+      "loss": 0.0417,
+      "step": 57700
+    },
+    {
+      "epoch": 1.8496000000000001,
+      "grad_norm": 1.0156079530715942,
+      "learning_rate": 1.2642182985553773e-05,
+      "loss": 0.051,
+      "step": 57800
+    },
+    {
+      "epoch": 1.8528,
+      "grad_norm": 0.2399500459432602,
+      "learning_rate": 1.2629341894060996e-05,
+      "loss": 0.0235,
+      "step": 57900
+    },
+    {
+      "epoch": 1.8559999999999999,
+      "grad_norm": 0.5918147563934326,
+      "learning_rate": 1.2616500802568219e-05,
+      "loss": 0.0383,
+      "step": 58000
+    },
+    {
+      "epoch": 1.8592,
+      "grad_norm": 0.8496889472007751,
+      "learning_rate": 1.2603659711075442e-05,
+      "loss": 0.0329,
+      "step": 58100
+    },
+    {
+      "epoch": 1.8624,
+      "grad_norm": 3.212545871734619,
+      "learning_rate": 1.2590818619582665e-05,
+      "loss": 0.0363,
+      "step": 58200
+    },
+    {
+      "epoch": 1.8656000000000001,
+      "grad_norm": 0.2524072527885437,
+      "learning_rate": 1.2577977528089888e-05,
+      "loss": 0.0443,
+      "step": 58300
+    },
+    {
+      "epoch": 1.8688,
+      "grad_norm": 0.09237070381641388,
+      "learning_rate": 1.2565136436597111e-05,
+      "loss": 0.0394,
+      "step": 58400
+    },
+    {
+      "epoch": 1.8719999999999999,
+      "grad_norm": 0.08935701102018356,
+      "learning_rate": 1.2552295345104335e-05,
+      "loss": 0.0251,
+      "step": 58500
+    },
+    {
+      "epoch": 1.8752,
+      "grad_norm": 0.03011847473680973,
+      "learning_rate": 1.2539454253611558e-05,
+      "loss": 0.0364,
+      "step": 58600
+    },
+    {
+      "epoch": 1.8784,
+      "grad_norm": 0.00672591058537364,
+      "learning_rate": 1.2526613162118781e-05,
+      "loss": 0.0453,
+      "step": 58700
+    },
+    {
+      "epoch": 1.8816000000000002,
+      "grad_norm": 0.01110851764678955,
+      "learning_rate": 1.2513772070626004e-05,
+      "loss": 0.0316,
+      "step": 58800
+    },
+    {
+      "epoch": 1.8848,
+      "grad_norm": 13.021896362304688,
+      "learning_rate": 1.2500930979133227e-05,
+      "loss": 0.0438,
+      "step": 58900
+    },
+    {
+      "epoch": 1.888,
+      "grad_norm": 0.01617710292339325,
+      "learning_rate": 1.248808988764045e-05,
+      "loss": 0.0281,
+      "step": 59000
+    },
+    {
+      "epoch": 1.8912,
+      "grad_norm": 0.126037135720253,
+      "learning_rate": 1.2475248796147675e-05,
+      "loss": 0.0361,
+      "step": 59100
+    },
+    {
+      "epoch": 1.8944,
+      "grad_norm": 0.1865486055612564,
+      "learning_rate": 1.2462407704654898e-05,
+      "loss": 0.0294,
+      "step": 59200
+    },
+    {
+      "epoch": 1.8976,
+      "grad_norm": 24.230648040771484,
+      "learning_rate": 1.2449566613162121e-05,
+      "loss": 0.0418,
+      "step": 59300
+    },
+    {
+      "epoch": 1.9008,
+      "grad_norm": 0.008240806870162487,
+      "learning_rate": 1.2436725521669345e-05,
+      "loss": 0.0369,
+      "step": 59400
+    },
+    {
+      "epoch": 1.904,
+      "grad_norm": 0.13642114400863647,
+      "learning_rate": 1.2423884430176568e-05,
+      "loss": 0.0264,
+      "step": 59500
+    },
+    {
+      "epoch": 1.9072,
+      "grad_norm": 7.658884525299072,
+      "learning_rate": 1.2411043338683787e-05,
+      "loss": 0.0358,
+      "step": 59600
+    },
+    {
+      "epoch": 1.9104,
+      "grad_norm": 0.019852541387081146,
+      "learning_rate": 1.239820224719101e-05,
+      "loss": 0.0431,
+      "step": 59700
+    },
+    {
+      "epoch": 1.9136,
+      "grad_norm": 0.2717871367931366,
+      "learning_rate": 1.2385361155698234e-05,
+      "loss": 0.0429,
+      "step": 59800
+    },
+    {
+      "epoch": 1.9167999999999998,
+      "grad_norm": 0.020897701382637024,
+      "learning_rate": 1.2372520064205458e-05,
+      "loss": 0.0372,
+      "step": 59900
+    },
+    {
+      "epoch": 1.92,
+      "grad_norm": 0.02349219284951687,
+      "learning_rate": 1.2359678972712682e-05,
+      "loss": 0.0441,
+      "step": 60000
+    },
+    {
+      "epoch": 1.92,
+      "eval_accuracy": 0.99049,
+      "eval_f1": 0.9904909638313073,
+      "eval_loss": 0.03547532483935356,
+      "eval_precision": 0.9905025162088448,
+      "eval_recall": 0.99049,
+      "eval_runtime": 764.9462,
+      "eval_samples_per_second": 130.728,
+      "eval_steps_per_second": 8.171,
+      "step": 60000
     }
   ],
   "logging_steps": 100,
         "early_stopping_threshold": 0.0
       },
       "attributes": {
+        "early_stopping_patience_counter": 2
       }
     },
     "TrainerControl": {
       "attributes": {}
     }
   },
+  "total_flos": 2.5479625112655552e+17,
   "train_batch_size": 16,
   "trial_name": null,
   "trial_params": null