End of training

Browse files

Files changed (4) hide show

README.md +53 -53
adapter_config.json +3 -3
adapter_model.safetensors +2 -2
training_args.bin +1 -1

README.md CHANGED Viewed

@@ -16,7 +16,7 @@ should probably proofread and complete it, then remove this comment. -->
 This model is a fine-tuned version of [roberta-large](https://huggingface.co/roberta-large) on the cdcvd/ejpfepj dataset.
 It achieves the following results on the evaluation set:
-- Loss: 1.0886
 ## Model description
@@ -45,58 +45,58 @@ The following hyperparameters were used during training:
 ### Training results
-| Training Loss | Epoch | Step | Validation Loss |
-|:-------------:|:-----:|:----:|:---------------:|
-| No log        | 1.0   | 13   | 0.2459          |
-| No log        | 2.0   | 26   | 0.1373          |
-| No log        | 3.0   | 39   | 0.1105          |
-| No log        | 4.0   | 52   | 0.1414          |
-| No log        | 5.0   | 65   | 0.1707          |
-| No log        | 6.0   | 78   | 0.1172          |
-| No log        | 7.0   | 91   | 0.3309          |
-| No log        | 8.0   | 104  | 0.5585          |
-| No log        | 9.0   | 117  | 0.5192          |
-| No log        | 10.0  | 130  | 0.5445          |
-| No log        | 11.0  | 143  | 0.6039          |
-| No log        | 12.0  | 156  | 0.5424          |
-| No log        | 13.0  | 169  | 0.5210          |
-| No log        | 14.0  | 182  | 0.5190          |
-| No log        | 15.0  | 195  | 0.5433          |
-| No log        | 16.0  | 208  | 0.5199          |
-| No log        | 17.0  | 221  | 0.5309          |
-| No log        | 18.0  | 234  | 0.5507          |
-| No log        | 19.0  | 247  | 0.5427          |
-| No log        | 20.0  | 260  | 0.5223          |
-| No log        | 21.0  | 273  | 0.5194          |
-| No log        | 22.0  | 286  | 0.5216          |
-| No log        | 23.0  | 299  | 0.5248          |
-| No log        | 24.0  | 312  | 0.5192          |
-| No log        | 25.0  | 325  | 0.5409          |
-| No log        | 26.0  | 338  | 0.5223          |
-| No log        | 27.0  | 351  | 0.5719          |
-| No log        | 28.0  | 364  | 0.5307          |
-| No log        | 29.0  | 377  | 0.5576          |
-| No log        | 30.0  | 390  | 0.5272          |
-| No log        | 31.0  | 403  | 0.5193          |
-| No log        | 32.0  | 416  | 0.5489          |
-| No log        | 33.0  | 429  | 0.5215          |
-| No log        | 34.0  | 442  | 0.5359          |
-| No log        | 35.0  | 455  | 0.5728          |
-| No log        | 36.0  | 468  | 0.5560          |
-| No log        | 37.0  | 481  | 0.5765          |
-| No log        | 38.0  | 494  | 0.5562          |
-| 0.4913        | 39.0  | 507  | 0.6608          |
-| 0.4913        | 40.0  | 520  | 0.7299          |
-| 0.4913        | 41.0  | 533  | 0.5850          |
-| 0.4913        | 42.0  | 546  | 0.7992          |
-| 0.4913        | 43.0  | 559  | 0.7670          |
-| 0.4913        | 44.0  | 572  | 0.9654          |
-| 0.4913        | 45.0  | 585  | 1.0347          |
-| 0.4913        | 46.0  | 598  | 0.9568          |
-| 0.4913        | 47.0  | 611  | 1.0205          |
-| 0.4913        | 48.0  | 624  | 1.0679          |
-| 0.4913        | 49.0  | 637  | 1.1054          |
-| 0.4913        | 50.0  | 650  | 1.0886          |
 ### Framework versions

 This model is a fine-tuned version of [roberta-large](https://huggingface.co/roberta-large) on the cdcvd/ejpfepj dataset.
 It achieves the following results on the evaluation set:
+- Loss: 1.0401
 ## Model description
 ### Training results
+| Training Loss | Epoch | Step  | Validation Loss |
+|:-------------:|:-----:|:-----:|:---------------:|
+| No log        | 1.0   | 282   | 0.2349          |
+| 0.3151        | 2.0   | 564   | 0.2351          |
+| 0.3151        | 3.0   | 846   | 1.0534          |
+| 0.7392        | 4.0   | 1128  | 1.0375          |
+| 0.7392        | 5.0   | 1410  | 1.0487          |
+| 1.0405        | 6.0   | 1692  | 1.0723          |
+| 1.0405        | 7.0   | 1974  | 1.0318          |
+| 1.0417        | 8.0   | 2256  | 1.0493          |
+| 1.0345        | 9.0   | 2538  | 1.0539          |
+| 1.0345        | 10.0  | 2820  | 1.0324          |
+| 1.0339        | 11.0  | 3102  | 1.0663          |
+| 1.0339        | 12.0  | 3384  | 1.0691          |
+| 1.0303        | 13.0  | 3666  | 1.0563          |
+| 1.0303        | 14.0  | 3948  | 1.0330          |
+| 1.0369        | 15.0  | 4230  | 1.0519          |
+| 1.0312        | 16.0  | 4512  | 1.0440          |
+| 1.0312        | 17.0  | 4794  | 1.0440          |
+| 1.0321        | 18.0  | 5076  | 1.0376          |
+| 1.0321        | 19.0  | 5358  | 1.0358          |
+| 1.0246        | 20.0  | 5640  | 1.0331          |
+| 1.0246        | 21.0  | 5922  | 1.0538          |
+| 1.0343        | 22.0  | 6204  | 1.0440          |
+| 1.0343        | 23.0  | 6486  | 1.0444          |
+| 1.0273        | 24.0  | 6768  | 1.0497          |
+| 1.0277        | 25.0  | 7050  | 1.0471          |
+| 1.0277        | 26.0  | 7332  | 1.0393          |
+| 1.0216        | 27.0  | 7614  | 1.0835          |
+| 1.0216        | 28.0  | 7896  | 1.0508          |
+| 1.0312        | 29.0  | 8178  | 1.0246          |
+| 1.0312        | 30.0  | 8460  | 1.0448          |
+| 1.0297        | 31.0  | 8742  | 1.0344          |
+| 1.0288        | 32.0  | 9024  | 1.0446          |
+| 1.0288        | 33.0  | 9306  | 1.0415          |
+| 1.0252        | 34.0  | 9588  | 1.0460          |
+| 1.0252        | 35.0  | 9870  | 1.0295          |
+| 1.0274        | 36.0  | 10152 | 1.0508          |
+| 1.0274        | 37.0  | 10434 | 1.0470          |
+| 1.0263        | 38.0  | 10716 | 1.0345          |
+| 1.0263        | 39.0  | 10998 | 1.0322          |
+| 1.0275        | 40.0  | 11280 | 1.0398          |
+| 1.0263        | 41.0  | 11562 | 1.0496          |
+| 1.0263        | 42.0  | 11844 | 1.0449          |
+| 1.0248        | 43.0  | 12126 | 1.0404          |
+| 1.0248        | 44.0  | 12408 | 1.0387          |
+| 1.025         | 45.0  | 12690 | 1.0455          |
+| 1.025         | 46.0  | 12972 | 1.0415          |
+| 1.0222        | 47.0  | 13254 | 1.0497          |
+| 1.0233        | 48.0  | 13536 | 1.0362          |
+| 1.0233        | 49.0  | 13818 | 1.0392          |
+| 1.0273        | 50.0  | 14100 | 1.0401          |
 ### Framework versions

adapter_config.json CHANGED Viewed

@@ -19,10 +19,10 @@
   "rank_pattern": {},
   "revision": null,
   "target_modules": [
-    "value",
-    "key",
     "query",
-    "dense"
   ],
   "task_type": "TOKEN_CLS"
 }

   "rank_pattern": {},
   "revision": null,
   "target_modules": [
+    "dense",
     "query",
+    "value",
+    "key"
   ],
   "task_type": "TOKEN_CLS"
 }

adapter_model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:3c26b6150126b58ea3e42ffeedd71144ebb62028417f004de571da6f028b48c3
-size 28361760

 version https://git-lfs.github.com/spec/v1
+oid sha256:75f8e9df83d7f584b872e3fe1928cfdb79b2e589b48ae00d70554425871b5d2b
+size 28402776

training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:457e660e78bee391797114873ca0ae5a1e385c88c7a29845907ac5623a01b3bb
 size 4792

 version https://git-lfs.github.com/spec/v1
+oid sha256:a055807ccad94dd2d8b4c734004e2df3b97d3ce636914eb3f45e999638a3366f
 size 4792