bytesizedllm
/

qa_model

@@ -15,7 +15,7 @@ should probably proofread and complete it, then remove this comment. -->
 This model is a fine-tuned version of [distilbert-base-uncased](https://huggingface.co/distilbert-base-uncased) on the None dataset.
 It achieves the following results on the evaluation set:
-- Loss: 0.0855
 ## Model description
@@ -40,62 +40,15 @@ The following hyperparameters were used during training:
 - seed: 42
 - optimizer: Adam with betas=(0.9,0.999) and epsilon=1e-08
 - lr_scheduler_type: linear
-- num_epochs: 50
 ### Training results
 | Training Loss | Epoch | Step | Validation Loss |
 |:-------------:|:-----:|:----:|:---------------:|
-| No log        | 1.0   | 14   | 2.9202          |
-| No log        | 2.0   | 28   | 1.2757          |
-| No log        | 3.0   | 42   | 0.7847          |
-| No log        | 4.0   | 56   | 0.5954          |
-| No log        | 5.0   | 70   | 0.4667          |
-| No log        | 6.0   | 84   | 0.3264          |
-| No log        | 7.0   | 98   | 0.2878          |
-| No log        | 8.0   | 112  | 0.2299          |
-| No log        | 9.0   | 126  | 0.2095          |
-| No log        | 10.0  | 140  | 0.1842          |
-| No log        | 11.0  | 154  | 0.1744          |
-| No log        | 12.0  | 168  | 0.1767          |
-| No log        | 13.0  | 182  | 0.1603          |
-| No log        | 14.0  | 196  | 0.1516          |
-| No log        | 15.0  | 210  | 0.1414          |
-| No log        | 16.0  | 224  | 0.1398          |
-| No log        | 17.0  | 238  | 0.1424          |
-| No log        | 18.0  | 252  | 0.1382          |
-| No log        | 19.0  | 266  | 0.1356          |
-| No log        | 20.0  | 280  | 0.1289          |
-| No log        | 21.0  | 294  | 0.1233          |
-| No log        | 22.0  | 308  | 0.1261          |
-| No log        | 23.0  | 322  | 0.1131          |
-| No log        | 24.0  | 336  | 0.1093          |
-| No log        | 25.0  | 350  | 0.1116          |
-| No log        | 26.0  | 364  | 0.1029          |
-| No log        | 27.0  | 378  | 0.1060          |
-| No log        | 28.0  | 392  | 0.1041          |
-| No log        | 29.0  | 406  | 0.0999          |
-| No log        | 30.0  | 420  | 0.0979          |
-| No log        | 31.0  | 434  | 0.0961          |
-| No log        | 32.0  | 448  | 0.0957          |
-| No log        | 33.0  | 462  | 0.0925          |
-| No log        | 34.0  | 476  | 0.1074          |
-| No log        | 35.0  | 490  | 0.0940          |
-| 0.4192        | 36.0  | 504  | 0.0935          |
-| 0.4192        | 37.0  | 518  | 0.0908          |
-| 0.4192        | 38.0  | 532  | 0.0896          |
-| 0.4192        | 39.0  | 546  | 0.0877          |
-| 0.4192        | 40.0  | 560  | 0.0881          |
-| 0.4192        | 41.0  | 574  | 0.0888          |
-| 0.4192        | 42.0  | 588  | 0.0900          |
-| 0.4192        | 43.0  | 602  | 0.0880          |
-| 0.4192        | 44.0  | 616  | 0.0875          |
-| 0.4192        | 45.0  | 630  | 0.0872          |
-| 0.4192        | 46.0  | 644  | 0.0867          |
-| 0.4192        | 47.0  | 658  | 0.0863          |
-| 0.4192        | 48.0  | 672  | 0.0855          |
-| 0.4192        | 49.0  | 686  | 0.0856          |
-| 0.4192        | 50.0  | 700  | 0.0855          |
 ### Framework versions

 This model is a fine-tuned version of [distilbert-base-uncased](https://huggingface.co/distilbert-base-uncased) on the None dataset.
 It achieves the following results on the evaluation set:
+- Loss: 0.0987
 ## Model description
 - seed: 42
 - optimizer: Adam with betas=(0.9,0.999) and epsilon=1e-08
 - lr_scheduler_type: linear
+- num_epochs: 3
 ### Training results
 | Training Loss | Epoch | Step | Validation Loss |
 |:-------------:|:-----:|:----:|:---------------:|
+| No log        | 1.0   | 14   | 0.1047          |
+| No log        | 2.0   | 28   | 0.1111          |
+| No log        | 3.0   | 42   | 0.0987          |
 ### Framework versions

model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:bd0b2e591e3d54893d0f46d86c129c378825b4c844cd6c8e4553d8ca52460d1b
 size 265470032

 version https://git-lfs.github.com/spec/v1
+oid sha256:0e09f4df5afcd49df244929c7adae617429cb8c3c908deb3b8b96ff1b0a50213
 size 265470032

training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:920b3b1f0e8bda0f0ed1f8fdb74af1e616fb88109e14381b3e06d5b414b2774a
 size 4475

 version https://git-lfs.github.com/spec/v1
+oid sha256:0679bb4ead2ec263d4146a2a56b513d432e8769333ba497e6b37981722f3ddef
 size 4475