irfanamal
/

bert_multiple_choice

Multiple Choice

Transformers

PyTorch

bert

Generated from Trainer

Inference Endpoints

Model card Files Files and versions Community

irfanamal commited on Aug 15, 2023

Commit

8d930fb

1 Parent(s): da859f0

update model card README.md

Browse files

Files changed (1) hide show

README.md +34 -17

README.md CHANGED Viewed

@@ -17,8 +17,8 @@ should probably proofread and complete it, then remove this comment. -->
 This model is a fine-tuned version of [bert-base-uncased](https://huggingface.co/bert-base-uncased) on the None dataset.
 It achieves the following results on the evaluation set:
-- Loss: 1.7699
-- Accuracy: 0.4
 ## Model description
@@ -37,31 +37,48 @@ More information needed
 ### Training hyperparameters
 The following hyperparameters were used during training:
-- learning_rate: 5e-05
 - train_batch_size: 16
 - eval_batch_size: 16
 - seed: 42
 - optimizer: Adam with betas=(0.9,0.999) and epsilon=1e-08
 - lr_scheduler_type: linear
-- num_epochs: 30
 ### Training results
 | Training Loss | Epoch | Step | Validation Loss | Accuracy |
 |:-------------:|:-----:|:----:|:---------------:|:--------:|
-| No log        | 1.0   | 12   | 1.5847          | 0.35     |
-| No log        | 2.0   | 24   | 1.5755          | 0.4      |
-| No log        | 3.0   | 36   | 1.5319          | 0.4      |
-| No log        | 4.0   | 48   | 1.4726          | 0.25     |
-| No log        | 5.0   | 60   | 1.4044          | 0.35     |
-| No log        | 6.0   | 72   | 1.4757          | 0.4      |
-| No log        | 7.0   | 84   | 1.4304          | 0.35     |
-| No log        | 8.0   | 96   | 1.3443          | 0.4      |
-| No log        | 9.0   | 108  | 1.4260          | 0.4      |
-| No log        | 10.0  | 120  | 1.3992          | 0.35     |
-| No log        | 11.0  | 132  | 1.4580          | 0.35     |
-| No log        | 12.0  | 144  | 1.4976          | 0.3      |
-| No log        | 13.0  | 156  | 1.7699          | 0.4      |
 ### Framework versions

 This model is a fine-tuned version of [bert-base-uncased](https://huggingface.co/bert-base-uncased) on the None dataset.
 It achieves the following results on the evaluation set:
+- Loss: 1.3676
+- Accuracy: 0.45
 ## Model description
 ### Training hyperparameters
 The following hyperparameters were used during training:
+- learning_rate: 5e-06
 - train_batch_size: 16
 - eval_batch_size: 16
 - seed: 42
 - optimizer: Adam with betas=(0.9,0.999) and epsilon=1e-08
 - lr_scheduler_type: linear
+- num_epochs: 50
 ### Training results
 | Training Loss | Epoch | Step | Validation Loss | Accuracy |
 |:-------------:|:-----:|:----:|:---------------:|:--------:|
+| No log        | 1.0   | 12   | 1.6011          | 0.2      |
+| No log        | 2.0   | 24   | 1.6026          | 0.2      |
+| No log        | 3.0   | 36   | 1.5957          | 0.3      |
+| No log        | 4.0   | 48   | 1.5885          | 0.35     |
+| No log        | 5.0   | 60   | 1.5782          | 0.4      |
+| No log        | 6.0   | 72   | 1.5609          | 0.45     |
+| No log        | 7.0   | 84   | 1.5448          | 0.45     |
+| No log        | 8.0   | 96   | 1.5432          | 0.45     |
+| No log        | 9.0   | 108  | 1.5166          | 0.5      |
+| No log        | 10.0  | 120  | 1.5045          | 0.5      |
+| No log        | 11.0  | 132  | 1.5056          | 0.5      |
+| No log        | 12.0  | 144  | 1.5011          | 0.5      |
+| No log        | 13.0  | 156  | 1.5010          | 0.4      |
+| No log        | 14.0  | 168  | 1.4879          | 0.4      |
+| No log        | 15.0  | 180  | 1.4721          | 0.5      |
+| No log        | 16.0  | 192  | 1.4582          | 0.45     |
+| No log        | 17.0  | 204  | 1.4659          | 0.5      |
+| No log        | 18.0  | 216  | 1.4445          | 0.4      |
+| No log        | 19.0  | 228  | 1.4404          | 0.45     |
+| No log        | 20.0  | 240  | 1.4322          | 0.45     |
+| No log        | 21.0  | 252  | 1.4284          | 0.4      |
+| No log        | 22.0  | 264  | 1.4045          | 0.45     |
+| No log        | 23.0  | 276  | 1.3910          | 0.5      |
+| No log        | 24.0  | 288  | 1.4120          | 0.45     |
+| No log        | 25.0  | 300  | 1.3679          | 0.5      |
+| No log        | 26.0  | 312  | 1.3662          | 0.5      |
+| No log        | 27.0  | 324  | 1.3865          | 0.55     |
+| No log        | 28.0  | 336  | 1.4005          | 0.5      |
+| No log        | 29.0  | 348  | 1.3866          | 0.45     |
+| No log        | 30.0  | 360  | 1.3676          | 0.45     |
 ### Framework versions