Training in progress, step 170

Browse files

Files changed (8) hide show

README.md +89 -41
model.safetensors +1 -1
runs/Sep02_02-03-55_a09311c9b42d/events.out.tfevents.1725242637.a09311c9b42d.22.0 +3 -0
runs/Sep02_02-03-55_a09311c9b42d/events.out.tfevents.1725243376.a09311c9b42d.22.1 +3 -0
runs/Sep02_02-16-18_a09311c9b42d/events.out.tfevents.1725243379.a09311c9b42d.22.2 +3 -0
runs/Sep02_02-16-18_a09311c9b42d/events.out.tfevents.1725244058.a09311c9b42d.22.3 +3 -0
runs/Sep02_02-27-39_a09311c9b42d/events.out.tfevents.1725244060.a09311c9b42d.22.4 +3 -0
training_args.bin +1 -1

README.md CHANGED Viewed

@@ -3,20 +3,20 @@ base_model: aubmindlab/bert-base-arabertv02
 tags:
 - generated_from_trainer
 model-index:
-- name: arabert_cross_relevance_task1_fold2
   results: []
 ---
 <!-- This model card has been generated automatically according to the information the Trainer had access to. You
 should probably proofread and complete it, then remove this comment. -->
-# arabert_cross_relevance_task1_fold2
 This model is a fine-tuned version of [aubmindlab/bert-base-arabertv02](https://huggingface.co/aubmindlab/bert-base-arabertv02) on the None dataset.
 It achieves the following results on the evaluation set:
-- Loss: 0.2831
 - Qwk: 0.0
-- Mse: 0.2831
 ## Model description
@@ -36,49 +36,97 @@ More information needed
 The following hyperparameters were used during training:
 - learning_rate: 2e-05
-- train_batch_size: 16
-- eval_batch_size: 16
 - seed: 42
 - optimizer: Adam with betas=(0.9,0.999) and epsilon=1e-08
 - lr_scheduler_type: linear
-- num_epochs: 1
 ### Training results
-| Training Loss | Epoch  | Step | Validation Loss | Qwk     | Mse    |
-|:-------------:|:------:|:----:|:---------------:|:-------:|:------:|
-| No log        | 0.0308 | 2    | 1.7758          | 0.0     | 1.7758 |
-| No log        | 0.0615 | 4    | 0.4260          | 0.0230  | 0.4260 |
-| No log        | 0.0923 | 6    | 0.2683          | 0.0357  | 0.2683 |
-| No log        | 0.1231 | 8    | 0.4228          | 0.1279  | 0.4228 |
-| No log        | 0.1538 | 10   | 0.3603          | -0.0238 | 0.3603 |
-| No log        | 0.1846 | 12   | 0.2737          | 0.0     | 0.2737 |
-| No log        | 0.2154 | 14   | 0.2624          | 0.0     | 0.2624 |
-| No log        | 0.2462 | 16   | 0.2619          | 0.0     | 0.2619 |
-| No log        | 0.2769 | 18   | 0.2688          | 0.0     | 0.2688 |
-| No log        | 0.3077 | 20   | 0.2704          | 0.0     | 0.2704 |
-| No log        | 0.3385 | 22   | 0.2624          | 0.0     | 0.2624 |
-| No log        | 0.3692 | 24   | 0.2623          | 0.0     | 0.2623 |
-| No log        | 0.4    | 26   | 0.2679          | 0.0     | 0.2679 |
-| No log        | 0.4308 | 28   | 0.2721          | 0.0     | 0.2721 |
-| No log        | 0.4615 | 30   | 0.2703          | 0.0     | 0.2703 |
-| No log        | 0.4923 | 32   | 0.2734          | 0.0     | 0.2734 |
-| No log        | 0.5231 | 34   | 0.2751          | 0.0     | 0.2751 |
-| No log        | 0.5538 | 36   | 0.2768          | 0.0     | 0.2768 |
-| No log        | 0.5846 | 38   | 0.2791          | 0.0     | 0.2791 |
-| No log        | 0.6154 | 40   | 0.2794          | 0.0     | 0.2794 |
-| No log        | 0.6462 | 42   | 0.2773          | 0.0     | 0.2773 |
-| No log        | 0.6769 | 44   | 0.2716          | 0.0     | 0.2716 |
-| No log        | 0.7077 | 46   | 0.2703          | 0.0     | 0.2703 |
-| No log        | 0.7385 | 48   | 0.2738          | 0.0     | 0.2738 |
-| No log        | 0.7692 | 50   | 0.2740          | 0.0     | 0.2740 |
-| No log        | 0.8    | 52   | 0.2800          | 0.0     | 0.2800 |
-| No log        | 0.8308 | 54   | 0.2820          | 0.0     | 0.2820 |
-| No log        | 0.8615 | 56   | 0.2816          | 0.0     | 0.2816 |
-| No log        | 0.8923 | 58   | 0.2830          | 0.0     | 0.2830 |
-| No log        | 0.9231 | 60   | 0.2845          | 0.0     | 0.2845 |
-| No log        | 0.9538 | 62   | 0.2838          | 0.0     | 0.2838 |
-| No log        | 0.9846 | 64   | 0.2831          | 0.0     | 0.2831 |
 ### Framework versions

 tags:
 - generated_from_trainer
 model-index:
+- name: arabert_cross_relevance_task1_fold1
   results: []
 ---
 <!-- This model card has been generated automatically according to the information the Trainer had access to. You
 should probably proofread and complete it, then remove this comment. -->
+# arabert_cross_relevance_task1_fold1
 This model is a fine-tuned version of [aubmindlab/bert-base-arabertv02](https://huggingface.co/aubmindlab/bert-base-arabertv02) on the None dataset.
 It achieves the following results on the evaluation set:
+- Loss: 0.2738
 - Qwk: 0.0
+- Mse: 0.2739
 ## Model description
 The following hyperparameters were used during training:
 - learning_rate: 2e-05
+- train_batch_size: 64
+- eval_batch_size: 64
 - seed: 42
 - optimizer: Adam with betas=(0.9,0.999) and epsilon=1e-08
 - lr_scheduler_type: linear
+- num_epochs: 10
 ### Training results
+| Training Loss | Epoch | Step | Validation Loss | Qwk     | Mse    |
+|:-------------:|:-----:|:----:|:---------------:|:-------:|:------:|
+| No log        | 0.125 | 2    | 1.0588          | -0.0001 | 1.0575 |
+| No log        | 0.25  | 4    | 0.3264          | 0.1085  | 0.3266 |
+| No log        | 0.375 | 6    | 0.4800          | 0.0711  | 0.4804 |
+| No log        | 0.5   | 8    | 0.3741          | 0.0242  | 0.3744 |
+| No log        | 0.625 | 10   | 0.2864          | 0.0     | 0.2865 |
+| No log        | 0.75  | 12   | 0.2902          | 0.0     | 0.2903 |
+| No log        | 0.875 | 14   | 0.3836          | -0.0180 | 0.3840 |
+| No log        | 1.0   | 16   | 0.5708          | 0.0324  | 0.5714 |
+| No log        | 1.125 | 18   | 0.6465          | 0.0638  | 0.6472 |
+| No log        | 1.25  | 20   | 0.4891          | -0.0969 | 0.4897 |
+| No log        | 1.375 | 22   | 0.3947          | 0.0283  | 0.3952 |
+| No log        | 1.5   | 24   | 0.3523          | 0.0122  | 0.3527 |
+| No log        | 1.625 | 26   | 0.3225          | 0.0     | 0.3228 |
+| No log        | 1.75  | 28   | 0.3334          | 0.0     | 0.3337 |
+| No log        | 1.875 | 30   | 0.3339          | 0.0     | 0.3343 |
+| No log        | 2.0   | 32   | 0.3405          | 0.0122  | 0.3408 |
+| No log        | 2.125 | 34   | 0.3476          | 0.0122  | 0.3480 |
+| No log        | 2.25  | 36   | 0.3276          | 0.0122  | 0.3280 |
+| No log        | 2.375 | 38   | 0.3178          | 0.0     | 0.3181 |
+| No log        | 2.5   | 40   | 0.3023          | 0.0     | 0.3026 |
+| No log        | 2.625 | 42   | 0.2905          | 0.0     | 0.2907 |
+| No log        | 2.75  | 44   | 0.2841          | 0.0     | 0.2843 |
+| No log        | 2.875 | 46   | 0.2902          | 0.0     | 0.2904 |
+| No log        | 3.0   | 48   | 0.3167          | 0.0122  | 0.3170 |
+| No log        | 3.125 | 50   | 0.3680          | 0.0285  | 0.3684 |
+| No log        | 3.25  | 52   | 0.3771          | 0.0452  | 0.3775 |
+| No log        | 3.375 | 54   | 0.3850          | 0.0665  | 0.3854 |
+| No log        | 3.5   | 56   | 0.3485          | 0.0080  | 0.3489 |
+| No log        | 3.625 | 58   | 0.3149          | 0.0     | 0.3151 |
+| No log        | 3.75  | 60   | 0.2939          | 0.0     | 0.2941 |
+| No log        | 3.875 | 62   | 0.2881          | 0.0     | 0.2883 |
+| No log        | 4.0   | 64   | 0.2895          | 0.0     | 0.2897 |
+| No log        | 4.125 | 66   | 0.3127          | 0.0     | 0.3129 |
+| No log        | 4.25  | 68   | 0.3458          | 0.0245  | 0.3462 |
+| No log        | 4.375 | 70   | 0.3576          | 0.0161  | 0.3580 |
+| No log        | 4.5   | 72   | 0.3521          | 0.0161  | 0.3525 |
+| No log        | 4.625 | 74   | 0.3633          | 0.0161  | 0.3637 |
+| No log        | 4.75  | 76   | 0.3571          | 0.0326  | 0.3575 |
+| No log        | 4.875 | 78   | 0.3220          | 0.0     | 0.3223 |
+| No log        | 5.0   | 80   | 0.2971          | 0.0     | 0.2973 |
+| No log        | 5.125 | 82   | 0.2905          | 0.0     | 0.2906 |
+| No log        | 5.25  | 84   | 0.2904          | 0.0     | 0.2906 |
+| No log        | 5.375 | 86   | 0.2948          | 0.0     | 0.2950 |
+| No log        | 5.5   | 88   | 0.3083          | 0.0     | 0.3085 |
+| No log        | 5.625 | 90   | 0.3120          | 0.0     | 0.3123 |
+| No log        | 5.75  | 92   | 0.2947          | 0.0     | 0.2949 |
+| No log        | 5.875 | 94   | 0.2786          | 0.0     | 0.2786 |
+| No log        | 6.0   | 96   | 0.2717          | 0.0     | 0.2717 |
+| No log        | 6.125 | 98   | 0.2685          | 0.0     | 0.2684 |
+| No log        | 6.25  | 100  | 0.2677          | 0.0     | 0.2677 |
+| No log        | 6.375 | 102  | 0.2687          | 0.0     | 0.2688 |
+| No log        | 6.5   | 104  | 0.2689          | 0.0     | 0.2690 |
+| No log        | 6.625 | 106  | 0.2694          | 0.0     | 0.2695 |
+| No log        | 6.75  | 108  | 0.2703          | 0.0     | 0.2703 |
+| No log        | 6.875 | 110  | 0.2742          | 0.0     | 0.2743 |
+| No log        | 7.0   | 112  | 0.2832          | 0.0     | 0.2833 |
+| No log        | 7.125 | 114  | 0.2950          | 0.0     | 0.2953 |
+| No log        | 7.25  | 116  | 0.2962          | 0.0     | 0.2965 |
+| No log        | 7.375 | 118  | 0.2908          | 0.0     | 0.2910 |
+| No log        | 7.5   | 120  | 0.2842          | 0.0     | 0.2844 |
+| No log        | 7.625 | 122  | 0.2800          | 0.0     | 0.2802 |
+| No log        | 7.75  | 124  | 0.2757          | 0.0     | 0.2758 |
+| No log        | 7.875 | 126  | 0.2725          | 0.0     | 0.2726 |
+| No log        | 8.0   | 128  | 0.2720          | 0.0     | 0.2720 |
+| No log        | 8.125 | 130  | 0.2730          | 0.0     | 0.2730 |
+| No log        | 8.25  | 132  | 0.2749          | 0.0     | 0.2750 |
+| No log        | 8.375 | 134  | 0.2761          | 0.0     | 0.2763 |
+| No log        | 8.5   | 136  | 0.2761          | 0.0     | 0.2762 |
+| No log        | 8.625 | 138  | 0.2753          | 0.0     | 0.2755 |
+| No log        | 8.75  | 140  | 0.2739          | 0.0     | 0.2740 |
+| No log        | 8.875 | 142  | 0.2738          | 0.0     | 0.2739 |
+| No log        | 9.0   | 144  | 0.2744          | 0.0     | 0.2745 |
+| No log        | 9.125 | 146  | 0.2747          | 0.0     | 0.2748 |
+| No log        | 9.25  | 148  | 0.2751          | 0.0     | 0.2752 |
+| No log        | 9.375 | 150  | 0.2750          | 0.0     | 0.2751 |
+| No log        | 9.5   | 152  | 0.2745          | 0.0     | 0.2747 |
+| No log        | 9.625 | 154  | 0.2742          | 0.0     | 0.2743 |
+| No log        | 9.75  | 156  | 0.2740          | 0.0     | 0.2741 |
+| No log        | 9.875 | 158  | 0.2739          | 0.0     | 0.2740 |
+| No log        | 10.0  | 160  | 0.2738          | 0.0     | 0.2739 |
 ### Framework versions

model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:083d3ac18b784ee9307527cae4f6370b1cea215a42909e743caeb786e5409b7d
 size 540799996

 version https://git-lfs.github.com/spec/v1
+oid sha256:852ef1e81b25f200546c0d05a02477920a007d55d465e29d8a0c54d322238e84
 size 540799996

runs/Sep02_02-03-55_a09311c9b42d/events.out.tfevents.1725242637.a09311c9b42d.22.0 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:3e6a0fc106c94b86c97514c87576eba536657bbbf37db0fced8f63570b2d75b0
+size 32251

runs/Sep02_02-03-55_a09311c9b42d/events.out.tfevents.1725243376.a09311c9b42d.22.1 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:cf9640d7f42aed20bf76a1b4736e92d07381d6c1528925281e2e4d9658cd426f
+size 453

runs/Sep02_02-16-18_a09311c9b42d/events.out.tfevents.1725243379.a09311c9b42d.22.2 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:14e3c3e7a77ec84a838120471e2c925efc236fbba8fd9eae945bd35f0a47571d
+size 34076

runs/Sep02_02-16-18_a09311c9b42d/events.out.tfevents.1725244058.a09311c9b42d.22.3 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:1eb0b0c858ceb7d33d48847fbc1eea007919d873c19f01775567fc3990876103
+size 453

runs/Sep02_02-27-39_a09311c9b42d/events.out.tfevents.1725244060.a09311c9b42d.22.4 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:e08cc9c4e5629bd646f6958331ec61097bbc8a5ddc80ebc9795fb8ef9168e28b
+size 35901

training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:a4f1e9e628a3f0a22aa5bbf899ee0b58aa6dcdea93676e2218a56749268954ef
 size 5240

 version https://git-lfs.github.com/spec/v1
+oid sha256:8c9140901b854ab7f49a7cfd0e0ca9307797caf800a35ae3b3746bf487b364e5
 size 5240