End of training

Browse files

Files changed (5) hide show

README.md +20 -18
model.safetensors +1 -1
runs/May31_07-45-35_4b94b27b3ee8/events.out.tfevents.1717141538.4b94b27b3ee8.6457.1 +3 -0
runs/May31_07-47-13_4b94b27b3ee8/events.out.tfevents.1717141639.4b94b27b3ee8.6457.2 +3 -0
training_args.bin +1 -1

README.md CHANGED Viewed

@@ -17,12 +17,12 @@ should probably proofread and complete it, then remove this comment. -->
 This model is a fine-tuned version of [t5-small](https://huggingface.co/t5-small) on the None dataset.
 It achieves the following results on the evaluation set:
-- Loss: 2.4677
-- Rouge1: 20.3261
-- Rouge2: 6.7795
-- Rougel: 15.5884
-- Rougelsum: 18.5485
-- Gen Len: 18.7778
 ## Model description
@@ -42,9 +42,11 @@ More information needed
 The following hyperparameters were used during training:
 - learning_rate: 2e-05
-- train_batch_size: 16
-- eval_batch_size: 16
 - seed: 42
 - optimizer: Adam with betas=(0.9,0.999) and epsilon=1e-08
 - lr_scheduler_type: linear
 - num_epochs: 10
@@ -54,16 +56,16 @@ The following hyperparameters were used during training:
 | Training Loss | Epoch | Step | Validation Loss | Rouge1  | Rouge2 | Rougel  | Rougelsum | Gen Len |
 |:-------------:|:-----:|:----:|:---------------:|:-------:|:------:|:-------:|:---------:|:-------:|
-| No log        | 1.0   | 45   | 3.3221          | 14.6698 | 3.0124 | 10.6423 | 12.9132   | 18.9778 |
-| No log        | 2.0   | 90   | 2.9680          | 15.3673 | 3.86   | 11.7066 | 13.6565   | 18.8778 |
-| No log        | 3.0   | 135  | 2.8031          | 16.8536 | 4.6418 | 12.7707 | 15.2338   | 18.7889 |
-| No log        | 4.0   | 180  | 2.6954          | 17.8659 | 5.3146 | 13.6729 | 16.3449   | 18.7889 |
-| No log        | 5.0   | 225  | 2.6161          | 18.7225 | 5.6819 | 14.2031 | 16.9795   | 18.7778 |
-| No log        | 6.0   | 270  | 2.5592          | 19.7238 | 6.2295 | 15.0955 | 17.9351   | 18.7778 |
-| No log        | 7.0   | 315  | 2.5183          | 20.0288 | 6.8336 | 15.4154 | 18.5299   | 18.7778 |
-| No log        | 8.0   | 360  | 2.4895          | 20.3239 | 6.6193 | 15.5755 | 18.5865   | 18.7778 |
-| No log        | 9.0   | 405  | 2.4735          | 20.4121 | 6.8302 | 15.6246 | 18.5777   | 18.7778 |
-| No log        | 10.0  | 450  | 2.4677          | 20.3261 | 6.7795 | 15.5884 | 18.5485   | 18.7778 |
 ### Framework versions

 This model is a fine-tuned version of [t5-small](https://huggingface.co/t5-small) on the None dataset.
 It achieves the following results on the evaluation set:
+- Loss: 2.0804
+- Rouge1: 21.7575
+- Rouge2: 8.5919
+- Rougel: 17.3288
+- Rougelsum: 20.4481
+- Gen Len: 18.8222
 ## Model description
 The following hyperparameters were used during training:
 - learning_rate: 2e-05
+- train_batch_size: 8
+- eval_batch_size: 8
 - seed: 42
+- gradient_accumulation_steps: 2
+- total_train_batch_size: 16
 - optimizer: Adam with betas=(0.9,0.999) and epsilon=1e-08
 - lr_scheduler_type: linear
 - num_epochs: 10
 | Training Loss | Epoch | Step | Validation Loss | Rouge1  | Rouge2 | Rougel  | Rougelsum | Gen Len |
 |:-------------:|:-----:|:----:|:---------------:|:-------:|:------:|:-------:|:---------:|:-------:|
+| No log        | 1.0   | 45   | 2.3869          | 21.4625 | 7.7924 | 16.4408 | 19.7799   | 18.7667 |
+| No log        | 2.0   | 90   | 2.3161          | 22.2793 | 8.0559 | 17.0177 | 20.6462   | 18.8444 |
+| No log        | 3.0   | 135  | 2.2576          | 21.9986 | 7.8751 | 16.7895 | 20.2286   | 18.6778 |
+| No log        | 4.0   | 180  | 2.2061          | 21.9707 | 8.2401 | 16.9102 | 20.2145   | 18.6333 |
+| No log        | 5.0   | 225  | 2.1667          | 22.1615 | 8.3056 | 17.0849 | 20.48     | 18.8222 |
+| No log        | 6.0   | 270  | 2.1350          | 21.942  | 8.5934 | 17.2273 | 20.4631   | 18.7444 |
+| No log        | 7.0   | 315  | 2.1102          | 21.8541 | 8.664  | 17.2851 | 20.4798   | 18.7444 |
+| No log        | 8.0   | 360  | 2.0939          | 21.967  | 8.675  | 17.4126 | 20.5475   | 18.8222 |
+| No log        | 9.0   | 405  | 2.0841          | 21.824  | 8.6682 | 17.3674 | 20.4822   | 18.8222 |
+| No log        | 10.0  | 450  | 2.0804          | 21.7575 | 8.5919 | 17.3288 | 20.4481   | 18.8222 |
 ### Framework versions

model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:0f22e3ac384b09c6ddb354668685cfaa14d1c133259959d1fca6a8e7d17db61e
 size 242041896

 version https://git-lfs.github.com/spec/v1
+oid sha256:baf382557e0b031a54e438968e30af2502a9891bd3feda1f97ba4295a12997f4
 size 242041896

runs/May31_07-45-35_4b94b27b3ee8/events.out.tfevents.1717141538.4b94b27b3ee8.6457.1 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:817bf25684ff23525c511e3aafee268e07e2a7c03e09a18dc0c982583a7846e4
+size 11592

runs/May31_07-47-13_4b94b27b3ee8/events.out.tfevents.1717141639.4b94b27b3ee8.6457.2 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:f93b4d5585ad5ea8e41feccc606446b79ab5fb5dd2803c7d1b1889a1938e448a
+size 11422

training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:58387878cb2f1a69f5dbbc47da76a16b03b6e42389953dcbdc44edec556d70fc
 size 5240

 version https://git-lfs.github.com/spec/v1
+oid sha256:d8b85338afdf88d9d3cb9690a7b21d0e378dbfcf92a4135940cb51f2a3d5078f
 size 5240