wgcv
/

tidy-tab-model-t5-small

@@ -17,12 +17,12 @@ should probably proofread and complete it, then remove this comment. -->
 This model is a fine-tuned version of [google-t5/t5-small](https://huggingface.co/google-t5/t5-small) on an unknown dataset.
 It achieves the following results on the evaluation set:
-- Loss: 0.9664
-- Rouge1: 0.7291
-- Rouge2: 0.6063
-- Rougel: 0.7259
-- Rougelsum: 0.7278
-- Gen Len: 6.9658
 ## Model description
@@ -41,21 +41,25 @@ More information needed
 ### Training hyperparameters
 The following hyperparameters were used during training:
-- learning_rate: 2e-05
 - train_batch_size: 16
 - eval_batch_size: 16
 - seed: 42
 - optimizer: Adam with betas=(0.9,0.999) and epsilon=1e-08
 - lr_scheduler_type: linear
-- num_epochs: 12
 ### Training results
 | Training Loss | Epoch   | Step | Validation Loss | Rouge1 | Rouge2 | Rougel | Rougelsum | Gen Len |
 |:-------------:|:-------:|:----:|:---------------:|:------:|:------:|:------:|:---------:|:-------:|
-| 0.9199        | 3.7879  | 500  | 0.9804          | 0.735  | 0.61   | 0.7309 | 0.7326    | 7.0299  |
-| 0.8632        | 7.5758  | 1000 | 0.9696          | 0.7269 | 0.6049 | 0.7237 | 0.7253    | 6.9786  |
-| 0.8398        | 11.3636 | 1500 | 0.9664          | 0.7291 | 0.6063 | 0.7259 | 0.7278    | 6.9658  |
 ### Framework versions

 This model is a fine-tuned version of [google-t5/t5-small](https://huggingface.co/google-t5/t5-small) on an unknown dataset.
 It achieves the following results on the evaluation set:
+- Loss: 0.9997
+- Rouge1: 0.7404
+- Rouge2: 0.6249
+- Rougel: 0.7403
+- Rougelsum: 0.7413
+- Gen Len: 6.9017
 ## Model description
 ### Training hyperparameters
 The following hyperparameters were used during training:
+- learning_rate: 5e-05
 - train_batch_size: 16
 - eval_batch_size: 16
 - seed: 42
 - optimizer: Adam with betas=(0.9,0.999) and epsilon=1e-08
 - lr_scheduler_type: linear
+- lr_scheduler_warmup_steps: 1000
+- num_epochs: 32
 ### Training results
 | Training Loss | Epoch   | Step | Validation Loss | Rouge1 | Rouge2 | Rougel | Rougelsum | Gen Len |
 |:-------------:|:-------:|:----:|:---------------:|:------:|:------:|:------:|:---------:|:-------:|
+| 2.3461        | 3.7879  | 500  | 1.0711          | 0.7407 | 0.6192 | 0.736  | 0.7374    | 7.188   |
+| 1.0075        | 7.5758  | 1000 | 0.9645          | 0.7313 | 0.6071 | 0.7304 | 0.7303    | 6.9274  |
+| 0.7921        | 11.3636 | 1500 | 0.9563          | 0.7306 | 0.6079 | 0.7323 | 0.7325    | 6.7863  |
+| 0.6587        | 15.1515 | 2000 | 0.9697          | 0.7382 | 0.6142 | 0.739  | 0.7397    | 6.8675  |
+| 0.5579        | 18.9394 | 2500 | 0.9905          | 0.7388 | 0.6203 | 0.7378 | 0.7395    | 6.8718  |
+| 0.4984        | 22.7273 | 3000 | 0.9997          | 0.7404 | 0.6249 | 0.7403 | 0.7413    | 6.9017  |
 ### Framework versions

model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:7842c5d8f6def9145b3675bd3e7fd72f4186bdec6c06d3aff57d4b8db2a73f5e
 size 241988648

 version https://git-lfs.github.com/spec/v1
+oid sha256:a929e79f3a3ef1f8d357a26daa1ef2784918613914d20edadf972ac66d3f41cc
 size 241988648