End of training

Files changed (3) hide show

README.md CHANGED Viewed

@@ -18,11 +18,11 @@ should probably proofread and complete it, then remove this comment. -->
 This model is a fine-tuned version of [google/flan-t5-small](https://huggingface.co/google/flan-t5-small) on an unknown dataset.
 It achieves the following results on the evaluation set:
 - Loss: nan
-- Rouge1: 0.0776
-- Rouge2: 0.0197
-- Rougel: 0.0639
-- Rougelsum: 0.0638
-- Gen Len: 12.879
 ## Model description
@@ -41,9 +41,9 @@ More information needed
 ### Training hyperparameters
 The following hyperparameters were used during training:
-- learning_rate: 2e-05
-- train_batch_size: 1
-- eval_batch_size: 1
 - seed: 42
 - optimizer: Adam with betas=(0.9,0.999) and epsilon=1e-08
 - lr_scheduler_type: linear
@@ -54,10 +54,10 @@ The following hyperparameters were used during training:
 | Training Loss | Epoch | Step | Validation Loss | Rouge1 | Rouge2 | Rougel | Rougelsum | Gen Len |
 |:-------------:|:-----:|:----:|:---------------:|:------:|:------:|:------:|:---------:|:-------:|
-| 0.0           | 1.0   | 989  | nan             | 0.0776 | 0.0197 | 0.0639 | 0.0638    | 12.879  |
-| 0.0           | 2.0   | 1978 | nan             | 0.0776 | 0.0197 | 0.0639 | 0.0638    | 12.879  |
-| 0.0           | 3.0   | 2967 | nan             | 0.0776 | 0.0197 | 0.0639 | 0.0638    | 12.879  |
-| 0.0           | 4.0   | 3956 | nan             | 0.0776 | 0.0197 | 0.0639 | 0.0638    | 12.879  |
 ### Framework versions

 This model is a fine-tuned version of [google/flan-t5-small](https://huggingface.co/google/flan-t5-small) on an unknown dataset.
 It achieves the following results on the evaluation set:
 - Loss: nan
+- Rouge1: 0.0827
+- Rouge2: 0.0227
+- Rougel: 0.0695
+- Rougelsum: 0.0694
+- Gen Len: 13.7944
 ## Model description
 ### Training hyperparameters
 The following hyperparameters were used during training:
+- learning_rate: 0.002
+- train_batch_size: 15
+- eval_batch_size: 15
 - seed: 42
 - optimizer: Adam with betas=(0.9,0.999) and epsilon=1e-08
 - lr_scheduler_type: linear
 | Training Loss | Epoch | Step | Validation Loss | Rouge1 | Rouge2 | Rougel | Rougelsum | Gen Len |
 |:-------------:|:-----:|:----:|:---------------:|:------:|:------:|:------:|:---------:|:-------:|
+| No log        | 1.0   | 66   | nan             | 0.0827 | 0.0227 | 0.0695 | 0.0694    | 13.7944 |
+| No log        | 2.0   | 132  | nan             | 0.0827 | 0.0227 | 0.0695 | 0.0694    | 13.7944 |
+| No log        | 3.0   | 198  | nan             | 0.0827 | 0.0227 | 0.0695 | 0.0694    | 13.7944 |
+| No log        | 4.0   | 264  | nan             | 0.0827 | 0.0227 | 0.0695 | 0.0694    | 13.7944 |
 ### Framework versions

runs/Mar04_05-49-08_452fc9328a02/events.out.tfevents.1709531349.452fc9328a02.1871.0 ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:33b6d989f45d9035958ac2be2dc0e6c25aafb20f53805fcb68c3313b08bd25bd
+size 7836

training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:681111e142b5ab2ed831af1fd043db7695326d13d312a4243ddd62536369ac81
 size 4856

 version https://git-lfs.github.com/spec/v1
+oid sha256:3c2b317954a53e58daa51747d166f975651bc6f6eba2c3bd20087aa5649709f9
 size 4856