End of training

Browse files

Files changed (9) hide show

README.md +40 -40
config.json +1 -1
generation_config.json +1 -1
model.safetensors +1 -1
runs/Mar14_03-58-11_a6dffb46838a/events.out.tfevents.1710388692.a6dffb46838a.273.0 +3 -0
runs/Mar14_04-03-49_a6dffb46838a/events.out.tfevents.1710389029.a6dffb46838a.273.1 +3 -0
runs/Mar14_04-05-09_a6dffb46838a/events.out.tfevents.1710389109.a6dffb46838a.273.2 +3 -0
tokenizer_config.json +1 -0
training_args.bin +2 -2

README.md CHANGED Viewed

@@ -17,11 +17,11 @@ should probably proofread and complete it, then remove this comment. -->
 This model is a fine-tuned version of [google/flan-t5-base](https://huggingface.co/google/flan-t5-base) on an unknown dataset.
 It achieves the following results on the evaluation set:
-- Loss: 0.0000
-- Rouge1: 1.0
-- Rouge2: 1.0
-- Rougel: 1.0
-- Rougelsum: 1.0
 ## Model description
@@ -42,7 +42,7 @@ More information needed
 The following hyperparameters were used during training:
 - learning_rate: 0.0003
 - train_batch_size: 8
-- eval_batch_size: 4
 - seed: 42
 - optimizer: Adam with betas=(0.9,0.999) and epsilon=1e-08
 - lr_scheduler_type: linear
@@ -52,41 +52,41 @@ The following hyperparameters were used during training:
 | Training Loss | Epoch | Step | Validation Loss | Rouge1 | Rouge2 | Rougel | Rougelsum |
 |:-------------:|:-----:|:----:|:---------------:|:------:|:------:|:------:|:---------:|
-| No log        | 1.0   | 1    | 0.0000          | 1.0    | 1.0    | 1.0    | 1.0       |
-| No log        | 2.0   | 2    | 0.0000          | 1.0    | 1.0    | 1.0    | 1.0       |
-| No log        | 3.0   | 3    | 0.0000          | 1.0    | 1.0    | 1.0    | 1.0       |
-| No log        | 4.0   | 4    | 0.0000          | 1.0    | 1.0    | 1.0    | 1.0       |
-| No log        | 5.0   | 5    | 0.0000          | 1.0    | 1.0    | 1.0    | 1.0       |
-| No log        | 6.0   | 6    | 0.0002          | 1.0    | 1.0    | 1.0    | 1.0       |
-| No log        | 7.0   | 7    | 0.0283          | 1.0    | 1.0    | 1.0    | 1.0       |
-| No log        | 8.0   | 8    | 0.0007          | 1.0    | 1.0    | 1.0    | 1.0       |
-| No log        | 9.0   | 9    | 0.0000          | 1.0    | 1.0    | 1.0    | 1.0       |
-| No log        | 10.0  | 10   | 0.0000          | 1.0    | 1.0    | 1.0    | 1.0       |
-| No log        | 11.0  | 11   | 0.0000          | 1.0    | 1.0    | 1.0    | 1.0       |
-| No log        | 12.0  | 12   | 0.0000          | 1.0    | 1.0    | 1.0    | 1.0       |
-| No log        | 13.0  | 13   | 0.0000          | 1.0    | 1.0    | 1.0    | 1.0       |
-| No log        | 14.0  | 14   | 0.0000          | 1.0    | 1.0    | 1.0    | 1.0       |
-| No log        | 15.0  | 15   | 0.0000          | 1.0    | 1.0    | 1.0    | 1.0       |
-| No log        | 16.0  | 16   | 0.0000          | 1.0    | 1.0    | 1.0    | 1.0       |
-| No log        | 17.0  | 17   | 0.0000          | 1.0    | 1.0    | 1.0    | 1.0       |
-| No log        | 18.0  | 18   | 0.0000          | 1.0    | 1.0    | 1.0    | 1.0       |
-| No log        | 19.0  | 19   | 0.0000          | 1.0    | 1.0    | 1.0    | 1.0       |
-| No log        | 20.0  | 20   | 0.0000          | 1.0    | 1.0    | 1.0    | 1.0       |
-| No log        | 21.0  | 21   | 0.0000          | 1.0    | 1.0    | 1.0    | 1.0       |
-| No log        | 22.0  | 22   | 0.0000          | 1.0    | 1.0    | 1.0    | 1.0       |
-| No log        | 23.0  | 23   | 0.0000          | 1.0    | 1.0    | 1.0    | 1.0       |
-| No log        | 24.0  | 24   | 0.0000          | 1.0    | 1.0    | 1.0    | 1.0       |
-| No log        | 25.0  | 25   | 0.0000          | 1.0    | 1.0    | 1.0    | 1.0       |
-| No log        | 26.0  | 26   | 0.0000          | 1.0    | 1.0    | 1.0    | 1.0       |
-| No log        | 27.0  | 27   | 0.0000          | 1.0    | 1.0    | 1.0    | 1.0       |
-| No log        | 28.0  | 28   | 0.0000          | 1.0    | 1.0    | 1.0    | 1.0       |
-| No log        | 29.0  | 29   | 0.0000          | 1.0    | 1.0    | 1.0    | 1.0       |
-| No log        | 30.0  | 30   | 0.0000          | 1.0    | 1.0    | 1.0    | 1.0       |
 ### Framework versions
-- Transformers 4.35.2
-- Pytorch 2.1.0+cu118
-- Datasets 2.14.7
-- Tokenizers 0.15.0

 This model is a fine-tuned version of [google/flan-t5-base](https://huggingface.co/google/flan-t5-base) on an unknown dataset.
 It achieves the following results on the evaluation set:
+- Loss: 0.0553
+- Rouge1: 0.8952
+- Rouge2: 0.8673
+- Rougel: 0.8952
+- Rougelsum: 0.8952
 ## Model description
 The following hyperparameters were used during training:
 - learning_rate: 0.0003
 - train_batch_size: 8
+- eval_batch_size: 8
 - seed: 42
 - optimizer: Adam with betas=(0.9,0.999) and epsilon=1e-08
 - lr_scheduler_type: linear
 | Training Loss | Epoch | Step | Validation Loss | Rouge1 | Rouge2 | Rougel | Rougelsum |
 |:-------------:|:-----:|:----:|:---------------:|:------:|:------:|:------:|:---------:|
+| 0.0194        | 1.0   | 2    | 0.0082          | 0.9333 | 0.9158 | 0.9333 | 0.9333    |
+| 0.0042        | 2.0   | 4    | 0.0408          | 0.9238 | 0.9031 | 0.9238 | 0.9238    |
+| 0.0002        | 3.0   | 6    | 0.0647          | 0.9238 | 0.9031 | 0.9238 | 0.9238    |
+| 0.0002        | 4.0   | 8    | 0.1117          | 0.9238 | 0.9031 | 0.9238 | 0.9238    |
+| 0.0007        | 5.0   | 10   | 0.1404          | 0.9238 | 0.9031 | 0.9238 | 0.9238    |
+| 0.0006        | 6.0   | 12   | 0.0987          | 0.9238 | 0.9031 | 0.9238 | 0.9238    |
+| 0.0005        | 7.0   | 14   | 0.0587          | 0.9238 | 0.9031 | 0.9238 | 0.9238    |
+| 0.0005        | 8.0   | 16   | 0.0251          | 0.9238 | 0.9031 | 0.9238 | 0.9238    |
+| 0.0022        | 9.0   | 18   | 0.0128          | 0.9095 | 0.8852 | 0.9095 | 0.9095    |
+| 0.0002        | 10.0  | 20   | 0.0228          | 0.8952 | 0.8622 | 0.8952 | 0.8952    |
+| 0.0003        | 11.0  | 22   | 0.0351          | 0.8952 | 0.8622 | 0.8952 | 0.8952    |
+| 0.0008        | 12.0  | 24   | 0.0374          | 0.9190 | 0.8980 | 0.9190 | 0.9190    |
+| 0.0004        | 13.0  | 26   | 0.0462          | 0.8952 | 0.8673 | 0.8952 | 0.8952    |
+| 0.0           | 14.0  | 28   | 0.0610          | 0.8952 | 0.8673 | 0.8952 | 0.8952    |
+| 0.0001        | 15.0  | 30   | 0.0737          | 0.8952 | 0.8673 | 0.8952 | 0.8952    |
+| 0.0005        | 16.0  | 32   | 0.0839          | 0.8952 | 0.8673 | 0.8952 | 0.8952    |
+| 0.0002        | 17.0  | 34   | 0.0917          | 0.8952 | 0.8673 | 0.8952 | 0.8952    |
+| 0.0009        | 18.0  | 36   | 0.1001          | 0.8952 | 0.8673 | 0.8952 | 0.8952    |
+| 0.0005        | 19.0  | 38   | 0.1054          | 0.8952 | 0.8673 | 0.8952 | 0.8952    |
+| 0.0012        | 20.0  | 40   | 0.1079          | 0.8952 | 0.8673 | 0.8952 | 0.8952    |
+| 0.0           | 21.0  | 42   | 0.1085          | 0.8952 | 0.8673 | 0.8952 | 0.8952    |
+| 0.0           | 22.0  | 44   | 0.1015          | 0.8952 | 0.8673 | 0.8952 | 0.8952    |
+| 0.0018        | 23.0  | 46   | 0.0862          | 0.8952 | 0.8673 | 0.8952 | 0.8952    |
+| 0.0001        | 24.0  | 48   | 0.0752          | 0.8952 | 0.8673 | 0.8952 | 0.8952    |
+| 0.0004        | 25.0  | 50   | 0.0675          | 0.8952 | 0.8673 | 0.8952 | 0.8952    |
+| 0.0001        | 26.0  | 52   | 0.0623          | 0.8952 | 0.8673 | 0.8952 | 0.8952    |
+| 0.0           | 27.0  | 54   | 0.0589          | 0.8952 | 0.8673 | 0.8952 | 0.8952    |
+| 0.0005        | 28.0  | 56   | 0.0568          | 0.8952 | 0.8673 | 0.8952 | 0.8952    |
+| 0.0002        | 29.0  | 58   | 0.0557          | 0.8952 | 0.8673 | 0.8952 | 0.8952    |
+| 0.0002        | 30.0  | 60   | 0.0553          | 0.8952 | 0.8673 | 0.8952 | 0.8952    |
 ### Framework versions
+- Transformers 4.38.2
+- Pytorch 2.2.1+cu121
+- Datasets 2.18.0
+- Tokenizers 0.15.2

config.json CHANGED Viewed

@@ -56,7 +56,7 @@
   },
   "tie_word_embeddings": false,
   "torch_dtype": "float32",
-  "transformers_version": "4.35.2",
   "use_cache": true,
   "vocab_size": 32128
 }

   },
   "tie_word_embeddings": false,
   "torch_dtype": "float32",
+  "transformers_version": "4.38.2",
   "use_cache": true,
   "vocab_size": 32128
 }

generation_config.json CHANGED Viewed

@@ -2,5 +2,5 @@
   "decoder_start_token_id": 0,
   "eos_token_id": 1,
   "pad_token_id": 0,
-  "transformers_version": "4.35.2"
 }

   "decoder_start_token_id": 0,
   "eos_token_id": 1,
   "pad_token_id": 0,
+  "transformers_version": "4.38.2"
 }

model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:1955b2417e196e067abff6a4d7d14ab3821e36107efd3f581625313365072f6a
 size 990345064

 version https://git-lfs.github.com/spec/v1
+oid sha256:08d28d5b5c247de7bf63c74f6cc8bbbaa3324ff97d7d84ff8ba4823a741f196e
 size 990345064

runs/Mar14_03-58-11_a6dffb46838a/events.out.tfevents.1710388692.a6dffb46838a.273.0 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:3ef68791b8f3a2e39a3a89ae6f0a6544920987aa90f1e8f3adcde25c6ac496f3
+size 21349

runs/Mar14_04-03-49_a6dffb46838a/events.out.tfevents.1710389029.a6dffb46838a.273.1 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:95fe7d3623c4303654e16c06cc582260bb98746359e4dee536946c89df730cf1
+size 21349

runs/Mar14_04-05-09_a6dffb46838a/events.out.tfevents.1710389109.a6dffb46838a.273.2 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:72671dd2a9b7aac74f3a8358a43f30960fdfc6f508403c90ddb954cac30cf13c
+size 32320

tokenizer_config.json CHANGED Viewed

@@ -1,4 +1,5 @@
 {
   "added_tokens_decoder": {
     "0": {
       "content": "<pad>",

 {
+  "add_prefix_space": true,
   "added_tokens_decoder": {
     "0": {
       "content": "<pad>",

training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:9b7f7bf430a5506e3361dc3d9efa8ed13a3a499a761cb7a029b721d3ab168621
-size 4792

 version https://git-lfs.github.com/spec/v1
+oid sha256:2515614738e407d56a9fa085dcfb69288c35c948198207bda024f162e2f08adb
+size 5112