End of training

Browse files

Files changed (6) hide show

README.md +58 -58
config.json +1 -1
generation_config.json +1 -1
model.safetensors +1 -1
runs/Mar07_11-28-21_dd6894533b8d/events.out.tfevents.1709810901.dd6894533b8d.494.0 +3 -0
training_args.bin +1 -1

README.md CHANGED Viewed

@@ -14,7 +14,7 @@ should probably proofread and complete it, then remove this comment. -->
 This model is a fine-tuned version of [google/pegasus-x-base](https://huggingface.co/google/pegasus-x-base) on the None dataset.
 It achieves the following results on the evaluation set:
-- Loss: 1.6064
 ## Model description
@@ -47,67 +47,67 @@ The following hyperparameters were used during training:
 | Training Loss | Epoch | Step | Validation Loss |
 |:-------------:|:-----:|:----:|:---------------:|
-| 3.7528        | 0.05  | 10   | 2.5788          |
-| 2.7466        | 0.11  | 20   | 2.2694          |
-| 2.4032        | 0.16  | 30   | 2.1298          |
-| 2.3188        | 0.21  | 40   | 2.0389          |
-| 2.1827        | 0.27  | 50   | 1.9788          |
-| 2.1284        | 0.32  | 60   | 1.9291          |
-| 2.1275        | 0.37  | 70   | 1.9024          |
-| 2.0536        | 0.43  | 80   | 1.8587          |
-| 1.9901        | 0.48  | 90   | 1.8407          |
-| 1.9769        | 0.53  | 100  | 1.8211          |
-| 1.9643        | 0.59  | 110  | 1.8048          |
-| 1.8846        | 0.64  | 120  | 1.7921          |
-| 1.9294        | 0.69  | 130  | 1.7837          |
-| 1.903         | 0.75  | 140  | 1.7664          |
-| 1.9329        | 0.8   | 150  | 1.7606          |
-| 1.865         | 0.85  | 160  | 1.7493          |
-| 1.8414        | 0.91  | 170  | 1.7404          |
-| 1.8793        | 0.96  | 180  | 1.7310          |
-| 1.8519        | 1.01  | 190  | 1.7165          |
-| 1.7918        | 1.07  | 200  | 1.7132          |
-| 1.7815        | 1.12  | 210  | 1.7087          |
-| 1.7503        | 1.17  | 220  | 1.7019          |
-| 1.7545        | 1.23  | 230  | 1.6937          |
-| 1.7088        | 1.28  | 240  | 1.6905          |
-| 1.7231        | 1.33  | 250  | 1.6862          |
-| 1.7584        | 1.39  | 260  | 1.6807          |
-| 1.7537        | 1.44  | 270  | 1.6762          |
-| 1.7867        | 1.49  | 280  | 1.6685          |
-| 1.7666        | 1.55  | 290  | 1.6642          |
-| 1.7076        | 1.6   | 300  | 1.6580          |
-| 1.6894        | 1.65  | 310  | 1.6596          |
-| 1.7207        | 1.71  | 320  | 1.6535          |
-| 1.6743        | 1.76  | 330  | 1.6565          |
-| 1.7197        | 1.81  | 340  | 1.6491          |
-| 1.7027        | 1.87  | 350  | 1.6438          |
-| 1.7161        | 1.92  | 360  | 1.6388          |
-| 1.7256        | 1.97  | 370  | 1.6368          |
-| 1.6623        | 2.03  | 380  | 1.6370          |
-| 1.6041        | 2.08  | 390  | 1.6402          |
-| 1.6308        | 2.13  | 400  | 1.6289          |
-| 1.6384        | 2.19  | 410  | 1.6333          |
-| 1.6223        | 2.24  | 420  | 1.6291          |
-| 1.6163        | 2.29  | 430  | 1.6212          |
-| 1.6232        | 2.35  | 440  | 1.6267          |
-| 1.6081        | 2.4   | 450  | 1.6302          |
-| 1.619         | 2.45  | 460  | 1.6196          |
-| 1.5802        | 2.51  | 470  | 1.6215          |
-| 1.6313        | 2.56  | 480  | 1.6216          |
-| 1.5968        | 2.61  | 490  | 1.6153          |
-| 1.589         | 2.67  | 500  | 1.6137          |
-| 1.6087        | 2.72  | 510  | 1.6129          |
-| 1.5614        | 2.77  | 520  | 1.6085          |
-| 1.6109        | 2.83  | 530  | 1.6067          |
-| 1.596         | 2.88  | 540  | 1.6097          |
-| 1.6343        | 2.93  | 550  | 1.5979          |
-| 1.5774        | 2.99  | 560  | 1.6064          |
 ### Framework versions
-- Transformers 4.38.1
 - Pytorch 2.1.0+cu121
 - Datasets 2.18.0
 - Tokenizers 0.15.2

 This model is a fine-tuned version of [google/pegasus-x-base](https://huggingface.co/google/pegasus-x-base) on the None dataset.
 It achieves the following results on the evaluation set:
+- Loss: 1.3143
 ## Model description
 | Training Loss | Epoch | Step | Validation Loss |
 |:-------------:|:-----:|:----:|:---------------:|
+| 3.5583        | 0.05  | 10   | 2.3912          |
+| 2.5255        | 0.11  | 20   | 2.0221          |
+| 2.1546        | 0.16  | 30   | 1.8584          |
+| 2.0147        | 0.21  | 40   | 1.7538          |
+| 1.9291        | 0.27  | 50   | 1.6817          |
+| 1.8566        | 0.32  | 60   | 1.6424          |
+| 1.8325        | 0.37  | 70   | 1.6027          |
+| 1.7709        | 0.43  | 80   | 1.5801          |
+| 1.7153        | 0.48  | 90   | 1.5569          |
+| 1.6983        | 0.53  | 100  | 1.5337          |
+| 1.6936        | 0.59  | 110  | 1.5292          |
+| 1.6254        | 0.64  | 120  | 1.5039          |
+| 1.629         | 0.69  | 130  | 1.4861          |
+| 1.6537        | 0.75  | 140  | 1.4684          |
+| 1.6449        | 0.8   | 150  | 1.4621          |
+| 1.5916        | 0.85  | 160  | 1.4497          |
+| 1.5764        | 0.91  | 170  | 1.4385          |
+| 1.5899        | 0.96  | 180  | 1.4406          |
+| 1.5556        | 1.01  | 190  | 1.4307          |
+| 1.4869        | 1.07  | 200  | 1.4263          |
+| 1.482         | 1.12  | 210  | 1.4156          |
+| 1.486         | 1.17  | 220  | 1.4109          |
+| 1.4407        | 1.23  | 230  | 1.4092          |
+| 1.4183        | 1.28  | 240  | 1.4010          |
+| 1.4226        | 1.33  | 250  | 1.3988          |
+| 1.4611        | 1.39  | 260  | 1.3917          |
+| 1.4823        | 1.44  | 270  | 1.3881          |
+| 1.4877        | 1.49  | 280  | 1.3800          |
+| 1.464         | 1.55  | 290  | 1.3799          |
+| 1.4327        | 1.6   | 300  | 1.3712          |
+| 1.4189        | 1.65  | 310  | 1.3725          |
+| 1.495         | 1.71  | 320  | 1.3649          |
+| 1.387         | 1.76  | 330  | 1.3640          |
+| 1.4308        | 1.81  | 340  | 1.3595          |
+| 1.4045        | 1.87  | 350  | 1.3547          |
+| 1.4227        | 1.92  | 360  | 1.3549          |
+| 1.444         | 1.97  | 370  | 1.3487          |
+| 1.3747        | 2.03  | 380  | 1.3467          |
+| 1.3504        | 2.08  | 390  | 1.3530          |
+| 1.3493        | 2.13  | 400  | 1.3438          |
+| 1.3099        | 2.19  | 410  | 1.3494          |
+| 1.3484        | 2.24  | 420  | 1.3374          |
+| 1.3541        | 2.29  | 430  | 1.3343          |
+| 1.3044        | 2.35  | 440  | 1.3383          |
+| 1.3457        | 2.4   | 450  | 1.3373          |
+| 1.3017        | 2.45  | 460  | 1.3291          |
+| 1.2956        | 2.51  | 470  | 1.3289          |
+| 1.322         | 2.56  | 480  | 1.3300          |
+| 1.3219        | 2.61  | 490  | 1.3211          |
+| 1.3026        | 2.67  | 500  | 1.3254          |
+| 1.3183        | 2.72  | 510  | 1.3191          |
+| 1.2709        | 2.77  | 520  | 1.3160          |
+| 1.303         | 2.83  | 530  | 1.3141          |
+| 1.2857        | 2.88  | 540  | 1.3189          |
+| 1.3126        | 2.93  | 550  | 1.3082          |
+| 1.3053        | 2.99  | 560  | 1.3143          |
 ### Framework versions
+- Transformers 4.38.2
 - Pytorch 2.1.0+cu121
 - Datasets 2.18.0
 - Tokenizers 0.15.2

config.json CHANGED Viewed

@@ -54,7 +54,7 @@
   "stagger_local_blocks": true,
   "static_position_embeddings": true,
   "torch_dtype": "float32",
-  "transformers_version": "4.38.1",
   "use_cache": true,
   "vocab_size": 96103
 }

   "stagger_local_blocks": true,
   "static_position_embeddings": true,
   "torch_dtype": "float32",
+  "transformers_version": "4.38.2",
   "use_cache": true,
   "vocab_size": 96103
 }

generation_config.json CHANGED Viewed

@@ -8,5 +8,5 @@
   "max_length": 16384,
   "num_beams": 8,
   "pad_token_id": 0,
-  "transformers_version": "4.38.1"
 }

   "max_length": 16384,
   "num_beams": 8,
   "pad_token_id": 0,
+  "transformers_version": "4.38.2"
 }

model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:ee8580e5261e11ba2ac78ee1ab3f7e36ad743dc3dec0745845561f8b084e832d
 size 1089213696

 version https://git-lfs.github.com/spec/v1
+oid sha256:6a9bbd4e5a909d19cacab038929226c859d711967f94fe63fbe231de11da5cdc
 size 1089213696

runs/Mar07_11-28-21_dd6894533b8d/events.out.tfevents.1709810901.dd6894533b8d.494.0 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:9f8d07cb4fbbc965d712ced8238f22381762010326337465120e85bc94ae1063
+size 32721

training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:109373ae87a3ec4d7ef93a8aa3affc231a05d6f6c24be8d853b0d0807d4075fb
 size 4920

 version https://git-lfs.github.com/spec/v1
+oid sha256:04a047579681a9084ff70c1e98fdf6a82fdad158447da9676ce53258c1da2488
 size 4920