End of training

Browse files

Files changed (3) hide show

README.md +17 -21
model.safetensors +1 -1
runs/Dec30_10-28-48_nsjmhjr540/events.out.tfevents.1703932132.nsjmhjr540.242.0 +2 -2

README.md CHANGED Viewed

@@ -1,4 +1,5 @@
 ---
 tags:
 - generated_from_trainer
 metrics:
@@ -14,14 +15,14 @@ should probably proofread and complete it, then remove this comment. -->
 # t5-small
-This model was trained from scratch on an unknown dataset.
 It achieves the following results on the evaluation set:
-- Loss: 1.6644
-- Rouge1: 58.4345
-- Rouge2: 35.6298
-- Rougel: 56.7347
-- Rougelsum: 56.768
-- Bleu: 0.2405
 ## Model description
@@ -40,9 +41,9 @@ More information needed
 ### Training hyperparameters
 The following hyperparameters were used during training:
-- learning_rate: 5e-05
-- train_batch_size: 64
-- eval_batch_size: 64
 - seed: 42
 - optimizer: Adam with betas=(0.9,0.999) and epsilon=1e-08
 - lr_scheduler_type: linear
@@ -50,21 +51,16 @@ The following hyperparameters were used during training:
 ### Training results
-| Training Loss | Epoch | Step  | Validation Loss | Rouge1  | Rouge2  | Rougel  | Rougelsum | Bleu   |
-|:-------------:|:-----:|:-----:|:---------------:|:-------:|:-------:|:-------:|:---------:|:------:|
-| 1.8479        | 0.34  | 3000  | 1.7017          | 58.311  | 35.3602 | 56.618  | 56.6461   | 0.2379 |
-| 1.8327        | 0.68  | 6000  | 1.6922          | 58.3222 | 35.4329 | 56.6269 | 56.6666   | 0.2385 |
-| 1.8236        | 1.01  | 9000  | 1.6832          | 58.3368 | 35.42   | 56.6223 | 56.6611   | 0.2382 |
-| 1.8046        | 1.35  | 12000 | 1.6784          | 58.4461 | 35.538  | 56.7423 | 56.779    | 0.2394 |
-| 1.8078        | 1.69  | 15000 | 1.6718          | 58.4257 | 35.566  | 56.7209 | 56.7558   | 0.2394 |
-| 1.7989        | 2.03  | 18000 | 1.6688          | 58.4162 | 35.6118 | 56.7173 | 56.7626   | 0.2402 |
-| 1.7945        | 2.37  | 21000 | 1.6661          | 58.444  | 35.6166 | 56.7463 | 56.7845   | 0.2401 |
-| 1.7907        | 2.71  | 24000 | 1.6644          | 58.4345 | 35.6298 | 56.7347 | 56.768    | 0.2405 |
 ### Framework versions
 - Transformers 4.36.2
 - Pytorch 1.13.0+cu117
-- Datasets 2.4.0
 - Tokenizers 0.15.0

 ---
+base_model: ToirovSadi/t5-small
 tags:
 - generated_from_trainer
 metrics:
 # t5-small
+This model is a fine-tuned version of [ToirovSadi/t5-small](https://huggingface.co/ToirovSadi/t5-small) on an unknown dataset.
 It achieves the following results on the evaluation set:
+- Loss: 1.5871
+- Rouge1: 61.1404
+- Rouge2: 37.8854
+- Rougel: 59.2953
+- Rougelsum: 59.3081
+- Bleu: 0.2843
 ## Model description
 ### Training hyperparameters
 The following hyperparameters were used during training:
+- learning_rate: 2e-05
+- train_batch_size: 8
+- eval_batch_size: 8
 - seed: 42
 - optimizer: Adam with betas=(0.9,0.999) and epsilon=1e-08
 - lr_scheduler_type: linear
 ### Training results
+| Training Loss | Epoch | Step   | Validation Loss | Rouge1  | Rouge2  | Rougel  | Rougelsum | Bleu   |
+|:-------------:|:-----:|:------:|:---------------:|:-------:|:-------:|:-------:|:---------:|:------:|
+| 1.7433        | 0.99  | 70000  | 1.6000          | 60.9802 | 37.6872 | 59.1561 | 59.1644   | 0.2821 |
+| 1.7216        | 1.97  | 140000 | 1.5905          | 61.1241 | 37.8722 | 59.2878 | 59.2991   | 0.2839 |
+| 1.7389        | 2.96  | 210000 | 1.5871          | 61.1404 | 37.8854 | 59.2953 | 59.3081   | 0.2843 |
 ### Framework versions
 - Transformers 4.36.2
 - Pytorch 1.13.0+cu117
+- Datasets 2.16.0
 - Tokenizers 0.15.0

model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:0277c51d7e27f458f8c9541968f8d30edc747b53ed31a9e525fea5875f0d588b
 size 242041896

 version https://git-lfs.github.com/spec/v1
+oid sha256:e3b34c639c2d0b4dfcc981be64867d554ee9e40e32bdc30e74a9562b5851bce3
 size 242041896

runs/Dec30_10-28-48_nsjmhjr540/events.out.tfevents.1703932132.nsjmhjr540.242.0 CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:ec8811e1456d832329092460035eb602b80a03c6bf9578a0a4b03fee9fb5332b
-size 74794

 version https://git-lfs.github.com/spec/v1
+oid sha256:8bf2ed8a866c42e43424268ef3c4ba3c0f3b5fb6d00b605e72f85c8020909acf
+size 75154