Model save

Browse files

Files changed (5) hide show

README.md +27 -27
generation_config.json +1 -1
model.safetensors +1 -1
runs/Mar02_15-57-52_n5qclzvvia/events.out.tfevents.1709395492.n5qclzvvia.213.0 +2 -2
runs/Mar02_15-57-52_n5qclzvvia/events.out.tfevents.1709398863.n5qclzvvia.213.1 +3 -0

README.md CHANGED Viewed

@@ -17,11 +17,11 @@ should probably proofread and complete it, then remove this comment. -->
 This model is a fine-tuned version of [facebook/bart-large-cnn](https://huggingface.co/facebook/bart-large-cnn) on an unknown dataset.
 It achieves the following results on the evaluation set:
-- Loss: 0.0490
-- Rouge1: 74.1584
-- Rouge2: 57.9788
-- Rougel: 62.8448
-- Rougelsum: 62.7765
 ## Model description
@@ -52,31 +52,31 @@ The following hyperparameters were used during training:
 | Training Loss | Epoch | Step | Validation Loss | Rouge1  | Rouge2  | Rougel  | Rougelsum |
 |:-------------:|:-----:|:----:|:---------------:|:-------:|:-------:|:-------:|:---------:|
-| 1.0254        | 1.0   | 35   | 0.7095          | 48.1054 | 30.2028 | 38.8084 | 38.8683   |
-| 0.6481        | 2.0   | 70   | 0.6066          | 50.8336 | 34.5183 | 41.7247 | 41.8707   |
-| 0.5614        | 3.0   | 105  | 0.5329          | 57.7426 | 37.8419 | 42.9075 | 42.9433   |
-| 0.5138        | 4.0   | 140  | 0.4973          | 57.8171 | 36.9019 | 44.6488 | 44.8647   |
-| 0.451         | 5.0   | 175  | 0.4401          | 60.916  | 41.087  | 45.4116 | 45.4411   |
-| 0.4162        | 6.0   | 210  | 0.3867          | 62.9769 | 43.4407 | 48.2851 | 48.3377   |
-| 0.3633        | 7.0   | 245  | 0.3383          | 65.5103 | 47.2327 | 53.4334 | 53.5125   |
-| 0.313         | 8.0   | 280  | 0.2834          | 64.057  | 46.1635 | 49.7044 | 49.8158   |
-| 0.2669        | 9.0   | 315  | 0.1994          | 66.9064 | 49.5199 | 55.2645 | 55.3093   |
-| 0.2073        | 10.0  | 350  | 0.1648          | 69.832  | 52.5513 | 58.7138 | 58.7687   |
-| 0.1655        | 11.0  | 385  | 0.1744          | 67.1147 | 49.7127 | 54.8    | 54.8769   |
-| 0.1285        | 12.0  | 420  | 0.1074          | 71.6738 | 54.8468 | 60.3888 | 60.5511   |
-| 0.0954        | 13.0  | 455  | 0.0886          | 73.8985 | 58.3168 | 64.7526 | 64.7308   |
-| 0.0757        | 14.0  | 490  | 0.0684          | 71.6519 | 54.7679 | 60.7249 | 60.8026   |
-| 0.0547        | 15.0  | 525  | 0.0679          | 71.475  | 55.8093 | 60.7339 | 60.7417   |
-| 0.0426        | 16.0  | 560  | 0.0677          | 73.0471 | 55.8567 | 60.1405 | 60.1719   |
-| 0.033         | 17.0  | 595  | 0.0516          | 73.7561 | 57.0512 | 62.7989 | 62.7546   |
-| 0.0262        | 18.0  | 630  | 0.0563          | 74.1168 | 58.3878 | 63.5671 | 63.5098   |
-| 0.0214        | 19.0  | 665  | 0.0404          | 74.4461 | 58.7092 | 64.3292 | 64.2233   |
-| 0.0157        | 20.0  | 700  | 0.0490          | 74.1584 | 57.9788 | 62.8448 | 62.7765   |
 ### Framework versions
-- Transformers 4.38.1
 - Pytorch 2.2.1+cu121
-- Datasets 2.17.1
 - Tokenizers 0.15.2

 This model is a fine-tuned version of [facebook/bart-large-cnn](https://huggingface.co/facebook/bart-large-cnn) on an unknown dataset.
 It achieves the following results on the evaluation set:
+- Loss: 0.0578
+- Rouge1: 74.2613
+- Rouge2: 58.7063
+- Rougel: 63.9504
+- Rougelsum: 64.1404
 ## Model description
 | Training Loss | Epoch | Step | Validation Loss | Rouge1  | Rouge2  | Rougel  | Rougelsum |
 |:-------------:|:-----:|:----:|:---------------:|:-------:|:-------:|:-------:|:---------:|
+| 0.8985        | 1.0   | 48   | 0.6541          | 46.8501 | 29.7327 | 36.488  | 36.5549   |
+| 0.6225        | 2.0   | 96   | 0.5766          | 53.306  | 34.1262 | 40.0055 | 39.8306   |
+| 0.5508        | 3.0   | 144  | 0.5222          | 55.9759 | 36.614  | 41.5281 | 41.4843   |
+| 0.4963        | 4.0   | 192  | 0.4711          | 57.6183 | 37.4078 | 42.6881 | 42.7515   |
+| 0.4517        | 5.0   | 240  | 0.4193          | 59.2425 | 39.9758 | 42.3079 | 42.2173   |
+| 0.4021        | 6.0   | 288  | 0.3792          | 59.5026 | 41.3313 | 46.1961 | 46.0462   |
+| 0.3672        | 7.0   | 336  | 0.3145          | 62.5542 | 44.3172 | 48.4545 | 48.421    |
+| 0.3153        | 8.0   | 384  | 0.2816          | 63.8301 | 46.3536 | 50.2103 | 50.1203   |
+| 0.268         | 9.0   | 432  | 0.2598          | 64.191  | 47.4322 | 51.7505 | 51.8051   |
+| 0.2159        | 10.0  | 480  | 0.2041          | 67.4345 | 49.7921 | 53.84   | 53.9574   |
+| 0.1714        | 11.0  | 528  | 0.1416          | 68.2944 | 51.3248 | 56.1006 | 56.0528   |
+| 0.1257        | 12.0  | 576  | 0.0961          | 69.7701 | 53.5417 | 58.2727 | 58.2473   |
+| 0.0991        | 13.0  | 624  | 0.0717          | 69.9164 | 53.6164 | 59.4382 | 59.518    |
+| 0.0699        | 14.0  | 672  | 0.0675          | 71.3498 | 55.64   | 60.2844 | 60.4973   |
+| 0.0526        | 15.0  | 720  | 0.0814          | 72.2287 | 56.8939 | 60.9719 | 61.2308   |
+| 0.0408        | 16.0  | 768  | 0.0843          | 71.7777 | 57.1413 | 62.0411 | 61.9723   |
+| 0.0315        | 17.0  | 816  | 0.0525          | 72.5746 | 57.5505 | 61.6754 | 61.8729   |
+| 0.0237        | 18.0  | 864  | 0.0542          | 72.0154 | 56.9233 | 61.3044 | 61.4721   |
+| 0.0187        | 19.0  | 912  | 0.0573          | 73.4681 | 58.9845 | 64.4143 | 64.5341   |
+| 0.0157        | 20.0  | 960  | 0.0578          | 74.2613 | 58.7063 | 63.9504 | 64.1404   |
 ### Framework versions
+- Transformers 4.38.2
 - Pytorch 2.2.1+cu121
+- Datasets 2.18.0
 - Tokenizers 0.15.2

generation_config.json CHANGED Viewed

@@ -11,6 +11,6 @@
   "no_repeat_ngram_size": 3,
   "num_beams": 4,
   "pad_token_id": 1,
-  "transformers_version": "4.38.1",
   "use_cache": false
 }

   "no_repeat_ngram_size": 3,
   "num_beams": 4,
   "pad_token_id": 1,
+  "transformers_version": "4.38.2",
   "use_cache": false
 }

model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:79fa868daae8436be0192301e5e518138d1a53dcc4ee3a471329564c4cd91bc7
 size 1625422896

 version https://git-lfs.github.com/spec/v1
+oid sha256:7db749339e3eba6473fe0e4672709f1218c37429aa6d0b0d9d495d6ce5f67f16
 size 1625422896

runs/Mar02_15-57-52_n5qclzvvia/events.out.tfevents.1709395492.n5qclzvvia.213.0 CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:6cf735aa5f4ded44b867d5e21ac41e24914cab4cd56e92289a0122936d4619fd
-size 12620

 version https://git-lfs.github.com/spec/v1
+oid sha256:64e0004e3086e5bdff91d37da134bcb14b122d0dd0a77bc1ac6bed5eef25c4bf
+size 19824

runs/Mar02_15-57-52_n5qclzvvia/events.out.tfevents.1709398863.n5qclzvvia.213.1 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:985ded8332d2a6d41626edbba407b8f7b5d029ffd91b7020be355ffcb1d9a196
+size 514