End of training

Browse files

Files changed (6) hide show

README.md +41 -41
config.json +2 -2
model.safetensors +2 -2
runs/Mar04_14-41-47_7c339ad63e68/events.out.tfevents.1709563307.7c339ad63e68.836.2 +3 -0
tokenizer.json +59 -35
training_args.bin +1 -1

README.md CHANGED Viewed

@@ -13,7 +13,7 @@ should probably proofread and complete it, then remove this comment. -->
 This model is a fine-tuned version of [](https://huggingface.co/) on the None dataset.
 It achieves the following results on the evaluation set:
-- Loss: 0.0914
 ## Model description
@@ -44,46 +44,46 @@ The following hyperparameters were used during training:
 | Training Loss | Epoch | Step | Validation Loss |
 |:-------------:|:-----:|:----:|:---------------:|
-| 2.9231        | 1.0   | 6    | 2.2571          |
-| 2.0141        | 2.0   | 12   | 1.6996          |
-| 1.5309        | 3.0   | 18   | 1.2998          |
-| 1.1976        | 4.0   | 24   | 1.0513          |
-| 1.0164        | 5.0   | 30   | 0.9962          |
-| 0.9314        | 6.0   | 36   | 0.8360          |
-| 0.8189        | 7.0   | 42   | 0.7625          |
-| 0.7377        | 8.0   | 48   | 0.6906          |
-| 0.6797        | 9.0   | 54   | 0.6286          |
-| 0.6326        | 10.0  | 60   | 0.6023          |
-| 0.6027        | 11.0  | 66   | 0.5696          |
-| 0.5668        | 12.0  | 72   | 0.5291          |
-| 0.5397        | 13.0  | 78   | 0.5183          |
-| 0.5151        | 14.0  | 84   | 0.4830          |
-| 0.4827        | 15.0  | 90   | 0.4806          |
-| 0.471         | 16.0  | 96   | 0.4802          |
-| 0.472         | 17.0  | 102  | 0.4500          |
-| 0.4374        | 18.0  | 108  | 0.4284          |
-| 0.4336        | 19.0  | 114  | 0.3807          |
-| 0.3985        | 20.0  | 120  | 0.3672          |
-| 0.38          | 21.0  | 126  | 0.3423          |
-| 0.3577        | 22.0  | 132  | 0.3290          |
-| 0.3397        | 23.0  | 138  | 0.2871          |
-| 0.3092        | 24.0  | 144  | 0.2936          |
-| 0.3086        | 25.0  | 150  | 0.2556          |
-| 0.2831        | 26.0  | 156  | 0.2386          |
-| 0.2589        | 27.0  | 162  | 0.2183          |
-| 0.2458        | 28.0  | 168  | 0.2022          |
-| 0.2312        | 29.0  | 174  | 0.1880          |
-| 0.2213        | 30.0  | 180  | 0.1704          |
-| 0.2023        | 31.0  | 186  | 0.1577          |
-| 0.1948        | 32.0  | 192  | 0.1401          |
-| 0.1776        | 33.0  | 198  | 0.1287          |
-| 0.1645        | 34.0  | 204  | 0.1158          |
-| 0.1569        | 35.0  | 210  | 0.1128          |
-| 0.1495        | 36.0  | 216  | 0.1032          |
-| 0.1435        | 37.0  | 222  | 0.0988          |
-| 0.1364        | 38.0  | 228  | 0.0972          |
-| 0.138         | 39.0  | 234  | 0.0930          |
-| 0.1294        | 40.0  | 240  | 0.0914          |
 ### Framework versions

 This model is a fine-tuned version of [](https://huggingface.co/) on the None dataset.
 It achieves the following results on the evaluation set:
+- Loss: 0.0095
 ## Model description
 | Training Loss | Epoch | Step | Validation Loss |
 |:-------------:|:-----:|:----:|:---------------:|
+| 2.4753        | 1.0   | 13   | 1.7336          |
+| 1.3843        | 2.0   | 26   | 0.9380          |
+| 0.8281        | 3.0   | 39   | 0.7141          |
+| 0.6509        | 4.0   | 52   | 0.5507          |
+| 0.5643        | 5.0   | 65   | 0.5065          |
+| 0.5155        | 6.0   | 78   | 0.4642          |
+| 0.445         | 7.0   | 91   | 0.3848          |
+| 0.3912        | 8.0   | 104  | 0.3584          |
+| 0.3564        | 9.0   | 117  | 0.3142          |
+| 0.3175        | 10.0  | 130  | 0.2663          |
+| 0.2765        | 11.0  | 143  | 0.2291          |
+| 0.2436        | 12.0  | 156  | 0.1915          |
+| 0.2186        | 13.0  | 169  | 0.1556          |
+| 0.1646        | 14.0  | 182  | 0.1097          |
+| 0.1504        | 15.0  | 195  | 0.0862          |
+| 0.113         | 16.0  | 208  | 0.0725          |
+| 0.0864        | 17.0  | 221  | 0.0500          |
+| 0.0722        | 18.0  | 234  | 0.0425          |
+| 0.0654        | 19.0  | 247  | 0.0389          |
+| 0.0581        | 20.0  | 260  | 0.0312          |
+| 0.052         | 21.0  | 273  | 0.0284          |
+| 0.0459        | 22.0  | 286  | 0.0275          |
+| 0.0426        | 23.0  | 299  | 0.0213          |
+| 0.0381        | 24.0  | 312  | 0.0200          |
+| 0.0374        | 25.0  | 325  | 0.0186          |
+| 0.0334        | 26.0  | 338  | 0.0185          |
+| 0.0307        | 27.0  | 351  | 0.0157          |
+| 0.0292        | 28.0  | 364  | 0.0147          |
+| 0.0269        | 29.0  | 377  | 0.0146          |
+| 0.0261        | 30.0  | 390  | 0.0129          |
+| 0.0248        | 31.0  | 403  | 0.0121          |
+| 0.0237        | 32.0  | 416  | 0.0114          |
+| 0.023         | 33.0  | 429  | 0.0115          |
+| 0.0217        | 34.0  | 442  | 0.0109          |
+| 0.0208        | 35.0  | 455  | 0.0101          |
+| 0.0205        | 36.0  | 468  | 0.0102          |
+| 0.0197        | 37.0  | 481  | 0.0098          |
+| 0.0193        | 38.0  | 494  | 0.0096          |
+| 0.019         | 39.0  | 507  | 0.0094          |
+| 0.0188        | 40.0  | 520  | 0.0095          |
 ### Framework versions

config.json CHANGED Viewed

@@ -78,7 +78,7 @@
     "typical_p": 1.0,
     "use_bfloat16": false,
     "use_cache": true,
-    "vocab_size": 53
   },
   "decoder_start_token_id": 2,
   "encoder": {
@@ -157,7 +157,7 @@
     "typical_p": 1.0,
     "use_bfloat16": false,
     "use_cache": true,
-    "vocab_size": 53
   },
   "eos_token_id": 0,
   "is_encoder_decoder": true,

     "typical_p": 1.0,
     "use_bfloat16": false,
     "use_cache": true,
+    "vocab_size": 65
   },
   "decoder_start_token_id": 2,
   "encoder": {
     "typical_p": 1.0,
     "use_bfloat16": false,
     "use_cache": true,
+    "vocab_size": 65
   },
   "eos_token_id": 0,
   "is_encoder_decoder": true,

model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:bf444c542344de4bd3ed82e5f1b260d744fe2e6768426188c5c9199301fd7001
-size 31207604

 version https://git-lfs.github.com/spec/v1
+oid sha256:ee0f55fb90d9fd389a3b662334a8cbb4c01e631d10f9d6d5ea1f15d5829b53f3
+size 31232228

runs/Mar04_14-41-47_7c339ad63e68/events.out.tfevents.1709563307.7c339ad63e68.836.2 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:4d1fb29e230fb7e056268a0bcaf839a9c640923c3e3a3a082568bdf4acdfb72e
+size 28105

tokenizer.json CHANGED Viewed

@@ -113,80 +113,104 @@
       "8": 14,
       "9": 15,
       "=": 16,
-      "10": 17,
-      "99": 18,
       "98": 19,
       "11": 20,
-      "97": 21,
-      "12": 22,
       "96": 23,
       "13": 24,
       "95": 25,
       "14": 26,
-      "94": 27,
-      "15": 28,
-      "93": 29,
-      "16": 30,
       "17": 31,
       "92": 32,
-      "18": 33,
-      "91": 34,
       "90": 35,
       "19": 36,
-      "20": 37,
-      "89": 38,
-      "21": 39,
-      "88": 40,
-      "87": 41,
-      "22": 42,
-      "23": 43,
-      "86": 44,
       "85": 45,
       "24": 46,
-      "25": 47,
-      "84": 48,
-      "83": 49,
-      "26": 50,
       "27": 51,
-      "82": 52
     },
     "merges": [
-      "1 0",
       "9 9",
       "9 8",
       "1 1",
-      "9 7",
       "1 2",
       "9 6",
       "1 3",
       "9 5",
       "1 4",
-      "9 4",
       "1 5",
-      "9 3",
       "1 6",
       "1 7",
       "9 2",
-      "1 8",
       "9 1",
       "9 0",
       "1 9",
-      "2 0",
       "8 9",
-      "2 1",
       "8 8",
-      "8 7",
       "2 2",
-      "2 3",
       "8 6",
       "8 5",
       "2 4",
-      "2 5",
       "8 4",
-      "8 3",
       "2 6",
       "2 7",
-      "8 2"
     ]
   }
 }

       "8": 14,
       "9": 15,
       "=": 16,
+      "99": 17,
+      "10": 18,
       "98": 19,
       "11": 20,
+      "12": 21,
+      "97": 22,
       "96": 23,
       "13": 24,
       "95": 25,
       "14": 26,
+      "15": 27,
+      "94": 28,
+      "16": 29,
+      "93": 30,
       "17": 31,
       "92": 32,
+      "91": 33,
+      "18": 34,
       "90": 35,
       "19": 36,
+      "89": 37,
+      "20": 38,
+      "88": 39,
+      "21": 40,
+      "22": 41,
+      "87": 42,
+      "86": 43,
+      "23": 44,
       "85": 45,
       "24": 46,
+      "84": 47,
+      "25": 48,
+      "26": 49,
+      "83": 50,
       "27": 51,
+      "81": 52,
+      "82": 53,
+      "28": 54,
+      "80": 55,
+      "30": 56,
+      "29": 57,
+      "31": 58,
+      "79": 59,
+      "78": 60,
+      "76": 61,
+      "34": 62,
+      "77": 63,
+      "33": 64
     },
     "merges": [
       "9 9",
+      "1 0",
       "9 8",
       "1 1",
       "1 2",
+      "9 7",
       "9 6",
       "1 3",
       "9 5",
       "1 4",
       "1 5",
+      "9 4",
       "1 6",
+      "9 3",
       "1 7",
       "9 2",
       "9 1",
+      "1 8",
       "9 0",
       "1 9",
       "8 9",
+      "2 0",
       "8 8",
+      "2 1",
       "2 2",
+      "8 7",
       "8 6",
+      "2 3",
       "8 5",
       "2 4",
       "8 4",
+      "2 5",
       "2 6",
+      "8 3",
       "2 7",
+      "8 1",
+      "8 2",
+      "2 8",
+      "8 0",
+      "3 0",
+      "2 9",
+      "3 1",
+      "7 9",
+      "7 8",
+      "7 6",
+      "3 4",
+      "7 7",
+      "3 3"
     ]
   }
 }

training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:7a8d5009d93cc0b28f0827c6753d8c862fb9c99bee9458d4004349b229359acd
 size 5112

 version https://git-lfs.github.com/spec/v1
+oid sha256:540c8fd7baa2c13dbd0184f2ea00a0cd78a6ebf4642173f5ea5924130d2de23a
 size 5112