End of training

Browse files

Files changed (5) hide show

README.md +42 -42
model.safetensors +1 -1
runs/Mar04_14-22-00_dd5a9353f29e/events.out.tfevents.1709562121.dd5a9353f29e.390.0 +3 -0
tokenizer.json +30 -30
training_args.bin +1 -1

README.md CHANGED Viewed

@@ -13,7 +13,7 @@ should probably proofread and complete it, then remove this comment. -->
 This model is a fine-tuned version of [](https://huggingface.co/) on the None dataset.
 It achieves the following results on the evaluation set:
-- Loss: 0.0868
 ## Model description
@@ -44,51 +44,51 @@ The following hyperparameters were used during training:
 | Training Loss | Epoch | Step | Validation Loss |
 |:-------------:|:-----:|:----:|:---------------:|
-| 2.9639        | 1.0   | 6    | 2.2327          |
-| 2.0112        | 2.0   | 12   | 1.7195          |
-| 1.5448        | 3.0   | 18   | 1.3346          |
-| 1.2344        | 4.0   | 24   | 1.1502          |
-| 1.0961        | 5.0   | 30   | 1.0083          |
-| 0.9938        | 6.0   | 36   | 0.9712          |
-| 0.9205        | 7.0   | 42   | 0.8846          |
-| 0.8293        | 8.0   | 48   | 0.7529          |
-| 0.7735        | 9.0   | 54   | 0.7236          |
-| 0.7284        | 10.0  | 60   | 0.7006          |
-| 0.673         | 11.0  | 66   | 0.6580          |
-| 0.6238        | 12.0  | 72   | 0.5931          |
-| 0.5871        | 13.0  | 78   | 0.5475          |
-| 0.548         | 14.0  | 84   | 0.4944          |
-| 0.5           | 15.0  | 90   | 0.4888          |
-| 0.4772        | 16.0  | 96   | 0.4259          |
-| 0.4605        | 17.0  | 102  | 0.4471          |
-| 0.4191        | 18.0  | 108  | 0.3692          |
-| 0.3724        | 19.0  | 114  | 0.3329          |
-| 0.3483        | 20.0  | 120  | 0.3270          |
-| 0.3268        | 21.0  | 126  | 0.2739          |
-| 0.2884        | 22.0  | 132  | 0.2396          |
-| 0.2567        | 23.0  | 138  | 0.2038          |
-| 0.2415        | 24.0  | 144  | 0.2121          |
-| 0.2322        | 25.0  | 150  | 0.1778          |
-| 0.1971        | 26.0  | 156  | 0.1631          |
-| 0.2065        | 27.0  | 162  | 0.1592          |
-| 0.1918        | 28.0  | 168  | 0.1422          |
-| 0.1854        | 29.0  | 174  | 0.1359          |
-| 0.1691        | 30.0  | 180  | 0.1291          |
-| 0.1645        | 31.0  | 186  | 0.1201          |
-| 0.1614        | 32.0  | 192  | 0.1138          |
-| 0.1435        | 33.0  | 198  | 0.1082          |
-| 0.1354        | 34.0  | 204  | 0.1014          |
-| 0.129         | 35.0  | 210  | 0.0956          |
-| 0.1298        | 36.0  | 216  | 0.0971          |
-| 0.1266        | 37.0  | 222  | 0.0916          |
-| 0.1374        | 38.0  | 228  | 0.0919          |
-| 0.1217        | 39.0  | 234  | 0.0882          |
-| 0.1341        | 40.0  | 240  | 0.0868          |
 ### Framework versions
 - Transformers 4.38.1
 - Pytorch 2.1.0+cu121
-- Datasets 2.17.1
 - Tokenizers 0.15.2

 This model is a fine-tuned version of [](https://huggingface.co/) on the None dataset.
 It achieves the following results on the evaluation set:
+- Loss: 0.1268
 ## Model description
 | Training Loss | Epoch | Step | Validation Loss |
 |:-------------:|:-----:|:----:|:---------------:|
+| 2.9786        | 1.0   | 6    | 2.2468          |
+| 2.0116        | 2.0   | 12   | 1.7255          |
+| 1.5628        | 3.0   | 18   | 1.3183          |
+| 1.2273        | 4.0   | 24   | 1.0790          |
+| 1.0219        | 5.0   | 30   | 0.9549          |
+| 0.9147        | 6.0   | 36   | 0.8300          |
+| 0.7993        | 7.0   | 42   | 0.7326          |
+| 0.7256        | 8.0   | 48   | 0.7028          |
+| 0.6677        | 9.0   | 54   | 0.6345          |
+| 0.6369        | 10.0  | 60   | 0.5926          |
+| 0.5883        | 11.0  | 66   | 0.5722          |
+| 0.5506        | 12.0  | 72   | 0.5835          |
+| 0.5504        | 13.0  | 78   | 0.5491          |
+| 0.5232        | 14.0  | 84   | 0.5165          |
+| 0.4977        | 15.0  | 90   | 0.4719          |
+| 0.4754        | 16.0  | 96   | 0.4910          |
+| 0.4706        | 17.0  | 102  | 0.4623          |
+| 0.4659        | 18.0  | 108  | 0.4202          |
+| 0.4186        | 19.0  | 114  | 0.3720          |
+| 0.385         | 20.0  | 120  | 0.3768          |
+| 0.3692        | 21.0  | 126  | 0.3751          |
+| 0.3775        | 22.0  | 132  | 0.3508          |
+| 0.3359        | 23.0  | 138  | 0.3427          |
+| 0.3412        | 24.0  | 144  | 0.3015          |
+| 0.3128        | 25.0  | 150  | 0.2826          |
+| 0.2892        | 26.0  | 156  | 0.2688          |
+| 0.28          | 27.0  | 162  | 0.2512          |
+| 0.2653        | 28.0  | 168  | 0.2385          |
+| 0.255         | 29.0  | 174  | 0.2275          |
+| 0.249         | 30.0  | 180  | 0.2108          |
+| 0.2316        | 31.0  | 186  | 0.1894          |
+| 0.2184        | 32.0  | 192  | 0.1777          |
+| 0.2057        | 33.0  | 198  | 0.1644          |
+| 0.186         | 34.0  | 204  | 0.1527          |
+| 0.1853        | 35.0  | 210  | 0.1484          |
+| 0.1721        | 36.0  | 216  | 0.1380          |
+| 0.165         | 37.0  | 222  | 0.1336          |
+| 0.1544        | 38.0  | 228  | 0.1299          |
+| 0.153         | 39.0  | 234  | 0.1288          |
+| 0.158         | 40.0  | 240  | 0.1268          |
 ### Framework versions
 - Transformers 4.38.1
 - Pytorch 2.1.0+cu121
+- Datasets 2.18.0
 - Tokenizers 0.15.2

model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:4cfbcc16fa186e80c1f30f878cd3491ee3c5e85053511e9589b369a081ced43d
 size 31207604

 version https://git-lfs.github.com/spec/v1
+oid sha256:d909ff86e2efa4695738c107a45410f68e077eeb366d2aabac8780d7ccef7fb7
 size 31207604

runs/Mar04_14-22-00_dd5a9353f29e/events.out.tfevents.1709562121.dd5a9353f29e.390.0 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:b7e61d195923d2ee30420fd83e13a699a6d99b8d418a36407773d038842188d5
+size 27997

tokenizer.json CHANGED Viewed

@@ -113,34 +113,34 @@
       "8": 14,
       "9": 15,
       "=": 16,
-      "99": 17,
-      "10": 18,
-      "98": 19,
-      "11": 20,
-      "97": 21,
-      "12": 22,
-      "96": 23,
-      "13": 24,
-      "95": 25,
-      "14": 26,
       "15": 27,
       "94": 28,
-      "93": 29,
-      "16": 30,
       "92": 31,
       "17": 32,
-      "18": 33,
-      "91": 34,
-      "90": 35,
-      "19": 36,
-      "89": 37,
-      "20": 38,
       "21": 39,
       "88": 40,
       "87": 41,
       "22": 42,
-      "23": 43,
-      "86": 44,
       "24": 45,
       "85": 46,
       "25": 47,
@@ -151,34 +151,34 @@
       "82": 52
     },
     "merges": [
-      "9 9",
       "1 0",
-      "9 8",
       "1 1",
-      "9 7",
       "1 2",
-      "9 6",
       "1 3",
-      "9 5",
       "1 4",
       "1 5",
       "9 4",
-      "9 3",
       "1 6",
       "9 2",
       "1 7",
-      "1 8",
       "9 1",
-      "9 0",
       "1 9",
-      "8 9",
       "2 0",
       "2 1",
       "8 8",
       "8 7",
       "2 2",
-      "2 3",
       "8 6",
       "2 4",
       "8 5",
       "2 5",

       "8": 14,
       "9": 15,
       "=": 16,
+      "10": 17,
+      "99": 18,
+      "11": 19,
+      "98": 20,
+      "12": 21,
+      "97": 22,
+      "13": 23,
+      "96": 24,
+      "14": 25,
+      "95": 26,
       "15": 27,
       "94": 28,
+      "16": 29,
+      "93": 30,
       "92": 31,
       "17": 32,
+      "91": 33,
+      "18": 34,
+      "19": 35,
+      "90": 36,
+      "20": 37,
+      "89": 38,
       "21": 39,
       "88": 40,
       "87": 41,
       "22": 42,
+      "86": 43,
+      "23": 44,
       "24": 45,
       "85": 46,
       "25": 47,
       "82": 52
     },
     "merges": [
       "1 0",
+      "9 9",
       "1 1",
+      "9 8",
       "1 2",
+      "9 7",
       "1 3",
+      "9 6",
       "1 4",
+      "9 5",
       "1 5",
       "9 4",
       "1 6",
+      "9 3",
       "9 2",
       "1 7",
       "9 1",
+      "1 8",
       "1 9",
+      "9 0",
       "2 0",
+      "8 9",
       "2 1",
       "8 8",
       "8 7",
       "2 2",
       "8 6",
+      "2 3",
       "2 4",
       "8 5",
       "2 5",

training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:d8d78e70a07f179c1153d41b5f956272edf46055c23441c484f26204c26026f5
 size 5112

 version https://git-lfs.github.com/spec/v1
+oid sha256:64d1328e59c0d1a44beb0f9d39d3a780e9714faf81159b142113fff9fdd60958
 size 5112