End of training

Browse files

Files changed (6) hide show

README.md +41 -41
config.json +2 -2
model.safetensors +2 -2
runs/Mar04_10-05-24_f9b5e148b874/events.out.tfevents.1709546724.f9b5e148b874.318.1 +3 -0
tokenizer.json +43 -42
training_args.bin +1 -1

README.md CHANGED Viewed

@@ -13,7 +13,7 @@ should probably proofread and complete it, then remove this comment. -->
 This model is a fine-tuned version of [](https://huggingface.co/) on the None dataset.
 It achieves the following results on the evaluation set:
-- Loss: 0.6779
 ## Model description
@@ -44,46 +44,46 @@ The following hyperparameters were used during training:
 | Training Loss | Epoch | Step | Validation Loss |
 |:-------------:|:-----:|:----:|:---------------:|
-| 3.4465        | 1.0   | 6    | 2.8008          |
-| 2.4324        | 2.0   | 12   | 2.0258          |
-| 1.8717        | 3.0   | 18   | 1.7217          |
-| 1.6802        | 4.0   | 24   | 1.6377          |
-| 1.5784        | 5.0   | 30   | 1.5571          |
-| 1.5182        | 6.0   | 36   | 1.5249          |
-| 1.4891        | 7.0   | 42   | 1.5271          |
-| 1.491         | 8.0   | 48   | 1.5028          |
-| 1.4957        | 9.0   | 54   | 1.4941          |
-| 1.4419        | 10.0  | 60   | 1.4593          |
-| 1.4233        | 11.0  | 66   | 1.4681          |
-| 1.4452        | 12.0  | 72   | 1.3954          |
-| 1.3414        | 13.0  | 78   | 1.3100          |
-| 1.2882        | 14.0  | 84   | 1.2658          |
-| 1.2233        | 15.0  | 90   | 1.1740          |
-| 1.1812        | 16.0  | 96   | 1.1963          |
-| 1.1567        | 17.0  | 102  | 1.3220          |
-| 1.1566        | 18.0  | 108  | 1.1536          |
-| 1.0904        | 19.0  | 114  | 1.1253          |
-| 1.0811        | 20.0  | 120  | 1.0386          |
-| 1.0245        | 21.0  | 126  | 1.0415          |
-| 1.0028        | 22.0  | 132  | 0.9741          |
-| 0.9561        | 23.0  | 138  | 0.9236          |
-| 0.9204        | 24.0  | 144  | 0.9070          |
-| 0.9064        | 25.0  | 150  | 0.8667          |
-| 0.8868        | 26.0  | 156  | 0.8357          |
-| 0.8513        | 27.0  | 162  | 0.8124          |
-| 0.8199        | 28.0  | 168  | 0.8041          |
-| 0.7951        | 29.0  | 174  | 0.7810          |
-| 0.8079        | 30.0  | 180  | 0.7692          |
-| 0.7769        | 31.0  | 186  | 0.7839          |
-| 0.782         | 32.0  | 192  | 0.7484          |
-| 0.7378        | 33.0  | 198  | 0.7386          |
-| 0.7591        | 34.0  | 204  | 0.7165          |
-| 0.7269        | 35.0  | 210  | 0.7015          |
-| 0.7163        | 36.0  | 216  | 0.7006          |
-| 0.7231        | 37.0  | 222  | 0.6897          |
-| 0.7088        | 38.0  | 228  | 0.6824          |
-| 0.7067        | 39.0  | 234  | 0.6795          |
-| 0.7004        | 40.0  | 240  | 0.6779          |
 ### Framework versions

 This model is a fine-tuned version of [](https://huggingface.co/) on the None dataset.
 It achieves the following results on the evaluation set:
+- Loss: 0.0923
 ## Model description
 | Training Loss | Epoch | Step | Validation Loss |
 |:-------------:|:-----:|:----:|:---------------:|
+| 3.0524        | 1.0   | 6    | 2.3364          |
+| 2.0601        | 2.0   | 12   | 1.7532          |
+| 1.5868        | 3.0   | 18   | 1.3439          |
+| 1.2198        | 4.0   | 24   | 1.0697          |
+| 1.0324        | 5.0   | 30   | 0.9496          |
+| 0.8954        | 6.0   | 36   | 0.8209          |
+| 0.7853        | 7.0   | 42   | 0.7529          |
+| 0.7118        | 8.0   | 48   | 0.6709          |
+| 0.6574        | 9.0   | 54   | 0.6452          |
+| 0.6368        | 10.0  | 60   | 0.5870          |
+| 0.5746        | 11.0  | 66   | 0.5092          |
+| 0.5092        | 12.0  | 72   | 0.4923          |
+| 0.4829        | 13.0  | 78   | 0.4596          |
+| 0.4542        | 14.0  | 84   | 0.4221          |
+| 0.4286        | 15.0  | 90   | 0.3805          |
+| 0.3987        | 16.0  | 96   | 0.3707          |
+| 0.3704        | 17.0  | 102  | 0.3424          |
+| 0.3639        | 18.0  | 108  | 0.3204          |
+| 0.3297        | 19.0  | 114  | 0.2918          |
+| 0.3085        | 20.0  | 120  | 0.2683          |
+| 0.2814        | 21.0  | 126  | 0.2524          |
+| 0.2667        | 22.0  | 132  | 0.2489          |
+| 0.2593        | 23.0  | 138  | 0.2238          |
+| 0.2427        | 24.0  | 144  | 0.2168          |
+| 0.2318        | 25.0  | 150  | 0.2048          |
+| 0.226         | 26.0  | 156  | 0.2018          |
+| 0.2085        | 27.0  | 162  | 0.1860          |
+| 0.1976        | 28.0  | 168  | 0.1800          |
+| 0.1928        | 29.0  | 174  | 0.1621          |
+| 0.1814        | 30.0  | 180  | 0.1551          |
+| 0.1758        | 31.0  | 186  | 0.1398          |
+| 0.1598        | 32.0  | 192  | 0.1291          |
+| 0.1541        | 33.0  | 198  | 0.1206          |
+| 0.1411        | 34.0  | 204  | 0.1097          |
+| 0.1371        | 35.0  | 210  | 0.1042          |
+| 0.1299        | 36.0  | 216  | 0.1015          |
+| 0.1273        | 37.0  | 222  | 0.0955          |
+| 0.1214        | 38.0  | 228  | 0.0944          |
+| 0.1161        | 39.0  | 234  | 0.0935          |
+| 0.1188        | 40.0  | 240  | 0.0923          |
 ### Framework versions

config.json CHANGED Viewed

@@ -78,7 +78,7 @@
     "typical_p": 1.0,
     "use_bfloat16": false,
     "use_cache": true,
-    "vocab_size": 52
   },
   "decoder_start_token_id": 2,
   "encoder": {
@@ -157,7 +157,7 @@
     "typical_p": 1.0,
     "use_bfloat16": false,
     "use_cache": true,
-    "vocab_size": 52
   },
   "eos_token_id": 0,
   "is_encoder_decoder": true,

     "typical_p": 1.0,
     "use_bfloat16": false,
     "use_cache": true,
+    "vocab_size": 53
   },
   "decoder_start_token_id": 2,
   "encoder": {
     "typical_p": 1.0,
     "use_bfloat16": false,
     "use_cache": true,
+    "vocab_size": 53
   },
   "eos_token_id": 0,
   "is_encoder_decoder": true,

model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:6725a75dc79b2917a840667d5428b4249d91fd36502cfc5e7aa3a967383da036
-size 31205552

 version https://git-lfs.github.com/spec/v1
+oid sha256:ea68d63e33c6aa4e3963c65007072dd91138022c527fb9911e38f90037f0ea1a
+size 31207604

runs/Mar04_10-05-24_f9b5e148b874/events.out.tfevents.1709546724.f9b5e148b874.318.1 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:e1856cb68386e1447ff2eaeb1f817adb39e9e7042877f3c566383d0f3a1f8d47
+size 27997

tokenizer.json CHANGED Viewed

@@ -112,78 +112,79 @@
       "7": 13,
       "8": 14,
       "9": 15,
-      "10": 16,
-      "99": 17,
       "11": 18,
-      "98": 19,
-      "12": 20,
-      "97": 21,
-      "96": 22,
-      "13": 23,
-      "95": 24,
-      "14": 25,
-      "15": 26,
-      "94": 27,
-      "16": 28,
-      "93": 29,
-      "92": 30,
-      "17": 31,
       "18": 32,
-      "91": 33,
-      "19": 34,
       "90": 35,
-      "89": 36,
       "20": 37,
-      "88": 38,
       "21": 39,
-      "22": 40,
       "87": 41,
-      "23": 42,
-      "86": 43,
-      "24": 44,
       "85": 45,
-      "84": 46,
       "25": 47,
-      "26": 48,
       "83": 49,
-      "27": 50,
-      "82": 51
     },
     "merges": [
       "1 0",
-      "9 9",
       "1 1",
-      "9 8",
       "1 2",
-      "9 7",
-      "9 6",
       "1 3",
-      "9 5",
       "1 4",
       "1 5",
-      "9 4",
       "1 6",
-      "9 3",
-      "9 2",
       "1 7",
       "1 8",
       "9 1",
-      "1 9",
       "9 0",
-      "8 9",
       "2 0",
-      "8 8",
       "2 1",
-      "2 2",
       "8 7",
       "2 3",
       "8 6",
-      "2 4",
       "8 5",
-      "8 4",
       "2 5",
-      "2 6",
       "8 3",
       "2 7",
       "8 2"
     ]

       "7": 13,
       "8": 14,
       "9": 15,
+      "=": 16,
+      "10": 17,
       "11": 18,
+      "12": 19,
+      "13": 20,
+      "14": 21,
+      "15": 22,
+      "99": 23,
+      "16": 24,
+      "98": 25,
+      "97": 26,
+      "96": 27,
+      "17": 28,
+      "95": 29,
+      "94": 30,
+      "93": 31,
       "18": 32,
+      "92": 33,
+      "91": 34,
       "90": 35,
+      "19": 36,
       "20": 37,
+      "89": 38,
       "21": 39,
+      "88": 40,
       "87": 41,
+      "22": 42,
+      "23": 43,
+      "86": 44,
       "85": 45,
+      "24": 46,
       "25": 47,
+      "84": 48,
       "83": 49,
+      "26": 50,
+      "27": 51,
+      "82": 52
     },
     "merges": [
       "1 0",
       "1 1",
       "1 2",
       "1 3",
       "1 4",
       "1 5",
+      "9 9",
       "1 6",
+      "9 8",
+      "9 7",
+      "9 6",
       "1 7",
+      "9 5",
+      "9 4",
+      "9 3",
       "1 8",
+      "9 2",
       "9 1",
       "9 0",
+      "1 9",
       "2 0",
+      "8 9",
       "2 1",
+      "8 8",
       "8 7",
+      "2 2",
       "2 3",
       "8 6",
       "8 5",
+      "2 4",
       "2 5",
+      "8 4",
       "8 3",
+      "2 6",
       "2 7",
       "8 2"
     ]

training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:65bd80821cc36b408de2a8706ddb6762183801d3bf3910bb268eb7f7e7c2de7c
 size 5112

 version https://git-lfs.github.com/spec/v1
+oid sha256:4365175f4bd43cb181ceb471649e3c191725217a9b6655f6c931ccfc1f9c9098
 size 5112