End of training

Browse files

Files changed (6) hide show

README.md +41 -41
config.json +2 -2
model.safetensors +2 -2
runs/Mar04_10-20-52_987e769f7287/events.out.tfevents.1709547652.987e769f7287.502.1 +3 -0
tokenizer.json +37 -36
training_args.bin +1 -1

README.md CHANGED Viewed

@@ -13,7 +13,7 @@ should probably proofread and complete it, then remove this comment. -->
 This model is a fine-tuned version of [](https://huggingface.co/) on the None dataset.
 It achieves the following results on the evaluation set:
-- Loss: 0.5972
 ## Model description
@@ -45,46 +45,46 @@ The following hyperparameters were used during training:
 | Training Loss | Epoch | Step | Validation Loss |
 |:-------------:|:-----:|:----:|:---------------:|
-| 3.7046        | 1.0   | 6    | 3.1566          |
-| 2.7296        | 2.0   | 12   | 2.2354          |
-| 1.97          | 3.0   | 18   | 1.7402          |
-| 1.6522        | 4.0   | 24   | 1.6050          |
-| 1.5915        | 5.0   | 30   | 1.5117          |
-| 1.497         | 6.0   | 36   | 1.4859          |
-| 1.4994        | 7.0   | 42   | 1.4515          |
-| 1.4372        | 8.0   | 48   | 1.4207          |
-| 1.4099        | 9.0   | 54   | 1.3809          |
-| 1.37          | 10.0  | 60   | 1.3981          |
-| 1.3361        | 11.0  | 66   | 1.2905          |
-| 1.2942        | 12.0  | 72   | 1.2986          |
-| 1.2437        | 13.0  | 78   | 1.2145          |
-| 1.18          | 14.0  | 84   | 1.1069          |
-| 1.0947        | 15.0  | 90   | 1.0619          |
-| 1.0435        | 16.0  | 96   | 0.9873          |
-| 0.9961        | 17.0  | 102  | 0.9470          |
-| 0.9408        | 18.0  | 108  | 0.9126          |
-| 0.9119        | 19.0  | 114  | 0.9238          |
-| 0.9158        | 20.0  | 120  | 0.8937          |
-| 0.8981        | 21.0  | 126  | 0.8486          |
-| 0.862         | 22.0  | 132  | 0.8756          |
-| 0.8577        | 23.0  | 138  | 0.8344          |
-| 0.8243        | 24.0  | 144  | 0.8168          |
-| 0.8018        | 25.0  | 150  | 0.7711          |
-| 0.7861        | 26.0  | 156  | 0.7986          |
-| 0.7838        | 27.0  | 162  | 0.7765          |
-| 0.7753        | 28.0  | 168  | 0.7504          |
-| 0.7602        | 29.0  | 174  | 0.7205          |
-| 0.7215        | 30.0  | 180  | 0.7216          |
-| 0.7148        | 31.0  | 186  | 0.6973          |
-| 0.7082        | 32.0  | 192  | 0.6753          |
-| 0.7017        | 33.0  | 198  | 0.6480          |
-| 0.6784        | 34.0  | 204  | 0.6394          |
-| 0.6702        | 35.0  | 210  | 0.6333          |
-| 0.6663        | 36.0  | 216  | 0.6221          |
-| 0.6415        | 37.0  | 222  | 0.6133          |
-| 0.6377        | 38.0  | 228  | 0.6065          |
-| 0.6291        | 39.0  | 234  | 0.6049          |
-| 0.6288        | 40.0  | 240  | 0.5972          |
 ### Framework versions

 This model is a fine-tuned version of [](https://huggingface.co/) on the None dataset.
 It achieves the following results on the evaluation set:
+- Loss: 0.1417
 ## Model description
 | Training Loss | Epoch | Step | Validation Loss |
 |:-------------:|:-----:|:----:|:---------------:|
+| 2.9571        | 1.0   | 6    | 2.2956          |
+| 2.0465        | 2.0   | 12   | 1.7293          |
+| 1.5363        | 3.0   | 18   | 1.2901          |
+| 1.2139        | 4.0   | 24   | 1.0866          |
+| 1.0369        | 5.0   | 30   | 0.9429          |
+| 0.9144        | 6.0   | 36   | 0.8284          |
+| 0.8202        | 7.0   | 42   | 0.7701          |
+| 0.7591        | 8.0   | 48   | 0.7184          |
+| 0.7075        | 9.0   | 54   | 0.6474          |
+| 0.6481        | 10.0  | 60   | 0.6074          |
+| 0.611         | 11.0  | 66   | 0.5786          |
+| 0.5714        | 12.0  | 72   | 0.5192          |
+| 0.5412        | 13.0  | 78   | 0.4924          |
+| 0.5092        | 14.0  | 84   | 0.5077          |
+| 0.5118        | 15.0  | 90   | 0.4989          |
+| 0.4982        | 16.0  | 96   | 0.4349          |
+| 0.4512        | 17.0  | 102  | 0.4090          |
+| 0.4176        | 18.0  | 108  | 0.3868          |
+| 0.395         | 19.0  | 114  | 0.3586          |
+| 0.3754        | 20.0  | 120  | 0.3666          |
+| 0.3561        | 21.0  | 126  | 0.3182          |
+| 0.3284        | 22.0  | 132  | 0.2906          |
+| 0.3123        | 23.0  | 138  | 0.2981          |
+| 0.3026        | 24.0  | 144  | 0.2740          |
+| 0.2809        | 25.0  | 150  | 0.2448          |
+| 0.2669        | 26.0  | 156  | 0.2321          |
+| 0.257         | 27.0  | 162  | 0.2179          |
+| 0.2349        | 28.0  | 168  | 0.2110          |
+| 0.2205        | 29.0  | 174  | 0.1969          |
+| 0.2142        | 30.0  | 180  | 0.1894          |
+| 0.2116        | 31.0  | 186  | 0.1819          |
+| 0.195         | 32.0  | 192  | 0.1747          |
+| 0.1884        | 33.0  | 198  | 0.1668          |
+| 0.1819        | 34.0  | 204  | 0.1615          |
+| 0.1741        | 35.0  | 210  | 0.1541          |
+| 0.172         | 36.0  | 216  | 0.1524          |
+| 0.1726        | 37.0  | 222  | 0.1471          |
+| 0.1555        | 38.0  | 228  | 0.1458          |
+| 0.1606        | 39.0  | 234  | 0.1430          |
+| 0.1604        | 40.0  | 240  | 0.1417          |
 ### Framework versions

config.json CHANGED Viewed

@@ -78,7 +78,7 @@
     "typical_p": 1.0,
     "use_bfloat16": false,
     "use_cache": true,
-    "vocab_size": 52
   },
   "decoder_start_token_id": 2,
   "encoder": {
@@ -157,7 +157,7 @@
     "typical_p": 1.0,
     "use_bfloat16": false,
     "use_cache": true,
-    "vocab_size": 52
   },
   "eos_token_id": 0,
   "is_encoder_decoder": true,

     "typical_p": 1.0,
     "use_bfloat16": false,
     "use_cache": true,
+    "vocab_size": 53
   },
   "decoder_start_token_id": 2,
   "encoder": {
     "typical_p": 1.0,
     "use_bfloat16": false,
     "use_cache": true,
+    "vocab_size": 53
   },
   "eos_token_id": 0,
   "is_encoder_decoder": true,

model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:9eac9568032de2353e7afc4f6f8f5d2e1848d85b29492cda36c36b04f968e5e8
-size 31205552

 version https://git-lfs.github.com/spec/v1
+oid sha256:20adbf651b3249c3a50b9a2faa1eb49f74f3190f9ebed2ea62b13f2ddd8ecad3
+size 31207604

runs/Mar04_10-20-52_987e769f7287/events.out.tfevents.1709547652.987e769f7287.502.1 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:1ead38571a6e417f1e74a464fe96259523464eaa883a883ab43d325d734dfad4
+size 27996

tokenizer.json CHANGED Viewed

@@ -112,48 +112,49 @@
       "7": 13,
       "8": 14,
       "9": 15,
-      "99": 16,
       "10": 17,
-      "11": 18,
       "98": 19,
-      "97": 20,
-      "12": 21,
-      "96": 22,
-      "13": 23,
-      "95": 24,
-      "14": 25,
-      "94": 26,
-      "15": 27,
-      "93": 28,
-      "16": 29,
-      "17": 30,
-      "92": 31,
-      "91": 32,
       "18": 33,
-      "90": 34,
-      "19": 35,
-      "89": 36,
       "20": 37,
-      "21": 38,
-      "88": 39,
-      "22": 40,
       "87": 41,
-      "86": 42,
       "23": 43,
-      "24": 44,
       "85": 45,
-      "25": 46,
-      "84": 47,
-      "83": 48,
-      "26": 49,
-      "27": 50,
-      "82": 51
     },
     "merges": [
-      "9 9",
       "1 0",
-      "1 1",
       "9 8",
       "9 7",
       "1 2",
       "9 6",
@@ -166,20 +167,20 @@
       "1 6",
       "1 7",
       "9 2",
-      "9 1",
       "1 8",
       "9 0",
       "1 9",
-      "8 9",
       "2 0",
       "2 1",
       "8 8",
-      "2 2",
       "8 7",
-      "8 6",
       "2 3",
-      "2 4",
       "8 5",
       "2 5",
       "8 4",
       "8 3",

       "7": 13,
       "8": 14,
       "9": 15,
+      "=": 16,
       "10": 17,
+      "99": 18,
       "98": 19,
+      "11": 20,
+      "97": 21,
+      "12": 22,
+      "96": 23,
+      "13": 24,
+      "95": 25,
+      "14": 26,
+      "94": 27,
+      "15": 28,
+      "93": 29,
+      "16": 30,
+      "17": 31,
+      "92": 32,
       "18": 33,
+      "91": 34,
+      "90": 35,
+      "19": 36,
       "20": 37,
+      "89": 38,
+      "21": 39,
+      "88": 40,
       "87": 41,
+      "22": 42,
       "23": 43,
+      "86": 44,
       "85": 45,
+      "24": 46,
+      "25": 47,
+      "84": 48,
+      "83": 49,
+      "26": 50,
+      "27": 51,
+      "82": 52
     },
     "merges": [
       "1 0",
+      "9 9",
       "9 8",
+      "1 1",
       "9 7",
       "1 2",
       "9 6",
       "1 6",
       "1 7",
       "9 2",
       "1 8",
+      "9 1",
       "9 0",
       "1 9",
       "2 0",
+      "8 9",
       "2 1",
       "8 8",
       "8 7",
+      "2 2",
       "2 3",
+      "8 6",
       "8 5",
+      "2 4",
       "2 5",
       "8 4",
       "8 3",

training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:fedc787b6585fe2f23741e21340cab6af289ea7ab373c0de387fd4de169db266
 size 5112

 version https://git-lfs.github.com/spec/v1
+oid sha256:4845741ab1a3479bc072df5105c0b7150f8aee2c76da05c97488950d259a6c8a
 size 5112