End of training

Browse files

Files changed (6) hide show

README.md +41 -41
config.json +2 -2
model.safetensors +2 -2
runs/Mar10_16-27-55_d0c17e360eb0/events.out.tfevents.1710088076.d0c17e360eb0.144.0 +3 -0
tokenizer.json +37 -36
training_args.bin +1 -1

README.md CHANGED Viewed

@@ -13,7 +13,7 @@ should probably proofread and complete it, then remove this comment. -->
 This model is a fine-tuned version of [](https://huggingface.co/) on the None dataset.
 It achieves the following results on the evaluation set:
-- Loss: 0.8874
 ## Model description
@@ -44,46 +44,46 @@ The following hyperparameters were used during training:
 | Training Loss | Epoch | Step | Validation Loss |
 |:-------------:|:-----:|:----:|:---------------:|
-| 3.3675        | 1.0   | 6    | 2.7074          |
-| 2.3683        | 2.0   | 12   | 1.9388          |
-| 1.8247        | 3.0   | 18   | 1.6651          |
-| 1.6383        | 4.0   | 24   | 1.5641          |
-| 1.5856        | 5.0   | 30   | 1.5378          |
-| 1.5526        | 6.0   | 36   | 1.5271          |
-| 1.5412        | 7.0   | 42   | 1.5342          |
-| 1.5522        | 8.0   | 48   | 1.5284          |
-| 1.5412        | 9.0   | 54   | 1.5417          |
-| 1.5399        | 10.0  | 60   | 1.5179          |
-| 1.5359        | 11.0  | 66   | 1.5177          |
-| 1.5109        | 12.0  | 72   | 1.5163          |
-| 1.5186        | 13.0  | 78   | 1.5135          |
-| 1.5322        | 14.0  | 84   | 1.5068          |
-| 1.5102        | 15.0  | 90   | 1.4860          |
-| 1.4963        | 16.0  | 96   | 1.4628          |
-| 1.4525        | 17.0  | 102  | 1.4343          |
-| 1.4217        | 18.0  | 108  | 1.4009          |
-| 1.3893        | 19.0  | 114  | 1.4014          |
-| 1.3816        | 20.0  | 120  | 1.3321          |
-| 1.3374        | 21.0  | 126  | 1.3043          |
-| 1.3131        | 22.0  | 132  | 1.3202          |
-| 1.3057        | 23.0  | 138  | 1.2499          |
-| 1.3516        | 24.0  | 144  | 1.2650          |
-| 1.2694        | 25.0  | 150  | 1.2313          |
-| 1.2187        | 26.0  | 156  | 1.1643          |
-| 1.1725        | 27.0  | 162  | 1.1295          |
-| 1.1283        | 28.0  | 168  | 1.0800          |
-| 1.0868        | 29.0  | 174  | 1.0535          |
-| 1.0771        | 30.0  | 180  | 1.0376          |
-| 1.0544        | 31.0  | 186  | 0.9880          |
-| 1.0181        | 32.0  | 192  | 0.9862          |
-| 1.0028        | 33.0  | 198  | 0.9744          |
-| 0.9996        | 34.0  | 204  | 0.9485          |
-| 0.9772        | 35.0  | 210  | 0.9270          |
-| 0.9558        | 36.0  | 216  | 0.9156          |
-| 0.9753        | 37.0  | 222  | 0.9040          |
-| 0.9376        | 38.0  | 228  | 0.8955          |
-| 0.9316        | 39.0  | 234  | 0.8908          |
-| 0.9245        | 40.0  | 240  | 0.8874          |
 ### Framework versions

 This model is a fine-tuned version of [](https://huggingface.co/) on the None dataset.
 It achieves the following results on the evaluation set:
+- Loss: 0.7222
 ## Model description
 | Training Loss | Epoch | Step | Validation Loss |
 |:-------------:|:-----:|:----:|:---------------:|
+| 3.4163        | 1.0   | 6    | 2.8253          |
+| 2.463         | 2.0   | 12   | 2.0984          |
+| 1.8832        | 3.0   | 18   | 1.7286          |
+| 1.6613        | 4.0   | 24   | 1.6379          |
+| 1.5863        | 5.0   | 30   | 1.5767          |
+| 1.5021        | 6.0   | 36   | 1.5366          |
+| 1.4813        | 7.0   | 42   | 1.5000          |
+| 1.4805        | 8.0   | 48   | 1.4118          |
+| 1.4184        | 9.0   | 54   | 1.4590          |
+| 1.3594        | 10.0  | 60   | 1.3815          |
+| 1.3154        | 11.0  | 66   | 1.3336          |
+| 1.3036        | 12.0  | 72   | 1.3426          |
+| 1.2467        | 13.0  | 78   | 1.2566          |
+| 1.1995        | 14.0  | 84   | 1.1788          |
+| 1.1292        | 15.0  | 90   | 1.1819          |
+| 1.1157        | 16.0  | 96   | 1.1389          |
+| 1.1397        | 17.0  | 102  | 1.0924          |
+| 1.1128        | 18.0  | 108  | 1.0831          |
+| 1.0476        | 19.0  | 114  | 1.0312          |
+| 1.0193        | 20.0  | 120  | 0.9820          |
+| 1.0701        | 21.0  | 126  | 0.9712          |
+| 0.9618        | 22.0  | 132  | 0.9326          |
+| 0.9227        | 23.0  | 138  | 0.9335          |
+| 0.9399        | 24.0  | 144  | 0.9046          |
+| 0.9318        | 25.0  | 150  | 0.8951          |
+| 0.9068        | 26.0  | 156  | 0.8831          |
+| 0.8687        | 27.0  | 162  | 0.8611          |
+| 0.848         | 28.0  | 168  | 0.8884          |
+| 0.8559        | 29.0  | 174  | 0.8844          |
+| 0.8439        | 30.0  | 180  | 0.8729          |
+| 0.8453        | 31.0  | 186  | 0.8323          |
+| 0.8154        | 32.0  | 192  | 0.8130          |
+| 0.788         | 33.0  | 198  | 0.8038          |
+| 0.7912        | 34.0  | 204  | 0.7717          |
+| 0.7823        | 35.0  | 210  | 0.7539          |
+| 0.7658        | 36.0  | 216  | 0.7556          |
+| 0.7617        | 37.0  | 222  | 0.7427          |
+| 0.7396        | 38.0  | 228  | 0.7340          |
+| 0.7621        | 39.0  | 234  | 0.7243          |
+| 0.7324        | 40.0  | 240  | 0.7222          |
 ### Framework versions

config.json CHANGED Viewed

@@ -78,7 +78,7 @@
     "typical_p": 1.0,
     "use_bfloat16": false,
     "use_cache": true,
-    "vocab_size": 52
   },
   "decoder_start_token_id": 2,
   "encoder": {
@@ -157,7 +157,7 @@
     "typical_p": 1.0,
     "use_bfloat16": false,
     "use_cache": true,
-    "vocab_size": 52
   },
   "eos_token_id": 0,
   "is_encoder_decoder": true,

     "typical_p": 1.0,
     "use_bfloat16": false,
     "use_cache": true,
+    "vocab_size": 53
   },
   "decoder_start_token_id": 2,
   "encoder": {
     "typical_p": 1.0,
     "use_bfloat16": false,
     "use_cache": true,
+    "vocab_size": 53
   },
   "eos_token_id": 0,
   "is_encoder_decoder": true,

model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:1c9cbe57dec03a2cdebb1dfd92343bc89e7f8de32f9c29fa852c65e6c2158af3
-size 31205552

 version https://git-lfs.github.com/spec/v1
+oid sha256:bc57d279b06577aa2908f9dd05e1c0a37e545c42dfedfbfe914fbce02ba8d9a0
+size 31207604

runs/Mar10_16-27-55_d0c17e360eb0/events.out.tfevents.1710088076.d0c17e360eb0.144.0 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:6e2fe3cf1f9f4e21e904a0032a462fcc4b12a6a4d85c4d6de997054ffa092ca5
+size 27997

tokenizer.json CHANGED Viewed

@@ -112,74 +112,75 @@
       "7": 13,
       "8": 14,
       "9": 15,
-      "99": 16,
       "10": 17,
-      "11": 18,
       "98": 19,
-      "12": 20,
-      "97": 21,
-      "96": 22,
       "13": 23,
-      "95": 24,
-      "14": 25,
-      "15": 26,
-      "94": 27,
-      "16": 28,
       "93": 29,
-      "17": 30,
       "92": 31,
-      "91": 32,
       "18": 33,
-      "19": 34,
-      "90": 35,
-      "20": 36,
       "89": 37,
-      "21": 38,
-      "88": 39,
-      "87": 40,
       "22": 41,
-      "86": 42,
       "23": 43,
-      "24": 44,
       "85": 45,
-      "25": 46,
-      "84": 47,
-      "26": 48,
-      "83": 49,
-      "27": 50,
-      "82": 51
     },
     "merges": [
-      "9 9",
       "1 0",
-      "1 1",
       "9 8",
       "1 2",
       "9 7",
-      "9 6",
       "1 3",
       "9 5",
       "1 4",
       "1 5",
       "9 4",
-      "1 6",
       "9 3",
-      "1 7",
       "9 2",
-      "9 1",
       "1 8",
       "1 9",
       "9 0",
-      "2 0",
       "8 9",
       "2 1",
       "8 8",
-      "8 7",
       "2 2",
-      "8 6",
       "2 3",
-      "2 4",
       "8 5",
       "2 5",
       "8 4",
       "2 6",

       "7": 13,
       "8": 14,
       "9": 15,
+      "=": 16,
       "10": 17,
+      "99": 18,
       "98": 19,
+      "11": 20,
+      "12": 21,
+      "97": 22,
       "13": 23,
+      "96": 24,
+      "95": 25,
+      "14": 26,
+      "15": 27,
+      "94": 28,
       "93": 29,
+      "16": 30,
       "92": 31,
+      "17": 32,
       "18": 33,
+      "91": 34,
+      "19": 35,
+      "90": 36,
       "89": 37,
+      "20": 38,
+      "21": 39,
+      "88": 40,
       "22": 41,
+      "87": 42,
       "23": 43,
+      "86": 44,
       "85": 45,
+      "24": 46,
+      "25": 47,
+      "84": 48,
+      "26": 49,
+      "83": 50,
+      "27": 51,
+      "82": 52
     },
     "merges": [
       "1 0",
+      "9 9",
       "9 8",
+      "1 1",
       "1 2",
       "9 7",
       "1 3",
+      "9 6",
       "9 5",
       "1 4",
       "1 5",
       "9 4",
       "9 3",
+      "1 6",
       "9 2",
+      "1 7",
       "1 8",
+      "9 1",
       "1 9",
       "9 0",
       "8 9",
+      "2 0",
       "2 1",
       "8 8",
       "2 2",
+      "8 7",
       "2 3",
+      "8 6",
       "8 5",
+      "2 4",
       "2 5",
       "8 4",
       "2 6",

training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:602ea3edb6ceefe1ca334d445fc0878db980705f84b80cf789f2af12cf5fe19b
 size 5112

 version https://git-lfs.github.com/spec/v1
+oid sha256:75c1cce945c5e65e2211dc0e5e08cf478ae72fd3da7322dd5486bca7af05174f
 size 5112