End of training

Browse files

Files changed (6) hide show

README.md +41 -41
config.json +2 -2
model.safetensors +2 -2
runs/Mar04_10-20-42_4150c2fa2709/events.out.tfevents.1709547643.4150c2fa2709.151.1 +3 -0
tokenizer.json +37 -36
training_args.bin +1 -1

README.md CHANGED Viewed

@@ -13,7 +13,7 @@ should probably proofread and complete it, then remove this comment. -->
 This model is a fine-tuned version of [](https://huggingface.co/) on the None dataset.
 It achieves the following results on the evaluation set:
-- Loss: 0.8124
 ## Model description
@@ -44,46 +44,46 @@ The following hyperparameters were used during training:
 | Training Loss | Epoch | Step | Validation Loss |
 |:-------------:|:-----:|:----:|:---------------:|
-| 3.3916        | 1.0   | 6    | 2.7549          |
-| 2.4048        | 2.0   | 12   | 1.9876          |
-| 1.8591        | 3.0   | 18   | 1.8948          |
-| 1.6663        | 4.0   | 24   | 1.6188          |
-| 1.586         | 5.0   | 30   | 1.5494          |
-| 1.5053        | 6.0   | 36   | 1.6146          |
-| 1.5878        | 7.0   | 42   | 1.5655          |
-| 1.5183        | 8.0   | 48   | 1.5487          |
-| 1.5695        | 9.0   | 54   | 1.5368          |
-| 1.5206        | 10.0  | 60   | 1.5189          |
-| 1.4748        | 11.0  | 66   | 1.5096          |
-| 1.4616        | 12.0  | 72   | 1.4969          |
-| 1.4502        | 13.0  | 78   | 1.4454          |
-| 1.4039        | 14.0  | 84   | 1.4019          |
-| 1.3864        | 15.0  | 90   | 1.3711          |
-| 1.3878        | 16.0  | 96   | 1.3687          |
-| 1.3034        | 17.0  | 102  | 1.2939          |
-| 1.2768        | 18.0  | 108  | 1.3036          |
-| 1.2649        | 19.0  | 114  | 1.2028          |
-| 1.26          | 20.0  | 120  | 1.1679          |
-| 1.198         | 21.0  | 126  | 1.2472          |
-| 1.1989        | 22.0  | 132  | 1.2993          |
-| 1.2132        | 23.0  | 138  | 1.0975          |
-| 1.1436        | 24.0  | 144  | 1.0720          |
-| 1.0686        | 25.0  | 150  | 1.1057          |
-| 1.0627        | 26.0  | 156  | 1.0181          |
-| 1.0           | 27.0  | 162  | 0.9821          |
-| 1.0395        | 28.0  | 168  | 0.9878          |
-| 0.9847        | 29.0  | 174  | 0.9409          |
-| 0.9655        | 30.0  | 180  | 0.9396          |
-| 0.9791        | 31.0  | 186  | 0.9019          |
-| 0.9318        | 32.0  | 192  | 0.8818          |
-| 0.9103        | 33.0  | 198  | 0.8827          |
-| 0.9049        | 34.0  | 204  | 0.8853          |
-| 0.9553        | 35.0  | 210  | 0.8960          |
-| 0.8924        | 36.0  | 216  | 0.8598          |
-| 0.9028        | 37.0  | 222  | 0.8312          |
-| 0.8601        | 38.0  | 228  | 0.8177          |
-| 0.8744        | 39.0  | 234  | 0.8153          |
-| 0.8442        | 40.0  | 240  | 0.8124          |
 ### Framework versions

 This model is a fine-tuned version of [](https://huggingface.co/) on the None dataset.
 It achieves the following results on the evaluation set:
+- Loss: 0.0824
 ## Model description
 | Training Loss | Epoch | Step | Validation Loss |
 |:-------------:|:-----:|:----:|:---------------:|
+| 2.9085        | 1.0   | 6    | 2.2339          |
+| 1.9955        | 2.0   | 12   | 1.7507          |
+| 1.5891        | 3.0   | 18   | 1.3630          |
+| 1.221         | 4.0   | 24   | 1.0757          |
+| 1.0321        | 5.0   | 30   | 0.9606          |
+| 0.9056        | 6.0   | 36   | 0.8336          |
+| 0.8119        | 7.0   | 42   | 0.7754          |
+| 0.7251        | 8.0   | 48   | 0.7105          |
+| 0.679         | 9.0   | 54   | 0.6689          |
+| 0.6367        | 10.0  | 60   | 0.6193          |
+| 0.5903        | 11.0  | 66   | 0.5498          |
+| 0.5423        | 12.0  | 72   | 0.5078          |
+| 0.5121        | 13.0  | 78   | 0.5079          |
+| 0.4916        | 14.0  | 84   | 0.4614          |
+| 0.4659        | 15.0  | 90   | 0.4271          |
+| 0.4173        | 16.0  | 96   | 0.4071          |
+| 0.3995        | 17.0  | 102  | 0.3885          |
+| 0.3809        | 18.0  | 108  | 0.3586          |
+| 0.3564        | 19.0  | 114  | 0.3231          |
+| 0.3277        | 20.0  | 120  | 0.3317          |
+| 0.3156        | 21.0  | 126  | 0.3146          |
+| 0.3124        | 22.0  | 132  | 0.3063          |
+| 0.2829        | 23.0  | 138  | 0.2604          |
+| 0.2624        | 24.0  | 144  | 0.2385          |
+| 0.2431        | 25.0  | 150  | 0.2421          |
+| 0.23          | 26.0  | 156  | 0.1983          |
+| 0.1995        | 27.0  | 162  | 0.1716          |
+| 0.1857        | 28.0  | 168  | 0.1565          |
+| 0.1654        | 29.0  | 174  | 0.1325          |
+| 0.1477        | 30.0  | 180  | 0.1246          |
+| 0.1489        | 31.0  | 186  | 0.1188          |
+| 0.1352        | 32.0  | 192  | 0.1075          |
+| 0.1232        | 33.0  | 198  | 0.1017          |
+| 0.1205        | 34.0  | 204  | 0.0963          |
+| 0.1125        | 35.0  | 210  | 0.0912          |
+| 0.1149        | 36.0  | 216  | 0.0903          |
+| 0.1081        | 37.0  | 222  | 0.0903          |
+| 0.1069        | 38.0  | 228  | 0.0851          |
+| 0.1046        | 39.0  | 234  | 0.0828          |
+| 0.0996        | 40.0  | 240  | 0.0824          |
 ### Framework versions

config.json CHANGED Viewed

@@ -78,7 +78,7 @@
     "typical_p": 1.0,
     "use_bfloat16": false,
     "use_cache": true,
-    "vocab_size": 52
   },
   "decoder_start_token_id": 2,
   "encoder": {
@@ -157,7 +157,7 @@
     "typical_p": 1.0,
     "use_bfloat16": false,
     "use_cache": true,
-    "vocab_size": 52
   },
   "eos_token_id": 0,
   "is_encoder_decoder": true,

     "typical_p": 1.0,
     "use_bfloat16": false,
     "use_cache": true,
+    "vocab_size": 53
   },
   "decoder_start_token_id": 2,
   "encoder": {
     "typical_p": 1.0,
     "use_bfloat16": false,
     "use_cache": true,
+    "vocab_size": 53
   },
   "eos_token_id": 0,
   "is_encoder_decoder": true,

model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:1316881e46b841dd1dd96b1112a88973a59bcc977ade6cb8a0b25e5e14c81baf
-size 31205552

 version https://git-lfs.github.com/spec/v1
+oid sha256:716d0e4c438984cf9fea3426de4859717ce10523a52ecf70917298bff07b5a65
+size 31207604

runs/Mar04_10-20-42_4150c2fa2709/events.out.tfevents.1709547643.4150c2fa2709.151.1 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:eab08d7befd138c78327bc3fe299aeb13650df35f56517211ea807e75a9e77a6
+size 27997

tokenizer.json CHANGED Viewed

@@ -112,48 +112,49 @@
       "7": 13,
       "8": 14,
       "9": 15,
-      "99": 16,
       "10": 17,
-      "11": 18,
       "98": 19,
-      "97": 20,
-      "12": 21,
-      "96": 22,
-      "13": 23,
-      "95": 24,
-      "14": 25,
-      "94": 26,
-      "15": 27,
-      "93": 28,
-      "16": 29,
-      "17": 30,
-      "92": 31,
-      "91": 32,
       "18": 33,
-      "19": 34,
       "90": 35,
-      "20": 36,
-      "89": 37,
-      "21": 38,
-      "88": 39,
-      "22": 40,
       "87": 41,
-      "23": 42,
-      "86": 43,
-      "85": 44,
-      "24": 45,
-      "25": 46,
-      "84": 47,
-      "26": 48,
       "83": 49,
-      "27": 50,
-      "82": 51
     },
     "merges": [
-      "9 9",
       "1 0",
-      "1 1",
       "9 8",
       "9 7",
       "1 2",
       "9 6",
@@ -166,24 +167,24 @@
       "1 6",
       "1 7",
       "9 2",
-      "9 1",
       "1 8",
-      "1 9",
       "9 0",
       "2 0",
       "8 9",
       "2 1",
       "8 8",
-      "2 2",
       "8 7",
       "2 3",
       "8 6",
       "8 5",
       "2 4",
       "2 5",
       "8 4",
-      "2 6",
       "8 3",
       "2 7",
       "8 2"
     ]

       "7": 13,
       "8": 14,
       "9": 15,
+      "=": 16,
       "10": 17,
+      "99": 18,
       "98": 19,
+      "11": 20,
+      "97": 21,
+      "12": 22,
+      "96": 23,
+      "13": 24,
+      "95": 25,
+      "14": 26,
+      "94": 27,
+      "15": 28,
+      "93": 29,
+      "16": 30,
+      "17": 31,
+      "92": 32,
       "18": 33,
+      "91": 34,
       "90": 35,
+      "19": 36,
+      "20": 37,
+      "89": 38,
+      "21": 39,
+      "88": 40,
       "87": 41,
+      "22": 42,
+      "23": 43,
+      "86": 44,
+      "85": 45,
+      "24": 46,
+      "25": 47,
+      "84": 48,
       "83": 49,
+      "26": 50,
+      "27": 51,
+      "82": 52
     },
     "merges": [
       "1 0",
+      "9 9",
       "9 8",
+      "1 1",
       "9 7",
       "1 2",
       "9 6",
       "1 6",
       "1 7",
       "9 2",
       "1 8",
+      "9 1",
       "9 0",
+      "1 9",
       "2 0",
       "8 9",
       "2 1",
       "8 8",
       "8 7",
+      "2 2",
       "2 3",
       "8 6",
       "8 5",
       "2 4",
       "2 5",
       "8 4",
       "8 3",
+      "2 6",
       "2 7",
       "8 2"
     ]

training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:0f8ecf8c900da182f6d948b82c28f1c64da66e2e05376f01450376eee7382376
 size 5112

 version https://git-lfs.github.com/spec/v1
+oid sha256:fdaf4cbde81c5fb1296780d605b465e1ad53cb014fa08dae4ab07a15be520994
 size 5112