End of training

Browse files

Files changed (6) hide show

README.md +51 -51
config.json +2 -2
model.safetensors +2 -2
runs/Feb28_19-58-25_3897ec21fae5/events.out.tfevents.1709150306.3897ec21fae5.112417.0 +3 -0
tokenizer.json +36 -37
training_args.bin +1 -1

README.md CHANGED Viewed

@@ -13,7 +13,7 @@ should probably proofread and complete it, then remove this comment. -->
 This model is a fine-tuned version of [](https://huggingface.co/) on the None dataset.
 It achieves the following results on the evaluation set:
-- Loss: 0.1435
 ## Model description
@@ -44,56 +44,56 @@ The following hyperparameters were used during training:
 | Training Loss | Epoch | Step | Validation Loss |
 |:-------------:|:-----:|:----:|:---------------:|
-| 3.0221        | 1.0   | 6    | 2.2896          |
-| 2.055         | 2.0   | 12   | 1.7915          |
-| 1.6422        | 3.0   | 18   | 1.4365          |
-| 1.2892        | 4.0   | 24   | 1.1407          |
-| 1.0661        | 5.0   | 30   | 0.9557          |
-| 0.9138        | 6.0   | 36   | 0.8362          |
-| 0.8297        | 7.0   | 42   | 0.7370          |
-| 0.7493        | 8.0   | 48   | 0.6858          |
-| 0.7285        | 9.0   | 54   | 0.6761          |
-| 0.6576        | 10.0  | 60   | 0.6179          |
-| 0.6126        | 11.0  | 66   | 0.5748          |
-| 0.57          | 12.0  | 72   | 0.5858          |
-| 0.5453        | 13.0  | 78   | 0.5193          |
-| 0.5309        | 14.0  | 84   | 0.5104          |
-| 0.5394        | 15.0  | 90   | 0.5115          |
-| 0.5024        | 16.0  | 96   | 0.4763          |
-| 0.4642        | 17.0  | 102  | 0.4389          |
-| 0.4478        | 18.0  | 108  | 0.4080          |
-| 0.424         | 19.0  | 114  | 0.3999          |
-| 0.4152        | 20.0  | 120  | 0.3876          |
-| 0.3966        | 21.0  | 126  | 0.3982          |
-| 0.3971        | 22.0  | 132  | 0.3669          |
-| 0.369         | 23.0  | 138  | 0.3579          |
-| 0.3584        | 24.0  | 144  | 0.3336          |
-| 0.3577        | 25.0  | 150  | 0.3271          |
-| 0.3279        | 26.0  | 156  | 0.3005          |
-| 0.315         | 27.0  | 162  | 0.2841          |
-| 0.3104        | 28.0  | 168  | 0.3149          |
-| 0.3129        | 29.0  | 174  | 0.2906          |
-| 0.2906        | 30.0  | 180  | 0.2925          |
-| 0.2778        | 31.0  | 186  | 0.2644          |
-| 0.276         | 32.0  | 192  | 0.2512          |
-| 0.2685        | 33.0  | 198  | 0.2494          |
-| 0.2524        | 34.0  | 204  | 0.2305          |
-| 0.2488        | 35.0  | 210  | 0.2199          |
-| 0.2411        | 36.0  | 216  | 0.2099          |
-| 0.2167        | 37.0  | 222  | 0.2022          |
-| 0.2175        | 38.0  | 228  | 0.1934          |
-| 0.2113        | 39.0  | 234  | 0.1841          |
-| 0.1923        | 40.0  | 240  | 0.1751          |
-| 0.1908        | 41.0  | 246  | 0.1732          |
-| 0.1857        | 42.0  | 252  | 0.1669          |
-| 0.1858        | 43.0  | 258  | 0.1598          |
-| 0.184         | 44.0  | 264  | 0.1600          |
-| 0.1772        | 45.0  | 270  | 0.1519          |
-| 0.1774        | 46.0  | 276  | 0.1533          |
-| 0.1669        | 47.0  | 282  | 0.1490          |
-| 0.1719        | 48.0  | 288  | 0.1454          |
-| 0.1631        | 49.0  | 294  | 0.1447          |
-| 0.1575        | 50.0  | 300  | 0.1435          |
 ### Framework versions

 This model is a fine-tuned version of [](https://huggingface.co/) on the None dataset.
 It achieves the following results on the evaluation set:
+- Loss: 0.5850
 ## Model description
 | Training Loss | Epoch | Step | Validation Loss |
 |:-------------:|:-----:|:----:|:---------------:|
+| 3.396         | 1.0   | 6    | 2.7406          |
+| 2.3939        | 2.0   | 12   | 1.9948          |
+| 1.7939        | 3.0   | 18   | 1.6558          |
+| 1.5985        | 4.0   | 24   | 1.6015          |
+| 1.6024        | 5.0   | 30   | 1.5540          |
+| 1.5383        | 6.0   | 36   | 1.5356          |
+| 1.4729        | 7.0   | 42   | 1.5437          |
+| 1.4981        | 8.0   | 48   | 1.4425          |
+| 1.3622        | 9.0   | 54   | 1.4418          |
+| 1.3585        | 10.0  | 60   | 1.3501          |
+| 1.2883        | 11.0  | 66   | 1.2932          |
+| 1.2361        | 12.0  | 72   | 1.3210          |
+| 1.2274        | 13.0  | 78   | 1.2883          |
+| 1.2667        | 14.0  | 84   | 1.2169          |
+| 1.1679        | 15.0  | 90   | 1.1638          |
+| 1.1237        | 16.0  | 96   | 1.1617          |
+| 1.144         | 17.0  | 102  | 1.0919          |
+| 1.0771        | 18.0  | 108  | 1.0928          |
+| 1.059         | 19.0  | 114  | 1.0184          |
+| 1.0024        | 20.0  | 120  | 0.9676          |
+| 0.9949        | 21.0  | 126  | 0.9555          |
+| 0.986         | 22.0  | 132  | 1.0286          |
+| 1.0278        | 23.0  | 138  | 0.9337          |
+| 0.9413        | 24.0  | 144  | 0.9162          |
+| 0.912         | 25.0  | 150  | 0.9396          |
+| 0.9621        | 26.0  | 156  | 0.8786          |
+| 0.9102        | 27.0  | 162  | 0.8947          |
+| 0.9384        | 28.0  | 168  | 0.8820          |
+| 0.868         | 29.0  | 174  | 0.8468          |
+| 0.8512        | 30.0  | 180  | 0.8478          |
+| 0.8302        | 31.0  | 186  | 0.8099          |
+| 0.8327        | 32.0  | 192  | 0.7622          |
+| 0.8193        | 33.0  | 198  | 0.7596          |
+| 0.7834        | 34.0  | 204  | 0.7329          |
+| 0.7608        | 35.0  | 210  | 0.7229          |
+| 0.7686        | 36.0  | 216  | 0.7257          |
+| 0.7262        | 37.0  | 222  | 0.6940          |
+| 0.7342        | 38.0  | 228  | 0.7117          |
+| 0.7209        | 39.0  | 234  | 0.6646          |
+| 0.7099        | 40.0  | 240  | 0.6530          |
+| 0.6908        | 41.0  | 246  | 0.6397          |
+| 0.6895        | 42.0  | 252  | 0.6356          |
+| 0.6761        | 43.0  | 258  | 0.6202          |
+| 0.668         | 44.0  | 264  | 0.6174          |
+| 0.6735        | 45.0  | 270  | 0.6074          |
+| 0.6502        | 46.0  | 276  | 0.6019          |
+| 0.6427        | 47.0  | 282  | 0.5953          |
+| 0.6326        | 48.0  | 288  | 0.5904          |
+| 0.6467        | 49.0  | 294  | 0.5872          |
+| 0.6307        | 50.0  | 300  | 0.5850          |
 ### Framework versions

config.json CHANGED Viewed

@@ -78,7 +78,7 @@
     "typical_p": 1.0,
     "use_bfloat16": false,
     "use_cache": true,
-    "vocab_size": 53
   },
   "decoder_start_token_id": 2,
   "encoder": {
@@ -157,7 +157,7 @@
     "typical_p": 1.0,
     "use_bfloat16": false,
     "use_cache": true,
-    "vocab_size": 53
   },
   "eos_token_id": 0,
   "is_encoder_decoder": true,

     "typical_p": 1.0,
     "use_bfloat16": false,
     "use_cache": true,
+    "vocab_size": 52
   },
   "decoder_start_token_id": 2,
   "encoder": {
     "typical_p": 1.0,
     "use_bfloat16": false,
     "use_cache": true,
+    "vocab_size": 52
   },
   "eos_token_id": 0,
   "is_encoder_decoder": true,

model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:3382b69e49d0bc15a1e3bc46509ee1eb1762c00de4b8752ca63872576a787056
-size 31207604

 version https://git-lfs.github.com/spec/v1
+oid sha256:a6dd0c10a93bc861dfdb78a028c4f50ca6a5ec612bb363bbe7288196804c2809
+size 31205552

runs/Feb28_19-58-25_3897ec21fae5/events.out.tfevents.1709150306.3897ec21fae5.112417.0 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:fc68afa9ce9448c7ac50be9b177c13e7e3ae130988291c7d10994b33f57c8bd1
+size 29926

tokenizer.json CHANGED Viewed

@@ -112,73 +112,72 @@
       "7": 13,
       "8": 14,
       "9": 15,
-      "=": 16,
       "99": 17,
-      "10": 18,
-      "11": 19,
-      "98": 20,
       "97": 21,
-      "12": 22,
       "96": 23,
-      "13": 24,
       "95": 25,
-      "14": 26,
       "15": 27,
-      "94": 28,
       "93": 29,
-      "16": 30,
-      "17": 31,
-      "92": 32,
-      "91": 33,
-      "18": 34,
-      "19": 35,
-      "90": 36,
       "89": 37,
-      "20": 38,
       "88": 39,
-      "21": 40,
       "22": 41,
-      "87": 42,
       "23": 43,
-      "86": 44,
-      "24": 45,
-      "85": 46,
-      "25": 47,
-      "84": 48,
-      "26": 49,
-      "83": 50,
-      "27": 51,
-      "82": 52
     },
     "merges": [
-      "9 9",
       "1 0",
       "1 1",
       "9 8",
-      "9 7",
       "1 2",
-      "9 6",
       "1 3",
-      "9 5",
       "1 4",
-      "1 5",
       "9 4",
-      "9 3",
       "1 6",
       "1 7",
       "9 2",
       "9 1",
       "1 8",
       "1 9",
       "9 0",
-      "8 9",
       "2 0",
-      "8 8",
       "2 1",
-      "2 2",
       "8 7",
-      "2 3",
       "8 6",
       "2 4",
       "8 5",
       "2 5",

       "7": 13,
       "8": 14,
       "9": 15,
+      "10": 16,
       "99": 17,
+      "11": 18,
+      "98": 19,
+      "12": 20,
       "97": 21,
+      "13": 22,
       "96": 23,
+      "14": 24,
       "95": 25,
+      "94": 26,
       "15": 27,
+      "16": 28,
       "93": 29,
+      "17": 30,
+      "92": 31,
+      "91": 32,
+      "18": 33,
+      "19": 34,
+      "90": 35,
+      "20": 36,
       "89": 37,
+      "21": 38,
       "88": 39,
+      "87": 40,
       "22": 41,
+      "86": 42,
       "23": 43,
+      "24": 44,
+      "85": 45,
+      "25": 46,
+      "84": 47,
+      "26": 48,
+      "83": 49,
+      "27": 50,
+      "82": 51
     },
     "merges": [
       "1 0",
+      "9 9",
       "1 1",
       "9 8",
       "1 2",
+      "9 7",
       "1 3",
+      "9 6",
       "1 4",
+      "9 5",
       "9 4",
+      "1 5",
       "1 6",
+      "9 3",
       "1 7",
       "9 2",
       "9 1",
       "1 8",
       "1 9",
       "9 0",
       "2 0",
+      "8 9",
       "2 1",
+      "8 8",
       "8 7",
+      "2 2",
       "8 6",
+      "2 3",
       "2 4",
       "8 5",
       "2 5",

training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:92373650ff57d5cbc6bac5a4d68bf78863a8e67ac3450e8e14ef9c02d0ebeb53
 size 4920

 version https://git-lfs.github.com/spec/v1
+oid sha256:4842f4a0fd629ccc59cab7f2313be44d4264afb1d3e03281108215f6061469f3
 size 4920