Training complete

Browse files

Files changed (7) hide show

README.md +44 -37
config.json +1 -1
model.safetensors +1 -1
runs/May07_00-28-18_7d25fd5318e7/events.out.tfevents.1715041699.7d25fd5318e7.271.0 +3 -0
runs/May07_00-28-18_7d25fd5318e7/events.out.tfevents.1715044297.7d25fd5318e7.271.1 +3 -0
tokenizer.json +1 -0
training_args.bin +2 -2

README.md CHANGED Viewed

@@ -20,11 +20,11 @@ should probably proofread and complete it, then remove this comment. -->
 This model is a fine-tuned version of [DmitryPogrebnoy/MedRuRobertaLarge](https://huggingface.co/DmitryPogrebnoy/MedRuRobertaLarge) on the None dataset.
 It achieves the following results on the evaluation set:
-- Loss: 0.4946
-- Precision: 0.5932
-- Recall: 0.5804
-- F1: 0.5868
-- Accuracy: 0.9015
 ## Model description
@@ -55,39 +55,46 @@ The following hyperparameters were used during training:
 | Training Loss | Epoch | Step | Validation Loss | Precision | Recall | F1     | Accuracy |
 |:-------------:|:-----:|:----:|:---------------:|:---------:|:------:|:------:|:--------:|
-| No log        | 1.0   | 50   | 0.6600          | 0.0       | 0.0    | 0.0    | 0.7759   |
-| No log        | 2.0   | 100  | 0.5893          | 0.0       | 0.0    | 0.0    | 0.7826   |
-| No log        | 3.0   | 150  | 0.4690          | 0.0265    | 0.0173 | 0.0210 | 0.8164   |
-| No log        | 4.0   | 200  | 0.4564          | 0.0979    | 0.1252 | 0.1099 | 0.8204   |
-| No log        | 5.0   | 250  | 0.3628          | 0.1881    | 0.2852 | 0.2266 | 0.8538   |
-| No log        | 6.0   | 300  | 0.3105          | 0.3469    | 0.3622 | 0.3544 | 0.8901   |
-| No log        | 7.0   | 350  | 0.3382          | 0.4084    | 0.3738 | 0.3903 | 0.8909   |
-| No log        | 8.0   | 400  | 0.2926          | 0.4774    | 0.4682 | 0.4728 | 0.9020   |
-| No log        | 9.0   | 450  | 0.2955          | 0.4630    | 0.4817 | 0.4721 | 0.9046   |
-| 0.3854        | 10.0  | 500  | 0.3161          | 0.5367    | 0.4933 | 0.5141 | 0.9080   |
-| 0.3854        | 11.0  | 550  | 0.3103          | 0.4612    | 0.6069 | 0.5241 | 0.9018   |
-| 0.3854        | 12.0  | 600  | 0.3020          | 0.5614    | 0.6166 | 0.5877 | 0.9136   |
-| 0.3854        | 13.0  | 650  | 0.3738          | 0.5625    | 0.5896 | 0.5757 | 0.9157   |
-| 0.3854        | 14.0  | 700  | 0.3322          | 0.4834    | 0.5877 | 0.5304 | 0.9031   |
-| 0.3854        | 15.0  | 750  | 0.3619          | 0.4855    | 0.5472 | 0.5145 | 0.9083   |
-| 0.3854        | 16.0  | 800  | 0.3597          | 0.4815    | 0.6763 | 0.5625 | 0.9018   |
-| 0.3854        | 17.0  | 850  | 0.4065          | 0.5488    | 0.6281 | 0.5858 | 0.9145   |
-| 0.3854        | 18.0  | 900  | 0.4491          | 0.6047    | 0.6513 | 0.6271 | 0.9184   |
-| 0.3854        | 19.0  | 950  | 0.4184          | 0.4972    | 0.6898 | 0.5779 | 0.8986   |
-| 0.0771        | 20.0  | 1000 | 0.3366          | 0.5929    | 0.6089 | 0.6008 | 0.9238   |
-| 0.0771        | 21.0  | 1050 | 0.6161          | 0.6834    | 0.5241 | 0.5932 | 0.9009   |
-| 0.0771        | 22.0  | 1100 | 0.6387          | 0.3497    | 0.6859 | 0.4632 | 0.8377   |
-| 0.0771        | 23.0  | 1150 | 0.3559          | 0.6004    | 0.6224 | 0.6112 | 0.9198   |
-| 0.0771        | 24.0  | 1200 | 0.4161          | 0.5926    | 0.6166 | 0.6043 | 0.9203   |
-| 0.0771        | 25.0  | 1250 | 0.4341          | 0.6365    | 0.6108 | 0.6234 | 0.9199   |
-| 0.0771        | 26.0  | 1300 | 0.3910          | 0.6184    | 0.5838 | 0.6006 | 0.9153   |
-| 0.0771        | 27.0  | 1350 | 0.3706          | 0.5396    | 0.6435 | 0.5870 | 0.9209   |
-| 0.0771        | 28.0  | 1400 | 0.5059          | 0.5833    | 0.6069 | 0.5949 | 0.9157   |
 ### Framework versions
-- Transformers 4.38.2
-- Pytorch 2.1.2
-- Datasets 2.1.0
-- Tokenizers 0.15.2

 This model is a fine-tuned version of [DmitryPogrebnoy/MedRuRobertaLarge](https://huggingface.co/DmitryPogrebnoy/MedRuRobertaLarge) on the None dataset.
 It achieves the following results on the evaluation set:
+- Loss: 0.6996
+- Precision: 0.5225
+- Recall: 0.5788
+- F1: 0.5492
+- Accuracy: 0.8955
 ## Model description
 | Training Loss | Epoch | Step | Validation Loss | Precision | Recall | F1     | Accuracy |
 |:-------------:|:-----:|:----:|:---------------:|:---------:|:------:|:------:|:--------:|
+| No log        | 1.0   | 50   | 0.6906          | 0.0175    | 0.0019 | 0.0035 | 0.7724   |
+| No log        | 2.0   | 100  | 0.7240          | 0.0526    | 0.0019 | 0.0037 | 0.7756   |
+| No log        | 3.0   | 150  | 0.5668          | 0.0407    | 0.0289 | 0.0338 | 0.7668   |
+| No log        | 4.0   | 200  | 0.4358          | 0.1326    | 0.1522 | 0.1417 | 0.8236   |
+| No log        | 5.0   | 250  | 0.3509          | 0.1932    | 0.2177 | 0.2047 | 0.8573   |
+| No log        | 6.0   | 300  | 0.2961          | 0.3339    | 0.3699 | 0.3510 | 0.8862   |
+| No log        | 7.0   | 350  | 0.3715          | 0.4073    | 0.3642 | 0.3845 | 0.8820   |
+| No log        | 8.0   | 400  | 0.2778          | 0.4511    | 0.4528 | 0.4519 | 0.9040   |
+| No log        | 9.0   | 450  | 0.3318          | 0.4576    | 0.4778 | 0.4675 | 0.8997   |
+| 0.4025        | 10.0  | 500  | 0.3198          | 0.5278    | 0.5299 | 0.5288 | 0.9049   |
+| 0.4025        | 11.0  | 550  | 0.3157          | 0.4297    | 0.6358 | 0.5128 | 0.8909   |
+| 0.4025        | 12.0  | 600  | 0.3024          | 0.5548    | 0.5954 | 0.5743 | 0.9188   |
+| 0.4025        | 13.0  | 650  | 0.3670          | 0.6091    | 0.6185 | 0.6138 | 0.9149   |
+| 0.4025        | 14.0  | 700  | 0.4036          | 0.5088    | 0.6127 | 0.5559 | 0.8998   |
+| 0.4025        | 15.0  | 750  | 0.4116          | 0.5542    | 0.6012 | 0.5767 | 0.9085   |
+| 0.4025        | 16.0  | 800  | 0.3971          | 0.5301    | 0.6455 | 0.5821 | 0.9095   |
+| 0.4025        | 17.0  | 850  | 0.4887          | 0.5535    | 0.5183 | 0.5353 | 0.8977   |
+| 0.4025        | 18.0  | 900  | 0.4385          | 0.5563    | 0.6474 | 0.5984 | 0.9106   |
+| 0.4025        | 19.0  | 950  | 0.4007          | 0.6316    | 0.6012 | 0.6160 | 0.9219   |
+| 0.0841        | 20.0  | 1000 | 0.3720          | 0.5709    | 0.5896 | 0.5801 | 0.9165   |
+| 0.0841        | 21.0  | 1050 | 0.5100          | 0.6393    | 0.6012 | 0.6197 | 0.9150   |
+| 0.0841        | 22.0  | 1100 | 0.5028          | 0.5319    | 0.6590 | 0.5886 | 0.8972   |
+| 0.0841        | 23.0  | 1150 | 0.4347          | 0.5656    | 0.5896 | 0.5774 | 0.9149   |
+| 0.0841        | 24.0  | 1200 | 0.4721          | 0.5861    | 0.6031 | 0.5945 | 0.9122   |
+| 0.0841        | 25.0  | 1250 | 0.5677          | 0.6457    | 0.5549 | 0.5969 | 0.9116   |
+| 0.0841        | 26.0  | 1300 | 0.4095          | 0.6278    | 0.6435 | 0.6356 | 0.9189   |
+| 0.0841        | 27.0  | 1350 | 0.4633          | 0.5088    | 0.6686 | 0.5779 | 0.8989   |
+| 0.0841        | 28.0  | 1400 | 0.3649          | 0.5617    | 0.6493 | 0.6023 | 0.9105   |
+| 0.0841        | 29.0  | 1450 | 0.4653          | 0.5633    | 0.6262 | 0.5931 | 0.9111   |
+| 0.0464        | 30.0  | 1500 | 0.5159          | 0.5581    | 0.6474 | 0.5995 | 0.9119   |
+| 0.0464        | 31.0  | 1550 | 0.4562          | 0.5248    | 0.6513 | 0.5813 | 0.9090   |
+| 0.0464        | 32.0  | 1600 | 0.4424          | 0.5665    | 0.5742 | 0.5703 | 0.9173   |
+| 0.0464        | 33.0  | 1650 | 0.4866          | 0.5617    | 0.5703 | 0.5660 | 0.9164   |
+| 0.0464        | 34.0  | 1700 | 0.4313          | 0.3760    | 0.4586 | 0.4132 | 0.8986   |
+| 0.0464        | 35.0  | 1750 | 0.3786          | 0.5218    | 0.5761 | 0.5476 | 0.9093   |
 ### Framework versions
+- Transformers 4.40.1
+- Pytorch 2.2.1+cu121
+- Datasets 2.19.1
+- Tokenizers 0.19.1

config.json CHANGED Viewed

@@ -31,7 +31,7 @@
   "pad_token_id": 1,
   "position_embedding_type": "absolute",
   "torch_dtype": "float32",
-  "transformers_version": "4.38.2",
   "type_vocab_size": 1,
   "use_cache": true,
   "vocab_size": 50257

   "pad_token_id": 1,
   "position_embedding_type": "absolute",
   "torch_dtype": "float32",
+  "transformers_version": "4.40.1",
   "type_vocab_size": 1,
   "use_cache": true,
   "vocab_size": 50257

model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:9dbf3f714f0460c72961c72193ee665e8751d5eb600994bc54c14e0979081e91
 size 1417268116

 version https://git-lfs.github.com/spec/v1
+oid sha256:6da5b56518d9f3ef1600691ace91cf3f5a7303f780c136166ebb6ce38e60465b
 size 1417268116

runs/May07_00-28-18_7d25fd5318e7/events.out.tfevents.1715041699.7d25fd5318e7.271.0 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:e1c488417a356809770abbc3a318a317cdcc1f19b5f127a9ec39b88e645dd99b
+size 22399

runs/May07_00-28-18_7d25fd5318e7/events.out.tfevents.1715044297.7d25fd5318e7.271.1 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:c1e3a172f1ada0578ef501f0a951e7a4bf3a978c4520ac18b36e87dffc2cb768
+size 560

tokenizer.json CHANGED Viewed

@@ -88,6 +88,7 @@
     "end_of_word_suffix": "",
     "fuse_unk": false,
     "byte_fallback": false,
     "vocab": {
       "<pad>": 0,
       "<s>": 1,

     "end_of_word_suffix": "",
     "fuse_unk": false,
     "byte_fallback": false,
+    "ignore_merges": false,
     "vocab": {
       "<pad>": 0,
       "<s>": 1,

training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:fea49175dffcf300beefc984322a438e08adb22620536bf75dfd078f2f546cc8
-size 4920

 version https://git-lfs.github.com/spec/v1
+oid sha256:2233076939c2ade1cecfe17625289d46f2320b2beb984c2aa8457f0e0286cae3
+size 4984