End of training

Browse files

Files changed (13) hide show

README.md +76 -0
config.json +163 -0
model.safetensors +3 -0
runs/Dec20_14-09-14_n27/events.out.tfevents.1734700178.n27.269776.0 +3 -0
runs/Dec20_14-11-04_n27/events.out.tfevents.1734700266.n27.269776.1 +3 -0
runs/Dec20_14-26-53_g08/events.out.tfevents.1734701215.g08.3246119.4 +3 -0
runs/Feb03_16-51-14_dgx10/events.out.tfevents.1738597881.dgx10.76300.0 +3 -0
runs/Feb03_16-51-14_dgx10/events.out.tfevents.1738612513.dgx10.76300.1 +3 -0
special_tokens_map.json +44 -0
tokenizer.json +0 -0
tokenizer_config.json +102 -0
training_args.bin +3 -0
vocab.txt +0 -0

README.md ADDED Viewed

	@@ -0,0 +1,76 @@

+---
+library_name: transformers
+license: apache-2.0
+base_model: bert-base-multilingual-cased
+tags:
+- generated_from_trainer
+datasets:
+- generator
+metrics:
+- accuracy
+model-index:
+- name: mBERT-2
+  results: []
+---
+<!-- This model card has been generated automatically according to the information the Trainer had access to. You
+should probably proofread and complete it, then remove this comment. -->
+# mBERT-2
+This model is a fine-tuned version of [bert-base-multilingual-cased](https://huggingface.co/bert-base-multilingual-cased) on the generator dataset.
+It achieves the following results on the evaluation set:
+- Loss: 0.9469
+- Accuracy: 0.8845
+- Micro Precision: 0.8845
+- Micro Recall: 0.8845
+- Micro F1: 0.8845
+- Macro Precision: 0.8512
+- Macro Recall: 0.8349
+- Macro F1: 0.8398
+## Model description
+More information needed
+## Intended uses & limitations
+More information needed
+## Training and evaluation data
+More information needed
+## Training procedure
+### Training hyperparameters
+The following hyperparameters were used during training:
+- learning_rate: 5e-05
+- train_batch_size: 12
+- eval_batch_size: 12
+- seed: 42
+- optimizer: Use adamw_torch with betas=(0.9,0.999) and epsilon=1e-08 and optimizer_args=No additional optimizer arguments
+- lr_scheduler_type: linear
+- num_epochs: 8
+### Training results
+| Training Loss | Epoch | Step   | Validation Loss | Accuracy | Micro Precision | Micro Recall | Micro F1 | Macro Precision | Macro Recall | Macro F1 |
+|:-------------:|:-----:|:------:|:---------------:|:--------:|:---------------:|:------------:|:--------:|:---------------:|:------------:|:--------:|
+| 0.6019        | 1.0   | 30148  | 0.5612          | 0.8398   | 0.8398          | 0.8398       | 0.8398   | 0.8271          | 0.7687       | 0.7761   |
+| 0.4904        | 2.0   | 60296  | 0.5216          | 0.8564   | 0.8564          | 0.8564       | 0.8564   | 0.8172          | 0.8079       | 0.8032   |
+| 0.3624        | 3.0   | 90444  | 0.5196          | 0.8656   | 0.8656          | 0.8656       | 0.8656   | 0.8374          | 0.8006       | 0.8094   |
+| 0.3242        | 4.0   | 120592 | 0.5662          | 0.8720   | 0.8720          | 0.8720       | 0.8720   | 0.8468          | 0.8222       | 0.8275   |
+| 0.2522        | 5.0   | 150740 | 0.6456          | 0.8717   | 0.8717          | 0.8717       | 0.8717   | 0.8329          | 0.8374       | 0.8298   |
+| 0.1707        | 6.0   | 180888 | 0.7233          | 0.8764   | 0.8764          | 0.8764       | 0.8764   | 0.8442          | 0.8356       | 0.8343   |
+| 0.103         | 7.0   | 211036 | 0.8474          | 0.8794   | 0.8794          | 0.8794       | 0.8794   | 0.8440          | 0.8403       | 0.8385   |
+| 0.0646        | 8.0   | 241184 | 0.9117          | 0.8836   | 0.8836          | 0.8836       | 0.8836   | 0.8465          | 0.8455       | 0.8423   |
+### Framework versions
+- Transformers 4.46.2
+- Pytorch 2.5.1+cu124
+- Datasets 3.1.0
+- Tokenizers 0.20.3

config.json ADDED Viewed

	@@ -0,0 +1,163 @@

+{
+  "_name_or_path": "bert-base-multilingual-cased",
+  "architectures": [
+    "RelationExtractionModel"
+  ],
+  "attention_probs_dropout_prob": 0.1,
+  "classifier_dropout": null,
+  "directionality": "bidi",
+  "hidden_act": "gelu",
+  "hidden_dropout_prob": 0.1,
+  "hidden_size": 768,
+  "id2label": {
+    "0": "P0 other",
+    "1": "P19 m\u00edsto narozen\u00ed",
+    "2": "P20 m\u00edsto \u00famrt\u00ed",
+    "3": "P21 pohlav\u00ed",
+    "4": "P22 otec",
+    "5": "P25 matka",
+    "6": "P26 cho\u0165",
+    "7": "P27 st\u00e1tn\u00ed ob\u010danstv\u00ed",
+    "8": "P36 hlavn\u00ed m\u011bsto",
+    "9": "P39 ve funkci",
+    "10": "P47 hrani\u010d\u00ed s",
+    "11": "P50 autor",
+    "12": "P53 rodina",
+    "13": "P54 \u010dlen sportovn\u00edho dru\u017estva",
+    "14": "P97 \u0161lechtick\u00fd titul",
+    "15": "P101 zam\u011b\u0159en\u00ed",
+    "16": "P102 stranick\u00e1 p\u0159\u00edslu\u0161nost",
+    "17": "P105 taxonomick\u00e9 za\u0159azen\u00ed",
+    "18": "P106 povol\u00e1n\u00ed",
+    "19": "P118 liga",
+    "20": "P131 nach\u00e1z\u00ed se v administrativn\u00ed jednotce",
+    "21": "P136 \u017e\u00e1nr",
+    "22": "P137 oper\u00e1tor",
+    "23": "P138 pojmenov\u00e1no po",
+    "24": "P140 vyzn\u00e1n\u00ed",
+    "25": "P150 ni\u017e\u0161\u00ed spr\u00e1vn\u00ed celky",
+    "26": "P155 p\u0159edchoz\u00ed",
+    "27": "P159 s\u00eddlo",
+    "28": "P161 hraje",
+    "29": "P171 nad\u0159azen\u00fd taxon",
+    "30": "P175 interpret",
+    "31": "P176 v\u00fdrobce",
+    "32": "P179 s\u00e9rie",
+    "33": "P206 u vodn\u00ed plochy",
+    "34": "P264 hudebn\u00ed vydavatelstv\u00ed",
+    "35": "P276 m\u00edsto",
+    "36": "P279 nadt\u0159\u00edda",
+    "37": "P360 seznam (\u010deho)",
+    "38": "P361 \u010d\u00e1st (\u010deho)",
+    "39": "P413 pozice hr\u00e1\u010de",
+    "40": "P425 obor tohoto povol\u00e1n\u00ed",
+    "41": "P460 \u00fadajn\u011b tot\u00e9\u017e co",
+    "42": "P461 protiklad",
+    "43": "P463 \u010dlen (\u010deho)",
+    "44": "P495 zem\u011b p\u016fvodu",
+    "45": "P527 skl\u00e1d\u00e1 se z",
+    "46": "P530 diplomatick\u00fd vztah",
+    "47": "P641 sport",
+    "48": "P669 ulice",
+    "49": "P706 oblast",
+    "50": "P708 diec\u00e9ze",
+    "51": "P734 p\u0159\u00edjmen\u00ed",
+    "52": "P735 rodn\u00e9 jm\u00e9no",
+    "53": "P740 m\u00edsto vzniku",
+    "54": "P800 d\u00edlo",
+    "55": "P921 hlavn\u00ed t\u00e9ma d\u00edla",
+    "56": "P974 p\u0159\u00edtok",
+    "57": "P1056 produkuje",
+    "58": "P1303 hudebn\u00ed n\u00e1stroj",
+    "59": "P1376 hlavn\u00ed s\u00eddlo \u010deho",
+    "60": "P1383 zahrnuje s\u00eddlo",
+    "61": "P1889 rozd\u00edln\u00e9 od",
+    "62": "P3373 sourozenec",
+    "63": "P4552 poho\u0159\u00ed"
+  },
+  "initializer_range": 0.02,
+  "intermediate_size": 3072,
+  "label2id": {
+    "P0 other": 0,
+    "P101 zam\u011b\u0159en\u00ed": 15,
+    "P102 stranick\u00e1 p\u0159\u00edslu\u0161nost": 16,
+    "P105 taxonomick\u00e9 za\u0159azen\u00ed": 17,
+    "P1056 produkuje": 57,
+    "P106 povol\u00e1n\u00ed": 18,
+    "P118 liga": 19,
+    "P1303 hudebn\u00ed n\u00e1stroj": 58,
+    "P131 nach\u00e1z\u00ed se v administrativn\u00ed jednotce": 20,
+    "P136 \u017e\u00e1nr": 21,
+    "P137 oper\u00e1tor": 22,
+    "P1376 hlavn\u00ed s\u00eddlo \u010deho": 59,
+    "P138 pojmenov\u00e1no po": 23,
+    "P1383 zahrnuje s\u00eddlo": 60,
+    "P140 vyzn\u00e1n\u00ed": 24,
+    "P150 ni\u017e\u0161\u00ed spr\u00e1vn\u00ed celky": 25,
+    "P155 p\u0159edchoz\u00ed": 26,
+    "P159 s\u00eddlo": 27,
+    "P161 hraje": 28,
+    "P171 nad\u0159azen\u00fd taxon": 29,
+    "P175 interpret": 30,
+    "P176 v\u00fdrobce": 31,
+    "P179 s\u00e9rie": 32,
+    "P1889 rozd\u00edln\u00e9 od": 61,
+    "P19 m\u00edsto narozen\u00ed": 1,
+    "P20 m\u00edsto \u00famrt\u00ed": 2,
+    "P206 u vodn\u00ed plochy": 33,
+    "P21 pohlav\u00ed": 3,
+    "P22 otec": 4,
+    "P25 matka": 5,
+    "P26 cho\u0165": 6,
+    "P264 hudebn\u00ed vydavatelstv\u00ed": 34,
+    "P27 st\u00e1tn\u00ed ob\u010danstv\u00ed": 7,
+    "P276 m\u00edsto": 35,
+    "P279 nadt\u0159\u00edda": 36,
+    "P3373 sourozenec": 62,
+    "P36 hlavn\u00ed m\u011bsto": 8,
+    "P360 seznam (\u010deho)": 37,
+    "P361 \u010d\u00e1st (\u010deho)": 38,
+    "P39 ve funkci": 9,
+    "P413 pozice hr\u00e1\u010de": 39,
+    "P425 obor tohoto povol\u00e1n\u00ed": 40,
+    "P4552 poho\u0159\u00ed": 63,
+    "P460 \u00fadajn\u011b tot\u00e9\u017e co": 41,
+    "P461 protiklad": 42,
+    "P463 \u010dlen (\u010deho)": 43,
+    "P47 hrani\u010d\u00ed s": 10,
+    "P495 zem\u011b p\u016fvodu": 44,
+    "P50 autor": 11,
+    "P527 skl\u00e1d\u00e1 se z": 45,
+    "P53 rodina": 12,
+    "P530 diplomatick\u00fd vztah": 46,
+    "P54 \u010dlen sportovn\u00edho dru\u017estva": 13,
+    "P641 sport": 47,
+    "P669 ulice": 48,
+    "P706 oblast": 49,
+    "P708 diec\u00e9ze": 50,
+    "P734 p\u0159\u00edjmen\u00ed": 51,
+    "P735 rodn\u00e9 jm\u00e9no": 52,
+    "P740 m\u00edsto vzniku": 53,
+    "P800 d\u00edlo": 54,
+    "P921 hlavn\u00ed t\u00e9ma d\u00edla": 55,
+    "P97 \u0161lechtick\u00fd titul": 14,
+    "P974 p\u0159\u00edtok": 56
+  },
+  "layer_norm_eps": 1e-12,
+  "max_position_embeddings": 512,
+  "model_type": "bert",
+  "num_attention_heads": 12,
+  "num_hidden_layers": 12,
+  "pad_token_id": 0,
+  "pooler_fc_size": 768,
+  "pooler_num_attention_heads": 12,
+  "pooler_num_fc_layers": 3,
+  "pooler_size_per_head": 128,
+  "pooler_type": "first_token_transform",
+  "position_embedding_type": "absolute",
+  "torch_dtype": "float32",
+  "transformers_version": "4.46.2",
+  "type_vocab_size": 2,
+  "use_cache": true,
+  "vocab_size": 119547
+}

model.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:2a002871ebaf57f1c843e507efc636586c9c042cf2cfa14d4d74f2f5c296c49f
+size 712027576

runs/Dec20_14-09-14_n27/events.out.tfevents.1734700178.n27.269776.0 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:17ac176c427438cdea8947a4d48851b5a549af324f09d874c56e41cc8deca72f
+size 9203

runs/Dec20_14-11-04_n27/events.out.tfevents.1734700266.n27.269776.1 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:2763b1e5231b4a8fc9976ce10704af2672ac92b03d6fcf606b6bf3120d291c99
+size 9203

runs/Dec20_14-26-53_g08/events.out.tfevents.1734701215.g08.3246119.4 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:65862eb8e52d66138cacd087a86f7a184e08bf9fa917abe92de695456408f17d
+size 60452

runs/Feb03_16-51-14_dgx10/events.out.tfevents.1738597881.dgx10.76300.0 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:981d9055f04294b4eb124b24c062f389b30aa59176ade1e982cbfbf3aed263e4
+size 119149

runs/Feb03_16-51-14_dgx10/events.out.tfevents.1738612513.dgx10.76300.1 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:ef5907a25078a8cd504cc207ff199895ee9e82eae9f64033717d5c70696c409e
+size 757

special_tokens_map.json ADDED Viewed

	@@ -0,0 +1,44 @@

+{
+  "additional_special_tokens": [
+    {
+      "content": "[unused1]",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false
+    },
+    {
+      "content": "[unused2]",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false
+    },
+    {
+      "content": "[unused3]",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false
+    },
+    {
+      "content": "[unused4]",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false
+    },
+    {
+      "content": "[unused5]",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false
+    }
+  ],
+  "cls_token": "[CLS]",
+  "mask_token": "[MASK]",
+  "pad_token": "[PAD]",
+  "sep_token": "[SEP]",
+  "unk_token": "[UNK]"
+}

tokenizer.json ADDED Viewed

The diff for this file is too large to render. See raw diff

tokenizer_config.json ADDED Viewed

	@@ -0,0 +1,102 @@

+{
+  "added_tokens_decoder": {
+    "0": {
+      "content": "[PAD]",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "1": {
+      "content": "[unused1]",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "2": {
+      "content": "[unused2]",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "3": {
+      "content": "[unused3]",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "4": {
+      "content": "[unused4]",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "5": {
+      "content": "[unused5]",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "100": {
+      "content": "[UNK]",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "101": {
+      "content": "[CLS]",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "102": {
+      "content": "[SEP]",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "103": {
+      "content": "[MASK]",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    }
+  },
+  "additional_special_tokens": [
+    "[unused1]",
+    "[unused2]",
+    "[unused3]",
+    "[unused4]",
+    "[unused5]"
+  ],
+  "clean_up_tokenization_spaces": false,
+  "cls_token": "[CLS]",
+  "do_lower_case": false,
+  "mask_token": "[MASK]",
+  "model_max_length": 512,
+  "pad_token": "[PAD]",
+  "sep_token": "[SEP]",
+  "strip_accents": null,
+  "tokenize_chinese_chars": true,
+  "tokenizer_class": "BertTokenizer",
+  "unk_token": "[UNK]"
+}

training_args.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:e2aa2204c2df7891c355527756f7f876fcc11529368cf074ad96779e102d4328
+size 5304

vocab.txt ADDED Viewed

The diff for this file is too large to render. See raw diff