pierreguillou
/

lilt-xlm-roberta-base-finetuned-with-DocLayNet-base-at-linelevel-ml384

Model card Files Files and versions Metrics Training metrics Community

pierreguillou commited on Feb 9, 2023

Commit

e1f7461

•

1 Parent(s): a6276de

Training in progress, step 1500

Browse files

Files changed (24) hide show

checkpoint-1000/config.json +56 -0
checkpoint-1000/optimizer.pt +3 -0
checkpoint-1000/pytorch_model.bin +3 -0
checkpoint-1000/rng_state.pth +3 -0
checkpoint-1000/scaler.pt +3 -0
checkpoint-1000/scheduler.pt +3 -0
checkpoint-1000/special_tokens_map.json +15 -0
checkpoint-1000/tokenizer.json +3 -0
checkpoint-1000/tokenizer_config.json +20 -0
checkpoint-1000/trainer_state.json +52 -0
checkpoint-1000/training_args.bin +3 -0
checkpoint-1500/config.json +56 -0
checkpoint-1500/optimizer.pt +3 -0
checkpoint-1500/pytorch_model.bin +3 -0
checkpoint-1500/rng_state.pth +3 -0
checkpoint-1500/scaler.pt +3 -0
checkpoint-1500/scheduler.pt +3 -0
checkpoint-1500/special_tokens_map.json +15 -0
checkpoint-1500/tokenizer.json +3 -0
checkpoint-1500/tokenizer_config.json +20 -0
checkpoint-1500/trainer_state.json +70 -0
checkpoint-1500/training_args.bin +3 -0
pytorch_model.bin +1 -1
runs/Feb09_15-43-15_f1c8d3a96fe7/events.out.tfevents.1675957409.f1c8d3a96fe7.143.0 +2 -2

checkpoint-1000/config.json ADDED Viewed

	@@ -0,0 +1,56 @@

+{
+  "_name_or_path": "nielsr/lilt-xlm-roberta-base",
+  "architectures": [
+    "LiltForTokenClassification"
+  ],
+  "attention_probs_dropout_prob": 0.1,
+  "bos_token_id": 0,
+  "channel_shrink_ratio": 4,
+  "classifier_dropout": null,
+  "eos_token_id": 2,
+  "hidden_act": "gelu",
+  "hidden_dropout_prob": 0.1,
+  "hidden_size": 768,
+  "id2label": {
+    "0": "Caption",
+    "1": "Footnote",
+    "2": "Formula",
+    "3": "List-item",
+    "4": "Page-footer",
+    "5": "Page-header",
+    "6": "Picture",
+    "7": "Section-header",
+    "8": "Table",
+    "9": "Text",
+    "10": "Title"
+  },
+  "initializer_range": 0.02,
+  "intermediate_size": 3072,
+  "label2id": {
+    "Caption": 0,
+    "Footnote": 1,
+    "Formula": 2,
+    "List-item": 3,
+    "Page-footer": 4,
+    "Page-header": 5,
+    "Picture": 6,
+    "Section-header": 7,
+    "Table": 8,
+    "Text": 9,
+    "Title": 10
+  },
+  "layer_norm_eps": 1e-05,
+  "max_2d_position_embeddings": 1024,
+  "max_position_embeddings": 514,
+  "model_type": "lilt",
+  "num_attention_heads": 12,
+  "num_hidden_layers": 12,
+  "output_past": true,
+  "pad_token_id": 1,
+  "position_embedding_type": "absolute",
+  "torch_dtype": "float32",
+  "transformers_version": "4.26.0",
+  "type_vocab_size": 1,
+  "use_cache": true,
+  "vocab_size": 250002
+}

checkpoint-1000/optimizer.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:850031ce3243a80d3659b496331db88ba7151ffeacf08604ac7171638cef7b44
+size 2265828101

checkpoint-1000/pytorch_model.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:03c23af0358fb05f012a6b62f08cda0f0f77800ae18932f19ad494e52ef62d8e
+size 1134425553

checkpoint-1000/rng_state.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:b77afc8dc240a230df75727f986b17d934e998fdd9251c9afa1179522f006116
+size 14575

checkpoint-1000/scaler.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:549c363f84648ad8593fc1d45abed2e334ff664013812020536a7e08d3a19ed2
+size 557

checkpoint-1000/scheduler.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:dcab0ffe66d73213bb723e7ed3816ba449fe7bd0b2f3ceae044473cf432e3783
+size 627

checkpoint-1000/special_tokens_map.json ADDED Viewed

	@@ -0,0 +1,15 @@

+{
+  "bos_token": "<s>",
+  "cls_token": "<s>",
+  "eos_token": "</s>",
+  "mask_token": {
+    "content": "<mask>",
+    "lstrip": true,
+    "normalized": false,
+    "rstrip": false,
+    "single_word": false
+  },
+  "pad_token": "<pad>",
+  "sep_token": "</s>",
+  "unk_token": "<unk>"
+}

checkpoint-1000/tokenizer.json ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:62c24cdc13d4c9952d63718d6c9fa4c287974249e16b7ade6d5a85e7bbb75626
+size 17082660

checkpoint-1000/tokenizer_config.json ADDED Viewed

	@@ -0,0 +1,20 @@

+{
+  "bos_token": "<s>",
+  "cls_token": "<s>",
+  "eos_token": "</s>",
+  "mask_token": {
+    "__type": "AddedToken",
+    "content": "<mask>",
+    "lstrip": true,
+    "normalized": true,
+    "rstrip": false,
+    "single_word": false
+  },
+  "model_max_length": 512,
+  "name_or_path": "nielsr/lilt-xlm-roberta-base",
+  "pad_token": "<pad>",
+  "sep_token": "</s>",
+  "special_tokens_map_file": null,
+  "tokenizer_class": "XLMRobertaTokenizer",
+  "unk_token": "<unk>"
+}

checkpoint-1000/trainer_state.json ADDED Viewed

	@@ -0,0 +1,52 @@

+{
+  "best_metric": 0.8311511798105226,
+  "best_model_checkpoint": "DocLayNet/lilt-xlm-roberta-base-finetuned-DocLayNet-base_ml384-v2/checkpoint-1000",
+  "epoch": 0.4154549231408392,
+  "global_step": 1000,
+  "is_hyper_param_search": false,
+  "is_local_process_zero": true,
+  "is_world_process_zero": true,
+  "log_history": [
+    {
+      "epoch": 0.21,
+      "learning_rate": 4.793934358122144e-05,
+      "loss": 0.7223,
+      "step": 500
+    },
+    {
+      "epoch": 0.21,
+      "eval_accuracy": 0.7741471103890881,
+      "eval_f1": 0.7741471103890881,
+      "eval_loss": 0.7764509916305542,
+      "eval_precision": 0.7741471103890881,
+      "eval_recall": 0.7741471103890881,
+      "eval_runtime": 33.2902,
+      "eval_samples_per_second": 61.64,
+      "eval_steps_per_second": 3.875,
+      "step": 500
+    },
+    {
+      "epoch": 0.42,
+      "learning_rate": 4.5870378063980065e-05,
+      "loss": 0.4469,
+      "step": 1000
+    },
+    {
+      "epoch": 0.42,
+      "eval_accuracy": 0.8311511798105226,
+      "eval_f1": 0.8311511798105226,
+      "eval_loss": 0.5913723707199097,
+      "eval_precision": 0.8311511798105226,
+      "eval_recall": 0.8311511798105226,
+      "eval_runtime": 37.4699,
+      "eval_samples_per_second": 54.764,
+      "eval_steps_per_second": 3.443,
+      "step": 1000
+    }
+  ],
+  "max_steps": 12035,
+  "num_train_epochs": 5,
+  "total_flos": 1669033433088000.0,
+  "trial_name": null,
+  "trial_params": null
+}

checkpoint-1000/training_args.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:2b3cb303483efa6f2dc51db1cfb9b16000da398e2d72673041025bfff104b3b8
+size 3643

checkpoint-1500/config.json ADDED Viewed

	@@ -0,0 +1,56 @@

+{
+  "_name_or_path": "nielsr/lilt-xlm-roberta-base",
+  "architectures": [
+    "LiltForTokenClassification"
+  ],
+  "attention_probs_dropout_prob": 0.1,
+  "bos_token_id": 0,
+  "channel_shrink_ratio": 4,
+  "classifier_dropout": null,
+  "eos_token_id": 2,
+  "hidden_act": "gelu",
+  "hidden_dropout_prob": 0.1,
+  "hidden_size": 768,
+  "id2label": {
+    "0": "Caption",
+    "1": "Footnote",
+    "2": "Formula",
+    "3": "List-item",
+    "4": "Page-footer",
+    "5": "Page-header",
+    "6": "Picture",
+    "7": "Section-header",
+    "8": "Table",
+    "9": "Text",
+    "10": "Title"
+  },
+  "initializer_range": 0.02,
+  "intermediate_size": 3072,
+  "label2id": {
+    "Caption": 0,
+    "Footnote": 1,
+    "Formula": 2,
+    "List-item": 3,
+    "Page-footer": 4,
+    "Page-header": 5,
+    "Picture": 6,
+    "Section-header": 7,
+    "Table": 8,
+    "Text": 9,
+    "Title": 10
+  },
+  "layer_norm_eps": 1e-05,
+  "max_2d_position_embeddings": 1024,
+  "max_position_embeddings": 514,
+  "model_type": "lilt",
+  "num_attention_heads": 12,
+  "num_hidden_layers": 12,
+  "output_past": true,
+  "pad_token_id": 1,
+  "position_embedding_type": "absolute",
+  "torch_dtype": "float32",
+  "transformers_version": "4.26.0",
+  "type_vocab_size": 1,
+  "use_cache": true,
+  "vocab_size": 250002
+}

checkpoint-1500/optimizer.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:e23364a6999277a663e128d860936666da5c97d392396e7e1bb598c485db3e4c
+size 2265828101

checkpoint-1500/pytorch_model.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:70b1a29b3ccb13877c06b9c50bf20c54e7d085e260a305e3376c872a9cfa9e2e
+size 1134425553

checkpoint-1500/rng_state.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:f8c587b97653ca2e1fe2cda77f5e5c4a3c7a1593d3d2f35db0d2ca4e7933179f
+size 14575

checkpoint-1500/scaler.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:9c2561ef8d03a8a364e3db0bdeeef0d1ebf7cf016b7859262ac8c8947d6e8539
+size 557

checkpoint-1500/scheduler.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:6cb4c24baee1d80158990ceb4f9780c1a6dd6396dffda96df7d63fa2d0ae5653
+size 627

checkpoint-1500/special_tokens_map.json ADDED Viewed

	@@ -0,0 +1,15 @@

+{
+  "bos_token": "<s>",
+  "cls_token": "<s>",
+  "eos_token": "</s>",
+  "mask_token": {
+    "content": "<mask>",
+    "lstrip": true,
+    "normalized": false,
+    "rstrip": false,
+    "single_word": false
+  },
+  "pad_token": "<pad>",
+  "sep_token": "</s>",
+  "unk_token": "<unk>"
+}

checkpoint-1500/tokenizer.json ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:62c24cdc13d4c9952d63718d6c9fa4c287974249e16b7ade6d5a85e7bbb75626
+size 17082660

checkpoint-1500/tokenizer_config.json ADDED Viewed

	@@ -0,0 +1,20 @@

+{
+  "bos_token": "<s>",
+  "cls_token": "<s>",
+  "eos_token": "</s>",
+  "mask_token": {
+    "__type": "AddedToken",
+    "content": "<mask>",
+    "lstrip": true,
+    "normalized": true,
+    "rstrip": false,
+    "single_word": false
+  },
+  "model_max_length": 512,
+  "name_or_path": "nielsr/lilt-xlm-roberta-base",
+  "pad_token": "<pad>",
+  "sep_token": "</s>",
+  "special_tokens_map_file": null,
+  "tokenizer_class": "XLMRobertaTokenizer",
+  "unk_token": "<unk>"
+}

checkpoint-1500/trainer_state.json ADDED Viewed

	@@ -0,0 +1,70 @@

+{
+  "best_metric": 0.8311511798105226,
+  "best_model_checkpoint": "DocLayNet/lilt-xlm-roberta-base-finetuned-DocLayNet-base_ml384-v2/checkpoint-1000",
+  "epoch": 0.6231823847112589,
+  "global_step": 1500,
+  "is_hyper_param_search": false,
+  "is_local_process_zero": true,
+  "is_world_process_zero": true,
+  "log_history": [
+    {
+      "epoch": 0.21,
+      "learning_rate": 4.793934358122144e-05,
+      "loss": 0.7223,
+      "step": 500
+    },
+    {
+      "epoch": 0.21,
+      "eval_accuracy": 0.7741471103890881,
+      "eval_f1": 0.7741471103890881,
+      "eval_loss": 0.7764509916305542,
+      "eval_precision": 0.7741471103890881,
+      "eval_recall": 0.7741471103890881,
+      "eval_runtime": 33.2902,
+      "eval_samples_per_second": 61.64,
+      "eval_steps_per_second": 3.875,
+      "step": 500
+    },
+    {
+      "epoch": 0.42,
+      "learning_rate": 4.5870378063980065e-05,
+      "loss": 0.4469,
+      "step": 1000
+    },
+    {
+      "epoch": 0.42,
+      "eval_accuracy": 0.8311511798105226,
+      "eval_f1": 0.8311511798105226,
+      "eval_loss": 0.5913723707199097,
+      "eval_precision": 0.8311511798105226,
+      "eval_recall": 0.8311511798105226,
+      "eval_runtime": 37.4699,
+      "eval_samples_per_second": 54.764,
+      "eval_steps_per_second": 3.443,
+      "step": 1000
+    },
+    {
+      "epoch": 0.62,
+      "learning_rate": 4.3793103448275864e-05,
+      "loss": 0.3819,
+      "step": 1500
+    },
+    {
+      "epoch": 0.62,
+      "eval_accuracy": 0.8102330668639719,
+      "eval_f1": 0.8102330668639719,
+      "eval_loss": 0.8744572997093201,
+      "eval_precision": 0.8102330668639719,
+      "eval_recall": 0.8102330668639719,
+      "eval_runtime": 34.6123,
+      "eval_samples_per_second": 59.285,
+      "eval_steps_per_second": 3.727,
+      "step": 1500
+    }
+  ],
+  "max_steps": 12035,
+  "num_train_epochs": 5,
+  "total_flos": 2503550149632000.0,
+  "trial_name": null,
+  "trial_params": null
+}

checkpoint-1500/training_args.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:2b3cb303483efa6f2dc51db1cfb9b16000da398e2d72673041025bfff104b3b8
+size 3643

pytorch_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:5de718e31c9f491c0dfba691cef2fadf6de01ce7e4513429474a72b167fc8394
 size 1134425553

 version https://git-lfs.github.com/spec/v1
+oid sha256:70b1a29b3ccb13877c06b9c50bf20c54e7d085e260a305e3376c872a9cfa9e2e
 size 1134425553

runs/Feb09_15-43-15_f1c8d3a96fe7/events.out.tfevents.1675957409.f1c8d3a96fe7.143.0 CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:01422eac22c1e831a9f9acda84370c4c1858be607d7cd440776b6e970bb0b54f
-size 5258

 version https://git-lfs.github.com/spec/v1
+oid sha256:643429707a800789d4f201880cd98c1a2057b31f9dc89474acd274f39e537fbf
+size 6516