Edit model card

EElayoutlmv3_jordyvl_rvl_cdip_100_examples_per_class_2023-07-06_g040

This model is a fine-tuned version of microsoft/layoutlmv3-base on an unknown dataset. It achieves the following results on the evaluation set:

  • Loss: 1.1088
  • Accuracy: 0.715
  • Exit 0 Accuracy: 0.1175
  • Exit 1 Accuracy: 0.1575
  • Exit 2 Accuracy: 0.3075
  • Exit 3 Accuracy: 0.32
  • Exit 4 Accuracy: 0.0675

Model description

More information needed

Intended uses & limitations

More information needed

Training and evaluation data

More information needed

Training procedure

Training hyperparameters

The following hyperparameters were used during training:

  • learning_rate: 2e-05
  • train_batch_size: 12
  • eval_batch_size: 4
  • seed: 42
  • gradient_accumulation_steps: 24
  • total_train_batch_size: 288
  • optimizer: Adam with betas=(0.9,0.999) and epsilon=1e-08
  • lr_scheduler_type: linear
  • num_epochs: 60

Training results

Training Loss Epoch Step Validation Loss Accuracy Exit 0 Accuracy Exit 1 Accuracy Exit 2 Accuracy Exit 3 Accuracy Exit 4 Accuracy
No log 0.72 2 2.7601 0.11 0.0825 0.0675 0.0875 0.0625 0.0625
No log 1.72 4 2.7329 0.115 0.07 0.065 0.115 0.0625 0.0625
No log 2.72 6 2.6953 0.135 0.075 0.06 0.12 0.0625 0.0625
No log 3.72 8 2.6612 0.165 0.08 0.055 0.1225 0.0625 0.0625
No log 4.72 10 2.6176 0.1925 0.0875 0.0575 0.1175 0.0625 0.0625
No log 5.72 12 2.5681 0.2125 0.09 0.08 0.1225 0.0625 0.0625
No log 6.72 14 2.5380 0.2125 0.095 0.08 0.125 0.0625 0.0625
No log 7.72 16 2.5137 0.2275 0.095 0.09 0.125 0.0625 0.0625
No log 8.72 18 2.4662 0.2775 0.095 0.0975 0.125 0.0625 0.0625
No log 9.72 20 2.4192 0.3 0.0925 0.105 0.1275 0.0625 0.0625
No log 10.72 22 2.3755 0.3075 0.095 0.1225 0.135 0.0625 0.0625
No log 11.72 24 2.3290 0.3225 0.0975 0.1175 0.125 0.0625 0.0625
No log 12.72 26 2.2739 0.3375 0.1 0.115 0.125 0.0625 0.0625
No log 13.72 28 2.2219 0.3525 0.0975 0.125 0.13 0.065 0.0625
No log 14.72 30 2.1835 0.3525 0.1 0.125 0.1475 0.065 0.0625
No log 15.72 32 2.1610 0.3725 0.1025 0.1275 0.155 0.0675 0.0625
No log 16.72 34 2.1139 0.39 0.1025 0.135 0.1675 0.07 0.0625
No log 17.72 36 2.0748 0.405 0.1 0.1375 0.185 0.0725 0.0625
No log 18.72 38 2.0145 0.4225 0.1025 0.14 0.1875 0.0725 0.0625
No log 19.72 40 1.9595 0.4475 0.1025 0.145 0.185 0.0725 0.0625
No log 20.72 42 1.9077 0.4875 0.1025 0.1425 0.18 0.085 0.0625
No log 21.72 44 1.8328 0.52 0.1025 0.145 0.185 0.11 0.0625
No log 22.72 46 1.7703 0.555 0.105 0.1425 0.185 0.1125 0.0625
No log 23.72 48 1.7462 0.565 0.11 0.1425 0.2025 0.11 0.0625
No log 24.72 50 1.6894 0.5625 0.1125 0.14 0.205 0.12 0.0625
No log 25.72 52 1.6273 0.585 0.1125 0.1475 0.205 0.1225 0.0625
No log 26.72 54 1.5894 0.5875 0.115 0.1475 0.21 0.1325 0.0625
No log 27.72 56 1.5567 0.605 0.115 0.1475 0.21 0.13 0.0625
No log 28.72 58 1.5013 0.6225 0.115 0.1475 0.215 0.135 0.0625
No log 29.72 60 1.4588 0.64 0.115 0.15 0.2175 0.145 0.0625
No log 30.72 62 1.4424 0.6425 0.115 0.15 0.23 0.145 0.065
No log 31.72 64 1.4074 0.65 0.115 0.1475 0.245 0.1475 0.065
No log 32.72 66 1.3663 0.6675 0.115 0.1475 0.2475 0.17 0.065
No log 33.72 68 1.3465 0.67 0.1175 0.1475 0.26 0.17 0.065
No log 34.72 70 1.3363 0.6675 0.115 0.15 0.265 0.18 0.065
No log 35.72 72 1.3183 0.67 0.1175 0.15 0.2725 0.185 0.0625
No log 36.72 74 1.2789 0.7025 0.1175 0.1525 0.2725 0.195 0.0625
No log 37.72 76 1.2625 0.7025 0.12 0.1525 0.2725 0.22 0.065
No log 38.72 78 1.2645 0.6875 0.12 0.1525 0.2725 0.2325 0.065
No log 39.72 80 1.2384 0.695 0.1225 0.1525 0.275 0.24 0.065
No log 40.72 82 1.2138 0.7075 0.1225 0.1525 0.29 0.2475 0.065
No log 41.72 84 1.2041 0.6975 0.12 0.1525 0.29 0.2475 0.065
No log 42.72 86 1.1907 0.7075 0.1175 0.1525 0.29 0.2575 0.0625
No log 43.72 88 1.1784 0.7075 0.1175 0.1525 0.2925 0.2675 0.0625
No log 44.72 90 1.1678 0.715 0.1175 0.1525 0.2925 0.2875 0.0625
No log 45.72 92 1.1662 0.715 0.1175 0.155 0.295 0.285 0.0625
No log 46.72 94 1.1568 0.715 0.1175 0.155 0.295 0.2925 0.0625
No log 47.72 96 1.1497 0.715 0.1175 0.155 0.3 0.3 0.0625
No log 48.72 98 1.1456 0.715 0.1175 0.1575 0.3 0.3025 0.065
No log 49.72 100 1.1406 0.7125 0.1175 0.1575 0.2975 0.305 0.0675
No log 50.72 102 1.1333 0.72 0.1175 0.1575 0.2975 0.305 0.0675
No log 51.72 104 1.1242 0.7175 0.1175 0.1575 0.2975 0.3125 0.0675
No log 52.72 106 1.1197 0.7125 0.1175 0.1575 0.2975 0.3125 0.0675
No log 53.72 108 1.1161 0.715 0.1175 0.1575 0.3 0.3125 0.0675
No log 54.72 110 1.1114 0.715 0.1175 0.1575 0.3075 0.3125 0.0675
No log 55.72 112 1.1096 0.715 0.1175 0.1575 0.315 0.32 0.0675
No log 56.72 114 1.1084 0.715 0.1175 0.1575 0.3125 0.32 0.0675
No log 57.72 116 1.1085 0.715 0.1175 0.1575 0.3075 0.32 0.0675
No log 58.72 118 1.1089 0.7125 0.1175 0.1575 0.3075 0.32 0.0675
No log 59.72 120 1.1088 0.715 0.1175 0.1575 0.3075 0.32 0.0675

Framework versions

  • Transformers 4.26.1
  • Pytorch 1.13.1.post200
  • Datasets 2.9.0
  • Tokenizers 0.13.2
Downloads last month
2
Inference Examples
This model does not have enough activity to be deployed to Inference API (serverless) yet. Increase its social visibility and check back later, or deploy to Inference Endpoints (dedicated) instead.