Training in progress, step 500

Files changed (7) hide show

config.json CHANGED Viewed

@@ -61,7 +61,7 @@
   "shape_size": 128,
   "text_embed": true,
   "torch_dtype": "float32",
-  "transformers_version": "4.21.0.dev0",
   "type_vocab_size": 1,
   "visual_embed": true,
   "vocab_size": 50265

   "shape_size": 128,
   "text_embed": true,
   "torch_dtype": "float32",
+  "transformers_version": "4.32.0.dev0",
   "type_vocab_size": 1,
   "visual_embed": true,
   "vocab_size": 50265

merges.txt CHANGED Viewed

@@ -1,4 +1,4 @@
-#version: 0.2 - Trained by `huggingface/tokenizers`
 Ġ t
 Ġ a
 h e

+#version: 0.2
 Ġ t
 Ġ a
 h e

preprocessor_config.json CHANGED Viewed

@@ -1,6 +1,7 @@
 {
   "apply_ocr": false,
   "do_normalize": true,
   "do_resize": true,
   "feature_extractor_type": "LayoutLMv3FeatureExtractor",
   "image_mean": [
@@ -8,6 +9,7 @@
     0.5,
     0.5
   ],
   "image_std": [
     0.5,
     0.5,
@@ -16,5 +18,10 @@
   "ocr_lang": null,
   "processor_class": "LayoutLMv3Processor",
   "resample": 2,
-  "size": 224
 }

 {
   "apply_ocr": false,
   "do_normalize": true,
+  "do_rescale": true,
   "do_resize": true,
   "feature_extractor_type": "LayoutLMv3FeatureExtractor",
   "image_mean": [
     0.5,
     0.5
   ],
+  "image_processor_type": "LayoutLMv3ImageProcessor",
   "image_std": [
     0.5,
     0.5,
   "ocr_lang": null,
   "processor_class": "LayoutLMv3Processor",
   "resample": 2,
+  "rescale_factor": 0.00392156862745098,
+  "size": {
+    "height": 224,
+    "width": 224
+  },
+  "tesseract_config": ""
 }

pytorch_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:5d07782f3f5aa5a7dca90e92f435c4c76c9070dc8bc477156c12d5f1bca288d4
-size 503784271

 version https://git-lfs.github.com/spec/v1
+oid sha256:8ce35ddc64488d58f7b52563960bf91e5e566b170b1429176954ff7ed7154b90
+size 503781677

tokenizer.json CHANGED Viewed

@@ -96,6 +96,7 @@
     "continuing_subword_prefix": "",
     "end_of_word_suffix": "",
     "fuse_unk": false,
     "vocab": {
       "<s>": 0,
       "<pad>": 1,

     "continuing_subword_prefix": "",
     "end_of_word_suffix": "",
     "fuse_unk": false,
+    "byte_fallback": false,
     "vocab": {
       "<s>": 0,
       "<pad>": 1,

tokenizer_config.json CHANGED Viewed

@@ -9,6 +9,7 @@
     "rstrip": false,
     "single_word": false
   },
   "cls_token": {
     "__type": "AddedToken",
     "content": "<s>",
@@ -41,7 +42,6 @@
     "single_word": false
   },
   "model_max_length": 512,
-  "name_or_path": "microsoft/layoutlmv3-base",
   "only_label_first_subword": true,
   "pad_token": {
     "__type": "AddedToken",
@@ -73,7 +73,6 @@
     0,
     0
   ],
-  "special_tokens_map_file": null,
   "tokenizer_class": "LayoutLMv3Tokenizer",
   "trim_offsets": true,
   "unk_token": {

     "rstrip": false,
     "single_word": false
   },
+  "clean_up_tokenization_spaces": true,
   "cls_token": {
     "__type": "AddedToken",
     "content": "<s>",
     "single_word": false
   },
   "model_max_length": 512,
   "only_label_first_subword": true,
   "pad_token": {
     "__type": "AddedToken",
     0,
     0
   ],
   "tokenizer_class": "LayoutLMv3Tokenizer",
   "trim_offsets": true,
   "unk_token": {

training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:906d3d77a7a1daa4b8b8913dd52265a86c71d76d3f3e77fe76cf3f87a6b5a5c3
-size 3375

 version https://git-lfs.github.com/spec/v1
+oid sha256:5f567568bcf823adc54555537461a0da99bee2a24a787f432eab06b5a3eac40e
+size 4091