Add JPQD model

Browse files

Files changed (16) hide show

.gitattributes +1 -0
README.md +91 -0
all_results.json +12 -0
compressed_graph.dot +0 -0
config.json +255 -0
eval_results.json +8 -0
nncf_output.log +0 -0
openvino_config.json +86 -0
openvino_model.bin +3 -0
openvino_model.xml +3 -0
original_graph.dot +0 -0
preprocessor_config.json +23 -0
structured_sparsity.csv +145 -0
train_results.json +7 -0
trainer_state.json +0 -0
training_args.bin +3 -0

.gitattributes CHANGED Viewed

@@ -32,3 +32,4 @@ saved_model/**/* filter=lfs diff=lfs merge=lfs -text
 *.zip filter=lfs diff=lfs merge=lfs -text
 *.zst filter=lfs diff=lfs merge=lfs -text
 *tfevents* filter=lfs diff=lfs merge=lfs -text

 *.zip filter=lfs diff=lfs merge=lfs -text
 *.zst filter=lfs diff=lfs merge=lfs -text
 *tfevents* filter=lfs diff=lfs merge=lfs -text
+*.xml filter=lfs diff=lfs merge=lfs -text

README.md ADDED Viewed

	@@ -0,0 +1,91 @@

+---
+license: apache-2.0
+tags:
+- image-classification
+- vision
+- generated_from_trainer
+datasets:
+- food101
+metrics:
+- accuracy
+model-index:
+- name: swin-base-food101-jpqd-ov
+  results:
+  - task:
+      name: Image Classification
+      type: image-classification
+    dataset:
+      name: food101
+      type: food101
+      config: default
+      split: validation
+      args: default
+    metrics:
+    - name: Accuracy
+      type: accuracy
+      value: 0.9060990099009901
+---
+<!-- This model card has been generated automatically according to the information the Trainer had access to. You
+should probably proofread and complete it, then remove this comment. -->
+# swin-base-food101-jpqd-ov
+It was compressed using [NNCF](https://github.com/openvinotoolkit/nncf) with [Optimum Intel](https://github.com/huggingface/optimum-intel#openvino) following the
+JPQD image classification example.
+This model is a fine-tuned version of [microsoft/swin-base-patch4-window7-224](https://huggingface.co/microsoft/swin-base-patch4-window7-224) on the food101 dataset.
+It achieves the following results on the evaluation set:
+- Loss: 0.3396
+- Accuracy: 0.9061
+### Training hyperparameters
+The following hyperparameters were used during training:
+- learning_rate: 5e-05
+- train_batch_size: 16
+- eval_batch_size: 128
+- seed: 42
+- gradient_accumulation_steps: 4
+- total_train_batch_size: 64
+- optimizer: Adam with betas=(0.9,0.999) and epsilon=1e-08
+- lr_scheduler_type: linear
+- lr_scheduler_warmup_ratio: 0.1
+- num_epochs: 10.0
+### Training results
+| Training Loss | Epoch | Step  | Validation Loss | Accuracy |
+|:-------------:|:-----:|:-----:|:---------------:|:--------:|
+| 2.2162        | 0.42  | 500   | 2.1111          | 0.7967   |
+| 0.729         | 0.84  | 1000  | 0.5474          | 0.8773   |
+| 0.7536        | 1.27  | 1500  | 0.3844          | 0.8984   |
+| 0.4822        | 1.69  | 2000  | 0.3340          | 0.9043   |
+| 12.2559       | 2.11  | 2500  | 12.0128         | 0.9033   |
+| 48.7302       | 2.54  | 3000  | 48.3874         | 0.8681   |
+| 75.1831       | 2.96  | 3500  | 75.3200         | 0.7183   |
+| 93.5572       | 3.38  | 4000  | 93.4142         | 0.5939   |
+| 103.798       | 3.8   | 4500  | 103.4427        | 0.5634   |
+| 108.0993      | 4.23  | 5000  | 108.6461        | 0.5490   |
+| 110.1265      | 4.65  | 5500  | 109.3663        | 0.5636   |
+| 1.5584        | 5.07  | 6000  | 0.9255          | 0.8374   |
+| 1.0883        | 5.49  | 6500  | 0.5841          | 0.8758   |
+| 0.7024        | 5.92  | 7000  | 0.5055          | 0.8854   |
+| 0.9033        | 6.34  | 7500  | 0.4639          | 0.8901   |
+| 0.6901        | 6.76  | 8000  | 0.4360          | 0.8947   |
+| 0.6114        | 7.19  | 8500  | 0.4080          | 0.8978   |
+| 0.5102        | 7.61  | 9000  | 0.3911          | 0.9009   |
+| 0.7154        | 8.03  | 9500  | 0.3747          | 0.9027   |
+| 0.5621        | 8.45  | 10000 | 0.3622          | 0.9021   |
+| 0.5262        | 8.88  | 10500 | 0.3554          | 0.9041   |
+| 0.5442        | 9.3   | 11000 | 0.3462          | 0.9053   |
+| 0.5615        | 9.72  | 11500 | 0.3416          | 0.9061   |
+### Framework versions
+- Transformers 4.26.1
+- Pytorch 1.13.1+cu117
+- Datasets 2.8.0
+- Tokenizers 0.13.2

all_results.json ADDED Viewed

	@@ -0,0 +1,12 @@

+{
+    "epoch": 10.0,
+    "eval_accuracy": 0.9060990099009901,
+    "eval_loss": 0.33955878019332886,
+    "eval_runtime": 224.5137,
+    "eval_samples_per_second": 112.465,
+    "eval_steps_per_second": 0.882,
+    "train_loss": 25.693809306425052,
+    "train_runtime": 41910.9513,
+    "train_samples_per_second": 18.074,
+    "train_steps_per_second": 0.282
+}

compressed_graph.dot ADDED Viewed

The diff for this file is too large to render. See raw diff

config.json ADDED Viewed

	@@ -0,0 +1,255 @@

+{
+  "_name_or_path": "microsoft/swin-base-patch4-window7-224",
+  "architectures": [
+    "NNCFNetwork"
+  ],
+  "attention_probs_dropout_prob": 0.0,
+  "depths": [
+    2,
+    2,
+    18,
+    2
+  ],
+  "drop_path_rate": 0.1,
+  "embed_dim": 128,
+  "encoder_stride": 32,
+  "finetuning_task": "image-classification",
+  "hidden_act": "gelu",
+  "hidden_dropout_prob": 0.0,
+  "hidden_size": 1024,
+  "id2label": {
+    "0": "apple_pie",
+    "1": "baby_back_ribs",
+    "10": "bruschetta",
+    "100": "waffles",
+    "11": "caesar_salad",
+    "12": "cannoli",
+    "13": "caprese_salad",
+    "14": "carrot_cake",
+    "15": "ceviche",
+    "16": "cheesecake",
+    "17": "cheese_plate",
+    "18": "chicken_curry",
+    "19": "chicken_quesadilla",
+    "2": "baklava",
+    "20": "chicken_wings",
+    "21": "chocolate_cake",
+    "22": "chocolate_mousse",
+    "23": "churros",
+    "24": "clam_chowder",
+    "25": "club_sandwich",
+    "26": "crab_cakes",
+    "27": "creme_brulee",
+    "28": "croque_madame",
+    "29": "cup_cakes",
+    "3": "beef_carpaccio",
+    "30": "deviled_eggs",
+    "31": "donuts",
+    "32": "dumplings",
+    "33": "edamame",
+    "34": "eggs_benedict",
+    "35": "escargots",
+    "36": "falafel",
+    "37": "filet_mignon",
+    "38": "fish_and_chips",
+    "39": "foie_gras",
+    "4": "beef_tartare",
+    "40": "french_fries",
+    "41": "french_onion_soup",
+    "42": "french_toast",
+    "43": "fried_calamari",
+    "44": "fried_rice",
+    "45": "frozen_yogurt",
+    "46": "garlic_bread",
+    "47": "gnocchi",
+    "48": "greek_salad",
+    "49": "grilled_cheese_sandwich",
+    "5": "beet_salad",
+    "50": "grilled_salmon",
+    "51": "guacamole",
+    "52": "gyoza",
+    "53": "hamburger",
+    "54": "hot_and_sour_soup",
+    "55": "hot_dog",
+    "56": "huevos_rancheros",
+    "57": "hummus",
+    "58": "ice_cream",
+    "59": "lasagna",
+    "6": "beignets",
+    "60": "lobster_bisque",
+    "61": "lobster_roll_sandwich",
+    "62": "macaroni_and_cheese",
+    "63": "macarons",
+    "64": "miso_soup",
+    "65": "mussels",
+    "66": "nachos",
+    "67": "omelette",
+    "68": "onion_rings",
+    "69": "oysters",
+    "7": "bibimbap",
+    "70": "pad_thai",
+    "71": "paella",
+    "72": "pancakes",
+    "73": "panna_cotta",
+    "74": "peking_duck",
+    "75": "pho",
+    "76": "pizza",
+    "77": "pork_chop",
+    "78": "poutine",
+    "79": "prime_rib",
+    "8": "bread_pudding",
+    "80": "pulled_pork_sandwich",
+    "81": "ramen",
+    "82": "ravioli",
+    "83": "red_velvet_cake",
+    "84": "risotto",
+    "85": "samosa",
+    "86": "sashimi",
+    "87": "scallops",
+    "88": "seaweed_salad",
+    "89": "shrimp_and_grits",
+    "9": "breakfast_burrito",
+    "90": "spaghetti_bolognese",
+    "91": "spaghetti_carbonara",
+    "92": "spring_rolls",
+    "93": "steak",
+    "94": "strawberry_shortcake",
+    "95": "sushi",
+    "96": "tacos",
+    "97": "takoyaki",
+    "98": "tiramisu",
+    "99": "tuna_tartare"
+  },
+  "image_size": 224,
+  "initializer_range": 0.02,
+  "label2id": {
+    "apple_pie": "0",
+    "baby_back_ribs": "1",
+    "baklava": "2",
+    "beef_carpaccio": "3",
+    "beef_tartare": "4",
+    "beet_salad": "5",
+    "beignets": "6",
+    "bibimbap": "7",
+    "bread_pudding": "8",
+    "breakfast_burrito": "9",
+    "bruschetta": "10",
+    "caesar_salad": "11",
+    "cannoli": "12",
+    "caprese_salad": "13",
+    "carrot_cake": "14",
+    "ceviche": "15",
+    "cheese_plate": "17",
+    "cheesecake": "16",
+    "chicken_curry": "18",
+    "chicken_quesadilla": "19",
+    "chicken_wings": "20",
+    "chocolate_cake": "21",
+    "chocolate_mousse": "22",
+    "churros": "23",
+    "clam_chowder": "24",
+    "club_sandwich": "25",
+    "crab_cakes": "26",
+    "creme_brulee": "27",
+    "croque_madame": "28",
+    "cup_cakes": "29",
+    "deviled_eggs": "30",
+    "donuts": "31",
+    "dumplings": "32",
+    "edamame": "33",
+    "eggs_benedict": "34",
+    "escargots": "35",
+    "falafel": "36",
+    "filet_mignon": "37",
+    "fish_and_chips": "38",
+    "foie_gras": "39",
+    "french_fries": "40",
+    "french_onion_soup": "41",
+    "french_toast": "42",
+    "fried_calamari": "43",
+    "fried_rice": "44",
+    "frozen_yogurt": "45",
+    "garlic_bread": "46",
+    "gnocchi": "47",
+    "greek_salad": "48",
+    "grilled_cheese_sandwich": "49",
+    "grilled_salmon": "50",
+    "guacamole": "51",
+    "gyoza": "52",
+    "hamburger": "53",
+    "hot_and_sour_soup": "54",
+    "hot_dog": "55",
+    "huevos_rancheros": "56",
+    "hummus": "57",
+    "ice_cream": "58",
+    "lasagna": "59",
+    "lobster_bisque": "60",
+    "lobster_roll_sandwich": "61",
+    "macaroni_and_cheese": "62",
+    "macarons": "63",
+    "miso_soup": "64",
+    "mussels": "65",
+    "nachos": "66",
+    "omelette": "67",
+    "onion_rings": "68",
+    "oysters": "69",
+    "pad_thai": "70",
+    "paella": "71",
+    "pancakes": "72",
+    "panna_cotta": "73",
+    "peking_duck": "74",
+    "pho": "75",
+    "pizza": "76",
+    "pork_chop": "77",
+    "poutine": "78",
+    "prime_rib": "79",
+    "pulled_pork_sandwich": "80",
+    "ramen": "81",
+    "ravioli": "82",
+    "red_velvet_cake": "83",
+    "risotto": "84",
+    "samosa": "85",
+    "sashimi": "86",
+    "scallops": "87",
+    "seaweed_salad": "88",
+    "shrimp_and_grits": "89",
+    "spaghetti_bolognese": "90",
+    "spaghetti_carbonara": "91",
+    "spring_rolls": "92",
+    "steak": "93",
+    "strawberry_shortcake": "94",
+    "sushi": "95",
+    "tacos": "96",
+    "takoyaki": "97",
+    "tiramisu": "98",
+    "tuna_tartare": "99",
+    "waffles": "100"
+  },
+  "layer_norm_eps": 1e-05,
+  "mlp_ratio": 4.0,
+  "model_type": "swin",
+  "num_channels": 3,
+  "num_heads": [
+    4,
+    8,
+    16,
+    32
+  ],
+  "num_layers": 4,
+  "out_features": null,
+  "patch_size": 4,
+  "path_norm": true,
+  "problem_type": "single_label_classification",
+  "qkv_bias": true,
+  "stage_names": [
+    "stem",
+    "stage1",
+    "stage2",
+    "stage3",
+    "stage4"
+  ],
+  "torch_dtype": "float32",
+  "transformers_version": "4.26.1",
+  "use_absolute_embeddings": false,
+  "window_size": 7
+}

eval_results.json ADDED Viewed

	@@ -0,0 +1,8 @@

+{
+    "epoch": 10.0,
+    "eval_accuracy": 0.9060990099009901,
+    "eval_loss": 0.33955878019332886,
+    "eval_runtime": 224.5137,
+    "eval_samples_per_second": 112.465,
+    "eval_steps_per_second": 0.882
+}

nncf_output.log ADDED Viewed

The diff for this file is too large to render. See raw diff

openvino_config.json ADDED Viewed

	@@ -0,0 +1,86 @@

+{
+  "compression": [
+    {
+      "algorithm": "movement_sparsity",
+      "ignored_scopes": [
+        "{re}.*PatchEmbed.*",
+        "{re}.*PatchMerging.*",
+        "{re}.*classifier.*",
+        "{re}.*LayerNorm.*"
+      ],
+      "params": {
+        "enable_structured_masking": true,
+        "importance_regularization_factor": 1.0,
+        "warmup_end_epoch": 5,
+        "warmup_start_epoch": 2
+      },
+      "sparse_structure_by_scopes": [
+        {
+          "mode": "block",
+          "sparse_factors": [
+            16,
+            16
+          ],
+          "target_scopes": "{re}.*SwinAttention.*"
+        },
+        {
+          "axis": 0,
+          "mode": "per_dim",
+          "target_scopes": "{re}.*SwinIntermediate.*"
+        },
+        {
+          "axis": 1,
+          "mode": "per_dim",
+          "target_scopes": "{re}.*SwinOutput.*"
+        }
+      ]
+    },
+    {
+      "algorithm": "quantization",
+      "export_to_onnx_standard_ops": false,
+      "ignored_scopes": [
+        "{re}.*__add___[0-1]",
+        "{re}.*layer_norm_0",
+        "{re}.*matmul_1",
+        "{re}.*__truediv__*"
+      ],
+      "initializer": {
+        "batchnorm_adaptation": {
+          "num_bn_adaptation_samples": 200
+        },
+        "range": {
+          "num_init_samples": 32,
+          "params": {
+            "max_percentile": 99.99,
+            "min_percentile": 0.01
+          },
+          "type": "percentile"
+        }
+      },
+      "overflow_fix": "enable",
+      "preset": "mixed",
+      "scope_overrides": {
+        "activations": {
+          "{re}.*matmul_0": {
+            "mode": "symmetric"
+          }
+        }
+      }
+    }
+  ],
+  "input_info": [
+    {
+      "keyword": "pixel_values",
+      "sample_size": [
+        16,
+        3,
+        224,
+        224
+      ],
+      "type": "float"
+    }
+  ],
+  "optimum_version": "1.7.1",
+  "save_onnx_model": false,
+  "transformers_version": "4.26.1"
+}

openvino_model.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:f9ecabfea4f940cb15e9e8cf6712edc6345e668946794d8dce79701de4bd0da9
+size 351628052

openvino_model.xml ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:40d77a91c23f1e0e29c3aed1d5a75fdfd2e343fdcfb3490df2cdf5bbc91b2159
+size 14235627

original_graph.dot ADDED Viewed

The diff for this file is too large to render. See raw diff

preprocessor_config.json ADDED Viewed

	@@ -0,0 +1,23 @@

+{
+  "do_normalize": true,
+  "do_rescale": true,
+  "do_resize": true,
+  "feature_extractor_type": "ViTFeatureExtractor",
+  "image_mean": [
+    0.485,
+    0.456,
+    0.406
+  ],
+  "image_processor_type": "ViTFeatureExtractor",
+  "image_std": [
+    0.229,
+    0.224,
+    0.225
+  ],
+  "resample": 3,
+  "rescale_factor": 0.00392156862745098,
+  "size": {
+    "height": 224,
+    "width": 224
+  }
+}

structured_sparsity.csv ADDED Viewed

	@@ -0,0 +1,145 @@

+,group_id,type,torch_module,weight_shape,pruned_weight_shape,bias_shape,pruned_bias_shape,head_or_channel_id_to_keep,module_node_name
+0,0,MHSA,nncf_module.swin.encoder.layers.0.blocks.0.attention.self.query,"(128, 128)","(64, 128)","(128,)","(64,)","[1, 3]",SwinForImageClassification/SwinModel[swin]/SwinEncoder[encoder]/ModuleList[layers]/SwinStage[0]/ModuleList[blocks]/SwinLayer[0]/SwinAttention[attention]/SwinSelfAttention[self]/NNCFLinear[query]/linear_0
+1,0,MHSA,nncf_module.swin.encoder.layers.0.blocks.0.attention.self.key,"(128, 128)","(64, 128)","(128,)","(64,)","[1, 3]",SwinForImageClassification/SwinModel[swin]/SwinEncoder[encoder]/ModuleList[layers]/SwinStage[0]/ModuleList[blocks]/SwinLayer[0]/SwinAttention[attention]/SwinSelfAttention[self]/NNCFLinear[key]/linear_0
+2,0,MHSA,nncf_module.swin.encoder.layers.0.blocks.0.attention.self.value,"(128, 128)","(64, 128)","(128,)","(64,)","[1, 3]",SwinForImageClassification/SwinModel[swin]/SwinEncoder[encoder]/ModuleList[layers]/SwinStage[0]/ModuleList[blocks]/SwinLayer[0]/SwinAttention[attention]/SwinSelfAttention[self]/NNCFLinear[value]/linear_0
+3,0,MHSA,nncf_module.swin.encoder.layers.0.blocks.0.attention.output.dense,"(128, 128)","(128, 64)","(128,)","(128,)","[1, 3]",SwinForImageClassification/SwinModel[swin]/SwinEncoder[encoder]/ModuleList[layers]/SwinStage[0]/ModuleList[blocks]/SwinLayer[0]/SwinAttention[attention]/SwinSelfOutput[output]/NNCFLinear[dense]/linear_0
+4,1,FF,nncf_module.swin.encoder.layers.0.blocks.0.intermediate.dense,"(512, 128)","(310, 128)","(512,)","(310,)",[310 items],SwinForImageClassification/SwinModel[swin]/SwinEncoder[encoder]/ModuleList[layers]/SwinStage[0]/ModuleList[blocks]/SwinLayer[0]/SwinIntermediate[intermediate]/NNCFLinear[dense]/linear_0
+5,1,FF,nncf_module.swin.encoder.layers.0.blocks.0.output.dense,"(128, 512)","(128, 310)","(128,)","(128,)",[310 items],SwinForImageClassification/SwinModel[swin]/SwinEncoder[encoder]/ModuleList[layers]/SwinStage[0]/ModuleList[blocks]/SwinLayer[0]/SwinOutput[output]/NNCFLinear[dense]/linear_0
+6,2,MHSA,nncf_module.swin.encoder.layers.0.blocks.1.attention.self.query,"(128, 128)","(32, 128)","(128,)","(32,)",[3],SwinForImageClassification/SwinModel[swin]/SwinEncoder[encoder]/ModuleList[layers]/SwinStage[0]/ModuleList[blocks]/SwinLayer[1]/SwinAttention[attention]/SwinSelfAttention[self]/NNCFLinear[query]/linear_0
+7,2,MHSA,nncf_module.swin.encoder.layers.0.blocks.1.attention.self.key,"(128, 128)","(32, 128)","(128,)","(32,)",[3],SwinForImageClassification/SwinModel[swin]/SwinEncoder[encoder]/ModuleList[layers]/SwinStage[0]/ModuleList[blocks]/SwinLayer[1]/SwinAttention[attention]/SwinSelfAttention[self]/NNCFLinear[key]/linear_0
+8,2,MHSA,nncf_module.swin.encoder.layers.0.blocks.1.attention.self.value,"(128, 128)","(32, 128)","(128,)","(32,)",[3],SwinForImageClassification/SwinModel[swin]/SwinEncoder[encoder]/ModuleList[layers]/SwinStage[0]/ModuleList[blocks]/SwinLayer[1]/SwinAttention[attention]/SwinSelfAttention[self]/NNCFLinear[value]/linear_0
+9,2,MHSA,nncf_module.swin.encoder.layers.0.blocks.1.attention.output.dense,"(128, 128)","(128, 32)","(128,)","(128,)",[3],SwinForImageClassification/SwinModel[swin]/SwinEncoder[encoder]/ModuleList[layers]/SwinStage[0]/ModuleList[blocks]/SwinLayer[1]/SwinAttention[attention]/SwinSelfOutput[output]/NNCFLinear[dense]/linear_0
+10,3,FF,nncf_module.swin.encoder.layers.0.blocks.1.intermediate.dense,"(512, 128)","(411, 128)","(512,)","(411,)",[411 items],SwinForImageClassification/SwinModel[swin]/SwinEncoder[encoder]/ModuleList[layers]/SwinStage[0]/ModuleList[blocks]/SwinLayer[1]/SwinIntermediate[intermediate]/NNCFLinear[dense]/linear_0
+11,3,FF,nncf_module.swin.encoder.layers.0.blocks.1.output.dense,"(128, 512)","(128, 411)","(128,)","(128,)",[411 items],SwinForImageClassification/SwinModel[swin]/SwinEncoder[encoder]/ModuleList[layers]/SwinStage[0]/ModuleList[blocks]/SwinLayer[1]/SwinOutput[output]/NNCFLinear[dense]/linear_0
+12,4,MHSA,nncf_module.swin.encoder.layers.1.blocks.0.attention.self.query,"(256, 256)","(96, 256)","(256,)","(96,)","[1, 3, 5]",SwinForImageClassification/SwinModel[swin]/SwinEncoder[encoder]/ModuleList[layers]/SwinStage[1]/ModuleList[blocks]/SwinLayer[0]/SwinAttention[attention]/SwinSelfAttention[self]/NNCFLinear[query]/linear_0
+13,4,MHSA,nncf_module.swin.encoder.layers.1.blocks.0.attention.self.key,"(256, 256)","(96, 256)","(256,)","(96,)","[1, 3, 5]",SwinForImageClassification/SwinModel[swin]/SwinEncoder[encoder]/ModuleList[layers]/SwinStage[1]/ModuleList[blocks]/SwinLayer[0]/SwinAttention[attention]/SwinSelfAttention[self]/NNCFLinear[key]/linear_0
+14,4,MHSA,nncf_module.swin.encoder.layers.1.blocks.0.attention.self.value,"(256, 256)","(96, 256)","(256,)","(96,)","[1, 3, 5]",SwinForImageClassification/SwinModel[swin]/SwinEncoder[encoder]/ModuleList[layers]/SwinStage[1]/ModuleList[blocks]/SwinLayer[0]/SwinAttention[attention]/SwinSelfAttention[self]/NNCFLinear[value]/linear_0
+15,4,MHSA,nncf_module.swin.encoder.layers.1.blocks.0.attention.output.dense,"(256, 256)","(256, 96)","(256,)","(256,)","[1, 3, 5]",SwinForImageClassification/SwinModel[swin]/SwinEncoder[encoder]/ModuleList[layers]/SwinStage[1]/ModuleList[blocks]/SwinLayer[0]/SwinAttention[attention]/SwinSelfOutput[output]/NNCFLinear[dense]/linear_0
+16,5,FF,nncf_module.swin.encoder.layers.1.blocks.0.intermediate.dense,"(1024, 256)","(787, 256)","(1024,)","(787,)",[787 items],SwinForImageClassification/SwinModel[swin]/SwinEncoder[encoder]/ModuleList[layers]/SwinStage[1]/ModuleList[blocks]/SwinLayer[0]/SwinIntermediate[intermediate]/NNCFLinear[dense]/linear_0
+17,5,FF,nncf_module.swin.encoder.layers.1.blocks.0.output.dense,"(256, 1024)","(256, 787)","(256,)","(256,)",[787 items],SwinForImageClassification/SwinModel[swin]/SwinEncoder[encoder]/ModuleList[layers]/SwinStage[1]/ModuleList[blocks]/SwinLayer[0]/SwinOutput[output]/NNCFLinear[dense]/linear_0
+18,6,MHSA,nncf_module.swin.encoder.layers.1.blocks.1.attention.self.query,"(256, 256)","(128, 256)","(256,)","(128,)","[0, 1, 5, 7]",SwinForImageClassification/SwinModel[swin]/SwinEncoder[encoder]/ModuleList[layers]/SwinStage[1]/ModuleList[blocks]/SwinLayer[1]/SwinAttention[attention]/SwinSelfAttention[self]/NNCFLinear[query]/linear_0
+19,6,MHSA,nncf_module.swin.encoder.layers.1.blocks.1.attention.self.key,"(256, 256)","(128, 256)","(256,)","(128,)","[0, 1, 5, 7]",SwinForImageClassification/SwinModel[swin]/SwinEncoder[encoder]/ModuleList[layers]/SwinStage[1]/ModuleList[blocks]/SwinLayer[1]/SwinAttention[attention]/SwinSelfAttention[self]/NNCFLinear[key]/linear_0
+20,6,MHSA,nncf_module.swin.encoder.layers.1.blocks.1.attention.self.value,"(256, 256)","(128, 256)","(256,)","(128,)","[0, 1, 5, 7]",SwinForImageClassification/SwinModel[swin]/SwinEncoder[encoder]/ModuleList[layers]/SwinStage[1]/ModuleList[blocks]/SwinLayer[1]/SwinAttention[attention]/SwinSelfAttention[self]/NNCFLinear[value]/linear_0
+21,6,MHSA,nncf_module.swin.encoder.layers.1.blocks.1.attention.output.dense,"(256, 256)","(256, 128)","(256,)","(256,)","[0, 1, 5, 7]",SwinForImageClassification/SwinModel[swin]/SwinEncoder[encoder]/ModuleList[layers]/SwinStage[1]/ModuleList[blocks]/SwinLayer[1]/SwinAttention[attention]/SwinSelfOutput[output]/NNCFLinear[dense]/linear_0
+22,7,FF,nncf_module.swin.encoder.layers.1.blocks.1.intermediate.dense,"(1024, 256)","(820, 256)","(1024,)","(820,)",[820 items],SwinForImageClassification/SwinModel[swin]/SwinEncoder[encoder]/ModuleList[layers]/SwinStage[1]/ModuleList[blocks]/SwinLayer[1]/SwinIntermediate[intermediate]/NNCFLinear[dense]/linear_0
+23,7,FF,nncf_module.swin.encoder.layers.1.blocks.1.output.dense,"(256, 1024)","(256, 820)","(256,)","(256,)",[820 items],SwinForImageClassification/SwinModel[swin]/SwinEncoder[encoder]/ModuleList[layers]/SwinStage[1]/ModuleList[blocks]/SwinLayer[1]/SwinOutput[output]/NNCFLinear[dense]/linear_0
+24,8,MHSA,nncf_module.swin.encoder.layers.2.blocks.0.attention.self.query,"(512, 512)","(224, 512)","(512,)","(224,)","[3, 4, 5, 8, 9, 10, 13]",SwinForImageClassification/SwinModel[swin]/SwinEncoder[encoder]/ModuleList[layers]/SwinStage[2]/ModuleList[blocks]/SwinLayer[0]/SwinAttention[attention]/SwinSelfAttention[self]/NNCFLinear[query]/linear_0
+25,8,MHSA,nncf_module.swin.encoder.layers.2.blocks.0.attention.self.key,"(512, 512)","(224, 512)","(512,)","(224,)","[3, 4, 5, 8, 9, 10, 13]",SwinForImageClassification/SwinModel[swin]/SwinEncoder[encoder]/ModuleList[layers]/SwinStage[2]/ModuleList[blocks]/SwinLayer[0]/SwinAttention[attention]/SwinSelfAttention[self]/NNCFLinear[key]/linear_0
+26,8,MHSA,nncf_module.swin.encoder.layers.2.blocks.0.attention.self.value,"(512, 512)","(224, 512)","(512,)","(224,)","[3, 4, 5, 8, 9, 10, 13]",SwinForImageClassification/SwinModel[swin]/SwinEncoder[encoder]/ModuleList[layers]/SwinStage[2]/ModuleList[blocks]/SwinLayer[0]/SwinAttention[attention]/SwinSelfAttention[self]/NNCFLinear[value]/linear_0
+27,8,MHSA,nncf_module.swin.encoder.layers.2.blocks.0.attention.output.dense,"(512, 512)","(512, 224)","(512,)","(512,)","[3, 4, 5, 8, 9, 10, 13]",SwinForImageClassification/SwinModel[swin]/SwinEncoder[encoder]/ModuleList[layers]/SwinStage[2]/ModuleList[blocks]/SwinLayer[0]/SwinAttention[attention]/SwinSelfOutput[output]/NNCFLinear[dense]/linear_0
+28,9,FF,nncf_module.swin.encoder.layers.2.blocks.0.intermediate.dense,"(2048, 512)","(1172, 512)","(2048,)","(1172,)",[1172 items],SwinForImageClassification/SwinModel[swin]/SwinEncoder[encoder]/ModuleList[layers]/SwinStage[2]/ModuleList[blocks]/SwinLayer[0]/SwinIntermediate[intermediate]/NNCFLinear[dense]/linear_0
+29,9,FF,nncf_module.swin.encoder.layers.2.blocks.0.output.dense,"(512, 2048)","(512, 1172)","(512,)","(512,)",[1172 items],SwinForImageClassification/SwinModel[swin]/SwinEncoder[encoder]/ModuleList[layers]/SwinStage[2]/ModuleList[blocks]/SwinLayer[0]/SwinOutput[output]/NNCFLinear[dense]/linear_0
+30,10,MHSA,nncf_module.swin.encoder.layers.2.blocks.1.attention.self.query,"(512, 512)","(320, 512)","(512,)","(320,)","[1, 6, 7, 8, 9, 10, 11, 12, 13, 14]",SwinForImageClassification/SwinModel[swin]/SwinEncoder[encoder]/ModuleList[layers]/SwinStage[2]/ModuleList[blocks]/SwinLayer[1]/SwinAttention[attention]/SwinSelfAttention[self]/NNCFLinear[query]/linear_0
+31,10,MHSA,nncf_module.swin.encoder.layers.2.blocks.1.attention.self.key,"(512, 512)","(320, 512)","(512,)","(320,)","[1, 6, 7, 8, 9, 10, 11, 12, 13, 14]",SwinForImageClassification/SwinModel[swin]/SwinEncoder[encoder]/ModuleList[layers]/SwinStage[2]/ModuleList[blocks]/SwinLayer[1]/SwinAttention[attention]/SwinSelfAttention[self]/NNCFLinear[key]/linear_0
+32,10,MHSA,nncf_module.swin.encoder.layers.2.blocks.1.attention.self.value,"(512, 512)","(320, 512)","(512,)","(320,)","[1, 6, 7, 8, 9, 10, 11, 12, 13, 14]",SwinForImageClassification/SwinModel[swin]/SwinEncoder[encoder]/ModuleList[layers]/SwinStage[2]/ModuleList[blocks]/SwinLayer[1]/SwinAttention[attention]/SwinSelfAttention[self]/NNCFLinear[value]/linear_0
+33,10,MHSA,nncf_module.swin.encoder.layers.2.blocks.1.attention.output.dense,"(512, 512)","(512, 320)","(512,)","(512,)","[1, 6, 7, 8, 9, 10, 11, 12, 13, 14]",SwinForImageClassification/SwinModel[swin]/SwinEncoder[encoder]/ModuleList[layers]/SwinStage[2]/ModuleList[blocks]/SwinLayer[1]/SwinAttention[attention]/SwinSelfOutput[output]/NNCFLinear[dense]/linear_0
+34,11,FF,nncf_module.swin.encoder.layers.2.blocks.1.intermediate.dense,"(2048, 512)","(1262, 512)","(2048,)","(1262,)",[1262 items],SwinForImageClassification/SwinModel[swin]/SwinEncoder[encoder]/ModuleList[layers]/SwinStage[2]/ModuleList[blocks]/SwinLayer[1]/SwinIntermediate[intermediate]/NNCFLinear[dense]/linear_0
+35,11,FF,nncf_module.swin.encoder.layers.2.blocks.1.output.dense,"(512, 2048)","(512, 1262)","(512,)","(512,)",[1262 items],SwinForImageClassification/SwinModel[swin]/SwinEncoder[encoder]/ModuleList[layers]/SwinStage[2]/ModuleList[blocks]/SwinLayer[1]/SwinOutput[output]/NNCFLinear[dense]/linear_0
+36,12,MHSA,nncf_module.swin.encoder.layers.2.blocks.2.attention.self.query,"(512, 512)","(256, 512)","(512,)","(256,)","[1, 4, 5, 6, 7, 9, 11, 12]",SwinForImageClassification/SwinModel[swin]/SwinEncoder[encoder]/ModuleList[layers]/SwinStage[2]/ModuleList[blocks]/SwinLayer[2]/SwinAttention[attention]/SwinSelfAttention[self]/NNCFLinear[query]/linear_0
+37,12,MHSA,nncf_module.swin.encoder.layers.2.blocks.2.attention.self.key,"(512, 512)","(256, 512)","(512,)","(256,)","[1, 4, 5, 6, 7, 9, 11, 12]",SwinForImageClassification/SwinModel[swin]/SwinEncoder[encoder]/ModuleList[layers]/SwinStage[2]/ModuleList[blocks]/SwinLayer[2]/SwinAttention[attention]/SwinSelfAttention[self]/NNCFLinear[key]/linear_0
+38,12,MHSA,nncf_module.swin.encoder.layers.2.blocks.2.attention.self.value,"(512, 512)","(256, 512)","(512,)","(256,)","[1, 4, 5, 6, 7, 9, 11, 12]",SwinForImageClassification/SwinModel[swin]/SwinEncoder[encoder]/ModuleList[layers]/SwinStage[2]/ModuleList[blocks]/SwinLayer[2]/SwinAttention[attention]/SwinSelfAttention[self]/NNCFLinear[value]/linear_0
+39,12,MHSA,nncf_module.swin.encoder.layers.2.blocks.2.attention.output.dense,"(512, 512)","(512, 256)","(512,)","(512,)","[1, 4, 5, 6, 7, 9, 11, 12]",SwinForImageClassification/SwinModel[swin]/SwinEncoder[encoder]/ModuleList[layers]/SwinStage[2]/ModuleList[blocks]/SwinLayer[2]/SwinAttention[attention]/SwinSelfOutput[output]/NNCFLinear[dense]/linear_0
+40,13,FF,nncf_module.swin.encoder.layers.2.blocks.2.intermediate.dense,"(2048, 512)","(1272, 512)","(2048,)","(1272,)",[1272 items],SwinForImageClassification/SwinModel[swin]/SwinEncoder[encoder]/ModuleList[layers]/SwinStage[2]/ModuleList[blocks]/SwinLayer[2]/SwinIntermediate[intermediate]/NNCFLinear[dense]/linear_0
+41,13,FF,nncf_module.swin.encoder.layers.2.blocks.2.output.dense,"(512, 2048)","(512, 1272)","(512,)","(512,)",[1272 items],SwinForImageClassification/SwinModel[swin]/SwinEncoder[encoder]/ModuleList[layers]/SwinStage[2]/ModuleList[blocks]/SwinLayer[2]/SwinOutput[output]/NNCFLinear[dense]/linear_0
+42,14,MHSA,nncf_module.swin.encoder.layers.2.blocks.3.attention.self.query,"(512, 512)","(192, 512)","(512,)","(192,)","[0, 3, 6, 7, 9, 11]",SwinForImageClassification/SwinModel[swin]/SwinEncoder[encoder]/ModuleList[layers]/SwinStage[2]/ModuleList[blocks]/SwinLayer[3]/SwinAttention[attention]/SwinSelfAttention[self]/NNCFLinear[query]/linear_0
+43,14,MHSA,nncf_module.swin.encoder.layers.2.blocks.3.attention.self.key,"(512, 512)","(192, 512)","(512,)","(192,)","[0, 3, 6, 7, 9, 11]",SwinForImageClassification/SwinModel[swin]/SwinEncoder[encoder]/ModuleList[layers]/SwinStage[2]/ModuleList[blocks]/SwinLayer[3]/SwinAttention[attention]/SwinSelfAttention[self]/NNCFLinear[key]/linear_0
+44,14,MHSA,nncf_module.swin.encoder.layers.2.blocks.3.attention.self.value,"(512, 512)","(192, 512)","(512,)","(192,)","[0, 3, 6, 7, 9, 11]",SwinForImageClassification/SwinModel[swin]/SwinEncoder[encoder]/ModuleList[layers]/SwinStage[2]/ModuleList[blocks]/SwinLayer[3]/SwinAttention[attention]/SwinSelfAttention[self]/NNCFLinear[value]/linear_0
+45,14,MHSA,nncf_module.swin.encoder.layers.2.blocks.3.attention.output.dense,"(512, 512)","(512, 192)","(512,)","(512,)","[0, 3, 6, 7, 9, 11]",SwinForImageClassification/SwinModel[swin]/SwinEncoder[encoder]/ModuleList[layers]/SwinStage[2]/ModuleList[blocks]/SwinLayer[3]/SwinAttention[attention]/SwinSelfOutput[output]/NNCFLinear[dense]/linear_0
+46,15,FF,nncf_module.swin.encoder.layers.2.blocks.3.intermediate.dense,"(2048, 512)","(1196, 512)","(2048,)","(1196,)",[1196 items],SwinForImageClassification/SwinModel[swin]/SwinEncoder[encoder]/ModuleList[layers]/SwinStage[2]/ModuleList[blocks]/SwinLayer[3]/SwinIntermediate[intermediate]/NNCFLinear[dense]/linear_0
+47,15,FF,nncf_module.swin.encoder.layers.2.blocks.3.output.dense,"(512, 2048)","(512, 1196)","(512,)","(512,)",[1196 items],SwinForImageClassification/SwinModel[swin]/SwinEncoder[encoder]/ModuleList[layers]/SwinStage[2]/ModuleList[blocks]/SwinLayer[3]/SwinOutput[output]/NNCFLinear[dense]/linear_0
+48,16,MHSA,nncf_module.swin.encoder.layers.2.blocks.4.attention.self.query,"(512, 512)","(224, 512)","(512,)","(224,)","[1, 4, 5, 6, 7, 11, 13]",SwinForImageClassification/SwinModel[swin]/SwinEncoder[encoder]/ModuleList[layers]/SwinStage[2]/ModuleList[blocks]/SwinLayer[4]/SwinAttention[attention]/SwinSelfAttention[self]/NNCFLinear[query]/linear_0
+49,16,MHSA,nncf_module.swin.encoder.layers.2.blocks.4.attention.self.key,"(512, 512)","(224, 512)","(512,)","(224,)","[1, 4, 5, 6, 7, 11, 13]",SwinForImageClassification/SwinModel[swin]/SwinEncoder[encoder]/ModuleList[layers]/SwinStage[2]/ModuleList[blocks]/SwinLayer[4]/SwinAttention[attention]/SwinSelfAttention[self]/NNCFLinear[key]/linear_0
+50,16,MHSA,nncf_module.swin.encoder.layers.2.blocks.4.attention.self.value,"(512, 512)","(224, 512)","(512,)","(224,)","[1, 4, 5, 6, 7, 11, 13]",SwinForImageClassification/SwinModel[swin]/SwinEncoder[encoder]/ModuleList[layers]/SwinStage[2]/ModuleList[blocks]/SwinLayer[4]/SwinAttention[attention]/SwinSelfAttention[self]/NNCFLinear[value]/linear_0
+51,16,MHSA,nncf_module.swin.encoder.layers.2.blocks.4.attention.output.dense,"(512, 512)","(512, 224)","(512,)","(512,)","[1, 4, 5, 6, 7, 11, 13]",SwinForImageClassification/SwinModel[swin]/SwinEncoder[encoder]/ModuleList[layers]/SwinStage[2]/ModuleList[blocks]/SwinLayer[4]/SwinAttention[attention]/SwinSelfOutput[output]/NNCFLinear[dense]/linear_0
+52,17,FF,nncf_module.swin.encoder.layers.2.blocks.4.intermediate.dense,"(2048, 512)","(1201, 512)","(2048,)","(1201,)",[1201 items],SwinForImageClassification/SwinModel[swin]/SwinEncoder[encoder]/ModuleList[layers]/SwinStage[2]/ModuleList[blocks]/SwinLayer[4]/SwinIntermediate[intermediate]/NNCFLinear[dense]/linear_0
+53,17,FF,nncf_module.swin.encoder.layers.2.blocks.4.output.dense,"(512, 2048)","(512, 1201)","(512,)","(512,)",[1201 items],SwinForImageClassification/SwinModel[swin]/SwinEncoder[encoder]/ModuleList[layers]/SwinStage[2]/ModuleList[blocks]/SwinLayer[4]/SwinOutput[output]/NNCFLinear[dense]/linear_0
+54,18,MHSA,nncf_module.swin.encoder.layers.2.blocks.5.attention.self.query,"(512, 512)","(64, 512)","(512,)","(64,)","[1, 5]",SwinForImageClassification/SwinModel[swin]/SwinEncoder[encoder]/ModuleList[layers]/SwinStage[2]/ModuleList[blocks]/SwinLayer[5]/SwinAttention[attention]/SwinSelfAttention[self]/NNCFLinear[query]/linear_0
+55,18,MHSA,nncf_module.swin.encoder.layers.2.blocks.5.attention.self.key,"(512, 512)","(64, 512)","(512,)","(64,)","[1, 5]",SwinForImageClassification/SwinModel[swin]/SwinEncoder[encoder]/ModuleList[layers]/SwinStage[2]/ModuleList[blocks]/SwinLayer[5]/SwinAttention[attention]/SwinSelfAttention[self]/NNCFLinear[key]/linear_0
+56,18,MHSA,nncf_module.swin.encoder.layers.2.blocks.5.attention.self.value,"(512, 512)","(64, 512)","(512,)","(64,)","[1, 5]",SwinForImageClassification/SwinModel[swin]/SwinEncoder[encoder]/ModuleList[layers]/SwinStage[2]/ModuleList[blocks]/SwinLayer[5]/SwinAttention[attention]/SwinSelfAttention[self]/NNCFLinear[value]/linear_0
+57,18,MHSA,nncf_module.swin.encoder.layers.2.blocks.5.attention.output.dense,"(512, 512)","(512, 64)","(512,)","(512,)","[1, 5]",SwinForImageClassification/SwinModel[swin]/SwinEncoder[encoder]/ModuleList[layers]/SwinStage[2]/ModuleList[blocks]/SwinLayer[5]/SwinAttention[attention]/SwinSelfOutput[output]/NNCFLinear[dense]/linear_0
+58,19,FF,nncf_module.swin.encoder.layers.2.blocks.5.intermediate.dense,"(2048, 512)","(1217, 512)","(2048,)","(1217,)",[1217 items],SwinForImageClassification/SwinModel[swin]/SwinEncoder[encoder]/ModuleList[layers]/SwinStage[2]/ModuleList[blocks]/SwinLayer[5]/SwinIntermediate[intermediate]/NNCFLinear[dense]/linear_0
+59,19,FF,nncf_module.swin.encoder.layers.2.blocks.5.output.dense,"(512, 2048)","(512, 1217)","(512,)","(512,)",[1217 items],SwinForImageClassification/SwinModel[swin]/SwinEncoder[encoder]/ModuleList[layers]/SwinStage[2]/ModuleList[blocks]/SwinLayer[5]/SwinOutput[output]/NNCFLinear[dense]/linear_0
+60,20,MHSA,nncf_module.swin.encoder.layers.2.blocks.6.attention.self.query,"(512, 512)","(288, 512)","(512,)","(288,)","[0, 2, 3, 6, 7, 8, 12, 13, 14]",SwinForImageClassification/SwinModel[swin]/SwinEncoder[encoder]/ModuleList[layers]/SwinStage[2]/ModuleList[blocks]/SwinLayer[6]/SwinAttention[attention]/SwinSelfAttention[self]/NNCFLinear[query]/linear_0
+61,20,MHSA,nncf_module.swin.encoder.layers.2.blocks.6.attention.self.key,"(512, 512)","(288, 512)","(512,)","(288,)","[0, 2, 3, 6, 7, 8, 12, 13, 14]",SwinForImageClassification/SwinModel[swin]/SwinEncoder[encoder]/ModuleList[layers]/SwinStage[2]/ModuleList[blocks]/SwinLayer[6]/SwinAttention[attention]/SwinSelfAttention[self]/NNCFLinear[key]/linear_0
+62,20,MHSA,nncf_module.swin.encoder.layers.2.blocks.6.attention.self.value,"(512, 512)","(288, 512)","(512,)","(288,)","[0, 2, 3, 6, 7, 8, 12, 13, 14]",SwinForImageClassification/SwinModel[swin]/SwinEncoder[encoder]/ModuleList[layers]/SwinStage[2]/ModuleList[blocks]/SwinLayer[6]/SwinAttention[attention]/SwinSelfAttention[self]/NNCFLinear[value]/linear_0
+63,20,MHSA,nncf_module.swin.encoder.layers.2.blocks.6.attention.output.dense,"(512, 512)","(512, 288)","(512,)","(512,)","[0, 2, 3, 6, 7, 8, 12, 13, 14]",SwinForImageClassification/SwinModel[swin]/SwinEncoder[encoder]/ModuleList[layers]/SwinStage[2]/ModuleList[blocks]/SwinLayer[6]/SwinAttention[attention]/SwinSelfOutput[output]/NNCFLinear[dense]/linear_0
+64,21,FF,nncf_module.swin.encoder.layers.2.blocks.6.intermediate.dense,"(2048, 512)","(1234, 512)","(2048,)","(1234,)",[1234 items],SwinForImageClassification/SwinModel[swin]/SwinEncoder[encoder]/ModuleList[layers]/SwinStage[2]/ModuleList[blocks]/SwinLayer[6]/SwinIntermediate[intermediate]/NNCFLinear[dense]/linear_0
+65,21,FF,nncf_module.swin.encoder.layers.2.blocks.6.output.dense,"(512, 2048)","(512, 1234)","(512,)","(512,)",[1234 items],SwinForImageClassification/SwinModel[swin]/SwinEncoder[encoder]/ModuleList[layers]/SwinStage[2]/ModuleList[blocks]/SwinLayer[6]/SwinOutput[output]/NNCFLinear[dense]/linear_0
+66,22,MHSA,nncf_module.swin.encoder.layers.2.blocks.7.attention.self.query,"(512, 512)","(256, 512)","(512,)","(256,)","[0, 1, 3, 6, 9, 10, 14, 15]",SwinForImageClassification/SwinModel[swin]/SwinEncoder[encoder]/ModuleList[layers]/SwinStage[2]/ModuleList[blocks]/SwinLayer[7]/SwinAttention[attention]/SwinSelfAttention[self]/NNCFLinear[query]/linear_0
+67,22,MHSA,nncf_module.swin.encoder.layers.2.blocks.7.attention.self.key,"(512, 512)","(256, 512)","(512,)","(256,)","[0, 1, 3, 6, 9, 10, 14, 15]",SwinForImageClassification/SwinModel[swin]/SwinEncoder[encoder]/ModuleList[layers]/SwinStage[2]/ModuleList[blocks]/SwinLayer[7]/SwinAttention[attention]/SwinSelfAttention[self]/NNCFLinear[key]/linear_0
+68,22,MHSA,nncf_module.swin.encoder.layers.2.blocks.7.attention.self.value,"(512, 512)","(256, 512)","(512,)","(256,)","[0, 1, 3, 6, 9, 10, 14, 15]",SwinForImageClassification/SwinModel[swin]/SwinEncoder[encoder]/ModuleList[layers]/SwinStage[2]/ModuleList[blocks]/SwinLayer[7]/SwinAttention[attention]/SwinSelfAttention[self]/NNCFLinear[value]/linear_0
+69,22,MHSA,nncf_module.swin.encoder.layers.2.blocks.7.attention.output.dense,"(512, 512)","(512, 256)","(512,)","(512,)","[0, 1, 3, 6, 9, 10, 14, 15]",SwinForImageClassification/SwinModel[swin]/SwinEncoder[encoder]/ModuleList[layers]/SwinStage[2]/ModuleList[blocks]/SwinLayer[7]/SwinAttention[attention]/SwinSelfOutput[output]/NNCFLinear[dense]/linear_0
+70,23,FF,nncf_module.swin.encoder.layers.2.blocks.7.intermediate.dense,"(2048, 512)","(1225, 512)","(2048,)","(1225,)",[1225 items],SwinForImageClassification/SwinModel[swin]/SwinEncoder[encoder]/ModuleList[layers]/SwinStage[2]/ModuleList[blocks]/SwinLayer[7]/SwinIntermediate[intermediate]/NNCFLinear[dense]/linear_0
+71,23,FF,nncf_module.swin.encoder.layers.2.blocks.7.output.dense,"(512, 2048)","(512, 1225)","(512,)","(512,)",[1225 items],SwinForImageClassification/SwinModel[swin]/SwinEncoder[encoder]/ModuleList[layers]/SwinStage[2]/ModuleList[blocks]/SwinLayer[7]/SwinOutput[output]/NNCFLinear[dense]/linear_0
+72,24,MHSA,nncf_module.swin.encoder.layers.2.blocks.8.attention.self.query,"(512, 512)","(224, 512)","(512,)","(224,)","[2, 3, 4, 5, 9, 10, 13]",SwinForImageClassification/SwinModel[swin]/SwinEncoder[encoder]/ModuleList[layers]/SwinStage[2]/ModuleList[blocks]/SwinLayer[8]/SwinAttention[attention]/SwinSelfAttention[self]/NNCFLinear[query]/linear_0
+73,24,MHSA,nncf_module.swin.encoder.layers.2.blocks.8.attention.self.key,"(512, 512)","(224, 512)","(512,)","(224,)","[2, 3, 4, 5, 9, 10, 13]",SwinForImageClassification/SwinModel[swin]/SwinEncoder[encoder]/ModuleList[layers]/SwinStage[2]/ModuleList[blocks]/SwinLayer[8]/SwinAttention[attention]/SwinSelfAttention[self]/NNCFLinear[key]/linear_0
+74,24,MHSA,nncf_module.swin.encoder.layers.2.blocks.8.attention.self.value,"(512, 512)","(224, 512)","(512,)","(224,)","[2, 3, 4, 5, 9, 10, 13]",SwinForImageClassification/SwinModel[swin]/SwinEncoder[encoder]/ModuleList[layers]/SwinStage[2]/ModuleList[blocks]/SwinLayer[8]/SwinAttention[attention]/SwinSelfAttention[self]/NNCFLinear[value]/linear_0
+75,24,MHSA,nncf_module.swin.encoder.layers.2.blocks.8.attention.output.dense,"(512, 512)","(512, 224)","(512,)","(512,)","[2, 3, 4, 5, 9, 10, 13]",SwinForImageClassification/SwinModel[swin]/SwinEncoder[encoder]/ModuleList[layers]/SwinStage[2]/ModuleList[blocks]/SwinLayer[8]/SwinAttention[attention]/SwinSelfOutput[output]/NNCFLinear[dense]/linear_0
+76,25,FF,nncf_module.swin.encoder.layers.2.blocks.8.intermediate.dense,"(2048, 512)","(1297, 512)","(2048,)","(1297,)",[1297 items],SwinForImageClassification/SwinModel[swin]/SwinEncoder[encoder]/ModuleList[layers]/SwinStage[2]/ModuleList[blocks]/SwinLayer[8]/SwinIntermediate[intermediate]/NNCFLinear[dense]/linear_0
+77,25,FF,nncf_module.swin.encoder.layers.2.blocks.8.output.dense,"(512, 2048)","(512, 1297)","(512,)","(512,)",[1297 items],SwinForImageClassification/SwinModel[swin]/SwinEncoder[encoder]/ModuleList[layers]/SwinStage[2]/ModuleList[blocks]/SwinLayer[8]/SwinOutput[output]/NNCFLinear[dense]/linear_0
+78,26,MHSA,nncf_module.swin.encoder.layers.2.blocks.9.attention.self.query,"(512, 512)","(320, 512)","(512,)","(320,)","[0, 1, 2, 3, 4, 7, 8, 9, 13, 15]",SwinForImageClassification/SwinModel[swin]/SwinEncoder[encoder]/ModuleList[layers]/SwinStage[2]/ModuleList[blocks]/SwinLayer[9]/SwinAttention[attention]/SwinSelfAttention[self]/NNCFLinear[query]/linear_0
+79,26,MHSA,nncf_module.swin.encoder.layers.2.blocks.9.attention.self.key,"(512, 512)","(320, 512)","(512,)","(320,)","[0, 1, 2, 3, 4, 7, 8, 9, 13, 15]",SwinForImageClassification/SwinModel[swin]/SwinEncoder[encoder]/ModuleList[layers]/SwinStage[2]/ModuleList[blocks]/SwinLayer[9]/SwinAttention[attention]/SwinSelfAttention[self]/NNCFLinear[key]/linear_0
+80,26,MHSA,nncf_module.swin.encoder.layers.2.blocks.9.attention.self.value,"(512, 512)","(320, 512)","(512,)","(320,)","[0, 1, 2, 3, 4, 7, 8, 9, 13, 15]",SwinForImageClassification/SwinModel[swin]/SwinEncoder[encoder]/ModuleList[layers]/SwinStage[2]/ModuleList[blocks]/SwinLayer[9]/SwinAttention[attention]/SwinSelfAttention[self]/NNCFLinear[value]/linear_0
+81,26,MHSA,nncf_module.swin.encoder.layers.2.blocks.9.attention.output.dense,"(512, 512)","(512, 320)","(512,)","(512,)","[0, 1, 2, 3, 4, 7, 8, 9, 13, 15]",SwinForImageClassification/SwinModel[swin]/SwinEncoder[encoder]/ModuleList[layers]/SwinStage[2]/ModuleList[blocks]/SwinLayer[9]/SwinAttention[attention]/SwinSelfOutput[output]/NNCFLinear[dense]/linear_0
+82,27,FF,nncf_module.swin.encoder.layers.2.blocks.9.intermediate.dense,"(2048, 512)","(1231, 512)","(2048,)","(1231,)",[1231 items],SwinForImageClassification/SwinModel[swin]/SwinEncoder[encoder]/ModuleList[layers]/SwinStage[2]/ModuleList[blocks]/SwinLayer[9]/SwinIntermediate[intermediate]/NNCFLinear[dense]/linear_0
+83,27,FF,nncf_module.swin.encoder.layers.2.blocks.9.output.dense,"(512, 2048)","(512, 1231)","(512,)","(512,)",[1231 items],SwinForImageClassification/SwinModel[swin]/SwinEncoder[encoder]/ModuleList[layers]/SwinStage[2]/ModuleList[blocks]/SwinLayer[9]/SwinOutput[output]/NNCFLinear[dense]/linear_0
+84,28,MHSA,nncf_module.swin.encoder.layers.2.blocks.10.attention.self.query,"(512, 512)","(320, 512)","(512,)","(320,)","[0, 1, 2, 5, 7, 9, 11, 12, 13, 14]",SwinForImageClassification/SwinModel[swin]/SwinEncoder[encoder]/ModuleList[layers]/SwinStage[2]/ModuleList[blocks]/SwinLayer[10]/SwinAttention[attention]/SwinSelfAttention[self]/NNCFLinear[query]/linear_0
+85,28,MHSA,nncf_module.swin.encoder.layers.2.blocks.10.attention.self.key,"(512, 512)","(320, 512)","(512,)","(320,)","[0, 1, 2, 5, 7, 9, 11, 12, 13, 14]",SwinForImageClassification/SwinModel[swin]/SwinEncoder[encoder]/ModuleList[layers]/SwinStage[2]/ModuleList[blocks]/SwinLayer[10]/SwinAttention[attention]/SwinSelfAttention[self]/NNCFLinear[key]/linear_0
+86,28,MHSA,nncf_module.swin.encoder.layers.2.blocks.10.attention.self.value,"(512, 512)","(320, 512)","(512,)","(320,)","[0, 1, 2, 5, 7, 9, 11, 12, 13, 14]",SwinForImageClassification/SwinModel[swin]/SwinEncoder[encoder]/ModuleList[layers]/SwinStage[2]/ModuleList[blocks]/SwinLayer[10]/SwinAttention[attention]/SwinSelfAttention[self]/NNCFLinear[value]/linear_0
+87,28,MHSA,nncf_module.swin.encoder.layers.2.blocks.10.attention.output.dense,"(512, 512)","(512, 320)","(512,)","(512,)","[0, 1, 2, 5, 7, 9, 11, 12, 13, 14]",SwinForImageClassification/SwinModel[swin]/SwinEncoder[encoder]/ModuleList[layers]/SwinStage[2]/ModuleList[blocks]/SwinLayer[10]/SwinAttention[attention]/SwinSelfOutput[output]/NNCFLinear[dense]/linear_0
+88,29,FF,nncf_module.swin.encoder.layers.2.blocks.10.intermediate.dense,"(2048, 512)","(1235, 512)","(2048,)","(1235,)",[1235 items],SwinForImageClassification/SwinModel[swin]/SwinEncoder[encoder]/ModuleList[layers]/SwinStage[2]/ModuleList[blocks]/SwinLayer[10]/SwinIntermediate[intermediate]/NNCFLinear[dense]/linear_0
+89,29,FF,nncf_module.swin.encoder.layers.2.blocks.10.output.dense,"(512, 2048)","(512, 1235)","(512,)","(512,)",[1235 items],SwinForImageClassification/SwinModel[swin]/SwinEncoder[encoder]/ModuleList[layers]/SwinStage[2]/ModuleList[blocks]/SwinLayer[10]/SwinOutput[output]/NNCFLinear[dense]/linear_0
+90,30,MHSA,nncf_module.swin.encoder.layers.2.blocks.11.attention.self.query,"(512, 512)","(288, 512)","(512,)","(288,)","[1, 3, 6, 8, 9, 10, 11, 12, 15]",SwinForImageClassification/SwinModel[swin]/SwinEncoder[encoder]/ModuleList[layers]/SwinStage[2]/ModuleList[blocks]/SwinLayer[11]/SwinAttention[attention]/SwinSelfAttention[self]/NNCFLinear[query]/linear_0
+91,30,MHSA,nncf_module.swin.encoder.layers.2.blocks.11.attention.self.key,"(512, 512)","(288, 512)","(512,)","(288,)","[1, 3, 6, 8, 9, 10, 11, 12, 15]",SwinForImageClassification/SwinModel[swin]/SwinEncoder[encoder]/ModuleList[layers]/SwinStage[2]/ModuleList[blocks]/SwinLayer[11]/SwinAttention[attention]/SwinSelfAttention[self]/NNCFLinear[key]/linear_0
+92,30,MHSA,nncf_module.swin.encoder.layers.2.blocks.11.attention.self.value,"(512, 512)","(288, 512)","(512,)","(288,)","[1, 3, 6, 8, 9, 10, 11, 12, 15]",SwinForImageClassification/SwinModel[swin]/SwinEncoder[encoder]/ModuleList[layers]/SwinStage[2]/ModuleList[blocks]/SwinLayer[11]/SwinAttention[attention]/SwinSelfAttention[self]/NNCFLinear[value]/linear_0
+93,30,MHSA,nncf_module.swin.encoder.layers.2.blocks.11.attention.output.dense,"(512, 512)","(512, 288)","(512,)","(512,)","[1, 3, 6, 8, 9, 10, 11, 12, 15]",SwinForImageClassification/SwinModel[swin]/SwinEncoder[encoder]/ModuleList[layers]/SwinStage[2]/ModuleList[blocks]/SwinLayer[11]/SwinAttention[attention]/SwinSelfOutput[output]/NNCFLinear[dense]/linear_0
+94,31,FF,nncf_module.swin.encoder.layers.2.blocks.11.intermediate.dense,"(2048, 512)","(1253, 512)","(2048,)","(1253,)",[1253 items],SwinForImageClassification/SwinModel[swin]/SwinEncoder[encoder]/ModuleList[layers]/SwinStage[2]/ModuleList[blocks]/SwinLayer[11]/SwinIntermediate[intermediate]/NNCFLinear[dense]/linear_0
+95,31,FF,nncf_module.swin.encoder.layers.2.blocks.11.output.dense,"(512, 2048)","(512, 1253)","(512,)","(512,)",[1253 items],SwinForImageClassification/SwinModel[swin]/SwinEncoder[encoder]/ModuleList[layers]/SwinStage[2]/ModuleList[blocks]/SwinLayer[11]/SwinOutput[output]/NNCFLinear[dense]/linear_0
+96,32,MHSA,nncf_module.swin.encoder.layers.2.blocks.12.attention.self.query,"(512, 512)","(384, 512)","(512,)","(384,)","[1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 12, 15]",SwinForImageClassification/SwinModel[swin]/SwinEncoder[encoder]/ModuleList[layers]/SwinStage[2]/ModuleList[blocks]/SwinLayer[12]/SwinAttention[attention]/SwinSelfAttention[self]/NNCFLinear[query]/linear_0
+97,32,MHSA,nncf_module.swin.encoder.layers.2.blocks.12.attention.self.key,"(512, 512)","(384, 512)","(512,)","(384,)","[1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 12, 15]",SwinForImageClassification/SwinModel[swin]/SwinEncoder[encoder]/ModuleList[layers]/SwinStage[2]/ModuleList[blocks]/SwinLayer[12]/SwinAttention[attention]/SwinSelfAttention[self]/NNCFLinear[key]/linear_0
+98,32,MHSA,nncf_module.swin.encoder.layers.2.blocks.12.attention.self.value,"(512, 512)","(384, 512)","(512,)","(384,)","[1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 12, 15]",SwinForImageClassification/SwinModel[swin]/SwinEncoder[encoder]/ModuleList[layers]/SwinStage[2]/ModuleList[blocks]/SwinLayer[12]/SwinAttention[attention]/SwinSelfAttention[self]/NNCFLinear[value]/linear_0
+99,32,MHSA,nncf_module.swin.encoder.layers.2.blocks.12.attention.output.dense,"(512, 512)","(512, 384)","(512,)","(512,)","[1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 12, 15]",SwinForImageClassification/SwinModel[swin]/SwinEncoder[encoder]/ModuleList[layers]/SwinStage[2]/ModuleList[blocks]/SwinLayer[12]/SwinAttention[attention]/SwinSelfOutput[output]/NNCFLinear[dense]/linear_0
+100,33,FF,nncf_module.swin.encoder.layers.2.blocks.12.intermediate.dense,"(2048, 512)","(1263, 512)","(2048,)","(1263,)",[1263 items],SwinForImageClassification/SwinModel[swin]/SwinEncoder[encoder]/ModuleList[layers]/SwinStage[2]/ModuleList[blocks]/SwinLayer[12]/SwinIntermediate[intermediate]/NNCFLinear[dense]/linear_0
+101,33,FF,nncf_module.swin.encoder.layers.2.blocks.12.output.dense,"(512, 2048)","(512, 1263)","(512,)","(512,)",[1263 items],SwinForImageClassification/SwinModel[swin]/SwinEncoder[encoder]/ModuleList[layers]/SwinStage[2]/ModuleList[blocks]/SwinLayer[12]/SwinOutput[output]/NNCFLinear[dense]/linear_0
+102,34,MHSA,nncf_module.swin.encoder.layers.2.blocks.13.attention.self.query,"(512, 512)","(96, 512)","(512,)","(96,)","[2, 4, 8]",SwinForImageClassification/SwinModel[swin]/SwinEncoder[encoder]/ModuleList[layers]/SwinStage[2]/ModuleList[blocks]/SwinLayer[13]/SwinAttention[attention]/SwinSelfAttention[self]/NNCFLinear[query]/linear_0
+103,34,MHSA,nncf_module.swin.encoder.layers.2.blocks.13.attention.self.key,"(512, 512)","(96, 512)","(512,)","(96,)","[2, 4, 8]",SwinForImageClassification/SwinModel[swin]/SwinEncoder[encoder]/ModuleList[layers]/SwinStage[2]/ModuleList[blocks]/SwinLayer[13]/SwinAttention[attention]/SwinSelfAttention[self]/NNCFLinear[key]/linear_0
+104,34,MHSA,nncf_module.swin.encoder.layers.2.blocks.13.attention.self.value,"(512, 512)","(96, 512)","(512,)","(96,)","[2, 4, 8]",SwinForImageClassification/SwinModel[swin]/SwinEncoder[encoder]/ModuleList[layers]/SwinStage[2]/ModuleList[blocks]/SwinLayer[13]/SwinAttention[attention]/SwinSelfAttention[self]/NNCFLinear[value]/linear_0
+105,34,MHSA,nncf_module.swin.encoder.layers.2.blocks.13.attention.output.dense,"(512, 512)","(512, 96)","(512,)","(512,)","[2, 4, 8]",SwinForImageClassification/SwinModel[swin]/SwinEncoder[encoder]/ModuleList[layers]/SwinStage[2]/ModuleList[blocks]/SwinLayer[13]/SwinAttention[attention]/SwinSelfOutput[output]/NNCFLinear[dense]/linear_0
+106,35,FF,nncf_module.swin.encoder.layers.2.blocks.13.intermediate.dense,"(2048, 512)","(1269, 512)","(2048,)","(1269,)",[1269 items],SwinForImageClassification/SwinModel[swin]/SwinEncoder[encoder]/ModuleList[layers]/SwinStage[2]/ModuleList[blocks]/SwinLayer[13]/SwinIntermediate[intermediate]/NNCFLinear[dense]/linear_0
+107,35,FF,nncf_module.swin.encoder.layers.2.blocks.13.output.dense,"(512, 2048)","(512, 1269)","(512,)","(512,)",[1269 items],SwinForImageClassification/SwinModel[swin]/SwinEncoder[encoder]/ModuleList[layers]/SwinStage[2]/ModuleList[blocks]/SwinLayer[13]/SwinOutput[output]/NNCFLinear[dense]/linear_0
+108,36,MHSA,nncf_module.swin.encoder.layers.2.blocks.14.attention.self.query,"(512, 512)","(256, 512)","(512,)","(256,)","[0, 3, 4, 5, 10, 11, 14, 15]",SwinForImageClassification/SwinModel[swin]/SwinEncoder[encoder]/ModuleList[layers]/SwinStage[2]/ModuleList[blocks]/SwinLayer[14]/SwinAttention[attention]/SwinSelfAttention[self]/NNCFLinear[query]/linear_0
+109,36,MHSA,nncf_module.swin.encoder.layers.2.blocks.14.attention.self.key,"(512, 512)","(256, 512)","(512,)","(256,)","[0, 3, 4, 5, 10, 11, 14, 15]",SwinForImageClassification/SwinModel[swin]/SwinEncoder[encoder]/ModuleList[layers]/SwinStage[2]/ModuleList[blocks]/SwinLayer[14]/SwinAttention[attention]/SwinSelfAttention[self]/NNCFLinear[key]/linear_0
+110,36,MHSA,nncf_module.swin.encoder.layers.2.blocks.14.attention.self.value,"(512, 512)","(256, 512)","(512,)","(256,)","[0, 3, 4, 5, 10, 11, 14, 15]",SwinForImageClassification/SwinModel[swin]/SwinEncoder[encoder]/ModuleList[layers]/SwinStage[2]/ModuleList[blocks]/SwinLayer[14]/SwinAttention[attention]/SwinSelfAttention[self]/NNCFLinear[value]/linear_0
+111,36,MHSA,nncf_module.swin.encoder.layers.2.blocks.14.attention.output.dense,"(512, 512)","(512, 256)","(512,)","(512,)","[0, 3, 4, 5, 10, 11, 14, 15]",SwinForImageClassification/SwinModel[swin]/SwinEncoder[encoder]/ModuleList[layers]/SwinStage[2]/ModuleList[blocks]/SwinLayer[14]/SwinAttention[attention]/SwinSelfOutput[output]/NNCFLinear[dense]/linear_0
+112,37,FF,nncf_module.swin.encoder.layers.2.blocks.14.intermediate.dense,"(2048, 512)","(1109, 512)","(2048,)","(1109,)",[1109 items],SwinForImageClassification/SwinModel[swin]/SwinEncoder[encoder]/ModuleList[layers]/SwinStage[2]/ModuleList[blocks]/SwinLayer[14]/SwinIntermediate[intermediate]/NNCFLinear[dense]/linear_0
+113,37,FF,nncf_module.swin.encoder.layers.2.blocks.14.output.dense,"(512, 2048)","(512, 1109)","(512,)","(512,)",[1109 items],SwinForImageClassification/SwinModel[swin]/SwinEncoder[encoder]/ModuleList[layers]/SwinStage[2]/ModuleList[blocks]/SwinLayer[14]/SwinOutput[output]/NNCFLinear[dense]/linear_0
+114,38,MHSA,nncf_module.swin.encoder.layers.2.blocks.15.attention.self.query,"(512, 512)","(352, 512)","(512,)","(352,)","[2, 3, 4, 5, 6, 8, 9, 10, 11, 13, 15]",SwinForImageClassification/SwinModel[swin]/SwinEncoder[encoder]/ModuleList[layers]/SwinStage[2]/ModuleList[blocks]/SwinLayer[15]/SwinAttention[attention]/SwinSelfAttention[self]/NNCFLinear[query]/linear_0
+115,38,MHSA,nncf_module.swin.encoder.layers.2.blocks.15.attention.self.key,"(512, 512)","(352, 512)","(512,)","(352,)","[2, 3, 4, 5, 6, 8, 9, 10, 11, 13, 15]",SwinForImageClassification/SwinModel[swin]/SwinEncoder[encoder]/ModuleList[layers]/SwinStage[2]/ModuleList[blocks]/SwinLayer[15]/SwinAttention[attention]/SwinSelfAttention[self]/NNCFLinear[key]/linear_0
+116,38,MHSA,nncf_module.swin.encoder.layers.2.blocks.15.attention.self.value,"(512, 512)","(352, 512)","(512,)","(352,)","[2, 3, 4, 5, 6, 8, 9, 10, 11, 13, 15]",SwinForImageClassification/SwinModel[swin]/SwinEncoder[encoder]/ModuleList[layers]/SwinStage[2]/ModuleList[blocks]/SwinLayer[15]/SwinAttention[attention]/SwinSelfAttention[self]/NNCFLinear[value]/linear_0
+117,38,MHSA,nncf_module.swin.encoder.layers.2.blocks.15.attention.output.dense,"(512, 512)","(512, 352)","(512,)","(512,)","[2, 3, 4, 5, 6, 8, 9, 10, 11, 13, 15]",SwinForImageClassification/SwinModel[swin]/SwinEncoder[encoder]/ModuleList[layers]/SwinStage[2]/ModuleList[blocks]/SwinLayer[15]/SwinAttention[attention]/SwinSelfOutput[output]/NNCFLinear[dense]/linear_0
+118,39,FF,nncf_module.swin.encoder.layers.2.blocks.15.intermediate.dense,"(2048, 512)","(1032, 512)","(2048,)","(1032,)",[1032 items],SwinForImageClassification/SwinModel[swin]/SwinEncoder[encoder]/ModuleList[layers]/SwinStage[2]/ModuleList[blocks]/SwinLayer[15]/SwinIntermediate[intermediate]/NNCFLinear[dense]/linear_0
+119,39,FF,nncf_module.swin.encoder.layers.2.blocks.15.output.dense,"(512, 2048)","(512, 1032)","(512,)","(512,)",[1032 items],SwinForImageClassification/SwinModel[swin]/SwinEncoder[encoder]/ModuleList[layers]/SwinStage[2]/ModuleList[blocks]/SwinLayer[15]/SwinOutput[output]/NNCFLinear[dense]/linear_0
+120,40,MHSA,nncf_module.swin.encoder.layers.2.blocks.16.attention.self.query,"(512, 512)","(256, 512)","(512,)","(256,)","[0, 2, 3, 7, 8, 9, 10, 14]",SwinForImageClassification/SwinModel[swin]/SwinEncoder[encoder]/ModuleList[layers]/SwinStage[2]/ModuleList[blocks]/SwinLayer[16]/SwinAttention[attention]/SwinSelfAttention[self]/NNCFLinear[query]/linear_0
+121,40,MHSA,nncf_module.swin.encoder.layers.2.blocks.16.attention.self.key,"(512, 512)","(256, 512)","(512,)","(256,)","[0, 2, 3, 7, 8, 9, 10, 14]",SwinForImageClassification/SwinModel[swin]/SwinEncoder[encoder]/ModuleList[layers]/SwinStage[2]/ModuleList[blocks]/SwinLayer[16]/SwinAttention[attention]/SwinSelfAttention[self]/NNCFLinear[key]/linear_0
+122,40,MHSA,nncf_module.swin.encoder.layers.2.blocks.16.attention.self.value,"(512, 512)","(256, 512)","(512,)","(256,)","[0, 2, 3, 7, 8, 9, 10, 14]",SwinForImageClassification/SwinModel[swin]/SwinEncoder[encoder]/ModuleList[layers]/SwinStage[2]/ModuleList[blocks]/SwinLayer[16]/SwinAttention[attention]/SwinSelfAttention[self]/NNCFLinear[value]/linear_0
+123,40,MHSA,nncf_module.swin.encoder.layers.2.blocks.16.attention.output.dense,"(512, 512)","(512, 256)","(512,)","(512,)","[0, 2, 3, 7, 8, 9, 10, 14]",SwinForImageClassification/SwinModel[swin]/SwinEncoder[encoder]/ModuleList[layers]/SwinStage[2]/ModuleList[blocks]/SwinLayer[16]/SwinAttention[attention]/SwinSelfOutput[output]/NNCFLinear[dense]/linear_0
+124,41,FF,nncf_module.swin.encoder.layers.2.blocks.16.intermediate.dense,"(2048, 512)","(988, 512)","(2048,)","(988,)",[988 items],SwinForImageClassification/SwinModel[swin]/SwinEncoder[encoder]/ModuleList[layers]/SwinStage[2]/ModuleList[blocks]/SwinLayer[16]/SwinIntermediate[intermediate]/NNCFLinear[dense]/linear_0
+125,41,FF,nncf_module.swin.encoder.layers.2.blocks.16.output.dense,"(512, 2048)","(512, 988)","(512,)","(512,)",[988 items],SwinForImageClassification/SwinModel[swin]/SwinEncoder[encoder]/ModuleList[layers]/SwinStage[2]/ModuleList[blocks]/SwinLayer[16]/SwinOutput[output]/NNCFLinear[dense]/linear_0
+126,42,MHSA,nncf_module.swin.encoder.layers.2.blocks.17.attention.self.query,"(512, 512)","(192, 512)","(512,)","(192,)","[3, 4, 5, 7, 9, 14]",SwinForImageClassification/SwinModel[swin]/SwinEncoder[encoder]/ModuleList[layers]/SwinStage[2]/ModuleList[blocks]/SwinLayer[17]/SwinAttention[attention]/SwinSelfAttention[self]/NNCFLinear[query]/linear_0
+127,42,MHSA,nncf_module.swin.encoder.layers.2.blocks.17.attention.self.key,"(512, 512)","(192, 512)","(512,)","(192,)","[3, 4, 5, 7, 9, 14]",SwinForImageClassification/SwinModel[swin]/SwinEncoder[encoder]/ModuleList[layers]/SwinStage[2]/ModuleList[blocks]/SwinLayer[17]/SwinAttention[attention]/SwinSelfAttention[self]/NNCFLinear[key]/linear_0
+128,42,MHSA,nncf_module.swin.encoder.layers.2.blocks.17.attention.self.value,"(512, 512)","(192, 512)","(512,)","(192,)","[3, 4, 5, 7, 9, 14]",SwinForImageClassification/SwinModel[swin]/SwinEncoder[encoder]/ModuleList[layers]/SwinStage[2]/ModuleList[blocks]/SwinLayer[17]/SwinAttention[attention]/SwinSelfAttention[self]/NNCFLinear[value]/linear_0
+129,42,MHSA,nncf_module.swin.encoder.layers.2.blocks.17.attention.output.dense,"(512, 512)","(512, 192)","(512,)","(512,)","[3, 4, 5, 7, 9, 14]",SwinForImageClassification/SwinModel[swin]/SwinEncoder[encoder]/ModuleList[layers]/SwinStage[2]/ModuleList[blocks]/SwinLayer[17]/SwinAttention[attention]/SwinSelfOutput[output]/NNCFLinear[dense]/linear_0
+130,43,FF,nncf_module.swin.encoder.layers.2.blocks.17.intermediate.dense,"(2048, 512)","(1022, 512)","(2048,)","(1022,)",[1022 items],SwinForImageClassification/SwinModel[swin]/SwinEncoder[encoder]/ModuleList[layers]/SwinStage[2]/ModuleList[blocks]/SwinLayer[17]/SwinIntermediate[intermediate]/NNCFLinear[dense]/linear_0
+131,43,FF,nncf_module.swin.encoder.layers.2.blocks.17.output.dense,"(512, 2048)","(512, 1022)","(512,)","(512,)",[1022 items],SwinForImageClassification/SwinModel[swin]/SwinEncoder[encoder]/ModuleList[layers]/SwinStage[2]/ModuleList[blocks]/SwinLayer[17]/SwinOutput[output]/NNCFLinear[dense]/linear_0
+132,44,MHSA,nncf_module.swin.encoder.layers.3.blocks.0.attention.self.query,"(1024, 1024)","(1024, 1024)","(1024,)","(1024,)",[32 items],SwinForImageClassification/SwinModel[swin]/SwinEncoder[encoder]/ModuleList[layers]/SwinStage[3]/ModuleList[blocks]/SwinLayer[0]/SwinAttention[attention]/SwinSelfAttention[self]/NNCFLinear[query]/linear_0
+133,44,MHSA,nncf_module.swin.encoder.layers.3.blocks.0.attention.self.key,"(1024, 1024)","(1024, 1024)","(1024,)","(1024,)",[32 items],SwinForImageClassification/SwinModel[swin]/SwinEncoder[encoder]/ModuleList[layers]/SwinStage[3]/ModuleList[blocks]/SwinLayer[0]/SwinAttention[attention]/SwinSelfAttention[self]/NNCFLinear[key]/linear_0
+134,44,MHSA,nncf_module.swin.encoder.layers.3.blocks.0.attention.self.value,"(1024, 1024)","(1024, 1024)","(1024,)","(1024,)",[32 items],SwinForImageClassification/SwinModel[swin]/SwinEncoder[encoder]/ModuleList[layers]/SwinStage[3]/ModuleList[blocks]/SwinLayer[0]/SwinAttention[attention]/SwinSelfAttention[self]/NNCFLinear[value]/linear_0
+135,44,MHSA,nncf_module.swin.encoder.layers.3.blocks.0.attention.output.dense,"(1024, 1024)","(1024, 1024)","(1024,)","(1024,)",[32 items],SwinForImageClassification/SwinModel[swin]/SwinEncoder[encoder]/ModuleList[layers]/SwinStage[3]/ModuleList[blocks]/SwinLayer[0]/SwinAttention[attention]/SwinSelfOutput[output]/NNCFLinear[dense]/linear_0
+136,45,FF,nncf_module.swin.encoder.layers.3.blocks.0.intermediate.dense,"(4096, 1024)","(2102, 1024)","(4096,)","(2102,)",[2102 items],SwinForImageClassification/SwinModel[swin]/SwinEncoder[encoder]/ModuleList[layers]/SwinStage[3]/ModuleList[blocks]/SwinLayer[0]/SwinIntermediate[intermediate]/NNCFLinear[dense]/linear_0
+137,45,FF,nncf_module.swin.encoder.layers.3.blocks.0.output.dense,"(1024, 4096)","(1024, 2102)","(1024,)","(1024,)",[2102 items],SwinForImageClassification/SwinModel[swin]/SwinEncoder[encoder]/ModuleList[layers]/SwinStage[3]/ModuleList[blocks]/SwinLayer[0]/SwinOutput[output]/NNCFLinear[dense]/linear_0
+138,46,MHSA,nncf_module.swin.encoder.layers.3.blocks.1.attention.self.query,"(1024, 1024)","(1024, 1024)","(1024,)","(1024,)",[32 items],SwinForImageClassification/SwinModel[swin]/SwinEncoder[encoder]/ModuleList[layers]/SwinStage[3]/ModuleList[blocks]/SwinLayer[1]/SwinAttention[attention]/SwinSelfAttention[self]/NNCFLinear[query]/linear_0
+139,46,MHSA,nncf_module.swin.encoder.layers.3.blocks.1.attention.self.key,"(1024, 1024)","(1024, 1024)","(1024,)","(1024,)",[32 items],SwinForImageClassification/SwinModel[swin]/SwinEncoder[encoder]/ModuleList[layers]/SwinStage[3]/ModuleList[blocks]/SwinLayer[1]/SwinAttention[attention]/SwinSelfAttention[self]/NNCFLinear[key]/linear_0
+140,46,MHSA,nncf_module.swin.encoder.layers.3.blocks.1.attention.self.value,"(1024, 1024)","(1024, 1024)","(1024,)","(1024,)",[32 items],SwinForImageClassification/SwinModel[swin]/SwinEncoder[encoder]/ModuleList[layers]/SwinStage[3]/ModuleList[blocks]/SwinLayer[1]/SwinAttention[attention]/SwinSelfAttention[self]/NNCFLinear[value]/linear_0
+141,46,MHSA,nncf_module.swin.encoder.layers.3.blocks.1.attention.output.dense,"(1024, 1024)","(1024, 1024)","(1024,)","(1024,)",[32 items],SwinForImageClassification/SwinModel[swin]/SwinEncoder[encoder]/ModuleList[layers]/SwinStage[3]/ModuleList[blocks]/SwinLayer[1]/SwinAttention[attention]/SwinSelfOutput[output]/NNCFLinear[dense]/linear_0
+142,47,FF,nncf_module.swin.encoder.layers.3.blocks.1.intermediate.dense,"(4096, 1024)","(2118, 1024)","(4096,)","(2118,)",[2118 items],SwinForImageClassification/SwinModel[swin]/SwinEncoder[encoder]/ModuleList[layers]/SwinStage[3]/ModuleList[blocks]/SwinLayer[1]/SwinIntermediate[intermediate]/NNCFLinear[dense]/linear_0
+143,47,FF,nncf_module.swin.encoder.layers.3.blocks.1.output.dense,"(1024, 4096)","(1024, 2118)","(1024,)","(1024,)",[2118 items],SwinForImageClassification/SwinModel[swin]/SwinEncoder[encoder]/ModuleList[layers]/SwinStage[3]/ModuleList[blocks]/SwinLayer[1]/SwinOutput[output]/NNCFLinear[dense]/linear_0

train_results.json ADDED Viewed

	@@ -0,0 +1,7 @@

+{
+    "epoch": 10.0,
+    "train_loss": 25.693809306425052,
+    "train_runtime": 41910.9513,
+    "train_samples_per_second": 18.074,
+    "train_steps_per_second": 0.282
+}

trainer_state.json ADDED Viewed

The diff for this file is too large to render. See raw diff

training_args.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:f8adafa4f3345654d0df2b280866deba1df38ac899b8bd9050c13c8c7d4626c6
+size 3515