IntelLabs
/

eftnas-s2-bert-medium

English

Model card Files Files and versions

eftnas-s2-bert-medium / eftnas-s2-bert-medium-sst2 /nncf_config.json

jinjieyuan

Upload model

e785a97 9 months ago

raw

history blame

15 kB

	{
	"input_info": [
	{
	"sample_size": [
	1,
	128
	],
	"type": "long",
	"keyword": "input_ids"
	},
	{
	"sample_size": [
	1,
	128
	],
	"type": "long",
	"keyword": "token_type_ids"
	},
	{
	"sample_size": [
	1,
	128
	],
	"type": "long",
	"keyword": "attention_mask"
	}
	],
	"bootstrapNAS": {
	"training": {
	"algorithm": "progressive_shrinking",
	"progressivity_of_elasticity": [
	"width"
	],
	"batchnorm_adaptation": {
	"num_bn_adaptation_samples": 0
	},
	"schedule": {
	"list_stage_descriptions": [
	{
	"train_dims": [
	"width"
	],
	"epochs": 8,
	"depth_indicator": 1,
	"width_indicator": 4,
	"init_lr": 3e-05,
	"epochs_lr": 8,
	"sample_rate": 1
	}
	]
	},
	"elasticity": {
	"available_elasticity_dims": [
	"width"
	],
	"width": {
	"overwrite_groups": [
	[
	"BertForSequenceClassification/BertModel[bert]/BertEncoder[encoder]/ModuleList[layer]/BertLayer[0]/BertAttention[attention]/BertSelfAttention[self]/NNCFLinear[query]/linear_0",
	"BertForSequenceClassification/BertModel[bert]/BertEncoder[encoder]/ModuleList[layer]/BertLayer[0]/BertAttention[attention]/BertSelfAttention[self]/NNCFLinear[key]/linear_0",
	"BertForSequenceClassification/BertModel[bert]/BertEncoder[encoder]/ModuleList[layer]/BertLayer[0]/BertAttention[attention]/BertSelfAttention[self]/NNCFLinear[value]/linear_0"
	],
	[
	"BertForSequenceClassification/BertModel[bert]/BertEncoder[encoder]/ModuleList[layer]/BertLayer[1]/BertAttention[attention]/BertSelfAttention[self]/NNCFLinear[query]/linear_0",
	"BertForSequenceClassification/BertModel[bert]/BertEncoder[encoder]/ModuleList[layer]/BertLayer[1]/BertAttention[attention]/BertSelfAttention[self]/NNCFLinear[key]/linear_0",
	"BertForSequenceClassification/BertModel[bert]/BertEncoder[encoder]/ModuleList[layer]/BertLayer[1]/BertAttention[attention]/BertSelfAttention[self]/NNCFLinear[value]/linear_0"
	],
	[
	"BertForSequenceClassification/BertModel[bert]/BertEncoder[encoder]/ModuleList[layer]/BertLayer[2]/BertAttention[attention]/BertSelfAttention[self]/NNCFLinear[query]/linear_0",
	"BertForSequenceClassification/BertModel[bert]/BertEncoder[encoder]/ModuleList[layer]/BertLayer[2]/BertAttention[attention]/BertSelfAttention[self]/NNCFLinear[key]/linear_0",
	"BertForSequenceClassification/BertModel[bert]/BertEncoder[encoder]/ModuleList[layer]/BertLayer[2]/BertAttention[attention]/BertSelfAttention[self]/NNCFLinear[value]/linear_0"
	],
	[
	"BertForSequenceClassification/BertModel[bert]/BertEncoder[encoder]/ModuleList[layer]/BertLayer[3]/BertAttention[attention]/BertSelfAttention[self]/NNCFLinear[query]/linear_0",
	"BertForSequenceClassification/BertModel[bert]/BertEncoder[encoder]/ModuleList[layer]/BertLayer[3]/BertAttention[attention]/BertSelfAttention[self]/NNCFLinear[key]/linear_0",
	"BertForSequenceClassification/BertModel[bert]/BertEncoder[encoder]/ModuleList[layer]/BertLayer[3]/BertAttention[attention]/BertSelfAttention[self]/NNCFLinear[value]/linear_0"
	],
	[
	"BertForSequenceClassification/BertModel[bert]/BertEncoder[encoder]/ModuleList[layer]/BertLayer[4]/BertAttention[attention]/BertSelfAttention[self]/NNCFLinear[query]/linear_0",
	"BertForSequenceClassification/BertModel[bert]/BertEncoder[encoder]/ModuleList[layer]/BertLayer[4]/BertAttention[attention]/BertSelfAttention[self]/NNCFLinear[key]/linear_0",
	"BertForSequenceClassification/BertModel[bert]/BertEncoder[encoder]/ModuleList[layer]/BertLayer[4]/BertAttention[attention]/BertSelfAttention[self]/NNCFLinear[value]/linear_0"
	],
	[
	"BertForSequenceClassification/BertModel[bert]/BertEncoder[encoder]/ModuleList[layer]/BertLayer[5]/BertAttention[attention]/BertSelfAttention[self]/NNCFLinear[query]/linear_0",
	"BertForSequenceClassification/BertModel[bert]/BertEncoder[encoder]/ModuleList[layer]/BertLayer[5]/BertAttention[attention]/BertSelfAttention[self]/NNCFLinear[key]/linear_0",
	"BertForSequenceClassification/BertModel[bert]/BertEncoder[encoder]/ModuleList[layer]/BertLayer[5]/BertAttention[attention]/BertSelfAttention[self]/NNCFLinear[value]/linear_0"
	],
	[
	"BertForSequenceClassification/BertModel[bert]/BertEncoder[encoder]/ModuleList[layer]/BertLayer[6]/BertAttention[attention]/BertSelfAttention[self]/NNCFLinear[query]/linear_0",
	"BertForSequenceClassification/BertModel[bert]/BertEncoder[encoder]/ModuleList[layer]/BertLayer[6]/BertAttention[attention]/BertSelfAttention[self]/NNCFLinear[key]/linear_0",
	"BertForSequenceClassification/BertModel[bert]/BertEncoder[encoder]/ModuleList[layer]/BertLayer[6]/BertAttention[attention]/BertSelfAttention[self]/NNCFLinear[value]/linear_0"
	],
	[
	"BertForSequenceClassification/BertModel[bert]/BertEncoder[encoder]/ModuleList[layer]/BertLayer[7]/BertAttention[attention]/BertSelfAttention[self]/NNCFLinear[query]/linear_0",
	"BertForSequenceClassification/BertModel[bert]/BertEncoder[encoder]/ModuleList[layer]/BertLayer[7]/BertAttention[attention]/BertSelfAttention[self]/NNCFLinear[key]/linear_0",
	"BertForSequenceClassification/BertModel[bert]/BertEncoder[encoder]/ModuleList[layer]/BertLayer[7]/BertAttention[attention]/BertSelfAttention[self]/NNCFLinear[value]/linear_0"
	],
	[
	"BertForSequenceClassification/BertModel[bert]/BertEncoder[encoder]/ModuleList[layer]/BertLayer[0]/BertIntermediate[intermediate]/NNCFLinear[dense]/linear_0"
	],
	[
	"BertForSequenceClassification/BertModel[bert]/BertEncoder[encoder]/ModuleList[layer]/BertLayer[1]/BertIntermediate[intermediate]/NNCFLinear[dense]/linear_0"
	],
	[
	"BertForSequenceClassification/BertModel[bert]/BertEncoder[encoder]/ModuleList[layer]/BertLayer[2]/BertIntermediate[intermediate]/NNCFLinear[dense]/linear_0"
	],
	[
	"BertForSequenceClassification/BertModel[bert]/BertEncoder[encoder]/ModuleList[layer]/BertLayer[3]/BertIntermediate[intermediate]/NNCFLinear[dense]/linear_0"
	],
	[
	"BertForSequenceClassification/BertModel[bert]/BertEncoder[encoder]/ModuleList[layer]/BertLayer[4]/BertIntermediate[intermediate]/NNCFLinear[dense]/linear_0"
	],
	[
	"BertForSequenceClassification/BertModel[bert]/BertEncoder[encoder]/ModuleList[layer]/BertLayer[5]/BertIntermediate[intermediate]/NNCFLinear[dense]/linear_0"
	],
	[
	"BertForSequenceClassification/BertModel[bert]/BertEncoder[encoder]/ModuleList[layer]/BertLayer[6]/BertIntermediate[intermediate]/NNCFLinear[dense]/linear_0"
	],
	[
	"BertForSequenceClassification/BertModel[bert]/BertEncoder[encoder]/ModuleList[layer]/BertLayer[7]/BertIntermediate[intermediate]/NNCFLinear[dense]/linear_0"
	]
	],
	"overwrite_groups_widths": [
	[
	512,
	448,
	320,
	192
	],
	[
	512,
	384,
	128
	],
	[
	512,
	320,
	256,
	128
	],
	[
	512,
	384,
	320,
	256
	],
	[
	512,
	320,
	256,
	192
	],
	[
	512,
	448,
	128,
	64
	],
	[
	512,
	320,
	192
	],
	[
	512,
	192,
	128
	],
	[
	2048,
	2047,
	1999,
	1656,
	1323
	],
	[
	2048,
	2001,
	1663,
	1319
	],
	[
	2048,
	1982,
	1549,
	1194
	],
	[
	2048,
	2047,
	1962,
	1545,
	1182
	],
	[
	2048,
	2045,
	1953,
	1531,
	1137
	],
	[
	2048,
	2044,
	1909,
	1382,
	996
	],
	[
	2048,
	2035,
	1843,
	1248,
	843
	],
	[
	2048,
	2018,
	1680,
	1027,
	684
	]
	],
	"add_dynamic_inputs": [
	"BertForSequenceClassification/BertModel[bert]/BertEncoder[encoder]/ModuleList[layer]/BertLayer[0]/BertAttention[attention]/BertSelfOutput[output]/NNCFLinear[dense]/linear_0",
	"BertForSequenceClassification/BertModel[bert]/BertEncoder[encoder]/ModuleList[layer]/BertLayer[1]/BertAttention[attention]/BertSelfOutput[output]/NNCFLinear[dense]/linear_0",
	"BertForSequenceClassification/BertModel[bert]/BertEncoder[encoder]/ModuleList[layer]/BertLayer[2]/BertAttention[attention]/BertSelfOutput[output]/NNCFLinear[dense]/linear_0",
	"BertForSequenceClassification/BertModel[bert]/BertEncoder[encoder]/ModuleList[layer]/BertLayer[3]/BertAttention[attention]/BertSelfOutput[output]/NNCFLinear[dense]/linear_0",
	"BertForSequenceClassification/BertModel[bert]/BertEncoder[encoder]/ModuleList[layer]/BertLayer[4]/BertAttention[attention]/BertSelfOutput[output]/NNCFLinear[dense]/linear_0",
	"BertForSequenceClassification/BertModel[bert]/BertEncoder[encoder]/ModuleList[layer]/BertLayer[5]/BertAttention[attention]/BertSelfOutput[output]/NNCFLinear[dense]/linear_0",
	"BertForSequenceClassification/BertModel[bert]/BertEncoder[encoder]/ModuleList[layer]/BertLayer[6]/BertAttention[attention]/BertSelfOutput[output]/NNCFLinear[dense]/linear_0",
	"BertForSequenceClassification/BertModel[bert]/BertEncoder[encoder]/ModuleList[layer]/BertLayer[7]/BertAttention[attention]/BertSelfOutput[output]/NNCFLinear[dense]/linear_0"
	]
	}
	}
	},
	"search": {
	"algorithm": "NSGA2",
	"batchnorm_adaptation": {
	"num_bn_adaptation_samples": 0
	},
	"num_evals": 1000,
	"population": 40,
	"ref_acc": 92.32
	}
	},
	"compression": [
	{
	"algorithm": "movement_sparsity",
	"params": {
	"warmup_start_epoch": 1,
	"warmup_end_epoch": 3,
	"importance_regularization_factor": 0.02,
	"enable_structured_masking": true
	},
	"sparse_structure_by_scopes": [
	{
	"mode": "block",
	"sparse_factors": [
	32,
	32
	],
	"target_scopes": "{re}.BertAttention."
	},
	{
	"mode": "per_dim",
	"axis": 0,
	"target_scopes": "{re}.BertIntermediate."
	},
	{
	"mode": "per_dim",
	"axis": 1,
	"target_scopes": "{re}.BertOutput."
	}
	],
	"ignored_scopes": [
	"{re}.NNCFEmbedding.",
	"{re}.LayerNorm.",
	"{re}.pooler.",
	"{re}.classifier."
	]
	}
	]
	}