Spaces:

hakansivuk
/

DiverseSemanticImageEditing

Sleeping

App Files Files Community

DiverseSemanticImageEditing / model /networks /blocks.py

hakansivuk

Final commit

087921f about 1 year ago

raw

history blame contribute delete

No virus

13.1 kB

	import torch
	import torch.nn as nn
	import torch.nn.functional as F
	import torch.nn.utils.spectral_norm as spectral_norm
	import torchvision

	class Conv2dBlock(nn.Module):
	def __init__(self, input_dim, output_dim, kernel_size, stride,
	padding=0, dilation=1, norm='in', activation='relu', pad_type='replicate'):
	super(Conv2dBlock, self).__init__()

	self.use_bias = False
	if norm == 'in':
	self.use_bias = True

	# initialize padding
	if pad_type == 'reflect':
	self.pad = nn.ReflectionPad2d(padding)
	elif pad_type == 'replicate':
	self.pad = nn.ReplicationPad2d(padding)
	elif pad_type == 'zero':
	self.pad = nn.ZeroPad2d(padding)
	else:
	assert 0, "Unsupported padding type: {}".format(pad_type)

	# initialize normalization
	norm_dim = output_dim
	if norm == 'bn':
	self.norm = nn.BatchNorm2d(norm_dim)
	elif norm == 'in':
	#self.norm = nn.InstanceNorm2d(norm_dim, track_running_stats=True)
	self.norm = nn.InstanceNorm2d(norm_dim)
	elif norm == 'none' or norm == 'sn':
	self.norm = None
	else:
	assert 0, "Unsupported normalization: {}".format(norm)

	# initialize activation
	if activation == 'relu':
	self.activation = nn.ReLU(inplace=True)
	elif activation == 'lrelu':
	self.activation = nn.LeakyReLU(0.2, inplace=True)
	elif activation == 'prelu':
	self.activation = nn.PReLU()
	elif activation == 'selu':
	self.activation = nn.SELU(inplace=True)
	elif activation == 'elu':
	self.activation = nn.ELU()
	elif activation == 'tanh':
	self.activation = nn.Tanh()
	elif activation == 'none':
	self.activation = None
	else:
	assert 0, "Unsupported activation: {}".format(activation)

	# initialize convolution
	if norm == 'sn':
	self.conv = spectral_norm(nn.Conv2d(input_dim, output_dim, kernel_size, stride, padding=0, dilation=dilation, bias=self.use_bias))
	else:
	self.conv = nn.Conv2d(input_dim, output_dim, kernel_size, stride, padding=0, dilation=dilation, bias=self.use_bias)

	def forward(self, x):
	x = self.conv(self.pad(x))
	if self.norm:
	x = self.norm(x)
	if self.activation:
	x = self.activation(x)
	return x


	class UpConv2dBlock(nn.Module):
	def __init__(self, input_dim, output_dim, kernel_size, stride,
	padding=0, norm='in', activation='relu', pad_type='replicate', up_mode='nearest'):
	super(UpConv2dBlock, self).__init__()

	self.use_bias = False
	if norm == 'IN':
	self.use_bias = True

	self.up = nn.Upsample(scale_factor=2, mode=up_mode)

	# initialize padding
	if pad_type == 'reflect':
	self.pad = nn.ReflectionPad2d(padding)
	elif pad_type == 'replicate':
	self.pad = nn.ReplicationPad2d(padding)
	elif pad_type == 'zero':
	self.pad = nn.ZeroPad2d(padding)
	else:
	assert 0, "Unsupported padding type: {}".format(pad_type)

	# initialize normalization
	norm_dim = output_dim
	if norm == 'bn':
	self.norm = nn.BatchNorm2d(norm_dim)
	elif norm == 'in':
	#self.norm = nn.InstanceNorm2d(norm_dim, track_running_stats=True)
	self.norm = nn.InstanceNorm2d(norm_dim)
	elif norm == 'none' or norm == 'sn':
	self.norm = None
	else:
	assert 0, "Unsupported normalization: {}".format(norm)

	# initialize activation
	if activation == 'relu':
	self.activation = nn.ReLU(inplace=True)
	elif activation == 'lrelu':
	self.activation = nn.LeakyReLU(0.2, inplace=True)
	elif activation == 'prelu':
	self.activation = nn.PReLU()
	elif activation == 'selu':
	self.activation = nn.SELU(inplace=True)
	elif activation == 'elu':
	self.activation = nn.ELU()
	elif activation == 'tanh':
	self.activation = nn.Tanh()
	elif activation == 'none':
	self.activation = None
	else:
	assert 0, "Unsupported activation: {}".format(activation)

	# initialize convolution
	if norm == 'sn':
	self.conv = spectral_norm(nn.Conv2d(input_dim, output_dim, kernel_size, stride, bias=self.use_bias))
	else:
	self.conv = nn.Conv2d(input_dim, output_dim, kernel_size, stride, bias=self.use_bias)

	def forward(self, x, skip=None):
	x = self.up(x)
	if skip is not None:
	x = torch.cat((x, skip), dim=1)
	x = self.conv(self.pad(x))
	if self.norm:
	x = self.norm(x)
	if self.activation:
	x = self.activation(x)
	return x


	# VGG architecter, used for the perceptual loss using a pretrained VGG network
	class VGG19(torch.nn.Module):
	def __init__(self, requires_grad=False):
	super().__init__()
	vgg_pretrained_features = torchvision.models.vgg19(pretrained=True).features
	self.slice1 = torch.nn.Sequential()
	self.slice2 = torch.nn.Sequential()
	self.slice3 = torch.nn.Sequential()
	self.slice4 = torch.nn.Sequential()
	self.slice5 = torch.nn.Sequential()
	for x in range(2):
	self.slice1.add_module(str(x), vgg_pretrained_features[x])
	for x in range(2, 7):
	self.slice2.add_module(str(x), vgg_pretrained_features[x])
	for x in range(7, 12):
	self.slice3.add_module(str(x), vgg_pretrained_features[x])
	for x in range(12, 21):
	self.slice4.add_module(str(x), vgg_pretrained_features[x])
	for x in range(21, 30):
	self.slice5.add_module(str(x), vgg_pretrained_features[x])
	if not requires_grad:
	for param in self.parameters():
	param.requires_grad = False

	def forward(self, X):
	h_relu1 = self.slice1(X)
	h_relu2 = self.slice2(h_relu1)
	h_relu3 = self.slice3(h_relu2)
	h_relu4 = self.slice4(h_relu3)
	h_relu5 = self.slice5(h_relu4)
	out = [h_relu1, h_relu2, h_relu3, h_relu4, h_relu5]
	return out



	####################################################################################################################
	class CondGatedConv2d(nn.Module):
	def __init__(self, in_channels, out_channels, label_nc, kernel_size, stride=1, padding=0, dilation=1, pad_type='zero',
	activation='elu', norm='none', sn=False, cfg=None, spade_norm=False):
	super(CondGatedConv2d, self).__init__()

	self.out_channels = out_channels
	self.spade_norm = spade_norm
	# Initialize the padding scheme
	if pad_type == 'reflect':
	self.pad = nn.ReflectionPad2d(padding)
	elif pad_type == 'replicate':
	self.pad = nn.ReplicationPad2d(padding)
	elif pad_type == 'zero':
	self.pad = nn.ZeroPad2d(padding)
	else:
	assert 0, "Unsupported padding type: {}".format(pad_type)

	# Initialize the normalization type
	if norm == 'bn':
	self.norm = nn.BatchNorm2d(out_channels)
	elif norm == 'in':
	self.norm = nn.InstanceNorm2d(out_channels)
	elif norm == 'ln':
	self.norm = nn.LayerNorm(out_channels)
	elif norm == 'none':
	self.norm = None
	else:
	assert 0, "Unsupported normalization: {}".format(norm)

	# Initialize the activation funtion
	if activation == 'relu':
	self.activation = nn.ReLU(inplace=True)
	elif activation == 'lrelu':
	self.activation = nn.LeakyReLU(0.2, inplace=True)
	elif activation == 'prelu':
	self.activation = nn.PReLU()
	elif activation == 'selu':
	self.activation = nn.SELU(inplace=True)
	elif activation == 'tanh':
	self.activation = nn.Tanh()
	elif activation == 'sigmoid':
	self.activation = nn.Sigmoid()
	elif activation == 'elu':
	self.activation = nn.ELU(inplace=True)
	elif activation == 'none':
	self.activation = None
	else:
	assert 0, "Unsupported activation: {}".format(activation)

	# Initialize the convolution layers
	if sn:
	self.conv2d = spectral_norm(
	nn.Conv2d(in_channels, out_channels, kernel_size, stride, padding=0, dilation=dilation))
	# self.mask_conv2d = spectral_norm(
	# nn.Conv2d(in_channels, out_channels, kernel_size, stride, padding=0, dilation=dilation))
	else:
	self.conv2d = nn.Conv2d(in_channels, out_channels, kernel_size, stride, padding=0, dilation=dilation)
	# self.mask_conv2d = nn.Conv2d(in_channels, out_channels, kernel_size, stride, padding=0, dilation=dilation)
	self.sigmoid = torch.nn.Sigmoid()

	####### mod 1 ########
	# nhidden = out_channels // 2
	# nhidden = 128
	nhidden = 64
	self.mlp_shared = nn.Sequential(
	nn.Conv2d(in_channels, nhidden, kernel_size=3, stride=stride, padding=1),
	nn.ReLU()
	)
	self.mlp_gamma = nn.Conv2d(nhidden, out_channels, kernel_size=3, padding=1)
	self.mlp_beta = nn.Conv2d(nhidden, out_channels, kernel_size=3, padding=1)

	####### mod 2 ########
	mlp_shared_in = label_nc + 1
	if self.spade_norm:
	mlp_shared_in += cfg["style_length"]
	self.mlp_shared_2 = nn.Sequential(
	nn.Conv2d(mlp_shared_in, nhidden, kernel_size=3, stride=1, padding=1),
	nn.ReLU()
	)
	self.mlp_gamma_ctx_gamma = nn.Conv2d(nhidden, out_channels, kernel_size=3, padding=1)
	self.mlp_beta_ctx_gamma = nn.Conv2d(nhidden, out_channels, kernel_size=3, padding=1)

	self.mlp_gamma_ctx_beta = nn.Conv2d(nhidden, out_channels, kernel_size=3, padding=1)
	self.mlp_beta_ctx_beta = nn.Conv2d(nhidden, out_channels, kernel_size=3, padding=1)

	# self.conv_x = nn.Conv2d(in_channels, in_channels, kernel_size=1, padding=0)

	def forward(self, x, seg, mask, style_codes=None):
	x_pad = self.pad(x)

	conv = self.conv2d(x_pad)

	if self.out_channels == 3:
	return conv

	if self.norm:
	normalized = self.norm(conv)

	####### mod 2 ########
	seg = F.interpolate(seg, size=normalized.size()[2:], mode='nearest')
	mask = F.interpolate(mask, size=normalized.size()[2:], mode='nearest')
	concatted = torch.cat((seg, mask), dim=1)
	if style_codes is not None:
	style_codes = F.interpolate(style_codes, size=normalized.size()[2:], mode='nearest')
	concatted = torch.cat((style_codes, concatted), dim=1)
	ctx = self.mlp_shared_2(concatted)
	gamma_ctx_gamma = self.mlp_gamma_ctx_gamma(ctx)
	beta_ctx_gamma = self.mlp_beta_ctx_gamma(ctx)
	gamma_ctx_beta = self.mlp_gamma_ctx_beta(ctx)
	beta_ctx_beta = self.mlp_beta_ctx_beta(ctx)

	####### mod 1 ########
	# x_conv = self.conv_x(x)
	actv = self.mlp_shared(x)
	gamma = self.mlp_gamma(actv)
	beta = self.mlp_beta(actv)
	# print(gamma_ctx_gamma.size())
	# print(beta_ctx_gamma.size())
	# print(gamma.size())

	gamma = gamma * (1. + gamma_ctx_gamma) + beta_ctx_gamma
	beta = beta * (1. + gamma_ctx_beta) + beta_ctx_beta
	out_norm = normalized * (1. + gamma) + beta

	if self.activation:
	out = self.activation(out_norm)

	return out


	class CondTransposeGatedConv2d(nn.Module):
	def __init__(self, in_channels, out_channels, label_nc, kernel_size, stride=1, padding=0, dilation=1, pad_type='zero',
	activation='lrelu', norm='none', sn=True, scale_factor=2, spade_norm=False, cfg=None):
	super(CondTransposeGatedConv2d, self).__init__()
	# Initialize the conv scheme
	self.scale_factor = scale_factor
	self.gated_conv2d = CondGatedConv2d(in_channels, out_channels, label_nc, kernel_size, stride, padding, dilation, pad_type,
	activation, norm, sn, cfg=cfg, spade_norm=spade_norm)

	def forward(self, x, seg, mask, skip=None, style_codes=None):
	x = F.interpolate(x, scale_factor=self.scale_factor, mode='bilinear')
	if skip is not None:
	x = torch.cat((x, skip), dim=1)
	x = self.gated_conv2d(x, seg, mask, style_codes=style_codes)
	return x