Spaces:

NMHung
/

USR-DA

Sleeping

USR-DA / train.py

dump shiet

e5b70eb over 2 years ago

17.1 kB

	import os

	import torch
	import torch.nn as nn
	import torch.optim as optim
	import wandb
	from torch.utils.data import DataLoader
	from torchvision import transforms
	from tqdm import tqdm

	from data.LQGT_dataset import LQGTDataset, LQGTValDataset
	from model import decoder, discriminator, encoder
	from opt.option import args
	from util.utils import (RandCrop, RandHorizontalFlip, RandRotate, ToTensor, RandCrop_pair,
	VGG19PerceptualLoss)

	from torchmetrics import PeakSignalNoiseRatio, StructuralSimilarityIndexMeasure
	from torchmetrics.image.lpip import LearnedPerceptualImagePatchSimilarity

	wandb.init(project='SR', config=args)



	# device setting
	if args.gpu_id is not None:
	os.environ['CUDA_VISIBLE_DEVICES'] = "0"
	print('using GPU 0')
	else:
	print('use --gpu_id to specify GPU ID to use')
	exit()

	device = torch.device('cuda')

	# make directory for saving weights
	if not os.path.exists(args.snap_path):
	os.mkdir(args.snap_path)

	print("Loading dataset...")
	# load training dataset
	train_dataset = LQGTDataset(
	db_path=args.dir_data,
	transform=transforms.Compose([RandCrop(args.patch_size, args.scale), RandHorizontalFlip(), RandRotate(), ToTensor()])
	)

	val_dataset = LQGTValDataset(
	db_path=args.dir_data,
	transform=transforms.Compose([RandCrop_pair(args.patch_size, args.scale), ToTensor()])
	)

	train_loader = DataLoader(
	train_dataset,
	batch_size=args.batch_size,
	num_workers=args.num_workers,
	drop_last=True,
	shuffle=True
	)

	val_loader = DataLoader(
	val_dataset,
	batch_size=args.batch_size,
	num_workers=args.num_workers,
	shuffle=False
	)


	print("Create model")
	model_Disc_feat = discriminator.DiscriminatorVGG(in_ch=args.n_hidden_feats, image_size=args.patch_size).to(device)
	model_Disc_img_LR = discriminator.DiscriminatorVGG(in_ch=3, image_size=args.patch_size).to(device)
	model_Disc_img_HR = discriminator.DiscriminatorVGG(in_ch=3, image_size=args.scale*args.patch_size).to(device)
	# define model (generator)
	model_Enc = encoder.Encoder_RRDB(num_feat=args.n_hidden_feats).to(device)
	model_Dec_Id = decoder.Decoder_Id_RRDB(num_in_ch=args.n_hidden_feats).to(device)
	model_Dec_SR = decoder.Decoder_SR_RRDB(num_in_ch=args.n_hidden_feats).to(device)

	# define model (discriminator)

	# model_Disc_feat = discriminator.UNetDiscriminator(num_in_ch=64).to(device)
	# model_Disc_img_LR = discriminator.UNetDiscriminator(num_in_ch=3).to(device)
	# model_Disc_img_HR = discriminator.UNetDiscriminator(num_in_ch=3).to(device)

	# wandb logging
	wandb.watch(model_Disc_feat)
	wandb.watch(model_Disc_img_LR)
	wandb.watch(model_Enc)
	wandb.watch(model_Dec_Id)
	wandb.watch(model_Dec_SR)


	print("Define Loss")
	# loss
	loss_L1 = nn.L1Loss().to(device)
	loss_MSE = nn.MSELoss().to(device)
	loss_adversarial = nn.BCEWithLogitsLoss().to(device)
	loss_percept = VGG19PerceptualLoss().to(device)


	print("Define Optimizer")
	# optimizer
	params_G = list(model_Enc.parameters()) + list(model_Dec_Id.parameters()) + list(model_Dec_SR.parameters())
	optimizer_G = optim.Adam(
	params_G,
	lr=args.lr_G,
	betas=(args.beta1, args.beta2),
	weight_decay=args.weight_decay,
	amsgrad=True
	)
	params_D = list(model_Disc_feat.parameters()) + list(model_Disc_img_LR.parameters()) + list(model_Disc_img_HR.parameters())
	optimizer_D = optim.Adam(
	params_D,
	lr=args.lr_D,
	betas=(args.beta1, args.beta2),
	weight_decay=args.weight_decay,
	amsgrad=True
	)

	print("Define Scheduler")
	# Scheduler
	iter_indices = [args.interval1, args.interval2, args.interval3]
	scheduler_G = optim.lr_scheduler.MultiStepLR(
	optimizer=optimizer_G,
	milestones=iter_indices,
	gamma=0.5
	)
	scheduler_D = optim.lr_scheduler.MultiStepLR(
	optimizer=optimizer_D,
	milestones=iter_indices,
	gamma=0.5
	)

	# print("Data Parallel")
	model_Enc = nn.DataParallel(model_Enc)
	model_Dec_Id = nn.DataParallel(model_Dec_Id)
	model_Dec_SR = nn.DataParallel(model_Dec_SR)

	# define model (discriminator)
	#model_Disc_feat = nn.DataParallel(model_Disc_feat)
	#model_Disc_img_LR = nn.DataParallel(model_Disc_img_LR)
	#model_Disc_img_HR = nn.DataParallel(model_Disc_img_HR)

	print("Load model weight")
	# load model weights & optimzer % scheduler
	if args.checkpoint is not None:
	checkpoint = torch.load(args.checkpoint)

	model_Enc.load_state_dict(checkpoint['model_Enc'])
	model_Dec_Id.load_state_dict(checkpoint['model_Dec_Id'])
	model_Dec_SR.load_state_dict(checkpoint['model_Dec_SR'])
	model_Disc_feat.load_state_dict(checkpoint['model_Disc_feat'])
	model_Disc_img_LR.load_state_dict(checkpoint['model_Disc_img_LR'])
	model_Disc_img_HR.load_state_dict(checkpoint['model_Disc_img_HR'])

	optimizer_D.load_state_dict(checkpoint['optimizer_D'])
	optimizer_G.load_state_dict(checkpoint['optimizer_G'])

	scheduler_D.load_state_dict(checkpoint['scheduler_D'])
	scheduler_G.load_state_dict(checkpoint['scheduler_G'])

	start_epoch = checkpoint['epoch']
	else:
	start_epoch = 0


	if args.pretrained is not None:
	ckpt = torch.load(args.pretrained)
	ckpt["params"]["conv_first.weight"] = ckpt["params"]["conv_first.weight"][:,0,:,:].expand(64,64,3,3)
	model_Dec_SR.load_state_dict(ckpt["params"])







	# model_Enc = model_Enc.to(device)
	# model_Dec_Id = model_Dec_Id.to(device)
	# model_Dec_SR = model_Dec_SR.to(device)

	# # define model (discriminator)
	# model_Disc_feat = model_Disc_feat.to(device)
	# model_Disc_img_LR = model_Disc_img_LR.to(device)
	# model_Disc_img_HR =model_Disc_img_HR.to(device)
	# training

	PSNR = PeakSignalNoiseRatio().to(device)
	SSIM = StructuralSimilarityIndexMeasure().to(device)
	LPIPS = LearnedPerceptualImagePatchSimilarity().to(device)

	if args.phase == "train":
	for epoch in range(start_epoch, args.epochs):
	# generator
	model_Enc.train()
	model_Dec_Id.train()
	model_Dec_SR.train()

	# discriminator
	model_Disc_feat.train()
	model_Disc_img_LR.train()
	model_Disc_img_HR.train()

	running_loss_D_total = 0.0
	running_loss_G_total = 0.0

	running_loss_align = 0.0
	running_loss_rec = 0.0
	running_loss_res = 0.0
	running_loss_sty = 0.0
	running_loss_idt = 0.0
	running_loss_cyc = 0.0

	iter = 0

	for data in tqdm(train_loader):
	iter += 1

	########################
	# data load #
	########################
	X_t, Y_s = data['img_LQ'], data['img_GT']

	ds4 = nn.Upsample(scale_factor=1/args.scale, mode='bicubic')
	X_s = ds4(Y_s)

	X_t = X_t.cuda(non_blocking=True)
	X_s = X_s.cuda(non_blocking=True)
	Y_s = Y_s.cuda(non_blocking=True)

	# real label and fake label
	batch_size = X_t.size(0)
	real_label = torch.full((batch_size, 1), 1, dtype=X_t.dtype).cuda(non_blocking=True)
	fake_label = torch.full((batch_size, 1), 0, dtype=X_t.dtype).cuda(non_blocking=True)


	########################
	# (1) Update D network #
	########################
	model_Disc_feat.zero_grad()
	model_Disc_img_LR.zero_grad()
	model_Disc_img_HR.zero_grad()

	for i in range(args.n_disc):
	# generator output (feature domain)
	F_t = model_Enc(X_t)
	F_s = model_Enc(X_s)

	# 1. feature aligment loss (discriminator)
	# output of discriminator (feature domain) (b x c(=1) x h x w)
	output_Disc_F_t = model_Disc_feat(F_t.detach())
	output_Disc_F_s = model_Disc_feat(F_s.detach())
	# discriminator loss (feature domain)
	loss_Disc_F_t = loss_MSE(output_Disc_F_t, fake_label)
	loss_Disc_F_s = loss_MSE(output_Disc_F_s, real_label)
	loss_Disc_feat_align = (loss_Disc_F_t + loss_Disc_F_s) / 2

	# 2. SR reconstruction loss (discriminator)
	# generator output (image domain)
	Y_s_s = model_Dec_SR(F_s)
	# output of discriminator (image domain)
	output_Disc_Y_s_s = model_Disc_img_HR(Y_s_s.detach())
	output_Disc_Y_s = model_Disc_img_HR(Y_s)
	# discriminator loss (image domain)
	loss_Disc_Y_s_s = loss_MSE(output_Disc_Y_s_s, fake_label)
	loss_Disc_Y_s = loss_MSE(output_Disc_Y_s, real_label)
	loss_Disc_img_rec = (loss_Disc_Y_s_s + loss_Disc_Y_s) / 2

	# 4. Target degradation style loss
	# generator output (image domain)
	X_s_t = model_Dec_Id(F_s)
	# output of discriminator (image domain)
	output_Disc_X_s_t = model_Disc_img_LR(X_s_t.detach())
	output_Disc_X_t = model_Disc_img_LR(X_t)
	# discriminator loss (image domain)
	loss_Disc_X_s_t = loss_MSE(output_Disc_X_s_t, fake_label)
	loss_Disc_X_t = loss_MSE(output_Disc_X_t, real_label)
	loss_Disc_img_sty = (loss_Disc_X_s_t + loss_Disc_X_t) / 2

	# 6. Cycle loss
	# generator output (image domain)
	Y_s_t_s = model_Dec_SR(model_Enc(model_Dec_Id(F_s)))
	# output of discriminator (image domain)
	output_Disc_Y_s_t_s = model_Disc_img_HR(Y_s_t_s.detach())
	output_Disc_Y_s = model_Disc_img_HR(Y_s)
	# discriminator loss (image domain)
	loss_Disc_Y_s_t_s = loss_MSE(output_Disc_Y_s_t_s, fake_label)
	loss_Disc_Y_s = loss_MSE(output_Disc_Y_s, real_label)
	loss_Disc_img_cyc = (loss_Disc_Y_s_t_s + loss_Disc_Y_s) / 2

	# discriminator weight update
	loss_D_total = loss_Disc_feat_align + loss_Disc_img_rec + loss_Disc_img_sty + loss_Disc_img_cyc
	loss_D_total.backward()
	optimizer_D.step()



	scheduler_D.step()


	########################
	# (2) Update G network #
	########################
	model_Enc.zero_grad()
	model_Dec_Id.zero_grad()
	model_Dec_SR.zero_grad()

	for i in range(args.n_gen):
	# generator output (feature domain)
	F_t = model_Enc(X_t)
	F_s = model_Enc(X_s)

	# 1. feature alignment loss (generator)
	# output of discriminator (feature domain)
	output_Disc_F_t = model_Disc_feat(F_t)
	output_Disc_F_s = model_Disc_feat(F_s)
	# generator loss (feature domain)
	loss_G_F_t = loss_MSE(output_Disc_F_t, (real_label + fake_label)/2)
	loss_G_F_s = loss_MSE(output_Disc_F_s, (real_label + fake_label)/2)
	L_align_E = loss_G_F_t + loss_G_F_s

	# 2. SR reconstruction loss
	# generator output (image domain)
	Y_s_s = model_Dec_SR(F_s)
	# output of discriminator (image domain)
	output_Disc_Y_s_s = model_Disc_img_HR(Y_s_s)
	# L1 loss
	loss_L1_rec = loss_L1(Y_s.detach(), Y_s_s)
	# perceptual loss
	loss_percept_rec = loss_percept(Y_s.detach(), Y_s_s)
	# adversatial loss
	loss_G_Y_s_s = loss_MSE(output_Disc_Y_s_s, real_label)
	L_rec_G_SR = loss_L1_rec + args.lambda_perceptloss_percept_rec + args.lambda_advloss_G_Y_s_s

	# 3. Target LR restoration loss
	X_t_t = model_Dec_Id(F_t)
	L_res_G_t = loss_L1(X_t, X_t_t)

	# 4. Target degredation style loss
	# generator output (image domain)
	X_s_t = model_Dec_Id(F_s)
	# output of discriminator (img domain)
	output_Disc_X_s_t = model_Disc_img_LR(X_s_t)
	# generator loss (feature domain)
	loss_G_X_s_t = loss_MSE(output_Disc_X_s_t, real_label)
	L_sty_G_t = loss_G_X_s_t

	# 5. Feature identity loss
	F_s_tilda = model_Enc(model_Dec_Id(F_s))
	L_idt_G_t = loss_L1(F_s, F_s_tilda)

	# 6. Cycle loss
	# generator output (image domain)
	Y_s_t_s = model_Dec_SR(model_Enc(model_Dec_Id(F_s)))
	# output of discriminator (image domain)
	output_Disc_Y_s_t_s = model_Disc_img_HR(Y_s_t_s)
	# L1 loss
	loss_L1_cyc = loss_L1(Y_s.detach(), Y_s_t_s)
	# perceptual loss
	loss_percept_cyc = loss_percept(Y_s.detach(), Y_s_t_s)
	# adversarial loss
	loss_Y_s_t_s = loss_MSE(output_Disc_Y_s_t_s, real_label)
	L_cyc_G_t_G_SR = loss_L1_cyc + args.lambda_perceptloss_percept_cyc + args.lambda_advloss_Y_s_t_s

	# generator weight update
	loss_G_total = args.lambda_alignL_align_E + args.lambda_recL_rec_G_SR + args.lambda_resL_res_G_t + args.lambda_styL_sty_G_t + args.lambda_idtL_idt_G_t + args.lambda_cycL_cyc_G_t_G_SR
	loss_G_total.backward()
	optimizer_G.step()
	scheduler_G.step()


	########################
	# compute loss #
	########################
	running_loss_D_total += loss_D_total.item()
	running_loss_G_total += loss_G_total.item()

	running_loss_align += L_align_E.item()
	running_loss_rec += L_rec_G_SR.item()
	running_loss_res += L_res_G_t.item()
	running_loss_sty += L_sty_G_t.item()
	running_loss_idt += L_idt_G_t.item()
	running_loss_cyc += L_cyc_G_t_G_SR.item()
	if iter % args.log_interval == 0:
	wandb.log(
	{
	"loss_D_total_step": running_loss_D_total/iter,
	"loss_G_total_step": running_loss_G_total/iter,
	"loss_align_step": running_loss_align/iter,
	"loss_rec_step": running_loss_rec/iter,
	"loss_res_step": running_loss_res/iter,
	"loss_sty_step": running_loss_sty/iter,
	"loss_idt_step": running_loss_idt/iter,
	"loss_cyc_step": running_loss_cyc/iter,
	}
	)
	### EVALUATE ###
	total_PSNR = 0
	total_SSIM = 0
	total_LPIPS = 0
	val_iter = 0
	with torch.no_grad():
	model_Enc.eval()
	model_Dec_SR.eval()
	for batch_idx, batch in enumerate(val_loader):
	val_iter += 1
	source = batch["img_LQ"].to(device)
	target = batch["img_GT"].to(device)

	feat = model_Enc(source)
	out = model_Dec_SR(feat)

	total_PSNR += PSNR(out, target)
	total_SSIM += SSIM(out, target)
	total_LPIPS += LPIPS(out, target)

	wandb.log(
	{
	"epoch": epoch,
	"lr": optimizer_G.param_groups[0]['lr'],
	"loss_D_total_epoch": running_loss_D_total/iter,
	"loss_G_total_epoch": running_loss_G_total/iter,
	"loss_align_epoch": running_loss_align/iter,
	"loss_rec_epoch": running_loss_rec/iter,
	"loss_res_epoch": running_loss_res/iter,
	"loss_sty_epoch": running_loss_sty/iter,
	"loss_idt_epoch": running_loss_idt/iter,
	"loss_cyc_epoch": running_loss_cyc/iter,
	"PSNR_val": total_PSNR/val_iter,
	"SSIM_val": total_SSIM/val_iter,
	"LPIPS_val": total_LPIPS/val_iter
	}
	)


	if (epoch+1) % args.save_freq == 0:
	weights_file_name = 'epoch_%d.pth' % (epoch+1)
	weights_file = os.path.join(args.snap_path, weights_file_name)
	torch.save({
	'epoch': epoch,

	'model_Enc': model_Enc.state_dict(),
	'model_Dec_Id': model_Dec_Id.state_dict(),
	'model_Dec_SR': model_Dec_SR.state_dict(),
	'model_Disc_feat': model_Disc_feat.state_dict(),
	'model_Disc_img_LR': model_Disc_img_LR.state_dict(),
	'model_Disc_img_HR': model_Disc_img_HR.state_dict(),

	'optimizer_D': optimizer_D.state_dict(),
	'optimizer_G': optimizer_G.state_dict(),

	'scheduler_D': scheduler_D.state_dict(),
	'scheduler_G': scheduler_G.state_dict(),
	}, weights_file)
	print('save weights of epoch %d' % (epoch+1))
	else:
	### EVALUATE ###
	total_PSNR = 0
	total_SSIM = 0
	total_LPIPS = 0
	val_iter = 0
	with torch.no_grad():
	model_Enc.eval()
	model_Dec_SR.eval()
	for batch_idx, batch in enumerate(val_loader):
	val_iter += 1
	source = batch["img_LQ"].to(device)
	target = batch["img_GT"].to(device)

	feat = model_Enc(source)
	out = model_Dec_SR(feat)

	total_PSNR += PSNR(out, target)
	total_SSIM += SSIM(out, target)
	total_LPIPS += LPIPS(out, target)
	print("PSNR_val: ", total_PSNR/val_iter)
	print("SSIM_val: ", total_SSIM/val_iter)
	print("LPIPS_val: ", total_LPIPS/val_iter)