Spaces:

menghanxia
/

ReversibleHalftoning

Runtime error

App Files Files Community

ReversibleHalftoning / train.py

menghanxia

created the space

6e70c4a over 1 year ago

raw

history blame

12.8 kB

	import os, glob, datetime, time
	import argparse, json

	import torch
	import torch.optim as optim
	from torch.autograd import Variable
	import torchvision
	from torch.utils.data import DataLoader
	from torch.backends import cudnn

	from model.base_module import tensor2array
	from model.model import ResHalf
	from model.loss import *
	from utils.dataset import HalftoneVOC2012 as Dataset
	from utils.util import ensure_dir, save_list, save_images_from_batch


	class Trainer():
	def __init__(self, config, resume):
	self.config = config
	self.name = config['name']
	self.resume_path = resume
	self.n_epochs = config['trainer']['epochs']
	self.with_cuda = config['cuda'] and torch.cuda.is_available()
	self.seed = config['seed']
	self.start_epoch = 0
	self.save_freq = config['trainer']['save_epochs']
	self.checkpoint_dir = os.path.join(config['save_dir'], self.name)
	ensure_dir(self.checkpoint_dir)
	json.dump(config, open(os.path.join(self.checkpoint_dir, 'config.json'), 'w'),
	indent=4, sort_keys=False)
	print("@Workspace: %s *************"%self.checkpoint_dir)
	self.cache = os.path.join(self.checkpoint_dir, 'train_cache')
	self.val_halftone = os.path.join(self.cache, 'halftone')
	self.val_restored = os.path.join(self.cache, 'restored')
	ensure_dir(self.val_halftone)
	ensure_dir(self.val_restored)

	## model
	self.model = eval(config['model'])()
	if self.config['multi-gpus']:
	self.model = torch.nn.DataParallel(self.model).cuda()
	elif self.with_cuda:
	self.model = self.model.cuda()

	## optimizer
	self.optimizer = getattr(optim, config['optimizer_type'])(self.model.parameters(), **config['optimizer'])
	self.lr_sheduler = optim.lr_scheduler.ReduceLROnPlateau(self.optimizer, **config['lr_sheduler'])

	## dataset loader
	with open(os.path.join(config['data_dir'], config['data_loader']['dataset'])) as f:
	dataset = json.load(f)
	train_set = Dataset(dataset['train'])
	self.train_data_loader = DataLoader(train_set, batch_size=config['data_loader']['batch_size'],
	shuffle=config['data_loader']['shuffle'],
	num_workers=config['data_loader']['num_workers'])
	val_set = Dataset(dataset['val'])
	self.valid_data_loader = DataLoader(val_set, batch_size=config['data_loader']['batch_size'],
	shuffle=False,
	num_workers=config['data_loader']['num_workers'])
	# special dataloader: constant color images
	with open(os.path.join(config['data_dir'], config['data_loader']['special_set'])) as f:
	dataset = json.load(f)
	specialSet = Dataset(dataset['train'])
	self.specialDataloader = DataLoader(specialSet, batch_size=config['data_loader']['batch_size'],
	shuffle=config['data_loader']['shuffle'],
	num_workers=config['data_loader']['num_workers'])

	## loss function
	self.quantizeLoss = eval(config['quantizeLoss'])
	self.quantizeLossWeight = config['quantizeLossWeight']
	self.toneLoss = eval(config['toneLoss'])
	self.toneLossWeight = config['toneLossWeight']
	self.structureLoss = eval(config['structureLoss'])
	self.structureLossWeight = config['structureLossWeight']
	self.restoreLoss = eval(config['restoreLoss'])
	self.restoreLossWeight = config['restoreLossWeight']
	# quantize [-1,1] data to be {-1,1}
	self.quantizer = lambda x: Quantize.apply(0.5 * (x + 1.)) * 2. - 1.
	self.blueNoiseLossWeight = config['blueNoiseLossWeight']
	self.vggloss = Vgg19Loss()
	self.vggLossWeight = config['vggLossWeight']

	# resume checkpoint or load warm-up checkpoint
	checkpt_path = self.config['initial_ckpt']
	if self.resume_path:
	checkpt_path = self.resume_path
	assert os.path.exists(checkpt_path), 'Invalid checkpoint Path: %s' % checkpt_path
	self.load_checkpoint(checkpt_path)


	def _train(self):
	torch.manual_seed(self.config['seed'])
	torch.cuda.manual_seed(self.config['seed'])
	cudnn.benchmark = True

	start_time = time.time()
	self.monitor_best = 999.
	for epoch in range(self.start_epoch, self.n_epochs + 1):
	ep_st = time.time()
	epoch_loss = self._train_epoch(epoch)
	# perform lr_sheduler
	self.lr_sheduler.step(epoch_loss['total_loss'])
	epoch_lr = self.optimizer.state_dict()['param_groups'][0]['lr']
	epoch_metric = self._valid_epoch(epoch)
	print("[*] --- epoch: %d/%d \| loss: %4.4f \| metric: %4.4f \| time-consumed: %4.2f ---" % \
	(epoch+1, self.n_epochs, epoch_loss['total_loss'], epoch_metric, (time.time()-ep_st)))

	# save losses and learning rate
	epoch_loss['metric'] = epoch_metric
	epoch_loss['lr'] = epoch_lr
	self.save_loss(epoch_loss, epoch)
	if ((epoch+1) % self.save_freq == 0 or epoch == (self.n_epochs-1)):
	print('---------- saving model ...')
	self.save_checkpoint(epoch)
	if self.monitor_best > epoch_metric:
	self.monitor_best = epoch_metric
	self.save_checkpoint(epoch, save_best=True)

	print("Training finished! consumed %f sec" % (time.time() - start_time))


	def _to_variable(self, data, target):
	data, target = Variable(data), Variable(target)
	if self.with_cuda:
	data, target = data.cuda(), target.cuda()
	return data, target


	def _train_epoch(self, epoch):
	self.model.train()
	total_loss, quantize_loss, restore_loss = 0, 0, 0
	tone_loss, structure_loss, blue_noise_loss = 0, 0, 0

	specialIter = iter(self.specialDataloader)
	time_stamp = time.time()
	for batch_idx, (color, halftone) in enumerate(self.train_data_loader):
	color, halftone = self._to_variable(color, halftone)
	# special data
	try:
	specialColor, specialHalftone = next(specialIter)
	except StopIteration:
	# reinitialize data loader
	specialIter = iter(self.specialDataloader)
	specialColor, specialHalftone = next(specialIter)
	specialColor, specialHalftone = self._to_variable(specialColor, specialHalftone)
	self.optimizer.zero_grad()
	output = self.model(color, halftone)
	quantizeLoss = self.quantizeLoss(output[0])
	toneLoss = self.toneLoss(output[0], color)
	structureLoss = self.structureLoss(output[0], color)

	# restore
	restoredColor = output[-1]
	restoreLoss = self.restoreLoss(restoredColor, color)
	vggLoss = self.vggloss(restoredColor / 2. + 0.5, color / 2. + 0.5)

	# special data
	output = self.model(specialColor, specialHalftone)
	toneLossSpecial = self.toneLoss(output[0], specialColor)
	blueNoiseLoss = l1_loss(output[1], output[2])
	quantizeLossSpecial = self.quantizeLoss(output[0])
	loss = (self.toneLossWeight * toneLoss + self.blueNoiseLossWeight*toneLossSpecial) \
	+ self.quantizeLossWeight * (0.5quantizeLoss + 0.5quantizeLossSpecial) \
	+ self.structureLossWeight * structureLoss \
	+ self.blueNoiseLossWeight * blueNoiseLoss \
	+ self.vggLossWeight * vggLoss \
	+ self.restoreLossWeight * restoreLoss

	loss.backward()
	# apply grad clip to make training roboust
	# torch.nn.utils.clip_grad_norm_(self.model.parameters(), 0.0001)
	self.optimizer.step()

	total_loss += loss.item()
	quantize_loss += quantizeLoss.item()
	restore_loss += (self.restoreLossWeightrestoreLoss + self.vggLossWeightvggLoss).item()
	tone_loss += toneLoss.item()
	structure_loss += structureLoss.item()
	blue_noise_loss += blueNoiseLoss.item()
	if batch_idx % 100 == 0:
	tm = datetime.datetime.now().strftime('%Y-%m-%d %H:%M:%S.%f')
	print("%s >> [%d/%d] iter:%d loss:%4.4f "%(tm, epoch+1, self.n_epochs, batch_idx+1, loss.item()))

	epoch_loss = dict()
	epoch_loss['total_loss'] = total_loss / (batch_idx+1)
	epoch_loss['quantize_loss'] = quantize_loss / (batch_idx+1)
	epoch_loss['tone_loss'] = tone_loss / (batch_idx+1)
	epoch_loss['structure_loss'] = structure_loss / (batch_idx+1)
	epoch_loss['bluenoise_loss'] = blue_noise_loss / (batch_idx+1)
	epoch_loss['restore_loss'] = restore_loss / (batch_idx+1)

	return epoch_loss


	def _valid_epoch(self, epoch):
	self.model.eval()
	total_loss = 0
	with torch.no_grad():
	for batch_idx, (color, halftone) in enumerate(self.valid_data_loader):
	color, halftone = self._to_variable(color, halftone)
	output = self.model(color, halftone)
	quantizeLoss = self.quantizeLoss(output[0])
	toneLoss = self.toneLoss(output[0], color)
	structureLoss = self.structureLoss(output[0], color)
	# restore
	restoredColor = output[-1]
	restoreLoss = self.restoreLoss(restoredColor, color)
	vggLoss = self.vggloss(restoredColor / 2. + 0.5, color / 2. + 0.5)

	loss = self.toneLossWeight * toneLoss \
	+ self.quantizeLossWeight * quantizeLoss \
	+ self.structureLossWeight * structureLoss \
	+ self.vggLossWeight * vggLoss \
	+ self.restoreLossWeight * restoreLoss

	total_loss += loss.item()
	#! save intermediate images
	gray_imgs = tensor2array(output[0])
	color_imgs = tensor2array(output[-1])
	save_images_from_batch(gray_imgs, self.val_halftone, None, batch_idx)
	save_images_from_batch(color_imgs, self.val_restored, None, batch_idx)

	return total_loss


	def save_loss(self, epoch_loss, epoch):
	if epoch == 0:
	for key in epoch_loss:
	save_list(os.path.join(self.cache, key), [epoch_loss[key]], append_mode=False)
	else:
	for key in epoch_loss:
	save_list(os.path.join(self.cache, key), [epoch_loss[key]], append_mode=True)


	def load_checkpoint(self, checkpt_path):
	print("-loading checkpoint from: {} ...".format(checkpt_path))
	if self.resume_path:
	checkpoint = torch.load(checkpt_path)
	self.start_epoch = checkpoint['epoch'] + 1
	self.monitor_best = checkpoint['monitor_best']
	self.model.load_state_dict(checkpoint['state_dict'])
	self.optimizer.load_state_dict(checkpoint['optimizer'])
	else:
	checkpoint = torch.load(checkpt_path)
	self.model.load_state_dict(checkpoint['state_dict'], strict=False)
	print("-pretrained checkpoint loaded.")


	def save_checkpoint(self, epoch, save_best=False):
	state = {
	'epoch': epoch,
	'state_dict': self.model.state_dict(),
	'optimizer': self.optimizer.state_dict(),
	'monitor_best': self.monitor_best
	}
	save_path = os.path.join(self.checkpoint_dir, 'model_last.pth.tar')
	if save_best:
	save_path = os.path.join(self.checkpoint_dir, 'model_best.pth.tar')
	torch.save(state, save_path)


	if __name__ == '__main__':
	parser = argparse.ArgumentParser(description='InvHalf')
	parser.add_argument('-c', '--config', default=None, type=str,
	help='config file path (default: None)')
	parser.add_argument('-r', '--resume', default=None, type=str,
	help='path to latest checkpoint (default: None)')
	args = parser.parse_args()
	config_dict = json.load(open(args.config))
	node = Trainer(config_dict, resume=args.resume)
	node._train()