Spaces:

onlineformapro
/

anydoor

Paused

App Files Files

anydoor / mydatasets /dreambooth.py

olfp

Upload 162 files

054c447 verified 10 months ago

raw

history blame

2.83 kB

	import json
	import cv2
	import numpy as np
	import os
	from torch.utils.data import Dataset
	from PIL import Image
	import cv2
	from .data_utils import *
	from .base import BaseDataset

	class DreamBoothDataset(BaseDataset):
	def __init__(self, fg_dir, bg_dir):
	self.bg_dir = bg_dir
	bg_data = os.listdir(self.bg_dir)
	self.bg_data = [i for i in bg_data if 'mask' in i]
	self.image_dir = fg_dir
	self.data = os.listdir(self.image_dir)
	self.size = (512,512)
	self.clip_size = (224,224)
	'''
	Dynamic:
	0: Static View, High Quality
	1: Multi-view, Low Quality
	2: Multi-view, High Quality
	'''
	self.dynamic = 1

	def __len__(self):
	return len(self.data)

	def __getitem__(self, idx):
	idx = np.random.randint(0, len(self.data)-1)
	item = self.get_sample(idx)
	return item

	def check_region_size(self, image, yyxx, ratio, mode = 'max'):
	pass_flag = True
	H,W = image.shape[0], image.shape[1]
	H,W = H * ratio, W * ratio
	y1,y2,x1,x2 = yyxx
	h,w = y2-y1,x2-x1
	if mode == 'max':
	if h > H and w > W:
	pass_flag = False
	elif mode == 'min':
	if h < H and w < W:
	pass_flag = False
	return pass_flag

	def get_alpha_mask(self, mask_path):
	image = cv2.imread( mask_path, cv2.IMREAD_UNCHANGED)
	mask = (image[:,:,-1] > 128).astype(np.uint8)
	return mask

	def get_sample(self, idx):
	dir_name = self.data[idx]
	dir_path = os.path.join(self.image_dir, dir_name)
	images = os.listdir(dir_path)
	image_name = [i for i in images if '.png' in i][0]
	image_path = os.path.join(dir_path, image_name)

	image = cv2.imread( image_path, cv2.IMREAD_UNCHANGED)
	mask = (image[:,:,-1] > 128).astype(np.uint8)
	image = image[:,:,:-1]

	image = cv2.cvtColor(image.copy(), cv2.COLOR_BGR2RGB)
	ref_image = image
	ref_mask = mask
	ref_image, ref_mask = expand_image_mask(image, mask, ratio=1.4)
	bg_idx = np.random.randint(0, len(self.bg_data)-1)

	tar_mask_name = self.bg_data[bg_idx]
	tar_mask_path = os.path.join(self.bg_dir, tar_mask_name)
	tar_image_path = tar_mask_path.replace('_mask','_GT')

	tar_image = cv2.imread(tar_image_path).astype(np.uint8)
	tar_image = cv2.cvtColor(tar_image, cv2.COLOR_BGR2RGB)
	tar_mask = (cv2.imread(tar_mask_path) > 128).astype(np.uint8)[:,:,0]

	item_with_collage = self.process_pairs(ref_image, ref_mask, tar_image, tar_mask)
	sampled_time_steps = self.sample_timestep()
	item_with_collage['time_steps'] = sampled_time_steps
	return item_with_collage