Spaces:

saptak21
/

Face_Direction_Detection

Running

App Files Files Community

saptak21 commited on 20 days ago

Commit

87dd991

verified ·

1 Parent(s): 5afaac3

Upload 7 files

Browse files

Files changed (7) hide show

datasets/__init__.py +0 -0
datasets/eyediap.py +103 -0
datasets/gaze360.py +106 -0
datasets/gazecapture.py +132 -0
datasets/helper/image_transform.py +81 -0
datasets/mpiigaze.py +109 -0
datasets/xgaze.py +137 -0

datasets/__init__.py ADDED Viewed

File without changes

datasets/eyediap.py ADDED Viewed

	@@ -0,0 +1,103 @@

+import os
+import numpy as np
+import h5py
+import cv2
+from torch.utils.data import Dataset
+from typing import List
+from omegaconf import OmegaConf, listconfig
+from .helper.image_transform import wrap_transforms
+class EYEDIAPDataset(Dataset):
+	def __init__(self,
+				dataset_path: str,
+				color_type,
+				keys_to_use: List[str] = None,
+				data_name=None,
+				image_size:int=224,  ## <---
+				transform_type='basic_imagenet', ## <--- modified
+				image_key='face_patch',
+				gaze_key='face_gaze',
+				):
+		self.path = dataset_path
+		self.hdfs = {}
+		self.data_name = data_name
+		self.image_key = image_key
+		self.gaze_key = gaze_key
+		self.image_size = (image_size, image_size)
+		assert color_type in ['rgb', 'bgr']
+		self.color_type = color_type
+		self.selected_keys = [k for k in keys_to_use]
+		assert len(self.selected_keys) > 0
+		self.file_paths = [os.path.join(self.path, k) for k in self.selected_keys]
+		for num_i in range(0, len(self.selected_keys)):
+			file_path = os.path.join(self.path, self.selected_keys[num_i]) # the subdirectories: train, test are not used in MPIIFaceGaze and MPII_Rotate
+			self.hdfs[num_i] = h5py.File(file_path, 'r', swmr=True)
+			print('read file: ', os.path.join(self.path, self.selected_keys[num_i]))
+			assert self.hdfs[num_i].swmr_mode
+		self.build_idx_to_kv()
+		for num_i in range(0, len(self.hdfs)):
+			if self.hdfs[num_i]:
+				self.hdfs[num_i].close()
+				self.hdfs[num_i] = None
+		self.transform = wrap_transforms(transform_type, image_size=image_size)
+		self.__hdfs = None
+		self.hdf = None
+	def __len__(self):
+		return len(self.idx_to_kv)
+	def __del__(self):
+		for num_i in range(0, len(self.hdfs)):
+			if self.hdfs[num_i]:
+				self.hdfs[num_i].close()
+				self.hdfs[num_i] = None
+	def build_idx_to_kv(self):
+		self.idx_to_kv = []
+		self.key_idx_dict = {}
+		for num_i in range(0, len(self.selected_keys)):
+			this_sub = self.selected_keys[num_i].split('.')[0]
+			n = self.hdfs[num_i][self.image_key].shape[0]
+			self.idx_to_kv += [(num_i, i) for i in range(n)]
+			self.key_idx_dict[this_sub] = [ i for i in range(n)]
+	@property
+	def archives(self):
+		if self.__hdfs is None: # lazy loading here!
+			self.__hdfs = [h5py.File(h5_path, "r", swmr=True) for h5_path in self.file_paths]
+		return self.__hdfs
+	def preprocess_image(self, image):
+		image = image.astype(np.float32)
+		if self.color_type == 'bgr':
+			image = image[..., ::-1]
+		image = cv2.resize(image, self.image_size, interpolation=cv2.INTER_AREA)
+		image = self.transform(image.astype(np.uint8)		)
+		return image
+	def __getitem__(self, index):
+		key, idx = self.idx_to_kv[index]
+		self.hdf = self.archives[key]
+		assert self.hdf.swmr_mode
+		image = self.hdf[self.image_key][idx, :]
+		gaze_label = self.hdf[self.gaze_key][idx].astype('float') if self.gaze_key in self.hdf else np.array([0,0]).astype('float')
+		head_label = self.hdf['face_head_pose'][idx].astype('float') if 'face_head_pose' in self.hdf else np.array([0,0]).astype('float')
+		entry = {
+			'image': self.preprocess_image(image),
+			'gaze': gaze_label,
+			'head': head_label,
+			'key': key,
+			'index':index
+		}
+		return entry

datasets/gaze360.py ADDED Viewed

	@@ -0,0 +1,106 @@

+import os
+import numpy as np
+import h5py, cv2
+from torch.utils.data import Dataset
+from typing import List
+from .helper.image_transform import wrap_transforms
+class Gaze360Dataset(Dataset):
+	def __init__(self,
+				dataset_path: str,
+				color_type,
+				keys_to_use: List[str] = None,
+				data_name=None,
+				image_size:int=224,
+				transform_type='basic_imagenet',
+				image_key='face_patch',
+				gaze_key='face_gaze',
+				sample_rate_use=1,
+				):
+		super().__init__()
+		self.dataset_path = dataset_path
+		self.hdfs = {}
+		self.data_name = data_name
+		self.image_key = image_key
+		self.gaze_key = gaze_key
+		self.image_size = (image_size, image_size)
+		assert color_type in ['rgb', 'bgr']
+		self.color_type = color_type
+		self.transform = wrap_transforms(transform_type, image_size=image_size)
+		self.sample_rate_use = sample_rate_use
+		#### -------------------------------------------------------- read the h5 files -------------------------------------------------------
+		self.selected_keys = [k for k in keys_to_use]
+		assert len(self.selected_keys) > 0
+		self.file_paths = [os.path.join(self.dataset_path, k) for k in self.selected_keys]
+		for num_i in range(0, len(self.selected_keys)):
+			file_path = os.path.join(self.dataset_path, self.selected_keys[num_i]) # the subdirectories: train, test are not used in MPIIFaceGaze and MPII_Rotate
+			self.hdfs[num_i] = h5py.File(file_path, 'r', swmr=True)
+			print('read file: ', os.path.join(self.dataset_path, self.selected_keys[num_i]))
+			assert self.hdfs[num_i].swmr_mode
+		####-----------------------------------------------------------------------------------------------------------------------------------
+		self.build_idx_to_kv()
+		for num_i in range(0, len(self.hdfs)):
+			if self.hdfs[num_i]:
+				self.hdfs[num_i].close()
+				self.hdfs[num_i] = None
+		self.__hdfs = None
+		self.hdf = None
+	def build_idx_to_kv(self):
+		self.idx_to_kv = []
+		self.key_idx_dict = {}
+		for num_i in range(0, len(self.selected_keys)):
+			p_key = self.selected_keys[num_i].split('.')[0]  ##p00
+			n = self.hdfs[num_i][self.image_key].shape[0]
+			if self.sample_rate_use > 1:
+				indices = np.arange(0, n, self.sample_rate_use)
+			else:
+				indices = np.arange(0, n)
+			self.idx_to_kv += [(num_i, i) for i in indices]
+			self.key_idx_dict[p_key] = [i for i in indices]
+	def __len__(self):
+		return len(self.idx_to_kv)
+	def __del__(self):
+		for num_i in range(0, len(self.hdfs)):
+			if self.hdfs[num_i]:
+				self.hdfs[num_i].close()
+				self.hdfs[num_i] = None
+	@property
+	def archives(self):
+		if self.__hdfs is None: # lazy loading here!
+			self.__hdfs = [h5py.File(h5_path, "r", swmr=True) for h5_path in self.file_paths]
+		return self.__hdfs
+	def preprocess_image(self, image):
+		image = image.astype(np.float32)
+		if self.color_type == 'bgr':
+			image = image[..., ::-1]
+		if image.shape[0] != self.image_size[0] or image.shape[1] != self.image_size[1]:
+			image = cv2.resize(image, self.image_size, interpolation=cv2.INTER_AREA)
+		image = self.transform(image.astype(np.uint8)		)
+		return image
+	def __getitem__(self, index):
+		key, idx = self.idx_to_kv[index]
+		self.hdf = self.archives[key]
+		image = self.hdf[self.image_key][idx]
+		gaze_label = self.hdf[self.gaze_key][idx].astype('float') if self.gaze_key in self.hdf else np.array([0,0]).astype('float')
+		head_label = self.hdf['face_head_pose'][idx].astype('float') if 'face_head_pose' in self.hdf else np.array([0,0]).astype('float')
+		entry = {
+			'image': self.preprocess_image(image),
+			'gaze': gaze_label,
+			'head': head_label,
+			'key': idx,
+			'index':index
+		}
+		return entry

datasets/gazecapture.py ADDED Viewed

	@@ -0,0 +1,132 @@

+import os
+import numpy as np
+import h5py
+import cv2
+from torch.utils.data import Dataset
+from typing import List
+from omegaconf import OmegaConf, listconfig
+from .helper.image_transform import wrap_transforms
+class GazeCaptureDataset(Dataset):
+	def __init__(self,
+				dataset_path: str,
+				color_type,
+				keys_to_use: List[str] = None,
+				data_name=None,
+				image_size:int=224,  ## <---
+				transform_type='basic_imagenet', ## <--- modified
+				image_key='face_patch',
+				gaze_key='face_gaze',
+				sample_rate_use=1,
+				):
+		self.transform = wrap_transforms(transform_type, image_size=image_size)
+		self.path = dataset_path
+		self.hdfs = {}
+		self.data_name = data_name
+		self.image_key = image_key
+		self.gaze_key = gaze_key
+		self.image_size = (image_size, image_size)
+		self.sample_rate_use = sample_rate_use
+		assert color_type in ['rgb', 'bgr']
+		self.color_type = color_type
+		self.selected_keys = [ k for k in keys_to_use]
+		assert len(self.selected_keys) > 0
+		self.file_paths = [os.path.join(self.path, k) for k in self.selected_keys]
+		for num_i in range(0, len(self.selected_keys)):
+			file_path = os.path.join(self.path, self.selected_keys[num_i]) # the subdirectories: train, test are not used in MPIIFaceGaze and MPII_Rotate
+			self.hdfs[num_i] = h5py.File(file_path, 'r', swmr=True)
+			print('read file: ', os.path.join(self.path, self.selected_keys[num_i]))
+			assert self.hdfs[num_i].swmr_mode
+		self.build_idx_to_kv()
+		for num_i in range(0, len(self.hdfs)):
+			if self.hdfs[num_i]:
+				self.hdfs[num_i].close()
+				self.hdfs[num_i] = None
+		self.__hdfs = None
+		self.hdf = None
+	def __len__(self):
+		return len(self.idx_to_kv)
+	def __del__(self):
+		for num_i in range(0, len(self.hdfs)):
+			if self.hdfs[num_i]:
+				self.hdfs[num_i].close()
+				self.hdfs[num_i] = None
+	def build_idx_to_kv(self):
+		self.idx_to_kv = []
+		self.key_idx_dict = {}
+		for num_i in range(0, len(self.selected_keys)):
+			this_sub = self.selected_keys[num_i].split('.')[0]
+			n = self.hdfs[num_i][self.image_key].shape[0]
+			if self.sample_rate_use > 1:
+				indices = np.arange(0, n, self.sample_rate_use)
+			else:
+				indices = np.arange(0, n)
+			self.idx_to_kv += [(num_i, i) for i in indices ]
+			self.key_idx_dict[this_sub] = [ i for i in indices ]
+	@property
+	def archives(self):
+		if self.__hdfs is None: # lazy loading here!
+			self.__hdfs = [h5py.File(h5_path, "r", swmr=True) for h5_path in self.file_paths]
+		return self.__hdfs
+	def preprocess_image(self, image):
+		image = image.astype(np.float32)
+		if self.color_type == 'bgr':
+			image = image[..., ::-1]
+		image = cv2.resize(image, self.image_size, interpolation=cv2.INTER_AREA)
+		image = self.transform(image.astype(np.uint8)		)
+		return image
+	def __getitem__(self, index):
+		key, idx = self.idx_to_kv[index]
+		self.hdf = self.archives[key]
+		# self.hdf = h5py.File(os.path.join(self.path, self.selected_keys[key]), 'r', swmr=True)
+		assert self.hdf.swmr_mode
+		image = self.hdf[self.image_key][idx, :]
+		gaze_label = self.hdf[self.gaze_key][idx].astype('float') if self.gaze_key in self.hdf else np.array([0,0]).astype('float')
+		head_label = self.hdf['face_head_pose'][idx].astype('float') if 'face_head_pose' in self.hdf else np.array([0,0]).astype('float')
+		entry = {
+			'image': self.preprocess_image(image),
+			'gaze': gaze_label,
+			'head': head_label,
+			'key': key,
+			'index':index
+		}
+		return entry
+# class GazeCaptureDatasetSubset(GazeCaptureDataset):
+# 	def __init__(self, images_per_person=None, **kwargs):
+# 		self.images_per_person = images_per_person
+# 		super().__init__(**kwargs)
+# 	def build_idx_to_kv(self):
+# 		self.idx_to_kv = []
+# 		self.key_idx_dict = {}
+# 		for num_i in range(0, len(self.selected_keys)):
+# 			this_sub = self.selected_keys[num_i].split('.')[0]
+# 			n = self.hdfs[num_i][self.image_key].shape[0]
+# 			if self.images_per_person is not None:
+# 				n = min(n, self.images_per_person)
+# 			self.idx_to_kv += [(num_i, i) for i in range(n)]
+# 			self.key_idx_dict[this_sub] = [ i for i in range(n)]

datasets/helper/image_transform.py ADDED Viewed

	@@ -0,0 +1,81 @@

+import cv2
+from torchvision import transforms
+import numpy as np
+import torch
+def re_normalize(image_tensor, old='[-1,1]', new='imagenet'):
+	"""
+	Re-normalizes an image tensor from one normalization scheme to another.
+	Args:
+		image_tensor (torch.Tensor): Image tensor to be re-normalized.
+		old (str): Old normalization scheme. Options: '[-1,1]', 'imagenet'.
+		new (str): New normalization scheme. Options: '[-1,1]', 'imagenet'.
+	Returns:
+		torch.Tensor: Re-normalized image tensor.
+	"""
+	# Old normalization parameters
+	device = image_tensor.device
+	if old == '[-1,1]':
+		old_mean = torch.tensor([0.5, 0.5, 0.5]).view(1, 3, 1, 1).to(device)
+		old_std = torch.tensor([0.5, 0.5, 0.5]).view(1, 3, 1, 1).to(device)
+	elif old == 'imagenet':
+		old_mean = torch.tensor([0.485, 0.456, 0.406]).view(1, 3, 1, 1).to(device)
+		old_std = torch.tensor([0.229, 0.224, 0.225]).view(1, 3, 1, 1).to(device)
+	elif old == '[0,1]':
+		old_mean = torch.tensor([0.0, 0.0, 0.0]).view(1, 3, 1, 1).to(device)
+		old_std = torch.tensor([1.0, 1.0, 1.0]).view(1, 3, 1, 1).to(device)
+	else:
+		print('old normalization not implemented')
+		raise NotImplementedError
+	# New normalization parameters
+	if new == '[-1,1]':
+		new_mean = torch.tensor([0.5, 0.5, 0.5]).view(1, 3, 1, 1).to(device)
+		new_std = torch.tensor([0.5, 0.5, 0.5]).view(1, 3, 1, 1).to(device)
+	elif new == 'imagenet':
+		new_mean = torch.tensor([0.485, 0.456, 0.406]).view(1, 3, 1, 1).to(device)
+		new_std = torch.tensor([0.229, 0.224, 0.225]).view(1, 3, 1, 1).to(device)
+	elif new == '[0,1]':
+		new_mean = torch.tensor([0.0, 0.0, 0.0]).view(1, 3, 1, 1).to(device)
+		new_std = torch.tensor([1.0, 1.0, 1.0]).view(1, 3, 1, 1).to(device)
+	else:
+		print('new normalization not implemented')
+		raise NotImplementedError
+	# Step 1: Denormalize the image tensor using the old mean and std
+	denormalized_image = image_tensor * old_std + old_mean
+	# Step 2: Normalize the image tensor using the new mean and std
+	normalized_image = (denormalized_image - new_mean) / new_std
+	return normalized_image
+def wrap_transforms(image_transforms_type, image_size):
+	if image_transforms_type == 'basic_imagenet':
+		MEAN = [0.485, 0.456, 0.406]
+		STD = [0.229, 0.224, 0.225]
+		return transforms.Compose([
+				transforms.ToPILImage(),
+				transforms.ToTensor(),
+				transforms.Normalize(mean=MEAN, std=STD)
+			])
+	else:
+		raise NotImplementedError
+# def enhance_contrast_clahe(image):
+# 	clahe = cv2.createCLAHE(clipLimit=2.0, tileGridSize=(8, 8))
+# 	lab = cv2.cvtColor(image, cv2.COLOR_RGB2LAB)
+# 	lab_planes = list( cv2.split(lab) )
+# 	lab_planes[0] = clahe.apply(lab_planes[0])
+# 	lab = cv2.merge(lab_planes)
+# 	image = cv2.cvtColor(lab, cv2.COLOR_LAB2RGB)
+# 	return image

datasets/mpiigaze.py ADDED Viewed

	@@ -0,0 +1,109 @@

+import os
+import numpy as np
+import h5py
+import cv2
+from torch.utils.data import Dataset
+from typing import List
+from omegaconf import OmegaConf, listconfig
+from .helper.image_transform import wrap_transforms
+class MPIIGazeDataset(Dataset):
+	def __init__(self,
+				dataset_path: str,
+				color_type,
+				keys_to_use: List[str] = None,
+				data_name=None,
+				image_size:int=224,  ## <---
+				transform_type='basic_imagenet', ## <--- modified
+				image_key='face_patch',
+				gaze_key='face_gaze',
+				):
+		self.dataset_path = dataset_path
+		self.hdfs = {}
+		self.data_name = data_name
+		self.image_key = image_key
+		self.gaze_key = gaze_key
+		self.image_size = (image_size, image_size)
+		assert color_type in ['rgb', 'bgr']
+		self.color_type = color_type
+		self.transform = wrap_transforms(transform_type, image_size=image_size)
+		self.selected_keys = [k for k in keys_to_use]
+		assert len(self.selected_keys) > 0
+		self.file_paths = [os.path.join(self.dataset_path, k) for k in self.selected_keys]
+		for num_i in range(0, len(self.selected_keys)):
+			file_path = os.path.join(self.dataset_path, self.selected_keys[num_i]) # the subdirectories: train, test are not used in MPIIFaceGaze and MPII_Rotate
+			self.hdfs[num_i] = h5py.File(file_path, 'r', swmr=True)
+			print('read file: ', os.path.join(self.dataset_path, self.selected_keys[num_i]))
+			assert self.hdfs[num_i].swmr_mode
+		self.build_idx_to_kv()
+		for num_i in range(0, len(self.hdfs)):
+			if self.hdfs[num_i]:
+				self.hdfs[num_i].close()
+				self.hdfs[num_i] = None
+		self.__hdfs = None
+		self.hdf = None
+	def __len__(self):
+		return len(self.idx_to_kv)
+	def __del__(self):
+		for num_i in range(0, len(self.hdfs)):
+			if self.hdfs[num_i]:
+				self.hdfs[num_i].close()
+				self.hdfs[num_i] = None
+	def build_idx_to_kv(self):
+		self.idx_to_kv = []
+		self.key_idx_dict = {}
+		for num_i in range(0, len(self.selected_keys)):
+			p_key = self.selected_keys[num_i].split('.')[0]  ##p00
+			n = self.hdfs[num_i][self.image_key].shape[0]
+			self.idx_to_kv += [(num_i, i) for i in range(n)]
+			self.key_idx_dict[p_key] = [i for i in range(n)]
+	@property
+	def archives(self):
+		if self.__hdfs is None: # lazy loading here!
+			self.__hdfs = [h5py.File(h5_path, "r", swmr=True) for h5_path in self.file_paths]
+		return self.__hdfs
+	def preprocess_image(self, image):
+		image = image.astype(np.float32)
+		if self.color_type == 'bgr':
+			image = image[..., ::-1]
+		if image.shape[0] != self.image_size[0] or image.shape[1] != self.image_size[1]:
+			image = cv2.resize(image, self.image_size, interpolation=cv2.INTER_AREA)
+		image = self.transform(image.astype(np.uint8)		)
+		return image
+	def __getitem__(self, index):
+		key, idx = self.idx_to_kv[index]
+		self.hdf = self.archives[key]
+		# self.hdf = h5py.File(os.path.join(self.dataset_path, self.selected_keys[key]), 'r', swmr=True)
+		assert self.hdf.swmr_mode
+		image = self.hdf[self.image_key][idx, :]
+		gaze_label = self.hdf[self.gaze_key][idx].astype('float') if self.gaze_key in self.hdf else np.array([0,0]).astype('float')
+		head_label = self.hdf['face_head_pose'][idx].astype('float') if 'face_head_pose' in self.hdf else np.array([0,0]).astype('float')
+		entry = {
+			'image': self.preprocess_image(image),
+			'gaze': gaze_label,
+			'head': head_label,
+			'key': key,
+			'index':index
+		}
+		return entry

datasets/xgaze.py ADDED Viewed

	@@ -0,0 +1,137 @@

+import os,random
+import numpy as np
+import h5py
+import cv2
+from typing import List
+from torch.utils.data import Dataset
+from .helper.image_transform import wrap_transforms
+class XGazeDataset(Dataset):
+	def __init__(self,
+				dataset_path: str,
+				color_type,
+				images_per_frame,
+				keys_to_use: List[str] = None,
+				data_name=None,
+				image_size:int=224,
+				transform_type='basic_imagenet', ## <--- modified
+				image_key='face_patch',
+				gaze_key='face_gaze',
+				camera_random=None,
+				frame_tag=[0,1000],
+				seed=0,
+				):
+		self.path = dataset_path
+		self.hdfs = {}
+		self.data_name = data_name
+		self.images_per_frame = images_per_frame
+		print('images_per_frame: ', images_per_frame)
+		self.image_key = image_key
+		self.gaze_key = gaze_key
+		self.image_size = (image_size, image_size)
+		random.seed(seed)
+		assert color_type in ['rgb', 'bgr']
+		self.color_type = color_type
+		self.cameras_idx = list(range(self.images_per_frame))
+		self.camera_random = camera_random
+		#### -------------------------------------------------------- read the h5 files -------------------------------------------------------
+		self.selected_keys = [k for k in keys_to_use]
+		assert len(self.selected_keys) > 0
+		self.file_paths = [os.path.join(self.path, k) for k in self.selected_keys]
+		for num_i in range(0, len(self.selected_keys)):
+			file_path = os.path.join(self.path, self.selected_keys[num_i]) # the subdirectories: train, test are not used in MPIIFaceGaze and MPII_Rotate
+			self.hdfs[num_i] = h5py.File(file_path, 'r', swmr=True)
+			print('read file: ', os.path.join(self.path, self.selected_keys[num_i]))
+			assert self.hdfs[num_i].swmr_mode
+		####-----------------------------------------------------------------------------------------------------------------------------------
+		self.idx_to_kv = []
+		self.key_idx_dict = {} ## this is for reading the second sample from the same person
+		for num_i in range(0, len(self.selected_keys)):
+			this_sub = self.selected_keys[num_i].split('.')[0]
+			n = self.hdfs[num_i][image_key].shape[0]
+			if type(frame_tag) == list:
+				self.start_frame, self.end_frame = frame_tag
+			elif frame_tag == 'all':
+				self.start_frame, self.end_frame = 0, 10000
+			else:
+				raise ValueError("frame_tag should be either a list of integers or str 'all' ")
+			start_idx = min(n, self.start_frame * self.images_per_frame)
+			end_idx =  min(n, self.end_frame  * self.images_per_frame)
+			if self.camera_random is None:
+				self.idx_to_kv +=  [(num_i, i) for i in range(start_idx, end_idx) if (i % self.images_per_frame ) in self.cameras_idx ]
+				self.key_idx_dict[this_sub] = [ i for i in range(start_idx, end_idx) if (i % self.images_per_frame ) in self.cameras_idx ]
+			else:
+				for frame in range(start_idx // self.images_per_frame, end_idx // self.images_per_frame):
+					frame_start_idx = frame * self.images_per_frame
+					frame_end_idx = frame_start_idx + self.images_per_frame
+					# Randomly select self.images_per_frame camera indices for this frame
+					random_cameras_idx = random.sample(range(self.images_per_frame), self.camera_random)
+					self.idx_to_kv += [(num_i, i) for i in range(frame_start_idx, frame_end_idx) if (i % self.images_per_frame) in random_cameras_idx]
+					self.key_idx_dict.setdefault(this_sub, []).extend(
+						[i for i in range(frame_start_idx, frame_end_idx) if (i % self.images_per_frame) in random_cameras_idx]
+					)
+		for num_i in range(0, len(self.hdfs)):
+			if self.hdfs[num_i]:
+				self.hdfs[num_i].close()
+				self.hdfs[num_i] = None
+		self.transform = wrap_transforms(transform_type, image_size=image_size)
+		self.__hdfs = None
+		self.hdf = None
+	def __len__(self):
+		return len(self.idx_to_kv)
+	def __del__(self):
+		for num_i in range(0, len(self.hdfs)):
+			if self.hdfs[num_i]:
+				self.hdfs[num_i].close()
+				self.hdfs[num_i] = None
+	@property
+	def archives(self):
+		if self.__hdfs is None: # lazy loading here!
+			self.__hdfs = [h5py.File(h5_path, "r", swmr=True) for h5_path in self.file_paths]
+		return self.__hdfs
+	def preprocess_image(self, image):
+		image = image.astype(np.float32)
+		if self.color_type == 'bgr':
+			image = image[..., ::-1]
+		if image.shape[0] != self.image_size[0] or image.shape[1] != self.image_size[1]:
+			image = cv2.resize(image, self.image_size, interpolation=cv2.INTER_AREA)
+		image = self.transform( image.astype(np.uint8) )
+		return image
+	def __getitem__(self, index):
+		key, idx = self.idx_to_kv[index]
+		self.hdf = self.archives[key]
+		assert self.hdf.swmr_mode
+		image = self.hdf[self.image_key][idx, :]
+		gaze_label = self.hdf[self.gaze_key][idx].astype('float') if self.gaze_key in self.hdf else np.array([0,0]).astype('float')
+		head_label = self.hdf['face_head_pose'][idx].astype('float') if 'face_head_pose' in self.hdf else np.array([0,0]).astype('float')
+		entry = {
+			'image': self.preprocess_image(image),
+			'gaze': gaze_label,
+			'head': head_label,
+			'key': key,
+			'index':index
+		}
+		return entry