DenseLabelDev / projects /mllm_labeling /merge_annotations_to_revos_format.py

Upload folder using huggingface_hub

032e687 verified 7 months ago

7.41 kB

	import json
	import os
	import cv2
	from PIL import Image

	# parse revos format
	# # mask_dict = '/mnt/bn/xiangtai-training-data-video/dataset/video_vlm/video_res/revos/mask_dict.json'
	# exp_dict = '/mnt/bn/xiangtai-training-data-video/dataset/video_vlm/video_res/revos/meta_expressions_valid_.json'
	# #
	# # with open(mask_dict, 'r') as f:
	# # mask_dict = json.load(f)
	# #
	# # print(mask_dict.keys())
	# # keys = list(mask_dict.keys())
	# # print(mask_dict[keys[0]])
	#
	# with open(exp_dict, 'r') as f:
	# exp_dict = json.load(f)
	#
	# print(exp_dict['videos']['UVO/all/-fbscFfkh4M']['expressions'])
	# print(exp_dict['videos']['UVO/all/-fbscFfkh4M']['vid_id'])
	# print(exp_dict['videos']['UVO/all/-fbscFfkh4M']['height'])
	# print(exp_dict['videos']['UVO/all/-fbscFfkh4M']['width'])
	# print(exp_dict['videos']['UVO/all/-fbscFfkh4M']['frames'])
	# #{'exp': 'the person who is wearing a white shirt and blue jeans.', 'obj_id': [0], 'anno_id': [3003019], 'type_id': 0}


	#--------------------------------------------------------------------------------------

	mini = False
	checked_folder = './manual_check_visualization_1028/checked/'
	short_anno_folder = './manual_check_visualization_1028/short_annotation/'
	save_dir = './ref_SAV/'

	auto_annotation_folders = [
	'./whole_pesudo_cap_v3/sav_054_step6/',
	'./whole_pesudo_cap_v3/sav_053_step6/'
	]
	json_files = []
	for auto_annotation_folder in auto_annotation_folders:
	file_names = os.listdir(auto_annotation_folder)
	file_names = [os.path.join(auto_annotation_folder, name) for name in file_names]
	json_files.extend(file_names)
	auto_json_datas = []
	for file_path in json_files:
	with open(file_path, 'r') as f:
	_data = json.load(f)
	auto_json_datas.extend(_data)

	auto_json_dict = {}
	for _item in auto_json_datas:
	video_id = _item['video_id']
	obj_id = _item['obj_id']
	if video_id not in auto_json_dict.keys():
	auto_json_dict[video_id] = {}
	auto_json_dict[video_id][obj_id] = _item


	def parse_file_name(name):
	print(name)
	name = name[:-4]
	name = name.split('_')
	folder_id = name[1]
	split_id = name[-1]
	return folder_id, split_id

	def parse_txt(path):
	with open(path, 'r') as f:
	data = f.read()
	data = data.split('\n')
	data_ = []
	for line in data:
	line = line.strip()
	if line == '':
	pass
	else:
	data_.append(line)
	return data_

	def parse_txt_short_anno(path):
	with open(path, 'r') as f:
	data = f.read()
	data = data.split('\n')
	short_cap = ''
	num = 0
	for _item in data:
	if 'The' in _item or 'Object' in _item or 'object' in _item or 'a' in _item:
	short_cap = _item
	num += 1
	assert num == 1, data
	short_cap = short_cap.strip()
	if short_cap[-1] != '.':
	short_cap = short_cap + '.'
	return short_cap

	def get_video_frames(video_path):
	cap = cv2.VideoCapture(video_path)

	if not cap.isOpened():
	print("Error: Cannot open video file.")
	return

	frames = []

	frame_id = 0
	while True:
	ret, frame = cap.read()

	if not ret:
	break

	frames.append(frame)

	frame_id += 1

	cap.release()
	return frames

	file_names = os.listdir(checked_folder)
	checked_number = 0

	meta_infos = []

	for file_name in file_names:
	checked_path = os.path.join(checked_folder, file_name)
	folder_id, split_id = parse_file_name(file_name)
	checked_object_ids = parse_txt(checked_path)

	for _object_id in checked_object_ids:
	_info = {'id': _object_id, 'folder_id': folder_id, 'split_id': split_id}
	meta_infos.append(_info)

	if mini:
	meta_infos = meta_infos[:50]


	short_file_names = os.listdir(short_anno_folder)
	short_meta_infos = []
	for file_name in short_file_names:
	short_cap = parse_txt_short_anno(os.path.join(short_anno_folder, file_name))
	_object_id = file_name.replace('.txt', '')

	_info = {'id': _object_id, 'folder_id': '054', 'short_cap': short_cap}
	meta_infos.append(_info)

	if mini:
	meta_infos = meta_infos[:100]

	ret_mask_dict = {}
	ret_exp_dict = {}

	if not os.path.exists(save_dir):
	os.mkdir(save_dir)
	if not os.path.exists(os.path.join(save_dir, 'videos')):
	os.mkdir(os.path.join(save_dir, 'videos'))

	for anno_id, _info in enumerate(meta_infos):
	print(anno_id)
	_object_id = _info['id']
	folder_id = _info['folder_id']
	# split_id = _info['split_id']
	video_id, object_id = _object_id.split('_obj')
	object_id = int(object_id.strip())

	# prepare exp

	if 'short_cap' in _info.keys():
	# print("Short manual anno.")
	# print(_info['short_cap'])
	object_exp = _info['short_cap']
	_exp_dict = {
	'exp': object_exp,
	'obj_id': [object_id],
	'anno_id': [10000 + anno_id],
	'type_id': 1,
	}
	else:
	object_exp = auto_json_dict[video_id][object_id]['final_caption']
	_exp_dict = {
	'exp': object_exp,
	'obj_id': [object_id],
	'anno_id': [10000 + anno_id],
	'type_id': 0,
	}

	# prepare mask
	mask_anno_path = \
	f"/mnt/bn/xiangtai-training-data-video/dataset/segmentation_datasets/sam_v_full/sav_{folder_id}/sav_train/sav_{folder_id}/{video_id}_manual.json"
	with open(mask_anno_path, 'r') as f:
	mask_anno_data = json.load(f)
	masklents = mask_anno_data['masklet']
	object_masklent = [_all_objects[object_id] for _all_objects in masklents]

	# save and append
	ret_mask_dict[str(10000+anno_id)] = object_masklent

	if video_id not in ret_exp_dict.keys():

	if not os.path.exists(os.path.join(save_dir, f"videos/{video_id}")):
	os.mkdir(os.path.join(save_dir, f"videos/{video_id}"))

	# prepare images
	video_path = \
	f"/mnt/bn/xiangtai-training-data-video/dataset/segmentation_datasets/sam_v_full/sav_{folder_id}/sav_train/sav_{folder_id}/{video_id}.mp4"

	video_frames = get_video_frames(video_path)
	video_valid = False
	if os.path.exists(os.path.join(save_dir, f"videos/{video_id}/")):
	video_valid = True
	video_frames = video_frames[::4]
	video_frames_ = []
	video_frames_names = []
	frames_ids = []
	for i_frame, frame in enumerate(video_frames):
	frame = frame[:, :, ::-1]
	frame_image = Image.fromarray(frame).convert('RGB')
	frames_ids.append(str(100000 + i_frame * 4))
	video_frames_names.append(f"videos/{video_id}/{100000 + i_frame * 4}.jpg")
	video_frames_.append(frame_image)

	width, height = video_frames_[0].size
	ret_exp_dict[video_id] = {
	'expressions': {},
	'vid_id': video_id,
	'height': height,
	'width': width,
	'frames': frames_ids,
	}

	for _video_frame_name, _frame_image in zip(video_frames_names, video_frames_):
	_save_pth = os.path.join(save_dir, _video_frame_name)
	_frame_image.save(_save_pth)

	ret_exp_dict[video_id]['expressions'][str(object_id)] = _exp_dict

	with open(os.path.join(save_dir, 'meta_expressions_valid.json'), 'w') as f:
	json.dump({'videos': ret_exp_dict}, f)
	with open(os.path.join(save_dir, 'mask_dict.json'), 'w') as f:
	json.dump(ret_mask_dict, f)