Spaces:

oguzakif
/

video-object-remover

Sleeping

App Files Files Community

video-object-remover / SiamMask /data /vid /visual.py

oguzakif

init repo

d4b77ac over 1 year ago

raw

history blame

1.96 kB

	# --------------------------------------------------------
	# SiamMask
	# Licensed under The MIT License
	# Written by Qiang Wang (wangqiang2015 at ia.ac.cn)
	# --------------------------------------------------------
	from os.path import join
	from os import listdir
	import cv2
	import numpy as np
	import glob
	import xml.etree.ElementTree as ET

	visual = False
	color_bar = np.random.randint(0, 255, (90, 3))

	VID_base_path = './ILSVRC2015'
	ann_base_path = join(VID_base_path, 'Annotations/VID/train/')
	img_base_path = join(VID_base_path, 'Data/VID/train/')
	sub_sets = sorted({'a', 'b', 'c', 'd', 'e'})
	for sub_set in sub_sets:
	sub_set_base_path = join(ann_base_path, sub_set)
	videos = sorted(listdir(sub_set_base_path))
	for vi, video in enumerate(videos):
	print('subset: {} video id: {:04d} / {:04d}'.format(sub_set, vi, len(videos)))

	video_base_path = join(sub_set_base_path, video)
	xmls = sorted(glob.glob(join(video_base_path, '*.xml')))
	for xml in xmls:
	f = dict()
	xmltree = ET.parse(xml)
	size = xmltree.findall('size')[0]
	frame_sz = [int(it.text) for it in size]
	objects = xmltree.findall('object')
	if visual:
	im = cv2.imread(xml.replace('xml', 'JPEG').replace('Annotations', 'Data'))
	for object_iter in objects:
	trackid = int(object_iter.find('trackid').text)
	bndbox = object_iter.find('bndbox')
	bbox = [int(bndbox.find('xmin').text), int(bndbox.find('ymin').text),
	int(bndbox.find('xmax').text), int(bndbox.find('ymax').text)]
	if visual:
	pt1 = (int(bbox[0]), int(bbox[1]))
	pt2 = (int(bbox[2]), int(bbox[3]))
	cv2.rectangle(im, pt1, pt2, color_bar[trackid], 3)
	if visual:
	cv2.imshow('img', im)
	cv2.waitKey(1)

	print('done!')