pipeline_server

Running

App Files Files Community

pipeline_server / detectors /retinanet /retinanet_inference_ver3.py

zy984764389

Upload folder using huggingface_hub

4ba6fde verified 11 months ago

raw

history blame contribute delete

7 kB

	from detectors.retinanet.utils_knn import read_LatLotAlt,get_GSD,filter_slice
	from detectors.retinanet.encoder_knn import DataEncoder,DataEncoder_fusion
	import torch
	import json
	from detectors.retinanet.tools import py_cpu_nms,get_sub_image

	import cv2




	model_conf_threshold = {'Bird_A':0.2,
	'Bird_B':0.2,
	'Bird_C':0.2,
	'Bird_D':0.2,
	'Bird_E':0.2,
	'Bird_drone':0.2}
	model_extension = {
	'Bird_drone':{40:('_alt_30',30),
	75:('_alt_60',60),
	90:('_alt_90',90)},
	'Bird_drone_KNN':{20:('_alt_15',15),
	40:('_alt_30',30),
	75:('_alt_60',60),
	90:('_alt_90',90)}
	}

	def get_model_conf_threshold (model_type):
	if (model_type in model_conf_threshold):
	return model_conf_threshold[model_type]
	else:
	return 0.3

	def get_model_extension(model_type,model_dir,altitude):
	if(model_type in model_extension):
	model_ext = model_extension[model_type]
	for altitude_thresh in model_ext:
	if (altitude_thresh>=altitude):
	ref_altitude = model_ext[altitude_thresh][1]
	# model_dir = model_dir.replace('.pkl',model_ext[altitude_thresh][0]+'.pkl')
	return model_dir,ref_altitude
	# model_dir = model_dir.replace('.pkl',model_ext[max(model_ext.keys())][0]+'.pkl')
	return model_dir,model_ext[max(model_ext.keys())][1]
	else:
	return model_dir,altitude

	class Retinanet_instance():
	def __init__(self,input_transform,model_type,model_dir,device =torch.device('cuda'),load_w_config = True,altitude=15):
	self.transform = input_transform
	self.model_type = model_type
	self.load_w_config = load_w_config
	self.altitude = altitude
	self.model_dir,self.ref_altitude = get_model_extension(model_type,model_dir,altitude)
	self.device = device
	self.conf_threshold = get_model_conf_threshold(model_type)
	self.model = None
	self.encoder = None
	self.load_model()

	def load_model(self):
	if (self.load_w_config):
	config_dir = self.model_dir.replace('.pkl','.json')
	with open(config_dir,'r') as f:
	cfg = json.load(f)
	from detectors.retinanet.retinanet_fusion import RetinaNet
	self.model = RetinaNet(num_classes=1,num_anchors=len(cfg['KNN_anchors']))
	self.encoder = DataEncoder_fusion(anchor_wh=cfg['KNN_anchors'],device = self.device)
	#self.model.load_state_dict(torch.load(self.model_dir))
	else:
	from detectors.retinanet.retinanet import RetinaNet
	self.model = RetinaNet(num_classes=1)
	self.encoder = DataEncoder(self.device)
	self.model = torch.load(self.model_dir,map_location=self.device)
	self.model = self.model.module.to(self.device)
	self.model.eval()
	print('check net mode',next(self.model.parameters()).device)

	def inference(self,image_dir,slice_overlap,read_GPS = False,debug = True):
	mega_image = cv2.imread(image_dir)
	mega_image = cv2.cvtColor(mega_image, cv2.COLOR_BGR2RGB)
	if (read_GPS):
	try:
	altitude = read_LatLotAlt(image_dir)['altitude']
	# print ('Reading altitude from Meta data of {}'.format(altitude))
	except:
	altitude = self.altitude
	# print ('Meta data not available, use default altitude {}'.format(altitude))
	else:
	altitude = self.altitude
	# print ('Using default altitude {}'.format(altitude))
	GSD,ref_GSD = get_GSD(altitude,camera_type='Pro2', ref_altitude=self.ref_altitude)
	ratio = 1.0*ref_GSD/GSD
	# print('Image processing altitude: {} \t Processing scale {}'.format(altitude,ratio))
	sub_image_list, coor_list = get_sub_image(
	mega_image, overlap=slice_overlap, ratio=ratio)

	bbox_list = []
	for index, sub_image in enumerate(sub_image_list):
	sub_bbox_list = []
	with torch.no_grad():
	inputs = self.transform(cv2.resize(
	sub_image, (512, 512), interpolation=cv2.INTER_AREA))
	inputs = inputs.unsqueeze(0).to(self.device)
	loc_preds, cls_preds = self.model(inputs)
	boxes, labels, scores = self.encoder.decode(
	loc_preds.data.squeeze(), cls_preds.data.squeeze(), 512, CLS_THRESH = self.conf_threshold,NMS_THRESH = 0.25)
	if (len(boxes.shape) != 1):
	for idx in range(boxes.shape[0]):
	x1, y1, x2, y2 = list(
	boxes[idx].cpu().numpy()) # (x1,y1, x2,y2)
	score = scores.cpu().numpy()[idx]
	sub_bbox_list.append([x1,y1,x2,y2,score])
	#filter boxes that has overlapped region on sliced images

	sub_bbox_list = filter_slice(sub_bbox_list,coor_list[index],sub_image.shape[0],mega_image.shape[:2],dis = int(slice_overlap/2*512))

	for sub_box in sub_bbox_list:
	x1,y1,x2,y2,score = sub_box
	bbox_list.append([coor_list[index][1]+ratiox1, coor_list[index][0]+ratioy1,
	coor_list[index][1]+ratiox2, coor_list[index][0]+ratioy2, score])

	box_idx = py_cpu_nms(bbox_list, 0.25)
	bbox_list = [bbox_list[i] for i in box_idx]
	if (debug):
	w = sub_image_list[0].shape[0]
	for i,coor in enumerate(coor_list):
	cv2.rectangle(mega_image,(coor[1],coor[0]),(coor[1]+w,coor[0]+w),(i, 255-i, 0), 2)


	for box in bbox_list:
	cv2.putText(mega_image, str(round(box[4], 2)), (int(box[0]), int(
	box[1])), cv2.FONT_HERSHEY_SIMPLEX, 0.5, (0, 0, 255), 1)
	cv2.rectangle(mega_image, (int(box[0]), int(
	box[1])), (int(box[2]), int(box[3])), (255, 0, 0), 2)
	return mega_image,bbox_list

	if __name__=='__main__':
	import torchvision.transforms as transforms
	transform = transforms.Compose([
	transforms.ToTensor(),
	transforms.Normalize((0.485, 0.456, 0.406), (0.229, 0.224, 0.225))
	])
	model = Retinanet_instance(input_transform = transform,model_type = 'Bird_drone_KNN',
	model_dir = '/home/robert/Models/Retinanet_inference_example/checkpoint/Bird_drone_KNN/final_model.pkl',
	device =torch.device('cpu'),load_w_config = True,altitude=15)
	image_dir = '/home/robert/Data/drone_collection/Cloud_HarvestedCrop_15m_DJI_0251.jpg'
	re = model.inference(image_dir=image_dir,slice_overlap= 0.2)
	import matplotlib.pyplot as plt
	plt.imshow(re[0])
	plt.show()