Spaces:

drjieliu
/

EPCOT

Running

App Files Files Community

EPCOT / func_gradio.py

drjieliu

Upload 4 files

a61d226 over 1 year ago

raw

history blame

No virus

7.04 kB

	import gradio,psutil
	import numpy as np
	import torch,os,pickle,uuid
	from util import check_region,predict_microc,predict_cage,predict_epis,filetobrowser,predict_hic,predict_epb
	from scipy.sparse import load_npz
	import matplotlib.pyplot as plt
	from matplotlib.gridspec import GridSpec
	import matplotlib
	def predict_func(input_chrom,cop_type, region_start,region_end, atac_seq):
	device = torch.device('cuda:0' if torch.cuda.is_available() else 'cpu')
	print(device)
	if input_chrom == '' or cop_type == '':
	raise gradio.Error("The prediction options cannot be empty")
	if atac_seq is None:
	raise gradio.Error("Must provide an ATAC-seq file!")
	if not os.path.exists('refSeq/hg38/chr%s.npz'%input_chrom):
	raise gradio.Error("The reference genome must be downloaded!")

	ref_genome = load_npz('refSeq/hg38/chr%s.npz'%input_chrom).toarray()
	try:
	with open(atac_seq.name,'rb') as f:
	tmp_atac=pickle.load(f)
	atac_seq = tmp_atac[int(input_chrom)].toarray()
	except Exception:
	raise gradio.Error('The ATAC-seq file cannot be read!')

	if cop_type == 'Micro-C':
	chrom, start, end = check_region(input_chrom, region_start,region_end, ref_genome,500000)
	else:
	chrom, start, end = check_region(input_chrom, region_start,region_end, ref_genome,1000000)



	out_epi_binding = predict_epb(os.path.abspath('models/epi_bind.pt'), [start, end], ref_genome, atac_seq, device,
	cop_type)
	out_cage = predict_cage(os.path.abspath('models/cage.pt'), [start, end], ref_genome, atac_seq, device, cop_type)

	out_epi = predict_epis(os.path.abspath('models/epi_track.pt'), [start, end], ref_genome, atac_seq, device, cop_type)

	file_id = str(uuid.uuid4())

	if not os.path.exists('results'):
	os.mkdir('results')
	else:
	for f in os.listdir('results/'):
	os.remove(os.path.join('results/', f))


	if cop_type == 'Micro-C':
	out_cop = predict_microc(os.path.abspath('models/microc.pt'), [start, end], ref_genome, atac_seq, device)
	np.savez_compressed( 'results/prediction_%s.npz'%file_id,
	chrom= input_chrom,start =start+10000,end=end-10000,
	epi=out_epi,epb=out_epi_binding, cage=out_cage,cop=out_cop)
	return ['results/prediction_%s.npz'%file_id,
	filetobrowser(out_epi,out_cage,out_cop,input_chrom, start+10000,end-10000,file_id)]
	else:
	out_cop=predict_hic(os.path.abspath('models/hic.pt'), [start, end], ref_genome, atac_seq, device)
	np.savez_compressed('results/prediction_%s.npz'%file_id,
	chrom=input_chrom, start=start + 20000, end=end - 20000,
	epi=out_epi,epb=out_epi_binding, cage=out_cage,cop=out_cop)

	return ['results/prediction_%s.npz'%file_id,
	filetobrowser(out_epi,out_cage,out_cop,input_chrom, start + 20000, end - 20000,file_id)]


	def make_plots(in_file,md,epis,epi_type, maxv1, maxv2,maxv3):
	matplotlib.use("Agg")
	# matplotlib.pyplot.switch_backend('Agg')
	if in_file is None:
	raise gradio.Error('Must upload a prediction file!')
	try:
	prediction = np.load(in_file.name)
	except Exception:
	raise gradio.Error('The prediction file cannot be read!')
	maxv1,maxv2,maxv3=float(maxv1),float(maxv2),float(maxv3)
	with open(os.path.abspath('data/epigenomes.txt'), 'r') as f:
	epigenomes = f.read().splitlines()

	bins = prediction['cop'].shape[-1]
	if epis=='':
	raise gradio.Error("No epigenomic feature is selected")
	num_mod = len(epis) + 1
	epi_idx=np.array([epigenomes.index(epi) for epi in epis])


	# plt.rcParams['font.sans-serif'] = 'Arial'
	# plt.rcParams['font.family'] = 'sans-serif'
	plt.rcParams['font.size'] = 14

	if bins==480:
	fig = plt.figure(figsize=(9, num_mod + 4))
	gs = GridSpec(num_mod+4, 9)
	ax_map = [fig.add_subplot(gs[:4, :8])]
	axc=fig.add_subplot(gs[:4, 8:])
	axc.axis('off')
	axs = [fig.add_subplot(gs[4+i, :8]) for i in range(num_mod)]
	else:
	fig = plt.figure(figsize=(9, num_mod+12))
	gs = GridSpec(num_mod + 12, 9)
	ax_map = [fig.add_subplot(gs[4i:4i+4, :8]) for i in range(4)]
	axc = fig.add_subplot(gs[:8, 8:])
	axc.axis('off')
	axc1 = fig.add_subplot(gs[8:12, 8:])
	axc1.axis('off')
	axs = [fig.add_subplot(gs[12 + i, :8]) for i in range(num_mod)]

	if bins == 480:
	bin_coords = np.true_divide(np.arange(bins), np.sqrt(2))
	x, y = np.meshgrid(bin_coords, bin_coords)
	sin45 = np.sin(np.radians(45))
	x, y = x * sin45 + y * sin45, x * sin45 - y * sin45
	m=ax_map[0].pcolormesh(x, y, prediction['cop'], cmap='RdBu_r', vmin=0, vmax=maxv1)

	cbar=fig.colorbar(m,ax=axc,aspect=20,fraction=1)
	else:
	bin_coords = np.true_divide(np.arange(bins), np.sqrt(2))
	x, y = np.meshgrid(bin_coords, bin_coords)
	sin45 = np.sin(np.radians(45))
	x, y = x * sin45 + y * sin45, x * sin45 - y * sin45
	m = [ax_map[i].pcolormesh(x, y, prediction['cop'][i], cmap='RdBu_r', vmin=0, vmax=maxv1) for i in range(3)]
	cbar = fig.colorbar(m[0], ax=axc, aspect=30, fraction=1,shrink=0.85)
	cbar.set_label('log2(x)+1')
	cbar1 = fig.colorbar(m[2], ax=axc1, aspect=15, fraction=1,shrink=0.85)
	types=['CTCF ChIA-PET','POLR2 ChIA-PET','Hi-C']
	for i in range(3):
	ax_map[i].text(2, bins//2.5, types[i],va='top',fontsize=18,color='r')


	for i in range(len(ax_map)):
	ax_map[i].set_yticks([])
	ax_map[i].set_ylim(0, bins//2)
	ax_map[i].spines['left'].set_visible(False)

	for axm in axs+ax_map:
	axm.set_xticks([])
	axm.margins(x=0)
	axm.spines['top'].set_visible(False)
	axm.spines['right'].set_visible(False)
	axm.spines['bottom'].set_visible(False)
	for i in range(num_mod-1):
	if epi_type=='Signal p-values (archsinh)':
	axs[i].fill_between(np.arange(prediction['epi'].shape[0]), 0, prediction['epi'][:,epi_idx[i]])
	axs[i].set_ylim(0, maxv2)
	axs[i].text(2, maxv2, epis[i],va='top')
	else:
	axs[i].fill_between(np.arange(prediction['epb'].shape[0]), 0, prediction['epb'][:, epi_idx[i]])
	axs[i].set_ylim(0, 1)
	axs[i].text(2, 1, epis[i], va='top')

	start=int(prediction['start'])
	chrom=int(prediction['chrom'])
	end= int(prediction['end'])
	seq_inter=1000 if bins==480 else 5000
	axs[-1].fill_between(np.arange(prediction['cage'].shape[0]), 0, prediction['cage'])
	axs[-1].set_ylim(0, maxv3)
	axs[-1].text(2, maxv3, 'CAGE',va='top')
	axs[-1].set_xticks([i*prediction['cage'].shape[0]//4 for i in range(5)])
	axs[-1].set_xticklabels([start+ibinsseq_inter//4 for i in range(5)])

	axs[-1].set_xlabel('chr%s:%s-%s'%(chrom,start,end))
	plt.show()
	return fig