Spaces:

szin94
/

dmsp

Running on Zero

App Files Files Community

dmsp / src /model /nn /ddsp.py

szin94

first commit

bc3e180 about 1 year ago

raw

history blame contribute delete

2.65 kB

	import torch
	import torch.nn as nn
	from src.model.nn.blocks import FMBlock, AMBlock
	from src.utils.ddsp import upsample
	from src.utils.ddsp import remove_above_nyquist_mode
	from src.utils.ddsp import amp_to_impulse_response, fft_convolve
	from src.utils.ddsp import modal_synth
	from src.utils.ddsp import resample
	import math

	class DDSP(nn.Module):
	def __init__(self,
	feature_size, hidden_size,
	n_modes, n_bands, sampling_rate, block_size,
	fm=False,
	):
	super().__init__()
	self.n_modes = n_modes

	self.freq_modulator = FMBlock(n_modes, feature_size) if fm else None
	self.coef_modulator = AMBlock(n_modes, feature_size)
	self.noise_proj = nn.Linear(feature_size, n_bands)

	noise_gate = nn.Parameter(torch.tensor([1e-2]), requires_grad=True)
	self.register_parameter("noise_gate", noise_gate)
	self.register_buffer("sampling_rate", torch.tensor(sampling_rate))
	self.register_buffer("block_size", torch.tensor(block_size))

	def forward(self, hidden, mode_freq, mode_coef, times, alpha, lengths):
	''' hidden : (Bs, 1, hidden_size)
	mode_freq : (Bs, Nt, n_modes)
	mode_coef : (Bs, 1, n_modes)
	times : (Bs, Nt, 1)
	'''
	if self.freq_modulator is None:
	freq_m = mode_freq # integer multiples
	else:
	freq_m = self.freq_modulator(mode_freq, hidden)
	coef_m = self.coef_modulator(mode_coef, hidden, times)

	#==============================
	# harmonic part
	#==============================
	freqs = freq_m / (2math.pi) self.sampling_rate
	coef_m = remove_above_nyquist_mode(coef_m, freqs, self.sampling_rate) # (Bs, Nt, n_modes)
	freq_s = upsample(freq_m, self.block_size).narrow(1,0,lengths)
	coef_s = upsample(coef_m, self.block_size).narrow(1,0,lengths)
	harmonic = modal_synth(freq_s, coef_s, self.sampling_rate)

	#==============================
	# noise part
	#==============================
	ngate = torch.tanh((alpha - 1) * self.noise_gate)
	param = ngate * torch.sigmoid(self.noise_proj(hidden) - 5)

	impulse = amp_to_impulse_response(param, self.block_size)
	noise = torch.rand(
	impulse.shape[0],
	impulse.shape[1],
	self.block_size,
	).to(impulse) * 2 - 1
	noise = fft_convolve(noise, impulse).contiguous()
	noise = noise.reshape(noise.shape[0], -1, 1).narrow(1,0,lengths)

	signal = harmonic + noise
	return signal.squeeze(-1), freq_m, coef_m