Spaces:

akhaliq
/

Music_Source_Separation

Runtime error

App Files Files Community

Music_Source_Separation / bytesep /dataset_creation /pack_audios_to_hdf5s /instruments_solo.py

akhaliq3

spaces demo

5019931 almost 3 years ago

raw

history blame

No virus

4.37 kB

	import argparse
	import os
	import pathlib
	import time
	from concurrent.futures import ProcessPoolExecutor
	from typing import Dict, List, NoReturn

	import h5py
	import numpy as np
	import pandas as pd

	from bytesep.utils import float32_to_int16, load_audio


	def read_csv(meta_csv) -> Dict:
	r"""Get train & test names from csv.

	Args:
	meta_csv: str

	Returns:
	names_dict: dict, e.g., {
	'train', ['songA.mp3', 'songB.mp3', ...],
	'test': ['songE.mp3', 'songF.mp3', ...]
	}
	"""
	df = pd.read_csv(meta_csv, sep=',')

	names_dict = {}

	for split in ['train', 'test']:
	audio_indexes = df['split'] == split
	audio_names = list(df['audio_name'][audio_indexes])
	audio_names = [
	'{}.mp3'.format(pathlib.Path(audio_name).stem) for audio_name in audio_names
	]
	names_dict[split] = audio_names

	return names_dict


	def pack_audios_to_hdf5s(args) -> NoReturn:
	r"""Pack (resampled) audio files into hdf5 files to speed up loading.

	Args:
	dataset_dir: str
	split: str, 'train' \| 'test'
	source_type: str
	hdf5s_dir: str, directory to write out hdf5 files
	sample_rate: int
	channels_num: int
	mono: bool

	Returns:
	NoReturn
	"""

	# arguments & parameters
	dataset_dir = args.dataset_dir
	split = args.split
	source_type = args.source_type
	hdf5s_dir = args.hdf5s_dir
	sample_rate = args.sample_rate
	channels = args.channels
	mono = True if channels == 1 else False

	# Only pack data for training data.
	assert split == "train"

	# paths
	audios_dir = os.path.join(dataset_dir, 'mp3s')
	meta_csv = os.path.join(dataset_dir, 'validation.csv')

	os.makedirs(hdf5s_dir, exist_ok=True)

	# Read train & test names.
	names_dict = read_csv(meta_csv)

	audio_names = names_dict[split]

	params = []

	for audio_index, audio_name in enumerate(audio_names):

	audio_path = os.path.join(audios_dir, audio_name)

	hdf5_path = os.path.join(
	hdf5s_dir, "{}.h5".format(pathlib.Path(audio_name).stem)
	)

	param = (
	audio_index,
	audio_name,
	source_type,
	audio_path,
	mono,
	sample_rate,
	hdf5_path,
	)
	params.append(param)

	# Uncomment for debug.
	# write_single_audio_to_hdf5(params[0])
	# os._exit()

	pack_hdf5s_time = time.time()

	with ProcessPoolExecutor(max_workers=None) as pool:
	# Maximum works on the machine
	pool.map(write_single_audio_to_hdf5, params)

	print("Pack hdf5 time: {:.3f} s".format(time.time() - pack_hdf5s_time))


	def write_single_audio_to_hdf5(param: List) -> NoReturn:
	r"""Write single audio into hdf5 file."""

	(
	audio_index,
	audio_name,
	source_type,
	audio_path,
	mono,
	sample_rate,
	hdf5_path,
	) = param

	with h5py.File(hdf5_path, "w") as hf:

	hf.attrs.create("audio_name", data=audio_name, dtype="S100")
	hf.attrs.create("sample_rate", data=sample_rate, dtype=np.int32)

	audio = load_audio(audio_path=audio_path, mono=mono, sample_rate=sample_rate)
	# audio: (channels_num, audio_samples)

	hf.create_dataset(
	name=source_type, data=float32_to_int16(audio), dtype=np.int16
	)

	print('{} Write hdf5 to {}'.format(audio_index, hdf5_path))


	if __name__ == "__main__":
	parser = argparse.ArgumentParser()

	parser.add_argument(
	"--dataset_dir",
	type=str,
	required=True,
	help="Directory of the instruments solo dataset.",
	)
	parser.add_argument("--split", type=str, required=True, choices=["train", "test"])
	parser.add_argument(
	"--source_type",
	type=str,
	required=True,
	)
	parser.add_argument(
	"--hdf5s_dir",
	type=str,
	required=True,
	help="Directory to write out hdf5 files.",
	)
	parser.add_argument("--sample_rate", type=int, required=True, help="Sample rate.")
	parser.add_argument(
	"--channels", type=int, required=True, help="Use 1 for mono, 2 for stereo."
	)

	# Parse arguments.
	args = parser.parse_args()

	# Pack audios to hdf5 files.
	pack_audios_to_hdf5s(args)