Spaces:

mattricesound
/

RemFx

Runtime error

App Files Files Community

mattricesound commited on Mar 25, 2023

Commit

8a3bb8f

1 Parent(s): 30c1b93

Update dataset to use range for num effects

Browse files

Files changed (6) hide show

README.md +8 -14
cfg/config.yaml +14 -19
cfg/exp/default.yaml +4 -9
cfg/exp/dist.yaml +3 -4
remfx/datasets.py +43 -37
setup.py +0 -1

README.md CHANGED Viewed

@@ -20,36 +20,30 @@
 ## Experiments
 Training parameters can be configured in `cfg/exp/default.yaml`. Here are some descriptions
-- `max_kept_effects={n}` max number of <b> Kept </b> effects to apply to each file. Set to -1 to always use all effects (default: -1)
-- `max_removed_effects={n}` max number of <b> Removed </b> effects to apply to each file. Set to -1 to always use all effects (default: -1)
 - `model={model}` architecture to use (see 'Models')
-- `effects_to_use={effect}` Effects to use (see 'Effects') (default: all in the list)
-- `effects_to_remove={effect}` Effects to remove (see 'Effects') (default: all in the list)
 - `accelerator=null/'gpu'` Use GPU (1 device) (default: null)
 - `render_files=True/False` Render files. Disable to skip rendering stage (default: True)
 - `render_root={path/to/dir}`. Root directory to render files to (default: DATASET_ROOT)
-Note that "kept effects" are calculated from the difference between `effects_to_use` and `effects_to_remove`.
 These can also be specified on the command line.
-Example: `python scripts/train.py model=demucs "effects_to_use=[distortion, reverb, chorus]" "effects_to_remove=[distortion]" max_kept_effects=2 max_removed_effects=4 shuffle_kept_effects=False shuffle_removed_effects=True accelerator='gpu' render_root=/scratch/VocalSet'`
-Printout:
-```
-Effect Summary:
-Apply kept effects: ['chorus', 'reverb'] (Up to 2, chosen in order) -> Dry
-Apply remove effects: ['distortion'] (Up to 4, chosen randomly) -> Wet
-```
 ## Models
 - `umx`
 - `demucs`
 ## Effects
 - `chorus`
 - `compressor`
 - `distortion`
 - `reverb`
 ## Misc.
 By default, files are rendered to `input_dir / processed / {string_of_effects} / {train|val|test}`.

 ## Experiments
 Training parameters can be configured in `cfg/exp/default.yaml`. Here are some descriptions
+- `num_kept_effects={min, max}` range of <b> Kept </b> effects to apply to each file.
+- `num_removed_effects={min, max}` range of <b> Removed </b> effects to apply to each file.
 - `model={model}` architecture to use (see 'Models')
+- `effects_to_keek={effect}` Effects to apply but not remove (see 'Effects')
+- `effects_to_remove={effect}` Effects to remove (see 'Effects')
 - `accelerator=null/'gpu'` Use GPU (1 device) (default: null)
 - `render_files=True/False` Render files. Disable to skip rendering stage (default: True)
 - `render_root={path/to/dir}`. Root directory to render files to (default: DATASET_ROOT)
 These can also be specified on the command line.
 ## Models
 - `umx`
 - `demucs`
+- `tcn`
+- `dcunet`
+- `dptnet`
 ## Effects
 - `chorus`
 - `compressor`
 - `distortion`
 - `reverb`
+- `delay`
 ## Misc.
 By default, files are rendered to `input_dir / processed / {string_of_effects} / {train|val|test}`.

cfg/config.yaml CHANGED Viewed

@@ -14,23 +14,18 @@ accelerator: null
 log_audio: True
 # Effects
-max_kept_effects: -1
-max_removed_effects: -1
 shuffle_kept_effects: True
 shuffle_removed_effects: False
 num_classes: 5
-effects_to_use:
-  - compressor
-  - distortion
   - reverb
   - chorus
   - delay
 effects_to_remove:
   - compressor
   - distortion
-  - reverb
-  - chorus
-  - delay
 callbacks:
   model_checkpoint:
@@ -62,10 +57,10 @@ datamodule:
     chunk_size: ${chunk_size}
     mode: "train"
     effect_modules: ${effects}
-    effects_to_use: ${effects_to_use}
     effects_to_remove: ${effects_to_remove}
-    max_kept_effects: ${max_kept_effects}
-    max_removed_effects: ${max_removed_effects}
     shuffle_kept_effects: ${shuffle_kept_effects}
     shuffle_removed_effects: ${shuffle_removed_effects}
     render_files: ${render_files}
@@ -78,10 +73,10 @@ datamodule:
     chunk_size: ${chunk_size}
     mode: "val"
     effect_modules: ${effects}
-    effects_to_use: ${effects_to_use}
     effects_to_remove: ${effects_to_remove}
-    max_kept_effects: ${max_kept_effects}
-    max_removed_effects: ${max_removed_effects}
     shuffle_kept_effects: ${shuffle_kept_effects}
     shuffle_removed_effects: ${shuffle_removed_effects}
     render_files: ${render_files}
@@ -94,10 +89,10 @@ datamodule:
     chunk_size: ${chunk_size}
     mode: "test"
     effect_modules: ${effects}
-    effects_to_use: ${effects_to_use}
     effects_to_remove: ${effects_to_remove}
-    max_kept_effects: ${max_kept_effects}
-    max_removed_effects: ${max_removed_effects}
     shuffle_kept_effects: ${shuffle_kept_effects}
     shuffle_removed_effects: ${shuffle_removed_effects}
     render_files: ${render_files}
@@ -121,11 +116,11 @@ trainer:
   _target_: pytorch_lightning.Trainer
   precision: 32 # Precision used for tensors, default `32`
   min_epochs: 0
-  max_epochs: -1
   enable_model_summary: False
   log_every_n_steps: 1 # Logs metrics every N batches
   accumulate_grad_batches: 1
   accelerator: ${accelerator}
   devices: 1
   gradient_clip_val: 10.0
-  max_steps: 50000

 log_audio: True
 # Effects
+num_kept_effects: [2,2] # [min, max]
+num_removed_effects: [2,2] # [min, max]
 shuffle_kept_effects: True
 shuffle_removed_effects: False
 num_classes: 5
+effects_to_keep:
   - reverb
   - chorus
   - delay
 effects_to_remove:
   - compressor
   - distortion
 callbacks:
   model_checkpoint:
     chunk_size: ${chunk_size}
     mode: "train"
     effect_modules: ${effects}
+    effects_to_keep: ${effects_to_keep}
     effects_to_remove: ${effects_to_remove}
+    num_kept_effects: ${num_kept_effects}
+    num_removed_effects: ${num_removed_effects}
     shuffle_kept_effects: ${shuffle_kept_effects}
     shuffle_removed_effects: ${shuffle_removed_effects}
     render_files: ${render_files}
     chunk_size: ${chunk_size}
     mode: "val"
     effect_modules: ${effects}
+    effects_to_keep: ${effects_to_keep}
     effects_to_remove: ${effects_to_remove}
+    num_kept_effects: ${num_kept_effects}
+    num_removed_effects: ${num_removed_effects}
     shuffle_kept_effects: ${shuffle_kept_effects}
     shuffle_removed_effects: ${shuffle_removed_effects}
     render_files: ${render_files}
     chunk_size: ${chunk_size}
     mode: "test"
     effect_modules: ${effects}
+    effects_to_keep: ${effects_to_keep}
     effects_to_remove: ${effects_to_remove}
+    num_kept_effects: ${num_kept_effects}
+    num_removed_effects: ${num_removed_effects}
     shuffle_kept_effects: ${shuffle_kept_effects}
     shuffle_removed_effects: ${shuffle_removed_effects}
     render_files: ${render_files}
   _target_: pytorch_lightning.Trainer
   precision: 32 # Precision used for tensors, default `32`
   min_epochs: 0
+  num_epochs: -1
   enable_model_summary: False
   log_every_n_steps: 1 # Logs metrics every N batches
   accumulate_grad_batches: 1
   accelerator: ${accelerator}
   devices: 1
   gradient_clip_val: 10.0
+  num_steps: 50000

cfg/exp/default.yaml CHANGED Viewed

@@ -11,23 +11,18 @@ render_root: "./data"
 accelerator: null
 log_audio: True
 # Effects
-max_kept_effects: -1
-max_removed_effects: -1
 shuffle_kept_effects: True
 shuffle_removed_effects: False
 num_classes: 5
-effects_to_use:
-  - compressor
-  - distortion
-  - reverb
-  - chorus
-  - delay
 effects_to_remove:
   - compressor
-  - distortion
   - reverb
   - chorus
   - delay
 datamodule:
   batch_size: 16
   num_workers: 8

 accelerator: null
 log_audio: True
 # Effects
+num_kept_effects: [0,0] # [min, max]
+num_removed_effects: [0,5] # [min, max]
 shuffle_kept_effects: True
 shuffle_removed_effects: False
 num_classes: 5
+effects_to_keep:
 effects_to_remove:
   - compressor
   - reverb
   - chorus
   - delay
+  - distortion
 datamodule:
   batch_size: 16
   num_workers: 8

cfg/exp/dist.yaml CHANGED Viewed

@@ -11,14 +11,13 @@ render_root: "/scratch/EffectSet"
 accelerator: "gpu"
 log_audio: True
 # Effects
-max_kept_effects: 5
-max_removed_effects: -1
 shuffle_kept_effects: True
 shuffle_removed_effects: False
 num_classes: 5
-effects_to_use:
   - compressor
-  - distortion
   - reverb
   - chorus
   - delay

 accelerator: "gpu"
 log_audio: True
 # Effects
+num_kept_effects: [0,4] # [min, max]
+num_removed_effects: [1,1] # [min, max]
 shuffle_kept_effects: True
 shuffle_removed_effects: False
 num_classes: 5
+effects_to_keep:
   - compressor
   - reverb
   - chorus
   - delay

remfx/datasets.py CHANGED Viewed

@@ -9,8 +9,7 @@ import random
 from tqdm import tqdm
 from pathlib import Path
 from remfx import effects
-from ordered_set import OrderedSet
-from typing import Any, List, Dict
 from torch.utils.data import Dataset, DataLoader
 from remfx.utils import select_random_chunk
@@ -155,10 +154,10 @@ class EffectDataset(Dataset):
         chunk_size: int = 262144,
         total_chunks: int = 1000,
         effect_modules: List[Dict[str, torch.nn.Module]] = None,
-        effects_to_use: List[str] = None,
         effects_to_remove: List[str] = None,
-        max_kept_effects: int = -1,
-        max_removed_effects: int = 1,
         shuffle_kept_effects: bool = True,
         shuffle_removed_effects: bool = False,
         render_files: bool = True,
@@ -174,16 +173,16 @@ class EffectDataset(Dataset):
         self.total_chunks = total_chunks
         self.sample_rate = sample_rate
         self.mode = mode
-        self.max_kept_effects = max_kept_effects
-        self.max_removed_effects = max_removed_effects
-        self.effects_to_use = effects_to_use
-        self.effects_to_remove = effects_to_remove
         self.normalize = effects.LoudnessNormalize(sample_rate, target_lufs_db=-20)
         self.effects = effect_modules
         self.shuffle_kept_effects = shuffle_kept_effects
         self.shuffle_removed_effects = shuffle_removed_effects
-        effects_string = "_".join(self.effects_to_use + ["_"] + self.effects_to_remove)
-        self.effects_to_keep = self.validate_effect_input()
         self.proc_root = self.render_root / "processed" / effects_string / self.mode
         self.files = locate_files(self.root, self.mode)
@@ -251,7 +250,7 @@ class EffectDataset(Dataset):
                     f"Effect {effect} not found in ALL_EFFECTS. "
                     f"Please choose from {ALL_EFFECTS}"
                 )
-        for effect in self.effects_to_use:
             if effect not in self.effects.keys():
                 raise ValueError(
                     f"Effect {effect} not found in self.effects. "
@@ -263,27 +262,37 @@ class EffectDataset(Dataset):
                     f"Effect {effect} not found in self.effects. "
                     f"Please choose from {self.effects.keys()}"
                 )
-        kept_fx = list(
-            OrderedSet(self.effects_to_use) - OrderedSet(self.effects_to_remove)
-        )
         kept_str = "randomly" if self.shuffle_kept_effects else "in order"
-        rem_fx = self.effects_to_remove
         rem_str = "randomly" if self.shuffle_removed_effects else "in order"
-        if self.max_kept_effects == -1:
-            num_kept_str = len(kept_fx)
         else:
-            num_kept_str = f"Up to {self.max_kept_effects}"
-        if self.max_removed_effects == -1:
-            num_rem_str = len(rem_fx)
         else:
-            num_rem_str = f"Up to {self.max_removed_effects}"
         print(
             f"Effect Summary: \n"
             f"Apply kept effects: {kept_fx} ({num_kept_str}, chosen {kept_str}) -> Dry\n"
             f"Apply remove effects: {rem_fx} ({num_rem_str}, chosen {rem_str}) -> Wet\n"
         )
-        return kept_fx
     def process_effects(self, dry: torch.Tensor):
         # Apply Kept Effects
@@ -293,13 +302,10 @@ class EffectDataset(Dataset):
         else:
             effect_indices = torch.arange(len(self.effects_to_keep))
-        # Up to max_kept_effects
-        if self.max_kept_effects != -1:
-            num_kept_effects = int(torch.rand(1).item() * (self.max_kept_effects))
-        else:
-            num_kept_effects = len(self.effects_to_keep)
         effect_indices = effect_indices[:num_kept_effects]
         # Index in effect settings
         effect_names_to_apply = [self.effects_to_keep[i] for i in effect_indices]
         effects_to_apply = [self.effects[i] for i in effect_names_to_apply]
@@ -312,22 +318,19 @@ class EffectDataset(Dataset):
         # Apply effects_to_remove
         # Shuffle effects if specified
-        wet = torch.clone(dry)
         if self.shuffle_removed_effects:
             effect_indices = torch.randperm(len(self.effects_to_remove))
         else:
             effect_indices = torch.arange(len(self.effects_to_remove))
-        # Up to max_removed_effects
-        if self.max_removed_effects != -1:
-            num_removed_effects = int(torch.rand(1).item() * (self.max_removed_effects))
-        else:
-            num_removed_effects = len(self.effects_to_remove)
         effect_indices = effect_indices[:num_removed_effects]
         # Index in effect settings
         effect_names_to_apply = [self.effects_to_remove[i] for i in effect_indices]
         effects_to_apply = [self.effects[i] for i in effect_names_to_apply]
         # Apply
         wet_labels = []
         for effect in effects_to_apply:
             # Normalize in-between effects
@@ -346,7 +349,10 @@ class EffectDataset(Dataset):
         # Normalize
         normalized_dry = self.normalize(dry)
         normalized_wet = self.normalize(wet)
         return normalized_dry, normalized_wet, dry_labels_tensor, wet_labels_tensor

 from tqdm import tqdm
 from pathlib import Path
 from remfx import effects
+from typing import Any, List, Dict, Tuple
 from torch.utils.data import Dataset, DataLoader
 from remfx.utils import select_random_chunk
         chunk_size: int = 262144,
         total_chunks: int = 1000,
         effect_modules: List[Dict[str, torch.nn.Module]] = None,
+        effects_to_keep: List[str] = None,
         effects_to_remove: List[str] = None,
+        num_kept_effects: List[int] = [1, 5],
+        num_removed_effects: List[int] = [1, 5],
         shuffle_kept_effects: bool = True,
         shuffle_removed_effects: bool = False,
         render_files: bool = True,
         self.total_chunks = total_chunks
         self.sample_rate = sample_rate
         self.mode = mode
+        self.num_kept_effects = num_kept_effects
+        self.num_removed_effects = num_removed_effects
+        self.effects_to_keep = [] if effects_to_keep == None else effects_to_keep
+        self.effects_to_remove = [] if effects_to_remove == None else effects_to_remove
         self.normalize = effects.LoudnessNormalize(sample_rate, target_lufs_db=-20)
         self.effects = effect_modules
         self.shuffle_kept_effects = shuffle_kept_effects
         self.shuffle_removed_effects = shuffle_removed_effects
+        effects_string = "_".join(self.effects_to_keep + ["_"] + self.effects_to_remove)
+        self.validate_effect_input()
         self.proc_root = self.render_root / "processed" / effects_string / self.mode
         self.files = locate_files(self.root, self.mode)
                     f"Effect {effect} not found in ALL_EFFECTS. "
                     f"Please choose from {ALL_EFFECTS}"
                 )
+        for effect in self.effects_to_keep:
             if effect not in self.effects.keys():
                 raise ValueError(
                     f"Effect {effect} not found in self.effects. "
                     f"Effect {effect} not found in self.effects. "
                     f"Please choose from {self.effects.keys()}"
                 )
         kept_str = "randomly" if self.shuffle_kept_effects else "in order"
         rem_str = "randomly" if self.shuffle_removed_effects else "in order"
+        if self.num_kept_effects[0] > self.num_kept_effects[1]:
+            raise ValueError(
+                f"num_kept_effects must be a tuple of (min, max). "
+                f"Got {self.num_kept_effects}"
+            )
+        if self.num_kept_effects[0] == self.num_kept_effects[1]:
+            num_kept_str = f"{self.num_kept_effects[0]}"
         else:
+            num_kept_str = (
+                f"Between {self.num_kept_effects[0]}-{self.num_kept_effects[1]}"
+            )
+        if self.num_removed_effects[0] > self.num_removed_effects[1]:
+            raise ValueError(
+                f"num_removed_effects must be a tuple of (min, max). "
+                f"Got {self.num_removed_effects}"
+            )
+        if self.num_removed_effects[0] == self.num_removed_effects[1]:
+            num_rem_str = f"{self.num_removed_effects[0]}"
         else:
+            num_rem_str = (
+                f"Between {self.num_removed_effects[0]}-{self.num_removed_effects[1]}"
+            )
+        rem_fx = self.effects_to_remove
+        kept_fx = self.effects_to_keep
         print(
             f"Effect Summary: \n"
             f"Apply kept effects: {kept_fx} ({num_kept_str}, chosen {kept_str}) -> Dry\n"
             f"Apply remove effects: {rem_fx} ({num_rem_str}, chosen {rem_str}) -> Wet\n"
         )
     def process_effects(self, dry: torch.Tensor):
         # Apply Kept Effects
         else:
             effect_indices = torch.arange(len(self.effects_to_keep))
+        r1 = self.num_kept_effects[0]
+        r2 = self.num_kept_effects[1]
+        num_kept_effects = torch.round((r1 - r2) * torch.rand(1) + r2).int()
         effect_indices = effect_indices[:num_kept_effects]
         # Index in effect settings
         effect_names_to_apply = [self.effects_to_keep[i] for i in effect_indices]
         effects_to_apply = [self.effects[i] for i in effect_names_to_apply]
         # Apply effects_to_remove
         # Shuffle effects if specified
         if self.shuffle_removed_effects:
             effect_indices = torch.randperm(len(self.effects_to_remove))
         else:
             effect_indices = torch.arange(len(self.effects_to_remove))
+        wet = torch.clone(dry)
+        r1 = self.num_removed_effects[0]
+        r2 = self.num_removed_effects[1]
+        num_removed_effects = torch.round((r1 - r2) * torch.rand(1) + r2).int()
         effect_indices = effect_indices[:num_removed_effects]
         # Index in effect settings
         effect_names_to_apply = [self.effects_to_remove[i] for i in effect_indices]
         effects_to_apply = [self.effects[i] for i in effect_names_to_apply]
         # Apply
         wet_labels = []
         for effect in effects_to_apply:
             # Normalize in-between effects
         # Normalize
         normalized_dry = self.normalize(dry)
         normalized_wet = self.normalize(wet)
+        print(dry_labels_tensor, wet_labels_tensor)
+        import pdb
+        pdb.set_trace()
         return normalized_dry, normalized_wet, dry_labels_tensor, wet_labels_tensor

setup.py CHANGED Viewed

@@ -47,7 +47,6 @@ setup(
         "pyloudnorm",
         "pedalboard",
         "frechet_audio_distance",
-        "ordered-set",
         "asteroid",
     ],
     include_package_data=True,

         "pyloudnorm",
         "pedalboard",
         "frechet_audio_distance",
         "asteroid",
     ],
     include_package_data=True,