Spaces:

descript
/

vampnet

Runtime error

App Files Files Community

Hugo Flores Garcia commited on Jul 11, 2023

Commit

5bd16c2

1 Parent(s): 91e3ceb

example audio

Browse files

Files changed (3) hide show

app.py +14 -21
conf/interface.yml +2 -2
setup.py +1 -1

app.py CHANGED Viewed

@@ -14,22 +14,22 @@ from vampnet.interface import Interface
 from vampnet import mask as pmask
 Interface = argbind.bind(Interface)
-AudioLoader = argbind.bind(at.data.datasets.AudioLoader)
 conf = argbind.parse_args()
 with argbind.scope(conf):
     interface = Interface()
-    loader = AudioLoader()
     print(f"interface device is {interface.device}")
-dataset = at.data.datasets.AudioDataset(
-    loader,
-    sample_rate=interface.codec.sample_rate,
-    duration=interface.coarse.chunk_size_s,
-    n_examples=5000,
-    without_replacement=True,
-)
 OUT_DIR = Path("gradio-outputs")
 OUT_DIR.mkdir(exist_ok=True, parents=True)
@@ -50,15 +50,8 @@ def load_audio(file):
     return sig.path_to_file
-def load_random_audio():
-    index = np.random.randint(0, len(dataset))
-    sig = dataset[index]["signal"]
-    sig = interface.preprocess(sig)
-    out_dir = OUT_DIR / "tmp" / str(uuid.uuid4())
-    out_dir.mkdir(parents=True, exist_ok=True)
-    sig.write(out_dir / "input.wav")
-    return sig.path_to_file
 def _vamp(data, return_mask=False):
@@ -191,7 +184,7 @@ with gr.Blocks() as demo:
                 label=f"upload some audio (will be randomly trimmed to max of {interface.coarse.chunk_size_s:.2f}s)",
                 file_types=["audio"]
             )
-            load_random_audio_button = gr.Button("or load random audio")
             input_audio = gr.Audio(
                 label="input audio",
@@ -206,8 +199,8 @@ with gr.Blocks() as demo:
             )
             # connect widgets
-            load_random_audio_button.click(
-                fn=load_random_audio,
                 inputs=[],
                 outputs=[ input_audio]
             )

 from vampnet import mask as pmask
 Interface = argbind.bind(Interface)
+# AudioLoader = argbind.bind(at.data.datasets.AudioLoader)
 conf = argbind.parse_args()
 with argbind.scope(conf):
     interface = Interface()
+    # loader = AudioLoader()
     print(f"interface device is {interface.device}")
+# dataset = at.data.datasets.AudioDataset(
+#     loader,
+#     sample_rate=interface.codec.sample_rate,
+#     duration=interface.coarse.chunk_size_s,
+#     n_examples=5000,
+#     without_replacement=True,
+# )
 OUT_DIR = Path("gradio-outputs")
 OUT_DIR.mkdir(exist_ok=True, parents=True)
     return sig.path_to_file
+def load_example_audio():
+    return "./assets/example.wav"
 def _vamp(data, return_mask=False):
                 label=f"upload some audio (will be randomly trimmed to max of {interface.coarse.chunk_size_s:.2f}s)",
                 file_types=["audio"]
             )
+            load_example_audio_button = gr.Button("or load example audio")
             input_audio = gr.Audio(
                 label="input audio",
             )
             # connect widgets
+            load_example_audio_button.click(
+                fn=load_example_audio,
                 inputs=[],
                 outputs=[ input_audio]
             )

conf/interface.yml CHANGED Viewed

@@ -5,6 +5,6 @@ Interface.coarse_chunk_size_s: 10
 Interface.coarse2fine_chunk_size_s: 3
 # Interface.wavebeat_ckpt: ./models/wavebeat.pth
-AudioLoader.sources:
-  - /media/CHONK/null

 Interface.coarse2fine_chunk_size_s: 3
 # Interface.wavebeat_ckpt: ./models/wavebeat.pth
+# AudioLoader.sources:
+#   - /media/CHONK/null

setup.py CHANGED Viewed

@@ -32,6 +32,6 @@ setup(
         "descript-audio-codec @ git+https://github.com/descriptinc/descript-audio-codec.git",
         "gradio",
         "tensorboardX",
-        "loralib"
     ],
 )

         "descript-audio-codec @ git+https://github.com/descriptinc/descript-audio-codec.git",
         "gradio",
         "tensorboardX",
+        "loralib",
     ],
 )