Spaces:

RexChan
/

ISOM5240_Group25

Sleeping

App Files Files Community

RexChan commited on Mar 24, 2024

Commit

8c57520

verified ·

1 Parent(s): d303e1d

Update app.py

Browse files

Files changed (1) hide show

app.py +56 -3

app.py CHANGED Viewed

@@ -8,14 +8,67 @@ from pydub import AudioSegment
 from IPython.display import Audio
 import os
 import accelerate
 # preprocess and crop audio file
-def audio_preprocess(input_file):
    # separate music and vocal
-    separator = Separator('spleeter:2stems')
    #separator.separate_to_file(input_file, output_file)
-    separated_audio = separator.separate(input_file)
    # Crop the audio
     start_time = 60000  # e.g. 30 seconds, 30000

 from IPython.display import Audio
 import os
 import accelerate
+import pyaudio
+import numpy as np
+# Create PyAudio object
+p = pyaudio.PyAudio()
+CHUNK_SIZE = 1024
+SAMPLING_RATE = 16000
+vocals_data = bytes()
 # preprocess and crop audio file
+def audio_preprocess(input_file, in_data, frame_count, time_info, status):
+# Define callback function for audio processing
+    global vocals_data
+    # Convert input data to numpy array
+    audio_array = np.frombuffer(input_file, dtype=np.int16)
+    # Perform vocal removal on the audio input
+    # Pass the audio array as waveform to separate() method
+    vocals = Separator('spleeter:2stems').separate(audio_array)
+    # Convert vocals to audio data
+    vocals_data = vocals['vocals'].flatten().astype(np.int16).tobytes()
+    # Return processed data for output
+    return vocals_data, pyaudio.paContinue
+    # Open stream for recording
+    stream = p.open(format=pyaudio.paInt16, channels=1, rate=SAMPLING_RATE, input=True, output=True,
+                    frames_per_buffer=CHUNK_SIZE, stream_callback=process_audio)
+    # Start stream
+    stream.start_stream()
+    # Create stream for playback
+    playback_stream = p.open(format=pyaudio.paInt16, channels=1, rate=SAMPLING_RATE, output=True)
+    # Play processed data in real-time
+    while stream.is_active():
+        if len(vocals_data) >= CHUNK_SIZE:
+            playback_stream.write(vocals_data[:CHUNK_SIZE])
+            vocals_data = vocals_data[CHUNK_SIZE:]
+    # Stop streams
+    stream.stop_stream()
+    stream.close()
+    playback_stream.stop_stream()
+    playback_stream.close()
+    # Terminate PyAudio object
+    p.terminate()
+    # Now 'processed_file' contains the separated vocals
+    separated_audio = vocals_data
    # separate music and vocal
+    #separator = Separator('spleeter:2stems')
    #separator.separate_to_file(input_file, output_file)
+    #separated_audio = separator.separate(input_file)
    # Crop the audio
     start_time = 60000  # e.g. 30 seconds, 30000