llama-3.2-3b-voice

Runtime error

App Files Files Community

yadongxie commited on Sep 28

Commit

b911576

•

1 Parent(s): 30d4448

chore: remove pause detect

Browse files

Files changed (1) hide show

app.py +1 -29

app.py CHANGED Viewed

@@ -11,18 +11,14 @@ import base64
 import uuid
 import os
-print(os.getenv("API_KEY"))
 @dataclass
 class AppState:
     stream: np.ndarray | None = None
     sampling_rate: int = 0
-    pause_detected: bool = False
     conversation: list = field(default_factory=list)
     client: openai.OpenAI = None
     output_format: str = "mp3"
-    stopped: bool = False
 # Global lock for thread safety
@@ -44,23 +40,6 @@ def test_api_key(client):
         raise e
-def determine_pause(audio, sampling_rate, state):
-    # Take the last 1 second of audio
-    pause_length = int(sampling_rate * 1)  # 1 second
-    if len(audio) < pause_length:
-        return False
-    last_audio = audio[-pause_length:]
-    amplitude = np.abs(last_audio)
-    # Calculate the average amplitude in the last 1 second
-    avg_amplitude = np.mean(amplitude)
-    silence_threshold = 0.01  # Adjust this threshold as needed
-    if avg_amplitude < silence_threshold:
-        return True
-    else:
-        return False
 def process_audio(audio: tuple, state: AppState):
     if state.stream is None:
         state.stream = audio[1]
@@ -68,13 +47,7 @@ def process_audio(audio: tuple, state: AppState):
     else:
         state.stream = np.concatenate((state.stream, audio[1]))
-    pause_detected = determine_pause(state.stream, state.sampling_rate, state)
-    state.pause_detected = pause_detected
-    if state.pause_detected:
-        return gr.Audio(recording=False), state
-    else:
-        return None, state
 def update_or_append_conversation(conversation, id, role, new_content):
@@ -169,7 +142,6 @@ def response(state: AppState):
     # Reset the audio stream for the next interaction
     state.stream = None
-    state.pause_detected = False
 def set_api_key(api_key, state):

 import uuid
 import os
 @dataclass
 class AppState:
     stream: np.ndarray | None = None
     sampling_rate: int = 0
     conversation: list = field(default_factory=list)
     client: openai.OpenAI = None
     output_format: str = "mp3"
 # Global lock for thread safety
         raise e
 def process_audio(audio: tuple, state: AppState):
     if state.stream is None:
         state.stream = audio[1]
     else:
         state.stream = np.concatenate((state.stream, audio[1]))
+    return None, state
 def update_or_append_conversation(conversation, id, role, new_content):
     # Reset the audio stream for the next interaction
     state.stream = None
 def set_api_key(api_key, state):