Zai

Runtime error

huynhkimthien commited on 12 days ago

Commit

287106c

verified ·

1 Parent(s): 1a94ea5

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -82,15 +82,23 @@ async def voice_chat(request: Request):
     try:
         raw_audio = await request.body()
         sample_rate = 16000
-        audio_np = np.frombuffer(raw_audio, dtype=np.int16)
         # Chuyển thành WAV
         wav_io = io.BytesIO()
-        wav.write(wav_io, sample_rate, audio_np)
         wav_io.seek(0)
         with open("temp_audio.wav", "wb") as f:
-            f.write(wav_io.read())
         # Whisper nhận dạng
         result = whisper_model.transcribe("temp_audio.wav", language="vi")

     try:
         raw_audio = await request.body()
         sample_rate = 16000
+        # Chuyển từ 3 bytes → int32
+        audio_np = np.frombuffer(raw_audio, dtype=np.uint8).reshape(-1, 3)
+        audio_int = (audio_np[:, 0].astype(np.int32) << 16) | \
+            (audio_np[:, 1].astype(np.int32) << 8) | \
+            audio_np[:, 2].astype(np.int32)
+        # Scale về int16 để ghi WAV
+        audio_int16 = (audio_int >> 8).astype(np.int16)
         # Chuyển thành WAV
         wav_io = io.BytesIO()
+        wav.write(wav_io, sample_rate, audio_int16)
         wav_io.seek(0)
         with open("temp_audio.wav", "wb") as f:
+        f.write(wav_io.read())
         # Whisper nhận dạng
         result = whisper_model.transcribe("temp_audio.wav", language="vi")