Spaces:

Alesmikes
/

audio2

Runtime error

Alesmikes commited on Jan 13

Commit

addeef6

•

1 Parent(s): 50b6c02

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -1,34 +1,37 @@
-import gradio as gr
-from transformers import Wav2Vec2ForCTC, Wav2Vec2Tokenizer
-# Nastavení modelu pro transkripci
-model_name = "facebook/wav2vec2-base-960h"
-def transcribe(audio_file):
-    """
-    Transkribuje audio soubor pomocí Wav2Vec2 modelu.
-    """
-    # Načtení modelu a tokenizeru
-    model = Wav2Vec2ForCTC.from_pretrained(model_name)
-    tokenizer = Wav2Vec2Tokenizer.from_pretrained(model_name)
-    # Převedení audio souboru na tokeny
-    input_values = tokenizer(audio_file, return_tensors="pt").input_values
-    # Transkripce audia
-    with gr.no_logging():
-        with gr.no_progress():
-            transcript = model(input_values).logits.argmax(dim=-1)
-    # Převedení výsledku na text
-    transcription = tokenizer.batch_decode(transcript)
-    return transcription[0]
-iface = gr.Interface(
-    fn=transcribe,
-    inputs=gr.inputs.Audio(source="microphone", type="file"),
-    outputs="text"
-)
-iface.launch()

+import pyaudio
+import wave
+# Nastavení parametrů nahrávání
+FORMAT = pyaudio.paInt16  # Formát zvuku
+CHANNELS = 1  # Počet kanálů (mono)
+RATE = 44100  # Vzorkovací frekvence (Hz)
+CHUNK = 1024  # Velikost bloku dat
+RECORD_SECONDS = 5  # Délka nahrávky (v sekundách)
+WAVE_OUTPUT_FILENAME = "sample1.wav"  # Název výstupního zvukového souboru
+audio = pyaudio.PyAudio()
+# Nahrávání zvuku z mikrofonu
+stream = audio.open(format=FORMAT, channels=CHANNELS,
+                    rate=RATE, input=True,
+                    frames_per_buffer=CHUNK)
+print("Nahrávám...")
+frames = []
+for i in range(0, int(RATE / CHUNK * RECORD_SECONDS)):
+    data = stream.read(CHUNK)
+    frames.append(data)
+print("Nahrávání dokončeno")
+# Uložení nahrávky do WAV souboru
+with wave.open(WAVE_OUTPUT_FILENAME, 'wb') as wf:
+    wf.setnchannels(CHANNELS)
+    wf.setsampwidth(audio.get_sample_size(FORMAT))
+    wf.setframerate(RATE)
+    wf.writeframes(b''.join(frames))
+stream.stop_stream()
+stream.close()
+audio.terminate()