Spaces:

mrblackdev
/

SubSync

Build error

App Files Files Community

mrblackdev commited on Oct 31, 2024

Commit

170db39

verified ·

1 Parent(s): c598cb8

Update app.py

Browse files

Files changed (1) hide show

app.py +13 -43

app.py CHANGED Viewed

@@ -1,37 +1,25 @@
-import sounddevice as sd
 import numpy as np
 import torchaudio
 import gradio as gr
-from scipy.io.wavfile import write
 import noisereduce as nr
 import torch
 from torchaudio.pipelines import WAV2VEC2_ASR_BASE_960H
 from datetime import timedelta
-# Configuración
-duration = 5  # Duración de la grabación en segundos
-sample_rate = 44100  # Frecuencia de muestreo
 # Cargar el modelo de transcripción de voz
 bundle = WAV2VEC2_ASR_BASE_960H
 asr_model = bundle.get_model()
 labels = bundle.get_labels()
-def record_audio():
-    # Grabar audio
-    print("Grabando...")
-    audio = sd.rec(int(duration * sample_rate), samplerate=sample_rate, channels=1, dtype='float64')
-    sd.wait()  # Esperar a que termine la grabación
-    print("Grabación terminada.")
-    # Guardar como archivo WAV
-    write('recorded_audio.wav', sample_rate, audio)
-    return 'recorded_audio.wav'
 def transcribe_audio(file):
-    # Cargar el audio grabado
-    waveform, sample_rate = torchaudio.load(file)
     # Reducir el ruido
     reduced_noise = nr.reduce_noise(y=waveform.numpy()[0], sr=sample_rate)
@@ -58,7 +46,6 @@ def transcribe_audio(file):
 def format_as_srt(transcription):
     # Dividir la transcripción en partes de ejemplo para los subtítulos
-    # Esto puede ajustarse según sea necesario para definir la duración de los subtítulos
     words = transcription.split()
     srt_output = []
     start_time = 0
@@ -75,10 +62,9 @@ def format_as_srt(transcription):
     return ''.join(srt_output)
-def process_audio():
-    # Grabar audio y luego transcribir
-    audio_file = record_audio()
-    transcription = transcribe_audio(audio_file)
     srt_content = format_as_srt(transcription)
     # Guardar el contenido SRT en un archivo
@@ -87,29 +73,13 @@ def process_audio():
     return transcription, 'subtitles.srt'
-# Crear ejemplos para la interfaz
-examples = [
-    ["Graba un saludo", "Hola, ¿cómo estás?"],
-    ["Graba una presentación", "Soy un apasionado de la programación."],
-    ["Graba una explicación", "El reconocimiento de voz es fascinante."],
-]
 # Crear la interfaz Gradio
 iface = gr.Interface(
     fn=process_audio,
-    inputs=None,
     outputs=["text", "file"],
     title="🎤 Grabador de Audio y Transcriptor a Subtítulos SRT 📜",
-    description="👋 Bienvenido a nuestra aplicación de grabación y transcripción de audio a subtítulos. Graba tu voz y obtén la transcripción junto con un archivo SRT de subtítulos.",
-    examples=examples,
-    theme="default",
-    layout="vertical",
-    css="""
-    .title { color: #4A90E2; font-weight: bold; }
-    .description { font-size: 16px; color: #555; }
-    .footer { text-align: center; font-size: 12px; color: #777; }
-    """,
 )
 iface.launch()

 import numpy as np
 import torchaudio
 import gradio as gr
+from pydub import AudioSegment
 import noisereduce as nr
 import torch
 from torchaudio.pipelines import WAV2VEC2_ASR_BASE_960H
 from datetime import timedelta
 # Cargar el modelo de transcripción de voz
 bundle = WAV2VEC2_ASR_BASE_960H
 asr_model = bundle.get_model()
 labels = bundle.get_labels()
 def transcribe_audio(file):
+    # Cargar el audio grabado usando pydub
+    audio_segment = AudioSegment.from_file(file)
+    audio_segment = audio_segment.set_frame_rate(16000)  # Cambiar la frecuencia de muestreo a 16 kHz
+    audio_segment.export("temp.wav", format="wav")
+    # Cargar el archivo WAV
+    waveform, sample_rate = torchaudio.load("temp.wav")
     # Reducir el ruido
     reduced_noise = nr.reduce_noise(y=waveform.numpy()[0], sr=sample_rate)
 def format_as_srt(transcription):
     # Dividir la transcripción en partes de ejemplo para los subtítulos
     words = transcription.split()
     srt_output = []
     start_time = 0
     return ''.join(srt_output)
+def process_audio(file):
+    # Transcribir el audio y generar subtítulos
+    transcription = transcribe_audio(file)
     srt_content = format_as_srt(transcription)
     # Guardar el contenido SRT en un archivo
     return transcription, 'subtitles.srt'
 # Crear la interfaz Gradio
 iface = gr.Interface(
     fn=process_audio,
+    inputs="audio",
     outputs=["text", "file"],
     title="🎤 Grabador de Audio y Transcriptor a Subtítulos SRT 📜",
+    description="Graba tu voz y obtén la transcripción junto con un archivo SRT de subtítulos.",
 )
 iface.launch()