https://www.youtube.com/watch?v=7K4b2S7X99w https://github.com/ikequan/meta-mms #Github proyecto https://github.com/AYTECOL/traductor-multilenguaje.git #Las librerias se instalan en: C:\Users\jorge\AppData\Local\Programs\Python\Python311\Scripts # Salida de Audio de video C:\Users\jorge\AppData\Local\Temp\gradio\04300dd9108b391bd8a7984ab530b47d54bfec91\ #Lenguajes soportados: https://github.com/wannaphong/ttsmms/blob/main/support_list.txt # Descargar e instalar Phyton si no está instalado Instalar en C:\Users\jorge\AppData\Local\Programs\Python\Python311\ Pasar al directorio \Scripts para que tome el comando .\pip # Comprobar la instalacion de PIP: .\pip help # Si PIP no está instalado descargarlo de: curl https://bootstrap.pypa.io/get-pip.py -o get-pip.py # Instalar PIP, pasar a la carpeta donde se descargó el archivo get-pip.py: py get-pip.py # Agregar el PATH de la instalación en las variables de entorno y colocarlo al inicio de la lista # Si no está instalado Microsoft Visual C++ 14.0 or greater instalarlo de: https://visualstudio.microsoft.com/visual-cpp-build-tools/ seleccionando las utilidades para desktop windows # Instalar transformers: .\pip install torch datasets[audio] .\pip install --upgrade transformers # Instalar los complementos necesarios para la aplicación: .\pip install gradio SpeechRecognition ttsmms deep_translator # instalar ffmpeg mediante cmd como administrador: choco install ffmpeg # Comprobar ISO de idiomas disponibles: https://dl.fbaipublicfiles.com/mms/tts/all-tts-languages.html # descargar los idiomas a soportar cambiando el ISO del idioma correspondiente: https://dl.fbaipublicfiles.com/mms/tts/full_model/eng.tar.gz #Inglés (eng) https://dl.fbaipublicfiles.com/mms/tts/full_model/spa.tar.gz #Español (spa) https://dl.fbaipublicfiles.com/mms/tts/full_model/gum.tar.gz #Misak (gum) https://dl.fbaipublicfiles.com/mms/tts/full_model/quz.tar.gz #Quechua Cuzco (quz)   # crear carpeta "data" y descomprimir ahi los lenguajes dentro del proyecto: /meta-mms/data/spa/ /meta-mms/data/eng/ # Comandos procesamiento de Audio y Video # extraer audio de un video ffmpeg -y -i input.mp4 -ar 16000 -ac 1 output_audio.wav # dejar un video sin audio ffmpeg -y -i input.mp4 -t 43 output_muted.webm ffmpeg -y -i input.mp4 -shortest output_muted.webm # unir audio con video ffmpeg -y -i input.mp4 -i audio.wav -an output_muted.webm # subtitulos ffmpeg -y -copyts -i input.webm -vf subtitles=subtitle.srt output_srt.webm ffmpeg -y -copyts -i noticias_caracol_tv.mp4 -vf subtitles=noticias_caracol_tv_subtitles.srt output_srt.webm # Para ejecutar la aplicación: py app.py