Spaces:

turing-usp
/

AlanVideos

Running

App Files Files Community

turing-usp commited on May 7

Commit

11d1dcc

•

1 Parent(s): 6ef657d

Update app.py

Browse files

Files changed (1) hide show

app.py +13 -13

app.py CHANGED Viewed

@@ -21,13 +21,12 @@ from langchain.chat_models import ChatOpenAI
 from langchain.memory import ConversationBufferWindowMemory
 from langchain.chains import ConversationalRetrievalChain
 from langchain.callbacks import get_openai_callback
 from langchain import PromptTemplate
 from langchain import LLMChain
 import monkey_patch     # OBS: esse arquivo evita um bug frequente do pytube
 from pytube import YouTube
-openai_api_key = os.getenv("openai_api_key")
   # Criando a função que corta o texto em chunks:
@@ -51,12 +50,12 @@ def get_vectorstore(chunks):
   # Criando a função para converter o vídeo para o formato adequado:
 @st.cache_data
-def convert_mp4_to_wav(mp4_file, wav_file):
     """Função que converte um arquivo de vídeo no formato MP4 para um arquivo de
     áudio no formato WAV a partir das seguintes entradas: o caminho do arquivo
     de vídeo no formato MP4 que se deseja converter; o caminho onde o arquivo
     de áudio WAV resultante será salvo. Nenhuma saída explícita é retornada."""
-    video = AudioFileClip(mp4_file)
     video.write_audiofile(wav_file)
   # Criando a função que gera a transcrição:
@@ -68,13 +67,15 @@ def get_transcriptions(url):
     dicionario = {}
       # Baixando o áudio:
     youtube_content = YouTube(url)
-    audio_streams = youtube_content.streams.filter(only_audio=True)
-    audio_streams[0].download()
     title = youtube_content.title
       # Convertendo para Wav:
-    mp4_file = '/content/'+''.join(char for char in title if char not in string.punctuation.replace('/', '').replace('-', '').replace('!', '').replace('(', '').replace(')', ''))+'.mp4'
-    wav_file = '/content/'+''.join(char for char in title if char not in string.punctuation.replace('/', '').replace('-', '').replace('!', '').replace('(', '').replace(')', ''))+'.wav'
-    convert_mp4_to_wav(mp4_file, wav_file)
       # Inicializando o reconhecedor de fala:
     r = sr.Recognizer()
       # Carregando o áudio gravado pelo Whisper em um objeto de áudio:
@@ -138,7 +139,7 @@ def get_correction(transcription):
   # Criando o chatbot
 def alan_videos(vectorstore):
-    """ Função que inicializa e configura um LLM da OpenAI
     e retorna um chatbot configurado pronto para uso. """
     memory = ConversationBufferWindowMemory(memory_key='chat_history', return_messages=True, k=3)
     LLM = ChatOpenAI(openai_api_key=openai_api_key, temperature=0.25, model_name="gpt-3.5-turbo")
@@ -148,7 +149,7 @@ def alan_videos(vectorstore):
   # Criando um modelo de chat:
 def chat(pergunta):
-    """ Função que processa uma pergunta utilizando o chatbot
     configurado (alan_videos) e retorna sua resposta. """
     with get_openai_callback() as cb:
         resposta = st.session_state.alanvideos.invoke({"question": pergunta})
@@ -171,7 +172,6 @@ icon = Image.open("Traçado laranja #f1863d.png")
 st.set_page_config(page_title="AlanVideos", page_icon=icon, layout="wide", initial_sidebar_state="auto")
   # Configurando o site:
 def main():
     local_css("style.css")

 from langchain.memory import ConversationBufferWindowMemory
 from langchain.chains import ConversationalRetrievalChain
 from langchain.callbacks import get_openai_callback
+from key import openai_api_key
 from langchain import PromptTemplate
 from langchain import LLMChain
 import monkey_patch     # OBS: esse arquivo evita um bug frequente do pytube
 from pytube import YouTube
+os.environ['OPENAI_API_KEY'] = openai_api_key
   # Criando a função que corta o texto em chunks:
   # Criando a função para converter o vídeo para o formato adequado:
 @st.cache_data
+def convert_mp4_to_wav(mp3_file, wav_file):
     """Função que converte um arquivo de vídeo no formato MP4 para um arquivo de
     áudio no formato WAV a partir das seguintes entradas: o caminho do arquivo
     de vídeo no formato MP4 que se deseja converter; o caminho onde o arquivo
     de áudio WAV resultante será salvo. Nenhuma saída explícita é retornada."""
+    video = AudioFileClip(mp3_file)
     video.write_audiofile(wav_file)
   # Criando a função que gera a transcrição:
     dicionario = {}
       # Baixando o áudio:
     youtube_content = YouTube(url)
     title = youtube_content.title
+    title = re.sub('[^A-z0-9 -]', '', title).replace(" ", " ")
+    audio_streams = youtube_content.streams.filter(only_audio=True)
+    audio_streams[0].download(filename=f"{title}.mp3")
       # Convertendo para Wav:
+    cwd = os.getcwd()
+    mp3_file = os.path.join(cwd, f"{title}.mp3")
+    wav_file = os.path.join(cwd, f"{title}.wav")
+    convert_mp4_to_wav(mp3_file, wav_file)
       # Inicializando o reconhecedor de fala:
     r = sr.Recognizer()
       # Carregando o áudio gravado pelo Whisper em um objeto de áudio:
   # Criando o chatbot
 def alan_videos(vectorstore):
+    """ Função que inicializa e configura um LLM da OpenAI
     e retorna um chatbot configurado pronto para uso. """
     memory = ConversationBufferWindowMemory(memory_key='chat_history', return_messages=True, k=3)
     LLM = ChatOpenAI(openai_api_key=openai_api_key, temperature=0.25, model_name="gpt-3.5-turbo")
   # Criando um modelo de chat:
 def chat(pergunta):
+    """ Função que processa uma pergunta utilizando o chatbot
     configurado (alan_videos) e retorna sua resposta. """
     with get_openai_callback() as cb:
         resposta = st.session_state.alanvideos.invoke({"question": pergunta})
 st.set_page_config(page_title="AlanVideos", page_icon=icon, layout="wide", initial_sidebar_state="auto")
   # Configurando o site:
 def main():
     local_css("style.css")