lgsantini1 commited on
Commit
cc7d6c2
·
verified ·
1 Parent(s): 2103e5e

Update app.py

Browse files
Files changed (1) hide show
  1. app.py +22 -22
app.py CHANGED
@@ -1,38 +1,38 @@
1
  import re
2
- import gradio as gr
3
  from youtube_transcript_api import YouTubeTranscriptApi
4
 
 
5
  def extract_video_id(youtube_url):
6
- # Regex para extrair o ID do vídeo da URL do YouTube
7
  match = re.search(r'(?:youtu\.be\/|(?:www\.)?youtube\.com\/(?:watch\?v=|embed\/|v\/|.+\?v=))([^&]{11})', youtube_url)
8
  return match.group(1) if match else None
9
 
 
10
  def get_transcript(video_id, language="en"):
11
  try:
12
  transcript = YouTubeTranscriptApi.get_transcript(video_id, languages=[language])
 
13
  return "\n".join([f"{t['start']}: {t['text']}" for t in transcript])
14
  except Exception as e:
15
  return f"Erro ao obter transcrição: {str(e)}"
16
 
17
- # Função que combina a extração do ID e a obtenção da transcrição
18
- def gradio_interface(youtube_url, language):
19
- video_id = extract_video_id(youtube_url)
20
- if not video_id:
21
- return "Erro: URL inválida. Por favor, insira um link válido do YouTube."
22
-
23
- return get_transcript(video_id, language)
24
 
25
- # Criação da interface Gradio
26
- iface = gr.Interface(
27
- fn=gradio_interface,
28
- inputs=[
29
- gr.Textbox(label="URL do Vídeo (YouTube)", placeholder="Ex: https://www.youtube.com/watch?v=tl1jHm0qC_4"),
30
- gr.Dropdown(label="Idioma", choices=["en", "pt", "es", "fr"], value="en")
31
- ],
32
- outputs="text",
33
- title="Obter Transcrição de Vídeos do YouTube",
34
- description="Insira a URL de um vídeo do YouTube e selecione o idioma da transcrição."
35
- )
36
 
37
- # Execução da interface Gradio
38
- iface.launch()
 
 
 
 
 
 
 
 
1
  import re
2
+ import streamlit as st
3
  from youtube_transcript_api import YouTubeTranscriptApi
4
 
5
+ # Função para extrair o ID do vídeo do YouTube
6
  def extract_video_id(youtube_url):
7
+ # Regex para extrair o ID do vídeo
8
  match = re.search(r'(?:youtu\.be\/|(?:www\.)?youtube\.com\/(?:watch\?v=|embed\/|v\/|.+\?v=))([^&]{11})', youtube_url)
9
  return match.group(1) if match else None
10
 
11
+ # Função para obter a transcrição do vídeo
12
  def get_transcript(video_id, language="en"):
13
  try:
14
  transcript = YouTubeTranscriptApi.get_transcript(video_id, languages=[language])
15
+ # Formata a transcrição em texto legível
16
  return "\n".join([f"{t['start']}: {t['text']}" for t in transcript])
17
  except Exception as e:
18
  return f"Erro ao obter transcrição: {str(e)}"
19
 
20
+ # Configuração do Streamlit
21
+ st.title("Obter Transcrição de Vídeos do YouTube")
22
+ st.write("Insira a URL de um vídeo do YouTube e selecione o idioma para obter a transcrição (se disponível).")
23
+
24
+ # Entrada da URL do vídeo
25
+ youtube_url = st.text_input("URL do Vídeo (YouTube)", placeholder="Ex: https://www.youtube.com/watch?v=tl1jHm0qC_4")
 
26
 
27
+ # Seleção do idioma
28
+ language = st.selectbox("Idioma da Transcrição", ["en", "pt", "es", "fr"], index=0)
 
 
 
 
 
 
 
 
 
29
 
30
+ # Botão para processar
31
+ if st.button("Obter Transcrição"):
32
+ # Validação da URL e obtenção da transcrição
33
+ video_id = extract_video_id(youtube_url)
34
+ if not video_id:
35
+ st.error("Erro: URL inválida. Por favor, insira um link válido do YouTube.")
36
+ else:
37
+ transcript = get_transcript(video_id, language)
38
+ st.text_area("Transcrição", value=transcript, height=400)