Spaces:

SAAZIZI
/

SummarizeAV

Runtime error

SummarizeAV / app.py

aazizisoufiane

format scripts

a9a8aac over 1 year ago

7.83 kB

	import os

	import openai
	import streamlit as st
	from streamlit_chat import message

	from config import output_path_video, output_path_transcription
	from keyword_retriever.keyword_retreiver import MediaRetriever
	from logger import logger
	from resource_loader.uploaded_media_loader import UploadedMediaLoader
	from resource_loader.youtube_loader import YouTubeLoader
	from summarization_service.summarizer import TranscriptSummary
	from utils import check_file_exists, download_video, transcribe_video, load_transcription

	st.set_page_config(page_title="Summary", layout="wide")

	# Initialize chat history
	chat_history = []

	# Initialize variables for LLM options and chosen LLM
	llm_options = []
	chosen_LLM = "default"


	def generate_response(prompt_input):
	answer = transcript_summary.query_summary(prompt_input)
	return answer


	@st.cache_resource()
	def factory_transcript(media_id, model, llm_provider):
	ts = TranscriptSummary(doc_id=media_id, model=model, llm_provider=llm_provider)
	logger.info("TranscriptSummary initialized")
	return ts


	@st.cache_resource()
	def factory_media(media_id, top_k):
	retriever = MediaRetriever(media_id=media_id, similarity_top_k=top_k)
	logger.info("video_retriever initialized")
	return retriever


	with st.sidebar:
	# Sidebar
	st.title("Controls")
	# Create a sidebar for the YouTube URL, search bar, and settings
	youtube_url = st.text_input("Enter YouTube URL:")
	uploaded_file = st.file_uploader("Or upload a video...",
	type=['mp4', 'mov', 'avi', 'flv', 'mkv', 'mp3', 'wav', 'aac', 'ogg'])

	if uploaded_file is not None:
	file_extension = uploaded_file.name.split('.')[-1]

	if file_extension in ['mp4', 'mov', 'avi', 'flv', 'mkv']:
	media_type = 'video'
	elif file_extension in ['mp3', 'wav', 'aac', 'ogg']:
	media_type = 'audio'
	else:
	media_type = 'unknown'

	media_loader = UploadedMediaLoader(uploaded_file, uploaded_file.name, media_type=media_type)

	elif youtube_url:
	media_loader = YouTubeLoader(youtube_url, output_path_video)

	similarity_top_k = st.number_input("Maximum Number of Results to Display", min_value=1, max_value=100, value=10)

	# Selecting the provider
	chosen_provider = st.selectbox("Choose Provider", ["OpenAI", "Replicate", "Default"])

	# Based on provider, display relevant LLMs
	if chosen_provider == "OpenAI":
	llm_options = ["gpt-3.5-turbo-0301", "gpt-3.5-turbo-16k", "gpt-4", "gpt-4-32k-0314"]
	elif chosen_provider == "Replicate":
	llm_options = ["mistralai/mistral-7b-v0.1:3e8a0fb6d7812ce30701ba597e5080689bef8a013e5c6a724fafb108cc2426a0",
	"mistralai/mistral-7b-instruct-v0.1:83b6a56e7c828e667f21fd596c338fd4f0039b46bcfa18d973e8e70e455fda70",
	"joehoover/zephyr-7b-alpha:14ec63365a1141134c41b652fe798633f48b1fd28b356725c4d8842a0ac151ee",
	"meta/llama-2-13b-chat:f4e2de70d66816a838a89eeeb621910adffb0dd0baba3976c96980970978018d",
	"meta/llama-2-70b-chat:02e509c789964a7ea8736978a43525956ef40397be9033abf9fd2badfe68c9e3",
	"meta/llama-2-7b-chat:8e6975e5ed6174911a6ff3d60540dfd4844201974602551e10e9e87ab143d81e", ]
	else:
	llm_options = ["default"]

	# Allow users to type a custom LLM or choose from list
	chosen_LLM = st.selectbox("Type or Choose Language Model", llm_options)

	api_key = st.text_input("OpenAI API Key", type="password")

	if api_key and chosen_provider == "OpenAI":
	logger.info("OpenAI API KEY")
	try:
	openai.api_key = api_key
	except:
	st.sidebar.write("Incorrect API key provided")
	elif api_key and chosen_provider == "Replicate":
	logger.info("Replicate API KEY")

	os.environ['REPLICATE_API_TOKEN'] = api_key
	else:
	chosen_LLM = "default"
	chosen_provider = "Default"

	if youtube_url or uploaded_file:
	video_file_path = os.path.join(output_path_video, f"{media_loader.media_id}.mp3")
	transcription_file_path = os.path.join(output_path_transcription, f"{media_loader.media_id}.json")

	if not check_file_exists(video_file_path):
	download_video(media_loader)
	else:
	logger.info(f"Video already downloaded: {video_file_path}")
	if not check_file_exists(transcription_file_path):
	transcribe_video(media_loader, output_path_video, output_path_transcription)
	else:
	logger.info(f"Transcription already exists: {transcription_file_path}")

	video_retriever = factory_media(media_loader.media_id, top_k=int(similarity_top_k))
	transcript_summary = factory_transcript(media_loader.media_id, model=chosen_LLM, llm_provider=chosen_provider)

	docs = load_transcription(media_loader, output_path_transcription)

	col2, col3 = st.columns([3, 1])

	# Main Content - Middle Section
	video_slot = col2.empty()

	with col2:
	if isinstance(media_loader, UploadedMediaLoader):
	video_slot.video(uploaded_file)

	elif isinstance(media_loader, YouTubeLoader):
	video_slot.video(youtube_url)

	st.title("Summary")
	# Display summary here
	st.write(transcript_summary.get_document_summary())
	# Initialize session_state for chat history if it doesn't exist
	if 'chat_history' not in st.session_state:
	st.session_state.chat_history = []

	# Main Content - Bottom Section for Chat
	st.title("Ask me")
	with col3:
	user_input = st.text_input("Search:")
	if user_input:

	if isinstance(media_loader, UploadedMediaLoader):
	video_slot.video(uploaded_file)
	elif isinstance(media_loader, YouTubeLoader):
	video_slot.video(youtube_url)

	raw_results = video_retriever.search(user_input)
	for i, result in enumerate(raw_results):
	text_content = result.node.text
	start_time = int(result.node.metadata['start'])

	full_youtube_url = f"{youtube_url}&t={start_time}s"

	if st.button(text_content, key=f"button_{i}"):
	st.session_state.current_video = full_youtube_url
	if isinstance(media_loader, UploadedMediaLoader):
	video_slot.video(uploaded_file, start_time=start_time)

	elif isinstance(media_loader, YouTubeLoader):
	video_slot.video(youtube_url, start_time=start_time)

	with col2:
	chat_placeholder = st.empty()


	def on_btn_click():
	del st.session_state.past[:]
	del st.session_state.generated[:]


	def on_input_change():
	user_input = st.session_state.user_input
	st.session_state.past.append(user_input)

	# Generate response only for the latest input
	latest_response = generate_response(st.session_state['past'][-1])

	st.session_state.generated.append(latest_response)
	st.session_state.user_input = "" # This will empty the "User Input:" text box


	if 'generated' not in st.session_state:
	st.session_state['generated'] = []
	if 'past' not in st.session_state:
	st.session_state['past'] = []

	with chat_placeholder.container():
	for i in range(len(st.session_state['generated'])):
	message(st.session_state['past'][i], is_user=True, key=f"{i}_user")

	# Displaying generated message
	message(st.session_state['generated'][i], key=f"{i}", allow_html=True, is_table=False)
	st.button("Clear message", on_click=on_btn_click)

	with st.container():
	st.text_input("User Input:", on_change=on_input_change, key="user_input")