Spaces:

oceansweep
/

tldw

Sleeping

tldw / App_Function_Libraries /SQLite_DB.py

ed28876 3 months ago

38.9 kB

	# SQLite_DB.py
	#########################################
	# SQLite_DB Library
	# This library is used to perform any/all DB operations related to SQLite.
	#
	####

	####################
	# Function List
	# FIXME - UPDATE Function Arguments
	# 1. get_connection(self)
	# 2. execute_query(self, query: str, params: Tuple = ())
	# 3. create_tables()
	# 4. add_keyword(keyword: str)
	# 5. delete_keyword(keyword: str)
	# 6. add_media_with_keywords(url, title, media_type, content, keywords, prompt, summary, transcription_model, author, ingestion_date)
	# 7. fetch_all_keywords()
	# 8. keywords_browser_interface()
	# 9. display_keywords()
	# 10. export_keywords_to_csv()
	# 11. browse_items(search_query, search_type)
	# 12. fetch_item_details(media_id: int)
	# 13. add_media_version(media_id: int, prompt: str, summary: str)
	# 14. search_db(search_query: str, search_fields: List[str], keywords: str, page: int = 1, results_per_page: int = 10)
	# 15. search_and_display(search_query, search_fields, keywords, page)
	# 16. display_details(index, results)
	# 17. get_details(index, dataframe)
	# 18. format_results(results)
	# 19. export_to_csv(search_query: str, search_fields: List[str], keyword: str, page: int = 1, results_per_file: int = 1000)
	# 20. is_valid_url(url: str) -> bool
	# 21. is_valid_date(date_string: str) -> bool
	# 22. add_media_to_database(url, info_dict, segments, summary, keywords, custom_prompt_input, whisper_model)
	# 23. create_prompts_db()
	# 24. add_prompt(name, details, system, user=None)
	# 25. fetch_prompt_details(name)
	# 26. list_prompts()
	# 27. insert_prompt_to_db(title, description, system_prompt, user_prompt)
	# 28. update_media_content(media_id: int, content: str, prompt: str, summary: str)
	# 29. search_media_database(query: str) -> List[Tuple[int, str, str]]
	# 30. load_media_content(media_id: int)
	# 31.
	# 32.
	#
	#
	#####################
	#
	# Import necessary libraries
	import csv
	import logging
	import os
	import re
	import sqlite3
	import time
	from contextlib import contextmanager
	from datetime import datetime
	from typing import List, Tuple
	# Third-Party Libraries
	import gradio as gr
	import pandas as pd
	# Import Local Libraries
	#
	#######################################################################################################################
	# Function Definitions
	#

	# Set up logging
	#logging.basicConfig(level=logging.INFO, format='%(asctime)s - %(levelname)s - %(message)s')
	#logging.basicConfig(level=logging.DEBUG, format='%(asctime)s - %(levelname)s - %(message)s')
	logger = logging.getLogger(__name__)


	# Custom exceptions
	class DatabaseError(Exception):
	pass


	class InputError(Exception):
	pass


	# Database connection function with connection pooling
	class Database:
	def __init__(self, db_name=None):
	self.db_name = db_name or os.getenv('DB_NAME', 'media_summary.db')
	self.pool = []
	self.pool_size = 10

	@contextmanager
	def get_connection(self):
	retry_count = 5
	retry_delay = 1
	conn = None
	while retry_count > 0:
	try:
	conn = self.pool.pop() if self.pool else sqlite3.connect(self.db_name, check_same_thread=False)
	yield conn
	self.pool.append(conn)
	return
	except sqlite3.OperationalError as e:
	if 'database is locked' in str(e):
	logging.warning(f"Database is locked, retrying in {retry_delay} seconds...")
	retry_count -= 1
	time.sleep(retry_delay)
	else:
	raise DatabaseError(f"Database error: {e}")
	except Exception as e:
	raise DatabaseError(f"Unexpected error: {e}")
	finally:
	# Ensure the connection is returned to the pool even on failure
	if conn:
	self.pool.append(conn)
	raise DatabaseError("Database is locked and retries have been exhausted")

	def execute_query(self, query: str, params: Tuple = ()) -> None:
	with self.get_connection() as conn:
	try:
	cursor = conn.cursor()
	cursor.execute(query, params)
	conn.commit()
	except sqlite3.Error as e:
	raise DatabaseError(f"Database error: {e}, Query: {query}")

	db = Database()


	# Function to create tables with the new media schema
	def create_tables() -> None:
	table_queries = [
	'''
	CREATE TABLE IF NOT EXISTS Media (
	id INTEGER PRIMARY KEY AUTOINCREMENT,
	url TEXT,
	title TEXT NOT NULL,
	type TEXT NOT NULL,
	content TEXT,
	author TEXT,
	ingestion_date TEXT,
	prompt TEXT,
	summary TEXT,
	transcription_model TEXT
	)
	''',
	'''
	CREATE TABLE IF NOT EXISTS Keywords (
	id INTEGER PRIMARY KEY AUTOINCREMENT,
	keyword TEXT NOT NULL UNIQUE
	)
	''',
	'''
	CREATE TABLE IF NOT EXISTS MediaKeywords (
	id INTEGER PRIMARY KEY AUTOINCREMENT,
	media_id INTEGER NOT NULL,
	keyword_id INTEGER NOT NULL,
	FOREIGN KEY (media_id) REFERENCES Media(id),
	FOREIGN KEY (keyword_id) REFERENCES Keywords(id)
	)
	''',
	'''
	CREATE TABLE IF NOT EXISTS MediaVersion (
	id INTEGER PRIMARY KEY AUTOINCREMENT,
	media_id INTEGER NOT NULL,
	version INTEGER NOT NULL,
	prompt TEXT,
	summary TEXT,
	created_at TEXT NOT NULL,
	FOREIGN KEY (media_id) REFERENCES Media(id)
	)
	''',
	'''
	CREATE TABLE IF NOT EXISTS MediaModifications (
	id INTEGER PRIMARY KEY AUTOINCREMENT,
	media_id INTEGER NOT NULL,
	prompt TEXT,
	summary TEXT,
	modification_date TEXT,
	FOREIGN KEY (media_id) REFERENCES Media(id)
	)
	''',
	'''
	CREATE VIRTUAL TABLE IF NOT EXISTS media_fts USING fts5(title, content);
	''',
	'''
	CREATE VIRTUAL TABLE IF NOT EXISTS keyword_fts USING fts5(keyword);
	''',
	'''
	CREATE INDEX IF NOT EXISTS idx_media_title ON Media(title);
	''',
	'''
	CREATE INDEX IF NOT EXISTS idx_media_type ON Media(type);
	''',
	'''
	CREATE INDEX IF NOT EXISTS idx_media_author ON Media(author);
	''',
	'''
	CREATE INDEX IF NOT EXISTS idx_media_ingestion_date ON Media(ingestion_date);
	''',
	'''
	CREATE INDEX IF NOT EXISTS idx_keywords_keyword ON Keywords(keyword);
	''',
	'''
	CREATE INDEX IF NOT EXISTS idx_mediakeywords_media_id ON MediaKeywords(media_id);
	''',
	'''
	CREATE INDEX IF NOT EXISTS idx_mediakeywords_keyword_id ON MediaKeywords(keyword_id);
	''',
	'''
	CREATE INDEX IF NOT EXISTS idx_media_version_media_id ON MediaVersion(media_id);
	''',
	'''
	CREATE INDEX IF NOT EXISTS idx_mediamodifications_media_id ON MediaModifications(media_id);
	''',
	'''
	CREATE UNIQUE INDEX IF NOT EXISTS idx_unique_media_url ON Media(url);
	''',
	'''
	CREATE UNIQUE INDEX IF NOT EXISTS idx_unique_media_keyword ON MediaKeywords(media_id, keyword_id);
	'''
	]
	for query in table_queries:
	db.execute_query(query)

	logging.info("All tables and indexes created successfully.")

	create_tables()


	#######################################################################################################################
	# Keyword-related Functions
	#

	# Function to add a keyword
	def add_keyword(keyword: str) -> int:
	keyword = keyword.strip().lower()
	with db.get_connection() as conn:
	cursor = conn.cursor()
	try:
	cursor.execute('INSERT OR IGNORE INTO Keywords (keyword) VALUES (?)', (keyword,))
	cursor.execute('SELECT id FROM Keywords WHERE keyword = ?', (keyword,))
	keyword_id = cursor.fetchone()[0]
	cursor.execute('INSERT OR IGNORE INTO keyword_fts (rowid, keyword) VALUES (?, ?)', (keyword_id, keyword))
	logging.info(f"Keyword '{keyword}' added to keyword_fts with ID: {keyword_id}")
	conn.commit()
	return keyword_id
	except sqlite3.IntegrityError as e:
	logging.error(f"Integrity error adding keyword: {e}")
	raise DatabaseError(f"Integrity error adding keyword: {e}")
	except sqlite3.Error as e:
	logging.error(f"Error adding keyword: {e}")
	raise DatabaseError(f"Error adding keyword: {e}")


	# Function to delete a keyword
	def delete_keyword(keyword: str) -> str:
	keyword = keyword.strip().lower()
	with db.get_connection() as conn:
	cursor = conn.cursor()
	try:
	cursor.execute('SELECT id FROM Keywords WHERE keyword = ?', (keyword,))
	keyword_id = cursor.fetchone()
	if keyword_id:
	cursor.execute('DELETE FROM Keywords WHERE keyword = ?', (keyword,))
	cursor.execute('DELETE FROM keyword_fts WHERE rowid = ?', (keyword_id[0],))
	conn.commit()
	return f"Keyword '{keyword}' deleted successfully."
	else:
	return f"Keyword '{keyword}' not found."
	except sqlite3.Error as e:
	raise DatabaseError(f"Error deleting keyword: {e}")



	# Function to add media with keywords
	def add_media_with_keywords(url, title, media_type, content, keywords, prompt, summary, transcription_model, author,
	ingestion_date):
	# Set default values for missing fields
	url = url or 'Unknown'
	title = title or 'Untitled'
	media_type = media_type or 'Unknown'
	content = content or 'No content available'
	keywords = keywords or 'default'
	prompt = prompt or 'No prompt available'
	summary = summary or 'No summary available'
	transcription_model = transcription_model or 'Unknown'
	author = author or 'Unknown'
	ingestion_date = ingestion_date or datetime.now().strftime('%Y-%m-%d')

	# Ensure URL is valid
	if not is_valid_url(url):
	url = 'localhost'

	if media_type not in ['article', 'audio', 'document', 'obsidian_note', 'podcast', 'text', 'video', 'unknown']:
	raise InputError("Invalid media type. Allowed types: article, audio file, document, obsidian_note podcast, text, video, unknown.")

	if ingestion_date and not is_valid_date(ingestion_date):
	raise InputError("Invalid ingestion date format. Use YYYY-MM-DD.")

	# Handle keywords as either string or list
	if isinstance(keywords, str):
	keyword_list = [keyword.strip().lower() for keyword in keywords.split(',')]
	elif isinstance(keywords, list):
	keyword_list = [keyword.strip().lower() for keyword in keywords]
	else:
	keyword_list = ['default']

	logging.info(f"Adding/updating media: URL={url}, Title={title}, Type={media_type}")
	logging.debug(f"Content (first 500 chars): {content[:500]}...")
	logging.debug(f"Keywords: {keyword_list}")
	logging.info(f"Prompt: {prompt}")
	logging.info(f"Summary: {summary}")
	logging.info(f"Author: {author}")
	logging.info(f"Ingestion Date: {ingestion_date}")
	logging.info(f"Transcription Model: {transcription_model}")

	try:
	with db.get_connection() as conn:
	conn.execute("BEGIN TRANSACTION")
	cursor = conn.cursor()

	# Check if media already exists
	cursor.execute('SELECT id FROM Media WHERE url = ?', (url,))
	existing_media = cursor.fetchone()

	if existing_media:
	media_id = existing_media[0]
	logging.info(f"Updating existing media with ID: {media_id}")

	cursor.execute('''
	UPDATE Media
	SET content = ?, transcription_model = ?, title = ?, type = ?, author = ?, ingestion_date = ?
	WHERE id = ?
	''', (content, transcription_model, title, media_type, author, ingestion_date, media_id))
	else:
	logging.info("Creating new media entry")

	cursor.execute('''
	INSERT INTO Media (url, title, type, content, author, ingestion_date, transcription_model)
	VALUES (?, ?, ?, ?, ?, ?, ?)
	''', (url, title, media_type, content, author, ingestion_date, transcription_model))
	media_id = cursor.lastrowid

	logging.info(f"Adding new modification to MediaModifications for media ID: {media_id}")
	cursor.execute('''
	INSERT INTO MediaModifications (media_id, prompt, summary, modification_date)
	VALUES (?, ?, ?, ?)
	''', (media_id, prompt, summary, ingestion_date))
	logger.info("New modification added to MediaModifications")

	# Insert keywords and associate with media item
	logging.info("Processing keywords")
	for keyword in keyword_list:
	keyword = keyword.strip().lower()
	cursor.execute('INSERT OR IGNORE INTO Keywords (keyword) VALUES (?)', (keyword,))
	cursor.execute('SELECT id FROM Keywords WHERE keyword = ?', (keyword,))
	keyword_id = cursor.fetchone()[0]
	cursor.execute('INSERT OR IGNORE INTO MediaKeywords (media_id, keyword_id) VALUES (?, ?)',
	(media_id, keyword_id))

	# Update full-text search index
	logging.info("Updating full-text search index")
	cursor.execute('INSERT OR REPLACE INTO media_fts (rowid, title, content) VALUES (?, ?, ?)',
	(media_id, title, content))

	logging.info("Adding new media version")
	add_media_version(media_id, prompt, summary)

	conn.commit()
	logging.info(f"Media '{title}' successfully added/updated with ID: {media_id}")

	return f"Media '{title}' added/updated successfully with keywords: {', '.join(keyword_list)}"

	except sqlite3.Error as e:
	conn.rollback()
	logging.error(f"SQL Error: {e}")
	raise DatabaseError(f"Error adding media with keywords: {e}")
	except Exception as e:
	conn.rollback()
	logging.error(f"Unexpected Error: {e}")
	raise DatabaseError(f"Unexpected error: {e}")


	def fetch_all_keywords() -> List[str]:
	try:
	with db.get_connection() as conn:
	cursor = conn.cursor()
	cursor.execute('SELECT keyword FROM Keywords')
	keywords = [row[0] for row in cursor.fetchall()]
	return keywords
	except sqlite3.Error as e:
	raise DatabaseError(f"Error fetching keywords: {e}")

	def keywords_browser_interface():
	keywords = fetch_all_keywords()
	return gr.Markdown("\n".join(f"- {keyword}" for keyword in keywords))

	def display_keywords():
	try:
	keywords = fetch_all_keywords()
	return "\n".join(keywords) if keywords else "No keywords found."
	except DatabaseError as e:
	return str(e)


	def export_keywords_to_csv():
	try:
	keywords = fetch_all_keywords()
	if not keywords:
	return None, "No keywords found in the database."

	filename = "keywords.csv"
	with open(filename, 'w', newline='', encoding='utf-8') as file:
	writer = csv.writer(file)
	writer.writerow(["Keyword"])
	for keyword in keywords:
	writer.writerow([keyword])

	return filename, f"Keywords exported to {filename}"
	except Exception as e:
	logger.error(f"Error exporting keywords to CSV: {e}")
	return None, f"Error exporting keywords: {e}"


	# Function to fetch items based on search query and type
	def browse_items(search_query, search_type):
	try:
	with db.get_connection() as conn:
	cursor = conn.cursor()
	if search_type == 'Title':
	cursor.execute("SELECT id, title, url FROM Media WHERE title LIKE ?", (f'%{search_query}%',))
	elif search_type == 'URL':
	cursor.execute("SELECT id, title, url FROM Media WHERE url LIKE ?", (f'%{search_query}%',))
	results = cursor.fetchall()
	return results
	except sqlite3.Error as e:
	raise Exception(f"Error fetching items by {search_type}: {e}")


	# Function to fetch item details
	def fetch_item_details(media_id: int):
	try:
	with db.get_connection() as conn:
	cursor = conn.cursor()
	cursor.execute("""
	SELECT prompt, summary
	FROM MediaModifications
	WHERE media_id = ?
	ORDER BY modification_date DESC
	LIMIT 1
	""", (media_id,))
	prompt_summary_result = cursor.fetchone()
	cursor.execute("SELECT content FROM Media WHERE id = ?", (media_id,))
	content_result = cursor.fetchone()

	prompt = prompt_summary_result[0] if prompt_summary_result else ""
	summary = prompt_summary_result[1] if prompt_summary_result else ""
	content = content_result[0] if content_result else ""

	return content, prompt, summary
	except sqlite3.Error as e:
	logging.error(f"Error fetching item details: {e}")
	return "", "", "" # Return empty strings if there's an error

	#
	#
	#######################################################################################################################




	# Function to add a version of a prompt and summary
	def add_media_version(media_id: int, prompt: str, summary: str) -> None:
	try:
	with db.get_connection() as conn:
	cursor = conn.cursor()

	# Get the current version number
	cursor.execute('SELECT MAX(version) FROM MediaVersion WHERE media_id = ?', (media_id,))
	current_version = cursor.fetchone()[0] or 0

	# Insert the new version
	cursor.execute('''
	INSERT INTO MediaVersion (media_id, version, prompt, summary, created_at)
	VALUES (?, ?, ?, ?, ?)
	''', (media_id, current_version + 1, prompt, summary, datetime.now().strftime('%Y-%m-%d %H:%M:%S')))
	conn.commit()
	except sqlite3.Error as e:
	raise DatabaseError(f"Error adding media version: {e}")


	# Function to search the database with advanced options, including keyword search and full-text search
	def search_db(search_query: str, search_fields: List[str], keywords: str, page: int = 1, results_per_page: int = 10):
	if page < 1:
	raise ValueError("Page number must be 1 or greater.")

	# Prepare keywords by splitting and trimming
	keywords = [keyword.strip().lower() for keyword in keywords.split(',') if keyword.strip()]

	with db.get_connection() as conn:
	cursor = conn.cursor()
	offset = (page - 1) * results_per_page

	# Prepare the search conditions for general fields
	search_conditions = []
	params = []

	for field in search_fields:
	if search_query: # Ensure there's a search query before adding this condition
	search_conditions.append(f"Media.{field} LIKE ?")
	params.append(f'%{search_query}%')

	# Prepare the conditions for keywords filtering
	keyword_conditions = []
	for keyword in keywords:
	keyword_conditions.append(
	f"EXISTS (SELECT 1 FROM MediaKeywords mk JOIN Keywords k ON mk.keyword_id = k.id WHERE mk.media_id = Media.id AND k.keyword LIKE ?)")
	params.append(f'%{keyword}%')

	# Combine all conditions
	where_clause = " AND ".join(
	search_conditions + keyword_conditions) if search_conditions or keyword_conditions else "1=1"

	# Complete the query
	query = f'''
	SELECT DISTINCT Media.id, Media.url, Media.title, Media.type, Media.content, Media.author, Media.ingestion_date,
	MediaModifications.prompt, MediaModifications.summary
	FROM Media
	LEFT JOIN MediaModifications ON Media.id = MediaModifications.media_id
	WHERE {where_clause}
	ORDER BY Media.ingestion_date DESC
	LIMIT ? OFFSET ?
	'''
	params.extend([results_per_page, offset])

	cursor.execute(query, params)
	results = cursor.fetchall()

	return results


	# Gradio function to handle user input and display results with pagination, with better feedback
	def search_and_display(search_query, search_fields, keywords, page):
	results = search_db(search_query, search_fields, keywords, page)

	if isinstance(results, pd.DataFrame):
	# Convert DataFrame to a list of tuples or lists
	processed_results = results.values.tolist() # This converts DataFrame rows to lists
	elif isinstance(results, list):
	# Ensure that each element in the list is itself a list or tuple (not a dictionary)
	processed_results = [list(item.values()) if isinstance(item, dict) else item for item in results]
	else:
	raise TypeError("Unsupported data type for results")

	return processed_results


	def display_details(index, results):
	if index is None or results is None:
	return "Please select a result to view details."

	try:
	# Ensure the index is an integer and access the row properly
	index = int(index)
	if isinstance(results, pd.DataFrame):
	if index >= len(results):
	return "Index out of range. Please select a valid index."
	selected_row = results.iloc[index]
	else:
	# If results is not a DataFrame, but a list (assuming list of dicts)
	selected_row = results[index]
	except ValueError:
	return "Index must be an integer."
	except IndexError:
	return "Index out of range. Please select a valid index."

	# Build HTML output safely
	details_html = f"""
	<h3>{selected_row.get('Title', 'No Title')}</h3>
	<p><strong>URL:</strong> {selected_row.get('URL', 'No URL')}</p>
	<p><strong>Type:</strong> {selected_row.get('Type', 'No Type')}</p>
	<p><strong>Author:</strong> {selected_row.get('Author', 'No Author')}</p>
	<p><strong>Ingestion Date:</strong> {selected_row.get('Ingestion Date', 'No Date')}</p>
	<p><strong>Prompt:</strong> {selected_row.get('Prompt', 'No Prompt')}</p>
	<p><strong>Summary:</strong> {selected_row.get('Summary', 'No Summary')}</p>
	<p><strong>Content:</strong> {selected_row.get('Content', 'No Content')}</p>
	"""
	return details_html


	def get_details(index, dataframe):
	if index is None or dataframe is None or index >= len(dataframe):
	return "Please select a result to view details."
	row = dataframe.iloc[index]
	details = f"""
	<h3>{row['Title']}</h3>
	<p><strong>URL:</strong> {row['URL']}</p>
	<p><strong>Type:</strong> {row['Type']}</p>
	<p><strong>Author:</strong> {row['Author']}</p>
	<p><strong>Ingestion Date:</strong> {row['Ingestion Date']}</p>
	<p><strong>Prompt:</strong> {row['Prompt']}</p>
	<p><strong>Summary:</strong> {row['Summary']}</p>
	<p><strong>Content:</strong></p>
	<pre>{row['Content']}</pre>
	"""
	return details


	def format_results(results):
	if not results:
	return pd.DataFrame(columns=['URL', 'Title', 'Type', 'Content', 'Author', 'Ingestion Date', 'Prompt', 'Summary'])

	df = pd.DataFrame(results, columns=['URL', 'Title', 'Type', 'Content', 'Author', 'Ingestion Date', 'Prompt', 'Summary'])
	logging.debug(f"Formatted DataFrame: {df}")

	return df


	# Function to export search results to CSV or markdown with pagination
	def export_to_file(search_query: str, search_fields: List[str], keyword: str, page: int = 1, results_per_file: int = 1000, export_format: str = 'csv'):
	try:
	results = search_db(search_query, search_fields, keyword, page, results_per_file)
	if not results:
	return "No results found to export."

	# Create an 'exports' directory if it doesn't exist
	if not os.path.exists('exports'):
	os.makedirs('exports')

	if export_format == 'csv':
	filename = f'exports/search_results_page_{page}.csv'
	with open(filename, 'w', newline='', encoding='utf-8') as file:
	writer = csv.writer(file)
	writer.writerow(['URL', 'Title', 'Type', 'Content', 'Author', 'Ingestion Date', 'Prompt', 'Summary'])
	for row in results:
	writer.writerow(row)
	elif export_format == 'markdown':
	filename = f'exports/search_results_page_{page}.md'
	with open(filename, 'w', encoding='utf-8') as file:
	for item in results:
	markdown_content = convert_to_markdown({
	'title': item[1],
	'url': item[0],
	'type': item[2],
	'content': item[3],
	'author': item[4],
	'ingestion_date': item[5],
	'summary': item[7],
	'keywords': item[8].split(',') if item[8] else []
	})
	file.write(markdown_content)
	file.write("\n---\n\n") # Separator between items
	else:
	return f"Unsupported export format: {export_format}"

	return f"Results exported to {filename}"
	except (DatabaseError, InputError) as e:
	return str(e)


	# Helper function to validate URL format
	def is_valid_url(url: str) -> bool:
	regex = re.compile(
	r'^(?:http\|ftp)s?://' # http:// or https://
	r'(?:(?:[A-Z0-9](?:[A-Z0-9-]{0,61}[A-Z0-9])?\.)+(?:[A-Z]{2,6}\.?\|[A-Z0-9-]{2,}\.?)\|' # domain...
	r'localhost\|' # localhost...
	r'\d{1,3}\.\d{1,3}\.\d{1,3}\.\d{1,3}\|' # ...or ipv4
	r'\[?[A-F0-9]*:[A-F0-9:]+\]?)' # ...or ipv6
	r'(?::\d+)?' # optional port
	r'(?:/?\|[/?]\S+)$', re.IGNORECASE)
	return re.match(regex, url) is not None


	# Helper function to validate date format
	def is_valid_date(date_string: str) -> bool:
	try:
	datetime.strptime(date_string, '%Y-%m-%d')
	return True
	except ValueError:
	return False


	# Add ingested media to DB
	def add_media_to_database(url, info_dict, segments, summary, keywords, custom_prompt_input, whisper_model, media_type='video'):
	try:
	# Extract content from segments
	if isinstance(segments, list):
	content = ' '.join([segment.get('Text', '') for segment in segments if 'Text' in segment])
	elif isinstance(segments, dict):
	content = segments.get('text', '') or segments.get('content', '')
	else:
	content = str(segments)

	logging.debug(f"Extracted content (first 500 chars): {content[:500]}")

	# Set default custom prompt if not provided
	if custom_prompt_input is None:
	custom_prompt_input = """
	You are a bulleted notes specialist. ```When creating comprehensive bulleted notes, you should follow these guidelines: Use multiple headings based on the referenced topics, not categories like quotes or terms. Headings should be surrounded by bold formatting and not be listed as bullet points themselves. Leave no space between headings and their corresponding list items underneath. Important terms within the content should be emphasized by setting them in bold font. Any text that ends with a colon should also be bolded. Before submitting your response, review the instructions, and make any corrections necessary to adhered to the specified format. Do not reference these instructions within the notes.``` \nBased on the content between backticks create comprehensive bulleted notes.
	Bulleted Note Creation Guidelines

	Headings:
	- Based on referenced topics, not categories like quotes or terms
	- Surrounded by bold formatting
	- Not listed as bullet points
	- No space between headings and list items underneath

	Emphasis:
	- Important terms set in bold font
	- Text ending in a colon: also bolded

	Review:
	- Ensure adherence to specified format
	- Do not reference these instructions in your response.</s>[INST] {{ .Prompt }} [/INST]"""

	logging.info(f"Adding media to database: URL={url}, Title={info_dict.get('title', 'Untitled')}, Type={media_type}")

	result = add_media_with_keywords(
	url=url,
	title=info_dict.get('title', 'Untitled'),
	media_type=media_type,
	content=content,
	keywords=','.join(keywords) if isinstance(keywords, list) else keywords,
	prompt=custom_prompt_input or 'No prompt provided',
	summary=summary or 'No summary provided',
	transcription_model=whisper_model,
	author=info_dict.get('uploader', 'Unknown'),
	ingestion_date=datetime.now().strftime('%Y-%m-%d')
	)

	logging.info(f"Media added successfully: {result}")
	return result

	except Exception as e:
	logging.error(f"Error in add_media_to_database: {str(e)}")
	raise


	#
	#
	#######################################################################################################################




	#######################################################################################################################
	# Functions to manage prompts DB
	#

	def create_prompts_db():
	conn = sqlite3.connect('prompts.db')
	cursor = conn.cursor()
	cursor.execute('''
	CREATE TABLE IF NOT EXISTS Prompts (
	id INTEGER PRIMARY KEY AUTOINCREMENT,
	name TEXT NOT NULL UNIQUE,
	details TEXT,
	system TEXT,
	user TEXT
	)
	''')
	conn.commit()
	conn.close()

	create_prompts_db()


	def add_prompt(name, details, system, user=None):
	try:
	conn = sqlite3.connect('prompts.db')
	cursor = conn.cursor()
	cursor.execute('''
	INSERT INTO Prompts (name, details, system, user)
	VALUES (?, ?, ?, ?)
	''', (name, details, system, user))
	conn.commit()
	conn.close()
	return "Prompt added successfully."
	except sqlite3.IntegrityError:
	return "Prompt with this name already exists."
	except sqlite3.Error as e:
	return f"Database error: {e}"

	def fetch_prompt_details(name):
	conn = sqlite3.connect('prompts.db')
	cursor = conn.cursor()
	cursor.execute('''
	SELECT name, details, system, user
	FROM Prompts
	WHERE name = ?
	''', (name,))
	result = cursor.fetchone()
	conn.close()
	return result

	def list_prompts():
	conn = sqlite3.connect('prompts.db')
	cursor = conn.cursor()
	cursor.execute('''
	SELECT name
	FROM Prompts
	''')
	results = cursor.fetchall()
	conn.close()
	return [row[0] for row in results]

	def insert_prompt_to_db(title, description, system_prompt, user_prompt):
	result = add_prompt(title, description, system_prompt, user_prompt)
	return result




	#
	#
	#######################################################################################################################


	def update_media_content(selected_item, item_mapping, content_input, prompt_input, summary_input):
	try:
	if selected_item and item_mapping and selected_item in item_mapping:
	media_id = item_mapping[selected_item]

	with db.get_connection() as conn:
	cursor = conn.cursor()

	# Update the main content in the Media table
	cursor.execute("UPDATE Media SET content = ? WHERE id = ?", (content_input, media_id))

	# Check if a row already exists in MediaModifications for this media_id
	cursor.execute("SELECT COUNT(*) FROM MediaModifications WHERE media_id = ?", (media_id,))
	exists = cursor.fetchone()[0] > 0

	if exists:
	# Update existing row
	cursor.execute("""
	UPDATE MediaModifications
	SET prompt = ?, summary = ?, modification_date = CURRENT_TIMESTAMP
	WHERE media_id = ?
	""", (prompt_input, summary_input, media_id))
	else:
	# Insert new row
	cursor.execute("""
	INSERT INTO MediaModifications (media_id, prompt, summary, modification_date)
	VALUES (?, ?, ?, CURRENT_TIMESTAMP)
	""", (media_id, prompt_input, summary_input))

	conn.commit()

	return f"Content updated successfully for media ID: {media_id}"
	else:
	return "No item selected or invalid selection"
	except Exception as e:
	logging.error(f"Error updating media content: {e}")
	return f"Error updating content: {str(e)}"

	def search_media_database(query: str) -> List[Tuple[int, str, str]]:
	try:
	with db.get_connection() as conn:
	cursor = conn.cursor()
	cursor.execute("SELECT id, title, url FROM Media WHERE title LIKE ?", (f'%{query}%',))
	results = cursor.fetchall()
	return results
	except sqlite3.Error as e:
	raise Exception(f"Error searching media database: {e}")

	def load_media_content(media_id: int) -> dict:
	try:
	with db.get_connection() as conn:
	cursor = conn.cursor()
	cursor.execute("SELECT content, prompt, summary FROM Media WHERE id = ?", (media_id,))
	result = cursor.fetchone()
	if result:
	return {
	"content": result[0],
	"prompt": result[1],
	"summary": result[2]
	}
	return {"content": "", "prompt": "", "summary": ""}
	except sqlite3.Error as e:
	raise Exception(f"Error loading media content: {e}")

	def insert_prompt_to_db(title, description, system_prompt, user_prompt):
	try:
	conn = sqlite3.connect('prompts.db')
	cursor = conn.cursor()
	cursor.execute(
	"INSERT INTO Prompts (name, details, system, user) VALUES (?, ?, ?, ?)",
	(title, description, system_prompt, user_prompt)
	)
	conn.commit()
	conn.close()
	return "Prompt added successfully!"
	except sqlite3.Error as e:
	return f"Error adding prompt: {e}"


	def fetch_items_by_title_or_url(search_query: str, search_type: str):
	try:
	with db.get_connection() as conn:
	cursor = conn.cursor()
	if search_type == 'Title':
	cursor.execute("SELECT id, title, url FROM Media WHERE title LIKE ?", (f'%{search_query}%',))
	elif search_type == 'URL':
	cursor.execute("SELECT id, title, url FROM Media WHERE url LIKE ?", (f'%{search_query}%',))
	results = cursor.fetchall()
	return results
	except sqlite3.Error as e:
	raise DatabaseError(f"Error fetching items by {search_type}: {e}")


	def fetch_items_by_keyword(search_query: str):
	try:
	with db.get_connection() as conn:
	cursor = conn.cursor()
	cursor.execute("""
	SELECT m.id, m.title, m.url
	FROM Media m
	JOIN MediaKeywords mk ON m.id = mk.media_id
	JOIN Keywords k ON mk.keyword_id = k.id
	WHERE k.keyword LIKE ?
	""", (f'%{search_query}%',))
	results = cursor.fetchall()
	return results
	except sqlite3.Error as e:
	raise DatabaseError(f"Error fetching items by keyword: {e}")


	def fetch_items_by_content(search_query: str):
	try:
	with db.get_connection() as conn:
	cursor = conn.cursor()
	cursor.execute("SELECT id, title, url FROM Media WHERE content LIKE ?", (f'%{search_query}%',))
	results = cursor.fetchall()
	return results
	except sqlite3.Error as e:
	raise DatabaseError(f"Error fetching items by content: {e}")


	def fetch_item_details_single(media_id: int):
	try:
	with db.get_connection() as conn:
	cursor = conn.cursor()
	cursor.execute("""
	SELECT prompt, summary
	FROM MediaModifications
	WHERE media_id = ?
	ORDER BY modification_date DESC
	LIMIT 1
	""", (media_id,))
	prompt_summary_result = cursor.fetchone()
	cursor.execute("SELECT content FROM Media WHERE id = ?", (media_id,))
	content_result = cursor.fetchone()

	prompt = prompt_summary_result[0] if prompt_summary_result else ""
	summary = prompt_summary_result[1] if prompt_summary_result else ""
	content = content_result[0] if content_result else ""

	return prompt, summary, content
	except sqlite3.Error as e:
	raise Exception(f"Error fetching item details: {e}")



	def convert_to_markdown(item):
	markdown = f"# {item['title']}\n\n"
	markdown += f"URL: {item['url']}\n\n"
	markdown += f"Author: {item['author']}\n\n"
	markdown += f"Ingestion Date: {item['ingestion_date']}\n\n"
	markdown += f"Type: {item['type']}\n\n"
	markdown += f"Keywords: {', '.join(item['keywords'])}\n\n"
	markdown += "## Summary\n\n"
	markdown += f"{item['summary']}\n\n"
	markdown += "## Content\n\n"
	markdown += f"{item['content']}\n\n"
	return markdown