Spaces:

akryldigital
/

audit_assistant

Sleeping

audit_assistant / src /retrieval /context.py

Ara Yeroyan

add src

f5df983 about 1 month ago

37.5 kB

	"""Context retrieval with reranking capabilities."""

	import os
	from typing import List, Optional, Tuple, Dict, Any
	from langchain.schema import Document
	from langchain_community.vectorstores import Qdrant
	from langchain_community.embeddings import HuggingFaceEmbeddings
	from sentence_transformers import CrossEncoder
	import numpy as np
	import torch
	from qdrant_client.http import models as rest
	import traceback

	from .filter import create_filter

	class ContextRetriever:
	"""
	Context retriever for hybrid search with optional filtering and reranking.
	"""

	def __init__(self, vectorstore: Qdrant, config: dict = None):
	"""
	Initialize the context retriever.

	Args:
	vectorstore: Qdrant vector store instance
	config: Configuration dictionary
	"""
	self.vectorstore = vectorstore
	self.config = config or {}
	self.reranker = None

	# BM25 attributes
	self.bm25_vectorizer = None
	self.bm25_matrix = None
	self.bm25_documents = None

	# Initialize reranker if available
	# Try to get reranker model from different config paths
	self.reranker_model_name = (
	config.get('retrieval', {}).get('reranker_model') or
	config.get('ranker', {}).get('model') or
	config.get('reranker_model') or
	'BAAI/bge-reranker-v2-m3'
	)
	self.reranker_type = self._detect_reranker_type(self.reranker_model_name)

	try:
	if self.reranker_type == 'colbert':
	from colbert.infra import Run, ColBERTConfig
	from colbert.modeling.checkpoint import Checkpoint
	# ColBERT uses late interaction - different implementation needed
	print(f"✅ RERANKER: ColBERT model detected ({self.reranker_model_name})")
	print(f"🔍 INTERACTION TYPE: Late interaction (token-level embeddings)")

	# Create ColBERT config for CPU mode
	colbert_config = ColBERTConfig(
	doc_maxlen=300,
	query_maxlen=32,
	nbits=2,
	kmeans_niters=4,
	root="./colbert_data"
	)

	# Load checkpoint (e.g. "colbert-ir/colbertv2.0")
	self.colbert_checkpoint = Checkpoint(self.reranker_model_name, colbert_config=colbert_config)
	self.colbert_model = self.colbert_checkpoint.model
	self.colbert_tokenizer = self.colbert_checkpoint.raw_tokenizer
	self.reranker = self._colbert_rerank # attach wrapper function
	print(f"✅ COLBERT: Model and tokenizer loaded successfully")

	else:
	# Standard CrossEncoder for BGE and other models
	from sentence_transformers import CrossEncoder
	self.reranker = CrossEncoder(self.reranker_model_name)
	print(f"✅ RERANKER: Initialized {self.reranker_model_name}")
	print(f"🔍 INTERACTION TYPE: Cross-encoder (single relevance score)")
	except Exception as e:
	print(f"⚠️ Reranker initialization failed: {e}")
	self.reranker = None

	def _detect_reranker_type(self, model_name: str) -> str:
	"""
	Detect the type of reranker based on model name.

	Args:
	model_name: Name of the reranker model

	Returns:
	'colbert' for ColBERT models, 'crossencoder' for others
	"""
	model_name_lower = model_name.lower()

	# ColBERT model patterns
	colbert_patterns = [
	'colbert',
	'colbert-ir',
	'colbertv2',
	'colbert-v2'
	]

	for pattern in colbert_patterns:
	if pattern in model_name_lower:
	return 'colbert'

	# Default to cross-encoder for BGE and other models
	return 'crossencoder'

	def _similarity_search_with_colbert_embeddings(self, query: str, k: int = 5, **kwargs) -> List[Tuple[Document, float]]:
	"""
	Perform similarity search and fetch ColBERT embeddings for documents.

	Args:
	query: Search query
	k: Number of documents to retrieve
	**kwargs: Additional search parameters (filter, etc.)

	Returns:
	List of (Document, score) tuples with ColBERT embeddings in metadata
	"""
	try:
	print(f"🔍 COLBERT RETRIEVAL: Fetching documents with ColBERT embeddings")

	# Use the vectorstore's similarity_search_with_score method instead of direct client
	# This ensures proper filter handling
	if 'filter' in kwargs and kwargs['filter']:
	# Use the vectorstore method with filter
	result = self.vectorstore.similarity_search_with_score(
	query,
	k=k,
	filter=kwargs['filter']
	)
	else:
	# Use the vectorstore method without filter
	result = self.vectorstore.similarity_search_with_score(query, k=k)

	# Convert to the format we need
	if isinstance(result, tuple) and len(result) == 2:
	documents, scores = result
	elif isinstance(result, list):
	documents = []
	scores = []
	for item in result:
	if isinstance(item, tuple) and len(item) == 2:
	doc, score = item
	documents.append(doc)
	scores.append(score)
	else:
	documents.append(item)
	scores.append(0.0)
	else:
	documents = []
	scores = []

	# Now we need to fetch the ColBERT embeddings for these documents
	# We'll use the Qdrant client directly for this part since we need specific payload fields
	from qdrant_client.http import models as rest

	collection_name = self.vectorstore.collection_name

	# Get document IDs from the retrieved documents
	doc_ids = []
	for doc in documents:
	# Extract ID from document metadata or use page_content hash as fallback
	doc_id = doc.metadata.get('id') or doc.metadata.get('_id')
	if not doc_id:
	# Use a hash of the content as ID
	import hashlib
	doc_id = hashlib.md5(doc.page_content.encode()).hexdigest()
	doc_ids.append(doc_id)

	# Fetch documents with ColBERT embeddings from Qdrant
	search_result = self.vectorstore.client.retrieve(
	collection_name=collection_name,
	ids=doc_ids,
	with_payload=True,
	with_vectors=False
	)

	# Convert results to Document objects with ColBERT embeddings
	enhanced_documents = []
	enhanced_scores = []

	# Create a mapping from doc_id to original score
	doc_id_to_score = {}
	for i, doc in enumerate(documents):
	doc_id = doc.metadata.get('id') or doc.metadata.get('_id')
	if not doc_id:
	import hashlib
	doc_id = hashlib.md5(doc.page_content.encode()).hexdigest()
	doc_id_to_score[doc_id] = scores[i]

	for point in search_result:
	# Extract payload
	payload = point.payload

	# Get the original score for this document
	doc_id = str(point.id)
	original_score = doc_id_to_score.get(doc_id, 0.0)

	# Create Document object with ColBERT embeddings
	doc = Document(
	page_content=payload.get('page_content', ''),
	metadata={
	**payload.get('metadata', {}),
	'colbert_embedding': payload.get('colbert_embedding'),
	'colbert_model': payload.get('colbert_model'),
	'colbert_calculated_at': payload.get('colbert_calculated_at')
	}
	)

	enhanced_documents.append(doc)
	enhanced_scores.append(original_score)

	print(f"✅ COLBERT RETRIEVAL: Retrieved {len(enhanced_documents)} documents with ColBERT embeddings")

	return list(zip(enhanced_documents, enhanced_scores))

	except Exception as e:
	print(f"❌ COLBERT RETRIEVAL ERROR: {e}")
	print(f"❌ Falling back to regular similarity search")

	# Fallback to regular search - handle filter parameter correctly
	if 'filter' in kwargs and kwargs['filter']:
	return self.vectorstore.similarity_search_with_score(query, k=k, filter=kwargs['filter'])
	else:
	return self.vectorstore.similarity_search_with_score(query, k=k)

	def retrieve_context(
	self,
	query: str,
	k: int = 5,
	reports: Optional[List[str]] = None,
	sources: Optional[List[str]] = None,
	subtype: Optional[str] = None,
	year: Optional[str] = None,
	district: Optional[List[str]] = None,
	filenames: Optional[List[str]] = None,
	use_reranking: bool = False,
	qdrant_filter: Optional[rest.Filter] = None
	) -> List[Document]:
	"""
	Retrieve context documents using hybrid search with optional filtering and reranking.

	Args:
	query: User query
	top_k: Number of documents to retrieve
	reports: List of report names to filter by
	sources: List of sources to filter by
	subtype: Document subtype to filter by
	year: Year to filter by
	use_reranking: Whether to apply reranking
	qdrant_filter: Pre-built Qdrant filter to use

	Returns:
	List of retrieved documents
	"""
	try:
	# Determine how many documents to retrieve
	retrieve_k = k #* 3 if use_reranking else k # Retrieve more for reranking

	# Build search kwargs
	search_kwargs = {}

	# Use qdrant_filter if provided (this takes precedence)
	if qdrant_filter:
	search_kwargs = {"filter": qdrant_filter}
	print(f"✅ FILTERS APPLIED: Using inferred Qdrant filter")
	else:
	# Build filter from individual parameters
	filter_obj = create_filter(
	reports=reports,
	sources=sources,
	subtype=subtype,
	year=year,
	district=district,
	filenames=filenames
	)

	if filter_obj:
	search_kwargs = {"filter": filter_obj}
	print(f"✅ FILTERS APPLIED: Using built filter")
	else:
	search_kwargs = {}
	print(f"⚠️ NO FILTERS APPLIED: All documents will be searched")

	# Perform vector search
	try:
	# Check if we need ColBERT embeddings for reranking
	if use_reranking and self.reranker_type == 'colbert':
	result = self._similarity_search_with_colbert_embeddings(
	query,
	k=retrieve_k,
	**search_kwargs
	)
	else:
	result = self.vectorstore.similarity_search_with_score(
	query,
	k=retrieve_k,
	**search_kwargs
	)

	# Handle different return formats
	if isinstance(result, tuple) and len(result) == 2:
	documents, scores = result
	elif isinstance(result, list) and len(result) > 0:
	# Handle case where result is a list of (Document, score) tuples
	documents = []
	scores = []
	for item in result:
	if isinstance(item, tuple) and len(item) == 2:
	doc, score = item
	documents.append(doc)
	scores.append(score)
	else:
	# Handle case where item is just a Document
	documents.append(item)
	scores.append(0.0) # Default score
	else:
	documents = []
	scores = []

	print(f"✅ RETRIEVAL SUCCESS: Retrieved {len(documents)} documents (requested: {retrieve_k})")

	# If we got fewer documents than requested, try without filters
	if len(documents) < retrieve_k and search_kwargs.get('filter'):
	print(f"⚠️ RETRIEVAL: Got {len(documents)} docs with filters, trying without filters...")
	try:
	result_no_filter = self.vectorstore.similarity_search_with_score(
	query,
	k=retrieve_k
	)

	if isinstance(result_no_filter, tuple) and len(result_no_filter) == 2:
	documents_no_filter, scores_no_filter = result_no_filter
	elif isinstance(result_no_filter, list):
	documents_no_filter = []
	scores_no_filter = []
	for item in result_no_filter:
	if isinstance(item, tuple) and len(item) == 2:
	doc, score = item
	documents_no_filter.append(doc)
	scores_no_filter.append(score)
	else:
	documents_no_filter.append(item)
	scores_no_filter.append(0.0)
	else:
	documents_no_filter = []
	scores_no_filter = []

	if len(documents_no_filter) > len(documents):
	print(f"✅ RETRIEVAL: Got {len(documents_no_filter)} docs without filters")
	documents = documents_no_filter
	scores = scores_no_filter
	except Exception as e:
	print(f"⚠️ RETRIEVAL: Fallback search failed: {e}")

	except Exception as e:
	print(f"❌ RETRIEVAL ERROR: {str(e)}")
	return []

	# Apply reranking if enabled
	reranking_applied = False
	if use_reranking and len(documents) > 1:
	print(f"🔄 RERANKING: Applying {self.reranker_model_name} to {len(documents)} documents...")
	try:
	original_docs = documents.copy()
	original_scores = scores.copy()

	# Apply reranking
	# print(f"🔍 ORIGINAL DOCS: {documents[0]}")
	reranked_docs = self._apply_reranking(query, documents, scores)
	# print(f"🔍 RERANKED DOCS: {reranked_docs[0]}")
	reranking_applied = len(reranked_docs) > 0

	if reranking_applied:
	print(f"✅ RERANKING APPLIED: {self.reranker_model_name}")
	documents = reranked_docs
	# Update scores to reflect reranking
	# scores = [0.0] * len(documents) # Reranked scores are not directly comparable
	else:
	print(f"⚠️ RERANKING FAILED: Using original order")
	documents = original_docs
	scores = original_scores
	return documents

	except Exception as e:
	print(f"❌ RERANKING ERROR: {str(e)}")
	print(f"⚠️ RERANKING FAILED: Using original order")
	reranking_applied = False
	elif use_reranking and len(documents) <= 1:
	print(f"ℹ️ RERANKING: Skipped (only {len(documents)} document(s) retrieved)")
	if use_reranking:
	print(f"ℹ️ RERANKING: Skipped (disabled or insufficient documents)")
	# Store original scores in metadata
	for i, (doc, score) in enumerate(zip(documents, scores)):
	doc.metadata['original_score'] = float(score)
	doc.metadata['reranking_applied'] = False
	return documents
	else:
	print(f"ℹ️ RERANKING: Skipped (disabled or insufficient documents)")

	# Limit to requested number of documents
	documents = documents[:k]
	scores = scores[:k] if scores else [0.0] * len(documents)

	# Add metadata to documents
	for i, (doc, score) in enumerate(zip(documents, scores)):
	if hasattr(doc, 'metadata'):
	doc.metadata.update({
	'reranking_applied': reranking_applied,
	'reranker_model': 'BAAI/bge-reranker-v2-m3' if reranking_applied else None,
	'original_rank': i + 1,
	'final_rank': i + 1,
	'original_score': float(score) if score is not None else 0.0
	})

	return documents

	except Exception as e:
	print(f"❌ CONTEXT RETRIEVAL ERROR: {str(e)}")
	return []

	def _apply_reranking(self, query: str, documents: List[Document], scores: List[float]) -> List[Document]:
	"""
	Apply reranking to documents using the appropriate reranker.

	Args:
	query: User query
	documents: List of documents to rerank
	scores: Original scores

	Returns:
	Reranked list of documents
	"""
	if not self.reranker or len(documents) == 0:
	return documents

	try:
	print(f"🔍 RERANKING METHOD: Starting reranking with {len(documents)} documents")
	print(f"🔍 RERANKING TYPE: {self.reranker_type.upper()}")

	if self.reranker_type == 'colbert':
	return self._apply_colbert_reranking(query, documents, scores)
	else:
	return self._apply_crossencoder_reranking(query, documents, scores)

	except Exception as e:
	print(f"❌ RERANKING ERROR: {str(e)}")
	return documents

	def _apply_crossencoder_reranking(self, query: str, documents: List[Document], scores: List[float]) -> List[Document]:
	"""
	Apply reranking using CrossEncoder (BGE and other models).

	Args:
	query: User query
	documents: List of documents to rerank
	scores: Original scores

	Returns:
	Reranked list of documents
	"""
	# Prepare pairs for reranking
	pairs = []
	for doc in documents:
	pairs.append([query, doc.page_content])

	print(f"🔍 CROSS-ENCODER: Prepared {len(pairs)} pairs for reranking")

	# Get reranking scores using the correct CrossEncoder API
	rerank_scores = self.reranker.predict(pairs)

	# Handle single score case
	if not isinstance(rerank_scores, (list, np.ndarray)):
	rerank_scores = [rerank_scores]

	# Ensure we have the right number of scores
	if len(rerank_scores) != len(documents):
	print(f"⚠️ RERANKING WARNING: Expected {len(documents)} scores, got {len(rerank_scores)}")
	return documents

	print(f"🔍 CROSS-ENCODER: Got {len(rerank_scores)} rerank scores")
	print(f"🔍 CROSS-ENCODER SCORES: {rerank_scores[:5]}...") # Show first 5 scores

	# Combine documents with their rerank scores
	doc_scores = list(zip(documents, rerank_scores))

	# Sort by rerank score (descending)
	doc_scores.sort(key=lambda x: x[1], reverse=True)

	# Extract reranked documents and store scores in metadata
	reranked_docs = []
	for i, (doc, rerank_score) in enumerate(doc_scores):
	# Find original index for original score
	original_idx = documents.index(doc)
	original_score = scores[original_idx] if original_idx < len(scores) else 0.0

	# Create new document with reranking metadata
	new_doc = Document(
	page_content=doc.page_content,
	metadata={
	**doc.metadata,
	'reranking_applied': True,
	'reranker_model': self.reranker_model_name,
	'reranker_type': self.reranker_type,
	'original_rank': original_idx + 1,
	'final_rank': i + 1,
	'original_score': float(original_score),
	'reranked_score': float(rerank_score)
	}
	)
	reranked_docs.append(new_doc)

	print(f"✅ CROSS-ENCODER: Reranked {len(reranked_docs)} documents")

	return reranked_docs

	def _apply_colbert_reranking(self, query: str, documents: List[Document], scores: List[float]) -> List[Document]:
	"""
	Apply reranking using ColBERT late interaction.

	Args:
	query: User query
	documents: List of documents to rerank
	scores: Original scores

	Returns:
	Reranked list of documents
	"""
	# Use the actual ColBERT reranking implementation
	return self._colbert_rerank(query, documents, scores)

	def _colbert_rerank(self, query: str, documents: List[Document], scores: List[float]) -> List[Document]:
	"""
	ColBERT reranking using late interaction with pre-calculated embeddings support.

	Args:
	query: User query
	documents: List of documents to rerank
	scores: Original scores

	Returns:
	Reranked list of documents
	"""
	try:
	print(f"🔍 COLBERT: Starting late interaction reranking with {len(documents)} documents")

	# Check if documents have pre-calculated ColBERT embeddings
	pre_calculated_embeddings = []
	documents_without_embeddings = []
	documents_without_indices = []

	for i, doc in enumerate(documents):
	if (hasattr(doc, 'metadata') and
	'colbert_embedding' in doc.metadata and
	doc.metadata['colbert_embedding'] is not None):
	# Use pre-calculated embedding
	colbert_embedding = doc.metadata['colbert_embedding']
	if isinstance(colbert_embedding, list):
	colbert_embedding = torch.tensor(colbert_embedding)
	pre_calculated_embeddings.append(colbert_embedding)
	else:
	# Need to calculate embedding
	documents_without_embeddings.append(doc)
	documents_without_indices.append(i)

	# Calculate query embedding
	query_embeddings = self.colbert_checkpoint.queryFromText([query])

	# Calculate embeddings for documents without pre-calculated ones
	if documents_without_embeddings:
	print(f"🔄 COLBERT: Calculating embeddings for {len(documents_without_embeddings)} documents without pre-calculated embeddings")
	doc_texts = [doc.page_content for doc in documents_without_embeddings]
	doc_embeddings = self.colbert_checkpoint.docFromText(doc_texts)

	# Insert calculated embeddings into the right positions
	for i, embedding in enumerate(doc_embeddings):
	idx = documents_without_indices[i]
	pre_calculated_embeddings.insert(idx, embedding)
	else:
	print(f"✅ COLBERT: Using pre-calculated embeddings for all {len(documents)} documents")

	# Calculate late interaction scores
	# ColBERT uses MaxSim: for each query token, find max similarity with document tokens
	colbert_scores = []
	for i, doc_embedding in enumerate(pre_calculated_embeddings):
	# Calculate similarity matrix between query and document i
	sim_matrix = torch.matmul(query_embeddings[0], doc_embedding.transpose(-1, -2))

	# MaxSim: for each query token, take max similarity with document
	max_sim_per_query_token = torch.max(sim_matrix, dim=-1)[0]

	# Sum over query tokens to get final score
	final_score = torch.sum(max_sim_per_query_token).item()
	colbert_scores.append(final_score)

	# Sort documents by ColBERT scores
	doc_scores = list(zip(documents, colbert_scores))
	doc_scores.sort(key=lambda x: x[1], reverse=True)

	# Create reranked documents with metadata
	reranked_docs = []
	for i, (doc, colbert_score) in enumerate(doc_scores):
	original_idx = documents.index(doc)
	original_score = scores[original_idx] if original_idx < len(scores) else 0.0

	new_doc = Document(
	page_content=doc.page_content,
	metadata={
	**doc.metadata,
	'reranking_applied': True,
	'reranker_model': self.reranker_model_name,
	'reranker_type': self.reranker_type,
	'original_rank': original_idx + 1,
	'final_rank': i + 1,
	'original_score': float(original_score),
	'reranked_score': float(colbert_score),
	'colbert_score': float(colbert_score),
	'colbert_embedding_pre_calculated': 'colbert_embedding' in doc.metadata
	}
	)
	reranked_docs.append(new_doc)

	print(f"✅ COLBERT: Reranked {len(reranked_docs)} documents using late interaction")
	print(f"🔍 COLBERT SCORES: {[f'{score:.4f}' for score in colbert_scores[:5]]}...")

	return reranked_docs

	except Exception as e:
	print(f"❌ COLBERT RERANKING ERROR: {str(e)}")
	print(f"❌ COLBERT TRACEBACK: {traceback.format_exc()}")
	# Fallback to original order - return documents as-is
	return documents

	def retrieve_with_scores(self, query: str, vectorstore=None, k: int = 5, reports: List[str] = None,
	sources: List[str] = None, subtype: List[str] = None,
	year: List[str] = None, use_reranking: bool = False,
	qdrant_filter: Optional[rest.Filter] = None) -> Tuple[List[Document], List[float]]:
	"""
	Retrieve context documents with scores using hybrid search with optional reranking.

	Args:
	query: User query
	vectorstore: Optional vectorstore instance (for compatibility)
	k: Number of documents to retrieve
	reports: List of report names to filter by
	sources: List of sources to filter by
	subtype: Document subtype to filter by
	year: List of years to filter by
	use_reranking: Whether to apply reranking
	qdrant_filter: Pre-built Qdrant filter

	Returns:
	Tuple of (documents, scores)
	"""
	try:
	# Use the provided vectorstore if available, otherwise use the instance one
	if vectorstore:
	self.vectorstore = vectorstore

	# Determine search strategy
	search_strategy = self.config.get('retrieval', {}).get('search_strategy', 'vector_only')

	if search_strategy == 'vector_only':
	# Vector search only
	print(f"🔄 VECTOR SEARCH: Retrieving {k} documents...")

	if qdrant_filter:
	print(f"✅ QDRANT FILTER APPLIED: Using inferred Qdrant filter")
	# Pass filter as positional argument, not keyword argument
	results = self.vectorstore.similarity_search_with_score(
	query,
	k=k,
	filter=qdrant_filter
	)
	else:
	# Build filter from individual parameters
	filter_conditions = self._build_filter_conditions(reports, sources, subtype, year)
	if filter_conditions:
	print(f"✅ FILTER APPLIED: {filter_conditions}")
	results = self.vectorstore.similarity_search_with_score(
	query,
	k=k,
	filter=filter_conditions
	)
	else:
	print(f"ℹ️ NO FILTERS APPLIED: All documents will be searched")
	results = self.vectorstore.similarity_search_with_score(query, k=k)

	print(f"🔍 SEARCH DEBUG: Raw result type: {type(results)}")
	print(f"🔍 SEARCH DEBUG: Raw result length: {len(results)}")

	# Handle different result formats
	if results and isinstance(results[0], tuple):
	documents = [doc for doc, score in results]
	scores = [score for doc, score in results]
	print(f"🔍 SEARCH DEBUG: After unpacking - documents: {len(documents)}, scores: {len(scores)}")
	else:
	documents = results
	scores = [0.0] * len(documents)
	print(f"🔍 SEARCH DEBUG: No scores available, using default")

	print(f"🔧 CONVERTING: Converting {len(documents)} documents")

	# Convert to Document objects and store original scores
	final_documents = []
	for i, (doc, score) in enumerate(zip(documents, scores)):
	if hasattr(doc, 'page_content'):
	new_doc = Document(
	page_content=doc.page_content,
	metadata=doc.metadata.copy()
	)
	# Store original score in metadata
	new_doc.metadata['original_score'] = float(score) if score is not None else 0.0
	final_documents.append(new_doc)
	else:
	print(f"⚠️ WARNING: Document {i} has no page_content")

	print(f"✅ RETRIEVAL SUCCESS: Retrieved {len(final_documents)} documents")

	# Apply reranking if enabled
	if use_reranking and len(final_documents) > 1:
	print(f"🔄 RERANKING: Applying {self.reranker_model} to {len(final_documents)} documents...")
	final_documents = self._apply_reranking(query, final_documents, scores)
	print(f"✅ RERANKING APPLIED: {self.reranker_model}")
	else:
	print(f"ℹ️ RERANKING: Skipped (disabled or no documents)")

	return final_documents, scores

	else:
	print(f"❌ UNSUPPORTED STRATEGY: {search_strategy}")
	return [], []

	except Exception as e:
	print(f"❌ RETRIEVAL ERROR: {e}")
	print(f"❌ RETRIEVAL TRACEBACK: {traceback.format_exc()}")
	return [], []

	def _build_filter_conditions(self, reports: List[str] = None, sources: List[str] = None,
	subtype: List[str] = None, year: List[str] = None) -> Optional[rest.Filter]:
	"""
	Build Qdrant filter conditions from individual parameters.

	Args:
	reports: List of report names
	sources: List of sources
	subtype: Document subtype
	year: List of years

	Returns:
	Qdrant filter or None
	"""
	conditions = []

	if reports:
	conditions.append(rest.FieldCondition(
	key="metadata.filename",
	match=rest.MatchAny(any=reports)
	))

	if sources:
	conditions.append(rest.FieldCondition(
	key="metadata.source",
	match=rest.MatchAny(any=sources)
	))

	if subtype:
	conditions.append(rest.FieldCondition(
	key="metadata.subtype",
	match=rest.MatchAny(any=subtype)
	))

	if year:
	conditions.append(rest.FieldCondition(
	key="metadata.year",
	match=rest.MatchAny(any=year)
	))

	if conditions:
	return rest.Filter(must=conditions)

	return None

	def get_context(
	query: str,
	vectorstore: Qdrant,
	k: int = 5,
	reports: Optional[List[str]] = None,
	sources: Optional[List[str]] = None,
	subtype: Optional[str] = None,
	year: Optional[str] = None,
	use_reranking: bool = False,
	qdrant_filter: Optional[rest.Filter] = None
	) -> List[Document]:
	"""
	Convenience function to get context documents.

	Args:
	query: User query
	vectorstore: Qdrant vector store instance
	k: Number of documents to retrieve
	reports: Optional list of report names to filter by
	sources: Optional list of source categories to filter by
	subtype: Optional subtype to filter by
	year: Optional year to filter by
	use_reranking: Whether to apply reranking
	qdrant_filter: Optional pre-built Qdrant filter

	Returns:
	List of retrieved documents
	"""
	retriever = ContextRetriever(vectorstore)
	return retriever.retrieve_context(
	query=query,
	k=k,
	reports=reports,
	sources=sources,
	subtype=subtype,
	year=year,
	use_reranking=use_reranking,
	qdrant_filter=qdrant_filter
	)


	def format_context_for_llm(documents: List[Document]) -> str:
	"""
	Format retrieved documents for LLM input.

	Args:
	documents: List of Document objects

	Returns:
	Formatted string for LLM
	"""
	if not documents:
	return ""

	formatted_parts = []
	for i, doc in enumerate(documents, 1):
	content = doc.page_content.strip()
	source = doc.metadata.get('filename', 'Unknown')

	formatted_parts.append(f"Document {i} (Source: {source}):\n{content}")

	return "\n\n".join(formatted_parts)


	def get_context_metadata(documents: List[Document]) -> Dict[str, Any]:
	"""
	Extract metadata summary from retrieved documents.

	Args:
	documents: List of Document objects

	Returns:
	Dictionary with metadata summary
	"""
	if not documents:
	return {}

	sources = set()
	years = set()
	doc_types = set()

	for doc in documents:
	metadata = doc.metadata
	if 'filename' in metadata:
	sources.add(metadata['filename'])
	if 'year' in metadata:
	years.add(metadata['year'])
	if 'source' in metadata:
	doc_types.add(metadata['source'])

	return {
	"num_documents": len(documents),
	"sources": list(sources),
	"years": list(years),
	"document_types": list(doc_types)
	}