Spaces:

MedSwin
/

MedicalDiagnosisSystem

Sleeping

App Files Files Community

dylanglenister commited on Oct 18

Commit

24ed5c4

1 Parent(s): 84d39f9

CHORE: Memory and summariser housekeeping

Browse files

Files changed (2) hide show

src/core/memory_manager.py +39 -16
src/services/summariser.py +13 -7

src/core/memory_manager.py CHANGED Viewed

@@ -177,9 +177,12 @@ class MemoryManager:
 			session_repo.add_message(session_id, answer, sent_by_user=False)
 			# 2. Generate a concise summary of the exchange
-			summary = await self._generate_summary(question, answer, gemini_rotator, nvidia_rotator)
-			if not summary:
-				return None # Could not generate a summary
 			# 3. Generate an embedding for the summary for semantic search
 			embedding = None
@@ -199,7 +202,11 @@ class MemoryManager:
 			)
 			# 5. Update the session title if this was the first exchange
-			await self._update_session_title_if_first_message(session_id, question, nvidia_rotator)
 			return summary
 		except ActionFailed as e:
@@ -228,7 +235,9 @@ class MemoryManager:
 			if recent_memories:
 				# Use NVIDIA to reason about relevance
 				relevant_stm = await self._filter_summaries_for_relevance(
-					question, [mem.summary for mem in recent_memories], nvidia_rotator
 				)
 				if relevant_stm:
 					context_parts.append("Recent relevant medical context (STM):\n" + "\n".join(relevant_stm))
@@ -239,14 +248,21 @@ class MemoryManager:
 		if self.embedder:
 			try:
 				query_embedding = self.embedder.embed([question])[0]
-				ltm_results = memory_repo.search_memories_semantic(patient_id, query_embedding, limit=2)
 				if ltm_results:
 					ltm_summaries = [result.summary for result in ltm_results]
 					context_parts.append("Semantically relevant medical history (LTM):\n" + "\n".join(ltm_summaries))
 			except (ActionFailed, Exception) as e:
 				logger().warning(f"Failed to perform LTM semantic search: {e}")
-		# 3. Get current conversation context
 		try:
 			session = session_repo.get_session(session_id)
 			if session and session.messages:
@@ -273,10 +289,10 @@ class MemoryManager:
 			session = self.get_session(session_id)
 			# Check if it's the first user message and first assistant response
 			if session and len(session.messages) == 2:
-				title = await summariser.summarise_title_with_nvidia(question, nvidia_rotator, max_words=5)
 				if not title:
 					title = question[:80] # Fallback to first 80 chars
-				self.update_session_title(session_id, title)
 		except Exception as e:
 			logger().warning(f"Failed to auto-update session title for session '{session_id}': {e}")
@@ -289,18 +305,25 @@ class MemoryManager:
 	) -> str:
 		"""Generates a summary of a Q&A exchange, falling back to a basic format if AI fails."""
 		try:
-			summary = await summariser.summarise_qa_with_gemini(question, answer, gemini_rotator)
-			if summary:
-				return summary
 			# Fallback to NVIDIA if Gemini fails
-			summary = await summariser.summarise_qa_with_nvidia(question, answer, nvidia_rotator)
-			if summary:
-				return summary
 		except Exception as e:
 			logger().warning(f"Failed to generate AI summary: {e}")
 		# Fallback for both exceptions and cases where services return None
-		return f"Question: {question}\nAnswer: {answer}"
 	async def _filter_summaries_for_relevance(
 		self,

 			session_repo.add_message(session_id, answer, sent_by_user=False)
 			# 2. Generate a concise summary of the exchange
+			summary = await self._generate_summary(
+				question=question,
+				answer=answer,
+				gemini_rotator=gemini_rotator,
+				nvidia_rotator=nvidia_rotator
+			)
 			# 3. Generate an embedding for the summary for semantic search
 			embedding = None
 			)
 			# 5. Update the session title if this was the first exchange
+			await self._update_session_title_if_first_message(
+				session_id=session_id,
+				question=question,
+				nvidia_rotator=nvidia_rotator
+			)
 			return summary
 		except ActionFailed as e:
 			if recent_memories:
 				# Use NVIDIA to reason about relevance
 				relevant_stm = await self._filter_summaries_for_relevance(
+					question=question,
+					summaries=[mem.summary for mem in recent_memories],
+					nvidia_rotator=nvidia_rotator
 				)
 				if relevant_stm:
 					context_parts.append("Recent relevant medical context (STM):\n" + "\n".join(relevant_stm))
 		if self.embedder:
 			try:
 				query_embedding = self.embedder.embed([question])[0]
+				ltm_results = memory_repo.search_memories_semantic(
+					patient_id=patient_id,
+					query_embedding=query_embedding,
+					limit=2
+				)
 				if ltm_results:
 					ltm_summaries = [result.summary for result in ltm_results]
 					context_parts.append("Semantically relevant medical history (LTM):\n" + "\n".join(ltm_summaries))
 			except (ActionFailed, Exception) as e:
 				logger().warning(f"Failed to perform LTM semantic search: {e}")
+		# 3. Consult knowledge base
+		# TODO
+		# 4. Get current conversation context
 		try:
 			session = session_repo.get_session(session_id)
 			if session and session.messages:
 			session = self.get_session(session_id)
 			# Check if it's the first user message and first assistant response
 			if session and len(session.messages) == 2:
+				title = await summariser.summarise_title_with_nvidia(text=question, rotator=nvidia_rotator, max_words=5)
 				if not title:
 					title = question[:80] # Fallback to first 80 chars
+				self.update_session_title(session_id=session_id, title=title)
 		except Exception as e:
 			logger().warning(f"Failed to auto-update session title for session '{session_id}': {e}")
 	) -> str:
 		"""Generates a summary of a Q&A exchange, falling back to a basic format if AI fails."""
 		try:
+			summary = await summariser.summarise_qa_with_gemini(
+				question=question,
+				answer=answer,
+				rotator=gemini_rotator
+			)
+			if summary: return summary
 			# Fallback to NVIDIA if Gemini fails
+			summary = await summariser.summarise_qa_with_nvidia(
+				question=question,
+				answer=answer,
+				rotator=nvidia_rotator
+			)
+			if summary: return summary
 		except Exception as e:
 			logger().warning(f"Failed to generate AI summary: {e}")
 		# Fallback for both exceptions and cases where services return None
+		return summariser.summarise_fallback(question=question, answer=answer)
 	async def _filter_summaries_for_relevance(
 		self,

src/services/summariser.py CHANGED Viewed

@@ -32,7 +32,7 @@ async def summarise_qa_with_gemini(
 	question: str,
 	answer: str,
 	rotator: APIKeyRotator
-) -> str:
 	"""Summarizes a Q&A pair into a 'q: ... a: ...' format using the Gemini API."""
 	prompt = prompt_builder.qa_summary_gemini_prompt(question, answer)
 	response = await gemini_chat(prompt, rotator)
@@ -45,14 +45,15 @@ async def summarise_qa_with_gemini(
 		if q_line and a_line:
 			return f"{q_line}\n{a_line}"
-	logger().warning("Gemini summarization failed, using fallback.")
-	return f"q: {question.strip()[:160]}\na: {answer.strip()[:220]}"
 async def summarise_qa_with_nvidia(
 	question: str,
 	answer: str,
 	rotator: APIKeyRotator
-) -> str:
 	"""Summarizes a Q&A pair into a 'q: ... a: ...' format using the NVIDIA API."""
 	sys_prompt = "You are a terse summariser. Output exactly two lines:\nq: <short question summary>\na: <short answer summary>\nNo extra text."
 	user_prompt = f"Question:\n{question}\n\nAnswer:\n{answer}"
@@ -65,6 +66,11 @@ async def summarise_qa_with_nvidia(
 	if q_line and a_line:
 		return f"{q_line}\n{a_line}"
-	q_fallback = "q: " + (question.strip()[:160] + "…")
-	a_fallback = "a: " + (answer.strip()[:220] + "…")
-	return f"{q_fallback}\n{a_fallback}"

 	question: str,
 	answer: str,
 	rotator: APIKeyRotator
+) -> str | None:
 	"""Summarizes a Q&A pair into a 'q: ... a: ...' format using the Gemini API."""
 	prompt = prompt_builder.qa_summary_gemini_prompt(question, answer)
 	response = await gemini_chat(prompt, rotator)
 		if q_line and a_line:
 			return f"{q_line}\n{a_line}"
+	#logger().warning("Gemini summarization failed, using fallback.")
+	#return f"q: {question.strip()[:160]}\na: {answer.strip()[:220]}"
+	return None
 async def summarise_qa_with_nvidia(
 	question: str,
 	answer: str,
 	rotator: APIKeyRotator
+) -> str | None:
 	"""Summarizes a Q&A pair into a 'q: ... a: ...' format using the NVIDIA API."""
 	sys_prompt = "You are a terse summariser. Output exactly two lines:\nq: <short question summary>\na: <short answer summary>\nNo extra text."
 	user_prompt = f"Question:\n{question}\n\nAnswer:\n{answer}"
 	if q_line and a_line:
 		return f"{q_line}\n{a_line}"
+	#q_fallback = "q: " + (question.strip()[:160] + "…")
+	#a_fallback = "a: " + (answer.strip()[:220] + "…")
+	#return f"{q_fallback}\n{a_fallback}"
+	return None
+def summarise_fallback(question: str, answer: str):
+	return f"q: {question.strip()[:160]}\na: {answer.strip()[:220]}"