Spaces:

FireBird-Tech
/

auto-analyst-backend

Running on CPU Upgrade

App Files Files

Arslan1997 commited on 6 days ago

Commit

ed97f9d

1 Parent(s): 2cac7a0

added new dspy

Browse files

Files changed (5) hide show

app.py +1 -1
scripts/format_response.py +1 -1
src/managers/session_manager.py +7 -3
src/routes/session_routes.py +8 -5
src/utils/model_registry.py +21 -18

app.py CHANGED Viewed

@@ -299,7 +299,7 @@ DEFAULT_MODEL_CONFIG = {
     "api_key": os.getenv("OPENAI_API_KEY"),
-    "temperature": float(os.getenv("TEMPERATURE", 1.0)),
     "max_tokens": int(os.getenv("MAX_TOKENS", 6000)), "cache": False

     "api_key": os.getenv("OPENAI_API_KEY"),
+    "temperature": min(1.0, max(0.0, float(os.getenv("TEMPERATURE", "1.0")))),  # Clamp to 0..1
     "max_tokens": int(os.getenv("MAX_TOKENS", 6000)), "cache": False

scripts/format_response.py CHANGED Viewed

@@ -44,7 +44,7 @@ API_KEY_PATTERNS = [
 ]
 # Network request patterns
-NETWORK_REQUEST_PATTERNS = re.compile(r"(requests\.|urllib\.|http\.|\.post\(|\.get\(|\.connect\()")
 # DataFrame creation with hardcoded data - block only this specific pattern

 ]
 # Network request patterns
+NETWORK_REQUEST_PATTERNS = re.compile(r"(requests\.|urllib\.|http\.client|httpx\.|socket\.connect\()")
 # DataFrame creation with hardcoded data - block only this specific pattern

src/managers/session_manager.py CHANGED Viewed

@@ -25,6 +25,10 @@ load_dotenv()
 # Initialize logger
 logger = Logger("session_manager", see_time=False, console_log=False)
 class SessionManager:
     """
     Manages session-specific state, including datasets, retrievers, and AI systems.
@@ -135,7 +139,7 @@ This dataset appears clean with consistent formatting and no missing values, mak
                 "provider": os.getenv("MODEL_PROVIDER", "anthropic"),
                 "model": os.getenv("MODEL_NAME", "claude-3-5-sonnet-latest"),
                 "api_key": os.getenv("ANTHROPIC_API_KEY"),
-                "temperature": float(os.getenv("TEMPERATURE", 1.0)),
                 "max_tokens": int(os.getenv("MAX_TOKENS", 6000))
             }
@@ -199,7 +203,7 @@ This dataset appears clean with consistent formatting and no missing values, mak
                 "provider": os.getenv("MODEL_PROVIDER", "anthropic"),
                 "model": os.getenv("MODEL_NAME", "claude-3-5-sonnet-latest"),
                 "api_key": os.getenv("ANTHROPIC_API_KEY"),
-                "temperature": float(os.getenv("TEMPERATURE", 1.0)),
                 "max_tokens": int(os.getenv("MAX_TOKENS", 6000))
             }
@@ -273,7 +277,7 @@ This dataset appears clean with consistent formatting and no missing values, mak
                 "provider": os.getenv("MODEL_PROVIDER", "anthropic"),
                 "model": os.getenv("MODEL_NAME", "claude-3-5-sonnet-latest"),
                 "api_key": os.getenv("ANTHROPIC_API_KEY"),
-                "temperature": float(os.getenv("TEMPERATURE", 1.0)),
                 "max_tokens": int(os.getenv("MAX_TOKENS", 6000))
             }

 # Initialize logger
 logger = Logger("session_manager", see_time=False, console_log=False)
+# Helper to clamp temperature to valid range
+def _get_clamped_temperature():
+    return min(1.0, max(0.0, float(os.getenv("TEMPERATURE", "1.0"))))
 class SessionManager:
     """
     Manages session-specific state, including datasets, retrievers, and AI systems.
                 "provider": os.getenv("MODEL_PROVIDER", "anthropic"),
                 "model": os.getenv("MODEL_NAME", "claude-3-5-sonnet-latest"),
                 "api_key": os.getenv("ANTHROPIC_API_KEY"),
+                "temperature": _get_clamped_temperature(),
                 "max_tokens": int(os.getenv("MAX_TOKENS", 6000))
             }
                 "provider": os.getenv("MODEL_PROVIDER", "anthropic"),
                 "model": os.getenv("MODEL_NAME", "claude-3-5-sonnet-latest"),
                 "api_key": os.getenv("ANTHROPIC_API_KEY"),
+                "temperature": _get_clamped_temperature(),
                 "max_tokens": int(os.getenv("MAX_TOKENS", 6000))
             }
                 "provider": os.getenv("MODEL_PROVIDER", "anthropic"),
                 "model": os.getenv("MODEL_NAME", "claude-3-5-sonnet-latest"),
                 "api_key": os.getenv("ANTHROPIC_API_KEY"),
+                "temperature": _get_clamped_temperature(),
                 "max_tokens": int(os.getenv("MAX_TOKENS", 6000))
             }

src/routes/session_routes.py CHANGED Viewed

@@ -384,23 +384,26 @@ async def update_model_settings(
         # Get session state to update model config
         session_state = app_state.get_session_state(session_id)
         # Create the model config
         if 'gpt-5' in str(settings.model):
             model_config = {
                 "provider": settings.provider,
                 "model": settings.model,
                 "api_key": settings.api_key,
-                "temperature": settings.temperature,
                 "max_tokens":16_000
                 # "max_completion_tokens": 2500
             }
-        elif 'o1-' in str(settings.model):
             model_config = {
                 "provider": settings.provider,
                 "model": settings.model,
                 "api_key": settings.api_key,
-                "temperature": 1,
-                "max_tokens":5001
             }
@@ -409,7 +412,7 @@ async def update_model_settings(
                 "provider": settings.provider,
                 "model": settings.model,
                 "api_key": settings.api_key,
-                "temperature": settings.temperature,
                 "max_tokens": settings.max_tokens
             }

         # Get session state to update model config
         session_state = app_state.get_session_state(session_id)
+        # Clamp temperature to valid range (0..1 for all providers)
+        clamped_temp = min(1.0, max(0.0, float(settings.temperature)))
         # Create the model config
         if 'gpt-5' in str(settings.model):
             model_config = {
                 "provider": settings.provider,
                 "model": settings.model,
                 "api_key": settings.api_key,
+                "temperature": 1,
                 "max_tokens":16_000
                 # "max_completion_tokens": 2500
             }
+        elif 'o1' or 'o3' in str(settings.model):
             model_config = {
                 "provider": settings.provider,
                 "model": settings.model,
                 "api_key": settings.api_key,
+                "temperature": 1.0,  # O-series only supports 1
+                "max_tokens":20_000
             }
                 "provider": settings.provider,
                 "model": settings.model,
                 "api_key": settings.api_key,
+                "temperature": clamped_temp,
                 "max_tokens": settings.max_tokens
             }

src/utils/model_registry.py CHANGED Viewed

@@ -10,6 +10,9 @@ PROVIDERS = {
 }
 max_tokens = int(os.getenv("MAX_TOKENS", 6000))
 small_lm = dspy.LM('openai/gpt-4o-mini',max_tokens=300,api_key=os.getenv("OPENAI_API_KEY"), cache=False)
 mid_lm = dspy.LM('openai/gpt-4o-mini',max_tokens=1300,api_key=os.getenv("OPENAI_API_KEY"), cache=False)
@@ -22,7 +25,7 @@ gpt_4o_mini = dspy.LM('openai/gpt-4o-mini',max_tokens=4000,api_key=os.getenv("OP
 gpt_5_mini = dspy.LM(
     model="openai/gpt-5-mini",
     api_key=os.getenv("OPENAI_API_KEY"),
-    temperature=float(os.getenv("TEMPERATURE", 1.0)),
     max_tokens= 16_000,
     # max_completion_tokens=max_tokens,
     cache=False
@@ -31,7 +34,7 @@ gpt_5_mini = dspy.LM(
 gpt_5 = dspy.LM(
     model="openai/gpt-5",
     api_key=os.getenv("OPENAI_API_KEY"),
-    temperature=float(os.getenv("TEMPERATURE", 1.0)),
         max_tokens= 16_000,
     # max_completion_tokens=max_tokens,  # Use max_completion_tokens for gpt-5
     cache=False
@@ -40,7 +43,7 @@ gpt_5 = dspy.LM(
 gpt_5_nano = dspy.LM(
     model="openai/gpt-5-nano",
     api_key=os.getenv("OPENAI_API_KEY"),
-    temperature=float(os.getenv("TEMPERATURE", 1.0)),
     max_tokens= 16_000,
     # max_completion_tokens=max_tokens,
     cache=False
@@ -73,7 +76,7 @@ o1_mini = dspy.LM(
 o3 = dspy.LM(
     model="openai/o3-2025-04-16",
     api_key=os.getenv("OPENAI_API_KEY"),
-    temperature=float(os.getenv("TEMPERATURE", 1.0)),
     max_tokens=20_000,
     cache=False
 )
@@ -81,7 +84,7 @@ o3 = dspy.LM(
 o3_mini = dspy.LM(
     model="openai/o3-mini",
     api_key=os.getenv("OPENAI_API_KEY"),
-    temperature=float(os.getenv("TEMPERATURE", 1.0)),
     max_tokens=20_000,
     cache=False
 )
@@ -89,16 +92,16 @@ o3_mini = dspy.LM(
 claude_4_5_sonnet_latest = dspy.LM(
     model="anthropic/claude-sonnet-4-5-20250929",
     api_key=os.getenv("ANTHROPIC_API_KEY"),
-    temperature=float(os.getenv("TEMPERATURE", 1.0)),
     max_tokens=max_tokens,
     cache=False
-)
 # Anthropic models
 claude_3_5_haiku_latest = dspy.LM(
     model="anthropic/claude-3-5-haiku-latest",
     api_key=os.getenv("ANTHROPIC_API_KEY"),
-    temperature=float(os.getenv("TEMPERATURE", 1.0)),
     max_tokens=max_tokens,
     cache=False
 )
@@ -106,7 +109,7 @@ claude_3_5_haiku_latest = dspy.LM(
 claude_3_7_sonnet_latest = dspy.LM(
     model="anthropic/claude-3-7-sonnet-latest",
     api_key=os.getenv("ANTHROPIC_API_KEY"),
-    temperature=float(os.getenv("TEMPERATURE", 1.0)),
     max_tokens=max_tokens,
     cache=False
 )
@@ -114,7 +117,7 @@ claude_3_7_sonnet_latest = dspy.LM(
 claude_3_5_sonnet_latest = dspy.LM(
     model="anthropic/claude-3-5-sonnet-latest",
     api_key=os.getenv("ANTHROPIC_API_KEY"),
-    temperature=float(os.getenv("TEMPERATURE", 1.0)),
     max_tokens=max_tokens,
     cache=False
 )
@@ -122,7 +125,7 @@ claude_3_5_sonnet_latest = dspy.LM(
 claude_sonnet_4_20250514 = dspy.LM(
     model="anthropic/claude-sonnet-4-20250514",
     api_key=os.getenv("ANTHROPIC_API_KEY"),
-    temperature=float(os.getenv("TEMPERATURE", 1.0)),
     max_tokens=max_tokens,
     cache=False
 )
@@ -130,7 +133,7 @@ claude_sonnet_4_20250514 = dspy.LM(
 claude_3_opus_latest = dspy.LM(
     model="anthropic/claude-3-opus-latest",
     api_key=os.getenv("ANTHROPIC_API_KEY"),
-    temperature=float(os.getenv("TEMPERATURE", 1.0)),
     max_tokens=max_tokens,
     cache=False
 )
@@ -138,7 +141,7 @@ claude_3_opus_latest = dspy.LM(
 claude_opus_4_20250514 = dspy.LM(
     model="anthropic/claude-opus-4-20250514",
     api_key=os.getenv("ANTHROPIC_API_KEY"),
-    temperature=float(os.getenv("TEMPERATURE", 1.0)),
     max_tokens=max_tokens,
     cache=False
 )
@@ -146,7 +149,7 @@ claude_opus_4_20250514 = dspy.LM(
 claude_opus_4_1 = dspy.LM(
     model="anthropic/claude-opus-4-1",
     api_key=os.getenv("ANTHROPIC_API_KEY"),
-    temperature=float(os.getenv("TEMPERATURE", 1.0)),
     max_tokens=max_tokens,
     cache=False
 )
@@ -155,7 +158,7 @@ claude_opus_4_1 = dspy.LM(
 deepseek_r1_distill_llama_70b = dspy.LM(
     model="groq/deepseek-r1-distill-llama-70b",
     api_key=os.getenv("GROQ_API_KEY"),
-    temperature=float(os.getenv("TEMPERATURE", 1.0)),
     max_tokens=max_tokens,
     cache=False
 )
@@ -163,7 +166,7 @@ deepseek_r1_distill_llama_70b = dspy.LM(
 gpt_oss_120B = dspy.LM(
     model="groq/gpt-oss-120B",
     api_key=os.getenv("GROQ_API_KEY"),
-    temperature=float(os.getenv("TEMPERATURE", 1.0)),
     max_tokens=max_tokens,
     cache=False
 )
@@ -171,7 +174,7 @@ gpt_oss_120B = dspy.LM(
 gpt_oss_20B = dspy.LM(
     model="groq/gpt-oss-20B",
     api_key=os.getenv("GROQ_API_KEY"),
-    temperature=float(os.getenv("TEMPERATURE", 1.0)),
     max_tokens=max_tokens,
     cache=False
 )
@@ -179,7 +182,7 @@ gpt_oss_20B = dspy.LM(
 gemini_2_5_pro_preview_03_25 = dspy.LM(
     model="gemini/gemini-2.5-pro-preview-03-25",
     api_key=os.getenv("GEMINI_API_KEY"),
-    temperature=float(os.getenv("TEMPERATURE", 1.0)),
     max_tokens=max_tokens,
     cache=False
 )

 }
 max_tokens = int(os.getenv("MAX_TOKENS", 6000))
+# Clamp temperature to valid range (0..1) for all models
+default_temperature = min(1.0, max(0.0, float(os.getenv("TEMPERATURE", "1.0"))))
 small_lm = dspy.LM('openai/gpt-4o-mini',max_tokens=300,api_key=os.getenv("OPENAI_API_KEY"), cache=False)
 mid_lm = dspy.LM('openai/gpt-4o-mini',max_tokens=1300,api_key=os.getenv("OPENAI_API_KEY"), cache=False)
 gpt_5_mini = dspy.LM(
     model="openai/gpt-5-mini",
     api_key=os.getenv("OPENAI_API_KEY"),
+    temperature=default_temperature,
     max_tokens= 16_000,
     # max_completion_tokens=max_tokens,
     cache=False
 gpt_5 = dspy.LM(
     model="openai/gpt-5",
     api_key=os.getenv("OPENAI_API_KEY"),
+    temperature=default_temperature,
         max_tokens= 16_000,
     # max_completion_tokens=max_tokens,  # Use max_completion_tokens for gpt-5
     cache=False
 gpt_5_nano = dspy.LM(
     model="openai/gpt-5-nano",
     api_key=os.getenv("OPENAI_API_KEY"),
+    temperature=default_temperature,
     max_tokens= 16_000,
     # max_completion_tokens=max_tokens,
     cache=False
 o3 = dspy.LM(
     model="openai/o3-2025-04-16",
     api_key=os.getenv("OPENAI_API_KEY"),
+    temperature=default_temperature,
     max_tokens=20_000,
     cache=False
 )
 o3_mini = dspy.LM(
     model="openai/o3-mini",
     api_key=os.getenv("OPENAI_API_KEY"),
+    temperature=default_temperature,
     max_tokens=20_000,
     cache=False
 )
 claude_4_5_sonnet_latest = dspy.LM(
     model="anthropic/claude-sonnet-4-5-20250929",
     api_key=os.getenv("ANTHROPIC_API_KEY"),
+    temperature=default_temperature,
     max_tokens=max_tokens,
     cache=False
+) don
 # Anthropic models
 claude_3_5_haiku_latest = dspy.LM(
     model="anthropic/claude-3-5-haiku-latest",
     api_key=os.getenv("ANTHROPIC_API_KEY"),
+    temperature=default_temperature,
     max_tokens=max_tokens,
     cache=False
 )
 claude_3_7_sonnet_latest = dspy.LM(
     model="anthropic/claude-3-7-sonnet-latest",
     api_key=os.getenv("ANTHROPIC_API_KEY"),
+    temperature=default_temperature,
     max_tokens=max_tokens,
     cache=False
 )
 claude_3_5_sonnet_latest = dspy.LM(
     model="anthropic/claude-3-5-sonnet-latest",
     api_key=os.getenv("ANTHROPIC_API_KEY"),
+    temperature=default_temperature,
     max_tokens=max_tokens,
     cache=False
 )
 claude_sonnet_4_20250514 = dspy.LM(
     model="anthropic/claude-sonnet-4-20250514",
     api_key=os.getenv("ANTHROPIC_API_KEY"),
+    temperature=default_temperature,
     max_tokens=max_tokens,
     cache=False
 )
 claude_3_opus_latest = dspy.LM(
     model="anthropic/claude-3-opus-latest",
     api_key=os.getenv("ANTHROPIC_API_KEY"),
+    temperature=default_temperature,
     max_tokens=max_tokens,
     cache=False
 )
 claude_opus_4_20250514 = dspy.LM(
     model="anthropic/claude-opus-4-20250514",
     api_key=os.getenv("ANTHROPIC_API_KEY"),
+    temperature=default_temperature,
     max_tokens=max_tokens,
     cache=False
 )
 claude_opus_4_1 = dspy.LM(
     model="anthropic/claude-opus-4-1",
     api_key=os.getenv("ANTHROPIC_API_KEY"),
+    temperature=default_temperature,
     max_tokens=max_tokens,
     cache=False
 )
 deepseek_r1_distill_llama_70b = dspy.LM(
     model="groq/deepseek-r1-distill-llama-70b",
     api_key=os.getenv("GROQ_API_KEY"),
+    temperature=default_temperature,
     max_tokens=max_tokens,
     cache=False
 )
 gpt_oss_120B = dspy.LM(
     model="groq/gpt-oss-120B",
     api_key=os.getenv("GROQ_API_KEY"),
+    temperature=default_temperature,
     max_tokens=max_tokens,
     cache=False
 )
 gpt_oss_20B = dspy.LM(
     model="groq/gpt-oss-20B",
     api_key=os.getenv("GROQ_API_KEY"),
+    temperature=default_temperature,
     max_tokens=max_tokens,
     cache=False
 )
 gemini_2_5_pro_preview_03_25 = dspy.LM(
     model="gemini/gemini-2.5-pro-preview-03-25",
     api_key=os.getenv("GEMINI_API_KEY"),
+    temperature=default_temperature,
     max_tokens=max_tokens,
     cache=False
 )