Spaces:

CodeCommunity
/

gitgud-ai

Paused

App Files Files Community

CodeCommunity commited on 11 days ago

Commit

2286df7

verified ·

1 Parent(s): 099f735

Create app/core/model_loader.py

Browse files

Files changed (1) hide show

app/core/model_loader.py +242 -0

app/core/model_loader.py ADDED Viewed

	@@ -0,0 +1,242 @@

+# app/core/model_loader.py
+import os
+import json
+import logging
+import time
+from datetime import datetime
+import google.generativeai as genai
+from google.generativeai.types import HarmCategory, HarmBlockThreshold
+from dotenv import load_dotenv
+# Force load .env immediately upon module import
+load_dotenv()
+logger = logging.getLogger(__name__)
+STATS_FILE = "usage_stats.json"
+class LLMSingleton:
+    _instance = None
+    @classmethod
+    def get_instance(cls):
+        if cls._instance is None:
+            cls._instance = cls()
+        return cls._instance
+    def __init__(self):
+        if self._instance is not None:
+            raise Exception("Singleton instance already exists!")
+        self.api_key = os.getenv("GEMINI_API_KEY")
+        if not self.api_key:
+            logger.warning("⚠️ GEMINI_API_KEY not found in environment variables. AI features will fail.")
+        else:
+            genai.configure(api_key=self.api_key)
+        # Gemini Flash Latest: Stable alias (likely 1.5 Flash)
+        # Explicitly pinning to 1.5-flash to guarantee the 1500 RPD free tier
+        self.model_name = "gemini-flash-latest"
+        self.generation_config = {
+            "temperature": 0.3,
+            "top_p": 0.95,
+            "top_k": 64,
+            "max_output_tokens": 8192,
+            "response_mime_type": "application/json",
+        }
+        self.safety_settings = {
+            HarmCategory.HARM_CATEGORY_HARASSMENT: HarmBlockThreshold.BLOCK_NONE,
+            HarmCategory.HARM_CATEGORY_HATE_SPEECH: HarmBlockThreshold.BLOCK_NONE,
+            HarmCategory.HARM_CATEGORY_SEXUALLY_EXPLICIT: HarmBlockThreshold.BLOCK_NONE,
+            HarmCategory.HARM_CATEGORY_DANGEROUS_CONTENT: HarmBlockThreshold.BLOCK_NONE,
+        }
+        # Load persistent stats
+        self.stats = self._load_stats()
+        self._check_daily_reset()
+        # RPM Tracking
+        self.rpm_limit = 15
+        self.minute_window_start = time.time()
+        self.requests_this_minute = 0
+    def _load_stats(self):
+        default_stats = {
+            "total_requests": 0,
+            "successful_requests": 0,
+            "rate_limit_hits": 0,
+            "input_tokens": 0,
+            "output_tokens": 0,
+            "errors": 0,
+            "local_model_requests": 0,
+            "date": datetime.now().strftime("%Y-%m-%d"),
+            "daily_requests_count": 0
+        }
+        if os.path.exists(STATS_FILE):
+            try:
+                with open(STATS_FILE, "r") as f:
+                    data = json.load(f)
+                    # Merge defaults for backward compatibility
+                    return {**default_stats, **data}
+            except Exception as e:
+                logger.error(f"Failed to load stats: {e}")
+        return default_stats
+    def _save_stats(self):
+        try:
+            with open(STATS_FILE, "w") as f:
+                json.dump(self.stats, f, indent=2)
+        except Exception as e:
+            logger.error(f"Failed to save stats: {e}")
+    def _check_daily_reset(self):
+        today = datetime.now().strftime("%Y-%m-%d")
+        if self.stats.get("date") != today:
+            logger.info("📅 New day detected. Resetting daily AI quotas.")
+            self.stats["date"] = today
+            self.stats["daily_requests_count"] = 0
+            # We don't reset total_requests to keep lifetime stats, or we could.
+            # Let's keep lifetime stats in 'total_requests' and daily in 'daily_requests_count'.
+            self._save_stats()
+    def _check_rpm_window(self):
+        """
+        Resets the minute counter if 60 seconds have passed.
+        """
+        now = time.time()
+        if now - self.minute_window_start >= 60:
+            self.minute_window_start = now
+            self.requests_this_minute = 0
+    def get_usage_stats(self):
+        self._check_daily_reset()
+        self._check_rpm_window()
+        stats = self.stats.copy()
+        # Limits for Gemini 3 Flash (Free Tier)
+        daily_limit = 500
+        stats["limits"] = {
+            "requests_per_minute": self.rpm_limit,
+            "requests_per_day": daily_limit
+        }
+        stats["remaining_daily_requests"] = max(0, daily_limit - stats["daily_requests_count"])
+        stats["remaining_rpm"] = max(0, self.rpm_limit - self.requests_this_minute)
+        return stats
+    def track_local_usage(self, input_chars: int = 0):
+        """
+        Track usage of local models (like CodeBERT).
+        """
+        self.stats["local_model_requests"] += 1
+        self.stats["input_tokens"] += input_chars // 4
+        self._save_stats()
+    def generate(self, prompt: str, max_tokens: int = 8192) -> str:
+        import random
+        self._check_daily_reset()
+        self._check_rpm_window()
+        if not self.api_key:
+            logger.error("Cannot generate: Missing GEMINI_API_KEY")
+            return ""
+        # Check daily quota before sending (Gemini 3 Flash Limit)
+        if self.stats["daily_requests_count"] >= 500:
+             logger.error("❌ Daily Quota Exceeded (500 requests). Request blocked.")
+             return ""
+        # Track attempt
+        self.requests_this_minute += 1
+        self.stats["total_requests"] += 1
+        self.stats["daily_requests_count"] += 1
+        self._save_stats()
+        # Log the prompt source (first 50 chars) to identify the caller
+        logger.info(f"🤖 Generating with Gemini. Prompt start: {prompt[:50]}...")
+        model = genai.GenerativeModel(
+            model_name=self.model_name,
+            generation_config=self.generation_config,
+            safety_settings=self.safety_settings
+        )
+        retries = 0
+        max_retries = 5
+        base_delay = 2
+        while retries <= max_retries:
+            try:
+                # Estimate input tokens (rough approximation: 4 chars/token)
+                self.stats["input_tokens"] += len(prompt) // 4
+                response = model.generate_content(prompt)
+                # Update stats
+                self.stats["successful_requests"] += 1
+                if response.usage_metadata:
+                    if response.text:
+                        self.stats["output_tokens"] += len(response.text) // 4
+                else:
+                     if response.text:
+                        self.stats["output_tokens"] += len(response.text) // 4
+                self._save_stats()
+                return response.text.strip()
+            except Exception as e:
+                error_str = str(e)
+                if "429" in error_str or "quota" in error_str.lower():
+                    self.stats["rate_limit_hits"] += 1
+                    self._save_stats()
+                    wait_time = (base_delay * (2 ** retries)) + random.uniform(0, 1)
+                    logger.warning(f"⚠️ Rate limit hit. Retrying in {wait_time:.2f}s... (Attempt {retries+1}/{max_retries})")
+                    time.sleep(wait_time)
+                    retries += 1
+                else:
+                    self.stats["errors"] += 1
+                    self._save_stats()
+                    logger.error(f"Gemini generation failed: {e}")
+                    return ""
+        self.stats["errors"] += 1
+        self._save_stats()
+        logger.error("❌ Max retries reached. Request failed.")
+        return ""
+    def generate_text(self, prompt: str) -> str:
+        """
+        Helper for non-JSON text generation (like Guides).
+        """
+        self._check_daily_reset()
+        self._check_rpm_window()
+        if not self.api_key:
+            return "Error: Missing API Key."
+        if self.stats["daily_requests_count"] >= 500:
+             return "Error: Daily Quota Exceeded."
+        try:
+            self.requests_this_minute += 1
+            self.stats["total_requests"] += 1
+            self.stats["daily_requests_count"] += 1
+            self._save_stats()
+            # Override config for text
+            config = self.generation_config.copy()
+            config["response_mime_type"] = "text/plain"
+            model = genai.GenerativeModel(
+                model_name=self.model_name,
+                generation_config=config,
+                safety_settings=self.safety_settings
+            )
+            response = model.generate_content(prompt)
+            return response.text
+        except Exception as e:
+            logger.error(f"Gemini text generation failed: {e}")
+            return f"Error generating content: {str(e)}"
+llm_engine = LLMSingleton.get_instance()