Spaces:

Dun3Co
/

LogRegModel

Sleeping

App Files Files Community

Dun3Co commited on Oct 9, 2025

Commit

d159d13

verified ·

1 Parent(s): 35daaab

Upload 4 files

Browse files

Files changed (4) hide show

Dockerfile +31 -0
app.py +159 -0
model_1mvp.pkl +3 -0
requirements.txt +6 -0

Dockerfile ADDED Viewed

	@@ -0,0 +1,31 @@

+# Use lightweight Python image
+FROM python:3.12-slim
+# Prevent Python from writing .pyc files and buffering output
+ENV PYTHONDONTWRITEBYTECODE=1
+ENV PYTHONUNBUFFERED=1
+# Set the working directory
+WORKDIR /app
+# Install system dependencies required by numpy, pandas, shap
+RUN apt-get update && \
+    apt-get install -y --no-install-recommends \
+    build-essential \
+    gcc \
+    && rm -rf /var/lib/apt/lists/*
+# Copy requirements first to leverage Docker layer caching
+COPY requirements.txt .
+# Install dependencies
+RUN pip install --no-cache-dir -r requirements.txt
+# Copy application code and model
+COPY . .
+# Expose Hugging Face default port
+EXPOSE 7860
+# Start FastAPI app
+CMD ["uvicorn", "app:app", "--host", "0.0.0.0", "--port", "7860"]

app.py ADDED Viewed

	@@ -0,0 +1,159 @@

+from fastapi import FastAPI
+from pydantic import BaseModel
+from typing import List, Literal, Optional
+import joblib
+import numpy as np
+import pandas as pd
+import requests
+import shap
+from sklearn.metrics import roc_auc_score, precision_recall_curve, auc
+# =====================================================
+# CONFIG
+# =====================================================
+# Replace these with your NoCoDB API details
+NOCO_API_URL = "https://dun3co-sdc-nocodb.hf.space/api/v2/tables/m39a8axnn3980w9/records"
+NOCO_VIEW_ID = "vwjuv5jnaet9npuu"
+NOCO_API_TOKEN = "YOUR_NOCODB_TOKEN"  # Replace or load from env variable
+HEADERS = {"xc-token": NOCO_API_TOKEN}
+# =====================================================
+# MODEL LOADING
+# =====================================================
+model = joblib.load("model_1mvp.pkl")
+app = FastAPI(title="Logistic Regression API 2")
+# =====================================================
+# DATA SCHEMAS
+# =====================================================
+class InputData(BaseModel):
+    age: int
+    balance: float
+    day: int
+    campaign: int
+    job: str
+    education: str
+    default: Literal["yes", "no", "unknown"]
+    housing: Literal["yes", "no", "unknown"]
+    loan: Literal["yes", "no", "unknown"]
+    months_since_previous_contact: str
+    n_previous_contacts: str
+    poutcome: str
+    had_contact: bool
+    is_single: bool
+    uknown_contact: bool
+class BatchInputData(BaseModel):
+    data: List[InputData]
+# =====================================================
+# HEALTH CHECK
+# =====================================================
+@app.get("/health")
+def health():
+    return {"status": "ok"}
+# =====================================================
+# NOCODB DATA FETCHING
+# =====================================================
+def fetch_test_data(limit: int = 100):
+    """Fetch test or sample data from NoCoDB view."""
+    params = {"offset": 0, "limit": limit, "viewId": NOCO_VIEW_ID}
+    res = requests.get(NOCO_API_URL, headers=HEADERS, params=params)
+    res.raise_for_status()
+    data = res.json()["list"]
+    return pd.DataFrame(data)
+# =====================================================
+# PREDICTION ENDPOINT
+# =====================================================
+@app.post("/predict")
+def predict(batch: BatchInputData):
+    try:
+        X = pd.DataFrame([item.dict() for item in batch.data])
+        preds = model.predict(X)
+        probs = model.predict_proba(X)[:, 1]
+        return {
+            "predictions": preds.tolist(),
+            "probabilities": probs.tolist()
+        }
+    except Exception as e:
+        import traceback
+        return {"error": str(e), "trace": traceback.format_exc()}
+# =====================================================
+# EXPLAINABILITY ENDPOINT
+# =====================================================
+@app.post("/explain")
+def explain(batch: Optional[BatchInputData] = None, limit: int = 100):
+    """Generate SHAP values either from provided data or from NoCoDB test data."""
+    try:
+        if batch:
+            X = pd.DataFrame([item.dict() for item in batch.data])
+        else:
+            X = fetch_test_data(limit=limit)
+        explainer = shap.Explainer(model, X)
+        shap_values = explainer(X)
+        # Aggregate mean absolute SHAP value per feature
+        shap_summary = pd.DataFrame({
+            "feature": X.columns,
+            "mean_abs_shap": np.abs(shap_values.values).mean(axis=0)
+        }).sort_values("mean_abs_shap", ascending=False)
+        return {
+            "n_samples": len(X),
+            "shap_summary": shap_summary.to_dict(orient="records")
+        }
+    except Exception as e:
+        import traceback
+        return {"error": str(e), "trace": traceback.format_exc()}
+# =====================================================
+# METRICS ENDPOINT
+# =====================================================
+@app.post("/metrics")
+def metrics(batch: Optional[BatchInputData] = None, y_true: Optional[List[int]] = None, limit: int = 100):
+    """Compute ROC AUC and threshold analysis, using input or NoCoDB test data."""
+    try:
+        # Use provided data or fallback to test data from NoCoDB
+        if batch:
+            X = pd.DataFrame([item.dict() for item in batch.data])
+        else:
+            X = fetch_test_data(limit=limit)
+        if y_true is None:
+            # Look for 'y_true' column in NoCoDB data
+            if "y_true" in X.columns:
+                y_true = X["y_true"].astype(int).tolist()
+                X = X.drop(columns=["y_true"])
+            else:
+                return {"error": "y_true values not provided or found in dataset"}
+        y_prob = model.predict_proba(X)[:, 1]
+        roc_auc = roc_auc_score(y_true, y_prob)
+        precision, recall, thresholds = precision_recall_curve(y_true, y_prob)
+        pr_auc = auc(recall, precision)
+        return {
+            "roc_auc": roc_auc,
+            "pr_auc": pr_auc,
+            "thresholds": thresholds.tolist()[:20],  # limit output size
+            "precision": precision.tolist()[:20],
+            "recall": recall.tolist()[:20]
+        }
+    except Exception as e:
+        import traceback
+        return {"error": str(e), "trace": traceback.format_exc()}

model_1mvp.pkl ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:779b2825e23ee94439d9d6b66ad3203b83bd1fda61f7f1808492ced0c4ca6e02
+size 5946

requirements.txt ADDED Viewed

	@@ -0,0 +1,6 @@

+fastapi
+uvicorn
+scikit-learn==1.7.2
+joblib==1.5.2
+numpy==2.3.1
+pandas==2.3.2