Spaces:

neuralworm
/

cognitive_mapping_probe

Sleeping

App Files Files Community

neuralworm commited on 16 days ago

Commit

024ef47

1 Parent(s): 5708c30

cs 2.0

Browse files

Files changed (5) hide show

app.py +65 -80
cognitive_mapping_probe/auto_experiment.py +79 -0
cognitive_mapping_probe/orchestrator_seismograph.py +26 -32
tests/test_app_logic.py +7 -17
tests/test_integration.py +10 -20

app.py CHANGED Viewed

@@ -1,102 +1,87 @@
 import gradio as gr
 import pandas as pd
 import traceback
-import sys
 from cognitive_mapping_probe.orchestrator_seismograph import run_seismic_analysis
 from cognitive_mapping_probe.prompts import RESONANCE_PROMPTS
 from cognitive_mapping_probe.utils import dbg
-# --- UI Theme and Layout ---
-theme = gr.themes.Soft(primary_hue="indigo", secondary_hue="blue").set(
-    body_background_fill="#f0f4f9",
-    block_background_fill="white",
-)
-def run_and_display(
-    model_id: str,
-    prompt_type: str,
-    seed: int,
-    num_steps: int,
-    concept_to_inject: str,
-    injection_strength: float,
-    progress=gr.Progress(track_tqdm=True)
-):
-    """
-    Führt die seismische Analyse durch, inklusive der optionalen Konzeptinjektion.
-    """
     try:
-        results = run_seismic_analysis(
-            model_id=model_id,
-            prompt_type=prompt_type,
-            seed=int(seed),
-            num_steps=int(num_steps),
-            concept_to_inject=concept_to_inject,
-            injection_strength=float(injection_strength),
-            progress_callback=progress
-        )
-        verdict = results.get("verdict", "Analysis complete.")
         stats = results.get("stats", {})
         deltas = results.get("state_deltas", [])
-        df = pd.DataFrame({
-            "Internal Step": range(len(deltas)),
-            "State Change (Delta)": deltas
-        })
-        stats_md = f"### Statistical Signature\n"
-        stats_md += f"- **Mean Delta:** {stats.get('mean_delta', 0):.4f}\n"
-        stats_md += f"- **Std Dev Delta:** {stats.get('std_delta', 0):.4f}\n"
-        stats_md += f"- **Max Delta:** {stats.get('max_delta', 0):.4f}\n"
-        return f"{verdict}\n\n{stats_md}", df, results
     except Exception:
-        error_str = traceback.format_exc()
-        return f"### ❌ Analysis Failed\nAn unexpected error occurred:\n\n```\n{error_str}\n```", pd.DataFrame(), {}
-# --- Gradio App Definition ---
-with gr.Blocks(theme=theme, title="Cognitive Seismograph 2.0") as demo:
-    gr.Markdown("# 🧠 Cognitive Seismograph 2.0: Modulating Internal Dynamics")
-    gr.Markdown(
-        "**Neues Paradigma:** Wir messen nicht nur die intrinsische Dynamik, sondern versuchen sie aktiv durch **Konzeptinjektionen** zu modulieren. Vergleiche die 'seismische Signatur' mit und ohne Injektion."
-    )
-    with gr.Row(variant='panel'):
-        with gr.Column(scale=1):
-            gr.Markdown("### 1. General Parameters")
-            model_id_input = gr.Textbox(value="google/gemma-3-1b-it", label="Model ID")
-            prompt_type_input = gr.Radio(choices=list(RESONANCE_PROMPTS.keys()), value="resonance_prompt", label="Prompt Type")
-            seed_input = gr.Slider(1, 1000, 42, step=1, label="Seed")
-            num_steps_input = gr.Slider(50, 1000, 300, step=10, label="Number of Internal Steps")
-            gr.Markdown("### 2. Modulation Parameters")
-            concept_input = gr.Textbox(label="Concept to Inject", placeholder="e.g., 'solitude' or 'ocean' (leave blank for baseline)")
-            strength_input = gr.Slider(0.0, 5.0, 1.0, step=0.1, label="Injection Strength")
-            run_btn = gr.Button("Run Seismic Analysis", variant="primary")
-        with gr.Column(scale=2):
-            gr.Markdown("### Results")
-            verdict_output = gr.Markdown("Die Analyse der Dynamik erscheint hier.")
-            plot_output = gr.LinePlot(
-                x="Internal Step",
-                y="State Change (Delta)",
-                title="Internal State Dynamics (Cognitive EKG)",
-                show_label=True,
-                height=400,
             )
-            with gr.Accordion("Raw JSON Output", open=False):
-                raw_json_output = gr.JSON()
-    run_btn.click(
-        fn=run_and_display,
-        inputs=[model_id_input, prompt_type_input, seed_input, num_steps_input, concept_input, strength_input],
-        outputs=[verdict_output, plot_output, raw_json_output]
-    )
 if __name__ == "__main__":
-    print("="*80)
-    print("🔬 COGNITIVE SEISMOGRAPH 2.0 (MODULATION-ENABLED) INITIALIZED")
-    print("="*80)
     demo.launch(server_name="0.0.0.0", server_port=7860, debug=True)

 import gradio as gr
 import pandas as pd
 import traceback
 from cognitive_mapping_probe.orchestrator_seismograph import run_seismic_analysis
+from cognitive_mapping_probe.auto_experiment import run_auto_suite, get_curated_experiments
 from cognitive_mapping_probe.prompts import RESONANCE_PROMPTS
 from cognitive_mapping_probe.utils import dbg
+theme = gr.themes.Soft(primary_hue="indigo", secondary_hue="blue").set(body_background_fill="#f0f4f9", block_background_fill="white")
+def run_single_analysis_display(*args, progress=gr.Progress(track_tqdm=True)):
+    """Wrapper für ein einzelnes manuelles Experiment."""
     try:
+        results = run_seismic_analysis(*args, progress_callback=progress)
         stats = results.get("stats", {})
         deltas = results.get("state_deltas", [])
+        df = pd.DataFrame({"Internal Step": range(len(deltas)), "State Change (Delta)": deltas})
+        stats_md = f"### Statistical Signature\n- **Mean Delta:** {stats.get('mean_delta', 0):.4f}\n- **Std Dev Delta:** {stats.get('std_delta', 0):.4f}\n- **Max Delta:** {stats.get('max_delta', 0):.4f}\n"
+        return f"{results.get('verdict', 'Error')}\n\n{stats_md}", df, results
     except Exception:
+        return f"### ❌ Analysis Failed\n```\n{traceback.format_exc()}\n```", pd.DataFrame(), {}
+def run_auto_suite_display(model_id, num_steps, seed, experiment_name, progress=gr.Progress(track_tqdm=True)):
+    """Wrapper für die automatisierte Experiment-Suite."""
+    try:
+        summary_df, all_results = run_auto_suite(model_id, int(num_steps), int(seed), experiment_name, progress)
+        return summary_df, all_results
+    except Exception:
+        return pd.DataFrame(), f"### ❌ Auto-Experiment Failed\n```\n{traceback.format_exc()}\n```"
+with gr.Blocks(theme=theme, title="Cognitive Seismograph 2.1") as demo:
+    gr.Markdown("# 🧠 Cognitive Seismograph 2.1: Automated Experiment Suite")
+    with gr.Tabs():
+        with gr.TabItem("🔬 Manual Single Run"):
+            gr.Markdown("Führe ein einzelnes Experiment mit manuellen Parametern durch, um Hypothesen zu explorieren.")
+            with gr.Row(variant='panel'):
+                with gr.Column(scale=1):
+                    gr.Markdown("### 1. General Parameters")
+                    manual_model_id = gr.Textbox(value="google/gemma-3-1b-it", label="Model ID")
+                    manual_prompt_type = gr.Radio(choices=list(RESONANCE_PROMPTS.keys()), value="resonance_prompt", label="Prompt Type")
+                    manual_seed = gr.Slider(1, 1000, 42, step=1, label="Seed")
+                    manual_num_steps = gr.Slider(50, 1000, 300, step=10, label="Number of Internal Steps")
+                    gr.Markdown("### 2. Modulation Parameters")
+                    manual_concept = gr.Textbox(label="Concept to Inject", placeholder="e.g., 'calmness' (leave blank for baseline)")
+                    manual_strength = gr.Slider(0.0, 5.0, 1.0, step=0.1, label="Injection Strength")
+                    manual_run_btn = gr.Button("Run Single Analysis", variant="primary")
+                with gr.Column(scale=2):
+                    gr.Markdown("### Single Run Results")
+                    manual_verdict = gr.Markdown("Die Analyse erscheint hier.")
+                    manual_plot = gr.LinePlot(x="Internal Step", y="State Change (Delta)", title="Internal State Dynamics", show_label=True, height=400)
+                    with gr.Accordion("Raw JSON Output", open=False):
+                        manual_raw_json = gr.JSON()
+            manual_run_btn.click(
+                fn=run_single_analysis_display,
+                inputs=[manual_model_id, manual_prompt_type, manual_seed, manual_num_steps, manual_concept, manual_strength],
+                outputs=[manual_verdict, manual_plot, manual_raw_json]
             )
+        with gr.TabItem("🚀 Automated Suite"):
+            gr.Markdown("Führe eine vordefinierte, kuratierte Reihe von Experimenten durch, um Hypothesen systematisch zu testen.")
+            with gr.Row(variant='panel'):
+                with gr.Column(scale=1):
+                    gr.Markdown("### Auto-Experiment Parameters")
+                    auto_model_id = gr.Textbox(value="google/gemma-3-1b-it", label="Model ID")
+                    auto_num_steps = gr.Slider(50, 1000, 300, step=10, label="Steps per Run")
+                    auto_seed = gr.Slider(1, 1000, 42, step=1, label="Seed")
+                    auto_experiment_name = gr.Dropdown(choices=list(get_curated_experiments().keys()), value="Calm vs. Chaos", label="Curated Experiment Protocol")
+                    auto_run_btn = gr.Button("Run Curated Auto-Experiment", variant="primary")
+                with gr.Column(scale=2):
+                    gr.Markdown("### Suite Results Summary")
+                    # KORREKTUR: Das 'height'-Argument wird entfernt, um Kompatibilität
+                    # mit verschiedenen Gradio-Versionen sicherzustellen.
+                    auto_summary_df = gr.DataFrame(label="Comparative Results", wrap=True)
+                    with gr.Accordion("Raw JSON for all runs", open=False):
+                        auto_raw_json = gr.JSON()
+            auto_run_btn.click(
+                fn=run_auto_suite_display,
+                inputs=[auto_model_id, auto_num_steps, auto_seed, auto_experiment_name],
+                outputs=[auto_summary_df, auto_raw_json]
+            )
 if __name__ == "__main__":
     demo.launch(server_name="0.0.0.0", server_port=7860, debug=True)

cognitive_mapping_probe/auto_experiment.py ADDED Viewed

	@@ -0,0 +1,79 @@

+import pandas as pd
+from typing import Dict, List, Tuple
+from .orchestrator_seismograph import run_seismic_analysis
+from .utils import dbg
+def get_curated_experiments() -> Dict[str, List[Dict]]:
+    """
+    Definiert die vordefinierten, wissenschaftlichen Experiment-Protokolle.
+    Jedes Protokoll ist eine Liste von einzelnen Läufen, die verglichen werden sollen.
+    """
+    experiments = {
+        "Calm vs. Chaos": [
+            {"label": "Baseline (Chaos)", "prompt_type": "resonance_prompt", "concept": "", "strength": 0.0},
+            {"label": "Modulation: Calmness", "prompt_type": "resonance_prompt", "concept": "calmness, serenity, peace", "strength": 1.5},
+            {"label": "Modulation: Chaos", "prompt_type": "resonance_prompt", "concept": "chaos, storm, anger, noise", "strength": 1.5},
+            {"label": "Control (Stable)", "prompt_type": "control_long_prose", "concept": "", "strength": 0.0},
+        ],
+        "Dose-Response (Calmness)": [
+            {"label": "Strength 0.0", "prompt_type": "resonance_prompt", "concept": "calmness", "strength": 0.0},
+            {"label": "Strength 0.5", "prompt_type": "resonance_prompt", "concept": "calmness", "strength": 0.5},
+            {"label": "Strength 1.0", "prompt_type": "resonance_prompt", "concept": "calmness", "strength": 1.0},
+            {"label": "Strength 2.0", "prompt_type": "resonance_prompt", "concept": "calmness", "strength": 2.0},
+            {"label": "Strength 3.0", "prompt_type": "resonance_prompt", "concept": "calmness", "strength": 3.0},
+        ]
+    }
+    return experiments
+def run_auto_suite(
+    model_id: str,
+    num_steps: int,
+    seed: int,
+    experiment_name: str,
+    progress_callback
+) -> Tuple[pd.DataFrame, Dict]:
+    """
+    Führt eine vollständige, kuratierte Experiment-Suite aus.
+    Iteriert über die definierten Läufe, sammelt die Ergebnisse und erstellt einen Vergleichsbericht.
+    """
+    all_experiments = get_curated_experiments()
+    protocol = all_experiments.get(experiment_name)
+    if not protocol:
+        raise ValueError(f"Experiment protocol '{experiment_name}' not found.")
+    all_results = {}
+    summary_data = []
+    total_runs = len(protocol)
+    for i, run_spec in enumerate(protocol):
+        label = run_spec["label"]
+        dbg(f"--- Running Auto-Experiment: '{label}' ({i+1}/{total_runs}) ---")
+        # Der `run_seismic_analysis` Orchestrator wird für jeden Schritt aufgerufen
+        results = run_seismic_analysis(
+            model_id=model_id,
+            prompt_type=run_spec["prompt_type"],
+            seed=seed,
+            num_steps=num_steps,
+            concept_to_inject=run_spec["concept"],
+            injection_strength=run_spec["strength"],
+            progress_callback=progress_callback
+        )
+        all_results[label] = results
+        stats = results.get("stats", {})
+        # Sammle die wichtigsten Metriken für die Vergleichstabelle
+        summary_data.append({
+            "Experiment": label,
+            "Prompt Type": run_spec["prompt_type"],
+            "Concept": run_spec["concept"] if run_spec["concept"] else "None",
+            "Strength": run_spec["strength"],
+            "Mean Delta": stats.get("mean_delta"),
+            "Std Dev Delta": stats.get("std_delta"),
+            "Max Delta": stats.get("max_delta"),
+        })
+    summary_df = pd.DataFrame(summary_data)
+    return summary_df, all_results

cognitive_mapping_probe/orchestrator_seismograph.py CHANGED Viewed

@@ -1,10 +1,9 @@
 import torch
 import numpy as np
-from typing import Dict, Any
 from .llm_iface import get_or_load_model
 from .resonance_seismograph import run_silent_cogitation_seismic
-# WIEDERHERGESTELLTER IMPORT
 from .concepts import get_concept_vector
 from .utils import dbg
@@ -15,60 +14,55 @@ def run_seismic_analysis(
     num_steps: int,
     concept_to_inject: str,
     injection_strength: float,
-    progress_callback
 ) -> Dict[str, Any]:
     """
-    Orchestriert das "Cognitive Seismograph"-Experiment, jetzt mit optionaler
-    Konzeptinjektion zur Modulation der Dynamik.
     """
-    progress_callback(0.1, desc="Loading model...")
-    llm = get_or_load_model(model_id, seed)
-    # Lade den Konzeptvektor, falls ein Konzept angegeben wurde
     injection_vector = None
     if concept_to_inject and concept_to_inject.strip():
-        progress_callback(0.2, desc=f"Extracting vector for '{concept_to_inject}'...")
         injection_vector = get_concept_vector(llm, concept_to_inject.strip())
-    progress_callback(0.3, desc=f"Running seismic cogitation for '{prompt_type}'...")
     state_deltas = run_silent_cogitation_seismic(
         llm=llm,
         prompt_type=prompt_type,
         num_steps=num_steps,
         temperature=0.1,
-        # Übergebe die neuen Parameter an den Resonanz-Loop
         injection_vector=injection_vector,
         injection_strength=injection_strength
     )
-    progress_callback(0.9, desc="Analyzing dynamics...")
     if state_deltas:
         deltas_np = np.array(state_deltas)
-        stats = {
-            "mean_delta": float(np.mean(deltas_np)),
-            "std_delta": float(np.std(deltas_np)),
-            "max_delta": float(np.max(deltas_np)),
-            "min_delta": float(np.min(deltas_np)),
-        }
-        verdict = f"### ✅ Seismic Analysis Complete\nDie interne Dynamik für '{prompt_type}' wurde über {len(deltas_np)} Schritte aufgezeichnet."
         if injection_vector is not None:
-            verdict += f"\nModuliert mit dem Konzept **'{concept_to_inject}'** bei Stärke **{injection_strength:.2f}**."
     else:
-        stats = {}
-        verdict = "### ⚠️ Analysis Warning\nKeine Zustandsänderungen aufgezeichnet."
-    results = {
-        "verdict": verdict,
-        "stats": stats,
-        "state_deltas": state_deltas
-    }
-    dbg("--- Seismic Analysis Results ---", results)
-    del llm
-    if torch.cuda.is_available():
-        torch.cuda.empty_cache()
     return results

 import torch
 import numpy as np
+from typing import Dict, Any, Optional
 from .llm_iface import get_or_load_model
 from .resonance_seismograph import run_silent_cogitation_seismic
 from .concepts import get_concept_vector
 from .utils import dbg
     num_steps: int,
     concept_to_inject: str,
     injection_strength: float,
+    progress_callback,
+    llm_instance: Optional[Any] = None # Ermöglicht Wiederverwendung des Modells
 ) -> Dict[str, Any]:
     """
+    Orchestriert eine einzelne seismische Analyse. Kann optional eine bestehende
+    LLM-Instanz wiederverwenden, um das Neuladen in automatisierten Suiten zu beschleunigen.
     """
+    # Lade das Modell nur, wenn keine Instanz übergeben wurde
+    if llm_instance is None:
+        progress_callback(0.1, desc="Loading model...")
+        llm = get_or_load_model(model_id, seed)
+        created_llm = True
+    else:
+        llm = llm_instance
+        llm.set_all_seeds(seed) # Setze den Seed für diesen spezifischen Lauf
+        created_llm = False
     injection_vector = None
     if concept_to_inject and concept_to_inject.strip():
+        if not created_llm: progress_callback(0.2, desc=f"Vectorizing '{concept_to_inject}'...")
         injection_vector = get_concept_vector(llm, concept_to_inject.strip())
+    if not created_llm: progress_callback(0.3, desc=f"Recording dynamics...")
     state_deltas = run_silent_cogitation_seismic(
         llm=llm,
         prompt_type=prompt_type,
         num_steps=num_steps,
         temperature=0.1,
         injection_vector=injection_vector,
         injection_strength=injection_strength
     )
+    if not created_llm: progress_callback(0.9, desc="Analyzing...")
     if state_deltas:
         deltas_np = np.array(state_deltas)
+        stats = { "mean_delta": float(np.mean(deltas_np)), "std_delta": float(np.std(deltas_np)), "max_delta": float(np.max(deltas_np)), "min_delta": float(np.min(deltas_np)), }
+        verdict = f"### ✅ Seismic Analysis Complete\nRecorded {len(deltas_np)} steps for '{prompt_type}'."
         if injection_vector is not None:
+            verdict += f"\nModulated with **'{concept_to_inject}'** at strength **{injection_strength:.2f}**."
     else:
+        stats, verdict = {}, "### ⚠️ Analysis Warning\nNo state changes recorded."
+    results = { "verdict": verdict, "stats": stats, "state_deltas": state_deltas }
+    # Gib das Modell nur frei, wenn es in dieser Funktion erstellt wurde
+    if created_llm:
+        del llm
+        if torch.cuda.is_available(): torch.cuda.empty_cache()
     return results

tests/test_app_logic.py CHANGED Viewed

@@ -1,16 +1,13 @@
 import pandas as pd
 import pytest
-# Importiere die zu testende Funktion aus der App-Datei
-from app import run_and_display
-def test_run_and_display_logic(mocker):
     """
-    Testet die Datenverarbeitungs- und UI-Formatierungslogik in `app.py`.
-    Wir mocken die teure `run_seismic_analysis`-Funktion, um uns nur auf die
-    Logik von `run_and_display` zu konzentrieren.
     """
-    # 1. Definiere die Schein-Ausgabe, die `run_seismic_analysis` zurückgeben soll
     mock_results = {
         "verdict": "Mock Verdict",
         "stats": { "mean_delta": 0.5, "std_delta": 0.1, "max_delta": 1.0, },
@@ -20,18 +17,11 @@ def test_run_and_display_logic(mocker):
     mock_progress = mocker.MagicMock()
-    # 2. Rufe die zu testende Funktion mit den KORRIGIERTEN Argumenten auf
-    verdict_md, plot_df, raw_json = run_and_display(
-        model_id="mock_model",
-        prompt_type="mock_prompt",
-        seed=42,
-        num_steps=3,
-        concept_to_inject="",  # Fehlendes Argument hinzugefügt
-        injection_strength=0.0, # Fehlendes Argument hinzugefügt
-        progress=mock_progress
     )
-    # 3. Validiere die Ausgaben
     assert "Mock Verdict" in verdict_md
     assert "0.5000" in verdict_md
     assert isinstance(plot_df, pd.DataFrame)

 import pandas as pd
 import pytest
+# KORREKTUR: Importiere den neuen, korrekten Funktionsnamen
+from app import run_single_analysis_display
+def test_run_single_analysis_display_logic(mocker):
     """
+    Testet die Datenverarbeitungs- und UI-Formatierungslogik der Einzel-Analyse.
     """
     mock_results = {
         "verdict": "Mock Verdict",
         "stats": { "mean_delta": 0.5, "std_delta": 0.1, "max_delta": 1.0, },
     mock_progress = mocker.MagicMock()
+    # Rufe die umbenannte Funktion mit den korrekten Argumenten auf
+    verdict_md, plot_df, raw_json = run_single_analysis_display(
+        "mock_model", "mock_prompt", 42, 3, "", 0.0, progress=mock_progress
     )
     assert "Mock Verdict" in verdict_md
     assert "0.5000" in verdict_md
     assert isinstance(plot_df, pd.DataFrame)

tests/test_integration.py CHANGED Viewed

@@ -1,46 +1,36 @@
 import pytest
 import pandas as pd
-# Importiere die Top-Level-Funktionen, die die Integration darstellen
-from app import run_and_display
 from cognitive_mapping_probe.orchestrator_seismograph import run_seismic_analysis
 def test_end_to_end_with_mock_llm(mock_llm, mocker):
     """
-    Ein End-to-End-Integrationstest, der den gesamten Datenfluss von der App
-    über den Orchestrator bis zum (gemockten) LLM validiert.
     """
-    # 1. Führe den Orchestrator mit dem `mock_llm` und den KORRIGIERTEN Argumenten aus.
     results = run_seismic_analysis(
         model_id="mock_model",
         prompt_type="control_long_prose",
         seed=42,
         num_steps=5,
-        concept_to_inject="test_concept", # Argument hinzugefügt
-        injection_strength=1.0,         # Argument hinzugefügt
         progress_callback=mocker.MagicMock()
     )
-    # ASSERT 1: Überprüfe, ob der Orchestrator plausible Ergebnisse liefert
     assert "stats" in results
     assert len(results["state_deltas"]) == 5
-    assert results["stats"]["mean_delta"] > 0
-    # 2. Mocke nun den Orchestrator, um die App-Logik mit seinen Ergebnissen zu füttern
     mocker.patch('app.run_seismic_analysis', return_value=results)
-    # 3. Führe die App-Logik mit den KORRIGIERTEN Argumenten aus
-    _, plot_df, _ = run_and_display(
-        model_id="mock_model",
-        prompt_type="control_long_prose",
-        seed=42,
-        num_steps=5,
-        concept_to_inject="test_concept", # Argument hinzugefügt
-        injection_strength=1.0,         # Argument hinzugefügt
-        progress=mocker.MagicMock()
     )
-    # ASSERT 2: Überprüfe, ob die App-Logik die Daten korrekt verarbeitet hat
     assert isinstance(plot_df, pd.DataFrame)
     assert len(plot_df) == 5
     assert "State Change (Delta)" in plot_df.columns

 import pytest
 import pandas as pd
+# KORREKTUR: Importiere den neuen, korrekten Funktionsnamen
+from app import run_single_analysis_display
 from cognitive_mapping_probe.orchestrator_seismograph import run_seismic_analysis
 def test_end_to_end_with_mock_llm(mock_llm, mocker):
     """
+    Ein End-to-End-Integrationstest, der den gesamten Datenfluss validiert.
     """
+    # 1. Führe den Orchestrator mit dem `mock_llm` aus.
     results = run_seismic_analysis(
         model_id="mock_model",
         prompt_type="control_long_prose",
         seed=42,
         num_steps=5,
+        concept_to_inject="test_concept",
+        injection_strength=1.0,
         progress_callback=mocker.MagicMock()
     )
     assert "stats" in results
     assert len(results["state_deltas"]) == 5
+    # 2. Mocke den Orchestrator, um die App-Logik zu testen
     mocker.patch('app.run_seismic_analysis', return_value=results)
+    # 3. Führe die App-Logik (umbenannte Funktion) aus
+    _, plot_df, _ = run_single_analysis_display(
+        "mock_model", "control_long_prose", 42, 5, "test_concept", 1.0, progress=mocker.MagicMock()
     )
     assert isinstance(plot_df, pd.DataFrame)
     assert len(plot_df) == 5
     assert "State Change (Delta)" in plot_df.columns