Spaces:

Danielfonseca1212
/

Promptinjection

Sleeping

App Files Files Community

Danielfonseca1212 commited on Mar 19

Commit

f86ef86

verified ·

1 Parent(s): e140e22

Update README.md

Browse files

Files changed (1) hide show

README.md +83 -8

README.md CHANGED Viewed

@@ -1,13 +1,88 @@
 ---
-title: Promptinjection
-emoji: 🌍
-colorFrom: yellow
-colorTo: green
 sdk: gradio
-sdk_version: 6.9.0
 app_file: app.py
-pinned: false
-short_description: middleware de segurança que senta na frente de qualquer LLM
 ---
-Check out the configuration reference at https://huggingface.co/docs/hub/spaces-config-reference

 ---
+title: Prompt Injection Shield
+emoji: "🛡️"
+colorFrom: green
+colorTo: red
 sdk: gradio
+sdk_version: "4.20.0"
 app_file: app.py
+pinned: true
+license: mit
+short_description: Enterprise-grade prompt injection detection OWASP LLM01 2025
 ---
+# 🛡️ Prompt Injection Shield
+**Enterprise-grade LLM security middleware** — detecção de prompt injection em tempo real, baseado no OWASP LLM Top 10:2025.
+## O que é?
+Middleware de segurança que intercepta ataques de prompt injection antes que cheguem ao LLM. Sem dependências pesadas — funciona com regex + heurísticas semânticas em <5ms por request.
+## Funcionalidades
+| Aba | Descrição |
+|-----|-----------|
+| 🔬 Demo Interativo | Teste qualquer prompt e veja risk score + ameaças |
+| 🔍 Pipeline Visual | Trace de cada camada de detecção passo a passo |
+| 📚 OWASP LLM Top 10 | Todas as 10 vulnerabilidades com exemplos e mitigações |
+| 🏆 Leaderboard | Ataques detectados pelos usuários em tempo real |
+| 📡 API | Simulação de chamada REST + código de integração |
+## Uso em produção
+```python
+from detector import PromptInjectionDetector, ThreatLevel
+detector = PromptInjectionDetector()
+result = detector.analyze(user_input, sensitivity="alta")
+if result.threat_level == ThreatLevel.BLOCKED:
+    return {"error": "Blocked", "trace_id": result.trace_id}
+# usar result.sanitized_text para chamar o LLM
+```
+## Arquitetura — 7 camadas
+```
+Request
+  │
+  ▼
+[1] Unicode normalizer   — NFKC, BOM removal
+  │
+  ▼
+[2] Control char filter  — \x00-\x1f, zero-width, RTL override
+  │
+  ▼
+[3] Size limiter         — max chars, max lines, repetition collapse
+  │
+  ▼
+[4] Pattern matcher      — 25+ regex patterns (OWASP LLM01)
+  │         │
+  │    BLOCKED → HTTP 403 + audit log
+  │
+  ▼
+[5] Semantic scorer      — keyword density + linguistic heuristics
+  │
+  ▼
+[6] Risk aggregator      — weighted score 0-100
+  │
+  ▼
+[7] Output filter        — PII redaction, response sanitization
+  │
+  ▼
+LLM API (Groq / OpenAI / Anthropic)
+```
+## Stack
+- Python 3.11 · zero ML dependencies
+- Gradio 4.x
+- OWASP LLM01:2025 compliance
+- Kubernetes-ready (parte do projeto Agentic RAG K8s)
+## Referências
+- [OWASP LLM Top 10:2025](https://owasp.org/www-project-top-10-for-large-language-model-applications/)
+- [OWASP LLM01: Prompt Injection](https://genai.owasp.org/llmrisk/llm01-prompt-injection/)