Spaces:
Sleeping
Sleeping
A newer version of the Gradio SDK is available:
6.2.0
metadata
title: Sistema Ibrido di Anonimizzazione Dati
emoji: ๐
colorFrom: blue
colorTo: red
sdk: gradio
sdk_version: 4.44.0
app_file: app.py
pinned: false
license: mit
๐ Sistema Ibrido di Anonimizzazione Dati
Un sistema avanzato per l'identificazione e anonimizzazione di dati sensibili in testi italiani, che combina:
- Stanford Deidentifier: Modello transformer specializzato
- Microsoft Presidio: Framework enterprise per data privacy
- Regex personalizzate: Pattern specifici per formati italiani
๐ฏ Caratteristiche
- โ Riconoscimento di 10+ tipi di entitร (persone, CF, P.IVA, IBAN, telefoni, email, ecc.)
- ๐๏ธ Controllo granulare per ogni tipo di entitร
- ๐ 3 modalitร di anonimizzazione: sostituzione, oscuramento, pseudonimizzazione
- โ๏ธ Parametri avanzati personalizzabili
- ๐ Statistiche dettagliate di rilevamento
๐ Utilizzo
- Inserisci il testo contenente dati sensibili
- Seleziona i tipi di entitร da anonimizzare
- Configura il metodo di anonimizzazione
- Visualizza i risultati con entitร evidenziate
๐ฌ Tecnologie
- Gradio per l'interfaccia web
- spaCy per il processamento NLP
- Transformers per i modelli deep learning
- Presidio per la privacy dei dati
๐ Esempi supportati
- Persone: Mario Rossi, Dott. Giovanni Bianchi
- Codici Fiscali: RSSMRC80D15H501V
- Partite IVA: IT12345678901
- IBAN: IT60X0542811101000000123456
- Telefoni: +39 333-123-4567
- Email: esempio@dominio.com
- Targhe: AB123CD
Basato sulla ricerca comparativa di Small Language Models per l'anonimizzazione di dati in lingua italiana.