Anonimizzazione / README.md
domdp's picture
Rename readme.md to README.md
c81b46f verified

A newer version of the Gradio SDK is available: 6.2.0

Upgrade
metadata
title: Sistema Ibrido di Anonimizzazione Dati
emoji: ๐Ÿ”’
colorFrom: blue
colorTo: red
sdk: gradio
sdk_version: 4.44.0
app_file: app.py
pinned: false
license: mit

๐Ÿ”’ Sistema Ibrido di Anonimizzazione Dati

Un sistema avanzato per l'identificazione e anonimizzazione di dati sensibili in testi italiani, che combina:

  • Stanford Deidentifier: Modello transformer specializzato
  • Microsoft Presidio: Framework enterprise per data privacy
  • Regex personalizzate: Pattern specifici per formati italiani

๐ŸŽฏ Caratteristiche

  • โœ… Riconoscimento di 10+ tipi di entitร  (persone, CF, P.IVA, IBAN, telefoni, email, ecc.)
  • ๐ŸŽ›๏ธ Controllo granulare per ogni tipo di entitร 
  • ๐Ÿ”„ 3 modalitร  di anonimizzazione: sostituzione, oscuramento, pseudonimizzazione
  • โš™๏ธ Parametri avanzati personalizzabili
  • ๐Ÿ“Š Statistiche dettagliate di rilevamento

๐Ÿš€ Utilizzo

  1. Inserisci il testo contenente dati sensibili
  2. Seleziona i tipi di entitร  da anonimizzare
  3. Configura il metodo di anonimizzazione
  4. Visualizza i risultati con entitร  evidenziate

๐Ÿ”ฌ Tecnologie

  • Gradio per l'interfaccia web
  • spaCy per il processamento NLP
  • Transformers per i modelli deep learning
  • Presidio per la privacy dei dati

๐Ÿ“‹ Esempi supportati

  • Persone: Mario Rossi, Dott. Giovanni Bianchi
  • Codici Fiscali: RSSMRC80D15H501V
  • Partite IVA: IT12345678901
  • IBAN: IT60X0542811101000000123456
  • Telefoni: +39 333-123-4567
  • Email: esempio@dominio.com
  • Targhe: AB123CD

Basato sulla ricerca comparativa di Small Language Models per l'anonimizzazione di dati in lingua italiana.