• Non ci sono risultati.

Protezione della privacy e prevenzione della discriminazione nel data mining

N/A
N/A
Protected

Academic year: 2021

Condividi "Protezione della privacy e prevenzione della discriminazione nel data mining"

Copied!
3
0
0

Testo completo

(1)

UNIVERSITÁ DEGLI STUDI DI PISA

Facoltà di Scienze Matematiche, Fisiche e Naturali

Corso di Laurea Specialistica in Informatica

Tesi di laurea

Protezione della privacy e prevenzione della

discriminazione nel data mining

Candidato:

Michela Corda

Relatore:

Franco Turini

(2)

Indice

Introduzione

3

I.1 Organizzazione della tesi ………..……….. 7

1 Il Data Mining 9

1.1 KDD e Data Mining ………... 9

1.2 Inferenza sui dati ……….. 16

1.3 Tecniche di data mining e altre definizioni utili ……….. 19

1.3.1 Regole di associazione ……….. 22

1.3.1.1 Itemset frequenti ………...………… 29

1.3.2 Regole di sequenza ………..………. 33

1.3.3 Classificazione e Regressione …………..……….... 35

1.3.4 Clustering ………..………... 40

2 Privacy e Discriminazione nel Data Mining 45

2.1 La privacy nel data mining ………... 45

2.2 Definizione di privacy e sua violazione ………... 48

2.3 Privacy Preserving Data Mining ……….. 51

2.3.1 Intensional Knowledge Hiding ………...….. 59

2.3.2 Extensional Knowledge Hiding ……… 60

2.3.3 Distributed Extensional Knowledge Hiding ………. 61

2.3.4 Secure Intensional Knowledge Sharing ……… 63

2.4 Data Mining e discriminazione ……….... 64 2.5 Classificazione degli algoritmi per il privacy preserving data mining … 66

(3)

3 Protezione della Privacy nel Data Mining 70

3.1 Data mining rispettoso della privacy ………...……... 70 3.2 Fase di Detection nel primo modello: attributi sensibili e non; Quasi-identifier ..………... 73 3.3 Fase di sanitization: tecniche per ripulire i dati ……… 77 3.4 K-anonimity protection ………...………. 80

3.4.1 Fase di sanitization: tecniche per ottenere il k-anonimato (Generalizzazione e Soppressione) ………... 82 3.4.2 Classificazione delle tecniche per ottenere il k-anonimato …….. 91 3.4.3 Altre tecniche per ottenere il k-anonimato (microaggregazione) . 97 3.4.4 Critica al k-anonymity protection: proprietà del k-anonimato p-sensibile o l-diversità ……….. 101 3.5 Detection e Sanitization nel secondo modello: k-anonimous patterns ... 109

4 Prevenzione della Discriminazione nel Data Mining 122

4.1 Il problema della discriminazione ……….. 122 4.1.1 La discriminazione e le leggi vigenti ……….. 125 4.2 Definizioni e teoremi utili nella ricerca delle regole discriminanti …… 133

Conclusioni 150

Riferimenti

Documenti correlati

Per misurare la fotosintesi, possiamo misurare il tasso di assorbimento dei componenti sul lato sinistro dell’equazione, o viceversa il tasso di produzione di quelli sul lato

 Pre-Condizioni: gli user devono essere registrati ed avere username e password accreditate dal sistema; quindi devono cliccare sul pulsante “eventi” o “riunioni”;. 

- Gli studenti del III anno delle LT in Biotecnologie, Ottica e Optometria, Scienze Biologiche, Scienze e Tecnologie per l’Ambiente che si siano iscritti come

However, these mechanisms sometimes have their limits: as a result the potential benefits might not extend to the entire population and the objective of

Uncomfortable with the absence of minority representation in the CDA, the GNC eventually passed an amendment to the Interim Constitutional Declaration, which revised the

the Convention by domestic courts as the only source for construing a domestic provision on human rights would remain unreviewed by the Strasbourg control

Working Paper: New Governance, Law and Constitutionalism* Gráinne de Búrca and Joanne Scott This paper introduces a set of working papers from the Law Taskforce, which explore

Gli Eurhinodelphinidae (Cetacea, Odontoceti) miocenici della Pietra leccese: descrizione e