APPLICAZIONE DI SISTEMI
GENETICI-FUZZY ALL’ANALISI DI
DATI BIOMEDICI RELATIVI A
PAZIENTI AFFETTI DA
DISFUNZIONE TIROIDEA
Relatori:
Chiar.mo Prof. Francesco Marcelloni
Chiar.ma Prof.ssa Beatrice Lazzerini
Candidato:
Cataldo De Benedictis
A mio padre,
che mi ha insegnato i valori della vita, dato sempre la
possibilità di scegliere e per tutti i sacrifici che ha fatto per
farmi realizzare.
A mia madre,
che mi ha sempre sostenuto nei miei studi e incoraggiato nei
momenti difficili.
A mia sorella,
alla quale voglio molto bene.
Ad Alessio,
il cui supporto è stato fondamentale nella realizzazione di
questo lavoro.
A mio cugino Luigi
il fratello che non ho avuto, compagno di tante avventure.
A Giovanni, Ciccio, Gerard, Sante
e tutti coloro che in questi anni mi hanno fatto sentire a casa
anche se ero mille chilometri distante.
A Taranto,
città dei due mari a cui sarò legato per sempre.
Sommario
Il lavoro che presentiamo è l’applicazione di un metodo
ingegneristico ad un problema medico. Il metodo
ingegneristico è un sistema genetico-fuzzy; generiamo
un sistema inferenziale fuzzy (Fis) dai dati. Il problema
medico in analisi è il distiroidismo; la disfunzione
tiroidea che analizzeremo nello specifico è la sindrome
da bassa T3. Richiamiamo concetti di logica fuzzy e
algoritmi genetici. Progettiamo e sviluppiamo due
metodi. Il primo metodo, di Wang&Mendel, genera una
base di regole fuzzy con la particolarità di combinare
informazioni numeriche e linguistiche in una struttura
comune. Il secondo, di Magdalena, ottimizza tale base
di regole attraverso tecniche genetiche, applicando le
funzioni di scaling. Illustriamo la selezione degli
ingressi ottimi, una variante al metodo di Magdalena.
Presentiamo il problema medico, che l’Unità Operativa
IV di Medicina Interna AUOP-Pisa ha fornito, facendo
dei cenni ai principi fisiologici delle disfunzioni
tiroidee. Ricerchiamo e verifichiamo l’esistenza di
eventuali relazioni tra alcune dimensioni delle analisi
biomediche e la loro diversa influenza nella
classificazione dei pazienti affetti dalla sindrome da
bassa T3. Come benchmark del sistema utilizziamo il
Fuzzy C-Means. Classifichiamo i pazienti e
selezioniamo le dimensioni che meglio si prestano alla
caratterizzazione del classificatore, tramite
l’applicazione del metodo della selezione degli ingressi
INDICE GENERALE
CAPITOLO 1 INTRODUZIONE
pag. 6
CAPITOLO 2 CENNI TEORICI
pag. 11
2.1 Introduzione pag. 12
2.2 La logica fuzzy pag. 13
2.2.1 Esempi di insiemi fuzzy pag. 14
2.2.2 Insieme fuzzy pag. 15
2.2.3 Operazioni sugli insiemi fuzzy pag. 16
2.2.4 Relazioni fuzzy pag. 17
2.2.5 Variabili linguistiche pag. 18
2.2.6 Implicazioni fuzzy pag. 19
2.2.7 Ragionamento approssimato pag. 20
2.2.8 Tecniche d’inferenza pag. 21
2.2.9 La defuzzificazione pag. 22
2.2.10 Il toolbox della logica fuzzy di Matlab pag. 23
2.3 Gli algoritmi genetici pag. 25
2.3.1 La codifica del cromosoma pag. 26
2.3.2 La funzione di qualità (fitness) pag. 26
2.3.3 Operatori di crossover e mutazione pag. 27
2.3.4 Algoritmo genetico pag. 29
2.3.5 Il toolbox degli algoritmi genetici del Matlab pag. 31
CAPITOLO 3 IL PROGETTO
pag. 34
3.1 Introduzione
pag. 353.2 Il metodo di Wang e Mendel pag. 39
3.2.1 Sistema fuzzy a modello libero con apprendimento pag. 40 3.2.2 Divisione degli spazi di Input-Output in regioni fuzzy pag. 41 3.2.3 Generazione di regole fuzzy dalle stringhe di dati pag. 42
3.2.4 Assegnamento di un valore ad ogni regola pag. 44
3.2.5 Creazione di una base di regole fuzzy combinata pag. 46
3.2.6 Determinazione di una mappatura basata una base di regole pag. 47
3.3 L’ottimizzazione del modello fuzzy pag. 51
3.3.1 Il metodo di Magdalena pag. 52
3.3.2 Miglioramento delle prestazioni di un FLC con gli alg. genetici pag. 52
3.3.3 Sistemi genetici fuzzy pag. 53
3.3.4 Ottimizzazione delle prestazioni di una FLC pag. 56
3.3.5 Le funzioni di scaling pag. 57
3.3.6 Processo d’apprendimento pag. 61
3.4 Applicazione del sistema inferenziale fuzzy alle analisi biomediche pag. 63
CAPITOLO 4 LO SVILUPPO
pag. 64
4.1 Introduzione pag. 65
4.2 Implementazione del metodo di Wang&Mendel pag. 66
4.3 Codice di alcune funzioni Matlab del metodo di Wang&Mendel pag. 69
4.4 Esempio di Fis generato pag. 73
4.5 Implementazione del metodo di Magdalena pag. 75
4.6 Codice di alcune funzioni Matlab del metodo di Magdalena pag. 79
4.7 Selezione degli ingressi ottimi (Input Selection) pag. 84
CAPITOLO 5 TEST FUNZIONALE
pag. 86
5.1 Introduzione pag. 87
5.2 Structure of Wages pag. 88
5.3 Iris pag. 101
CAPITOLO 6 IL PROBLEMA TIROIDEO
pag. 112
6.1 Introduzione pag. 113
6.2 Il problema tiroideo pag. 114
6.3 Analisi mediche pag. 119
CAPITOLO 7 ANALISI DEI DATI BIOMEDICI
pag. 122
7.1 Introduzione pag. 123
7.2 Presentazione del problema pag. 124
7.3 Analisi preliminare e statistica del dataset pag. 134
7.4 Classificazione dei pazienti pag. 142
7.5 Ricerca di relazioni nel dataset pag. 148
7.6 Selezione degli ingressi ottimi pag. 156