100
7. CONCLUSIONI
Il lavoro svolto, presentato nei capitoli precedenti, ha portato alla realizzazione software di due algoritmi di clustering, selezionati tra le tecniche esistenti in quanto orientati al trattamento di grosse moli di dati multi-dimensionali
Uno dei due algoritmi scelti è stato dotato di un’opzione aggiuntiva per l’utente, progettata con l’obiettivo di estenderne le possibilità applicative a una particolare classe di dataset, quelli rappresentabili con matrici sparse.
I due software realizzati sono stati valutati applicandoli a dataset artificiali e reali. I risultati ottenuti hanno permesso di affermare che:
1. l’algoritmo ORCLUS, nella sua versione standard, presenta un pesante calo di efficienza quando viene applicato a dataset caratterizzati da sparsità;
2. la modifica apportata all’algoritmo ORCLUS permette di scavalcare tale limitazione e pertanto ne estende le possibilità applicative;
3. l’algoritmo B-FREM non ha efficienza sufficientemente costante per tutti i dataset cui viene applicato, ma non sono identificate le caratteristiche rispetto a cui classificare i dataset è garantita l’efficienza.
Sono stati previsti sviluppi futuri del lavoro svolto, riguardanti l’apporto di moduli aggiuntivi al software realizzato. In particolare, è prevista l’integrazione con un’interfaccia grafica unica (Figura 47), realizzata per una Tesi di Laurea relativa all’argomento del clustering
2.
Figura 47
2 Implementazione dell’algoritmo di clustering gerarchico agglomerativo “CURE” e sua applicazione a grandi volumi di dati - Manuele Piastra