Conclusioni - LEADER: un protocollo peer-to-peer per la costruzione dinamica di comunità basato

Nell’ambito delle reti semantiche, un aspetto fondamentale è riuscire a modellare la similarità tra entità/peer. Occorre trovare un buon compromesso tra la preci- sione nel caratterizzare un utente, la leggerezza delle informazioni scambiate a tale scopo tra le entità, e la capacità di adattamento alle continue evoluzioni del sistema. Nella proposta data in [26] è apprezzabile la semplicità dell’approccio che si limita a confrontare i tag presenti nei propri documenti. Ciò permette un sem-

2.4. CONCLUSIONI 35 plice adattamento sia che si tratti di una condivisione di file multimediali, di testi o quant’altro. Inoltre ciò comporta una totale indipendenza del peer da fonti esterne cosa che non avviene in [28] e in [30] dove ogni peer deve appoggiarsi a WordNet [29] per calcolare la propria similarità con gli altri. Una caratteristica cercata nello spazio semantico è la rintracciabilità di ogni peer. Si vuole garantire la connettività tra due peer presenti ai capi opposti della rete: chiunque deve poter collegarsi con chiunque allo scopo che peer simili si trovino nella stesa comunità pur trovandosi distanti tra loro. Tale proprietà, non garantita da [26] è invece ben realizzata da [30] e [43] dove il protocollo è suddiviso in due livelli; quello inferiore tramite il protocollo rispettivamente Cyclon [24] e RPS[44], esplora tutta la rete in ricerca di nodi similari. Le soluzioni descritte in [30, 43] pur adattandosi con semplicità ed efficienza all’evoluzione della rete non permettono l’individuazione delle community che caratterizzano i peer uniti in una rete di interessi comuni, cos`ı come sono ben presentate in [27] dove però, per contro parte, vi è una designazione statica del mondo suddiviso in categorie e sotto-categorie che non permettono dei cambiamenti nella struttura. Una possibile rappresentazione delle community è fornita dalla struttura presente negli AccessPoint d i[28] dove viene utilizzata per indirizzare i nuovi peer al join del sistema. Tale struttura, basandosi su ogni singola parola che caratterizza i peer e i suoi documenti, ha il difetto di fornire una suddivisione molto dettagliata che richiede pesanti meccanismi che prediligono una rete in cui gli interessi dei peer siano stabili. Entrambi i protocolli presentati in [37] riescono ad identificare i medoidi con i relativi cluster che possiamo far combaciare con i leader e le rispettive community. Tali procedure però hanno il difetto di richiedere una sincronizzazione tra i nodi nell’esecuzione delle iterazioni del protocollo. Altri due aspetti negativi, in comune con l’algoritmo CDC [42] sono il fissare preventivamente il numero dei cluster/comunità creati in cui verranno suddivisi i peer di una rete, e il dover individuare degli specifici nodi che iniziano l’esecuzione dell’algoritmo.

Capitolo 3

Protocollo proposto

In questo capitolo viene presentato LEADER un protocollo asincrono che attraverso una procedura di elezione dei leader permette di far emergere dall’overlay network la suddivisione logica degli utenti in communità. Tale protocollo possiede al suo interno le migliori caratteristiche presenti nei lavori citati nel capitolo precedente: la semplicità nell’implementare il concetto di similarità presente in [26], la connet- tività di tutta la rete e la adattabilità ai cambiamenti di [30], la chiarezza nella modellazione delle community in [27] con una modellazione più leggera di quella già proposta in [28], una buona suddivisione dei nodi in cluster/cummunity come quella presentata in [37] e la scelta autonoma del proprio leader/community da parte di ogni nodo come in [39].

L’utilizzo di un protocollo con le suddette caratteristiche permette di unire insieme le qualità e gli aspetti positivi delle reti semantiche con quelli ottenuti tramite una clusterizzazione dei dati. La struttura dell’overlay network cos`ı creata è carat- terizzata da qualità di leggerezza e di buona modellazione che permettono un’ot- timizzazione nella gestione della ricerca di informazioni. La conoscenza dei soli leader permette di ottenere una visione globale della struttura dei dati e delle informazioni presenti nell’intero sistema. Infatti, venire a conoscenza del profilo di un leader, significa scoprire un gruppo di peer molto simili a quel profilo. Ciò permette miglioramenti nello instradamento dei dati e delle informazioni.

3.1 Architettura generale del sistema

Il protocollo LEADER è inserito in un sistema per la gestione dei profili di sup- porto ai peer del sistema. In tale sistema viene mantenuto un indice aggiornato dei profili delle comunità e degli indici di alcuni membri di ogni comunità, perme- ttendo di ricercare i profili per similarità. Essa è basata su due DHT. La prima

e adibita alla memorizzazione dei descrittori delle comunità, coppie dalla forma (prof ilo, idendif icatore) dei leader delle comunità. La seconda mantiene per ogni id di comunità una lista di indirizzi di peer che fungono da “punti di accesso” per la comunità.

Figura 3.1: struttura generale del sistema

Questa struttura di indicizzazione viene utilizzata pi`u volte dal peer come illus- trato in figura 3.1:

• al momento del primo ingresso di un peer nel sistema essa ha funzione di AccessP oint. Tramite essa un peer pu`o ottenere un insieme di peer a lui simili.

• al momento della creazione di una nuova comunit`a, il leader invia al sistema il descrittore della comunit`a e gli indirizzi di alcuni membri che fungeranno da punti di accesso.

• al momento della modifica del descrittore di una comunità il leader compe- tente informerà la struttura del cambiamento. Negli ultimi due casi il nuovo descrittore sarà inviato ai nodi di accesso delle altre comunità per aggiornali sullo stato attuale della rete.

• nel caso di scioglimento di una comunit`a al fine di eliminare dalle DHT il descrittore della comunit`a.

3.2. L’AMBIENTE DI PARTENZA 39

Nel documento LEADER: un protocollo peer-to-peer per la costruzione dinamica di comunità basato su Gossip (pagine 34-39)