4. IL PROFILING NEL WEB USAGE MINING
4.7 Applicazione delle tecniche PACT e ARHP
4.7.3 Valutazione dei risultati ottenuti
Di seguito esamineremo i risultati ottenuti utilizzando le tre tecniche descritte prima per la determinazione di profili e le misure associate ad esse per ottenere raccomandazioni efficaci. Data un transazione t ed una finestra di grandezza n,
64 vengono scelti in maniera casuale |t|−n +1 gruppi di elementi come finestre di sessioni attive ognuna avente dimensione n.
Per ognuna di queste sessioni attive si produrrà un set di raccomandazioni, basato su profili di aggregazione e si comparerà questo con il set di elementi rimanenti nella transazioneal fine di calcolare la precisione, la copertura, F1 e R. Per ciascuna di queste misure, il punteggio finale per la transazione t è stato il punteggio medio su tutte |t|−n +1sessioni attive associate a t. Per determinare un set di raccomandazioni basato su sessioni attive, si varia la soglia di raccomandazione da 0,1 a 1,0.
Tabella 4.2 Copertura e numero medio di raccomandazioni con una finestra di grandezza pari a 2
Una pagina è inclusa in un set di raccomandazioni se e solo se ha un punteggio di raccomandazione maggiore o uguale ad una determinata soglia. Chiaramente sono meno le raccomandazioni prodotte a soglie elevate, mentre avremo un punteggio di copertura elevato a soglie più basse, infatti idealmente auspicheremmo che il motore di raccomandazioni produca poche raccomandazioni ma di elevata rilevanza. La Tabella 4.2 mostra una porzione dei risultati prodotti dal motore di raccomandazione per i tre metodi di generazione di profili, utilizzando una sessione di grandezza pari a due. Per esempio ad una soglia di 0,6, il metodo Hypergraph produce una copertura del 0,52 con un set si raccomandazione di misura 6,97 su tutte le prove, ciò significa che in media il 52% delle pagine effettivamente visitate dagli utenti nella valutazione del set di transazioni, corrisponde alle prime sette raccomandazioni prodotte dal sistema.
65 La valutazione dei risultati per le finestre attive di grandezza due sono rappresentati in Figura 4.6. In termini di precisione, il metodo PACT supera nettamente gli altri due metodi in particolare per elevati valori di soglia, mentre il metodo Hypergraph ha mostrato una performance piuttosto scarsa in termini di precisione raggiungendo però un elevato livello di raccomandazione su tutto, con una precisione riferita ai buoni punteggi di F1. La misura R accerta il metodo PACT come il chiaro vincitore in termini di accuratezza della raccomandazione ad elevate soglie dove però sono prodotte un numero molto piccolo di raccomandazioni. Va sottolineato che i punteggi raggiunti da queste misure sono solo basati su semplici dati di clickstream anonimi e con poche pagine (in questo caso due) utilizzate per produrre raccomandazioni. Nel caso del metodo PACT, i risultati mostrano che esso può essere una tecnica efficace per la personalizzazione basata esclusivamente su clickstream anonimi degli utenti, soprattutto nelle prime fasi di interazione tra questi ed il sito verificando la loro disponibilità ad approfondire informazioni (il tutto prima della registrazione).
La Figura 4.7 mostra l’ effetto dell’incremento della grandezza della finestra da due a tre sulle misure F1 e R. Fatta questa variazione possiamo notare come tutte e tre le tecniche ottengono una performance migliore sottolineando il fatto, che il metodo PACT ha dei problemi rispetto agli altri due nella misura R mentre il metodo Hypergraph ha il miglior punteggio nella misura F1 producendo una elevata copertura di raccomandazioni rispetto agli altri.
66 .
Figura 4.6 Efficacia della raccomandazione utilizzando la finestra di grandezza pari a 2 basata sulle misure precisione, copertura, F1, R.
Figura 4.7 Aumento della grandezza della finestra (da 2 a 3) sull’efficacia della raccomandazione basata sulle misure F1 e R.
Nonostante il fatto che il metodo Hypergraph ha ottenuto un punteggio inferiore rispetto ai metodi PACT e Clique in termini di accuratezza della precisione, l’ osservazione dei risultati di raccomandazione ha mostrato come il metodo Hypergraph tende ha produrre raccomandazione più “interessanti”; cioè va più in profondità sugli aspetti del sito dovuto al fatto che l’interesse del set di elementi è stato utilizzato per calcolare i pesi relativi ai “hyperedges”. Intuitivamente consideriamo un oggetto (pagina o prodotto) più interessante o utile se l’utente lo richiede durante la sua navigazione piuttosto che se viene consigliato dal motore di raccomandazione. Al fine di valutare l’ efficacia delle tre tecniche di generazione di profili (PACT, ARHP, Clinique), sono state filtrate le pagine di
67 navigazione di livello top sia nel set di training che in quello di valutazione rigenerando i profili aggregati.
La Figura 4.8 illustra le performance delle tre tecniche applicando il filtro basato su finestre di sessioni attive di grandezza pari a due mostrando i risultati relativi alle misure precisione e F1. I risultati ottenuti dimostrano che filtrando il set di dati si sono prodotte prestazioni migliori per tutte tre le tecniche e cioè un moderato miglioramento per quella Clique, un miglioramento più importante per quella Hypergraph ed in misura leggermente minore per quella PACT. In particolare la tecnica Hypergraph ha performato meglio delle altre due in questo esperimento, in quanto essa tende a produrre raccomandazioni più interessanti, avendo un miglioramento in termini di precisione rispetto al metodo PACT. La Figura 4.9 mostra come il metodo Hypergraph migliora, in termini di misura R, quando si confrontano i risultati applicando o no il filtro al set di dati, e aumentando la dimensione della finestra da due a tre.
Figura 4.8 L’impatto dei filtri sull’efficacia della raccomandazione basato sulle performance delle misure di precisione e F1. I risultati rappresentano solo la finestra della sessione attiva di misura 2.
68 Figura 4.9 Il miglioramento delle performance ottenuto con il metodo Hypergraph dovuto al filtraggio e all’aumento della misura della finestra