• Non ci sono risultati.

Algoritmi di valutazione

Nel documento Aggregatori di informazioni (pagine 32-40)

1.2 Valutazione delle fonti

1.2.2 Algoritmi di valutazione

In questa sezione verranno approfonditi alcuni degli algoritmi di valutazione che vengono utilizzati da certi aggregatori per assegnare un punteggio alle proprie fonti.

PageRank

Nei motori di ricerca sono due gli algoritmi principali che ne garantiscono il successo e il funzionamento: l’indicizzazione e il pagerank. Il primo permette di inserire il sito nel database del motore di ricerca mentre il secondo ne definisce la posizione nella pagina dei risultati della ricerca.

Il PageRank `e l’algoritmo che utilizza il motore di ricerca Google per assegnare un peso alle proprie fonti. Grazie a questo algoritmo Google pu`o restituire all’utente i risultati della ricerca, in ordine decrescente di rilevanza.

Il principio base di questo algoritmo `e quello di assegnare un valore numerico ad ogni elemento di un collegamento ipertestuale all’interno del World Wide Web; questo valore rispecchia l’importanza del collegamento ipertestuale all’interno della serie in cui si trova. Ci`o che si propone di fare questo algoritmo `e quello di assegnare un grado di popolarit`a al sito rispetto ai termini inseriti in fase di ricerca. Il principio di funzionamento di questo algoritmo `e assimilabile ad un meccanismo elettivo: ogni pagina Web indicizzata `e un elettore ed esprime il proprio voto attraverso i collegamenti ipertestuali in essa presente;le pagine

esprimono un voto che `e proporzionale alla popolarit`a. Oltre a queste votazioni altri elementi che concorrono a definire la popolarit`a del sito secondo questo algoritmo sono la pertinenza del contenuto della pagine, le pagine correlate, la diffusione dell’argomento trattato.

Algoritmi di geolocalizzazione

Tra gli esempi mostrati in precedenza abbiamo Foursquare che utilizza un algo- ritmo di geolocalizzazione per ricercare negozi e locali nelle vicinanze della zona in cui ci troviamo. Grazie a questo algoritmo verranno restituiti come risultati solo dei places entro un range che pu`o essere stabilito dall’utente.

Le tecniche di geolocalizzazione permettono di determinare la posizione nel mon- do reale, di un determinato device; questi algoritmi si rivelano particolarmente utili sui dispositivi mobili, come smartphone e tablet, sempre pi`u spesso dotati di GPS e che permettono quindi di essere utilizzati anche come navigatori. I meccanismi di geolocalizzazione pi`u utilizzati sono:

• tramite tecnologia GPS che sfrutta i satelliti artificiali che orbitano intorno alla Terra;

• tramite l’indirizzo IP assegnato al device;

• tramite le celle telefoniche a cui il cellulare si collega; • tramite WiFi o WLAN.

Tra i meccanismi elencati il pi`u preciso `e sicuramente quello che si basa sulla tecnologia GPS, ancor meglio se `e utilizzato in tandem con localizzazione tra- mite WiFi.

Oltre a Foursquare, tra gli esempi proposti, ci sono altri aggregatori che uti- lizzano algoritmi di geolocalizzazione. Ad esempio Facebook utilizza la geolo- calizzazione per assegnare un tag agli stati o alle foto pubblicate dagli utenti; Google invece utilizza la geolocalizzazione nel servizio Google Maps, che fornisce all’utente mappe di tutto il mondo. La geolocalizzazione pu`o essere utilizzata inoltre per campagne di marketing mirate rispetto al luogo nel quale ci si trova (viene anche definito geomarketing).

Motori semantici

Secondo la definizione del suo ideatore, Tim Berners-Lee il Web semantico `e un’estensione del Web corrente in cui le informazioni hanno un ben preciso

significato e in cui computer e utenti lavorano in cooperazione(Scientific Ame- rican, Maggio 2001). Ci`o significa che i documenti pubblicati sul Web sono insertiti in un contesto semantico che viene specificato dalle informazioni e dai dati e i meta-dati[9].

La ricerca semantica `e un metodo di ricerca che tenta di provare ad avvicinarsi ai meccanismi cognitivi dell’uomo, ovvero il motore di ricerca tenta di estra- polare il contesto e il significato delle parole che sta leggendo. Tra gli esempi che sono stati analizzati in questo capitolo abbiamo Liquida che fa uso di un motore semantico per classificare gli articoli che propone. L’algoritmo utilizzato da Liquida autocompone i contenuti selezionati dalla redazione di Liquida e li raggruppa a seconda delle tematiche che trattano grazie ad un sistema di analisi dei contenuti. Come dichiarato da Liquida, l’algoritmo per ogni tema seleziona- to propone ai lettori un occhiello redazionale, l’articolo ritenuto pi`u rilevante, i tag relativi, altri post inerenti e quattro contenuti multimediali (immagini e vi- deo)(Liquida.it). Liquida utilizza tecnologie semantiche per indicizzare i propri post e che permettono di effettuare ricerche per categoria. Questo sistema, svi- luppato da Expert System in collaborazione con Liquida, cataloga il materiale informativo in base all’argomento trattato e genera metadati che permettono di recuperarli in fase di ricerca.

1.2.3

Tabella comparativa

La tabella seguente riassume, per ogni esempio preso in considerazione in questo capitolo, come viene espressa la valutazione della fonte e come questa valutazione incide nell’economia dell’aggregatore.

1.3

Considerazioni generali

In questa sezione verranno fatte alcune considerazioni di carattere generale sugli aggregatori analizzati nei precedenti capitoli; in particolare verranno espressi quali sono i punti forti e quelli deboli degli aggregatori considerati.

1.3.1

Motori di ricerca

Come gi`a approfonditamente spiegato nel capitolo 1, la funzione dei motori di ricerca `e quella di scandagliare il Web alla ricerca di pagine coerenti ad un input (solitamente una stringa di caratteri) inserita dall’utente. Il problema princi-

Aggregatore Valutazione delle fonti

Google Valutazione tramite algoritmo di Pa- geRank. La valutazione incide nel posizionamento nei risultati di ricerca Indeed Valutazione tramite confronto con le

altre fonti. La valutazione incide nel posizionamento nei risultati di ricerca Mobisave Valutazione tramite confronto in base a

parametri delle tariffe telefoniche. Vie- ne restiuito il piano tariffario ritenuto migliore

Ciao.it Valutazione dei prodotti effettuata dagli utenti tramite delle recensioni. Kelkoo Valutazione tramite confronto di prezzi.

Vengono restituiti i risultati in ordine di prezzo.

Trovaprezzi.it Valutazione tramite confronto di prezzi. Vengono restituiti i risultati in ordine di prezzo.

Digg Valutazione effettuata dagli utenti. Le votazioni incidono nel posizionamento della notizia all’interno della pagina. TzeTze Valutazione effettuata dagli utenti tra-

mite il pulsante tzetze. Le votazioni in- cidono nel posizionamento della notizia all’interno della pagina.

Liquida Valutazione tramite algoritmo semanti- co.

Facebook Gli utenti valutano i contenuti trami- te il pulsante like. Per ogni contenu- to viene visualizzato il numero di like ricevuto.

Twitter Nessuna valutazione viene effettuata. Timekiwi Nessuna valutazione viene effettuata. Storify Nessuna valutazione viene effettuata. Foursquare Valutazione tramite algoritmo di geo-

localizzazione e tramite recensione da parte degli utenti. Vengono restituiti i risultati che si trovano entro una certa distanza dagli utenti.

Songbird Nesssuna valutazione viene effettuata. Amazon Valutazione dei prodotti effettuata

dagli utenti tramite recensioni. CdBaby Nessuna valutazione viene effettuata.

pale di questo tipo di aggregatore `e che devono scorrere milardi di pagine in tempi molto brevi; `e ovvio quindi che non potranno mai essere prese in consi- derazione la totalit`a delle pagine Web. Secondo alcune stime, il numero totale di pagine Web supera i mille miliardi; se prendiamo in considerazione Google, il suo database di pagine indicizzate consta di circa 25 miliardi di pagine. Quindi `

e praticamente impossibile effettuare una ricerca che prenda in considerazione tutto il materiale presente sul Web.

Un’altra problematica, che ricorrer`a anche per gli altri tipi di aggregatori, `e il grado di fiducia che ha l’utente nei risultati proposti dal motore di ricerca; `e im- portante quindi che gli algoritmi di ricerca siano in grado di eliminare risultati di spam (nel capitolo 1 `e stato affrontato il problema del cosiddetto spamindexing).

1.3.2

Motori di confronto

Le problematiche relative ai motori di confronto sono pi`u o meno le stesse di quelle dei motori di ricerca, ovvero quantit`a di pagine indicizzate e fiducia del- l’utente nei risultati proposti dall’aggregatore.

Prendiamo in considerazione aggregatori come Kelkoo oppure Ciao.it: essi si propongono di effettuare una ricerca su prodotti venduti in rete, cercando di restituire all’utente le offerte migliori presenti fra le pagine indicizzate; `e ov- vio che maggiore sar`a la fiducia dell’utente quanto pi`u ampio sar`a lo spettro della ricerca dell’aggregatore. Infatti un utente potrebbe chiedersi se le offerte presentate da questi aggregatori siano effettivamente le migliori oppure se altre offerte siano state trascurate; siccome la maggior parte di essi opera solo su un certo numero di Web-store con cui stipula accordi commerciali, l’utente si pu`o porre effettivamente il dubbio che le offerte non siano in realt`a le migliori ma che i risultati delle ricerche siano in qualche modo delle inserzioni pubblicitarie. A questo riguardo bene si comporta Ciao.it, che ha una community di utenti che recensisce e assegna dei punteggi sia ai prodotti che ai negozi online. Un altro punto a sfavore di questi aggregatori `e che prendono in considerazione solo un limitato numero di negozi e le offerte considerate sono esclusivamente di prodotti venduti online.

1.3.3

Aggregatori di notizie

Per gli aggregatori di notizie `e pi`u che mai fondamentale la fiducia che gli utenti hanno nell’aggregatore e nelle fonti che prende in considerazione; infatti tanto pi`u l’utente non si fida delle fonti che l’aggregatore utilizza per reperire le notizie,

tanto pi`u non prender`a in considerazione tale aggregatore. Da questo punto di vista, gli aggregatori che meglio rispondono a questa esigenza di affidabilit`a sono i lettori di feed; essi infatti permettono all’utente di selezionare personalmente le fonti, permettendogli di creare una sorta di notiziario personalizzato. Altri aggregatori come Digg e TzeTze invece permetto agli utenti di valutare gli articoli; gli articoli con pi`u valutazioni positive occuperanno posti di maggior rilievo nella pagina.

Un’altro tipo di problematica che si pone con questo tipo di aggregatori `e di natura prettamente legale: infatti ci possono essere problemi di copyright nella pubblicazione di notizie pubblicate da altri siti; deve esserci quindi l’assenso dei siti sorgenti, che in cambio ottengono visibilit`a su questi aggregatori; `e quindi fondamentale che l’aggregatore sia di successo in modo che i siti sorgenti abbiano un guadagno a permettere la pubblicazione delle proprie notizie. Una soluzione adottata da questi aggregatori `e che per leggere l’intera notizia, l’utente sia reindirizzato alla pagina originale del sito sorgente.

Capitolo 2

Classificazione

Non classificato non omologato, Indesiderato, non obliterato, Non idoneo, non ammesso, Non allineato,assente sempre ingiustificato.

Subsonica-Non identificato

Alla luce degli esempi mostrati nel capitolo precedente, si prova qui a dare una classificazione degli aggregatori Web. Questo tentativo di classificazione tiene conto di tutte le caratteristiche emerse dall’analisi dei vari aggregatori, cercando di cogliere gli aspetti che li caratterizzano.

Come gi`a emerge dalle tabelle comparative del capitolo precedente, due criteri imprescindibili per la classificazione sono il modo in cui gli aggregatori selezio- nano le fonti e come esse vengono valutate; un altro criterio `e sicuramente lo scopo per cui viene usato un aggregatore e le funzionalit`a di cui esso dispone. Alla luce di tutto ci`o i criteri di classificazione utilizzati sono i seguenti:

• classificazione in base allo scopo dell’aggregatore; • classificazione in base alla selezione delle fonti ; • classificazione in base alla valutazione delle fonti ; • classificazione in base alle funzionalit`a.

Nei prossimi paragrafi verranno esposti e giustificati questi criteri e alla fine si effettuer`a una classificazione di tutti gli esempi mostrati nel capitolo precedente.

2.1

Classificazione in base allo scopo

Il principio base di questo criterio `e quello di classificare gli aggregatori sulla base dello scopo di utilizzazione; ad esempio un motore di ricerca come Google viene utilizzato dagli utenti per effettuare una ricerca sul Web mentre ad esem- pio un aggregatore di notizie viene utilizzato per leggere contenuti provenienti da pi`u fonti. Sulla base di queste considerazioni e sull’analisi dei casi presi pre- cedentemente in considerazione le classi di aggregatori individuate per questo criterio sono:

• Ricerca: la funzione primaria degli aggregatori appartenenti a questa classe `e quella di effettuare una ricerca tra le fonti che appartengono al proprio database e restituirle all’utente ordinate dalla pi`u coerente alla meno coerente a seconda del criterio di ricerca e dall’algoritmo di valuta- zione utilizzato; solitamente viene fornita un’anteprima per ogni risultato nella lista che viene restituita all’utente. Rientrano in questa classe di aggregatori tutti i motori di ricerca (Google, Yahoo ecc.); possiamo ve- dere come motore di ricerca anche il mall online di Amazon, in quanto dal punto di vista di aggregatore ci`o che compie `e quello di effettuare una ricerca all’interno del proprio database dei prodotti.

• Comparazione: questo tipo di aggregatori a fronte di un input ricevuto dall’utente (tipicamente una stringa che rappresenta l’oggetto della ricer- ca) effettuano una ricerca di beni o servizi all’interno delle proprie fonti e restituiscono all’utente i migliori risultati, secondo un determinato pa- rametro, in forma aggregata. Questo parametro varia da aggregatore ad aggregatore; solitamente se la ricerca riguarda prodotti in vendita questo parametro pu`o essere il prezzo del prodotto oppure il voto delle recen- sioni effettuate dagli utenti. Ne sono esempi di questa classe i motori di confronto come Kelkoo, Ciao, Indeed.

• Lettura: la caratteristica di questa classe di aggregatori `e quella di offrire all’utente la possibilit`a di leggere materiale informativo proveniente da pi`u fonti; in questo caso le fonti possono essere selezionate dall’utente (come nel caso dei lettori di feed) che decide quali fonti inserire nel proprio aggregatore. Tipicamente fanno parte di questa categoria di aggregatori tutti i servizi di aggregazione di news come i lettori di feed, Liquida e TzeTze e gli aggregatori di social network come Storify e TimeKiwi.

Figura 2.1: Classificazione per scopo

• Pubblicazione: lo scopo principale di questo tipo di aggregatori `e la pub- blicazione di informazione; l’informazione pu`o provenire da fonti diverse, come nel caso di Pipes che crea mash-up con informazioni provenienti da siti diverse, oppure l’informazione pu`o essere pubblicata su diverse fonti come nel caso di Timekiwi (uno stesso post pu`o essere pubblicato contem- poraneamente su Facebook e su Twitter) e di CdBaby che distribuisce le proprie canzoni su diversi market online.

• Misto: sono gli aggregatori che per loro natura possono rientrare in pi`u di una delle classi sopraccitate. Se prendiamo ad esempio Timeki- wi, esso permette la lettura di contenuti provenienti da fonti diverse e allo stesso tempo permette la pubblicazione di post su pi`u social network contemporaneamente; esso `e quindi un aggregatore sia di lettura che di pubblicazione.

2.2

Classificazione in base alla selezione delle

Nel documento Aggregatori di informazioni (pagine 32-40)

Documenti correlati