Oltre che sulla questione della privacy, cioè su quanto possiamo fidarci che Google non faccia un uso distorto o illecito dell'enorme quantità di informazioni che possiede, un altro punto su cui soffermarsi riguarda quanto e come Google ci permetta di raggiungere il sapere, la conoscenza, l'informazione.
Analizzando i criteri che sono alla base di un motore di ricerca, dunque interrogandosi sulla natura e sul funzionamento di quel particolare tipo di finestra che si affaccia sull'informazione, occorre focalizzare dei concetti fondamentali, utili per un corretto inquadramento della
questione. Proporrei questa triade: oggettività, rilevanza e purezza, quando questi concetti siano riferiti ai risultati di una ricerca.
Per oggettività di un risultato intendo rappresentare il rapporto che esso ha con una idea di verità socialmente condivisa e se questa possa essere accolta o scambiata in certi casi per la verità. Si tratta di un punto estremamente complesso, perché investe concetti fondamentali del nostro pensiero e, sul piano della vitalità e buona salute di una cultura e di una democrazia, oserei dire cruciale. Dovremmo distinguere tra diverse situazioni, prima di tutto fra quelle facilmente oggettivabili e quelle che invece non lo sono. Ad esempio, se voglio sapere chi ha scritto i
Promessi Sposi, potrò definire il risultato "Alessandro Manzoni" come vero, ma se voglio trovare
il miglior sito che offra informazioni su un periodo storico, ad esempio la Guerra Civile
Americana, non è detto che sia vero che i siti che mi vengono segnalati siano i migliori, dove per migliori possiamo intendere sommariamente i più documentati, chiari, liberi e aperti al confronto critico.
Per rilevanza intendo quanto il risultato di una ricerca è vicino all'aspettativa di chi ha effettuato quella ricerca. Ad esempio, se effettuo una ricerca con la chiave "apache" con l'intenzione di ricevere informazioni sulla tribù indiana, mentre invece mi vengono segnalati siti che hanno a che fare con il server chiamato Apache, diremmo che quei risultati hanno una bassa rilevanza.
Per purezza di un risultato, infine, intendo la sua completa e coerente dipendenza dai criteri pubblici che stanno alla base del funzionamento di un motore, senza che intervengano
nascostamente altri fattori. Ad esempio, se io cerco "partiti politici italiani", dovrei ottenere la lista dei siti di tutti i partiti, senza che qualcuno di questi venga escluso perché nascostamente censurato dal motore33
.
33 Preciso che cosa intendo per criterio pubblico in questo contesto, dal momento che, a essere rigorosi, il cuore di un
motore di ricerca non è mai completamente pubblico (anzi, nel caso di Google, l'algoritmo PageRank in tutta la sua completezza con tutti i raffinamenti successivi si può dire sia segreto tanto quanto la ricetta della Coca Cola). Per
criterio pubblico intendo la filosofia di fondo che ispira il funzionamento di un motore, non l'insieme delle
Oggettività di un risultato tra alêtheia e doxa
Google è stato il primo motore di ricerca che abbia adottato un sistema automatico ed altamente efficiente di classificazione e valutazione dei siti web. Potremmo dire provvisoriamente,
consapevoli di quanto sia ambigua e pericolosa questa espressione, oggettivo. Con i primi rudimentali motori di ricerca, l'indicizzazione dei siti avveniva sostanzialmente attraverso una varia combinazione tra valutazioni umane, redazionali, da una parte, e interpretazione dei titoli delle pagine web e delle parole chiave che i siti stessi ponevano entro specifici tag, dall'altra. Erano cioè privi di abilità semantiche. Sebbene questa indicizzazione si avvalesse di strumenti automatici, essa poggiava in maniera importante sul giudizio umano: o quello di un redattore verso un sito, o quello di un webmaster verso il proprio sito attraverso la scelta di un titolo e di parole chiave, una forma di autopresentazione coincidente spesso con una sorta di
autovalutazione. I motori successivi, ad esempio Altavista, riuscirono a spingere oltre gli automatismi, indicizzando non solo il titolo di una pagina, ma anche il suo contenuto. Lycos, creato nel maggio del 1994, fu il primo che introdusse tra le sue funzioni di valutazione della rilevanza di un sito l'analisi dei link che puntavano verso quel sito. Lo stesso criterio che è alla base del PageRank di Google, che però è riuscito a sviluppare raggiungendo un'efficienza molto più elevata. Ed è proprio questa elevata efficienza che fa "sfuggire" di bocca, quasi in maniera inconscia, una suggestione di oggettività. Ma non è soltanto questa efficienza a produrre questa suggestione. E' il sapere che dietro quella semplice pagina bianca dove scrivo la mia
interrogazione ci sia a rispondermi una grande macchina (diretta da un algoritmo) e non le idiosincrasie degli uomini con la loro grande varietà di preferenze individuali. La macchina intelligente, separata dal mio corpo e autonoma, di cui il cinema e la fantascienza hanno prodotto esempi estremamente potenti e suggestivi - basti pensare al computer parlante di Star Trek, ci appare neutra, giusta, addirittura buona perché contemporaneamente infallibile, veloce, raffinata e soprattutto fredda, cioè non soggetta per sua natura a ciò che rende gli uomini così capaci di sbagliare, cioè sentimenti e passioni. Il punto è che questa macchina, inutile dirlo, dagli uomini è stata creata, da loro viene istruita e modificata, da loro non è affatto separata perché ne è soltanto una potentissima protesi. Più in generale, l'evoluzione e sofisticazione sempre maggiori di certe tecnologie provoca in noi un fascino crescente, tanto da essere portati a dare allo strumento in quanto tale un'importanza eccessiva, ambigua e fuorviante, quasi fosse capace di avere una
diremmo che la filosofia di fondo scelta per la valutazione di un sito considera il successo che questo ha ottenuto in termini di link (sia quantitativamente che qualitativamente) come criterio per determinarne la qualità e il peso.
volontà propria34. Nel caso di Google a trattarlo come se fosse una specie di oracolo, aggiornando
il vecchio refrain "l'ha detto la TV" con "l'ho visto su Google"35
.
Questa illusione così seducente ogni tanto si inceppa: basta imbattersi in una situazione dove qualche fattore particolare ci renda in palese disaccordo con la macchina. Prendiamo ad esempio le rimostranze che un webmaster inviò ai gestori di Google riguardo il modo col quale il motore aveva indicizzato il suo sito, che aveva per argomento la Guerra Civile Americana36
:
Sono rimasto stupefatto dal vostro processo di classificazione. Visto che voi avete creato questo motore di ricerca, dovete anche correggere un odioso errore che è allo stesso tempo ridicolo e odioso per un webmaster. Per favore, digitate le parole "Ulysses S. Grant" nel vostro motore e guardate i risultati. Il mio sito web, "la home page di Ulysses S. Grant" fu votato come "miglior sito sulla Guerra Civile" nel numero del febbraio 1994 della rivista Civil War Time Illustrated (…) Si è classificato come la più importante
risorsa web su qualsiasi personaggio o battaglia della Guerra Civile. Bill Gates mi ha persino inviato un'e-mail personale elogiandolo (…). Voi (…) collocate altri siti (alcuni patetici) più in alto nella vostra graduatoria (…). Questa è una ingiustizia di tale gravità da richiedere una spiegazione. Sono convinto che se dedicherete cinque minuti a guardare il mio sito lo collocherete più in alto.
Chi ha ragione? Il webmaster offeso o la macchina Google, buona, neutra e imparziale? Certo, il mondo è pieno di esaltati che hanno una considerazione di sé esagerata, ma chi può veramente dire se quel sito sia fatto meglio o peggio degli altri in cima alla lista, alcuni dei quali definiti addirittura "patetici"? Non serve nemmeno provare a stabilirlo, è sufficiente capire da questo esempio quali sono i termini della questione. Si tratta cioè di aver chiaro che anche nella più potente finestra che si affaccia nella grande ragnatela del terzo millennio, quell'immensa 'biblioteca' vivente e interattiva che è il Web, abitano, in forme del tutto nuove - forse spesso invisibili - due opposti che scivolano dentro al nostro pensiero da sempre, vale a dire la coppia verità e opinione, alêtheia e doxa.
34 Nella mia esperienza personale - mi occupo di grafica e di editoria - ho incontrato e incontro moltissime volte
studenti o stagisti che mi rivolgono domande su che cosa bisogna imparare per fare il mio lavoro. Nella stragrande maggioranza dei casi queste domande coincidono con quale tipo di software bisogna conoscere. Rispondo sempre allo stesso modo, con toni a volte benevoli, a volte un po' convincenti: "il principale software che devi conoscere e usare bene sta dentro la tua scatola cranica. Quello che tu chiami software è soltanto uno strumento e devi essere tu a guidarlo, non viceversa".
35 In uno studio pubblicato nel gennaio 2005 da Pew Internet & American Life Project, condotto su un campione di
2200 adulti, si mostra che il 92% di chi usa un motore di ricerca negli Stati Uniti ha piena fiducia nei risultati delle sue ricerche. Un altro dato interessante è che ben il 62% non fa alcuna distinzione tra i risutati sponsorizzati e quelli normali, distinzione che soltanto il 18% degli intervistati dice di saper fare con certezza. Questo studio viene riportato da Jean- Noël Jeanneney in Quand Google défie l’Europe. Playdoyer pour un sursaut, Mille et une nuits, Parigi 2006 a pag. 60.
36 L'esempio è riportato da John Battelle in Google e gli altri. Come hanno trasformato la nostra cultura e riscritto le
John Battelle, nel riportare quest'esempio, sostiene che:
A molti diffondere un sistema di classificazione basato su un arido algoritmo sembrava un supremo atto di arroganza: chi erano questi mocciosi di Stanford per dire al mondo chi di noi era più importante? Che cosa ne sapevano del lavoro e della passione che c'erano dietro ai nostri siti? In verità Page e Brin non avevano alcuna pretesa di possedere quel tipo di conoscenza (…) il servizio di Google non pretendeva di leggere
effettivamente un particolare sito, o di comprenderne il contenuto. Semplicemente, rivelava la verità (il corsivo è mio) spesso sgradevole su quanto un sito fosse connesso con gli altri. Non importava quanto un sito sembrasse fantastico, o quanti premi avesse ricevuto; se altri non erano collegati ad esso attraverso link - meglio se da siti che a loro volta erano connessi a molti altri - allora, secondo la valutazione di Google, quel sito non esisteva veramente. Questo semplice, brutale fatto era difficile per molti da accettare.37
Battelle usa il termine verità in maniera nient'affatto ambigua perché lo riferisce, forse in maniera astuta, a un fatto realmente oggettivo e incontrovertibile, cioè a "quanto un sito (sia) connesso con gli altri", fatto che, però, tradotto nel pensiero di Google, significa "quanto un sito (sia) migliore degli altri". Occorre dunque aver bene presente che il criterio base di Google, cioè seguire l'opinione della maggioranza, è un criterio e non il criterio. E che questo criterio è
umano, molto umano, sebbene sia una macchina ad averlo imparato. Senza questa
consapevolezza la suggestione dell'oggettività è sempre pericolosamente dietro l'angolo ad attenderci, pronta a vestire di verità ciò che non è detto lo meriti.
Ma se questa suggestione può nascere da sola senza che ce ne accorgiamo, bisogna sottolineare che è Google stesso a parlarne piuttosto esplicitamente. Nelle pagine di presentazione del servizio raggiungibili dalla home page infatti si legge:
(…) PageRank esegue una misurazione oggettiva dell'importanza delle pagine Web (…) Non vi è intervento da parte di persone o manipolazione dei risultati; ecco perché gli utenti si fidano di Google come di una fonte di informazioni oggettive non influenzata dal posizionamento a pagamento.
E così, sebbene in contesti strutturati con qualche differenza, nella versione francese, tedesca, inglese:
(...) PageRank permet de mesurer objectivement l'importance des pages Web. (...) Les résultats ne font l'objet d'aucune intervention humaine ni manipulation, ce qui explique pourquoi les utilisateurs font confiance à Google et considèrent ce moteur de recherche comme une source d'information objective et indépendante.
(...) PageRank nimmt eine objektive Bewertung der Wichtigkeit von Webseiten vor. (...) keiner unserer Mitarbeiter greift persönlich in diesen Prozess ein oder manipuliert die Ergebnisse, weshalb die Nutzer auf Google als objektive Informationsquelle vertrauen, die frei ist von bezahlten Platzierungen.
(...) Google is objective and fully automated and does not use human editors to judge a web page's importance. 38
Google, dunque, è onesto ed oggettivo, la fiducia dei suoi utenti da lì nasce. Non ci sono sfumature di sorta, l'affermazione è netta. E' comprensibile che in quel contesto, oltre ad
informare, si faccia anche un po' di autopromozione, ma un piccolo accenno, anche di sfuggita, al fatto che a questo mondo la maggioranza non sempre ha ragione sarebbe stato altrettanto onesto. Si potrebbe disquisire su differenze, anche importanti, tra i diversi significati attribuibili alle diverse accezioni di oggettivo nelle varie lingue, ad esempio la maggiore vicinanza dell'inglese
objective non tanto all'idea di verità quanto a quella di imparzialità. Il punto è che le affermazioni
che ho citato stanno in un contesto non filosofico e accademico, dove si pesano le parole con molto scrupolo, ma sono pensate per un pubblico di milioni di persone, e dunque hanno un carattere evidentemente divulgativo dove si usa un linguaggio semplice, comune. Non si fa mai esplicito riferimento alla nozione di verità (ci mancherebbe!) ma è come se la si evocasse "di sponda" usando quella di importanza ("PageRank esegue una misurazione oggettiva
dell'importanza delle pagine Web"): la fretta, la distrazione media dell'internauta medio e un pizzico di ingenuità fanno il resto. Se al posto di importanza si fosse usato il concetto di
popolarità l'espressione sarebbe risultata molto più corretta (ciò che è popolare non è detto sia importante), ma forse meno accattivante.
Sempre nelle pagine di presentazione di Google si legge che PageRank
(…) è basato sullo specifico carattere democratico del web39
(…) Google interpreta un
38 Tutte queste citazioni sono tratte dalle pagine dove Google presenta la sua filosofia e gli strumenti che usa. Sono
raggiungibili dal link "tutto su Google" presente sulla home page di ogni sezione nazionale.
39 Curioso il fatto che nella versione francese di queste pagine l'espressione sia molto più carica di enfasi, infatti vi si
legge "PageRank est un champion de la démocratie". Probabilmente gli abili comunicatori di Google hanno pensato fosse utile calibrare questa espressione rispetto al retaggio culturale del paese della Marsigliese. Stessa differenza rispetto alla versione italiana la si trova nella frase finale. "I voti espressi da pagine importanti hanno più rilevanza e quindi contribuiscono a rendere importanti anche le pagine collegate" frase che nella versione francese risulta essere
collegamento dalla pagina A alla pagina B come un "voto" espresso dalla prima in merito alla seconda. Tuttavia, non si limita a calcolare il numero di voti, o collegamenti, assegnati a una pagina. Oltre a effettuare questo calcolo, Google prende in esame la pagina che ha assegnato il voto. I voti espressi da pagine importanti hanno più rilevanza e quindi contribuiscono a rendere importanti anche le pagine collegate.
Dunque: un link equivale a un voto; tutti i link non hanno lo stesso peso e quelli provenienti da un sito a sua volta molto linkato hanno un peso più alto. In altre parole, la qualità non è
nient'altro che un prodotto della quantità, e, spingendosi ancora oltre, è oggettivo ciò che è prodotto dall'opinione della maggioranza. Si può essere dunque facilmente portati a pensare che in un quadro del genere l'originale, l'atipico, il carattere singolare e tutto ciò che sia decisamente fuori dagli schemi fatichi ad essere intercettato, perché Google privilegia il dato comune, il valore medio, non l'eccezione e ciò che è minoritario. Come scrive Barbara Cassin "L'opinione dunque serve da punto di partenza e di arrivo, è misura e criterio di tutto. Essa definisce lo statuto ontologico degli oggetti che sono sulla ragnatela e della classificazione che ne fa Google".40
PageRank: evoluzione digitale di una moderna tirannia della maggioranza?
Uno studio41
condotto tra il 2003 e il 2004 pose a confronto una porzione del Web in un dato momento con quella stessa porzione sette mesi dopo. Di un campione di 150 siti furono scaricate tutte le loro pagine e quelle di altri siti ad esse collegate, arrivando a un totale di circa 15 milioni di pagine. Lo scopo era di vedere come sarebbe cambiata la ragnatela dei link nell'arco di quei sette mesi.
Si scoprì che in quel lasso di tempo si erano formati 12 milioni di nuovi link, ma ben il 70% di questi erano andati a rivolgersi a quelle pagine, circa il 20% del campione, che erano già popolari e molto linkate sin dal punto d'inizio dell'indagine. Non solo, ma una gran parte dei siti che originariamente avevano pochissimi link non ne avevano affatto guadagnato di nuovi. Sono dati sorprendenti, ma bisogna prima sottolineare due componenti naturali che
contribuiscono a produrli. Primo: è logico che, nel tempo, una pagina con contenuti di buona qualità (lo supponiamo dal momento che è molto linkata) sia attraente e quindi si procuri nuovi link. Secondo: per creare un nuovo link a una pagina, è altrettanto logico che bisogna conoscerla, dunque anche in questo senso è normale che una pagina molto linkata ottenga nuovi link, mentre
"Les liens présents dans des pages jugées importantes par Google ont plus de poids , et contribuent ainsi à élire d'autres pages". Si noti quindi come l'italiano "rendere importanti" diventi molto più enfaticamente "eleggere".
40 Barbara Cassin, Google-moi. La deuxième mission de l’Amérique, Albin Michel, Parigi 2007, p. 104.
41 Cfr. Marco Gori, Iian H. Witten, Teresa Numerico, Web Dragons. Inside the Myths of Search Engine Technology,
una per niente linkata non ne ottenga di nuovi.
Prendendo per buoni questi dati, e rimanendo sempre su un piano logico, c'è una cosa che non torna. Un sito non raggiunge un certo successo in maniera istantanea, ha bisogno di un certo tempo. Pertanto dovremmo concludere che il destino di un sito si gioca tutto all'inizio, quando riesce a ottenere quella quantità di link che riuscirà non solo a tenerlo "a galla", ma a procurargli nuovo successo? In altre parole, posto che un sito sia di qualità, quali sono i fattori che entrano in gioco nel momento in cui esso si afferma? Ce ne devono essere vari, altrimenti il web sarebbe immobile, mentre invece nuovi siti si affermano e altri perdono popolarità. Il punto è quindi capire a partire da che cosa un sito diventi visibile.
Questo accade in tre "luoghi": si scopre un sito perché ce lo segnala un motore di ricerca, perché lo scopriamo navigando "casualmente" e vi arriviamo attraverso un link, perché qualcuno ce ne ha parlato in qualche modo o un mezzo di comunicazione ce lo ha segnalato.
I primi due luoghi, sulla base delle due componenti naturali di cui parlavo sopra (la qualità è normale che sia attraente e per linkare qualcosa bisogna conoscerne l'esistenza) tenderebbero a essere sostanzialmente "conservatori". E quindi un sito già popolare rimane tale, mentre uno sconosciuto resta sempre sconosciuto. Bisogna dunque dedurre che sia il terzo luogo quello che "spariglia" le carte? Sì, a rigor di logica, ma potremmo aggiungere un altro fattore discriminante: il fatto, cioè, che non tutti i motori di ricerca ragionano allo stesso modo e non tutti seguono come criterio di fondo l'opinione della maggioranza.
Se questo ragionamento è corretto, scopriamo quanto sia importante che sul web la visibilità non provenga sempre dalla stessa fonte. Google è usato da moltissimi utenti, ma per fortuna non da tutti. Se invece così fosse, l'algoritmo PageRank sarebbe un monarca digitale che governerebbe attraverso una moderna versione della tirannia della maggioranza42
.
42 Come abbiamo visto in questo paragrafo, esistono fortunatamente dei fattori che intervengono a "sparigliare" gli
effetti dell'opinione della maggioranza. Tuttavia, sul piano concettuale, è opportuno ricordare i rischi che discendono da questa tirannia della maggioranza, rifacendosi sommariamente al pensiero di colui che introdusse per la prima volta questo concetto nelle sue teorie politiche, ossia Alexis de Tocqueville. Nel confrontare i sistemi politici basati sulla gerarchia tra gli uomini e quello giovane americano, che invece si basava sull'eguaglianza, egli sostiene che non è