• Non ci sono risultati.

2. Cercando informazioni nel web

2.3. Dai motori di ricerca a Google

Il web è uno sterminato ipertesto composto da miliardi e miliardi di pagine che si collegano le une alle altre attraverso i link. Cercare contenuti sul web senza il supporto di uno strumento capace di selezionare questa enormità di informazioni, sarebbe praticamente impossibile. A questo servono i motori di ricerca, che funzionano un po’ come dei vigili informatici, dando indicazioni ai viaggiatori delle autostrade dell’informazione.

Il web e i motori di ricerca nascono più o meno assieme: più le strade della rete si estendono e si ramificano, più servono vigili capaci di indirizzare le persone in modo veloce ed efficace verso i luoghi di loro interesse.

Il web è nato all’inizio degli anni novanta al CERN, dal lavoro di Tim Bernes-Lee e Robert Cailliau, che definirono il protocollo HTTP e il linguaggio HTML e promossero il loro progetto di ipertesto mondiale. Nel giro di pochi anni, mano a mano che il web si diffondeva, venivano creati i primi motori di ricerca, strumenti capaci di catalogare le pagine web e renderle accessibili agli utenti. Fin dal principio i motori di ricerca sono stati costruiti grazie a un software genericamente chiamato spider capace di navigare tra le pagine web e di catalogarne il contenuto, facendo confluire i risultati in un database, che poteva essere interrogato tramite un’interfaccia semplice e di facile utilizzo. Uno dei primi motori di ricerca di successo, Lycos, già alla fine del 1994 era capace con questo sistema di catalogare il 90% delle pagine presenti a quell’epoca sul web: dieci milioni

38

circa12. Da allora il numero delle pagine web è cresciuto vorticosamente13. I motori di ricerca si sono evoluti, diventando sempre più potenti e sofisticati, e tra gli altri Google si è imposto al punto da diventare non solo il motore di ricerca più utilizzato, ma anche il sito in assoluto più visitato al mondo. La home page del motore di ricerca google.com è stabile da diversi anni in cima alla classifica dei siti web più visitati al mondo; analogamente la home page italiana (google.it) occupa il primo posto della classifica dei siti più visitati per l’Italia14

.

Fin dalle sue origini Google è stato un motore di ricerca diverso dagli altri. I suoi creatori, Sergey Brinn e Larry Page, avevano in mente di creare un motore capace di servire al meglio gli utenti, una intelligenza artificiale in grado di discernere addirittura le intenzioni di chi effettua una ricerca, e di fornire in base a quelle una lista di risultati con attributi di rilevanza e priorità15.

Un motore di ricerca dell’era precedente a quella di Google, davanti a una ricerca con una parola chiave comune, molto utilizzata, non poteva fare altro che restituire all’utente una lunghissima lista di pagine. Anche Google restituisce una lunghissima lista di link, ma lo fa seguendo un preciso ordine di priorità, che non è solo quello della pertinenza rispetto alla chiave utilizzata. Google utilizza infatti un algoritmo che tiene conto di molte variabili, tra cui in particolare il numero e la qualità dei link che portano a un certo sito web. Il Page Rank di Google si basa sul presupposto che più un sito (o per meglio dire una pagina web) è linkata da altri siti, più quel sito (o quella pagina) sono importanti. Si basa, in ultima istanza, sulla fiducia nel confronti dell’intelligenza collettiva: se una pagina web parla, per esempio di ricette di cucina, e quella pagina web riceve molti e molti link da altri siti che a loro volta parlano ricette e di argomenti affini, allora è molto probabile che quella sia una pagina importante relativamente al tema in questione. E quindi, se un utente interroga il motore con le parole ricette di cucina, Google gli proporrà proprio quella pagina in cima alla lista.

12 Ippolita, Luci e ombre di Google. Futuro e passato dell'industria dei metadati, Feltrinelli, Milano, 2007. 13

A quanto pare nessuno è in grado di contare il numero delle pagine attualmente presenti sul web. Qualche idea sulle dimensioni della rete e sulla sua crescita nel corso degli anni si può avere dai dati sulle pagine indicizzate dai motori di ricerca. Google sostiene che il suo primo indice, nel 1998, conteneva 26 milioni di pagine, che sono diventate un miliardo nel 2000; tra il 2000 e il 2008 il numero delle pagine ha continuato a crescere fino a toccare i mille miliardi (ed è presumibile che sia ulteriormente cresciuto dal 2008 a oggi). Fonte: We knew the web was big, pubblicato su “The official Google Blog” il 25 luglio 2008,

http://googleblog.blogspot.com/2008/07/we-knew-web-was-big.html .

14 Vedi www.alexa.com.

39

In questo modo Google suggerisce ogni giorno a milioni di persone dove andare per trovare quello che cercano. Lo fa in modo efficace, andando incontro alle esigenze degli utenti, ma ciò non toglie che sia un potente strumento di selezione dell’informazione. Se non piaci a Google puoi stare certo che le tue pagine web resteranno ad ammuffire in fondo alle Serp16 e sarà estremamente difficile che qualcuno ti trovi.

Il meccanismo è complesso, l’algoritmo non si basa unicamente sul numero di link in entrata; non è sempre lo stesso perché con il passare del tempo cambia e si adatta alle trasformazioni del web; e non è nemmeno noto, perché Google lo tiene segreto. Offre però una serie di indicazioni abbastanza precise ai web master che desiderano posizionare il loro sito in modo ottimale per il motore di ricerca. Da queste indicazioni si individuano tre livelli per l’ottimizzazione dei siti su Google: un livello tecnico (come utilizzare al meglio alcuni tag HTML, come utilizzare alcuni strumenti online come il file robot.txt o la

site map); un livello relativo ai contenuti (una buona organizzazione, un linguaggio e link pertinenti al tema trattato, titoli di pagina e URL significativi rispetto al contenuto, non

copiare i testi da altre pagine web, la coerenza); un livello relativo alla promozione del sito e alla sua popolarità in base ai link che questo riceve.

Non è rilevante in questa sede addentrarsi nei meccanismi che governano il funzionamento di Google, e nemmeno nella questione complessa e tutt’ora aperta della reale o presunta trasparenza e neutralità di questa tecnologia. Si è voluto però accennare ai meccanismi di funzionamento del motore di ricerca per sottolineare il fatto che l’esito delle ricerche in Google è il frutto di un meccanismo che propone una selezione e una gerarchia dell’informazione. E che questo meccanismo non è né casuale né totalmente ingovernabile da chi vuole offrire i propri contenuti online. Esiste una metodologia precisa, che prende il nome di Search Engine Optimization (SEO) che viene applicata per cercare di posizionare in modo ottimale un sito web nei motori di ricerca. È in corso addirittura una battaglia silenziosa tra gli esperti SEO che cercano di carpire e di forzare i

meccanismi dei motori, e Google che modifica il proprio algoritmo cercando di eludere le forzature non gradite. Si tratta di questioni per addetti ai lavori, che tuttavia sono importanti perché concorrono a spiegare per quale motivo certi contenuti riescono a scalare le vette dei risultati delle ricerche, mentre altri risultano meno visibili. E inoltre, vale la pena sottolinearlo, non sono necessarie competenze tecniche particolarmente

16 Serp è l’acronimo di search engine results page, e viene utilizzato nel gergo informatico per indicare

40

raffinate per cercare di migliorare il posizionamento di un sito. Le istruzioni che Google mette a disposizione sono molto semplici, e tra queste una andrebbe mandata a memoria da chiunque voglia impegnarsi in qualsiasi tipo di comunicazione in rete: “pensa alle parole che gli utenti potrebbero digitare per trovare le tue pagine e assicurati che siano incluse nel tuo sito”.

Documenti correlati