DEL CONTENUTO
5.1 COME OVVIARE AL PROBLEMA DEL PIANO DELL'ESPRESSIONE
Il passo successivo della nostra analisi tocca un argomento recentemente tornato in auge al grande pubblico dopo il rilascio, da parte di Google, del nuovo spider Panda. In questo aggiornamento, infatti, sono stati modificati e migliorati i parametri che i motori di ricerca utilizzano per calcolare la relevance di un sito, con l'aggiunta di una penalizzazione per coloro tentassero di aggirare i procedimenti di indicizzazione.
Basato sulle valutazioni e i commenti di utenti (e webmaster!), siamo in grado di scoprire un po' meglio i segnali che aiutano Panda a identificare contenuto di bassa qualità con più precisione. Ciò si traduce in una maggiore varietà di siti, piccoli e medi, con contenuto di alta qualità, premiati con un ranking maggiore, il che è buono (Post di Pierre Far su Google+ del 26/09/14, esperto in webmaster trend analyst, traduzione mia – http://goo.gl/GCPe0U).
Non è propriamente un argomento nuovo, ma mai prima questi elementi furono resi così chiari e disponibili ai webmaster o a qualsiasi utente che voglia impratichirsi nella SEO. Google utilizza, all'incirca, duecento parametri per indicizzare una pagina e quindi attribuirgli un voto. Questi parametri sono importanti per la SEO e interessanti per la semiotica. Infatti sono punti di incontro tra ottimizzatori e motori di ricerca, nel senso che, tra i più di duecento parametri, quelli più significativi per noi sono composti di testo. Questo è un argomento che non stupisce, dal momento in cui i motori di ricerca scandagliano solo il piano dell'espressione e quindi il testo scritto, sia esso codice di programmazione o contenuti per utenti. Questi punti focali della pagina, dove
ottimizzatore e motore si incontrano, vanno sfruttati per far sì che l'indicizzazione avvenga per le parole chiave ritenute idonee dallo specialista SEO. È curioso notare che parliamo di testo scritto, dotato di significato, pensato appositamente per i motori di ricerca e gli utenti. Un testo con un doppio lettore modello, si potrebbe affermare.
Alcuni dei parametri sotto elencati verranno approfonditi in seguito, ma intanto vediamo quali sono i più interessanti alla luce del limite dei motori di ricerca di approdare al piano del contenuto:
− Parole chiave nel tag title, possibilmente all'inizio. Il tag title è quello che compare nelle ricerche di Google come nome della pagina di ricerca (in fig. 14 la scritta in blu). Risulta molto importante per i fini SEO andare a inserire una parola chiave in questo campo, così i motori di ricerca capiscono l'argomento della pagina e gli utenti centrano immediatamente l'argomento di discussione. In questo caso il testo è pensato per motore e utente.
− Parole chiave nel meta tag description, possibilmente all'inizio. Come il punto sopra, con la differenza che la description è invisibile agli occhi degli utenti nella pagina, ma è presente sui motori di ricerca sotto il tag title (in fig. 14 la scritta in nero). Anche qui, specificando bene le parole chiave, si permette al motore di ricerca di individuare quali keywords associare alla pagina in questione, ma non per obiettivi di indicizzazione. Vedremo in seguito il perché questo testo è pensato solo per gli utenti.
− Parole chiave in URL. Di nuovo, come i punti sopra, con la differenza che in questo caso le parole chiave vanno inserite nel nome della pagina, in quello che noi immettiamo quando vogliamo raggiungere un sito direttamente, senza
passare dai motori di ricerca (in fig. 14 la scritta in verde).
− Parole chiave nel tag heading (H1). H1 è un altro tag di struttura del sito, che potremmo indicare come titolo della pagina. Google, giustamente, è interessato a capire la struttura della pagina e inserendo le opportune parole chiave nei titoli dei paragrafi, risulta più semplice indicizzare e interpretare il contenuto dei testi.
− Keyword density. Ovvero la frequenza con la quale le parole chiave si presentano nel testo in relazione alle parole totali del testo. È uno dei modi in cui Google cerca di capire il contenuto della pagina. Con il semplice calcolo di un tasso percentuale, lo spider ottiene il numero di volte che una parola si ripete nel testo. Banalmente, più una parola è ripetuta più è possibile che la pagina stia parlando proprio di quell'argomento. Ovviamente è solo uno dei parametri, altrimenti risulterebbe riduttivo e comunque, ad oggi, è considerato poco importante ai fini di una corretta indicizzazione.
− Parola chiave nelle prime 100 parole del testo della pagina. Google preferisce avere all'inizio le parole chiave da indicizzare, perché fa parte dell'idea che le pagine devono essere create per gli utenti e non per i motori di ricerca. Gli utenti preferiscono avere subito le informazioni che cercano e quindi Google premia questo tipo di struttura dei contenuti.
− Link all'esterno. Un'altra cosa che Google apprezza nei siti è la possibilità di collegarsi ad altre pagine che parlano dello stesso argomento o che sono in qualche modo collegate. Nell'ipotesi che una pagina abbia un contenuto ambiguo per lo spider, Google potrebbe collegarsi a un link che dalla pagina porta verso un altro sito per cercare di comprendere l'argomento generale.
− Contenuto non copiato. Semplice: Google non vuole che gli utenti leggano gli stessi contenuti ripetuti e quindi penalizza quelle pagine che presentano lo stesso testo trovato in altre pagine, sia facente parte dello stesso sito, sia di un terzo.
− Una pagina vicina alla home page è da considerarsi più rilevante. Parametro particolare, visto che ha un puro valore posizionale. Le pagine collegate direttamente alla home page sono considerate più importanti rispetto a quelle non collegate. Se si considera la home page del sito di Lucanica, chiamato livello 0, il link alle categorie merceologiche sarà il livello 1 e il link dalla categoria alla scheda specifica informativa delle aziende sarà il livello 2. Questa gerarchia Google la riconosce e ne tiene conto in sede di votazione. Approfondiremo la gerarchia e la struttura del sito Lucanica nei prossimi capitoli.
− Liste o elenchi puntati aiutano gli utenti alla lettura del testo. Google potrebbe favorire siti con tale caratteristica, perché gli utenti preferiscono questo tipo di struttura. Si è visto che gli elenchi puntati aiutano alla comprensione e alla schematizzazione del contenuto per renderlo più facilmente comprensibile. Non è chiaro se questo tipo di struttura aiuta anche i motori di ricerca per l'organizzazione dei contenuti e l'indicizzazione.
− Sitemap. Questo è un elemento molto tecnico, ma estremamente interessante per noi. Lo spider si appoggia a un file di testo, che il webmaster carica in un apposito strumento di Google, in cui è esplicata la struttura del sito. Così facendo lo spider sa già dove sono, per esempio, le pagine tradotte in altre lingue, quale pagina si collega a un'altra e come è strutturato il menu interno del sito.
Dopo questa rapida analisi, emerge in modo preponderante la forza della struttura nelle dinamiche di indicizzazione delle pagine per i motori di ricerca. Ed è così importante perché la struttura non cambia, rimane stabile, diversamente dalle parole e dal loro significato. In questo modo il motore di ricerca riduce al minimo le variabili potenzialmente incontrollabili, andando a indicizzare solo quello che comprende, lasciando indietro ciò che è troppo complesso o non scritto nel modo giusto (giusto per il motore di ricerca).
In termini semiotici potremmo dire che i motori di ricerca si affidano alla sintassi, ovvero alla struttura interna e alle posizioni che i diversi elementi occupano nella pagina (title, H1, posizione dei link, posizione dell'immagine, ecc.). Lo spider che entra nella home page di Lucanica, per esempio, vede diversi link lungo tutta la pagina e interpreta quelli in alto facenti parte del menù di navigazione, quelli a metà link alle pagine centrali del sito e quelli più in basso come referenze esterne e note legali (il footer). Il motore di ricerca così, solo guardando alla struttura, si sta già facendo un'idea della conformazione del sito, cosa è più importante (i link a metà) e quali e quante sono le pagine del sito (menù in alto). Di conseguenza il motore di ricerca attribuirà più importanza alle pagine collegate alla home page (primo livello), rispetto a pagine collegate ad altre che non siano la pagina iniziale (secondo livello).
Nel sito Lucanica, al primo livello, troviamo tutte le cinque categorie (Vini & Liquori, Olio, Pane & Pasta, Salumi & Formaggi, Specialità) più Focus on, Contatti e informazioni sul progetto. Se accedendo alla pagina Vini & Liquori clicco su una delle aziende, per esempio, Terra dei Re, allora accedo a una pagina di secondo livello, impossibile da raggiungere direttamente dalla home page. Inoltre, entrando nella pagina delle categorie merceologiche, ad esempio la pagina dedicata all'Olio, lo spider visualizzerà un'immagine nominata olive oil e con alt tag (posizione in cui andare a scrivere cosa è contenuto nell'immagine, leggibile dal motore di ricerca) italian olive
oil. Subito sotto l'immagine è presente il titolo, nel tag H1, e poi il testo descrittivo della
categoria, con le parole chiave inserite nelle prime parole. I motori di ricerca, quindi, entrando nella pagina dal link della home page olio, ne interpretano velocemente la struttura, con immagine dell'olio, poi testo inerente sempre all'olio e infine parole chiave nel testo sempre relative all'olio. In questo caso memorizzare una pagina relativa all'argomento olio risulterà abbastanza scontato, nonostante si rimanga sempre sul piano dell'espressione.
La struttura del sito è, fin da subito, materiale di analisi e soggetto a votazione da parte dei motori di ricerca, dato che più la composizione del sito risulterà chiara e standardizzata, più l'utente sarà soddisfatto. Questa struttura ha per i motori di ricerca, la stessa importanza che la sintassi ha per la lingua: ordine degli elementi che permettono
la composizione del linguaggio.
Si giunge così a osservare diversi escamotage che hanno lo scopo di aggirare il problema dell'indicizzazione basata su analisi compiute esclusivamente sul piano dell'espressione. Da un punto di vista fortunato, come quello semiotico, ciò appare straordinario, visto che Google difficilmente sbaglia a restituire il giusto sito per una
query. Tale precisione è sbalorditiva, sapendo che lo spider non capisce cosa legge, ma
restituisce meccanicamente parole uguali a quelle inserite dall'utente nel riquadro di ricerca. I duecento parametri sopra citati servono appunto a questo obiettivo: evitare errori di indicizzazione restituendo contenuto di qualità, il quale sarà premiato dai motori di ricerca con una posizione alta nella serp.