• Non ci sono risultati.

Capitolo 2. Il targeting

N/A
N/A
Protected

Academic year: 2021

Condividi "Capitolo 2. Il targeting"

Copied!
40
0
0

Testo completo

(1)

33

Capitolo 2. Il targeting

2.1. Introduzione

In questo paragrafo vedremo brevemente quali sono i metodi utilizzati per posizionare gli annunci all’interno di una pagina. Tali modelli verranno poi approfonditi nelle prossime pagine.

Il targeting è importante perché permette di posizionare gli annunci in modo tale che chi li visualizza sia interessato a ciò che offrono.

Le principali tipologie di web targeting sono le seguenti tre: • Search-based targeting;

• Contextual targeting; • Behavioral targeting.

I primi due modelli utilizzano come base per posizionare gli annunci le parole chiave. Nel primo quelle digitate da un utente in un motore di ricerca, nel secondo quelle all’interno di una pagina di contenuti, come ad esempio un articolo su un quotidiano online.

Il behavioral targeting invece si basa su dati sull’utente che sta visitando il sito in quel momento, come per esempio pagine visitate in precedenza, link cliccati e ricerche effettuate.

Un publisher può utilizzare anche più di una di queste tecnologie contemporaneamente dividendo i propri spazi disponibili e usando targeting diversi.

Nei prossimi paragrafi approfondiremo le tematiche riguardanti queste metodologie e le tecnologie che utilizzano.

(2)

34

2.2. Keyword e Search Engine Advertising

Il search engine advertising è la tipologia di pubblicità online che produce più fatturato nel complesso mercato dell’internet advertising. Questo dato è anche dovuto alla grande facilità con cui un utente si trova in contatto con un motore di ricerca. Basti pensare che effettuare una query nel web è una delle prime azioni che viene compiuta anche da un utente inesperto e che l’utilizzo di tale strumento risulta subito familiare.

La logica di funzionamento è semplice. Un utente esegue una ricerca sul web (producendo una query), oltre ai risultati richiesti il motore di ricerca produce anche altri link, corrispondenti a pubblicità, spesso evidenziati o inseriti in determinati spazi, ma in ogni caso facilmente riconoscibili.

Figura 12. Esempio di Search Engine Advertising su Google. 

Google inserisce i collegamenti sponsorizzati al di sopra e alla sinistra dei risultati di ricerca, questo layout di pagina è utilizzato anche dal suo maggiore antagonista: Yahoo!.

Andiamo ora a descrivere brevemente la storia di questa metodologia di advertising. Il primo motore di ricerca ad aver utilizzato il targeting dei banner pubblicitari basato sulle keyword digitate è stato InfoSeek nel 1995. L’anno

(3)

35 successivo fece il suo avvento il modello di pricing basato sul numero di click7 collezionati da una pubblicità, nato da una esplicita richiesta di Proctor & Gamble a Yahoo!. Nello stesso periodo anche un altro motore di ricerca, OpenText, iniziò ad usare il targeting basato sulle query degli utenti. Ancora, però, il mercato non era pronto ad affrontare la trasformazione commerciale dei motori di ricerca, quindi gli altri competitor non proseguirono oltre nella sperimentazione.

Per ovviare al problema dell'accettabilità da parte degli utilizzatori Goto.Com (oggi proprietà di Yahoo!) introdusse pubblicità testuali chiaramente differenziate dai risultati della ricerca. Ma allo stesso tempo si era mossa anche Google che introdusse AdWords, che oggi produce ricavi altissimi in tutto il mondo. Oltre a queste grandi realtà si sono affermate anche altre aziende specializzate nella gestione del search engine advertising come DoubleClick (oggi di proprietà di Google), con il ruolo di ottimizzare le campagne, di creare strumenti integrativi e di supporto e di aumentare il ROI specifico.

La tecnologia che sta dietro al search engine advertising, basata sulla corrispondenza tra keyword e testo digitato dall’utente, è utilizzata anche all’interno dei siti web che desiderano ospitare pubblicità correlata ai contenuti delle pagine al loro interno.

Prima di andare a vedere chi sono i maggiori player nel search engine advertising, andiamo ad analizzare le quote di mercato con cui i motori di ricerca si dividono il mercato. La rete Google è di gran lunga la più utilizzata per le ricerche con una percentuale di 59,8 negli U.S.A. e del 79,2 in Europa, seguono Yahoo! (21,3% in U.S.A., 2% in Europa) e Microsoft (9,4 % in U.S.A. e 1,9% in Europa)8, che però sono molto staccate soprattutto nel vecchio continente.

I più grandi player nel Search Engine Advertising sono due: Google, Yahoo (che in questo campo è partner di Microsoft, a cui offre il servizio di sponsorizzazione

7 Cost per Click o CPC, sarà descritto in seguito. 8 Dati comScore qSearch, www.comScore.com

(4)

36

su Live Search). Le due società propongono i servizi AdWords (di Google) e Yahoo! Search Marketing, il cui funzionamento di fondo è il medesimo.

Molti motori di ricerca si avvalgono dei servizi offerti da queste due grandi multinazionali. Solo per fare alcuni esempi possiamo citare tra gli utilizzatori di AdWords: AOL9, Alice e Libero, e tra gli utilizzatori di Yahoo! Search Marketing: MSN, Altavista e Kataweb. Vedremo nel paragrafo relativo agli aspetti microeconomici che queste collaborazioni sono molto importanti ai fini dell’incremento della quota di mercato.

Yahoo! e Google offrono anche un altro tipo di prodotto, complementare al primo, che offre la possibilità di inserire pubblicità nel proprio sito o nel sito della propria azienda, riuscendo così a creare ricavi aggiuntivi. Per quel che riguarda Google lo strumento si chiama AdSense mentre il concorrente risponde con Yahoo! Publisher Network.

Nei seguenti paragrafi vedremo come sono strutturati gli annunci, dove vengono posizionati, quanto costano e perché.

2.2.1. Keyword advertising

Gli annunci basati sulla correlazione tra query dell’utente e parole chiave hanno il grande vantaggio di fornire all’utente un messaggio mirato alle sue esigenze, nel momento e nel posto giusto, cioè quando sta proprio cercando quel determinato prodotto.

I concetti di fondo che ispirano questa tipologia di pubblicità sono molto simili per tutte le piattaforme di ricerca che operano sul mercato, qui prenderemo in considerazione prevalentemente la metodologia utilizzata da Google.

Gli annunci di questo tipo sono visualizzati in due tipologie di pagine, quelle di ricerca e quelle di contenuti. Le prime sono quelle in cui l’ad è correlato direttamente a ciò che l’utente ha appena digitato nel motore di ricerca (esempio in Figura 12), nelle seconde l’utente visualizza annunci relativi a ciò che è

(5)

37 contenuto nella pagina (ad esempio una notizia), possiamo vederne un esempio nel seguente articolo (non completo) del Sole 24 Ore:

Figura 13. Keyword advertising su ilsole24ore.com. 

Grazie all’utilizzo di questi due canali il motore di ricerca riesce ad aumentare la propria offerta facendo visualizzare anche annunci collegati a parole chiave non molto ricercate.

Più nel dettaglio la rete Google si divide in rete di ricerca e rete di contenuti. La prima è composta dalle pagine di ricerca di Google e da quelle dei siti di ricerca che utilizzano Google per gli annunci (p.e. AOL, Alice). In questo caso gli annunci, come già detto in precedenza, vengono visualizzati sopra e a destra dei risultati della query.

La rete di contenuti comprende pagine di notizie, siti web che trattano argomenti specifici, blog e altro. Qui il posizionamento del blocco di annunci è scelto dall’editore in base al layout del proprio sito web.

(6)

38

Nella rete di contenuti l’advertiser può decidere di utilizzare un targeting per posizionamento invece del tradizionale targeting correlato alle keyword, cioè può scegliere su quali siti il suo annuncio verrà visualizzato, in questo modo potrà controllare più facilmente dove verranno pubblicati i suoi ad. Il targeting per posizionamento interagisce con il targeting per parola chiave nella definizione dei siti con contenuti appropriati all’annuncio.

Oltre a queste due tipologie è possibile utilizzare targeting geografici o linguistici per far visualizzare gli annunci solo ad utenti di determinate aree o che parlano una certa lingua. Per fare ciò Google utilizza quattro strumenti:

• Il riconoscimento del dominio Google, se per esempio l’utente effettua la ricerca da Google.it vengono visualizzati gli annunci in italiano;

• Analisi sintattica delle ricerche, con questo strumento Google inserisce annunci relativi ad una determinata città o area grazie ai termini di ricerca inseriti dall’utente, p.e. per la query “hotel Livorno” l’utente visualizzerà ad di quella determinata area;

• Indirizzo IP, è un codice univoco utilizzato per individuare la posizione fisica di un computer, Google usa questo dato per due ragioni, la prima è quella di indirizzare gli annunci con target geografico personalizzato o per regione, la seconda è quella di indirizzare verso gli annunci nella propria lingua gli utenti che fanno ricerche su Google.com;

• Preferenze linguistiche, ogni utente può scegliere la lingua dei risultati della ricerca e quindi degli annunci. Se non viene specificata vengono utilizzate le regole precedenti. P.e. utilizzando questo strumento un soggetto può fare ricerche su Google.it visualizzando annunci in una lingua diversa dall’italiano.

Abbiamo visto dove e come può essere fatto il posizionamento, ora ci soffermiamo sul formato dell’annuncio.

(7)

39 Gli annunci più usati in Google generalmente sono in forma testuale, ma possono essere anche illustrati, animati o video. Qui andremo ad approfondire solo quelli testuali.

Figura 14. Esempio di annuncio testuale in Google AdWords. 

Gli annunci testuali in Google contengono 4 righe. La prima in blu è il titolo e descrive il prodotto offerto dall’advertiser, nella seconda e nella terza si trova la descrizione del prodotto e nella quarta il link alla pagina del venditore10. Google definisce anche la lunghezza delle quattro righe: 25 caratteri (compresi gli spazi) per il titolo e 35 per le altre tre.

Inoltre Google stabilisce regole redazionali molto chiare sull’impostazione dell’annuncio, andando a controllare molti aspetti. Di seguito riportiamo un elenco delle principali voci analizzate: grammatica e ortografia, spaziatura dei caratteri, ripetizioni, appropriatezza del linguaggio, accettabilità delle espressioni, esistenza effettiva dell’offerta pubblicitaria. Il controllo di Google inoltre va a prendere in considerazione anche il contenuto della pubblicità, vietando o limitando gli annunci relativi a determinate tipologie di pubblicità, come ad esempio quelle relative ad alcolici, sigarette, armi, giochi d’azzardo, pirateria informatica e molti altri. Queste regole possono variare a seconda dell’area in cui ci troviamo a causa di diversa legislazione su determinati temi. Quando un annuncio è stato creato il suo posizionamento (e il suo costo) all’interno di una pagina web o nei risultati di ricerca sarà determinato da un’asta (che descriveremo più avanti), l’asta prende in considerazione alcuni valori,

10 Il link visualizzato si chiama URL di visualizzazione, non è necessariamente quello specifico della pagina, anzi spesso è quello dell’homepage del sito web in cui si trova l’offerta. In realtà l’utente verrà indirizzato in una pagina specifica, quella scelta dall’advertising come URL di destinazione. Questo indirizzo non viene visualizzato sull’annuncio, ma corrisponde esattamente alla pagina in cui si trova il prodotto. In questo modo si evita che gli annunci contengano link molto lunghi. In ogni caso il link di destinazione si deve trovare all’interno del sito dell’URL di visualizzazione.

(8)

40

importanti anche per la gestione dell’account da parte dell’utente, descritti nel prossimo paragrafo.

Nella scelta delle parole chiave gli advertiser possono scegliere tra 4 opzioni di corrispondenza con le query:

• Generica; • A frase; • Esatta; • Inversa.

La corrispondenza generica è l’impostazione predefinita di adWords, ogni nuova parola chiave inserita dall’advertiser avrà questa impostazione finché, e se, verrà modificata. Con questa corrispondenza un annuncio verrà visualizzato ogni volta che un utente effettua una ricerca contenente quella parola chiave o un termine simile. Quindi, se si utilizza questa metodologia, un annuncio viene visualizzato anche quando vengono ricercate altre parole, o quando la ricerca è simile (p.e. plurali e sinonimi).

Nella corrispondenza a frase l’annuncio viene visualizzato quando la query dell’utente contiene la keyword o frase nell’esatta sequenza o forma specificata dall’advertiser. In questo modo si può limitare la visualizzazione dell’annuncio per varianti non pertinenti della parola chiave, creando un targeting più preciso. Un modo ancora più preciso per creare parole chiave mirate è la corrispondenza

esatta, in questo caso l’annuncio sarà visualizzato solo nel caso che la ricerca di

un utente corrisponda esattamente alla parola chiave, non sono ammessi caratteri extra o altri contenuti nella query.

La corrispondenza inversa invece è utilizzata per non far visualizzare l’annuncio nel caso sia stata fatta una ricerca con parole non gradite dall’advertiser insieme alle keyword selezionate.

(9)

41

2.2.2. Terminologia e parametri da tenere in considerazione nel search advertising

Partiamo descrivendo le tipologie di driver che guidano il pricing degli annunci. Possiamo in quest’ottica distinguere tra Cost per Impression, Cost per Click e Cost per Action (quest’ultima non utilizzata da Google ma comunque importante).

Il Cost per Impression o Cost per Mille (CPM), è stato il primo metodo di pricing utilizzato in questo settore. Il suo funzionamento è ispirato ai media classici, cioè l’advertiser paga una cifra pattuita con il publisher ogni volta che l’annuncio viene visualizzato. Nel caso specifico l’advertiser paga la cifra pattuita ogni 1000 volte che l’ad viene visualizzato. L’attribuzione del costo basato sul driver Impressione non garantisce all’advertiser un livello di conversione delle visualizzazioni in click soddisfacente. Con il CPM possono verificarsi situazioni in cui l’annuncio viene visualizzato molte volte senza essere mai cliccato. In linea generale, quindi, nel CPM la posizione più rischiosa è occupata dall’advertiser, mentre il publisher è tenuto solamente a mostrare la pubblicità il numero di volte pattuito senza nessuna responsabilità sul numero di click.

Un netto miglioramento a questa situazione è dato dal Cost per Click (CPC), questo modello di pricing è attualmente il più usato, grazie anche agli ottimi risultati di Google.

Nel CPC il driver di costo è il click effettuato sull’annuncio. In questo modo l’advertiser paga solo quando viene visitata la pagina pubblicizzata, senza tenere conto di quante volte l’annuncio viene visualizzato. Con questo modello, a parità di costo, molti più utenti visualizzeranno la pagina dedicata al prodotto facendo aumentare la probabilità di creare ricavi11.

11 Dobbiamo tenere conto, per stabilire la quota di prodotti venduti grazie agli annunci pubblicati su internet, del tasso di conversione delle visualizzazioni dell’annuncio in click e successivamente della conversione dei click in acquisti da parte dell’utente.

(10)

42

Con questa tipologia di pricing il rischio si sposta anche sul publisher, che trarrà anch’esso vantaggio da un migliore posizionamento degli annunci, creando un punto di incontro tra le due parti in gioco, portando ad un sistema molto efficace. Purtroppo però, il CPC è soggetto a tentativi di frode da parte di soggetti (spesso organizzati) che vogliono aumentare il numero di click sugli annunci. Questa pratica, il Click Fraud, viene utilizzata per aumentare i propri ricavi nel caso di un publisher o per aumentare i costi dei competitor (se effettuata da advertiser). Nonostante forti investimenti e molte ricerche il problema è ancora lontano dall’essere risolto.

Questo problema potrebbe essere superato se si utilizzasse il Cost per Action (CPA), già utilizzato da Amazon.com. Con il CPA l’advertiser paga una determinata cifra ogni volta che viene effettuata una determinata azione (conversion action), come ad esempio la registrazione sul sito web, la sottoscrizione di una newsletter o l’acquisto di un prodotto. Con questo modello l’advertiser è sgravato da buona parte del rischio a scapito del publisher.

Si pensi al caso, non certo improbabile, in cui il Cost per Action è legato all’acquisto del prodotto: un utente clicca sull’annuncio entrando nella pagina del sito dove si acquista il prodotto, se effettua direttamente l’acquisto il publisher verrà pagato dall’advertiser per l’ammontare pattuito. Ma l’utente potrebbe decidere di uscire dal sito e di acquistare in un secondo momento, e potrebbe rientrare nella pagina dell’acquisto non più dal link pubblicitario ma dalla home page del sito. Facendo ciò non sarà possibile verificare che l’acquirente sia arrivato grazie alla pubblicità e il publisher non avrà nessun ricavo.

Il Cost per Action è stato testato per un breve periodo da Google con alcuni advertiser scelti. Ma dopo l’acquisto di DoubleClick, Google ha cambiato strategia, lasciando perdere questa metodologia di pricing e il testing.

Nelle campagne AdWords l’utente può scegliere liberamente se utilizzare un modello Pay per Click o Pay per Impression. La prima è comunque la più utilizzata.

(11)

43 Un altro parametro per misurare la bontà dell’annuncio è il Click-Through Rate (CTR o percentuale di click). Il CTR è un indicatore dato dal rapporto tra il numero di click e il numero di impressioni (x 100) collezionate da una determinata parola chiave. Indica quindi l’efficacia e il rendimento dell’annuncio. In linea generale il CTR è fortemente collegato alla pertinenza dell’annuncio, con l’aumentare di una di queste variabili aumenta anche l’altra. Quando il CTR è basso sarebbe opportuno che l’advertiser facesse dei cambiamenti all’annuncio o, se possibile, al suo posizionamento.

Un altro importante indicatore (questo a differenza degli altri utilizzato esclusivamente da Google) è il punteggio di qualità. Tale valore serve a determinare l’offerta minima che l’advertiser deve presentare per far si che il suo annuncio venga pubblicato. È influenzato dal CTR della parola chiave, dalla pertinenza del testo dell’annuncio, dal rendimento storico della keyword e da altri fattori di pertinenza.

Un’altra variabile importante è il budget giornaliero. Questo valore corrisponde all’ammontare massimo che un utente vuole spendere nell’arco di un giorno, Google fa in modo che tale limite di spesa non venga superato. L’advertiser, quindi, non spenderà mai più di quanto previsto. Gli annunci verranno mostrati con la massima frequenza possibile per una determinata offerta. AdWords propone all’advertiser un importo consigliato di budget giornaliero, al di sotto di questo valore la visualizzazione può essere discontinua. L’utente è comunque libero di scegliere il budget che preferisce, sia alzando che abbassando l’offerta. Molto importante, soprattutto per la determinazione del posizionamento dell’annuncio (descritto nel paragrafo sul funzionamento delle aste), è il valore dell’offerta CPC (o CPM nel caso del Cost per Impression). Questo valore è relativo alla parola chiave o al set di parole chiave contenute in un annuncio e corrisponde all’ammontare che il soggetto vuole spendere ogni volta che l’annuncio viene cliccato (o visualizzato 1000 volte nel CPM). Il valore scelto sarà determinante per la visualizzazione dell’annuncio, un’offerta troppo bassa

(12)

44

potrebbe portare il link in posizioni poco redditizie, non creando conversioni delle impressioni in click.

È importante che l’advertiser conosca anche il valore delle conversioni e la loro probabilità. Una conversione è l’azione che l’advertiser desidera scaturisca dal click sul suo annuncio pubblicitario, che ad esempio può essere l’acquisto di un prodotto o la sottoscrizione ad una newsletter. Il conversion rate (tasso di conversione) rappresenta la probabilità (a preventivo) o la frequenza (a consuntivo) con cui un click effettuato su un annuncio si trasformi nell’azione desiderata.

Questo è un importante parametro per l’advertiser in quanto gli consente di valutare l’efficacia delle proprie campagne e di decidere quanto vuole spendere per far visualizzare i suoi annunci.

2.2.3. Il click fraud

Come già premesso il principale problema del Cost Per Click è dato dal fenomeno del click fraud, con tale pratica diverse tipologie di soggetti creano click invalidi per scopi fraudolenti. In questo paragrafo vedremo una breve panoramica del problema e il comportamento di Google per arginarlo.

Google definisce i click o le impressioni invalidi come: “Clic o impressioni sulle pagine generati attraverso metodi vietati, e finalizzati all'incremento artificiale del numero di clic o impressioni sugli account dei publisher. La tecnologia proprietaria di Google analizza tutti i clic per determinare se rispondono a un uso fraudolento inteso a incrementare il numero di clic ricevuti da un'inserzionista o i guadagni di un publisher. Tutti i clic ritenuti non validi non daranno origine a entrate.”

Possiamo distinguere tra due tipi di click fraudolenti, quello commesso dai publisher e quello commesso dai competitor degli advertiser. Il primo è commesso per scopi lucrativi ed ha la finalità di aumentare i click sugli annunci nei propri siti per incrementare i ricavi. Il secondo viene commesso dai competitor degli advertiser ed ha lo scopo di danneggiare i concorrenti grazie

(13)

45 all’aumento dei click sui loro annunci, con un conseguente aumento dei costi pubblicitari che non porta a nessun ricavo aggiuntivo.

I click invalidi possono venire da diverse sorgenti:

• Individui che utilizzano programmi o applicazioni progettati appositamente per cliccare sugli annunci;

• Individui che impiegano lavoratori a basso costo o incentivano terzi a cliccare sul proprio annuncio;

• Publisher che cliccano manualmente sugli annunci delle loro pagine; • Publisher che modificano la struttura del proprio sito web in modo che gli

utenti aumentino i click involontariamente;

• Publisher che pagano siti web che forniscono artificiosamente traffico aggiuntivo e click aggiuntivi sugli annunci;

• Advertiser che cliccano manualmente sui click dei propri concorrenti; • Publisher sabotati dai propri concorrenti o da altri soggetti che desiderano

che abbiano risultati negativi;

• Diversi tipi di click involontari, come click doppi o altri click non intenzionali fatti da utenti che comunque non avevano intenzioni fraudolente;

• Problemi tecnici, errori nell’implementazione del sistema e coordinazione tra il motore di ricerca e gli affiliati che portano a conteggi doppi dei click; • Account multipli dei publisher AdSense. Google considera invalidi tutti i click collezionati da un account utente creato illegalmente e con false generalità da un publisher che già aveva un account.

Nella pratica non è sempre possibile sapere con certezza se un click è invalido o meno. È importante capire l’intento per cui è stato effettuato un click e se quel click aveva delle possibilità di trasformarsi in azione o se era stato effettuato solo per aumentarne il numero.

(14)

46

Google cerca di combattere questo fenomeno con diversi strumenti, che elenca nella sua guida di AdSense, vediamone uno stralcio:

“I nostri esperti controllano con estrema attenzione i clic e le impressioni sugli annunci Google per proteggere gli interessi dei publisher e quelli degli inserzionisti. Per maggiore accuratezza, vengono eseguite analisi automatiche e manuali su tutti i clic e le impressioni generate per rilevare eventuali attività di simulazione che possano aumentare artificialmente i costi degli inserzionisti o le entrate dei publisher.

La tecnologia proprietaria di Google analizza tutti i clic e le impressioni per determinare se rispondono a un uso fraudolento volto a incrementare artificialmente i costi di un inserzionista o le entrate di un publisher. Il nostro sistema utilizza sofisticati filtri per distinguere le attività generate da un normale utilizzo da parte degli utenti dalle attività che possono costituire un rischio per gli inserzionisti AdWords. Esempi di queste attività sono i clic o le impressioni generate da utenti scorretti, le sorgenti di traffico e i robot automatici, nonché i publisher che incentivano i clic sui propri annunci. Il nostro sistema ci consente di filtrare la maggior parte dei clic e delle impressioni non valide, impedendo così che tali attività vengano addebitate ai nostri inserzionisti.

Oltre al sistema automatizzato, un intero team di Google è dedicato alla rilevazione delle attività non valide mediante una serie di strumenti speciali e un'ampia gamma di tecniche basate sul monitoraggio esteso del comportamento degli utenti e sull'analisi delle situazioni. I nostri sistemi di rilevamento vengono aggiornati costantemente in modo da contrastare attivamente le attività non valide.”12

Questi strumenti, seppur ben funzionanti, non sono perfetti.

(15)

47 Per sopperire a mancanze legali e alle differenti visioni degli ordinamenti degli stati in cui opera, Google ha stilato un regolamento per i publisher di AdSense, in cui, tra le altre cose, si raccomanda di non fare click sui propri annunci, di non chiedere ad altri di fare click sui propri annunci e di non manomettere il codice AdSense. Se un publisher non rispetta il regolamento il suo account viene disattivato; in questo modo l’azienda si Brin e Page è riuscita a tutelarsi legalmente, almeno in parte, dai click fraudolenti, che rimangono comunque un problema di una certa rilevanza.

(16)

48

2.3. Il Behavioral targeting

Il behavioral targeting (BT o targeting comportamentale) è una metodologia di targeting delle pubblicità su internet basata sui comportamenti dei soggetti che stanno visitando un determinato sito web, come per esempio i siti visitati in precedenza o le pagine che l’utente ha visualizzato sul nostro sito.

Il publisher che utilizza questo tecnologia divide i potenziali clienti in segmenti derivanti dai loro comportamenti. I segmenti possono essere più o meno specifici, ad esempio se un utente ha visualizzato pagine inerenti a prodotti elettronici verrà indirizzato nel segmento “Appassionato di Elettronica” (o qualsiasi altro nome che il publisher voglia attribuire al segmento). Possono anche essere create tipologie di segmenti differenti come “Utenti che hanno inserito prodotti nel carrello ma non hanno acquistato”.

Possiamo dividere il behavioral targeting in tre tipologie principali: 1. Basato sui siti web e/o sulle pagine visitate in precedenza; 2. Basato sulle keyword cercate e/o sui contenuti letti; 3. Basato sui precedenti visitatori del proprio sito.

La prima tipologia è la più comune ed aggrega gli utenti che hanno visitato specifici siti internet con contenuti specializzati. Ad esempio se un soggetto frequenta abitualmente siti che offrono o parlano di viaggi viene inserito nella categoria “Travel shoppers”. In questo modo al soggetto verranno offerti contenuti e annunci pubblicitari più vicini ai suoi interessi, il vantaggio per gli advertiser è quello di mostrare la pubblicità ad un utente che è già dentro al mercato.

Vediamo un esempio di tale metodologia andando a vedere come opera Specific Media.

Per prima cosa i visitatori dei siti web vengono catalogati grazie a dati anonimi collezionati grazie a cookie. Il secondo passaggio è quello della segmentazione dei soggetti in gruppi con comportamenti simili. Infine quando un utente tornerà

(17)

49 su un sito della rete di Specific Media (oltre 450 siti) visualizzerà annunci pubblicitari basati sul suo comportamento passato. Tale funzionamento è riassunto nella seguente figura:

Figura 15. Specific Media behavioral targeting. 

La metodologia basata sulle keyword e sui contenuti va a segmentare il mercato trovando i soggetti interessati ad un determinato prodotto in base a ciò che loro hanno cercato o alle parole chiave presenti in ciò che hanno letto. Questa metodologia, in parte simile al contextual targeting, cerca corrispondenze con gli annunci pubblicitari degli advertiser basati sulle stesse parole chiave.

La terza tipologia crea segmenti comportamentali in base agli utenti che precedentemente hanno visualizzato il sito web. Generalmente ciò viene fatto inserendo uno o più codici nel sito web. Il metodo più semplice prevede l’inserimento di un solo codice nella home page, ma quello più efficiente prevede l’inserimento di più codici in diverse pagine. In questo modo si possono dividere i visitatori, andando a vedere quali visitano solo la home page, quali vanno a vedere gli approfondimenti, o qualsiasi altra informazione che il publisher crede essere discriminante per la segmentazione.

(18)

50

Questa tipologia di behavioral targeting è comunemente usata dai siti di e-commerce. Grazie ad essa offrono agli utenti prodotti rilevanti, in particolare si possono dividere i potenziali clienti in tre categorie:

• Coloro che hanno visitato il sito ma non hanno visualizzato informazioni aggiuntive sui prodotti o servizi;

• Coloro che hanno visualizzato la pagine dei prodotti ma non hanno neanche iniziato il processo di acquisto. Questi soggetti probabilmente hanno bisogno di informazioni aggiuntive o di un incentivo ad acquistare; • Coloro che hanno iniziato il processo di acquisto (ad esempio inserendo il

prodotto nello shopping cart) ma che non lo hanno portato a termine, anche questi soggetti hanno bisogno di informazioni aggiuntive o di incentivi, spesso però diversi da quelli cercati dai soggetti della categoria precedente.

In questo caso la finalità del targeting comportamentale è quella di fornire messaggi (anche pubblicitari) mirati ad ogni utente basati sul loro posizionamento nel ciclo di acquisto.

Naturalmente sono possibili altri tipi di targeting comportamentali. A titolo esemplificativo possiamo citare quello basato sui click effettuati in precedenza su annunci pubblicitari.

Cerchiamo ora di capire quali sono gli strumenti che permettono agli advertiser di essere in possesso dei dati (personali o non personali) degli utenti.

I dati possono essere collezionati tramite cookie o tramite web beacons. I cookie sono piccole quantità di dati che vengono inviate all’utente tramite i web browser e memorizzati sul computer. Essi servono ai siti internet visitati a tracciare le preferenze degli utenti, per esempio per capire se l’utente ha già visualizzato il sito in passato. I cookie rendono possibile la personalizzazione delle pagine web e permettono agli ad network di conoscere le preferenze dei soggetti e di mostrargli annunci su misura. I web beacons sono piccole stringhe di software in grado di determinare se una certa pagina web è stata visualizzata, da quanti utenti

(19)

51 è stata vista e quanti hanno avuto accesso ai cookie di quella pagina o sito. I web beacons sono contenuti in immagini, per esempio in banner pubblicitari o in immagini create appositamente, a volte grandi 1x1 pixel in modo da non stravolgere il layout di un sito web.

Per chiarire le funzioni di cookie e web beacon, vediamo come vengono utilizzati da Yahoo!, partendo dai cookie:

“Yahoo! utilizza le informazioni personali raccolte dai propri utenti per tre diversi obiettivi di massima: personalizzare i messaggi pubblicitari ed i contenuti, rispondere nel migliore dei modi alle richieste di specifici prodotti e servizi, ed infine informare gli utenti stessi su offerte speciali e nuovi prodotti. In particolare, Yahoo! utilizza i propri cookies per diversi scopi, fra cui:

• Accedere alle informazioni del tuo account (memorizzate sui nostri computer) nel momento in cui ti registri, in modo da poterti fornire contenuti personalizzati, come avviene nel caso de Il Mio Yahoo!.

• Tenere traccia delle preferenze che ti viene chiesto di specificare quando utilizzi determinati servizi Yahoo!.

• Rendere più mirati i messaggi pubblicitari che compaiono sulle nostre pagine Web, sulla base dei tuoi interessi e delle tue "abitudini di navigazione" su Yahoo!.

• Aiutare i commercianti presenti in Yahoo! Shopping ad evadere nel migliore dei modi tutti i tuoi ordini.

• Valutare il volume del traffico sui nostri siti, facendo delle stime il più possibile precise.

• Fare ricerche di mercato per migliorare costantemente i contenuti dei nostri siti Web ed i nostri servizi.

• Proteggere la sicurezza del tuo account ed evitare che altre persone vi possano entrare, anche solo accidentalmente; a questo fine, ti chiediamo

(20)

52

infatti di reinserire la tua password Yahoo! anche solo dopo un breve periodo di inattività.

• Ti ricordiamo che Yahoo! consente ai suoi inserzionisti di inviare i loro cookies sul tuo computer e di accedervi.”13

I web beacons vengono utilizzati da Yahoo! nelle seguenti situazioni: “All'interno della rete dei siti Yahoo!:

• Yahoo! fa uso dei Web beacons nell'ambito della propria rete di siti Web allo scopo di conteggiare il numero di utenti e riconoscere gli utenti registrati Yahoo! attraverso i cookies Yahoo!.

• Accedendo ai cookies Yahoo! siamo inoltre in grado di rendere più significativa, piacevole e personalizzata la tua esperienza sui quei siti Yahoo! che non sono direttamente nel dominio yahoo.com (come, ad esempio, Yahoo! GeoCities, che si può trovare ancora come www.geocities.com).

Al di fuori della rete dei siti Yahoo!:

• Yahoo! fa uso dei Web beacons per condurre delle ricerche per conto di partner terzi, sui loro siti Web. Scopo di tali ricerche è di misurare e implementare l'efficacia delle rispettive attività di marketing e pubblicitarie. I dati così raccolti vengono poi utilizzati esclusivamente al fine di poter fornire ai nostri partner delle informazioni, in forma aggregata, sui loro utenti, comprese quelle a carattere demografico e sui modelli d'uso. Sottolineiamo tuttavia che, a seguito di queste ricerche, nessuna delle informazioni personali raccolte da ciascuno dei nostri utenti viene in alcun modo da noi trasmessa ai nostri partner esterni.”14

13 http://info.yahoo.com/privacy/it/yahoo/cookies/ 14 http://info.yahoo.com/privacy/it/yahoo/webbeacons/

(21)

53 Per riassumere il possibile funzionamento del processo di behavioral targeting vediamo passaggi di questo esempio teorico:

• Un utente accede ad internet e digita un indirizzo nel suo browser per visitare un sito web;

• Se quel sito ha un accordo con un ad network fa parte della sua rete di siti, quando l’utente vi accede stabilisce anche una connessione separata a un ad server di terze parti;

• Quindi l’ad server risponde alla connessione e identifica il computer dell’utente inserendoci un cookie;

• Simultaneamente l’ad server crea un suo file che gli permette di iniziare a predire in che segmento di mercato si trova l’utente che sta utilizzando quel computer;

• Quando l’utente si sposta in un altro sito facente parte dello stesso ad network il computer riallaccia il contatto con lo stesso ad server, che avendo già posizionato il cookie non deve far altro che aggiungere dati al file creato precedentemente per quell’utente;

• L’ad server sceglierà quindi un appropriato banner o annuncio basandosi sugli interessi presunti del segmento di mercato in cui ricade quel soggetto, e invierà questa pubblicità tramite il sito web che l’utente sta visualizzando.

Il più grande problema del behavioral targeting è quello che deriva dalla raccolta di informazioni sui soggetti. Questo perché esistono limitazioni legali ma anche perché non sempre, anzi quasi mai, i soggetti sono entusiasti di essere controllati. Questo anche quando le informazioni utilizzate per il targeting non sono strettamente personali come l’indirizzo IP o la cronologia delle esplorazioni. Più avanti approfondiremo questo tema.

(22)

54

In breve il behavioral advertising è utilizzato dagli advertiser per mostrare i propri annunci ad utenti già nel mercato dei loro prodotti o servizi. E chi è già nel mercato acquisterà con più probabilità rispetto a chi non lo è. Inoltre se l’azienda conosce quali sono i tratti distintivi del suo cliente modello può cercare gli utenti con le stesse caratteristiche ed offrirgli il proprio prodotto aumentando la possibilità di creare un conversione.

Il behavioral targeting è in grande crescita, tanto che Google ha deciso di acquistare DoubleClick, il tool provider più grande del mercato. Questo acquisto è stato monitorato da vicino dalla Federal Trade Commission e dall’Unione Europea. Si voleva verificare da una parte che non fosse creato un colosso imbattibile nell’internet advertising e dall’altra le ragioni che spingono Google a registrare le informazioni sulle ricerche effettuate dai suoi utenti.

In effetti, la sinergia tra le due aziende può creare grandi risultati. Infatti da un lato Google ha gli storici delle ricerche effettuate da milioni di utenti in rete e dall’altro DoubleClick ha gli strumenti per tracciare i siti web e le pagine effettivamente visualizzate dagli utenti. A questo dobbiamo aggiungere che il behavioral targeting è tanto più funzionante tanto è più grande il network che lo ospita.

2.3.1. Un esempio di BT: il modello di Advertising.com

Il modello che vedremo in questo paragrafo spiega le scelte di business intelligence fatte da Advertising.com, il principale ad network americano, nell’ indirizzamento degli annunci agli utenti basato sul loro comportamento precedente.

Lo scopo di questo progetto è quello di utilizzare i dati a disposizione di Advertising.com per creare lift aggiuntivo.

Approfondimento: il lift

Il lift è la misura del miglioramento nel numero di successi su una certa dimensione del campione distorto (in senso positivo) scelto dal modello.

(23)

55 lift(n) = k

significa che sugli n casi che il modello giudica più promettenti il numero di successi è k volte maggiore della media.

Si può anche leggere così: k volte maggiore del numero di successi che avremmo con un campione causale.

Ma il campione casuale è quello scelto usando un modello casuale, cioè nessun modello.

Quindi il lift è il rapporto tra la performance del modello scelto e quella del modello casuale, o di nessun modello.

La formula del lift è:  

 

Puntualizziamo il concetto con un semplice esempio: Stiamo progettando una campagna di mailing.

I clienti a cui possiamo inviare la proposta sono 1.000.000.

Non vogliamo inviare semplicemente a tutti. Vogliamo selezionare un campione distorto nel quale la probabilità di accettazione della proposta sia massima. Sappiamo che la risposta normale a campagne di questo tipo è dello 0,1%, quindi su tutta la popolazione ci attendiamo 1.000 successi.

Supponiamo di avere un modello di classificazione Risponde / Non risponde

che sul campione non casuale dei 100.000 clienti con il massimo score ci dà 400 successi contro i 100 di un campione casuale.

Diciamo che il modello ha un lift uguale a 4 (cioè 400 / 100) su un campione di 100.00 clienti.

Forse conviene inviare solo ai primi 100.000.

La realizzazione di questo modello è avvenuto attraverso questi passaggi: • Analisi e data mining per determinare relazioni e trend significativi;

• Sviluppo di modelli matematici per predire le probabili risposte al marketing comportamentale; ) / ( ) / ( e popolazion C p campione C p lift i i =

(24)

56

• Proposta di una metodologia che migliorasse la strategia pubblicitaria, in grado di aumentare il tasso di risposta degli utenti;

• Valutazione delle metodologie proposte per verificare la loro efficacia; • Raccomandazione formale di una metodologia in grado di generare

campagne pubblicitarie più efficienti e aumentare la risposta degli utenti online alla pubblicità.

La tecnologia utilizzata da Advertising.com è denominata AdLearn®. Questo strumento crea campagne dinamiche effettuando direttamente il targeting degli utenti.

AdLearn® utilizza un complesso algoritmo matematico che analizza le proprietà di alcuni fattori come ad esempio la posizione degli annunci, le performance del sito e il comportamento dell’utente. Questa tecnologia poi combina i dati relativi all’annuncio a quelli relativi al sito e alle preferenze (anonime) dell’utente. In breve è uno strumento di ottimizzazione automatica che opera dinamicamente sulle campagne pubblicitarie, scegliendo il posizionamento degli annunci in modo da massimizzare il risultato.

Advertising.com analizza i dati degli utenti ed estrae ogni informazione rilevante, cioè ogni informazione che sia in grado di aumentare il tasso di conversione. Una conversione è un’azione di interazione con l’annuncio effettuata dall’utente, che quindi produce informazione per l’advertiser, le forme possono essere svariate come ad esempio la registrazione o l’acquisto di un bene o servizio.

La rete di siti web di Advertising.com è molto grande, con moltissime campagne attive. Ciò permette di tracciare le attività di moltissimi utenti, portando ad avere dati molto significativi.

Con un piazzamento migliore degli annunci forniti ad un’utenza mirata, si può ridurre il numero totale della pubblicità fornita per raggiungere lo stesso risultato, così da avere minori costi. Ciò viene realizzato da Advertising.com grazie ad un’analisi approfondita sui comportamenti degli utenti all’interno dei siti web visitati. Ogni volta che un utente ricade all’interno delle caratteristiche di un

(25)

57 determinato gruppo di utenti unito ad un gruppo di siti web, vengono mostrati gli annunci appropriati a tali categorie basandosi sul migliore valore di lift atteso. Partiamo analizzando la classificazione degli utenti. La metodologia in analisi utilizza il clustering per dividere gli utenti in sottogruppi.

Approfondimento: il Clustering

Il clustering è una tecnica di organizzazione dei dati in gruppi, chiamati cluster. La divisione dei gruppi segue i seguenti criteri:

• Massima similarità fra clienti di uno stesso gruppo; • Massima diversità fra clienti di gruppi diversi.

Il clustering è una tecnica non supervisionata, quindi non esistono le giuste risposte. Un clustering può riuscire più o meno bene a soddisfare il criterio di similarità-diversità. La predizione sui casi ignoti è che ognuno si comporterà come quelli del cluster a cui è più vicino.

Lo scopo del clustering è fare emergere regolarità nei dati, aiutarci a capire che esistono dei gruppi non casuali, che mostrano certe regolarità, che condividono certe caratteristiche, che spontaneamente si presentano come entità compatte, con un loro profilo.

Grazie al clustering il modello suddivide gli utenti in gruppi in base ai loro comportamenti, così che sia possibile sapere quali sono gli annunci più appropriati per loro. Quindi viene estratto un modello di comportamento da ogni cluster esistente. Esistono varie tipologie di clustering e ognuna di esse restituisce risultati differenti. In questo modello si utilizza l’algoritmo delle k-medie perché può essere utilizzato in presenza di grandi moli di dati.

Approfondimento: Clustering con algoritmo delle k-medie.

Questa tecnica è semplice ma efficace, il suo funzionamento è il seguente: • Scegliere un valore di k, il numero di cluster da generare;

• Scegliere in modo casuale k osservazioni (p.e. clienti) nel dataset. Questi saranno i centri dei cluster;

(26)

58

• Collocare ogni altra osservazione nel cluster con il centro più vicino a essa;

• Utilizzare le osservazioni in ogni cluster per calcolarne il nuovo centro; • Se i cluster non si sono modificati allora terminare, altrimenti ripetere il

ciclo;

Occorre definire un concetto di distanza (vicinanza), per il resto l’algoritmo è semplice. La distanza più comune fra osservazioni numeriche è la distanza euclidea della somma dei quadrati degli scarti.

Vediamo un esempio per chiarire il funzionamento:

La distanza euclidea fra il punto (x1, y1) e il punto (x2, y2) è definita così:

Decidiamo che k = 2: vogliamo due cluster.

Prendiamo due centri a caso: scegliamo le osservazioni 1 e 3. Quindi i centri sono A = (1.0, 1.5) e B = (2.0, 1.5).

L’osservazione 5 ha distanza da A uguale a:

24 . 2 5 1 2 ) 5 . 1 5 . 2 ( ) 0 . 1 0 . 3 ( 2+ 2 = 2+ 2 = = La distanza da B è invece: 41 . 1 2 1 1 ) 5 . 1 5 . 2 ( ) 0 . 2 0 . 3 ( 2+ 2 = 2+ 2 = =

Quindi l’osservazione 5 va nel secondo cluster, quello che ha centro B.

L’osservazione 4 ha distanza 2.24 da A e 2.00 da B, quindi va nel secondo cluster.

L’osservazione 6 ha distanza 6.02 da A e 5.41 da B, quindi va nel secondo cluster.

L’osservazione 2 ha distanza 3.00 da A e 3.16 da B, quindi va nel primo cluster. I due cluster dopo il primo passo risultano quindi essere

2 2 1 2 2 1 ) ( ) (xx + yy

(27)

59

{1, 2} e {3, 4, 5, 6}.

Il nuovo centro del primo cluster è il nuovo punto A di coordinate (1.0, 3.0), calcolate come medie delle coordinate dei due punti nel primo cluster: nuova x di A = (1.0 + 1.0) / 2 = 1.0 e

nuova y di A = (1.5 + 4.5) / 2 = 3.0

Il nuovo centro B del secondo cluster ha coordinate (3.0, 3.375), calcolate come nuova x di B = (2.0 + 2.0 + 3.0 + 5.0) / 4 = 3.0

nuova y di B = (1.5 + 3.5 + 2.5 + 6.0) / 4 = 3.375 I centri sono cambiati. Quindi ripetiamo il ciclo.

Nota: i nuovi centri non sono più osservazioni, ma punti inesistenti nel dataset. Troviamo che l’osservazione 3 è più vicina al nuovo A (distanza 1.80) che al nuovo B (distanza 2.125) quindi si sposta dal secondo al primo cluster.

Anche le osservazioni 1 e 2 sono più vicine ad A che a B, quindi restano nel primo cluster.

Invece le osservazioni 4, 5 e 6 sono più vicine a B e restano nel secondo cluster.

Dopo il secondo ciclo dell’algoritmo i due cluster sono {1, 2, 3} e {4, 5, 6} E si continua finché i cluster si stabilizzano.

Il risultato dipende anche dalla scelta iniziale casuale dei centri.

Per questo motivo si esegue l’algoritmo varie volte con diverse scelte iniziali e si cerca un risultato buono, anche se non proprio ottimo (non si può provare tutte le combinazioni perché possono essere numerosissime).

Ma come si può giudicare la bontà di un clustering?

In vari modi. Il più semplice è la minimizzazione dell’errore quadratico.

L’idea è che un cluster è buono se ha piccola varianza nei cluster e grande varianza fra i cluster.

La varianza entro un cluster è la somma dei quadrati delle distanze dei punti dal centro del cluster.

La varianza fra cluster è la varianza dei centri dei cluster rispetto al centro dei centri.

(28)

60

Nello sviluppo del modello, prima di procedere con il clustering si vanno a scegliere i migliori 500 siti web, andando a prendere quelli più popolari, cioè quelli con una più alta frequenza di visite.

Fatto ciò sono stati estratti gli utenti che avevano visitato almeno uno dei 500 siti. L’intersezione di questi valori da origine alle basi della matrice in figura:

Figura 16. Matrice di input per il clustering. 

I valori nella matrice possono essere di tre tipi: binari, di frequenza e di frequenza relativa. Con valori binari, un uno corrisponde ad un determinato utente che ha visualizzato un annuncio su un dato sito web, mentre uno zero corrisponde ad un non evento. Mentre nel caso dei valori espressi in frequenza ogni cella riporterà il numero di impressioni che l’utente specifico ha totalizzato nel sito corrispondente alla colonna. Con la frequenza relativa il valore nelle celle è calcolato come la percentuale di visualizzazioni dell’utente ha totalizzato nel sito web specifico fratto il totale delle impressioni che lo stesso utente ha collezionato nei 500 siti considerati. Per effettuare il clustering sono stati preferiti valori binari perché creano gruppi migliori.

A questo punto viene scelto il numero dei cluster, k1, che rappresentano gruppi di

utenti internet con comportamenti nelle visite simili. Questo approccio al clustering minimizza la somma degli errori quadratici tra la singola osservazione e il centro. La matrice diventa la seguente:

(29)

61 Figura 17. User Clustering. 

Fatto ciò si passa alla classificazione dei siti web. Il procedimento è simile al precedente, si procede con un clustering con un numero di cluster pari a k2.

Questo clustering divide i siti web basandosi sulla similarità dei cluster utenti, assegnando un particolare sottogruppo di utenti ad un determinato sottogruppo di siti web. La matrice si trasforma ancora e diventa la seguente:

Figura 18. Website clustering 

Grazie a ciò quando un utente è assegnato ad un cluster, viene indirizzato in uno dei siti web del cluster siti web corrispondente. Questo categorizza meglio gli utenti ed i siti, riducendo la pubblicità non rilevante.

(30)

62

Il terzo passaggio consiste nell’integrare i cluster relativi agli utenti ed ai siti

web con le campagne pubblicitarie. In questo modo si determinano quali

campagne vanno mostrate al soggetto in base ai cluster in cui si trova.

Con questa nuova dimensione viene aggiunta anche la nozione di risposta dell’utente basata sui dati relativi alle azioni o ai click. In breve, ad un utente dovrebbe essere mostrato un particolare annuncio su un determinato sito che genera una miglior risposta.

Le tre dimensioni formano un cubo, la loro integrazione può migliorare il posizionamento degli annunci e la risposta degli utenti. Il modello prende il nome di Cube Model:

Figura 19. Cube Model. 

Il modello predittivo visto fino a questo momento è alla base dell’algoritmo di ottimizzazione delle campagne pubblicitarie. L’algoritmo funziona dinamicamente utilizzando come input una pubblicità e i comportamenti passati nelle visite nei siti web. L’output è il posizionamento di quella pubblicità.

Quando un nuovo utente entra nel network di Advertising.com si crea un ciclo con i seguenti passaggi:

• Quando un soggetto visualizza per la prima volta un sito web diventa un nuovo utente;

• L’utente viene inserito nel website cluster relativo al sito che ha visitato; • L’utente viene poi inserito in un user cluster corrispondente alla

(31)

63 website cluster. Per questa attribuzione si può utilizzare la massima probabilità o una strategia casuale;

• Una volta determinati i due cluster viene attribuita all’utente la campagna pubblicitaria. In questa assegnazione si possono utilizzare 4 metodologie: il tasso massimo di lift percepito, massimo ricavo atteso, massimo tasso di click atteso o una strategia casuale;

• Quando l’utente visita nuovi siti viene rivista la scelta dei cluster, ripartendo con il loop.

Figura 20. Funzionamento del ciclo di assegnazione delle campagne pubblicitarie. 

Lo stesso studio effettuato su Advertising.com ha evidenziato un’altra categoria di dati da tenere in considerazione, quelli relativi ai session behavior. Fanno parte dei session behavior il tempo che un utente passa su internet, la velocità con cui un utente lascia il sito che sta visitando e quanto spesso un utente si collega ad internet.

Una session (session) è il periodo di tempo in cui un utente sta davanti al computer ed effettua attività in internet. L’analisi delle sessioni viene effettuata perché si assume che soggetti con diversi session behavior rispondono in modi differenti alle campagne pubblicitarie.

(32)

64

Ci sono diversi passaggi nell’analisi del session behavior, il primo è la definizione del cutoff time. Il cutoff time è il periodo di tempo che intercorre tra le impressioni, assumiamo che sia il tempo compreso tra il momento in cui l’utente smette di navigare in internet e quello in cui inizia una nuova sessione. Nell’analisi svolta in questo modello è stato utilizzato un cutoff time di trentatre minuti.

Dato il cutoff time, le sessioni sono calcolate grazie ai dati sulle impressioni e altri attributi per ogni utente. Non è chiaro quale siano i session behavior più utilizzati, quindi vengono presi in considerazione più attributi possibili, per poi utilizzare solo i più significativi per segmentare gli utenti. Alcuni degli attributi delle sessioni calcolati dai dati sono i seguenti:

• Numero di sessioni in un giorno;

• Ora di inizio della prima sessione giornaliera; • Ora di fine dell’ultima sessione giornaliera; • Durata media di ogni sessione;

• Numero medio di impressioni;

• Numero medio di pubblicità uniche visualizzate; • Numero medio di siti unici visitati;

• Tempo medio tra sessioni;

• Media di impressioni per minuto durante la sessione.

Analizzando tutti questi dati, o solo alcuni di questi, si riesce ad avere un quadro chiaro del comportamento degli utenti nella navigazione in internet completamente indipendente dai siti che essi visitano.

Una volta in possesso dei dati sulle sessioni di ogni utente si creano sottogruppi di utenti basati sui session behavior. Il dataset è diviso in gruppi attraverso una serie di divisioni in 2 parti basate sugli attributi. Per esempio la prima divisione è effettuata tra i soggetti che hanno una sessione al giorno e quelli che invece ne

(33)

65 hanno di più. Ognuno di questi gruppi viene ancora diviso sulla base di altri criteri. Infine ogni utente viene inserito nel gruppo più appropriato basandosi sulla appropriatezza del suo range di dati al gruppo.

Nell’analisi del modello sono stati creati i seguenti gruppi:

Tabella 9. Gruppi nell'analisi del session behavior. 

È stato provato, grazie ad un’analisi giornaliera, che gli stessi cluster garantiscono una risposta simile durante la settimana.

Si è giunti a due conclusioni: gli attributi non cambiano da un giorno all’altro e che fornire pubblicità ai gruppi con maggiore Click-Through rate aumenta il numero totale di click.

In definitiva se implementata efficacemente l’analisi del session behavioral può aiutare ad aumentare il tasso di risposta ed incrementare l’efficienza dell’internet advertising.

(34)

66

2.4. Il monitoraggio e il miglioramento delle campagne: gli

Analytics

Gli web analytics possono essere definiti come gli strumenti atti alla misurazione, la collezione, l'analisi e il reporting di dati internet allo scopo di capire e ottimizzare l'utilizzo del Web.

Le funzioni di questi software in realtà vanno molto al di la di ciò che è contenuto in questa definizione. Infatti sono fondamentali per riuscire a competere efficacemente nel vasto mondo dell’internet advertising e dell’e-commerce.

I web analytics forniscono moltissimi dati e di diverse tipologie al gestore di un sito internet. Per portare solo qualche esempio possiamo citare il numero di visitatori unici, il tempo delle sessioni, gli annunci pubblicitari cliccati, malfunzionamenti nel sito (p.e. link non funzionanti o immagini mancanti) e il punto in cui un utente abbandona il sito internet.

Le informazioni fornite dagli web analytics servono a migliorare le campagne pubblicitarie, i guadagni di siti e-commerce e di siti publisher.

Gli web analytics sono una peculiarità dell’advertising online rispetto alla pubblicità sugli altri media. Nessun altro canale pubblicitario (si pensi ad esempio alla TV o alla stampa) ha uno strumento capace di misurare le conversioni delle campagne pubblicitarie così preciso e veloce. La web analytics fornisce esattamente dati su quanti utenti sono entrati nel sito, quanti si sono iscritti ad una newsletter, quanti hanno acquistato quel prodotto e molto altro. Non sfruttare informazioni di questo genere sarebbe un errore, in quanto da ognuna di esse, se interpretate nel modo esatto, si possono raccogliere preziose indicazioni.

Il web analytics non deve essere utilizzato solamente come strumento di mera analisi, ma deve essere il punto di partenza dell’ottimizzazione e dell’aumento delle entrate di un sito o di una campagna.

(35)

67 I software di web analytics disponibili sul mercato sono molti, ma quello più diffuso è quello distribuito gratuitamente da Google. Il suo nome è Google Analytics. Nelle prossime pagine parleremo di questo strumento e delle sue principali funzioni.

2.4.1. Google Analytics

Google Analytics è leader nella sua categoria grazie alla facilità di utilizzo, il dettaglio delle informazioni e soprattutto la sua gratuità. Ciò lo rende utilizzabile dalle grandi aziende ma anche da gestori di piccoli siti o blog con poco traffico.

(36)

68

Google spiega l’utilità del suo analytics con questa motivazione:

“Capire in che modo gli utenti interagiscono con il tuo sito web e sfruttare queste conoscenze per apportare i necessari correttivi è un elemento fondamentale nella creazione di una proficua attività online”.

Google Analytics fornisce ai suoi utenti cinque tipi di macrorapporti. Grazie ai quali si può capire cosa attira visitatori al sito internet, come navigano al suo interno, si possono gestire le campagne pubblicitarie e i portali di e-commerce. I rapporti sono i seguenti:

• Visitatori;

• Sorgenti di traffico; • Contenuto;

• Obiettivi; • E-commerce.

Partiamo analizzando le prime due sezioni: visitatori e sorgenti di traffico. Nei rapporti della sezione Visitatori si trovano dati relativi alle visite che sono state fatte al sito web, quindi si trovano dati sul numero di utenti nel periodo di tempo specificato, numero di utenti totali, numero di utenti unici. Inoltre gli utenti possono essere divisi in categorie. Per effettuare tale divisione si può utilizzare come base la loro locazione geografica, la frequenza delle visite, utenti che sono tornati a visitare il sito dopo poco tempo rispetto alla precedente visita, lingua parlata, browser utilizzato. È, inoltre, possibile conoscere la durata della navigazione nel sito da parte degli utenti e la profondità della visita, cioè quante pagine sono state visualizzate prima di terminare la sessione. In questa parte dell’analisi è importante l’area relativa al confronto tra i risultati provenienti da una categoria rispetto ad un’altra. Per esempio si possono confrontare i risultati (sull’utilizzo del sito, sul comportamento di conversione, ecc.) provenienti da diverse aree geografiche, che parlano lingue differenti o che non usano lo stesso browser.

(37)

69 Nella sezione Sorgenti di traffico si trovano dati relativi alla fonte da cui arrivano i visitatori del sito. Le fonti possono essere referral15, motori di ricerca, parole chiave, annunci, campagne di marketing e traffico diretto16.

Figura  22.  Esempio    di  rapporto  visitatori  per  locazione  geografica  con  dati  relativi  alle  sorgenti  di  traffico. 

Questa sezione è incentrata sul confronto tra e attraverso le fonti di traffico. Ad esempio si possono confrontare i dati relativi al traffico proveniente da un determinato sito rispetto ad un altro, o di un determinato motore di ricerca rispetto ad un suo concorrente. Si possono confrontare i dati relativi agli utenti che provengono da fonti a pagamento (p.e. annunci adWords) con quelli degli utenti provenienti da sorgenti gratuite.

In questa sezione sono compresi dati molto rilevanti per la gestione delle campagne pubblicitarie. Sono presenti informazioni relative all’influenza del posizionamento sul rendimento degli annunci e rapporti di marketing. Quali ad

15 Un referral si verifica quando un utente fa clic su un collegamento ipertestuale che lo indirizza a una nuova pagina o file di qualsiasi sito web: il sito di origine è il referrer.

16 Visite degli utenti che hanno digitato la URL direttamente nella barra degli indirizzi del proprio browser.

(38)

70

esempio: click, transazioni, costo, entrate, percentuale di click, tasso di conversione, costo per click, entrate per click. Un dato molto interessante per le campagne di search engine advertising è quello contenuto nel rapporto Considerazioni sulle parole chiave. Tale rapporto elenca le parole chiave usate dagli utenti nei motori di ricerca per raggiungere il sito web che però non sono utilizzate nelle campagne CPC adWords.

I rapporti Contenuto consentono di conoscere l’efficacia con cui un sito attira l’interesse dei visitatori.

Più in particolare grazie ai rapporti di questa sezione si possono conoscere i dettagli relativi a come i visitatori navigano all’interno del proprio sito internet, riuscendo così a capire se i visitatori trovano facilmente ciò che cercano o se incontrano difficoltà. Inoltre, per ogni pagina si può conoscere il tempo medio in cui viene visualizzata, la frequenza con cui gli utenti hanno abbandonato il sito dopo aver visualizzato quella pagina e l’indice € che misura il valore delle conversioni (in termini di entrate e-commerce o valore degli obiettivi) avvenute dopo la visualizzazione di quella pagina. Sono disponibili anche report relativi alle pagine di destinazione, cioè tutte le pagine tramite cui gli utenti sono entrati nel sito e le pagine di uscita, che elenca il numero di uscite da una pagina e il numero di uscite dal sito da una determinata pagina. Il rapporto ottimizzazione pagine di destinazione consente di creare pagine appositamente create per ospitare coloro che hanno cliccato su un referral o su un annuncio. È importante in tali pagine inserire contenuti e informazioni che motivino l’utente ad entrare nel sito.

Strettamente collegati ai contenuti sono gli obiettivi, nei rapporti relativi a questa categoria si trovano dati relativi al modo in cui i visitatori conseguono o meno gli obiettivi del sito web. Tramite i rapporti di questa sezione si riesce a capire se gli utenti seguono il percorso prestabilito (p.e. i passaggi per l’acquisto su un sito e-commerce) per raggiungere l’obiettivo oppure abbandonano prima per la troppa complessità di alcune pagine. In questo caso il proprietario del sito deve lavorare al miglioramento di queste pagine. È anche possibile visualizzare il percorso

(39)

71 inverso, cioè quello effettivamente seguito dai visitatori per capire in che modo sono arrivati alla pagina relativa al conseguimento dell’obiettivo.

Altre informazioni visualizzabili in questa area sono il totale delle conversioni per un determinato obiettivo, il tasso di conversione, il valore obiettivo che permette di visualizzare il valore delle conversioni registrate dal sito nel tempo. L’ultima tipologia di rapporti, che tratteremo più in breve delle altre, è quella relativa all’e-commerce. In questa sezione troviamo informazioni relative ad entrate, tasso di conversione, transazioni (numero ordini di acquisto) e valore medio degli ordini (entrate medie derivanti da ciascun acquisto).

Sono visualizzabili rapporti più analitici relativi al rendimento dei singoli prodotti o linee di prodotto. Sono presenti anche dati relativi ai tempi di acquisto, in questo modo si può comprendere l’andamento del ciclo di vendita di un prodotto e quanto tempo gli utenti utilizzano per effettuare un acquisto.

Per tutti questi tipi di report sono disponibili strumenti di ordinamento e filtro dati. Grazie ad essi chi utilizza Google Analytics è in grado di visualizzare solo le informazioni che in quel momento gli interessano. Un importante strumento è quello che permette di vedere dati relativi ad un determinato intervallo di tempo, impostando la data di inizio e quella di fine. Oppure basta cliccare sul calendario presente nelle pagine dello strumento per visualizzare dati relativi ad un giorno, una settimana, un mese o un determinato anno. È disponibile anche una funzione che permette di confrontare informazioni relative a due intervalli di date differenti.

In questo riassunto delle funzioni di Google Analytics sono state viste le principali caratteristiche di questo strumento, che può essere utilizzato da chiunque, dal blogger che vuole conoscere il traffico sul suo sito, al portale di e-commerce con grandi moli di vendite.

(40)

Figura

Figura 12. Esempio di Search Engine Advertising su Google. 
Figura 13. Keyword advertising su ilsole24ore.com. 
Figura 15. Specific Media behavioral targeting. 
Figura 16. Matrice di input per il clustering. 
+6

Riferimenti

Documenti correlati

In conclusion we can said that the Chinese luxury market is not at all easy to conquer because it is characterized by different factors; by a socio-economic

quelle che ricevono una maggior quantità di lamentele può essere spiegato anche in relazione al fatto che gestiscono una quantità di clientela più ampia e con

Per quanto riguarda le differenze di genere, la presenza femminile nei ruoli apicali è, come già visto, penalizzata rispetto a quella maschile, ma nelle imprese con più di cento

Il corso Search Engine Optimization (S.E.O.) - Search Engine Optimization - “ottimizzazione per i motori di ricerca“, intende fornire una panoramica delle strategie e pratiche volte

entro il 31 dicembre 2020 il 50% dell’importo oggetto di sospensione dovrà essere interamente corrisposto in quanto ciò costituisce condizione necessaria per beneficiare

questi viene corretto della parte rilassata durante la fase di carico, secondo la correzione già operata per il modulo elastico al paragrafo 3.3.4 e come indicato

 Posizionamento, detto anche Ranking: quando l’utente effettua una ricerca, gli algoritmi dei motori di ricerca, valutano quali contenuti rispondono meglio alla domanda effettuata..

Double claiming of emissions reductions or removals can occur if a country reduces its claimed emissions on the basis of a credit it acquired from a project that has reduced