• Non ci sono risultati.

Hashtags e Tweet positivi:

N/A
N/A
Protected

Academic year: 2021

Condividi "Hashtags e Tweet positivi:"

Copied!
170
0
0

Testo completo

(1)

UNIVERSITA’ DEGLI STUDI DI PISA Dipartimento di Economia e Management

Corso di Laurea Magistrale in Marketing e Ricerche di Mercato

TESI DI LAUREA

Analisi del sentiment in Twitter: ricerca di marketing per il lancio dell’applicazione Sentimap di REXOLCOLM®

RELATORE

Prof. Alessandro Gandolfo

Candidata M. Giulia Biagiotti

ANNO ACCADEMICO 2013/2014

(2)

1 INDICE

CAPITOLO 1

1.Il contesto in cui nasce e si sviluppa l’analisi del sentiment……….…7

2.L’analisi del sentiment………18

2.1.Il sentiment………...………18

2.2.Analizzare il sentiment………...………19

3.Il sistema di analisi del sentiment……….…22

4.L’analisi del sentiment come metodologia di ricerca……….…….23

4.1.La fase preparatoria all’analisi………...23

4.2.Il processo di analisi e raccolta dei dati ……….24

4.2.1.La raccolta dei dati………...24

4.2.2.La preparazione del testo……….26

4.2.3.L’individuazione del sentiment………...26

4.2.4.La classificazione del sentiment………...29

4.2.5.La presentazione degli output di ricerca………30

5.Gli ambiti applicativi della analisi del sentiment………33

6.Limitazioni dell’analisi del sentiment………..……….39

6.1.Limitazioni etiche………39

6.2.Limitazioni legate al software………39

6.3.Limitazioni legate alla complessità linguistica……….………40

6.4.Limitazioni legate alla lingua analizzata………..……….……41

6.5.Limitazioni del metodo di ricerca………..…41

7.I vantaggi dell’analisi del sentiment……….…42

8.Le ricerche sul clima di fiducia di consumatori e imprese……….…43

8.1.L’Indagine sul clima di fiducia dei Consumatori……….…44

(3)

2

8.2.Le indagini sul clima di fiducia delle imprese………46

8.3.Iesi: Istat Economic Sentiment Indicator………48

CAPITOLO 2 1.L’azienda: Rexolcom s.r.l. ……….………...…50

2.Il processo organizzativo: Lean Start-up e Business Model Canvas….………51

2.1La Lean start-up Strategy………..…….51

2.2Il Business Model Canvas………54

3.I Principali prodotti/servizi attuali……….………..56

4.Focus: La scelta di Twitter……….…...58

4.1I numeri di Twitter………...…58

4.2Gli utenti: la distinzione tra privati e aziende………60

4.3Le potenzialità di un Tweet……….64

4.4I dati che si celano dietro un Tweet………65

5. Il nuovo prodotto/servizio: Sentimap.……….67

CAPITOLO 3 1.L’indagine………..………73

2.L’indagine Sentimap 1st Loop……….74

2.1Gli obiettivi di indagine……….…….74

2.2La metodologia……….74

2.2.1La definizione del target e la costruzione della lista……….….74

2.2.2La costruzione della traccia dell’intervista………77

2.2.3Il metodo di contatto………78

2.2.4Il metodo di raccolta dei dati………..78

(4)

3

2.2.5Il metodo di analisi dei dati………..79

2.3I risultati della ricerca………...79

2.3.1I tassi di risposta……….………...…....79

2.3.2Il profilo dei rispondenti……….………..80

2.3.3Le opinioni su Sentimap………..……….…80

2.3.3.1Home page di Sentimap……….81

2.3.3.1.1Intuitività di: slogan, titolo, grafica………..81

2.3.3.1.2 Log-in con Twitter ed Eventbrite……….83

2.3.3.2Choose your topics………84

2.3.3.3La sentiment analysis………85

2.3.3.3.1Le aspettative di azione nella schermata……….………85

2.3.3.3.2Focus: Le interpretazioni del grafico a torta e dei colori rosso e blu………..85

2.3.3.4 La selezione dell’area di analisi………87

2.3.3.5La Condivisione………..88

2.3.3.6Gli Hashtags più negativi e Tweet collegati……….89

2.3.3.6.1Avere la lista degli hashtags………89

2.3.3.6.2Leggere i Tweet………...89

2.3.3.7Rispondere ai consumatori sui Social………..89

2.3.3.7.1Giudizi sulla funzione di risposta nell’app………90

2.3.3.8Funzione di risposta e la Versione Premium………90

2.3.3.8.1Le idee per la futura Versione Premium………91

2.3.3.8.2Le funzioni attese……….91

2.3.3.8.3La disponibilità all’acquisto………...93

2.3.3.9I Giudizi Finali: funzioni e Grafica………..94

(5)

4

2.3.3.9.1La Valutazione delle Funzioni………94

2.3.3.9.2Il Look & Feel dell’App……….96

2.3.3.9.3Focus: Il punto di vista del grafico………97

2.4Conclusioni e suggerimenti……….98

3.L’indagine Sentimap 2nd Loop………...………103

3.1Gli obiettivi di indagine……….103

3.2La metodologia………..103

3.2.1La definizione del target e la costruzione della lista………103

3.2.2La costruzione della traccia dell’intervista………..104

3.2.3Il metodo di contatto………..106

3.2.4Il metodo di raccolta dei dati……….…106

3.2.5Il metodo di analisi dei dati………107

3.2.5.1L’analisi dei dati quantitativi………..107

3.2.5.2L’analisi dei dati qualitativi……….108

3.2.6Le differenze rispetto Sentimap 1st Loop……….109

3.3I risultati della ricerca………109

3.3.1Tassi di risposta………...…109

3.3.2Il profilo dei rispondenti……….111

3.3.3Le opinioni sull’app Sentimap………114

3.3.3.1L’Home page di Sentimap………...114

3.3.3.1.1Coerenza tra Home Page e Contenuto………114

3.3.3.1.2I Commenti sull’Home page in generale………117

3.3.3.1.3Focus su titolo, slogan e immagini………...…118

3.3.3.2Le Funzioni di Filtro: Topics, Area, Time……….…126

(6)

5

3.3.3.3I risultati dell'analisi: Sentimap Results………..…..128

3.3.3.3.1Il tasto di condivisione dell’analisi: i commenti….…128 3.3.3.3.2Grafico a torta: i commenti………..………129

3.3.3.3.3Bottone #List: i commenti………131

3.3.3.4Le funzioni attuali………133

3.3.3.4.1Le funzioni più importanti………133

3.3.3.4.2Le funzioni meno importanti………134

3.3.3.5Le funzioni aggiuntive………..…136

3.3.3.5.1Le funzioni suggerite autonomamente dai rispondenti………...136

3.3.3.5.2Le funzioni indicate e l’interesse dei rispondenti……136

3.3.3.6La disponibilità all’acquisto dell’app in versione premium..…141

3.3.3.7I prezzi attesi delle versioni attuale e premium………143

3.3.3.7.1La versione attuale………143

3.3.3.7.2La versione premium………146

3.3.3.8Gli scopi potenziali di utilizzo………..149

3.3.3.8.1Collaborare in team………..149

3.3.3.8.2Gestire/monitorare eventi………150

3.3.3.8.3Gestire /monitorare campagne promozionali………153

3.3.3.9Le considerazioni complessive su Sentimap………...155

3.3.3.9.1Fluidità e intuitività dell’applicazione. ………..155

3.3.3.9.2Sentimap: un voto da 1 a 10 ………156

3.3.3.10Approfondimento: considerazioni “fuori traccia” emerse dalle interviste……….……….159

3.3.3.10.1Gli attributi importanti per i rispondenti…….……159

(7)

6 3.3.3.10.2Le funzioni aggiuntive proposte dagli intervistati…159

3.3.3.10.3Le esigenze dell’utente potenziale………..162

3.3.3.10.4I limiti dell’applicazione…………...………….162

3.3.3.10.4.1La geo-localizzazione………...163

3.4Conclusioni e suggerimenti………165

4.Limiti della ricerca………...167

ALLEGATI……….170

(8)

7 CAPITOLO 1

1. Il contesto in cui nasce e si sviluppa l’analisi del sentiment

L’analisi del sentiment è una metodologia di ricerca che consente, con l’aiuto di tecniche di data mining, di individuare l’opinione espressa dagli individui su specifici elementi di interesse (Feldman, 2013).

Per meglio comprendere le motivazioni che spingono ricercatori ed imprese ad utilizzare in misura crescente questa metodologia di ricerca, si riporta un breve excursus sul quadro attuale di riferimento in cui questa analisi si inserisce e si sviluppa.

Web 2.0 e User-generated content. Le possibilità espressive fornite da internet e dal Web2.0 hanno permesso ad una quantità sempre maggiore di utenti di manifestare on-line le proprie opinioni; rivelate in rete in maniera sempre più spontanea, le opinioni coprono una larghissima varietà di temi (Gunter et al., 2014). Grazie alle potenzialità del web, i

“luoghi” di espressione degli internauti sono divenuti i più differenziati: si parla nei forum on line, nei blog, per non parlare di social network come Twitter e Facebook. Molte delle pagine web sono, infatti, organizzate intorno ad un tema specifico e ciò si rivela ancora più interessante per gli specialisti di marketing e brand reputation che desiderano comprendere fino in fondo ciò che si cela al di là delle dinamiche di mercato, nella mente dei consumatori, per ciò che riguarda i propri brand, prodotti e servizi. Gli “User-generated content”, ossia i contenuti generati dagli utenti, permettono di raccogliere insight interessanti per la messa in pratica di strategie aziendali. Dallo “slang” da utilizzare nelle campagne pubblicitarie alle strategie reputazionali, innumerevoli sono le applicazioni dei contenuti e opinioni espressi dagli utenti nella rete, che possono rivelarsi di estrema utilità non soltanto per le imprese ma anche per i “policy makers” e le agenzie di marketing e comunicazione.

Opinioni on-line e E-Wom. L’importanza crescente delle opinioni on-line può derivare da due ordini di motivazioni.

Il primo è legato al lato statico del web, traccia residua del Web 1.0: internet si rivela un contenitore di volume infinitamente grande e variegato grazie alla presenza di una notevole mole di utenti. Secondo i dati Istat, in Italia aumenta, nel 2014 rispetto all'anno precedente,

(9)

8 la quota di famiglie che dispongono di un accesso ad Internet da casa (più precisamente dal 60,7% al 64%, Figure 1: Distribuzione delle famiglie per disponibilità di beni e servizi tecnologici, senza considerare la penetrazione dei telefoni cellulari, gli smartphones in particolare: l’accesso a internet per il tramite di cellulari abilitati sale dal 43,9% nel 2013 al 54% nel 2014.

Figure 1: Distribuzione delle famiglie per disponibilità di beni e servizi tecnologici. Anni 2013-2014, valori per 100 famiglie

Fonte: Dati Istat (2015)

L’aumento delle possibilità di accesso ad internet comporta una naturale estensione della possibilità degli utenti di visualizzare i contenuti disponibili on-line, e al crescere della confidenza con gli strumenti, aumentano le opportunità di esprimersi nella rete; le opinioni

“postate” on-line saranno a loro volta visualizzate e tenute in considerazione da altri utenti.

Ed è in tale contesto che si inserisce il secondo ordine di motivazioni, legato al lato dinamico della rete, prerogativa del Web 2.0: internet e l’interattività che lo caratterizza, premettono una diffusione incredibile di informazioni che non soltanto passano da utente a utente ma che sono inoltre capaci di influenzare gli utenti stessi, con livelli crescenti di

(10)

9 coinvolgimento: si parla del cosiddetto E-Wom (“Electronic Word of Mouth”), ossia il passaparola on-line, che crea la base dati da analizzare quando si procede con un’analisi del sentiment.

Cercare informazioni on-line. Gli utenti non soltanto si trovano a visualizzare informazioni presenti in rete ma, percependone l’utilità, vi è una crescente porzione di popolazione che effettua ricerche on-line su ogni tipo d tematica. La tendenza alla ricerca di informazioni on-line è confermata dai risultati delle indagini Istat relative all’anno appena trascorso. In dettaglio, secondo i dati Istat, gli utilizzatori di Internet1 sono stati in totale 31.841.000 (Errore. L'origine riferimento non è stata trovata.), ossia circa la metà ella popolazione italiana al 1/1/2014, composta da 60,783 milioni di individui (dati Istat, 2014). Coloro che hanno avuto accesso a internet risultano coprire il 49% delle femmine e il 54,1% dei maschi; dato ancor più interessante risulta il fatto che il 51,7 % di chi ha avuto accesso a internet, abbia ricercato informazioni relative a merci e servizi; in particolare sono i soggetti appartenenti alla fasce di età dai 20 ai 74 anni,(Errore. L'origine iferimento non è stata trovata.) ossia la fascia avente potere di acquisto indipendente nelle scelte di consumo, a dimostrare questa tendenza; da notare, inoltre, il picco del 60% relativo agli individui appartenenti alla fascia 35-44 anni.

Table 1: Persone di 6 anni e più che hanno usato Internet negli ultimi 3 mesi per altre attività svolte per classe di età in valore assoluto- Anno 2014 (dati in migliaia)

Hanno utilizzato internet negli ultimi 3 mesi

Ricerca d'informazioni Cercare

informazioni su merci o servizi

Cercare informazioni su attività di istruzione o corsi di

Cercare informazioni sanitarie (es.

infortuni, malattie,

1 Dati Istat, riferiti ai tre mesi precedenti la ricerca, svoltasi a marzo 2014.

(11)

10 qualunque

tipo

alimentazione, miglioramento della salute, ecc.)

CLASSI DI ETÀ MASCHI E FEMMINE

6-10 1.226 57 124 14

11-14 1.765 281 336 117

15-17 1.615 552 534 320 18-19 1.012 496 489 338 20-24 2.635 1.411 1.279 982 25-34 5.399 3.140 2.181 2.538 35-44 7.260 4.361 2.575 3.582 45-54 5.808 3.451 2.049 2.914 55-59 2.068 1.125 621 1.011 60-64 1.483 825 380 798 65-74 1.312 671 259 631

75 e più 259 91 45 119

Totale 31.841 16.461 10.872 13.364

Fonte: nostro riadattamento da dati Istat (2014)

Table 2: Persone di 6 anni e più che hanno usato Internet negli ultimi 3 mesi per altre attività svolte per classe di età in valore percentuale dei valori assoluti di accesso a internet- Anno 2014

Ricerca d'informazioni

(12)

11 Cercare

informazioni su merci o servizi

Cercare informazioni su attività di istruzione o corsi di qualunque tipo

Cercare informazioni sanitarie (es.

infortuni, malattie, alimentazione, miglioramento della salute, ecc.)

CLASSI DI ETÀ MASCHI E

FEMMINE

6-10 4,6 10,1 1,1

11-14 15,9 19,0 6,7

15-17 34,2 33,0 19,8 18-19 49,0 48,3 33,4 20-24 53,6 48,5 37,3 25-34 58,2 40,4 47,0 35-44 60,1 35,5 49,3 45-54 59,4 35,3 50,2 55-59 54,4 30,0 48,9 60-64 55,7 25,6 53,8 65-74 51,1 19,8 48,1

75 e più 35,0 17,5 46,1

Totale 51,7 % 34,1 % 42,0 %

Fonte: nostro riadattamento da dati Istat (2014)

(13)

12 Anche i social network svolgono un ruolo importante nella ricerca e visualizzazione delle informazioni; vi partecipa il 51,7% degli utilizzatori d’internet e vengono utilizzati non soltanto per mantenere rapporti di tipo amicale, ma anche come strumento di partecipazione alla vita sociale o politica del Paese: circa un quinto degli utilizzatori di Internet (20,5%)2 ha espresso in rete opinioni su temi sociali o politici (dati Istat, 2014), che possono essere individuati da software di analisi del sentiment per evincere l’opinione complessiva degli utenti su un determinato argomento.

Recensioni on-line. Una tipologia di opinione sempre più spesso tenuta in considerazione dai consumatori è costituita dalle recensioni on-line di prodotti e servizi. Dal punto di vista dell’analisi del sentiment, le recensioni costituiscono un’ottima base di dati, facilmente categorizzabili per entità (si pensi ad esempio, ai ratings di un prodotto o servizio, o per i suoi attributi), e di indubbia importanza se si considera l’impatto che possono avere le recensioni negative sulle decisioni d’acquisto di futuri acquirenti.

L’attività di recensione online è nata recentemente per adattamento di un sistema, quello della recensione (e dei feedback in generale), ai nuovi mezzi di comunicazione resi disponibili dalle nuove tecnologie internet-based.

Il sistema è andato sviluppandosi perché un potenziale acquirente, nella fase pre-acquisto, svolge normalmente3 un’attività di ricerca di informazioni sul bene o servizio che desidera acquistare, per valutare le caratteristiche che per lui sono importanti; una volta si ottenevano informazioni grazie al passaparola di parenti, amici, conoscenti oppure da altre fonti altrettanto “credibili” quali riviste (specializzate) e programmi televisivi. Le potenzialità aperte dall’avvento d’internet hanno ampliato il numero di fonti d’informazione per i consumatori: ora essi hanno accesso ad un passaparola che, sebbene non derivi più da soggetti “spazialmente vicini”, sono caratterizzate da spontaneità e da una presenza in quantità notevolmente maggiore, ed è proprio ciò che fa loro ottenere una certa credibilità.

La fiducia dei consumatori. Le capacità di influenza dei contenuti postati on-line dipende

2 Dati Istat (2014), tab. 3.1.

3 Con ciò si intende che in tale trattazione saranno esclusi i cosiddetti “ acquisti di impulso”, noti in letteratura di marketing per la mancanza della fase di ricerca delle informazioni.

(14)

13 direttamente dalla fiducia che i consumatori e gli utenti in generale ripongono in ciò che trovano pubblicato on-line.

Ci forniscono utili elementi di riflessione a questo proposito le recenti indagini svolte sull’argomento da istituti di ricerca quali: Nielsen, Havas Worldwide e DigitasLBi.

L'ultima indagine Nielsen (2013), 'Global Trust in Advertising', realizzata a livello europeo nel maggio 2013, ha analizzato la fiducia riposta dai consumatori in diverse forme pubblicitarie ed ha riportato che “ben il 78% degli italiani (Europa le cifre salgono all'80%, nel mondo all'84%) dichiara di fidarsi, nel momento dell'acquisto, dei consigli dei conoscenti; tuttavia questo canale risulta in diminuzione del 10% in Italia (e del 9% in Europa). Calo che si spiega in base all'aumento dell'utilizzo di opinione e recensioni sui social media, passati (rispetto al 2011) dal 62% al 64%.”

I dati di cui sopra sono riportati in Figure 2: "Fino a che punto ti fidi delle seguenti forme di pubblicità?", proprio alle prime posizioni nella classifica per grado di fiducia.

(15)

14 Figure 2: "Fino a che punto ti fidi delle seguenti forme di pubblicità?"

Fonte: Nielsen Global (2013)

In particolare colpisce l’effetto sul comportamento (presunto di acquisto) dei consumatori:

i dati riferiscono che ben il 59% del campione sarebbe propenso ad attivarsi a seguito della consultazione di commenti di consumatori postati on-line, in secondo posto dopo le raccomandazioni di conoscenti (73%) come è possibile osservare in Figure 3.

(16)

15 Figure 3: "Fino a che punto intraprenderesti un'azione in base alle seguenti forme di pubblicità?"

Fonte: Nielsen Global (2013)

Anche il gruppo di comunicazione Havas Worldwide (2014) ha svolto due ricerche su questo tema intitolate rispettivamente “Il Digital e il nuovo consumatore” e “Creare brand che contano”.

Queste indagini, che hanno coinvolto più di 10.000 persone in 31 Paesi fra cui l’Italia, focalizzano l’attenzione sui trend di acquisto emergenti a livello globale, e confermano la visione emergente

(17)

16 del nuovo consumatore: un individuo sempre più digitale che, se da una parte, condivide on line la propria esperienza con il brand, dall’altra, si affida alle recensioni degli altri utenti, considerate più̀

affidabili dei pareri degli esperti.

Brand Experience e Brand reputation. Secondo Havas (2014), tra gli italiani vi è una spiccata propensione a condividere online la propria brand experience rispetto ai dati globali (98%, vs 84%

globale), sia che l’esperienza sia positiva sia negativa, anche se i commenti negativi, che dissuadono all’acquisto più di un italiano su tre, sembrano non superare quelli positivi.

La brand reputation influenza anche la disponibilità all’acquisto: secondo l’indagine, il 73% dei Prosumer4 italiani (contro un 76% a livello globale) sarebbe disposto a spendere di più per acquistare un prodotto se deriva da un’azienda con una buona brand reputation; secondo l’indagine, questa tendenza è andata crescendo di importanza negli ultimi anni.

Il contesto in cui si muovono le imprese al giorno d’oggi è in continua evoluzione: cosi come le tecnologie anche il modo dei consumatori di approcciarsi ad esse varia in frangenti di tempo sempre più ristretti. Le possibilità per un’impresa di inserirsi in questo quadro cangiante sono strettamente legate agli strumenti che le permettono di tenersi al corrente di ciò che accade intorno a sé, tanto

“off-line” quanto “on-line”.

In un mondo in cui la reputazione si rivela un elemento di crescente importanza, l’impresa si trova ad affrontare l’esigenza di aver a disposizione strumenti sempre più precisi e tempestivi per intercettare le opinioni dei consumatori e del mercato in generale. Se il passaparola off-line è rintracciabile con le tradizionali metodologie di ricerca (Osservazione, Focus group, Interviste in Profondità, etc.), i contenuti on-line per loro natura sono individuabili attraverso strumenti tecnologicamente avanzati. Si fanno strada, pertanto, dispositivi che permettono alle imprese di lasciarsi alle spalle sistemi di monitoraggio “manuale” (si pensi alle rassegne stampa), lunghi e dispendiosi in termini monetari e di tempo; tra le tecnologie e metodi che permettono di soddisfare

4 I “Prosumer” sono “le persone capaci di anticipare e influenzare trend e consumi a livello mondiale, quelle che rappresentano la frangia della popolazione più tecnologica, accolgono facilmente le innovazioni e amano condividere le proprie esperienze” (Engage.it, 2014).

(18)

17 quest’esigenze vi è lo strumento dell'analisi del sentiment, che approfondiremo nelle prossime pagine.

(19)

18 2. L’analisi del sentiment

Le origini dell’analisi del sentiment come ricerca si inserisce nel quadro di discipline quali psicologia, sociologia e antropologia ed in particolare le teorie sul giudizio e della presa di posizione affettiva che si focalizzano sulla formazione delle cognizioni, delle attitudini e giudizi dell’individuo (Rambocas et al.,2013),. Queste ultime possono appartenere ad un processo di creazione sia consapevole che inconsapevole, essendo direttamente legate alla sfera emotiva dell’individuo, ma è possibile comunque osservarlo grazie non solo alle manifestazioni esplicite del suo pensiero, ma anche quelle implicite, legate alla comunicazione non verbale.

L’importanza delle emozioni è più che nota nella letteratura e nella pratica del marketing: opinioni, percezioni e attitudini nei confronti di prodotti e servizi, il brand aziendale e esperienze in generale si riflettono dalla vita del singolo individuo alla più larga sfera delle sue interazioni sociali e nei suoi comportamenti d’acquisto (Rambocas et al., 2013).

Nel contesto dell’analisi del comportamento del consumatore si inserisce l’analisi del sentiment, ossia dei sentimenti ed emozioni; un’analisi che si rivela perciò una metodologia già utilizzata in marketing ma che oggi può essere estesa ai nuovi ambiti e rinnovata grazie alle potenzialità fornite dalla rete.

Per meglio approfondire questo tipo di analisi, si riporta una breve introduzione sul significato di sentiment per poi passare a chiarire ciò che si intende per analisi del sentiment.

2.1. Il sentiment

Al fine di procedere gradualmente all’approfondimento del tema dell’analisi del sentiment, introduciamo cosa si intende per sentiment.

Nel momento in cui un individuo affronta uno stimolo emotivamente significativo, egli è portato a vivere interiormente un processo, un’emozione, che è descrivibile come “l’impatto” di tale evento sul soggetto, un impatto che consiste anche nella valutazione di tale evento. Il sentimento, o sentiment, è definibile come la “rappresentazione cosciente della valutazione di un evento-stimolo che ha suscitato nell’individuo un’emozione, che lo porteranno alla preparazione di un’azione”

(Enciclopedia Treccani, 2015). Attraverso questa definizione, è facilmente intuibile l’importanza dell’interiorità dell’individuo e delle sue manifestazioni esterne che possono riflettersi in ogni ambito, sia a livello di micro cosmo dell’individuo e quindi a livello comportamentale e micro

(20)

19 sociale, sia a livello di macro cosmo come può accadere a livello politico, economico e macro sociale; ne è un esempio il riflesso della fiducia dei consumatori sui mercati.

L’analisi di sentiment che approfondiremo di seguito mira ad analizzare l’insieme delle espressioni emotive rilevabili nei contenuti che specificatamente sono espressi in rete. In particolare, intenderemo come “sentiment on-line” “le convinzioni ed emozioni umane espresse attraverso internet […] un’attitudine nei confronti di una situazione, di un oggetto o di un evento, spesso manifestate attraverso una varietà di alternative di media on line, tra cui i più popolari, i social network” (Rambocas et al., 2013).

2.2. Analizzare il sentiment

Gli sviluppi recenti della tecnologia e l’interesse per la materia hanno permesso notevoli progressi nell’approfondimento delle tecniche computazionali di individuazione e di analisi del sentiment on-line. Più di 7000 articoli sono stati scritti e centinaia di start up cercano di sviluppare algoritmi di calcolo; i pacchetti statistici più importanti, come SPSS o SAS, cominciano ad includere nei propri moduli elementi dedicati alla sentiment analysis (Feldman, 2013).

Google Trends mostra come le parole sentiment analysis siano state digitate in maniera crescente dal 2004 ad oggi (Figure 4).

Figure 4: Interesse crescente nella ricerca delle parole "sentiment analysis”

Fonte: Google Trends (Italia, Marzo 2015)

(21)

20 Illustreremo l’analisi del sentiment e le sue caratteristiche principali per il tramite delle definizioni più recenti degli studiosi del campo.

Rambocas et al. (2013) definiscono la sentiment analysis come una tipologia di analisi che ha ad oggetto ciò che viene espresso on-line; più precisamente, si tratta di una “tecnica di data mining che utilizza processi di linguaggio naturale, linguistica computazionale e analisi del testo per identificare ed estrarre contenuti di interesse da un corpo di dati in forma testuale”.

Essa si focalizza, in particolare, “sulla valutazione di attitudini e opinioni su un argomento di interesse utilizzando tecniche machine learning (apprendimento automatico)5” (Rambocas et al., 2013). Lo scopo principale di questa tipologia di analisi è, infatti, l’identificazione ed estrazione delle “prove di valutazioni aventi toni emotivi e soggettivi”, attraverso la disamina di “quali caratteristiche (“features”) testuali (lessicali, sintattiche o, più recentemente, la frequenza delle parole), contribuiscono al contenuto affettivo del testo” (Gunter et al., 2014); inoltre, queste caratteristiche possano essere individuate in maniera automatica (in una parola, frase o a livello di intero testo) e quantificate grazie all’aiuto delle risorse computazionali utilizzabili (Gunter et al., 2014).

L’analisi del sentiment può essere esaminata secondo un duplice punto di vista: da una parte, l’aspetto operativo, ossia quello relativo ai mezzi con i quali viene svolta, dall’altra l’aspetto funzionale, ossia di descrizione degli scopi ed usi pratici che si possono fare di tale analisi.

Secondo un punto di vista operativo, l’analisi del sentiment è una “analisi della soggettività automatizzata” (Kumar e Sebastian, 2012) poiché si avvale di sistemi di linguistica computazionale e programmazione computerizzata per estrarre un giudizio da dati di tipo testuale.

Dal punto di vista funzionale, invece, l’analisi è un processo di categorizzazione di un data set in forma testuale che ha l’obiettivo di “determinare sentimenti, attitudini ed emozioni nei confronti di una particolare questione o oggetto” (Liu, 2010). Inoltre, applicando questa analisi a contenuti disponibili on-line, e considerando l’importanza degli stessi in termini di diffusione e viralità consentiti da internet, gli obiettivi conoscitivi della sentiment analysis si allargano a comprendere

5 L’apprendimento automatico, chiamato in letteratura “machine learning”, è l’ambito scientifico relativo all’intelligenza artificiale che mira alla creazione di algoritmi e sistemi basati sull’osservazione dei dati per creare nuova conoscenza. Come vedremo nel caso dei software di analisi del sentiment, i dati di base possono provenire da diverse fonti, tra cui data set di linguistica come i Lexicons.

(22)

21 anche chi sono gli autori dell’opinione espressa, poiché “il processo decisionale delle persone è influenzato dalle opinioni dei leader ma anche dalle persone comuni” (Feldman, 2013).

In sintesi, possiamo affermare che le caratteristiche fondamentali dell’analisi del sentiment sono le seguenti:

 Obiettivo: monitorare e quantificare l’opinione on line di un individuo o gruppo di individui, avente l’influenza sugli altri, da controllare in tempo reale per poter agire strategicamente di conseguenza (Feldman, 2013);

 Oggetto di analisi: dati qualitativi di tipo testuale, che possono essere raccolti da fonti molteplici, esprimenti un’opinione riguardo un elemento di interesse. In particolare, dell’opinione espressa vengono analizzati (Kumar e Sebastian, 2012):

1. L’elemento di interesse: può essere un prodotto, una persona, un evento, un organizzazione, un argomento; può possedere degli attributi, caratteristiche o componenti ad esso associate, a loro volta scomponibili secondo i propri attributi e componenti;

2. Le caratteristiche: un attributo dell’oggetto o sua parte, rispetto ai quali si svolge la valutazione;

3. La polarità (o orientamento dell’opinione): indica il risultato della scala di valutazione utilizzata per determinare il sentiment rispetto all’elemento di interesse; usualmente, la scala prevede tre gradi (positivo, negativo o neutrale) ma vi possono essere differenti scale di valutazione dell’intensità e significato dell’opinione;

4. Il soggetto che esprime l’opinione: una persona o un’organizzazione.

 Luogo di raccolta dei dati: pagine on-line in genere, dai forum ai social network, in cui l’interazione e la potenziale viralità dell’opinione possono renderla amplificata;

 Mezzi di analisi: software di analisi del linguaggio naturale in grado di individuare ed “estrarre” toni caratterizzati emotivamente dai dati qualitativi, un software in grado di sostituirsi alla ricerca e analisi manuale e in grado di aggiungere dati di tipo quantitativo ai dati qualitativi precedentemente raccolti.

(23)

22 Sia gli aspetti funzionali sia operativi di questo tipo di analisi, sono necessari per valutare la portata dello strumento e la sua applicabilità in termini di ricerche di marketing; nei prossimi paragrafi vedremo quali sono le tappe fondamentali per svolgere un’analisi del sentiment e i vantaggi e le limitazioni che caratterizzano questo tipo di tecnica.

3. Il sistema di analisi del sentiment

L’architettura generale del sistema di analisi del sentiment prevede 5 blocchi principali, riportati in Figure 5.

Figure 5: I Cinque elementi del sistema di analisi del sentiment

Fonte: Feldman (2013)

Gli elementi che costituiscono l’input del sistema è il “Corpus” costituito dai dati testuali, che possono essere in qualunque formato (html, pdf, word,…); una volta inseriti nel sistema, i dati vengono processati, e convertiti in testo “analizzabile” attraverso risorse linguistiche e dizionari specializzati, i cosiddetti “Lexicons”.

Tra gli strumenti di analisi linguistica ricordiamo, ad esempio:

(24)

23

 Tokenization: identificazione dell’unità di base dell’analisi secondo una precisa regola di identificazione (ad esempio, le singole parole delimitate da spazi nella lingua italiana);

 Stemming: sostituisce alla parola la parola che ne è all’origine, come nel caso: “cani”,

“cane” oppure “pensiamo”, “pensare”;

 Tagging delle parti del discorso: identificazione delle parole come verbi, aggettivi, nomi propri, etc. e del contesto in cui si legano alle altre parti del discorso;

 Estrazione delle entità: classificazione delle parti del discorso in categorie predeterminate, ad esempio “espressioni temporali”, “luoghi”, “percentuali”, etc. . Ad esempio: “[Jim]Person

bought 300 shares of [Acme Corp.]Organization in [2006]Time” (Feldman, 2013);

 Estrazione delle relazioni: identificazione delle relazioni tra gli elementi del discorso.

Una volta processato, nella fase di analisi agli elementi del documento (frase, aspetto, intero documento), vengono attribuiti delle annotazioni sul sentiment, che costituiscono l’output della ricerca, solitamente sotto forma di punteggi (“scores”), che è possibile visualizzare attraverso una larga varietà di strumenti grafici.

4. L’analisi del sentiment come metodologia di ricerca

Rambocas et al. (2014) ed altri autori hanno cercato di sistematizzare l’utilizzo dell’analisi del sentiment come metodologia da applicare nelle ricerche di marketing.

4.1. La fase preparatoria all’analisi

Mandelbaum (2014) considera tre step fondamentali iniziali per introdurre il ricercatore all’analisi del sentiment:

1. Stabilire l’Obiettivo: occorre scegliere se considerare come unità di analisi la propria impresa, un prodotto specifico, un certo team esecutivo, un competitor oppure una specifica campagna, etc.

2. Stabilire un range temporale per l’analisi: accade, ad esempio, nel caso di una campagna specifica, gli obiettivi conoscitivi si inseriscono forzatamente all’interno di un intervallo temporale definito; ciò permette anche il paragone tra più range temporali per uno stesso obiettivo

(25)

24 conoscitivo. È, infatti, necessario definire se si tratta di analisi in tempo reale o svolte periodicamente.

3. Scegliere la lista di parole chiave: idealmente occorrerebbe inserire tutte le parole che si desidera individuare e testare; ciò significa che per un’analisi, la lista deve essere non troppo corta per inserire tutte le parole chiave necessarie ma anche non troppo lunga, per non uscire “fuori tema” e allungare la ricerca inutilmente.

4.2. Il processo di analisi e raccolta dei dati 6

Rambocas et al. (2013) analizzano l’analisi del sentiment dal punto di vista di una nuova metodologia di ricerca qualitativa di marketing in grado di integrare e migliorare la complementarietà tra le ricerche qualitative e quantitative. Nel loro articolo riportano in particolare le fasi che compongono il processo di analisi del sentiment.

Figure 6: Il processo di Analisi del Sentiment

Fonte: Rambocas et al. (2013) 4.2.1. La raccolta dei dati

La prima fase attiva di ogni analisi è la raccolta dei dati (Figure 6).

L’analisi del sentiment, come ricordato in precedenza, si avvale dei contenuti generati dagli utenti, ossia le discussioni pubblicate on line; pertanto le fonti principali, a seconda che i contenuti siano o meno soggetti a restrizioni di visualizzazione, si rivelano essere:

6 Riadattamento da Rambocas et al. (2013).

Raccolta dei Dati

Preparazione del Testo

Individuazione del Sentiment

Classificazione del Sentiment

Presentazione degli Output di

ricerca

(26)

25

 Fonti tendenzialmente pubbliche:

o Forum (Forum.donnamoderna.com,…) o Blogs (TheBlondSalad.com,…)

o Siti di recensione di prodotti/ servizi (Amazon.com, Blablacar.com,…)

 Fonti tendenzialmente private:

o Social network (Facebook, Twitter,…)

o Messaggistica Privata (WhatsApp, Facebook Messenger,…)

o Altri siti web (forum, blog,… ) accessibili per registrazione/ammissione da parte dell’amministratore.

Il problema fondamentale che l’analista affronta è la considerazione che i dati che è possibile raccogliere sono di fatto “in grandi volumi, disorganizzati e disintegrati in molteplici portali”

(Rambocas et al.,2013) e ciò complica ulteriormente la possibilità di individuare le opinioni e le emozioni presenti on line: potrebbero essere espressi in diversi siti web, a livelli differenti di dettaglio, di vocabolario, etc. . In questo contesto intervengono particolari software di analisi, resi disponibili gratuitamente o a pagamento da imprese specializzate, in grado di individuare oltre che analizzare il materiale (Figure 7: Un esempio di individuazione di dati e di sentiment a partire dal Social Network Twitter

Fonte: www. sentiment140.com), ottenendo un risparmio notevole di risorse in termini di tempo e denaro all’eventuale ricercatore che, in alternativa, se ne dovrebbe occupare manualmente.

(27)

26 Figure 7: Un esempio di individuazione di dati e di sentiment a partire dal Social Network

Twitter

Fonte: www. sentiment140.com

4.2.2. La preparazione del testo

Questa fase consiste nella “pulizia” dei dati che precede l’analisi vera e propria e frequentemente include l’eliminazione dei dati che non sono necessari per l’analisi del sentiment, come ad esempio i dati legati al soggetto che scrive (es. il nome/user name; l’ora e il luogo in cui si scrive, non strettamente necessari per l’analisi del sentiment) oppure parole che non rilevanti perché di scarso o nullo contenuto informativo come le cosiddette “stop words”, ossia articoli, preposizioni, … .

4.2.3. L’individuazione del sentiment

Una volta liberato il testo degli elementi non necessari per l’analisi, specifici software vengono utilizzati per associare alle parti di testo un determinato livello di sentiment. Occorre sottolineare che non tutte le frasi vengono analizzate: il software, infatti, si occupa in primo luogo di individuare le frasi in cui è possibile individuare un sentiment: inizialmente, il software stabilisce quali frasi siano di tipo “oggettivo” ossia, quelle contenenti informazioni fattuali, dichiarazioni di stato, fatti,

(28)

27 comunicazioni oggettive in genere (Fedelman, 2013) distinguendole da quelle di tipo “soggettivo”

ossia, contenenti opinioni esplicite, valori, punti di vista riguardo elementi specifici; (Fedelman, 2013); successivamente, prosegue l’analisi soltanto su quest’ultima tipologia.

Il sentiment può essere individuato a differenti livelli di analisi, ossia a livello di:

 Singolo termine;

 Singola frase, o frasi composte;

 Intero documento.

Una volta definito l’unità di analisi, occorre stabilire quali metodi e tecniche di analisi del linguaggio utilizzare per l’individuazione del sentiment; sono numerosi gli approcci che vengono utilizzati per analizzare i dati testuali; tra le tecniche più comunemente utilizzate (Rambocas et al., 2013) ricordiamo:

 Unigrams: in questo approccio, il sentiment viene individuato a partire dalla frequenza di una singola parola; è anche definito, infatti, “bag of words approach”, ossia “approccio della borsa di parole”.

 N-grams: con questa tecnica, si tiene conto non di una singola parola per volta ma di più parole (N parole) insieme; ciò permette di prendere in considerazione anche il contesto in cui la parola viene espressa.

 Lemmas: lavora utilizzando un sistema di sinonimi delle parole piuttosto che le parole stesse; ciò comporta un certo grado di generalizzazione e di conseguenza dei risultati non del tutto precisi, come testimoniato da Kushal et al. (2003), dato che i sinonimi non sempre esprimono esattamente lo stesso significato di una parola.

 Negation: in questo approccio si aggiunge al metodo N-grams l’insieme delle parole che implicano una negazione nel contenuto espressivo, in modo tale da separare in due gruppi opposti le espressioni di significato opposto; ad es, “Mi piace questo libro” e “Non mi piace questo libro”. Questo tipo di approccio, riportano gli autori, è ancora in fase di miglioramento perché non in grado di considerare le sfumature di significato, né l’ironia né il sarcasmo; ad es, sarebbe difficile riuscire

(29)

28 a individuare il sentiment di una frase come “Non c’è dubbio che questo libro sia il migliore”.

 Opinion Words: utilizza, come base di analisi, tutte quelle parole, aggettivi, nomi, avverbi che più frequentemente vengono utilizzati in senso soggettivo e allo scopo di esprimere un’emozione o sentimento.

Sottolineano, inoltre, gli autori che, essendo molto comune il riferimento di un’opinione a un’entità definita, sono disponibili algoritmi matematici in grado di individuare l’oggetto dell’opinione (sia esso un prodotto, una persona, una caratteristica o attributo, etc.) per raggiungere un grado di categorizzazione e analisi aggiuntiva, più precisa e ovviamente di ampia applicabilità in ambito di marketing.

Fedelman (2013), infatti, aggiunge che è possibile effettuare analisi differenti a seconda di un punto di vista più funzionale:

 Analisi basata sugli aspetti: compiere un’analisi che mira a valutare i diversi attributi di un’entità e le diverse opinioni nei loro riguardi, come può spesso accadere in un Forum o in un sito di recensioni.

 Analisi comparativa: è di maggior utilità quando le opinioni sono espresse su un’entità paragonata ad un'altra, di cui è possibile individuare la “preferita”.

 Acquisizione del lessico del sentiment: l’analisi del sentiment può a sua volta dare origine ad altro materiale utile alla creazione di risorse linguistiche per ulteriori analisi; è il caso della creazione di “lexicons” (dizionari), i cui termini possono essere acquisiti con : approccio manuale (codifica manuale del lexicon); approccio basato su dizionari (quando si ha un dizionario di partenza come WordNet di cui si espande il corpus); approccio basato sul corpo dati (quando vengono utilizzati dei set di “parole seme” da espandere attraverso più documenti all’interno di un singolo dominio).

(30)

29 4.2.4. La classificazione del sentiment

Una volta individuate le parti “soggettive” del dataset testuale, il software si occupa di assegnare all’elemento di interesse una classificazione di polarità. Frequentemente tale polarità viene espressa tramite una scala avente due estremi opposti, tra i quali vi è un continuum di valori intermedi, anche coinvolgenti più polarità contemporaneamente (si pensi alle stelle usate per le recensioni su siti per l’acquisto di scarpe on-line o come Tripadvisors.com).

Per la classificazione del sentiment, i software si avvalgono comunemente di “tecniche di apprendimento automatico”, dall’inglese “machine learning techniques”. Le tecniche machine learning ricorrono a strumenti legati all’intelligenza artificiale ed hanno lo scopo di creare dei modelli predittivi basati su un’esperienza passata o sull’osservazione di un determinato fenomeno.

Lo scopo è quello di creare una funzione che, dato un input di attributo o criterio, sia in grado di predire un determinato risultato obiettivo. Quando l’obiettivo è noto, si parla di “apprendimento supervisionato”7: la “macchina” impara attraverso processi di cui sono noti sia gli input sia gli output; nel caso di una analisi del sentiment, l’insieme dei dati da utilizzare come training per l’apprendimento della macchina è costituito da elementi testuali che servono da preparazione per insegnare all’algoritmo come svolgere la classificazione.

Senza addentrarci nei dettagli informatici dell’analisi, riportiamo le tre funzioni di classificazione che Rambocas et al. (2013), nominano come le più comuni disponibili:

1. “Naive Bayes”: crea una classificazione che considera la frequenza di ogni elemento (Feature) per ogni etichetta di classe (class label), basata sul teorema di Bayes; quest’ultimo ipotizza che gli elementi siano indipendenti, data l’etichetta di classe8 ed attraverso dei processi inversione è in grado di risalire alla probabilità che una certa feature appartenga ad una certa etichetta di classe.

2. “Support Vector Machines”: è una funzione di classificazione basata sulle teorie di apprendimento statistico (Vapnik, 1995).

7 L'apprendimento supervisionato (“supervised learning approach”) è una tecnica di apprendimento automatico che mira a istruire un sistema informatico in modo da consentirgli di risolvere dei compiti in maniera autonoma sulla base di una serie di esempi ideali, costituiti da coppie di input e di output desiderati, che gli vengono inizialmente forniti.

Fonte: Wikipedia.

8 Questa tecnica viene utilizzata in ReXoLcom S.r.l. .

(31)

30 3. “Maximum Entropy”: crea un insieme di modelli in cui l’elemento ha un determinato ruolo; solo il modello con il massimo livello di entropia viene selezionato per essere utilizzato nella classificazione.

Le tecniche di apprendimento automatico, ricordano Rambocas et al. (2013), si basano sull’esistenza di un dataset in cui vi è stata già effettuata una classificazione degli elementi che potrebbe non essere sempre disponibile perché legato alla lingua in cui i dati sono espressi. La letteratura, le tecniche e i metodi di analisi del sentiment più noti sono legati alla lingua inglese e si pone pertanto la difficoltà di un utilizzo esteso ad altri idiomi;

un’eventuale traduzione letterale potrebbe presentare, infatti, perdite notevoli di elementi espressivi tipici di una lingua.

Una volta terminata la classificazione dell’elemento di analisi, viene assegnato un valore

“score” all’elemento stesso per determinarne il sentiment, attraverso algoritmo specifici.

4.2.5. La presentazione degli output di ricerca

I risultati delle analisi del testo possono essere notevolmente differenziate tra loro a seconda degli scopi conoscitivi e della funzionalità espressiva della modalità di presentazione del risultato.

Parametro alla base di ogni presentazione, rimane l’obiettivo di rendere una gran mole di dati qualitativi disorganizzati un’informazione avente significato e utilità per un eventuale committente.

Qualunque sia la presentazione degli output prescelta, occorre tenere conto degli obiettivi conoscitivi della ricerca. In particolare, Mandelbaum (2014) individua due tipologie principali di analisi, che possono corrispondere a due tipologie differenti di obiettivi, oltre che di strumenti:

 Analisi in tempo reale (“Real-time Analysis”): permette di individuare le

“conversazioni” in tempo reale e di inserire delle notifiche apposite (“alerts”) per parole chiave. Ciò permette di rispondere in tempo reale ad un consumatore che manifesta un problema, come l’attesa in una lunga coda fuori da un museo, causata forse dall’addetto ai biglietti.

 Dati Aggregati (“Aggregate Data”): permette di raccogliere dati durante un certo intervallo temporale e poterli perciò riassumere in report periodici, che possono

(32)

31 essere approfonditi con focus su elementi più importanti, come campagne specifiche.

Rambocas et al. (2013) riportano alcuni esempi di grafici a torta e a barre, alcuni derivanti da analisi in tempo reale, altre da analisi legate a ricerche di più ampio respiro, che esprimono il sentiment riguardo un elemento singolo (Figure 8), un prodotto con più attributi (Figure 9) o più prodotti di cui si comparano i sentiment di più attributi (Figure 10), oltre ai semplici “ratings”, tra i più comuni quelli con le stelline che riassumono in una scala (spesso da 1 a 5 stelle) la recensione riportata successivamente di un prodotto (Figure 11). Un esempio di analisi del sentiment che tiene conto anche del fattore tempo è riportato in Figure 12. L’utilizzo delle tecniche più innovative di rappresentazione, le cosiddette “Infografiche” possono inoltre dare un tocco stilistico in più alla presentazione dei risultati della ricerca.

Figure 8: Sintesi di Sentiment su un singolo prodotto

Fonte: Rambocas et al. (2013) da www.sentiment140.com

(33)

32 Figure 9: Analisi del Sentiment per attributi di un singolo prodotto

Fonte: Rambocas et al. (2013)

Figure 10: Analisi del Sentiment comparativa per attributi per due prodotti

Fonte: Lu (2010)

Figure 11: Esempio di Rating attraverso polarità espressa da stelle;

Fonte: Amazon.com

(34)

33 Figure 12: Analisi temporale del Sentiment;

Fonte: Rambocas et al. (2013)

5. Gli ambiti applicativi della analisi del sentiment

L’analisi del sentiment è applicabile a qualunque tipologia di dataset qualitativo costituito da testo e ciò permette una notevole estensione dell’applicabilità dell’analisi a domini differenti. Volendo considerare gli ambiti applicativi più importanti dal punto di vista di marketing, possiamo considerare sei categorie maggiori di beneficiari dell’analisi del sentiment9.

1. Imprese

2. Agenzie Governative 3. Politici

4. Imprese specializzate in Marketing e PR 5. Società di Investimento

6. Acquirenti On-line

9 Rambocas et al. (2013) definiscono i primi tre beneficiari fondamentali per la sentiment analysis; Feldman (2013) aggiunge altri due e la sottoscritta ha aggiunto l’ultima categoria.

(35)

34 7. Scienze sociali

Prima sfera di applicazione, le imprese: nell’ottica di approccio al mercato, non possono non tenere in considerazione la necessità di godere di un’ottima reputazione, sia on line sia off-line; gli strumenti forniti dalle nuove tecnologie permettono un’analisi che raggruppa le molteplici fonti on line per ottenere degli insight approfonditi sull’opinione dei consumatori riguardo il brand dell’impresa, i suoi servizi e i suoi prodotti, anche in rapporto a prodotti e servizi dei concorrenti.

Gli algoritmi di analisi del sentiment possono, infatti, operare la cosiddetta “feature extraction”

(estrazione della caratteristica, elementi, componenti): il “processo con cui un prodotto può essere scomposto nelle sue componenti o attributi, i quali possono essere utilizzati come frasi principali per l’estrazione e la classificazione” (Li, 2005) del sentiment.

Le aziende che esprimono l’esigenza di strumenti di monitoraggio della reputazione on-line si possono rivolgere ad imprese specializzate nell’offerta di servizi di monitoraggio della reputazione, focalizzati perlopiù su:

 Monitoraggio delle recensioni on line di prodotti e servizi sia di utenti sia di non utenti degli stessi;

 Monitoraggio dei contenuti on line “virali”, che possono influenzare positivamente o negativamente il buzz10 sull’azienda;

 Stabilire il buzz del mercato, le attività dei competitors e i trend che influenzano i consumatori;

 Misurare la risposta dei consumatori alle strategie attivate dall’impresa o ad altri elementi ad essa correlati.

Mandelbaum (2014) nella sua “Guida agli strumenti della sentiment analysis”, riporta un esempio applicativo di come la sentiment analysis può aggiustare il mirino della strategia d’impresa:

immaginiamo di dover lanciare sul mercato cinematografico un nuovo film, e il target stabilito dal

10Buzz marketing: Tecnica di marketing basata sul passaparola in Internet (specialmente attraverso i blog), al fine di raggiungere nel minor tempo possibile un gruppo di utenti interessato al tema, al prodotto o al servizio che si intende diffondere. Fonte: Google.

“Il Consumer buzz è riferito ai messaggi dovuti al passaparola che viene generato dagli utenti, come ad esempio le recensioni sui prodotti he sono volontariamente “postate” sui siti web dai consumatori riguardo le loro esperienze di consumo” (Luo et al., 2013).

(36)

35 management comprende una fascia di età prestabilita, su cui sono basate le campagne di comunicazione. Se si trovasse del sentiment positivo da parte di un target appartenente ad una fascia di età più bassa rispetto a quella prevista, potrebbe essere interessante considerare un riaggiustamento delle strategie di marketing future. Ma aggiunge anche l’autore che una analisi del sentiment singolarmente non è uno strumento completo se non lo si affianca ad un’analisi che miri ad approfondire i motivi alla base di un determinato sentiment. Ad esempio, non soltanto conoscere il sentiment di una certa campagna pubblicitaria, ma anche conoscere il perché si è originata per individuare gli strumenti corretti per migliorare l’opinione pubblica” on line11.

Secondo ambito applicativo dell’analisi del sentiment risultano le agenzie governative. Anche queste ultime iniziano a dare ascolto anche al buzz on line soprattutto nell’epoca contemporanea caratterizzata da continue minacce terroristiche alla sicurezza nazionale: ogni elemento rinvenibile anche in rete può essere d’aiuto per identificare e prevenire minacce alla sicurezza nazionale (Figure 13 e Figure 14). Un articolo del New York Times (2006) annunciava già un progetto finanziato dal governo americano per 2.4 milioni di dollari per lo sviluppo di software in grado di analizzare i contenuti di articoli pubblicati negli Stati Uniti e fuori dagli Usa.

11 Analoghe considerazioni valgono anche per i personaggi pubblici in generale, la cui reputazione resta un elemento determinante per la loro carriera.

(37)

36 Figure 13: Indice di sentiment per la sicurezza nazionale negli Usa

Fonte: http://sentdex.com/political-sentiment-analysis/

Figure 14: Indice di sentiment sul Terrorismo negli Usa

Fonte:http://sentdex.com/political-sentiment-analysis/

(38)

37 Al terzo posto, come sfera di applicazione strettamente legata alla precedente, troviamo i soggetti politici: partiti politici e i personaggi di spicco del contesto politico in genere possono trovare nell’analisi del sentiment un valido aiuto per le loro campagne: un sistema per monitorare non soltanto il gradimento degli elettori ma anche per individuare i bisogni degli elettori stessi direttamente nel momento in cui vengono espressi. Un esempio applicativo è quello fornito da un’applicazione per smartphones, Tata iElect che permette di scoprire quali dei candidati alle elezioni in India sono giudicati come i migliori nel social network Twitter, riportati in Figure 15:

Screenshot dell’app Tata iElect, un'app di monitoraggio del sentiment politico durante le elezioni in India su Twitter

.

Figure 15: Screenshot dell’app Tata iElect, un'app di monitoraggio del sentiment politico durante le elezioni in India su Twitter

Fonte: elaborata da TATA®

(39)

38 Le imprese specializzate in Public Relations, e di Marketing e Comunicazione in genere, possono beneficiare dei servizi forniti dalle analisi del sentiment come servizio da poter offrire ai propri clienti.

Le Società di Investimento contano sulle opinioni del mercato per prevedere l’andamento del mercato azionario; l’analisi del sentiment finanziarie è già ben presente tra i providers di questa analisi. Un esempio ne è l’applicazione per I-Phone; una schermata è riportata in Figure 16.

Figure 16: Schermata dell'applicazione "Scutify"

Fonte: Apple Store Infine, al di là degli utilizzi commerciali di questo strumento, occorre ricordare che l’analisi del sentiment è utilizzabile anche in ambiti di studio scientifico, ad esempio nelle scienze sociali.

Declinando l’algoritmo secondo il caso, potrebbe essere un valido aiuto per interpretare il grado di benessere della società (Iacus, 2014).

(40)

39 6. Limitazioni dell’analisi del sentiment

Come ogni strumento, anche l’analisi del sentiment non è esente da limitazioni particolari, che possiamo classificare in cinque macro-classi: limitazioni etiche, legate al software, dovute alla complessità linguistica, legate alla lingua analizzata ed infine al metodo di ricerca.

6.1. Limitazioni etiche

Dal punto di vista etico, sarebbe corretto applicare la richiesta del consenso al trattamento dei contenuti pubblicati on line da parte di un qualsiasi autore; nonostante si tratti di una pratica con notevoli difficoltà dato che si parla di ingenti moli di contenuti pubblicati on line ogni giorno, omettere questa prassi nel processo di ricerca l’analisi può comportare problematiche dal punto di vista della partecipazione volontaria, confidenzialità e privacy dei contenuti. È pur vero che l’iscrizione ad un servizio da parte dell’utente dovrebbe avvenire in maniera consapevole, preliminarmente accettando le specifiche “condizioni di servizio”; ad esempio in Twitter, tali condizioni prevedono che i contenuti siano pubblici per default (Rambocas et al., 2013).

Dall’altra parte, chi procura un servizio di analisi del sentiment deve necessariamente, per trasparenza ed etica professionale, informare l’acquirente del servizio delle modalità di calcolo e del livello di accuratezza del software utilizzato (Anstead & O’Loughlin, 2012).

6.2. Limitazioni legate al software

Lungi dall’esaustività in ambito informatico, si riportano alcuni esempi di svantaggi legati al software di analisi del sentiment degni di nota per chi comincia ad avvicinarsi a questo strumento:

 Tempi di sviluppo dei software: tecniche di apprendimento automatico e Lexicons già disponibili possono ridurre i tempi di sviluppo di un software, che rimangono sempre lunghi (Rambocas et al., 2013).

 L’accuratezza di sistemi di monitoraggio del sentiment è piuttosto variabile; ad esempio, sono stati riscontrati migliori risultati nel caso di elevati volumi della base dati, per cui, di conseguenza, una piccola-media impresa (PMI) potrebbe non trovare un dataset significativo per analisi specifiche (Mandelbaum,2014); anche la lunghezza delle frasi da analizzare influenzano i risultati: le frasi più corte, secondo un recente articolo pubblicato sull’ Academy of Marketing Science (Davis and O’Flaherty, 2012), sarebbero più facilmente interpretabili dai software (Rambocas et al., 2013).

(41)

40

 Selezione delle parole chiave: nella fase di classificazione operata dai software di analisi del sentiment, si utilizzano parole chiave per la categorizzazione degli elementi; la scelta di alcune categorie implica una perdita conoscitiva rispetto alle categorie non esaminate. La classificazione più nota è quella finale riguardante la polarità: includere un elemento in una scala positivo- negativa può essere particolarmente riduttivo rispetto alla varietà espressiva che può confluirvi (Kumar e Sebastian, 2012).

 Opinioni multiple: una frase può contenere più opinioni oppure contenere anche espressioni soggettive insieme ad espressioni oggettive. L’implementazione di un software affidabile dovrebbe tenere conto anche di questi elementi. (Kumar e Sebastian, 2012).

6.3. Limitazioni legate alla complessità linguistica

Tra gli ostacoli legati all’applicazione della linguistica in campo informatico ricordiamo che:

 Il sarcasmo e l’ironia, nelle loro innumerevoli sfumature, non sono sempre facili da tracciare e il software può segnalare come positiva una frase che in realtà non lo è; ad esempio, “Che bello vedere (il film) X con mamma…anche no!” (Mandelbaum,2014) ma sono anche molto diffuse sui social network, dove è possibile reperire larga parte della base dati dell’analisi del sentiment (Kumar e Sebastian, 2012).

 Il sentiment è specifico per dominio (“domain specific”), per cui il significato delle parole dipende dal contesto in cui vengono utilizzate; ad esempio: “go, read the book” può essere una recensione positiva se si parla del libro ma negativa se si parla di un film (Kumar e Sebastian, 2012); inoltre, i dati testuali sono declinati rispetto a specifici luoghi e tempi (Rambocas et al., 2013), oltre che a specifici contesti linguistici.

 Espressioni linguistiche particolari come gli slang, ad esempio, o i neologismi potrebbero non essere riconosciuti dai software e comportare delle perdite conoscitive; si pensi inoltre, alle metafore, alle perifrasi ed altre espressioni linguistiche più complesse.

 La negazione e le opinioni implicite possono non essere comprese: le espressioni per esprimere uno stesso concetto possono avere differenti gradi di complessità e i software

(42)

41 potrebbero non essere in grado né di individuarle né di comprendere il significato implicito di alcune espressioni. (Kumar e Sebastian, 2012).

6.4. Limitazioni legate alla lingua analizzata

Ad oggi, l’inglese è una delle lingue più utilizzate per l’analisi del sentiment, anche per la disponibilità di Lexicons complessi come Wordnet, pronti all’uso. Ma solo il 26.8 % degli utenti di internet parla inglese (Kumar e Sebastian, 2012) per cui si rivela necessario estendere le risorse semantiche anche ad altre lingue per aumentare le possibilità applicative offerte dall’analisi del sentiment. Tra i metodi attuali vi è l’utilizzo la traduzione dei dati testuali, con ovvie perdite a livello di espressività specifica di ogni lingua (Rambocas et al., 2013); inoltre è possibile che un’opinione sia espressa in più lingue all’interno di una stessa frase; si pensi al crescente uso di espressioni in inglese per commentare post in italiano su Facebook, quali “Lol” (“Laughing out loud”) .

6.5. Limitazioni del metodo di ricerca

La crescente popolarità dello strumento rischia di deviare l’attenzione dalle differenze fondamentali tra le fonti di dati on line usati per questo tipo di ricerca e i metodi tradizionali di misurazione delle opinioni, come i sondaggi d’opinione (Gunter et al., 2014). Tra le difficoltà che si possono incontrare ricordiamo i profili demografici degli autori dei contenuti: non potendo avere dati demografici comparabili all’interno del dataset, potrebbe non essere possibile effettuare delle ricerche approfondite in tal senso, men che meno effettuare disegni di campionamento e segmentazioni attraverso questo tipo di variabili.

Inoltre, a differenza dei sondaggi di opinione, in cui l’opinione è sollecitata e può essere confermata dal rispondente, nell’analisi del sentiment manca la possibilità di validare il sentiment calcolato dal software (Gunter et al., 2014). Infatti, è possibile imbattersi nelle cosiddette “opinioni spam”, ossia opinioni false pubblicate in rete con l’obiettivo di alterare la reputazione on-line dell’elemento a cui si riferisce sia in termini migliorativi sia peggiorativi (Kumar e Sebastian, 2012). Potrebbe rivelarsi necessario implementare dei sistemi di filtro dei dati per determinare un certo livello di

“sincerità” dei contenuti on-line.

Infine, occorre considerare l’origine della base dati utilizzata in rapporto a quella utilizzabile nelle ricerche tradizionali: nell’analisi del sentiment, non è sempre possibile operare in maniera

Riferimenti

Documenti correlati

Si noti che sotto le ipotesi del teorema, l’affermazione ”tutti i sistemi sono impossibili oppure nessun sistema e’ impossibile” e’ falsa, cosi’ come e’ falsa

Ogni frase si può dividere in tanti mattoncini che hanno un significato preciso.. I mattoncini si

 Le parole di queste frasi si sono scambiate di posto creando frasi strane, senza SIGNIFICATO LOGICO.. Rimettile al loro posto e scrivi le

Corte di Cassazione - copia non ufficiale.. 3, c.p.c., Poste Italiane ha denunciato la falsa applicazione dell'articolo 33, comma 5, della legge n. 104 del 1992, così come

1.Con il ricorso introduttivo del giudizio, notificato ai soggetti indicati in epigrafe in data 29 ottobre 2018 e depositato il successivo 7 novembre 2018, la

Il tratto più conosciuto dell’ironia socratica nei dialoghi giovanili di Platone è quello della “dissimulazione” di ignoranza: di fronte alla sicurezza di

10/4/2011, depositata in data 25/01/2011, con la quale - in controversia concernente l'impugnazione di un avviso di accertamento emesso per maggiori IRPEG ed IRAP dovute in

S abato 30 marzo, nel viale e nei giardini delle scuole di via Martinen- go, i genitori che da anni ani- mano e organizzano gli eventi presso i plessi scolastici del- l’istituto