• Non ci sono risultati.

3. LA QUALITATIVE CONTENT ANALYSIS NELLA NETWORK SOCIETY

3.2 La metodologia di analisi

3.2.2 La Sentiment Analysis

Chiunque, nel momento di prendere decisioni, più o meno importanti, si sarà sicuramente chiesto cosa ne pensano le altre persone, soprattutto se la decisione deve essere presa tra diverse opzioni e se richiede tempo e denaro.

Siamo passati dal far affidamento sugli individui (amici, conoscenti, familiari) e sui media specializzati (come le riviste), a un processo di scelta che fa affidamento sulle esperienze che gli utenti (per lo più sconosciuti) lasciano sui Social Media (come i blog e i Social Network) (Cambria et al., 2013). L’importanza di individuare e analizzare queste opinioni incomincia a essere riconosciuta in molti rami, come gli ambienti economici e le comunità scientifiche.

La Sentiment Analysis e l’Opinion Mining rappresentano i due campi principali di applicazione. Sebbene siano focalizzati su due aspetti diversi, in quanto la prima ha come fine la comprensione del sentimento mentre la seconda punta a rilevare la polarità di un testo, vengono oramai raggruppati sotto il nome generale di Sentiment Analysis, indicando con essa una tecnica che ha come obiettivo primario l’individuazione della polarità di un testo o di una frase e la classificazione della polarità come positiva, negativa o neutra. Sebbene molti metodi di classificazione statistica tendano a escludere la terza classe (neutro), questa è stata ritenuta fondamentale all’interno di un’analisi di questo tipo.

La Sentiment Analysis rappresenta una metodologia in larga espansione, potendo contare su ulteriori ambiti di applicazione rispetto a quelli tradizionali, in seguito all’affermazione del Web 2.0 e dei contenuti dei Social Media, all’interno dei quali

116 con sempre maggiore frequenza le persone esprimono i propri giudizi, le proprie valutazioni, recensioni e commenti. I sentiment qui espressi, quando raggiungono un numero soddisfacente, permettono di poter ricavare informazioni di una certa rilevanza, in grado di evidenziare i punti di forza e debolezza del settore, così come i trend in atto: se colti con un certo tempismo, possono assumere un ruolo importante per indirizzare le politiche aziendali o di mercato.

Come sostengono Cambria et al. (2013), l’obiettivo primario di questa analisi è rappresentato proprio dalla polarity classification, che si verifica nel momento in cui viene attribuito a una parte di testo, riferito a un solo argomento, uno dei due sentimenti opposti (positivo o negativo). Una seconda metodologia della Sentiment Analysis è rappresentata dalla agreement detection, ovvero una tipologia di classificazione binaria in cui si decide se attribuire o meno a una coppia di testi la stessa polarità, aggiungendo poi ad essa gradi di positività o negatività.

Problemi aggiuntivi si creano quando una parte di testo si riferisce a più argomenti, nel qual caso bisogna identificare le varie tematiche e individuare le opinioni per ciascuna di esse. Viceversa, un testo può contenere una forte polarità ma non manifestare un parere di qualche tipo.

I principali vantaggi della Sentiment sui Social Media riguardano:

 La gestione di conversazioni spontaneamente create dagli utenti e non mediate da terzi

 Una elevata riduzione dei costi di rilevamento e delle tempistiche richieste per il raggiungimento di una mole uguale di dati con metodologie tradizionali come i sondaggi

 La possibilità di acquisire i dati in tempo reale attraverso un monitoraggio costante

 Automatizzazione del processo tramite l’utilizzo di particolari tool di analisi semantica

L’automazione della Sentiment Analysis avviene tramite l’adozione del Natural Language Processing (NLP) e della linguistica computazionale, intendendo con esso un metodo di analisi dei testi svolto con calcolatori e software in grado di elaborare una grossa mole di dati attraverso diverse fasi. Sebbene oramai rappresenti il metodo di analisi principale, il processo di automazione non è però un argomento

117 così scontato, e anzi bisogna considerare questa opzione con cautela, tenendo conto dei rischi che si corrono affidando l’analisi esclusivamente a software e algoritmi, come quelli indicati da Diegoli (2011):

 Valutazione di post come neutrali laddove manchino elementi forti che permettano al software di attribuire un segno (positivo/negativo) al commento

 Mancata individuazione dei segnali di una crisi in arrivo o di potenziali ambassador per l’azienda, a seguito della codificazione dei commenti come neutrali

Un algoritmo infatti non può capire quando ci si trova dinnanzi a frasi ironiche, modi di dire, sarcasmo o sfumature che solo una persona può cogliere, anche se non sempre si tratta di un processo immediato. La stessa punteggiatura, messa in un modo invece che in un altro, può alternare il significato del testo. Il linguaggio è estremamente complesso e affidarsi esclusivamente all’automazione vuol dire rischiare spesso di sbagliare. Una componente umana nell’analisi è quindi richiesta. “Il processo mentale che porta alla produzione di un testo è puramente un mistero.

[…] ogni singola frase per quanto ponderata e ben costruita può cambiare drasticamente il suo significato per l’inclusione anche

di una piccola variazione” (Ceron et al., 2014)

Gli stessi autori ci tengono a sottolineare come i metodi automatici possono essere sicuramente di grande aiuto, velocizzando alcuni processi, ma non si può pensare che siano in grado di sostituire interamente la componente umana.

I vantaggi di una codifica umana risiedono nel bassissimo rischio di errore nell’attribuzione del segno della polarità, e questo è vero finché il soggetto può comprendere senza problemi un testo. Tra gli svantaggi invece Ceron et al. (2014) inseriscono il tempo richiesto per completare lo studio, nel momento in cui si maneggiano migliaia (se non milioni) di commenti, che si prolunga ulteriormente quando si affrontando testi lunghi come quelli dei blog. Inoltre anche la componente soggettiva può avere un suo peso considerevole nello spostare l’ago della bilancia della polarità, potendo trasformare un commento positivo in neutro, se non addirittura negativo o viceversa, laddove le ideologie del codificatore non gli permettano di essere totalmente obiettivo. In questo ultimo caso, gli autori

118 consigliano di far svolgere l’analisi a più di un soggetto, svolgendo codifiche incrociate e affidandosi a un supervisore esterno, incaricandolo del controllo di campioni casuali per giudicarne la qualità.