• Non ci sono risultati.

L’attribuzione di parole chiave (tagging)

3.3 Applicazione della classificazione supervisionata

3.3.11 L’attribuzione di parole chiave (tagging)

La codifica manuale diventa particolarmente delicata in sede di opinion mi- ning, ovvero nel momento in cui ci si confronta con diverse dimensioni. Co- me anticipato nelle considerazioni preliminari, la determinazione di ci`o che `e sentiment positivo e ci`o che `e sentiment negativo pu`o rivelarsi a volte difficile anche per il codificatore umano. Nel caso di pi`u dimensioni d’ana- lisi, interpretare correttamente il testo assegnandogli le categorie pi`u adatte a rappresentarne il significato vuol dire incorrere non solo nei problemi gi`a noti dell’ambiguit`a del testo (le figure retoriche dell’ironia e della preterizio- ne, ad esempio), ma anche il rischio proprio del ricercatore di forzare una classificazione, inserendo il tweet in una categoria che non lo rappresenta completamente al fine di non “perdere” la quantit`a di informazione conte- nuta nel tweet. Su quest’ultimo aspetto, vale la pena menzionare una delle potenzialit`a di Voices Analytics ovvero la possibilit`a di includere, durante la fase di etichettatura, nuove categorie mano a mano che la lettura dei tweet ne fa riscontrare la necessit`a. Dall’altra parte invece, `e possibile a valle dell’in- dagine, quindi al termine della fase di codifica, decidere di incorporare una o pi`u categorie in un’altra, ritenendo una delle categorie non sufficientemente

“rappresentativa”.

Un esempio pu`o illustrare meglio in che modo effettuare la fase di coding:

Nebbiolina ed umido a Milano. Le palme di Starbucks si domandano: ma

che ce sto a fa’ ? 

In questo caso, sarebbe difficile decidere in che modo classificare il sentimento rispetto a Starbucks. Il tweet per`o fornisce informazioni rispetto a:

IMMAGINE MILANO:

-associazioni con spiaggia e mare IMMAGINE PALME:

-esotico

SENTIMENT VERSO LA CAMPAGNA -negativo

MOTIVAZIONI SENTIMENT NEGATIVO -incoerenza

In questo caso invece il tweet non `e particolarmente significativo rispetto alla campagna, ma lo `e rispetto al focus della polemica:

Vai a vedere che gli stessi a cui non piacciono palme e banani in Piazza

Duomo a Milano sono quelli che andranno da #Starbucks per il caff`e

FOCUS:

-chi critica `e incoerente

ciale dell’iniziativa:

Comunque geniali quelli di Starbucks: avessero messo delle piante qualunque

non se li sarebbe filati nessuno. E, invece, le palme....

In questo caso l’interpretazione del codificatore `e importante: il tweet potreb- be essere etichettato come sentiment neutro e fatto cadere sotto il cappello della categoria “immagine palme” come “trovata commerciale”; in questo ca- so invece si `e deciso che il “geniali” come attributo rappresentasse comunque un valore positivo rispetto alla campagna:

SENTIMENT POSITIVO

MOTIVAZIONI SENTIMENT POSITIVO buona operazione di marketing

`

E da sottolineare che la fase di coding, proprio per l’arbitrariet`a di alcune decisioni come quella appena illustrata, viene generalmente supervisionata da un altro codificatore che abbia la stessa conoscenza del campo di indagine e che quindi possa assicurarsi della bont`a della classificazione, intervenendo per minimizzare l’eventuale errore umano (una codifica involontariamente errata a causa di distrazione o inceppamento tecnico) o ancora mettere in discussione una scelta di classificazione ritenuta non idonea. Il problema non `e comunque risolto completamente, come dimostrano gli studi effettuati sulle discordanze di codifica che si sono effettutati paragonando le classifica- zioni manuali di codificatori diversi [51]. Un’ultima considerazione riguarda l’impossibilit`a di assegnare pi`u di una motivazione di sentiment negativo o positivo allo stesso testo: delle categorie di motivazione a disposizione, il co-

dificatore `e costretto a sceglierne solo una. Nei casi, quindi, in cui il tweet si prestasse a essere interpretato con pi`u di una motivazione di sentiment, si `e scelta quella ritenuta pi`u rappresentativa o inclusiva.

Fatte queste precisazioni, `e possibile passare alla fase relativa ai risulta- ti ottenuti. Ci limitiamo soltanto a segnalare la differenza di iSA e quindi dell’uso della piattaforma Voices Analytics rispetto all’analisi condotta pre- cedentemente per quanto riguarda l’aspetto dell’ampiezza del training set. Secondo il modello Hopkins-King, su cui `e stato sviluppato iSA, il numero minimo di testi da codificare per l’apprendimento dell’algoritmo non pu`o es- sere calcolato a priori: ci`o che conta `e invece avere sufficienti codifiche di ogni categoria considerata [51]. Negli approcci tradizionali esistono delle for- mule che, sulla base del numero di categorie e dell’ampiezza del corpus, ci permettono di determinare il valore di numerosit`a del training set rispetto al test set come misura percentuale, dipendente quindi dall’ampiezza della popolazione d’osservazione. Nel caso del modello Hopkins-King, invece, non si ha una numerosit`a a priori di osservazioni da etichettare, bens`ı un numero individuale di codifiche per ogni categoria: la codifica manuale dovrebbe per- ci`o proseguire fino a che non si raggiunga un numero sufficientemente elevato di osservazioni catalogate per quella categoria. Non si conosce un numero di codifiche di testi ottimale: empiricamente, si ritiene che secondo il modello Hopkins-King un numero tra le 30 e le 50 codifiche sia sufficiente. La quan- tit`a di lavoro di codifica manuale richiesta per avere dei risultati accurati dipende quindi:

1) dall’effettiva rappresentativit`a delle categorie: si ricorda a questo pro- posito quanto accennato precedentemente sulla decisione eventuale, in fase di tagging, ovvero di incorporare due categorie in una, includen-

done una troppo specifica (e quindi rara, poco rappresentativa) in una pi`u generale.

2) dalla quantit`a di osservazioni offtopic, che rendono quindi non signifi- cativa la singola codifica di questa categoria e chiedono al codificatore di procedere con la successiva. La quantit`a di osservazioni offtopic pu`o essere anche molto elevata, particolarmente nell’ambito dei social network, in cui la raccolta dei dati `e affidata alle parole chiave e agli hashtag.

Nel nostro caso, la codifica manuale ha portato ad analizzare un totale di 292 post, 11 dei quali rilevati come offtopic e quindi scartati dall’anali- si. `E opportuno segnalare che per una delle categorie inizialmente previste per la dimensione “Motivazioni di sentiment positivo”, ovvero la categoria “Rappresentano positivamente il brand Starbucks”, non si sono trovate evi- denze sufficienti; la categoria `e stata fatta convogliare in “Buona operazione di marketing”, che era invece gi`a prevista.

Documenti correlati