• Non ci sono risultati.

Assunzioni preliminari del Metodo Hopkins e King

Capitolo 4: “Il Prosecco”

4.1 Analisi dei dati estratti da Twitter

4.1.1 Assunzioni preliminari del Metodo Hopkins e King

Per applicare il metodo Hopkins e King al fine di analizzare come il prosecco e gli aspetti ad esso connessi sono percepiti dagli utenti Twitter, è necessario fare alcune assunzioni preliminari. Innanzitutto si devono dividere i testi in italiano dai testi in inglese per distinguere utenti italiani e utenti esteri (sarebbe stato opportuno sviluppare l’analisi per geo- localizzazione, ma si tratta di un servizio non sempre usato dagli utenti).

È fondamentale individuare le categorie sia per la Sentiment Analysis sia per l’Opinion Analysis al fine di poter associare ogni testo, nel nostro caso i tweet, ad una determinata categoria. Le categorie utilizzate per la Sentiment Analysis sono riportate nella Tabella 4.1 e descrivono le caratteristiche che deve avere ogni tweet per essere associato ad una certa categoria. Le categorie sono differenziate per nome, valore e descrizione; la descrizione serve per capire a che categoria appartiene il tweet e di conseguenza al valore a cui verrà associato: se un tweet esprime un sentimento positivo verso il tema di analisi sarà associato alla categoria +1 (positivo), se invece esprime un sentimento negativo verrà associato alla categoria -1 (negativo). Le categorie presenti per la Sentiment Analysis sono cinque: positivo, negativo, neutro, no – opinion e offtopic. Le ultime due categorie sono state aggiunte ad integrazione delle prime tre per poter categorizzare anche quei tweet che non esprimono un reale sentimento (pubblicità, presentazione di eventi, articoli) e i tweet che non parlano dell’argomento considerano nonostante siano parte del set di dati. Allo stesso modo si procede per l’Opinion Analysi dove troviamo un numero maggiore di categorie, ovvero undici. A differenza della Sentiment Analysis l’Opinion Analysis mira ad un’analisi più profonda dei motivi che hanno portato ad esprimere un determinato giudizio, ricercando nel sentimento manifestato la ragione che ha portato alla sua espressione. Ogni sentimento che è stato categorizzato come positivo apparterrà ad una determinata categoria compresa tra le prime cinque (rappresentate in Tabella 4.2), mentre i sentimenti negativi apparterranno ad una delle rimanenti categorie. Tutti i tweet a cui è stata precedentemente associata la categoria che esprime un sentimento neutro, no - opinon o offtopic apparterranno alla categoria identificata come “Altro” in quanto non esprimono un sentimento chiaro ed esplicito. Si deve precisare che alle categorie dell’Opinion Analysis non è stato assegnato un nome ma sono identificate da un numero, in quanto le cinque categorie positive sono equivalenti nei contenuti delle cinque negative ma esprimono giudizi opposti: la numero 1 e la numero 6 contengono tweet generici, la 2 e la 7 contengono tweet sul

68

territorio, la 3 e la 8 esprimono opinioni sul prodotto, la categoria 4 e la categoria 9 contengono espressioni su eventi legati al prosecco, la 5 e la 10 riguardano opinioni sulle infrastrutture e infine la numero 11 contiene tutti quei tweet che sono precedentemente stati etichettati come neutri, no – opinion e offtopic.

Tabella 4.1: Categorie scelte per la Sentiment Analysis

SENTIMENT ANALYSIS NOME CATEGORIA VALORE CATEGORIA DESCRIZIONE POSITIVO/ NEGATIVO +1 (positivo) -1 (negativo)

Sentimento riferito al Prosecco o altri eventi collegati attraverso messaggi positivi/negativi chiari ed espliciti.

NEUTRO 0

Testi che non esprimono un sentimento chiaro, ma si limitano a manifestare delle perplessità o delle aspettative senza però contenere note negative o positive.

NO-OPINION

-2

Il testo non esprime un giudizio. Si tratta di testi scritti principalmente da pagine pubbliche che riportano avvenimenti, eventi, articoli che non sono associabili alle altre precedenti categorie in quanto non esprimono un sentimento ma si limitano a riportare i fatti.

OFF-TOPIC -3

Tutto ciò che va al di là dell’argomento di analisi, quello che non si capisce, i discorsi non chiari, frasi incomplete e tutti i casi di indecisione.

69 Tabella 4.2: Categorie scelte per l’Opinion Analysis

OPINION ANALYSIS NOME CATEGORIA VALORE

CATEGORIA

DESCRIZIONE

POSITIVO

1

Opinione positiva verso il Prosecco espressa in maniera esplicita ed argomentata, ma generica. Si tratta di tweet con nota postitiva non riconducibili ad altre categorie. Si può fare riferimento a tweet postati in occasione di cene, festeggiamenti personali o altre considerazioni generiche, ad esempio:“Serata bollicine da C’e posto per te #bollicine #prosecco #vadobbiadene #docg #veneto”, “Prosecco Superiore From Conegliano Valdobbiadene DOCG A Shining Star #wine #prosecco #vino”.

2

Testi contenenti giudizi positivi relativi al territorio del Prosecco, ovvero ad espressioni come: “Un territorio che incanta e ci dona il #Prosecco, Superiore per #Natura”, “#prosecco#proseccoshire #schipisommelier #unesco candidatura per il bel paesaggio #coneglianovaldobbiadenedocg”. Il primo fa riferimento al piacere di vedere il prosecco nella sua natura, mentre il secondo richiama la bellezza del paesaggio e la sua candidatura a patrimonio dell’UNESCO.

3

Testi che esprimono opinioni positive verso il prodotto in sé e le sue caratteristiche organolettiche. Ad esempio: “La frutta col #prosecco e buonissima”, “Quest’uva ci regalera dell’ottimo #Prosecco di Conegliano- Valdobbiadene DOCG”

4

Testi contenti espressioni positivi legate ad eventi correlati al Prosecco. Ad esempio: “#Giro101 dopo tappa #Barolo tappa #prosecco tappa

70

#sagrantino.. 2018 tappa #franciacorta.. Il vino e eccellenza”

5

Testi riguardanti l’adeguatezza delle infrastrutture come cantine, strade, segnaletica. Ad esempio espressioni di apprezzamento verso la pulizia delle cantine, l’ospitalità del personale, la facilità nel trovare le strade.

NEGATIVO

6

Opinione negativa verso il Prosecco espressa in maniera esplicita ed argomentata, ma generica. Si tratta di tweet con nota negativa non riconducibili ad altre categorie. Si può fare riferimento ad esperienze negative avute o a varie considerazioni personali, come ad esempio: “Il #Prosecco purtroppo fa vittime e non per alcolismo”, “Odio il #prosecco nella #plastica #aperitivo #intreno #milanoroma #dasola #tristezza #lonely”.

7

Testi contenenti giudizi negativi relativi al territorio del Prosecco, ovvero ad espressioni riguardanti il paesaggio stesso.

8

Testi che esprimono una nota negativa verso le caratteristiche del prodotto. Si include in questa categoria il tema dei pesticidi, si intendono quindi anche le caratteristiche del prodotto come portatrici di problemi di salute. Ad esempio: “Chi brinderà il 31 con #Prosecco si ricordi che gli abitanti della zona di produzione vengono inondati di #pesticidi”, “Ah, tra l'altro lasciate perdere il #Prosecco, visto che lo fanno imbottito di pesticidi e #Glifosato”.

9

Testi contenti espressioni negative legate ad eventi correlati al Prosecco. Si tratti di giudizi negativi sull’esperienza di un determinato

71

evento, sulla sua organizzazione e sulle conseguenze che può portare.

10

Testi riguardanti l’inadeguatezza delle infrastrutture come cantine, strade, segnaletica. Ad esempio espressioni di non apprezzamento verso la pulizia delle cantine, l’ospitalità del personale, la facilità nel trovare le strade.

ALTRO 11

Tutto ciò che è no-opinion, neutro e off-topic. Tutti i casi di forte indecisione che non esprimono un giudizio positivo o negativo. Ad esempio: “Incontro ieri con Presidente Consorzio Tutela Prosecco DOC Stefano Zanette per parlare di tutela”, “Nelle terre del #Prosecco quanto costa la #terra? Se lo e chiesto il #Settimanale della @TgrRai”, “#Treviso. Nelle terre del #prosecco. Terre d’oro per quanto producono e quanto costano. Nel #Settimanale @TgrRai”.

72