• Non ci sono risultati.

Capitolo 4: “Il Prosecco”

4.3 L’analisi con il metodo LDA

4.3.1 I tweet in italiano

I tweet considerati sono i medesimi dell’analisi precedente incluse le considerazioni che hanno portato ad ottenere il database finale di 1.107 tweeet. Allo stesso modo, prima di procedere, è necessario pulire i testi e renderli analizzabili. Dal momento che tale fase è già stata applicata in precedenza, partiamo dal dataset dei 1.107 tweet pre - processati.

Per stimare il modello utilizziamo il pacchetto “topicmodels” e in particolare la funzione “LDA” che permette di stimare un modello LDA tramite l’algoritmo VEM o il campionamento Gibbs:

110

LDA(x, k, method = "VEM", control = NULL, model = NULL, ...)

In cui “x” rappresenta l’oggetto della Document Term Matrix, “k” rappresenta il numero di topic scelto, “method” indica il metodo da utilizzare che in questo caso è VEM o Gibbs, “control” indica una lista con i parametri di controllo per la stima, “model” individua l’oggetto della classe LDA per l’inizializzazione e infine “…” indica altri argomenti opzionali. A questo punto possiamo caricare il set di dati pulito (nominato “Analisi10”) e creare la Document Term Matrix.

doc.lenghts<-rowSums(as.matrix(DocumentTermMatrix(analisi10))) dtm<-DocumentTermMatrix(analisi10[doc.lenghts>0])

Carichiamo i pacchetti necessari e stimiamo il modello con il numero di topic fissato. I metodi proposti per questa analisi prevedono che si scelga a priori il numero di topic da utilizzare e si è deciso un numero di topic k=6; tale scelta è stata condizionata dalla precedente analisi in cui sono state individuate 6 categorie nella fase di tagging manuale e per questo motivo si è deciso di individuare lo stesso numero di argomenti.

library(topicmodels) library(tidytext) library(dplyr) library(ggplot2)

model_testi<-LDA(dtm,6)

Salviamo la distribuzione delle parole per ciascun topic (beta) in un dataframe:

topic_testi<-tidy(model_testi,matrix="beta")

Creiamo un dataframe con le 20 parole con la probabilità più alta per ciascun topic:

top_terms<-topic_testi %>% group_by(topic) %>%

top_n(20, beta) %>% ungroup() %>%

111

Generiamo un grafico con le parole più frequenti per ciascun topic: top_terms %>%

mutate(term = reorder(term, beta)) %>%

ggplot(aes(term, beta, fill = factor(topic))) + geom_col(show.legend = FALSE) +

facet_wrap(~ topic, scales = "free") + coord_flip()

In Figura 4.23 vediamo rappresentate le parole più frequenti per ciascuno dei 6 topic. Analizziamo ciascun topic e cerchiamo di capire se possono essere ricondotti ad una determinata e chiara categoria:

 Topic 1: “La tipologia di vino”. È rappresentato da parole riguardanti vari tipi di vino anche differenti dal prosecco, come il chianti e il brunello. Identifichiamo in tale categoria parole riferite al vino sia in termini di provenienza che di produzione (biologico).

 Topic 2: “Il prodotto”. Tale topic riporta parole che richiamano il prosecco in sé, le sue caratteristiche e i suoi utilizzi. Si tratta di un topic che parla del prodotto, ma in maniera generica.

 Topic 3: “Il paesaggio e le emozioni”. Si tratta principalmente di espressioni che raccontano emozioni conseguenti la vista del paesaggio e la visita alla strada del prosecco.

 Topic 4: “Il territorio”. Le parole più frequenti fanno intendere la volontà di sostenere il territorio del prosecco alla candidatura a patrimonio dell’Unesco, non mancano i riferimenti al paesaggio e alla sua bellezza.

 Topic 5: “Le dichiarazioni”. Il nome di tale topic viene dai numerosi riferimenti alle discussioni televisive, agli articoli, ai brani dove si discute sul prosecco. Si identifica perciò il lato “media” del prosecco.

 Topic 6: “I festeggiamenti”. Si tratta di parole riferite a festeggiamenti, ad occasioni e vari momenti di relax e svago dove si è accompagnati da un bicchiere di prosecco.

112 Figura 4.23: Le parole più frequenti dei topic considerati

Vediamo i primi 7 termini di ogni topic: term <- terms(model_testi, 7)

term<-apply(term, MARGIN=2, paste, collapse=”,”)

Topic 1 “La tipologia di vino”

"prosecco,doc,vini,biologico,bio,toscana,maremma"

Topic 2 “Il prodotto”

"prosecco,doc,docg,valdobbiaden,schipisommeli,sempr,franciacorta"

Topic 3 “Il paesaggio e le emozioni”

"coneglianovaldobbiaden,prosecco,ancora,stradadelprosecco,autunno,emozioni, regala"

Topic 4 “Il territorio”

113

Topic 5 “Le dichiarazioni” "prosecco,report,terr,vini,lunedi,torna,brano"

Topic 6 “I festeggiamenti”

"prosecco,doc,uprosecco,poco,anni,bellissima,organ"

Per identificare il topic associato a ciascun documento (tweet) utilizziamo la seguente funzione e riportiamo i primi 20:

topics<-topics(model_testi) topics[1:20]

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 3 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 3 6

Vediamo ora nel dettaglio per ciascun topic un numero di 5 tweet associati. In Tabella 4.18 riportiamo nella prima colonna il topic di riferimento, seguito dal testo del tweet e da un commento sull’associazione che è stata assegnata dal metodo.

Tabella 4.18: Alcune associazioni tra topic e tweet

TOPIC TEXT NOTE

1 - “La tipologia di

vino”

#MeranoWineFestival: degustate e votate il nostro #Cartizze #DOCG #Dry al banco d'assaggio #EnotecaItalia

Si parla di una determinata tipologia di vino in particolare di un determinato tipo di prosecco: il “Cartizze”.

RT@TwitItalianWine:#PoggioLaLuna #vini della #Maremma Toscana #DOC #bio#biologico@poggiolaluna#Scansano

Si riferimento ad un vino Toscano, non è in questo caso riferito al prosecco ma è correttamente presente all’interno del topic di riferimento.

RT@TurismoVeneto: #LoSapevate che il #ChiarettoDiBardolino e da poco diventato una #DOC autonoma?

Si può considerare la stessa osservazione fatta per il tweet precedente.

114

RT@TwitItalianWine: Una selezione di Vini@IlPalagio: #Vernaccia #Morellino #Brunello #Arnolfo #Chianti #Prosecco

Si fa riferimento a più tipologie di vino, di cui prende parte anche il prosecco.

#BisolMilano e la #LaCucinaItaliana

Un #prosecco #Crede (Creta) apre la serata#vino #cibo

Si tratta di un tweet sul prosecco, in cui viene riportato anche il riferimento ad una cantina.

2 - “Il prodotto”

Anche il #Tanore #Proseccosuperiore #DOCG #Brut sara presente al brindisi nella #SETTIMANA DELLA #CUCINAITALIANA

In questo tweet il prosecco è l’oggetto dell’evento di riferimento, perciò si può intendere il riferimento al prosecco come prodotto.

Con l'annata 2017 ci sara un grande cambiamento: #PinotGrigio delle Venezie IGT diventera Pinot Grigio delle Venezia

Si fa riferimento al vino Pinot Grigio inteso come prodotto che cambia la sua dednominazione.

Grande edizione

questo@MeranoWineFest! E per noi e stato un onore far conoscere l'#identita del nostro #territorio

Si parla del prosecco come prodotto ed identità del territorio.

RT@VillaSandi_it: Discover #VillaSandi Valdobbiadene #ProseccoSuperiore DOCG Millesimato@Decanter_Events Fine Wine Encounter #London@

Anche in questo caso si fa riferimento al prosecco come oggetto dell’evento di cui si parla. Infatti il prosecco è il prodotto principale.

RT@ViniLaDelizia: MILLESIMATO - Il #Prosecco #Doc d'eccellenza della linea #Naonis #Collection per i vostri brindisi piu importanti. #wine

Si parla del prosecco come ottimo prodotto da utilizzare in occasione di brindisi importanti.

RT@emanueleo73: Morbido e fruttato, caldo e complesso questo #cru #Cavagino #CollidiLuni #Vermentino in purezza #Lunae@CantineLunae #doc

Si fa riferimento sia al prodotto che al paesaggio, ma lo troviamo in questo topic.

115 3 - “Il paesaggio e le emozioni”

Sulle colline del #barolo e del #barbaresco. #wine #hill #barolo #docg #serralunga

Fa riferimento alle colline del vino Barolo ed anche se non è il prosecco è parte del nostro topic proprio per il riferimento al paesaggio.

Si avvicinano le #feste! Hai gia pensato al #Prosecco per i tuoi cesti natalizi? Prova l'#Asolo Prosecco Superior

Il tweet riportato è parte del topic sul paesaggio e le emozioni, ma in questo caso è più riferito alle emozioni delle feste natalizie. Le incredibili #atmosfere, le nebbioline,

che sfumano i #colori in pastello, i #profumi che pervadono ogni cosa

Tale tweet centra in pieno il tema del topic perché riporta le caratteristiche del paesaggio e lascia intendere la sua bellezza. RT@lucazaiafans: TurismoVeneto:

L’autunno regala ancora emozioni #StradadelProsecco

#ConeglianoValdobbiadene

Si parla delle emozioni che regala il paesaggio della zona del prosecco, in particolare della Strada del Prosecco.

4 - “Il territorio”

RT@TurismoVeneto: Questo paesaggio e una simbiosi perfetta tra uomo e natura, non trovate? #StradaDelProsecco #ConeglianoValdobbiadene

Si fa riferimento al paesaggio che si può vedere visitando il territorio del prosecco, con particolare riferimento alla Strada del Prosecco.

Discover #VillaSandi Valdobbiadene

#ProseccoSuperiore DOCG

Millesimato@Decanter_Events Fine Wine Encounter #London

Il tweet riporta la zona di Valdobbiadene e una determinata cantina.

Perle nella Marca trevigiana #VittorioVeneto #MulinettodelleCroda #Veneto #sopacoada #prosecco

Si parla del territorio della zona del Prosecco, con particolare riferimento alla zona di Vittorio Veneto.

116

RT @myvinespot: @Degliultimi Conegliano Valdobbiadene Prosecco Superiore DOCG Brut Rive di... #wine #Prosecco #myvinespot

Anche qui il riferimento è alla particolare zona di Conegliano Valdobbiadene.

RT @ItalyMFA: #Diplomazia e anche sostenere la candidatura delle Colline del #Prosecco Superiore di Conegliano Valdobbiadene a patrimonio unesco

Si fa riferimento al sostenimento del territorio nella sua candidatura a patrimonio dell’Unesco. 5 - “Le dichiarazio ni”

Eccoci a presentare il #prosecco a VinAfrica presso l’ambasciata di Accra in Ghana.

Si fa riferimento ad un evento in cui si presenterà il prosecco.

RT@AsoloMontello: Una mostra per scoprire le Identita #Prosecco #AsoloProsecco@TurismoVeneto@Pros eccoCV@DOCProsecco@Foodeconomy 24

Il tweet parla della mostra in cui si scoprirà l’identità del prosecco.

A #Natale brinda con@folladorwines aiuta la #ricerca #ControLaSLA #prosecco #valdobbiadene #millesimato #brut

Anche in questo caso il prosecco è associato ad un particolare evento.

@reportrai3 perche non vi occupate anche della #Pedemontana Veneta? Altro che #prosecco. Una vostra indagine forse

Il tweet riporta un commento su una particolare puntata di report su rai tre in cui si è discusso sul prosecco.

#report se le autorita non intervengono a limitare l'uso dei #pesticidi poi possono succedere fatti spiacevoli

Si riporta qui un commento diverso alla puntata di report, ma si tratta sempre di una dichiarazione sul prosecco. Secondo giorno al #MeranoWineFestival

giornata molto interessante ed intensa, e bello esserci!raccontare ai winelov

Si fa riferimento ad un evento in cui è stato protagonista il vino.

117

6 - “I festeggiam

enti”

RT@emanueleo73: Una #bonarda frizzante di 3 anni? Profumi, aromi complessi, medio corpo, equilibrato... #DOC #wine #oltrePO@Vivino

In questo caso non si riesce chiaramente ad individuare un certo tipo di festeggiamento, ma lascia intendere un occasione generica.

RT@donnedelvino: Un brindisi delle@DonneDelVinoFvg #Friuli alla prima di Finche c'e #Prosecco c'e speranza

Qui è invece molto chiaro il riferimento ad un brindisi con il prosecco.

Ma una bottiglia di #prosecco come bomboniera?

Non capisco.

#ilcastellodellecerimonie

Tale tweet ha una nota negativa e si parla del prosecco come idea per una bomboniera in occasione di un festeggiamento.

#prosecco #before #best #italian #meal #celebrating #future #marriage pastinatrattoria #prosecco

Il prosecco è parte di un festeggiamento, o meglio di un matrimonio.

In Tabella 4.19 e successivamente in Figura 4.24 riportiamo la numerosità dei topic. Il topic maggiormente rappresentato è il numero “5 – Le dichiarazioni”, mentre il meno rappresentato è il numero 6 (“I festeggiamenti”). In generale, possiamo notare come ogni topic è rappresentato da un numero più o meno simile di tweet e nessuno spicca rispetto agli altri.

Tabella 4.19: Numerosità dei topic

Topic Sum of text 1 180 2 174 3 194 4 192 5 204 6 162

118

Figura 4.24: Rappresentazione grafica della numerosità dei topic