• Non ci sono risultati.

3.4 Statistiche aggiuntive

3.4.2 Distribuzione oraria di post e commenti

Successivamente al calcolo del numero di commenti per ogni post, ci si `e chie- sti quando, nell’orizzonte temporale, vengano prodotti il maggior numero di post e commenti all’interno di Facebook. Questo tipo di dato, oltre che dal punto di vi- sta analitico, pu`o essere molto interessante anche da un punto di vista strettamente commerciale. Difatti, conoscere i momenti di maggiore attivit`a per gli utenti del social network pu`o portare a una migliore gestione del contenuto, come ad esempio la possibilit`a di effettuare una programmazione accurata riguardo la pubblicazione dei post pi`u importanti, es. le notizie pi`u rilevanti della giornata, in orari di punta nei quali ci sono maggiori possibilit`a di ottenere maggior visibilit`a e riscontro da parte della rete.

Si `e quindi deciso di visualizzare graficamente la quantit`a di contenuti di tipo post e di tipo commento in base al loro orario di pubblicazione.

Per fare ci`o, sono stati considerati tutti i post e tutti i commenti presenti nel corpus. Per ognuno di essi `e stato salvato l’orario di pubblicazione, e successivamente questi sono stati aggregati proprio in base all’ora in cui sono stati pubblicati.

Per quanto riguarda il numero di post per ogni ora, i risultati sono mostrati in Figura 3.4.

Come si pu`o notare dal grafico, `e presente una distribuzione alquanto particolare. Sono prodotti un maggior numero di post nelle ore centrali della giornata, mentre durante la notte il numero cala drasticamente. Il picco massimo si pu`o osservare intorno alle ore 11, seguito da un leggero ma evidente calo durante le ore del pranzo, per poi ritornare a elevarsi in frequenza durante le prime ore del pomeriggio. `E inte- ressante notare tuttavia come la distribuzione sia leggermente differente per quanto riguarda le prime ore del giorno rispetto alle ultime ore del pomeriggio e della se- ra, i due momenti in cui `e evidente rispettivamente una crescita e una decrescita nel numero di post pubblicati. Mentre la crescita durante le prime ore del giorno, in par- ticolare tra le 04 e le 07 del mattino, `e rappresentata da una curva molto ripida, ci`o

Figura 3.4: Numero di post pubblicati ogni ora

non pu`o essere affermato per quanto riguarda il calo nella produzione osservato dal tardo pomeriggio, mostrato con una forma pi`u morbida nella parte destra del grafico.

Questa differenza osservata pu`o essere causata da alcuni fattori. Sicuramente `

e da tenere conto che, mentre nelle ore pi`u tarde della notte l’attivit`a sul social `e drasticamente pi`u bassa, poich´e la maggior parte delle persone dorme, questo pu`o non essere vero nel tardo pomeriggio e nelle prime ore della sera, momenti in cui gran parte delle persone si rilassano ed eventualmente si tengono in contatto con i propri amici attraverso la rete. Inoltre, essendo presi in considerazione in questo caso i post pubblicati da pagine che rappresentano quotidiani nazionali, `e chiaro come le prime ore del mattino siano il momento in cui una gran parte dell’informazione viene prodotta e fruita dalle persone. Si tratta infatti dei momenti in cui le redazioni preparano le notizie del giorno.

Anche allo scopo di validare queste ipotesi, `e stato prodotto il grafico che rap- presenta invece il numero di commenti pubblicati durante la giornata, mostrato in Figura 3.5. Si pu`o chiaramente notare quanto la situazione mostrata sia del tutto simile a quella vista nel caso dei post, con tuttavia alcune differenze degne di nota.

Figura 3.5: Numero di post pubblicati ogni ora

Innanzitutto, Si pu`o notare come la curva sia pi`u morbida da entrambi i lati, senza la presenza di una salita ripida nelle prime ore del mattino come mostrato per i post pubblicati. Inoltre si nota come, generalmente, i picchi e le valli della curva siano in questo caso spostate di circa due ore, sia nella parte centrale della giornata che durante le ore della notte. Ciononostante, come gi`a accennato, la forma della distribuzione all’interno della giornata rimane decisamente molto simile tra post e commenti, come testimoniato da Figura 3.6, dove le due distribuzioni sono state messe a confronto.

Dalla visione comparata delle due distribuzioni `e assolutamente evidente come le stesse siano estremamente simili per andamento generale, fatta eccezione per le prime ore del mattino, dove sembra che il numero di post pubblicati salga pi`u rapidamente rispetto al numero di commenti. Va comunque fatto notare come le due distribuzioni siano di ordini di grandezza totalmente differenti, ed `e stata infatti usata una scala differente per ognuna delle distribuzioni per poterle visualizzare insieme nel grafico. L’immagine `e stata infatti creata semplicemente con lo scopo di mostrare quanto l’andamento giornaliero, sia per la produzione di post che per la produzione dei relativi commenti, fosse estremamente simile.

Figura 3.6: Numero di post e numero di commenti pubblicati ogni ora

In conclusione di questa rapida panoramica riguardante alcune dinamiche dei dati a nostra disposizione si pu`o quindi affermare quanto questo tipo di nozioni possano risultare estremamente utili, sia dal punto di vista teorico, per studiare l’andamento dell’attivit`a sul social, sia dal punto di vista pratico, in quanto pu`o essere di aiuto a editori e gestori di pagine Facebook per organizzare al meglio il contenuto da pubblicare durante la giornata.

Inoltre, si pu`o prendere consapevolezza di quanto risorse come quella creata siano al giorno d’oggi sempre pi`u importanti, sia dal punto di vista del Natural Language Processing, come `e stato fatto per la parte centrale del presente lavoro, sia per quanto riguarda l’analisi delle reti sociali e il comportamento degli utenti all’interno di esse.

La risorsa `e stata denominata FBNEWS-2015, e cos`ı come `e stata presentata, verr`a resa liberamente disponibile.

Nel presente caso con la risorsa `e stato creato uno spazio distribuzionale emotivo, che come mostrato nei capitoli successivi, `e stato applicato attraverso una serie di feature emotive estratte dal testo, in un classificatore volto ad individuare la polarit`a, positiva o negativa, di tweet.

Capitolo 4

Esperimenti

Una volta completato il lavoro di creazione del corpus, si `e proceduto a effettuare esperimenti volti a constatare se e quanto l’utilizzo di feature emotive potesse risul- tare di aiuto in un task di classificazione della polarit`a di documenti.

Per prima cosa quindi, `e stato creato uno spazio distribizionale emotivo a partire dal corpus ricavato da Facebook. In seguito, utilizzando come base di partenza lo spazio emotivo, sono state estratte le feature potenzialmente interessanti per l’addestramen- to del classificatore. Infine, sono stati eseguiti alcuni esperimenti per determinare la combinazione migliore di feature da utilizzare nel classificatore definitivo.

In questo capitolo verranno quindi esaminate le fasi del progetto sopra menzionate.

Documenti correlati