• Non ci sono risultati.

5. ANALISI DEI TWEETS CHE HANNO GENERATO ANOMALIE

5.2. Ipotesi 2: cashtags in un tweet a capitalizzazione variabile

5.2.2. Capitalizzazioni vs volume delle anomalie

Per approfondire il fenomeno ci si è concentrati sul confronto tra capitalizzazione di un cashtag e volume delle anomalie (altezza dei picchi) in cui occorre.

L’idea parte dal fatto che intuitivamente ci si aspetta un andamento nel volume dei tweets per cui se un cashtag è importante e ad alta capitalizzazione genererà più discussione e quindi comparirà in picchi molto alti, mentre se un cashtag non è famoso allora i suoi picchi saranno bassi, poiché non vi saranno tante discussioni virtuali al riguardo.

Per verificare questa tesi si è scelto di realizzare degli scatterplot come mostrati in Figura 5.5.

Figura 5.5. Capitalizzazione dei cashtags

rispetto alla mediana delle altezze dei picchi in cui occorrono

NASDAQ NYSE

NYSEARCA NYSEMKT

Ogni punto del grafico è un cashtag. Il colore rappresenta il mercato di appartenenza del cashtag. L’asse x rappresenta la mediana delle altezze dei picchi in cui occorre un cashtag, mentre sulle y la sua capitalizzazione.

Ciò che viene evidenziato dai grafici è che i cashtags del mercato OTCMKTS hanno effettivamente una capitalizzazione molto bassa, occupando la zona meridionale del grafico. Tuttavia hanno una mediana delle altezze dei picchi in cui occorrono molto alta, simile ai cashtags ad alta capitalizzazione. Tale fatto è contro-intuitivo rispetto all’andamento che era stato previsto: nei picchi alti si nota la presenza cashtags importanti, ma anche di cashtags a bassa capitalizzazione.

Il passo seguente applica una Kernel Density Estimation. Tale metodo si basa sul computo del numero di eventi del pattern che ricadono in un insieme di celle di dimensione quadrata, che discretezza la regione di studio. La Kernel density Estimation si basa sul concetto di associare una densità ad ogni punto dello spazio e non soltanto ai punti in cui avviene l’evento. La densità viene stimata contando il numero di eventi in una regione, detta kernel, centrata in corrispondenza del punto dove si vuole effettuare la stima [56].

Presa una porzione di grafico rappresentativa, la Figura 5.6 evidenzia bene il fenomeno: se si porziona il grafico in quattro regioni si nota in maniera evidente che i titoli a bassa capitalizzazione in OTCMKTS tendono ad essere discussi su Twitter e a manifestarsi in picchi molto alti.

Figura 5.6. Kernel Density Estimation della capitalizzazione dei cashtags rispetto alla mediana delle altezze dei picchi in cui occorrono

(mediana come da legenda)

È interessante notare che i picchi sono stati rilevati dalle serie storiche dei cashtags monitorati, di cui i titoli di OTCMKTS non fanno parte. Tuttavia nei tweets che generano anomalie compaiono anche i cashtags OTC. Ciò significa che tali titoli compaiono sempre in concomitanza con almeno un altro cashtag monitorato ad alta capitalizzazione nei tweets che sono stati retweettati tante volte da realizzare un picco anomalo.

Questo è a sostegno dell’ipotesi iniziale che i cashtags small caps cavalchino l’onda di popolarità dei cashtags large caps. Il passo successivo consiste nel chiedersi: è possibile che siano i titoli OTCMKTS a “tirare” con la loro popolarità gli altri cashtags? Esistono picchi i cui tweets contengono solo un cashtag di OTCMKTS? Questo per capire se un cashtag a bassa capitalizzazione che non viene citato insieme ad altri cashtag è capace di generare una discussione tale da realizzare picchi altrettanto alti nella sua serie storica.

NASDAQ NYSE NYSEARCA NYSEMKT OTCMKTS 103 103 103 101 101 102 102 102 102 101 102 101 101 103 103

Per rispondere a queste domande è necessaria la serie storica dei cashtags di OTCMKTS di cui non si dispone poiché non sono stati monitorati.

Per avere almeno una statistica al riguardo è stata quindi impostata una ulteriore raccolta dati su Twitter tramite Search API di una settimana, in cui sono stati raccolti i tweets di un campione di cashtags OTCMKTS.

Sono stati raccolti l’equivalente di 5 milioni di tweets dal 25 giugno al 2 luglio e sono state ri effettuate le analisi basate su serie storiche come descritte nel Sezione 4.1.

Come mostrato nella Figura 5.7, se si considerano i tweets raccolti che contengono esattamente un cashtag OTCMKTS, non si rilevano picchi nel periodo considerato che si discostano 10 volte la deviazione standard dalla media. Ciò va a sostegno dell’ipotesi iniziale, cioè che se un cashtag OTCMKTS appare in un picco per come è stato definito è grazie alla visibilità che ottiene dalla presenza, nello stesso tweet, di un cashtag più importante.

Figura 5.7. Cashtags di cui si rileva almeno un picco cambiando θ

Se si rilassa il vincolo a 7 volte la deviazione standard dalla media, è possibile trovare dei picchi più bassi. Per queste anomalie è interessante notare i tweets che le realizzano grazie alle loro ri condivisioni, mostrati nelle Figure 5.8 e 5.9.

Figura 5.8. Esempio di tweet con un solo cashtag OTCMKT che genera anomalia in presenza del trend “Rihanna”

Figura 5.9. Esempio di tweet con un solo cashtag OTCMKT che genera anomalia in presenza del trend “Trump”

Le figure mostrano che, nonostante il cashtag compaia senza la presenza di altri cashtags che lo aiutano ad ottenere visibilità, si ritrova comunque lo stesso principio: il cashtag si aggancia ad una news o a un trend molto popolare e scorrelato dal cashtag (Rihanna, Trump, ecc) per riscuotere engagement e amplificare la sua visibilità all’interno della sezione di ricerca.

Questo fenomeno avvalora la tesi iniziale: la strategia di base consiste nel dare visibilità a un cashtag di OTCMKTS in diversi modi: sfruttando dei trend oppure

appoggiandosi ad altri cashtags più noti, il “veicolo” che va per la maggiore. Nel primo caso il titolo si fa pubblicità generica; nel secondo caso si fa pubblicità ad un’audience che è interessata a quella particolare tematica perché è più probabile che gli osservatori di finanza siano in “ascolto” delle discussioni che avvengono intorno a titoli famosi.

Questa pratica potrebbe rivelare la presenza di bots dediti all’attuazione di tale strategia speculativa.

In ultima fase sono stati analizzati quindi gli utenti che hanno realizzato tali anomalie al fine di individuare spambots.

6. ANALISI DEGLI UTENTI CHE HANNO

Documenti correlati