• Non ci sono risultati.

Bounded confidence, Stubborness e Peer Pressure: simulare l'adozione di fake news tramite modelli di opinion dynamics

N/A
N/A
Protected

Academic year: 2021

Condividi "Bounded confidence, Stubborness e Peer Pressure: simulare l'adozione di fake news tramite modelli di opinion dynamics"

Copied!
148
0
0

Testo completo

(1)

universit`a di Pisa

Dipartimento di informatica

Corso di Laurea Magistrale in Data Science and Business Informatics

TESI DI LAUREA

Bounded confidence, Stubborness e Peer Pressure:

simulare l’adozione di fake news tramite modelli di

opinion dynamics

RELATORI:

Prof. Giulio Rossetti

Dr.ssa Letizia Milli

CANDIDATO:

Cecilia Toccaceli

(2)
(3)

Sommario

Ogni giorno ognuno di noi `e esposto ad un flusso di informazioni e spesso, senza volerlo, entra in contatto con le cosiddette “fake news”. Queste portano le persone ad accettare bu-gie intenzionalmente proposte come verit`a, diffondendo disinformazione, fino ad arrivare a rappresentare una vera e propria minaccia per la democrazia, il giornalismo e la libert`a di espressione. La loro esplosione `e facilitata anche dall’ampia popolarit`a dei social media. Con questo lavoro si cerca di studiare come queste notizie si diffondono all’interno di un social network attraverso l’influenza reciproca degli individui. L’interazione dei vari utenti viene si-mulata usando due diversi approcci di opinion dynamics a confidenza limitata tramite il quale gli agenti interagiscono con i loro vicini aventi un’opinione pi`u simile alla loro e aggiornano le loro credenze tenendo conto sia della loro esperienza che di quella del vicinato. Durante l’interazione vengono considerati: la frequenza di interazione tra gli agenti, la similarit`a tra questi e la presenza di agenti “testardi” (coloro che non cambiano opinione). Per ciascun mo-dello valutiamo due diversi tipi d’interazione: una in gruppo, cio`e tra n individui, e una binaria. Quest’ultima prevede due diversi casi: nel primo i due agenti concordano su quanto stanno discutendo (le opinioni tendono ad avvicinarsi), nel secondo hanno opinioni divergenti (inte-razione con repulsione di opinioni). Tutte le versioni dei modelli sono state testate con diverse configurazioni dei parametri mostrando come all’aumentare degli agenti testardi e nel caso di interazione con repulsione di opinioni indipendentemente dalla topologia sottostante del grafo, vi sia una maggiore difficolt`a nel raggiungere una situazione di consenso. La stessa dif-ficolt`a si riflette quando come struttura del social network si assume un contesto pi`u realistico, con una popolazione divisa in comunit`a.

(4)
(5)

“Questo `e il tuo viaggio la tua vita la tua storia che non `e scritta nelle stelle e nel passato puoi disegnarla col dito sul vetro appannato scolpirla nella montagna legarla ad un aquilone” - Jovanotti

(6)
(7)

Indice

INTRODUZIONE 11

1 STATO DELL’ARTE 15

1.1 Fake news . . . 15

1.1.1 Caratterizzazione di fake news . . . 15

1.1.2 Studi nell’ambito delle fake news . . . 18

1.2 Social Networks . . . 22

1.2.1 Preliminari . . . 23

1.2.2 Modelli di rete . . . 28

1.2.3 Reti scale - free . . . 30

1.3 Opinion dynamics . . . 32

1.3.1 Modelli discreti . . . 33

1.3.2 Modelli continui . . . 36

2 I MODELLI 38 2.1 Interazione in gruppo . . . 39

2.1.1 Integrazione del peso sui collegamenti del social network . . . 39

2.1.2 Inserimento degli agenti “testardi” . . . 41

2.1.3 Similarit`a tra gli agenti . . . 43

2.2 Interazione in coppia . . . 45

2.2.1 Effetto attrattivo . . . 46

(8)

INDICE INDICE

3 ANALISI E RISULTATI 52

3.1 Organizzazione degli esperimenti . . . 52

3.2 Setting dei diversi modelli di rete . . . 54

3.3 Discussione dei risultati . . . 55

3.3.1 La versione in gruppo . . . 55

3.3.2 La versione binaria . . . 73

4 LFR: APPLICAZIONE ALLA REALT `A 96 4.1 LFR Benchmark . . . 96

4.2 Generazione e setting . . . 98

4.3 Discussione dei risultati . . . 101

4.3.1 WSSHkModel1- interazione in gruppo . . . 102

4.3.2 WSSHkModel1- interazione in coppia con effetto attrattivo . . . 106

4.3.3 WSSHkModel1- interazione in coppia con effetto repulsivo . . . 110

4.3.4 WSSHkModel2- interazione in gruppo . . . 117

4.3.5 WSSHkModel2- interazione in coppia con effetto attrattivo . . . 121

4.3.6 WSSHkModel2- interazione in coppia con effetto repulsivo . . . 129

5 CONCLUSIONI 135

(9)

Elenco delle figure

1.1 Esempio di fake news condivisa da un utente su Facebook . . . 17

1.2 Volume, velocit`a e veridicit`a di una fake news . . . 18

1.3 Comunit`a all’interno di un network . . . 26

1.4 Illustrazione dei diversi modelli di rete. Nella rete scale - free gli hub sono evidenziati di verde. . . 32

2.1 Tassonomia dei modelli con relative estensioni . . . 39

2.2 L’opinione xi `e influenzata dalle opinioni degli agenti in N. Al termine del-l’interazione xi si avvicina alle opinioni degli agenti con pesi maggiori. . . 41

2.3 Se l’agente i `e testardo allora la sua opinione non cambier`a, altrimenti si pro-cede applicando o la formula (2.1) o la (2.2). . . 43

2.4 Ad ogni agente `e assegnato il vettore di elementi binari rappresentanti i tratti della personalit`a. . . 45

2.5 Effetto attrattivo o repulsivo dell’interazione. . . 51

3.1 WSSHkModel1: rete completa . . . 56

3.2 WSSHkModel1: random network . . . 56

3.3 WSSHkModel1: scale - free network . . . 57

3.4 WSSHkModel1con testardi su opinioni positive: rete completa . . . 59

3.5 WSSHkModel1con testardi su opinioni positive: random network . . . 59

3.6 WSSHkModel1con testardi su opinioni positive: scale - free network . . . 60

3.7 WSSHkModel1con testardi su opinioni negative: rete completa . . . 60

(10)

ELENCO DELLE FIGURE ELENCO DELLE FIGURE

3.9 WSSHkModel1con testardi su opinioni negative: scale - free network . . . 61

3.10 WSSHkModel2: rete completa . . . 65

3.11 WSSHkModel2: random network . . . 65

3.12 WSSHkModel2: scale - free network . . . 66

3.13 WSSHkModel2con testardi su opinioni positive: rete completa . . . 68

3.14 WSSHkModel2con testardi su opinioni positive: random network . . . 68

3.15 WSSHkModel2con testardi su opinioni positive: scale - free network . . . 69

3.16 WSSHkModel2con testardi su opinioni negative: rete completa . . . 69

3.17 WSSHkModel2con testardi su opinioni negative: random network . . . 70

3.18 WSSHkModel2con testardi su opinioni negative: scale - free network . . . 70

3.19 WSSHkModel2, testardi su opinioni negative e similarit`a: random network . . 72

3.20 WSSHkModel2, testardi su opinioni positive e similarit`a: scale - free network . 73 3.21 WSSHkModel1in coppia - testardi con opinioni positive estreme: grafo completo 74 3.22 WSSHkModel1in coppia - testardi con opinioni positive estreme: random net-work . . . 74

3.23 WSSHkModel1 in coppia - testardi con opinioni positive estreme: scale - free network . . . 74

3.24 WSSHkModel1in coppia - testardi con opinioni negative estreme: grafo completo 75 3.25 WSSHkModel1 in coppia - testardi con opinioni negative estreme: random network . . . 75

3.26 WSSHkModel1in coppia - testardi con opinioni negative estreme: scale - free network . . . 75

3.27 WSSHkModel1 in coppia - testardi con opinioni positive intermedie: grafo completo . . . 76

3.28 WSSHkModel1 in coppia - testardi con opinioni positive intermedie: random network . . . 76

3.29 WSSHkModel1 in coppia testardi con opinioni positive intermedie: scale -free network . . . 76

3.30 WSSHkModel1 in coppia - testardi con opinioni negative intermedie: grafo completo . . . 77

(11)

ELENCO DELLE FIGURE ELENCO DELLE FIGURE

3.31 WSSHkModel1in coppia - testardi con opinioni negative intermedie: random

network . . . 77

3.32 WSSHkModel1 in coppia testardi con opinioni negative intermedie: scale

-free network . . . 77

3.33 WSSHkModel1repulsivo - testardi con opinioni positive estreme: random

net-work . . . 79

3.34 WSSHkModel1 repulsivo - testardi con opinioni positive estreme: scale - free

network . . . 79

3.35 WSSHkModel1 repulsivo - testardi con opinioni negative estreme: random

network . . . 80

3.36 WSSHkModel1repulsivo - testardi con opinioni negative estreme: scale - free

network . . . 80

3.37 WSSHkModel1 repulsivo - testardi con opinioni positive intermedie: random

network . . . 81

3.38 WSSHkModel1 repulsivo testardi con opinioni positive intermedie: scale

-free network . . . 81

3.39 WSSHkModel1repulsivo - testardi con opinioni negative intermedie: random

network . . . 82

3.40 WSSHkModel1 repulsivo testardi con opinioni negative intermedie: scale

-free network . . . 82

3.41 WSSHkModel2in coppia - testardi con opinioni positive estreme: grafo completo 84

3.42 WSSHkModel2in coppia - testardi con opinioni positive estreme: random

net-work . . . 84

3.43 WSSHkModel2 in coppia - testardi con opinioni positive estreme: scale - free

network . . . 84

3.44 WSSHkModel2in coppia - testardi con opinioni negative estreme: grafo completo 85

3.45 WSSHkModel2 in coppia - testardi con opinioni negative estreme: random

network . . . 85

3.46 WSSHkModel2in coppia - testardi con opinioni negative estreme: scale - free

(12)

ELENCO DELLE FIGURE ELENCO DELLE FIGURE

3.47 WSSHkModel2 in coppia - testardi con opinioni positive intermedie: grafo

completo . . . 86

3.48 WSSHkModel2 in coppia - testardi con opinioni positive intermedie: random network . . . 86

3.49 WSSHkModel2 in coppia testardi con opinioni positive intermedie: scale -free network . . . 86

3.50 WSSHkModel2 in coppia - testardi con opinioni negative intermedie: grafo completo . . . 87

3.51 WSSHkModel2in coppia - testardi con opinioni negative intermedie: random network . . . 87

3.52 WSSHkModel2 in coppia testardi con opinioni negative intermedie: scale -free network . . . 87

3.53 WSSHkModel2in coppia - caso base: grafo completo . . . 89

3.54 WSSHkModel2in coppia - caso base: random network . . . 89

3.55 WSSHkModel2in coppia - caso base: scale - free network . . . 89

3.56 WSSHkModel2repulsivo - testardi con opinioni positive estreme: random net-work . . . 90

3.57 WSSHkModel2 repulsivo - testardi con opinioni positive estreme: scale - free network . . . 91

3.58 WSSHkModel2 repulsivo - testardi con opinioni negative estreme: random network . . . 92

3.59 WSSHkModel2repulsivo - testardi con opinioni negative estreme: scale - free network . . . 93

3.60 WSSHkModel2repulsivo, caso base: random network . . . 95

3.61 WSSHkModel2repulsivo, caso base: scale - free network . . . 95

4.1 LFR: 300 nodi e 4 comunit`a . . . 99

4.2 LFR modificata per configurazione C . . . 101

4.3 Animazione: WSSHkModel1in gruppo - configurazione B . . . 104

(13)

ELENCO DELLE FIGURE ELENCO DELLE FIGURE

4.5 WSSHkModel1in coppia - configurazione A. . . 107

4.6 WSSHkModel1in coppia - configurazione B. . . 108

4.7 WSSHkModel1in coppia - configurazione C. . . 109

4.8 WSSHkModel1in coppia con repulsione - configurazione A: gli agenti testardi

sono distribuiti casualmente. . . 110

4.9 Animazione: WSSHkModel1in coppia con repulsione - configurazione A. . . . 112

4.10 Animazione per caso 1: WSSHkModel1 in coppia con repulsione -

configura-zione B. . . 113

4.11 Animazione per caso 2: WSSHkModel1 in coppia con repulsione -

configura-zione B. . . 114

4.12 Animazione: WSSHkModel1in coppia con repulsione - configurazione C. . . . 116

4.13 WSSHkModel2in gruppo - configurazione A. . . 118

4.14 Animazione: WSSHkModel2in gruppo - configurazione B distribuzione finale

delle opinioni. . . 119

4.15 WSSHkModel2 in gruppo - configurazione B: plot con community 3 con

opi-nioni differenziate. . . 120

4.16 WSSHkModel2in coppia - configurazione A. . . 121

4.17 Animazione e plot: WSSHkModel2 in coppia - configurazione A con testardi

con opinioni positive estreme. . . 122

4.18 Animazione: WSSHkModel2in coppia - configurazione B. . . 124

4.19 Animazione caso 1: WSSHkModel2in coppia - configurazione C con  = 0.65. 126

4.20 Animazione caso 2: WSSHkModel2in coppia - configurazione C con  = 0.85. 127

4.21 WSSHkModel2in coppia - configurazione C con community 0 differenziata. . 128

4.22 WSSHkModel2in coppia - configurazione C con community 2 differenziata. . 128

4.23 WSSHkModel2in coppia - configurazione C con community 3 differenziata. . 129

4.24 WSSHkModel2in coppia con repulsione - configurazione A. . . 131

4.25 WSSHkModel2in coppia con repulsione - configurazione B con  = 0.85. . . . 132

(14)

INTRODUZIONE

L’informazione `e da sempre un campo delicato, che pu`o creare timore nelle persone. Questo `e dovuto al fatto che da una parte c’`e la necessit`a di sapere cosa sta accadendo e perch`e, men-tre dall’altra vi `e la consapevolezza di imbattersi in una rappresentazione vaga ed ingannevole della realt`a. Spesso infatti una notizia pu`o apparire come oggettiva, ma non esserlo interamen-te. Al giorno d’oggi risulta ancora pi`u complicato assicurarsi della veridicit`a di una notizia in quanto si sta assistendo alla propagazione delle fake news.

In senso lato il concetto di “fake news” esiste da secoli ed esse non sono da considerarsi un nuovo fenomeno. In merito, uno degli esempi storici `e quello avvenuto nei primi dell’800 a Londra, dove si diffuse la voce che Napoleone fosse stato ucciso per mano dei cosacchi. Nono-stante la mancanza di conferme ufficiali, all’apertura della Borsa, piccoli e grandi azionisti si precipitarono a investire contando sul fatto che il tiranno francese fosse defunto e che i Bor-boni fossero tornati sul trono. I titoli di stato decollarono ma appena fu chiaro che era tutto un’invenzione si verific`o un forte ribasso, facendo vivere brutti momenti agli azionisti londi-nesi.

Ci`o che sta diventando particolarmente rilevante in questo momento `e per`o capire il perch`e le fake news stiano sempre pi`u attirando l’attenzione del pubblico, diventando argomento di interesse mondiale.

Una delle possibili cause `e sicuramente riconducibile all’ascesa dei social media e della loro popolarit`a nella societ`a odierna. I social media sono diventati un mezzo importante per la condivisione e comunicazione di informazioni su larga scala, non solo in tutte le professioni ma in ogni aspetto della vita. Tramite queste piattaforme, le fake news possono essere create e pubblicate online in modo pi`u rapido ed economico rispetto ai media tradizionali come gior-nali e televisione ed inoltre, cos`ı facendo, si infrange la barriera della distanza tra le persone,

(15)

INTRODUZIONE

consentendo di condividere, inoltrare e incoraggiare gli utenti a partecipare alla discussione di notizie online.

Una notizia falsa che appare su un social network in genere contiene delle affermazioni sul mondo che sono di fatto sbagliate, ma non palesemente, in modo tale da creare qualche incer-tezza sulla sua veridicit`a. Inoltre, nei social media quando un post `e accompagnato da molti “Mi piace”, condivisioni o commenti, `e pi`u probabile che attiri l’attenzione di altre persone, e quindi `e pi`u probabile che sia pi`u gradito, ri-condiviso o commentato, portando quel po-st a un elevato numero di visualizzazioni. La popolarit`a sui social media `e quindi un ciclo auto-vivacizzante che ben si presta alla propagazione di informazioni non verificate. Questo di conseguenza porta le persone a poter accettare bugie propinate come verit`a, cos`ı come a cambiare la loro percezione delle notizie legittime e, nei peggiori dei casi, la prevalenza di fake news ha il potenziale per rompere l’affidabilit`a dell’intero ecosistema di notizie. Questa impennata di attivit`a attorno alle notizie online pu`o portare a gravi ripercussioni, ma anche a potenziali benefici politici ed economici. Tali vantaggi generosi incoraggiano le entit`a maligne a creare, pubblicare e diffondere notizie false.

Le fake news sono ora viste come una delle principali minacce alla democrazia, al giornalismo e alla libert`a di espressione. La loro diffusione ha indebolito la fiducia della popolazione nei confronti dei governi: si pensi all’impatto ancora da quantificare che le fake news hanno avu-to sul referendum sulla “Brexit” e sulle elezioni presidenziali statunitensi del 2016. Neanche le nostre economie sono immuni alla diffusione di queste notizie, con fake news collegate a fluttuazioni del mercato azionario e scambi commerciali di massa.

Intanto, contemporaneamente alla diffusione di fake news e delle concernenti preoccupazioni, negli ultimi anni c’`e stato un crescente interesse su questo argomento, con approcci e tecniche interdisciplinari emergenti. Diverse pubblicazioni si sono concentrate sullo studio della pro-pagazione delle notizie false, sull’analisi delle caratteristiche di queste notizie e sulla proposta di modelli di diffusione. Molti altri studi sono focalizzati sulla creazione di classificatori per rilevare contenuti o account falsi, evidenziando pattern ricorrenti. Da un punto di vista psico-logico, sono state proposte diverse teorie per limitare la diffusione di bufale, identificando gli utenti pi`u influenti o lavorando su bias e credenze personali.

(16)

stu-INTRODUZIONE

diare l’impatto che la diffusione di una fake news pu`o avere all’interno di un social network. Si propongono due diversi approcci per simulare il diffondersi di una fake news nella realt`a, attraverso un processo di Opinion Dynamics. Gli approcci sviluppati pongono le proprie basi in un modello gi`a esistente in letteratura. Attraverso di essi si descrive il propagarsi di una notizia sui social media come una complessa diffusione in un social network. Ci`o significa che intendiamo un social network come un numero di nodi collegati, rappresentanti gli individui, e a ciascuno di essi `e assegnata una soglia e uno stato iniziale. Quest’ultimo corrisponde all’o-pinione dell’individuo, mentre la soglia indica la propensione del singolo agente a comunicare con i suoi vicini. Gli agenti possono cambiare la propria opinione nel tempo, in base all’inte-razione con il vicinato e a diverse regole di aggiornamento, ovvero dei criteri che determinano le conseguenti modifiche di opinione. Per ciascun approccio si ha un modello corrispondente che permette di simulare un’interazione tra N agenti e un altro modello per un’interazione binaria, che a sua volta prevede due diversi casi. Il primo considera un effetto attrattivo tra i soggetti interagenti: i due al termine della loro discussione sono riusciti a convincersi e ad accordarsi sull’argomento trattato e cos`ı le loro opinioni tenderanno a convergere. L’altro `e il caso opposto in cui i soggetti hanno opinioni contrastanti e terminata la comunicazione en-trambi rimarranno fermi nella propria convinzione, portando ancor pi`u la propria opinione ad allontanarsi da quella dell’altro. Alle versioni dei modelli vengono inoltre integrate la parte-cipazione di agenti testardi - coloro che non cambiano opinione nel tempo - e la somiglianza caratteriale tra gli individui. Diverse simulazioni vengono effettuate al variare dei parametri di input e al variare della presenza di testardi sulle topologie di rete standard, dimostrando come si possano raggiungere diversi scenari. In alcune circostanze, maggiore `e la presenza di individui testardi e pi`u sembra difficoltoso il raggiungimento del consenso. La stessa difficolt`a si osserva nel caso binario e ancor pi`u quando questo prevede una repulsione.

Per valutare l’applicazione dei modelli su uno scenario approssimativo del mondo reale, le di-verse versioni sono state successivamente testate su un LFR benchmark. Anche in questo caso l’evoluzione dell’opinione `e stata esaminata attraverso diverse simulazioni effettuate cambian-do le configurazioni della rete e dei parametri. Come ci si aspettava in un contesto realistico conseguire il consenso `e ancora pi`u arduo.

(17)

INTRODUZIONE

La tesi `e organizzata come segue:

• Nel capitolo 1 si presenta una breve rassegna della letteratura, vengono caratterizzate le fake news e i principali lavori al riguardo. Vengono introdotte le nozioni fondamentali di Social Network Analysis necessarie ai fini di questo lavoro e dettagliati i modelli pi`u conosciuti di opinion dynamics.

• Il capitolo 2 delinea il quadro formale dei modelli in cui si presentano i due diversi approcci con relative estensioni e formule di aggiornamento.

• Nel capitolo 3 si studia l’effetto che l’applicazione delle diverse versioni produce su modelli di rete con caratteristiche standard.

• Nel capitolo 4 vengono analizzate e commentate le simulazioni ottenute dal testing dei modelli su una rete generata tramite l’LFR.

(18)

Capitolo 1

STATO DELL’ARTE

Questo capitolo `e suddiviso in quattro sottocapitoli in cui viene presentata la revisione della letteratura. In primo luogo si cerca di caratterizzare le fake news, poi vengono introdotti i principali ambiti di studio per l’analisi di queste notizie. Successivamente viene fornita una panoramica generale della teoria relativa ai social networks, rivolgendo particolare attenzione alle strutture di rete che vengono utilizzate ai fini di questo lavoro. Infine vengono descritti i principali metodi di opinion dynamics presenti in letteratura.

1.1

Fake news

1.1.1

Caratterizzazione di fake news

Prima di procedere all’illustrazione dei principali studi presenti in letteratura sul tema delle fake news, `e opportuno definire il termine stesso in quanto una definizione chiara e accurata pu`o essere utile per stabilire delle basi appropriate per l’analisi di fake news e valutare gli studi correlati.

Non esiste una definizione universale di fake news ma in letteratura si trovano diverse spiega-zioni e tassonomie: in [AG17] le fake news sono considerate come “articoli di notizie che sono intenzionalmente e verificabilmente falsi e potrebbero fuorviare i lettori”, invece in [Laz+18] esse vengono definite come “informazioni inventate che imitano il contenuto dei media nella forma, ma senza le norme e i processi editoriali dei media che garantiscono l’accuratezza e

(19)

1.1. FAKE NEWS CAPITOLO 1. STATO DELL’ARTE

la credibilit`a delle informazioni”. In [ZG20] le fake news vengono definite come “tutti i tipi di storie false o notizie che sono principalmente pubblicate e distribuite su Internet, al fine di fuorviare intenzionalmente, ingannare o attirare lettori per scopi finanziari, politici o guadagni di altro tipo”. In quest’ultimo lavoro vengono dettagliati anche quelli che sono i componenti di una fake news online:

• Creatore / Diffusore: i creatori di fake news online possono essere sia umani che non umani, come bots o cyborgs. A loro volta, quelli umani possono essere sia autori che pubblicano involontariamente notizie false sia utenti malintenzionati che creano volon-tariamente informazioni false.

• Vittime: coloro che cadono nell’inganno delle fake news. Possono essere utenti di social media o di altre piattaforme di notizie online e in base allo scopo della notizia possono essere studenti, elettori, anziani e cos`ı via.

• Contenuto della notizia: si riferisce al corpo della stessa. Si intende sia il contenuto fisico, per esempio titolo, testo del corpo, multimedia, ma anche quello non fisico come lo scopo e gli argomenti trattati.

• Contesto sociale: indica come le notizie vengono distribuite attraverso Internet. Esso comprende sia l’analisi della rete di utenti, ovvero in che modo gli utenti sono coinvolti nelle notizie, sia l’analisi del modello di trasmissione.

Nella figura 1.1 viene mostrata una fake news comparsa su Facebook negli anni passati. La fo-tografia che appare `e stata pubblicata sul social media per screditare Laura Boldrini, una delle principali figure politiche italiane di quei tempi. Il post in questione mostra la foto di un’attrice americana, Krysten Ritter, spacciandola per la sorella della Boldrini e sostenendo che la stessa gestiva cooperative di assistenza ai migranti. Nell’immagine A, B, C, D rappresentano rispet-tivamente il creatore della notizia, il contesto sociale, il contenuto e le vittime. Per contesto sociale si intende tutte le interazioni tra gli utenti e la fake news, quindi commenti, reazioni o condivisioni del post. Le vittime invece sono quegli utenti che entrano in contatto con la notizia attraverso i metodi sopra menzionati.

(20)

1.1. FAKE NEWS CAPITOLO 1. STATO DELL’ARTE

Figura 1.1: Esempio di fake news condivisa da un utente su Facebook

Inoltre, come riportato in [ZZ18], spesso in molti studi il termine fake news viene collegato ad altri concetti come notizie falsamente dannose [AG17], notizie false [VRA18], notizie sulla satira [BS16], disinformazione (ovvero inganno) [KV17], misinformazione [Kuc16] e rumors [BG17].

Tra quelle elencate, in questo lavoro si considera la prima definizione - fake news come articoli di notizie che sono intenzionalmente falsi e al contempo facilmente verificabili e che possono fuorviare i lettori - in quanto essa presenta due principali caratteristiche: autenticit`a ed intento. Autenticit`a significa che le fake news contengono informazioni false che possono essere verificate come tali, mentre l’intento denota il fatto che le fake news vengono create con lo scopo di ingannare i lettori.

Prendendo spunto da [ZG20] e facendo riferimento alla figura 1.2, vediamo quelle che sono delle propriet`a di base di queste notizie per cercare di caratterizzarle ancora di pi`u:

• Volume delle fake news: una grande quantit`a di contenuti falsi viene diffusa attraverso Internet, spesso senza la consapevolezza degli utenti. Ci`o `e possibile perch`e chiunque pu`o scrivere fake news online, in quanto non esiste una procedura di verifica [Ahm17], ma anzi, esistono molti siti web creati appositamente per trasmettere disinformazione. • Variet`a delle fake news: recensioni e pubblicit`a false, false dichiarazioni di politici, sono

(21)

1.1. FAKE NEWS CAPITOLO 1. STATO DELL’ARTE

solo alcuni esempi di come le fake news possono manifestarsi. Con la crescente popo-larit`a dei social media, le fake news online sono di vasta portata in ogni ambito della nostra vita quotidiana.

• Velocit`a delle fake news: gli autori di fake news solitamente hanno vita breve [AG17]. Ad esempio, molte pagine web di fake news attive durante le elezioni statunitensi del 2016 non esistono pi`u. Questo accade cos`ı da poter evitare di essere identificati dai sistemi di rilevamento. Inoltre le fake news hanno una natura real time, il che rende ancora pi`u complicato identificarle, determinare quanti utenti sono entrati in contatto con la notizia e stimare quando e come si potrebbero fermare le conseguenze prodotte dalla loro diffusione.

Figura 1.2:Volume, velocit`a e veridicit`a di una fake news

1.1.2

Studi nell’ambito delle fake news

Esistono diversi approcci per affrontare il problema dei contenuti inaffidabili online. In lette-ratura la maggior parte dei lavori relativi alle fake news propongono metodi per la rilevazione di queste notizie.

La rilevazione di una notizia non pu`o dipendere solo ed esclusivamente dal suo contenuto, ma `e giusto considerare anche gli altri componenti visti precedentemente, come l’autore della stessa e il contesto sociale. In base al componente considerato durante l’analisi, in [ZG20] gli approcci di rilevamento di fake news vengono distinti in: analisi del creatore, analisi del contenuto e analisi del contesto sociale.

(22)

1.1. FAKE NEWS CAPITOLO 1. STATO DELL’ARTE

Analisi dell’autore

L’attuale stato dell’arte si sta focalizzando sul tentativo di riconoscere account malevoli da quelli legittimi. Questa necessit`a nasce perch´e gli utenti online spesso non sono in grado di capire quando l’autore di una notizia `e un bot, un cyborg o semplicemente un utente malin-tenzionato. Gli utenti malevoli si comportano diversamente dagli utenti considerati legittimi. L’analisi dell’autore della fake news pu`o essere classificata in:

• analisi della profilazione dell’utente: per scovare questo genere di utenti, un possibile approccio proposto `e lo studio della profilazione, quindi informazioni come la lingua usata, la posizione geografica dell’account, se l’account `e verificato o meno, il numero di post dell’account. Attraverso l’analisi di questi dati `e possibile capire quanto sia attivo e sospetto un account social [Zha+14];

• analisi del comportamento temporale e posting: attraverso questa analisi `e possibile individuare il pattern temporale degli account, come ad esempio il tempo medio tra due post consecutivi, la frequenza di risposta o di condivisione e cos`ı via. Gli account legittimi hanno pattern temporali complessi, diversamente da bot che invece, essendo guidati da timer o programmi automatici, risultano essere pi`u attivi in un determinato periodo di tempo;

• informazioni relative alla credibilit`a: usare il numero di follower o di amici permette di differenziare account maligni dagli altri. Si `e osservato come il numero di amici di un utente malintenzionato `e solitamente molto superiore al numero di follower, cosa che invece non si verifica negli account autentici. [Chu+12] propone un metodo per calcolare la reputazione di un account basato su questi dati e attraverso di esso si `e constatato come sia possibile riconoscere una celebrit`a che avr`a un punteggio di reputazione migliore -da un social bot;

• analisi relative al sentimento: anche i fattori riguardanti il sentimento fungono da at-tributi chiave per distinguere gli account dannosi. Ci sono diversi approcci che sono stati proposti per l’estrazione di features relative al sentimento, ad esempio il punteggio delle emozioni o il punteggio di felicit`a. Combinando diverse features di questo genere,

(23)

1.1. FAKE NEWS CAPITOLO 1. STATO DELL’ARTE

[DKS14] mostra che il comportamento legato al sentimento `e sufficiente per distinguere un account umano da un social bot.

Analisi del contenuto

Effettuando uno studio sul contenuto delle notizie - quindi sia contenuto fisico che non - `e possibile analizzare modelli linguistici e stili di scrittura sia per le notizie veritiere sia per quelle false, riuscendo a catturare cos`ı le caratteristiche discriminanti per il riconoscimento delle fake news online. Anche in questo caso le diverse analisi si dividono in:

• analisi linguistica e semantica: fanno riferimento a studi classici e linguistici del lin-guaggio naturale. Nel dettaglio, attraverso l’analisi linguistica si cerca di determinare la competenza linguistica del creatore di notizie, studiando i formati linguistici e i modelli di scrittura. Alcuni dei metodi pi`u comuni per rappresentare testi grezzi sono “Bag of -Words” e “N - Grams”. Il primo considera ogni parola come un’unit`a singola ed uguale e rappresenta il testo come l’insieme di tutte le parole, ignorando la grammatica e l’ordine delle parole. In “N - gram”, il testo `e rappresentato da una sequenza di n elementi, che possono essere fonemi, sillabe, lettere o parole. Tuttavia, queste due metodologie hanno dimostrato di avere carenze significative nell’elaborazione e nella classificazione dei te-sti, quindi sono state proposte altre tecniche pi`u raffinate e complesse come “word2vec”, “long short – term memory (LSTM ) neural network”. L’analisi basata sulla semantica si riferisce al processo di caratterizzazione delle strutture sintattiche dei contenuti testuali che permette di scoprire il grado di compatibilit`a tra l’esperienza personale dell’autore e il contenuto delle notizie. Ad esempio, i creatori di fake news spesso usano titoli esa-gerati per attirare l’attenzione dei lettori, quindi per queste notizie il titolo `e solitamente non correlato o in conflitto con il contenuto delle notizie.

• analisi basata sulla conoscenza: corrisponde ai tentativi di verificare direttamente la ve-ridicit`a delle notizie. Data l’enorme quantit`a di informazioni diffuse mediante i social networks, questi studi diventano cruciali. Di fondamentale importanza `e il cosiddet-to fact - checking aucosiddet-tomatizzacosiddet-to che ha lo scopo di verificare aucosiddet-tomaticamente quancosiddet-to riportato nei contenuti delle notizie attraverso consultazioni ed estrazioni di dati da

(24)

di-1.1. FAKE NEWS CAPITOLO 1. STATO DELL’ARTE

verse fonti. Alcuni esempi tipici di siti web di fact - checking sono Snopes.com e Fact-Check.org. Uno dei limiti principali di questi tools `e l’esigenza di risorse esterne, come le conoscenze di un esperto, per assegnare alle notizie un valore veritiero, quindi, no-nostante queste tipo di tecnologie risultino essere estremamente promettenti, al giorno d’oggi dipendono ancora principalmente dalla conoscenza umana.

• analisi basata sullo stile: questa tipologia di analisi gioca un ruolo importante per cercare di catturare le caratteristiche peculiari degli stili di scrittura di account anomali, infatti si `e notato che gli account fake online diffondono informazioni fuorvianti celando di proposito lo stile di scrittura o cercando di imitare gli altri, mentre quelli legittimi espri-mono opinioni, emozioni e sentimento verso specifici prodotti, eventi o contenuti vari [Ahm17]. Questo tipo di analisi si pu`o compiere dal punto di vista dello stile fisico del contenuto della notizia, quindi estraendo caratteristiche fisiche come lo stile di scrittura, la sintassi del testo e l’atteggiamento personale delle notizie, oppure da un punto di vista non fisico analizzando propriet`a come la complessit`a e la leggibilit`a del testo. Attraver-so queste tecniche si `e constatato per esempio, come gli utenti dannosi impieghino pi`u tempo e tendano a fare pi`u errori durante la scrittura.

Analisi del contesto sociale

Come `e gi`a stato menzionato precedentemente, il contesto sociale corrisponde all’ambiente sociale in cui si diffonde la notizia. L’analisi corrispondente consiste nello studio di quanto rapidamente e ampiamente si diffonde la fake news e di come gli utenti online interagiscono tra di loro. Attraverso questa tecnica si `e in grado di fare previsioni anticipate sulla velocit`a di propagazione, la scala e l’impatto della diffusione delle informazioni. Tra tutte le analisi viste questa risulta essere quella meno utilizzata. La suddetta si pu`o distinguere in:

• analisi della rete di utenti: per capire se una notizia `e da ritenersi pi`u o meno falsa `e possibile esaminare la rete dell’autore, cio`e le interazione tra questo e gli altri utenti. L’idea `e che i vari utenti possiedono educazioni, esperienze ed interessi diversi, quindi sui social networks le persone tendono a formare gruppi con altri utenti che risultano essere simili a loro. Di conseguenza, si pu`o ipotizzare che gli utenti online che

(25)

intera-1.2. SOCIAL NETWORKS CAPITOLO 1. STATO DELL’ARTE

giscono fortemente con il creatore di notizie possono essere utilizzati per prevedere il livello di autenticit`a di queste. Ad esempio, in [Tac+17] e [CMP11] si `e osservato che se molti account anomali o inaffidabili “apprezzano” o “commentano” una notizia, `e pi`u probabile che questa notizia contenga informazioni false e fuorvianti .

• analisi del modello di distribuzione: corrisponde allo studio delle caratteristiche della diffusione delle informazioni. Ogni giorno milioni di notizie e messaggi online vengono pubblicati, condivisi e inoltrati, `e quindi fondamentale saper riconoscere le notizie at-tendibili da quelle che non lo sono. I modelli di diffusione delle notizie possono fornire informazioni preziose per filtrare le fake news. Negli ultimi anni, molti ricercatori stanno lavorando al rilevamento di modelli anomali per le informazioni sociali che potrebbero aiutare gli utenti a scoprire informazioni insolite o non previste ([Chu+12], [HLL11], [RMK11] [Zha+14]). Quest’ultima analisi `e sicuramente da considerarsi una soluzione futura per l’individuazione di notizie false.

1.2

Social Networks

Il lavoro che viene discusso in questa tesi pone le sue basi in quella che `e l’analisi dei social networks, per questo motivo risulta utile introdurre alcuni concetti principali correlati a que-sta disciplina.

Per comprendere e studiare networks molto complessi, occorre conoscere come i componenti di questi interagiscono tra di loro. Un modo per fare ci`o `e rappresentare questi sistemi attra-verso strutture come i grafi che ne facilitano la comprensione. Per essere pi`u precisi, quando si parla di ‘network’ ci si sta riferendo ad un sistema reale, quando, invece, si fa riferimen-to al ‘grafo’ si intende il modello matematico alla base della struttura di un network. Nella pratica questa distinzione tra i due termini viene meno, in quanto sono spesso utilizzati come sinonimi.

(26)

1.2. SOCIAL NETWORKS CAPITOLO 1. STATO DELL’ARTE

1.2.1

Preliminari

Un network `e costituito da due componenti principali: i nodi, chiamati vertici, e le interazioni dirette tra loro, chiamate collegamenti o archi.

Il numero di nodi, denotato da N, definisce la dimensione della rete. Spesso per distinguerli i nodi vengono etichettati con i = 1, 2, ...., N. Il numero di archi, o L, rappresenta invece l’insieme delle interazioni tra i nodi del grafo. Gli archi vengono indicati dalla coppia di nodi che collegano; per esempio (2, 5) per rappresentare il collegamento tra il nodo 2 e 5. Quando due nodi sono connessi da un arco si parla di nodi vicini (neighbours).

Un arco pu`o essere di due tipologie: indiretto (o non orientato), quando il collegamento `e una relazione simmetrica (per esempio, il nodo 1 `e collegato al nodo 3 e il nodo 3 `e collegato ad 1); altrimenti si dice diretto (orientato), in questo caso il nodo 1 `e collegato al nodo 3, ma pu`o accadere che il nodo 3 non sia connesso ad 1. Di conseguenza, in base alla tipologia del-l’insieme degli archi, un grafo `e detto diretto o indiretto. Per esempio, un network usato per rappresentare le relazioni di amicizia su Facebook in cui ogni nodo rappresenta un utente, ed esiste un arco tra i nodi u e v se e solo se gli utenti rappresentati da u e v sono “amici”, sar`a indiretto, perch´e se u `e “amico” di v, allora anche v `e “amico” di u. Lo stesso tipo di network non `e adatto nel caso si voglia rappresentare le relazioni su “Twitter” dato che queste non sono di natura reciproca e quindi per questo caso `e opportuno usare un grafo orientato.

Un’altra propriet`a degli archi che porta ad una diversa classificazione del network `e il peso. Infatti, gli archi possono essere pesati o non pesati, rispettivamente se hanno o no un peso associato. Il peso pu`o rappresentare diverse informazioni aggiuntive dell’arco, per esempio la frequenza della comunicazione oppure la lunghezza di un collegamento.

Oltre alle propriet`a degli archi, esistono alcune caratteristiche dei nodi che risultano fonda-mentali per l’analisi dei networks. Una di queste `e il grado (degree) di un nodo dato dal numero di connessioni che esso ha con gli altri vertici. Pu`o indicare il numero di “amici” che un utente possiede su Facebook o il numero di citazioni avute da un articolo di ricerca se consideriamo

un citation network. Il grado del nodo i − esimo viene indicato con ki. Nel caso di un grafo

(27)

1.2. SOCIAL NETWORKS CAPITOLO 1. STATO DELL’ARTE

per trovare il numero totale di link, dato da

L = 1 2 N X i=1 ki (1.1) dove il fattore 1

2 viene aggiunto perch`e altrimenti ogni arco verrebbe contato due volte.

Un’altra propriet`a importante che si pu`o derivare per l’analisi del social network `e il grado medio (average degree) calcolato come:

hki = 1 N N X i=1 ki = 2L N (1.2)

Quando si tratta di un grafo orientato invece `e necessario differenziare tra kin

i o grado in

entrata, cio`e il numero di link che puntano (entranti) al nodo i − esimo e kout

i o grado in

uscita, dato dagli archi che dal nodo i − esimo puntano ad altri nodi. Sommati portano al

grado totale del nodo ki. In questo caso, il numero totale degli archi viene calcolato come

L = N X i=1 kiin = N X i=1 kiout (1.3)

Diversamente dal calcolo di L nei grafi non orientati, in questo caso il fattore1

2non `e necessario

perch´e in questa tipologia di reti i link entranti e uscenti da un nodo vengono gi`a calcolati separatamente.

Dividendo L per la dimensione del grafo N si ottiene il grado medio:

kin = 1 N N X i=1 kiin =kout = 1 N N X i=1 kiout = L N (1.4)

Un ulteriore parametro significativo `e la distribuzione del grado dei nodi. Indicata con pk, essa

`e una funzione che fornisce la frazione dei nodi della rete che hanno il grado k. Attraverso questa si pu`o anche analizzare come sono distribuiti i collegamenti tra i nodi nel grafo. Per un network con N nodi la distribuzione del grafo `e data dal rapporto tra il numero di nodi di grado k e il numero totali di nodi, cio`e pk = NNk.

Un’altra misura fondamentale `e il shortest path di una rete. Dati due nodi u e v, un path `e definito come la sequenza di archi che vengono attraversati durante il cammino che ha origine in u e termina in v. La lunghezza di un path `e data dal numero di archi che questo contiene. Il shortest path `e quindi il path pi`u corto tra due nodi u e v del grafo, cio`e quello avente il minor

(28)

1.2. SOCIAL NETWORKS CAPITOLO 1. STATO DELL’ARTE

numero di link.

Altre propriet`a da evidenziare sono quelle di centralit`a. Nell’analisi dei networks gli indicatori di centralit`a identificano i nodi pi`u importanti. Questi si dividono in:

• degree centrality : `e la pi`u semplice tra le misure di centralit`a. `E definita come il numero di link che attraversano un nodo e corrisponde quindi al grado di questo. La degree centrality del nodo i `e calcolata come ki =

PN

j=1Aij, con Aij = 1se i e j sono connessi,

altrimenti 0. Nel caso di un network orientato occorre distinguere la degree centrality in outegree e indegree;

• closeness centrality : calcola la distanza media di un nodo da ogni altro nodo della rete. Pertanto pi`u un nodo `e centrale, pi`u `e vicino a tutti gli altri nodi;

• betweenness centrality : per ogni coppia di nodi in un grafo connesso, esiste almeno uno shortest path tra i nodi tale che o il numero di link che il path attraversa (per i grafi non pesati) o la somma dei pesi dei link (per quelli ponderati) sia minimizzata. La betweenness centrality per ogni nodo `e il numero di questi shortest paths che passano attraverso il nodo considerato. Lo stesso approccio si pu`o applicare sugli archi trovando la edge betweenness.

Per un’analisi pi`u approfondita dei grafi `e possibile ricorrere ad altre propriet`a fondamen-tali (si veda [Bar+16]), ma quelle sopracitate sono sufficienti per l’analisi che si terr`a in questo elaborato.

Community discovery

Durante l’analisi di un social network un’altro studio che pu`o rilevare informazioni importanti `e quello relativo alla struttura delle comunit`a. Per struttura delle comunit`a si intende insiemi di nodi che sono caratterizzati da un numero molto alto di link interni rispetto ai link che collegano i nodi dell’insieme a nodi esterni ad esso.

Non esiste una chiara definizione di ci`o che `e una comunit`a, generalmente viene definita come un insieme di nodi che condividono propriet`a comuni o ricoprono ruoli simili all’interno del grafo. In figura 1.3 `e mostrato un esempio schematico di un grafo con le comunit`a.

(29)

1.2. SOCIAL NETWORKS CAPITOLO 1. STATO DELL’ARTE

Figura 1.3: Comunit`a all’interno di un network

Alcune reti sociali del mondo reale riflettono questa particolare struttura. Per individuare la presenza di questi insiemi di nodi sono stati proposti diversi approcci algoritmici che prendono il nome di “community discovery”. Si noti come in base all’approccio adottato, il termine comunit`a assume una diversa definizione.

• Internal density: in questo caso una comunit`a `e un insieme di entit`a densamente con-nesse. Ogni comunit`a deve avere un numero di archi significativamente superiore al numero previsto di archi in un grafo random. L’idea `e quella di definire una funzione di qualit`a che misuri la densit`a di una comunit`a e cercare di massimizzarla. Per fare ci`o, la maggior parte dei metodi proposti ricorre all’utilizzo della “modularit`a”, una metrica proposta da Newman [New06]. Questa assume valori grandi per le partizioni migliori, cio`e quelle in cui la densit`a interna della comunit`a `e maggiore di quella esterna.

• Bridge detection: una community `e un componente del network ottenuto rimuovendo dalla struttura tutti i bridges sparsi che collegano le parti dense della rete. I bridges sono archi con un’alta betweenness centrality. Questo approccio viene applicato nel-l’algoritmo Girvan-Newman [GN02]: ad ogni iterazione il link con pi`u alta betweenness centrality viene selezionato ed eliminato. Pertanto occorre capire qual `e il buon

(30)

momen-1.2. SOCIAL NETWORKS CAPITOLO 1. STATO DELL’ARTE

to per fermarsi. Solitamente si calcola la modularit`a, decidendo di fermare l’esecuzione dell’algoritmo quando si ottiene il suo valore massimo.

• Feature distance: per questo gruppo una comunit`a `e data da un insieme di nodi che con-dividono uno specifico insieme di caratteristiche. `E necessario selezionare una misura per calcolare la distanza tra le caratteristiche selezionate dei nodi. Applicando la misura di distanza, i vertici all’interno di una comunit`a risultano molto vicini tra loro, pi`u di quelli esterni alla comunit`a.

• Percolation: per questi algoritmi una comunit`a `e un insieme di nodi raggruppati in base alla propagazione di una stessa propriet`a o informazione attraverso gli archi della rete. Uno dei metodi pi`u conosciuti di questa classe `e il Label Propagation. Per spiegare il funzionamento di questo, assumiamo che ciascun nodo possieda un’unica etichetta (la propriet`a). Alla prima iterazione, ogni nodo cambia la sua etichetta con quella di un suo nodo vicino con una probabilit`a α, mentre ad ogni iterazione successiva ogni nodo adotta come etichetta quella condivisa dalla maggioranza dei suoi vicini. L’algoritmo continua finch´e non si raggiunge il consenso.

• Entity closeness: famiglia di algoritmi basata sull’idea che una community `e un insieme di nodi dove `e possibile raggiungere ogni altro membro con una distanza significativa-mente minore dell’average shortest path nel network.

• Structure definition: in questa categoria una comunit`a `e intesa come un insieme di nodi con un preciso numero di archi tra loro, distribuiti in una topologia molto precisa defi-nita da regole specifiche. In altre parole, questi algoritmi hanno lo scopo di trovare le comunit`a con una data struttura.

• Link communities: le categorie descritte finora non permettono di avere comunit`a so-vrapposte, cio`e un nodo non pu`o fare parte di pi`u partizioni. Questo scenario invece si verifica comunemente nella societ`a: un soggetto qualsiasi fa parte di pi`u comunit`a, come la famiglia, il gruppo di colleghi di lavoro, gli amici del circolo sportivo. Per riflettere questa situazione, questa tipologia di metodi applica la divisione in comunit`a sugli archi e quindi i nodi appartengono a tutte le comunit`a a cui appartengono i loro archi.

(31)

1.2. SOCIAL NETWORKS CAPITOLO 1. STATO DELL’ARTE

1.2.2

Modelli di rete

L’attenzione ora si sposta sulle diverse strutture sottostanti al social network. La scienza delle reti ha come obiettivo primario quello di realizzare modelli che possano riprodurre al meglio le propriet`a osservate nei sistemi reali. Per maggiori dettagli su queste reti, si rimanda il lettore al libro di Barab´asi [Bar+16].

Reti complete

Una rete si dice completa quando vi `e un arco che collega ogni possibile coppia di nodi, quindi ogni vertice `e connesso agli altri (vedi Figura 1.4 (a)). L’esempio pi`u semplice di questa topo-logia `e una rete a due nodi.

Un grafo completo costituito da N nodi viene indicato con Kne possiede N(N − 1)/2 archi.

Questa topologia non `e molto diffusa tra le reti reali in quanto la maggior parte di queste sono sparse. Molto spesso, quando si vuole testare un modello di opinion dynamics o di diffusio-ne, il social network considerato pu`o essere completo, portando ad applicare il modello del campo medio per avere un’approssimazione. Attraverso la teoria del campo medio `e possibile esaminare i modelli ad alta dimensione studiando quello che `e un modello semplificato, simile all’originale, mediando sui gradi di libert`a. Tramite l’applicazione di questa teoria, l’effetto di tutti gli altri su un dato individuo `e approssimato da un singolo effetto medio.

Reti random

Le reti random sono state introdotte dal modello matematico di Erd¨os R´enyi. Queste sono generalmente costruite aggiungendo in modo casuale degli archi ad un insieme statico di nodi, cio`e data una rete di N nodi, ogni coppia di questi `e connessa con probabilit`a p.

Ogni random network generato con gli stessi parametri N e p `e leggermente diverso dagli altri, poich´e non cambia soltanto lo schema della rete, ma anche il numero di archi L. Pertanto, il numero atteso di link hLi `e dato dal prodotto della probabilit`a p che due nodi siano connessi e il numero di coppie che si tenta di connettere, cio`e

hLi = pN (N − 1)

(32)

1.2. SOCIAL NETWORKS CAPITOLO 1. STATO DELL’ARTE

In particolare, aumentando la probabilit`a p, si ottiene un random network pi`u denso.

Sfrut-tando la formula (1.5), `e possibile determinare il grado medio hki = 2hLi

N = p(N − 1). Nella

creazione di una rete random alcuni nodi ottengono numerosi archi, mentre altri ne acquisi-scono solo pochi o addirittura nessuno (si veda Figura 1.4 (b)). Attraverso la distribuzione dei gradi pk`e possibile notare queste differenze.

La forma esatta della distribuzione dei nodi di questa tipologia di reti corrisponde ad una di-stribuzione binomiale. Nello specifico, la probabilit`a che il nodo i abbia esattamente k archi `e data dal prodotto tra:

• la probabilit`a che siano presenti k dei suoi collegamenti, cio`e pk;

• la probabilit`a che manchino gli archi rimanenti data da (1 − p)N −1−k

• il numero di modi in cui possiamo selezionare k archi da N − 1 potenziali link che un

nodo pu`o avere, ovvero N −1

k



La distribuzione dei gradi pu`o quindi essere definita come pk=

N − 1 k



pk(1 − p)N −1−k (1.6)

Durante i diversi studi su queste reti, si `e notato come la maggior parte delle reti reali `e sparsa, cio`e in queste hki  N. Quando si verifica questa condizione, la distribuzione dei gradi `e meglio approssimata da una Poisson:

pk = e−hki

hkik

k! (1.7)

La (1.7) `e considerata, insieme alla distribuzione binomiale, la distribuzione dei gradi dei nodi di una rete random.

In breve, nonostante la distribuzione di Poisson sia solo un’approssimazione della distribuzione dei gradi di questo tipo di reti, grazie alla sua semplicit`a analitica, `e la forma preferita per descrivere pk. Questa semplicit`a dipende dal fatto che le sue propriet`a sono indipendenti dalla

dimensione della rete e dipendono solo dal grado medio hki. In particolare, per reti piccole (con N = 102) occorre utilizzare una distribuzione binomiale, per reti pi`u grandi la distribuzione dei gradi diventa indistinguibile da quella di Poisson e quindi `e conveniente utilizzare quest’ultima.

(33)

1.2. SOCIAL NETWORKS CAPITOLO 1. STATO DELL’ARTE

1.2.3

Reti scale - free

Diversi studi hanno osservato come alcuni sistemi naturali e creati dall’uomo, come il World Wide Web o le reti di citazioni, differiscono notevolmente da quella che `e la struttura dei ran-dom networks. Queste differenze sono individuabili nella presenza di numerosi nodi con gra-do piccolo che coesistono con alcuni hub, che invece sono nodi con un numero estremamente elevato di collegamenti. Questa particolare struttura si incontra nella maggior parte delle reti reali e rappresenta un principio organizzativo che da il nome a queste reti: scale - free (si veda Figura 1.4 (c)). Se si tenta di rappresentare la distribuzione del grado di queste reti, si osserva che non corrispondono ad una distribuzione di Poisson ma vengono ben approssimate dalla distribuzione chiamata legge di potenza. Una rete scale - free `e una rete la cui distribuzione dei gradi segue una legge di potenza (power law)

pk∼ k−γ (1.8)

dove γ `e il suo esponente di grado.

La principale differenza tra un random network e un scale - free si trova nella coda della distribuzione dei gradi, rappresentante la regione con il pi`u alto grado k della distribuzione pk.

Se si confrontano le due distribuzioni si pu`o osservare come:

• per piccoli k la legge di potenza `e sopra la funzione di Poisson, indicando che una rete scale - free ha un gran numero di nodi con grado piccolo;

• per k in prossimit`a di hki la distribuzione di Poisson `e al di sopra della legge di potenza, indicando che in una rete random c’`e un eccesso di nodi con grado k ≈ hki;

• per k grandi la legge di potenza `e di nuovo sopra la curva di Poisson, indicando che la probabilit`a di osservare un nodo di alto grado, o hub, `e di diversi ordini di grandezza superiore in uno scale - free rispetto a un rete random.

Il modello di Barab´asi - Albert (o semplicemente BA) viene introdotto per cercare di spiegare questa particolare architettura delle reti scale - free. Esso prende il nome dai suoi ideato-ri Albert-L´aszl´o Barab´asi e R´eka Albert.

(34)

1.2. SOCIAL NETWORKS CAPITOLO 1. STATO DELL’ARTE

reali: l’espansione della rete e l’attaccamento preferenziale (meglio conosciuto con la traduzio-ne del termitraduzio-ne preferential attachment). Con espansiotraduzio-ne si intende che le reti reali si ampliano attraverso l’aggiunta di nuovi nodi che aumenta continuamente N, cosa che non viene consi-derata nelle reti random dove invece si presuppone che il numero dei nodi sia fisso. Il prefe-rential attachment invece, indica la tendenza dei nuovi nodi a collegarsi ai nodi pi`u connessi. Al contrario, i nodi nei random networks scelgono casualmente a quale degli altri connettersi. Basandosi su questi due concetti, il modello BA `e definito come segue: inizialmente si hanno

m0nodi, i collegamenti tra questi vengono scelti in modo arbitrario, purch´e ciascun nodo

ab-bia almeno un collegamento. La rete si sviluppa seguendo due passaggi: la crescita, cio`e ad

ogni fase temporale aggiungiamo un nuovo nodo con m link (m ≤ m0)che collegano il

nuo-vo nodo a quelli gi`a nella rete; l’attaccamento preferenziale, ovvero la probabilit`a Π(k) che un

collegamento del nuovo nodo si connette al nodo i dipende dal grado ki come Π(ki) = Pki

jkj.

Dopo t step temporali, il modello BA genera una rete con nodi N = t + m0 e mo+ mtarchi.

La rete che si ottiene avr`a una distribuzione dei gradi rappresentata da una power law con esponente di grado γ = 3.

L’origine della power law e degli hub associati `e un fenomeno che si arricchisce, indotto dal-la coesistenza di questi due ingredienti. Infatti, durante il processo di costruzione deldal-la rete, la maggior parte dei nodi ha solo pochi archi, mentre altri si trasformano pian piano in hub. Questi sono il risultato dell’azione dell’attaccamento preferenziale, secondo il quale `e pi`u pro-babile che i nodi pi`u connessi acquisiranno connessioni con i nuovi nodi a spese di quelli con un grado pi`u piccolo.

(35)

1.3. OPINION DYNAMICS CAPITOLO 1. STATO DELL’ARTE

(a) Rete completa. (b) Rete random. (c) Rete scale - free.

Figura 1.4: Illustrazione dei diversi modelli di rete. Nella rete scale - free gli hub sono

evidenziati di verde.

1.3

Opinion dynamics

Negli ultimi anni, la formazione delle opinioni sta attirando la curiosit`a di esperti interdisci-plinari. Le opinioni possono essere considerate come lo stato interno degli individui o ancora meglio come la manifestazione del proprio punto di vista circa determinati fatti o fenomeni. Possiamo avere opinioni riguardanti i prodotti di consumo, la politica, fatti di cronaca, cia-scuno di noi ha praticamente opinioni su tutto ci`o che ci circonda. L’opinione di una persona `e influenzata da diversi elementi, per esempio la predisposizione individuale, le informazioni possedute, l’interazione con altri soggetti. Infatti `e stato dimostrato che i nostri pensieri e le nostre credenze spesso portano a determinare con quali altre persone interagiamo. Pertanto risulta rilevante studiare la dinamica dell’opinione e al riguardo molti esperti provenienti da aree di ricerca diverse hanno presentato vari modelli.

In [SL18] la dinamica dell’opinione `e definita come il processo che tenta di descrivere come gli individui scambiano opinioni, si convincono a vicenda, prendono decisioni e attuano azioni, impiegando diversi strumenti, ad esempio la teoria delle probabilit`a e dei grafi.

I modelli di opinion dynamics possono portare a diversi scenari: consenso, polarizzazione e frammentazione. In particolare, il consenso si verifica con l’emergere di un accordo e quindi tutti gli individui partecipanti alla formazione dell’opinione condividono lo stesso pensiero;

(36)

1.3. OPINION DYNAMICS CAPITOLO 1. STATO DELL’ARTE

la polarizzazione si raggiunge quando si ottengono due opinioni diverse concomitanti, cio`e la coesistenza di due gruppi aventi opinioni diverse. Per finire, la frammentazione si riscontra in caso di una distribuzione di numerose opinioni uniforme e piuttosto dispersa. Per capire come si raggiungono queste situazioni spesso si ricorre ad una modellazione basata su agenti: in ciascuna fase temporale di una simulazione, un gruppo di agenti interagisce e questo de-termina l’aggiornamento dell’opinione di ciascun partecipante. La maggior parte degli studi utilizza la teoria dei grafi per analizzare questo scenario, dove ciascun soggetto corrisponde ad un nodo su un grafo, la sua opinione `e espressa tramite una variabile, le relazioni tra i vari agenti sono modellate dagli archi e tramite delle regole vengono gestite le interazioni e le con-seguenti modifiche di opinione. Quindi l’opinione dei vari agenti pu`o oscillare tra i possibili valori, simulando come le opinioni cambiano nella realt`a. Il modo in cui le variabili d’opinione sono definite permette di distinguere modelli di opinione discreti da quelli continui. I primi descrivono casi pi`u limitanti in cui le persone discutono solo su due possibili opzioni su un dato argomento, come ad esempio s`ı o no, destra o sinistra, Samsung o Iphone; con gli altri l’opinione `e un numero reale entro dei limiti stabiliti e sono adatti per rappresentare quei casi in cui l’opinione di un individuo pu`o variare da un estremo all’altro di un dato intervallo come, ad esempio, nel caso di un esperto che `e chiamato a valutare una certa entit`a.

Di seguito si riassumono brevemente i modelli che prevalgono all’interno della letteratura distinguendoli in discreti e continui.

1.3.1

Modelli discreti

Voter model

Questo modello `e uno dei primi della dinamica di opinione discreta, `e uno dei pi`u semplici e viene proposto originariamente per modellare la concorrenza delle specie [CS73]. Successiva-mente viene applicato anche alle elezioni elettorali [HL75] derivandone il nome.

In questo modello vengono considerati N agenti collegati attraverso un grafo sottostante e

ogni agente i possiede una delle due opinioni discrete xi = ± 1. In ogni fase temporale, viene

selezionato casualmente un agente i insieme a un suo vicino casuale j e xi viene impostata

(37)

1.3. OPINION DYNAMICS CAPITOLO 1. STATO DELL’ARTE

Quando gli agenti sono collegati da una rete completa, la popolazione converge al consenso su una delle due possibili opinioni. La probabilit`a che si raggiunga il consenso su una data opinione `e uguale alla frazione di individui che inizialmente possiedono tale opinione.

Una variante di questo modello, oltre a considerare singole coppie di agenti interagenti, ana-lizza un nodo e il suo vicinato, N. Se il numero di nodi nel vicinato che detengono un’opinio-ne diversa supera una data soglia T, il nodo selezionato cambia opinioun’opinio-ne. Ulteriori studi del modello prevedono ad esempio l’applicazione di questo su opinioni discrete non binarie e su diverse topologie di rete.

Majority rule model

Il Majority Rule model si colloca tra quelli che considerano opinioni discrete tra ± 1 ed `e sta-to introdotsta-to per descrivere i dibattiti pubblici [Gal02]. Anche il nome di quessta-to modello `e descrittivo del suo funzionamento: ad ogni iterazione un gruppo di r agenti `e scelto casual-mente come gruppo di discussione e tutti assumono l’opinione della maggioranza all’interno del gruppo.

La dimensione del gruppo selezionato pu`o essere impostata o selezionata ad ogni fase tempo-rale da una distribuzione precisa. Il valore di r pu`o quindi essere pari o dispari: nel caso in cui r `e dispari la maggioranza `e sempre definita; in caso contrario potrebbe non essere sempre possibile selezionare un’opinione predominante. Per ovviare a questo problema, viene inseri-to un errore sistematico a favore dell’opinione +1. Gli auinseri-tori hanno dimostrainseri-to che l’opinione preferita verr`a assunta da tutta la popolazione e che il tempo medio di consenso scala come log N, dove N `e il numero di agenti nella rete.

Alcune estensioni di questo modello sono state utilizzate per esaminare l’andamento dei dibat-titi pubblici su questioni recenti. Qualcuna prevede due diversi tipi di agenti, cio`e gli indecisi e gli agenti che non cambiano opinione, dimostrando come quest’ultima tipologia definisce il risultato del dibattito. Un altro sviluppo considera la presenza di agenti “contrari” cio`e coloro che possiedono idee opposte e che quindi adottano l’opinione di minoranza del gruppo.

(38)

1.3. OPINION DYNAMICS CAPITOLO 1. STATO DELL’ARTE

Teoria dell’impatto sociale e modello di Sznajd

La dinamica delle opinioni `e un argomento di interesse anche per le scienze sociali. Una delle teorie che nascono da questo campo `e quella che prende il nome di teoria dell’impatto sociale [Lat81]. Questa descrive come gli individui percepiscono la presenza dei loro pari e come loro stessi influenzano gli altri, affermando che ci`o dipende dal numero N di individui, dal potere di persuasione, dalla distanza tra loro e dalla loro forza. L’idea `e che la forza `e rappresentata da due variabili: la persuasivit`a e il supporto che corrispondono rispettivamente alla capacit`a di un agente di cambiare l’opinione degli altri e alla capacit`a dello stesso di mantenere il suo pensiero. Agli archi viene assegnata la propriet`a di immediatezza, che descrive la facilit`a o probabilit`a della comunicazione tra due nodi specifici. Su un reticolo questa `e la distanza euclidea tra quei nodi, mentre in altre topologie grafiche pu`o essere gestita con archi ponderati. Se la somma ponderata della persuasivit`a di agenti che hanno un’opinione diversa dell’agente

i`e maggiore del sostegno degli agenti che hanno la sua stessa opinione, allora i viene persuaso

e cambia opinione.

Un modello che ha le sue fondamenta in questa teoria `e quello proposto da Sznajd [SS00]. Questo parte dall’idea che convincere qualcuno sia pi`u facile per un gruppo di persone che per un singolo individuo. Il social network considerato `e un reticolo bidimensionale e ciascun

agente possiede un’opinione xi = ± 1. Ad ogni step vengono selezionati due agenti vicini i e j,

se xi = xj, la coppia `e d’accordo e tutti i loro vicini copiano la loro opinione, altrimenti nessuna

opinione viene modificata. Esiste un’altra versione del modello che in caso di disaccordo tra le opinioni dei due agenti considerati, prevede che i vicini di uno prendano l’opinione dell’altro. Il modello Q - Voter

Questo viene introdotto come generalizzazione dei modelli di opinioni discrete. Il Q - Voter [CMP09] modella N individui in una rete completamente connessa e ognuno possiede uno stato ± 1. Ad ogni fase temporale si seleziona un insieme di agenti vicini q: se concordano, influenzano un vicino casuale, altrimenti con probabilit`a  il vicino scelto cambia la sua opi-nione. Il voter model e quello formulato da Sznajd sono casi speciali di questo, rispettivamente con q = 1,  = 0 e q = 2 e  = 0.

(39)

1.3. OPINION DYNAMICS CAPITOLO 1. STATO DELL’ARTE

I risultati con q ≤ 3 confermano quelli ottenuti per le configurazioni dei modelli dei casi spe-ciali, con transizioni da una fase ordinata ( piccolo) ad una di disordine ( grande), mentre si osserva come con un q > 3 si ha un nuovo tipo transizione tra le due fasi, ovvero un regime intermedio in cui lo stato finale dipende dalla condizione iniziale.

1.3.2

Modelli continui

Il modello HK

Il modello Hegselmann - Krause [HK+02] ha costituito la base di questo lavoro. Esso rientra nei modelli che considerano le dinamiche di opinione continue e che sono caratterizzati da un parametro distintivo rappresentato dalla soglia di interazione (o anche chiamata soglia di con-fidenza limitata): gli agenti interagiscono solo quando sono vicini all’opinione reciproca, cio`e se la differenza delle loro opinioni `e inferiore alla soglia di confidenza fissata. Diversamente da altri, questo risulta particolarmente adatto per modellare situazioni in cui l’interazione av-viene in grandi gruppi.

Nello specifico, il modello in questione considera una popolazione di N agenti e ogni

indivi-duo i ha un’opinione continua xi(t). Ad ogni fase temporale discreta t viene selezionato un

agente casuale i e, successivamente, tutti i suoi vicini. In base al valore assegnato alla soglia di confidenza  vengono poi considerati solo gli agenti vicini j la cui opinione differisce al massimo di  da quella di i. La distanza tra l’opinione dell’agente i e quella dell’agente j `e

definita come dij = |xi− xj| quindi i due soggetti comunicano solo se dij <= altrimenti

non si verifica nulla. In base a questo vincolo, i interagisce solo con gli agenti aventi opinioni in [xi− , xi+ ]. Il modello prevede che l’agente i modifichi la sua opinione in base a quella

di tutti i vicini compatibili secondo la regola di aggiornamento: xi(t + 1) = P j:|xi−xj|<aijxj(t) P j:|xi−xj|<aij (1.9)

dove aij `e la matrice di adiacenza del grafo. Attraverso questa formula l’opinione

dell’a-gente i aggiornata a t+1 sar`a la media delle opinioni dei suoi vicini in .

Si `e dimostrato come esso converge in un tempo polinomiale e come `e strettamente definito dal parametro , infatti durante l’avanzamento della simulazione la popolazione di agenti si

(40)

di-1.3. OPINION DYNAMICS CAPITOLO 1. STATO DELL’ARTE

vide in cluster fino ad ottenere un numero di raggruppamenti di opinioni finali che diminuisce all’aumentare di .

Sono stati effettuati ulteriori studi di approfondimento per questo modello, per esempio in [SL18] il modello viene applicato a diverse topologie di rete considerando sia grafi sintetici che reti reali, dimostrando come con un  = 1 il modello raggiunge il consenso nelle reti sintetiche ma non nelle altre; un altro di questi [MB12] propone la versione eterogenea del modello, cio`e viene assegnata una soglia di confidenza diversa per ciascun agente.

Il modello Deffuant-Weisbuch

Questo modello [Def+00] sfrutta uno spazio d’opinione continuo, considerando una

popola-zione di N individui, ciascuno con un’opinione xi ∈ [−1, 1]. Ad ogni fase temporale discreta,

viene estratta casualmente una coppia di soggetti interagenti (i, j). I due interagiscono solo se la differenza delle loro opinioni `e minore del valore del parametro di confidenza limitata, cio`e se |xi− xj| ≤ , con  ∈ [0, 1]. In questo caso, le loro opinioni si avvicinano di un certo valore

determinato dalla loro differenza e da un parametro di convergenza µ ∈ [0, 0.5]. Le opinioni di i e j vengono aggiornate seguendo la formula:

xi(t + 1) = xi+ µ(xj − xi) (1.10)

In base al valore di  la popolazione converge in uno o pi`u cluster. Inoltre, il parametro µ e la dimensione della popolazione determinano la velocit`a di convergenza e l’ampiezza della di-stribuzione delle opinioni finali. Caratteristico dei risultati che si ottengono da questo modello `e la presenza di piccoli cluster estremi tra quelli finali.

(41)

Capitolo 2

I MODELLI

Il principale contributo di questo elaborato `e presentare due diversi approcci di opinion dyna-mics, prendendo spunto dal modello di Hegselmann - Krause sopracitato. Ognuno di questi propone una nuova regola di aggiornamento. Inoltre, come `e gi`a stato detto nel capitolo intro-duttivo, entrambi considerano sia un’interazione tra N agenti, sia un’interazione binaria, che a sua volta prevede anche una comunicazione tra agenti aventi opinioni contrastanti. Ciascuna di queste versioni `e stata estesa aggiungendo i seguenti elementi:

• i pesi sugli archi del grafo per rappresentare la frequenza di interazione tra gli agenti; • la presenza di agenti cosiddetti ‘testardi’, ovvero coloro che, anche se interagiscono con

altri, non spostano la propria posizione riguardo un dato argomento; • la similarit`a tra gli agenti.

In questo capitolo descriviamo le diverse versioni sviluppate dividendole in modelli con interazione di gruppo e modelli con interazione binaria (per una migliore comprensione si veda la figura 2.1) .

(42)

2.1. INTERAZIONE IN GRUPPO CAPITOLO 2. I MODELLI

Figura 2.1: Tassonomia dei modelli con relative estensioni

2.1

Interazione in gruppo

2.1.1

Integrazione del peso sui collegamenti del social network

La prima modifica che `e stata apportata al modello originale `e l’inserimento del peso sugli ar-chi del network. Si `e visto come la condizione di soglia sia cruciale per il modello HK. Questo parametro pu`o essere interpretato tenendo conto che gli agenti interagiscono solo quando le loro opinioni sono gi`a abbastanza vicine; altrimenti non si preoccupano nemmeno di discutere. La ragione di tale comportamento potrebbe essere ad esempio la mancanza di comprensione o i conflitti di interesse. Gli stati invece possono rappresentare, per esempio, opinioni relative all’argomento trattato nel contenuto della fake news sul quale gli individui si stanno confron-tando. I soggetti sono collegati tra loro attraverso link con pesi casuali. L’inserimento dei pesi `e utile per considerare l’importanza della frequenza di interazione tra due individui. L’idea `e quella di rappresentare la diversa forza dei legami sociali tra agenti come avviene nella realt`a. Si supponga che l’agente i navigando in rete, abbia letto sulla sua bacheca Facebook un post riguardante la diffusione del “coronavirus”. Il contenuto del post sostiene che il vaccino per

Riferimenti

Documenti correlati

Secondo Lei potrebbe essere giusto\tollerabile dover pagare un ticket (o aumentare il pagamento per un ticket se già previsto) per accedere: Valori %. Introdurre il

L'assegno universale per chi perde il lavoro che Renzi propone nel suo Jobs Act lo obbliga ad affrontare un dilemma generazionale di ben più ampia portata: chi aiutare per primo,

art. 81 del Tuir, rientra nella categoria del reddito d ’impresa per il solo fatto di essere realizzato da un soggetto costituito in una veste giuridica societaria ”. L ’Agenzia

Lo scopo dello studio condotto da ricercatori dello Statens Seruminstitut di Copenhagen è stato quello di identificare nuove possibilità sierologiche per una futura sierodiagnosi

Attività adattata da “Unplugged” a cura della UOS Prevenzione specifica della ATS di Milano Città Metropolitana, in collaborazione con UOSD Promozione della Salute, Prevenzione

L’analisi FISH ha messo in evidenza come nel lago INI-1 la percentuale di cellule ibridate con la EUB Mix (specifica per i Batteri) e quella relativa al gruppo dei

Viene visualizzato l’elenco degli Insegnamenti/Moduli valutabili dallo Studente, fra cui scegliere il corso da valutare

Visto che siamo nella rubrica di TdG, ciò che cercherò di mostrare è come, all’interno di modelli del tutto standard di TdG, giocatori con opinioni diverse e tra