• Non ci sono risultati.

Polarizzazione delle informazioni tramite echo-chambers

3. FAKE NEWS

3.3 Polarizzazione delle informazioni tramite echo-chambers

In un intervento su WEF (World Economic Forum), Walter Quattrociocchi spiega molto chiaramente che cosa siano le echo-chamber: “Uno spazio definito sul web nel quale le idee scambiate, essenzialmente, si confermano le une con le altre. Per esempio, può essere uno spazio di persone che hanno la stessa mentalità e che si scambiano idee politiche simili, oppure una pagina su una teoria cospirazionista. Una volta entrati in questi spazi, gli utenti scambiano informazioni molto simili, in pratica facendosi eco l’un l’altro56”.

Eli Pariser ha sottolineato come ci sia una relazione tra l’algoritmo fondamentale delle piattaforme più usate su internet in Occidente, da Google a Facebook, e la formazione di echo-chamber. Perché l’algoritmo non fa altro che restituire pagine che favoriscono argomenti e persone simili a quelle che sono state in passato gradite agli utenti. Quegli algoritmi che servono a “filtrare” l’informazione in un contesto di eccesso quantitativo di informazione di fatto formano delle bolle intorno a ciascun utente grazie alle quali egli vede e legge prevalentemente informazioni che somigliano a ciò che ha gradito in passato57.

Le camere dell’eco hanno dunque una funzione molto importante nella diffusione dell’informazione online che risulta dunque essere polarizzata, i partecipanti utilizzano queste camere per condividere

56 Ibidem, blog.debiase.com/2016/08/22/la-disinformazione-online-e-quello-che-possiamo-fare-quattrociocchi-pariser- menczer-fournier-quelch-rietveld/

34

e scambiarsi idee molto simili fra loro che si confermano l’una con l’altra creando così l’eco. Questo effetto viene esasperato quando un utente si inserisce in una conversazione che tratta vari argomenti che vengono tutti presi in considerazione e messo il like agli stessi creando un vero e proprio effetto a valanga che prende il nome di “snowball”. Il problema vero di queste community è che gli utenti si aggregano e condividono gli argomenti che confermano quelle che erano le proprie opinioni iniziali, rafforzandole. Inoltre, quando un altro utente proporrà delle opinioni differenti in merito a quello specifico contenuto, l’utente criticherà la posizione contrastante per far prevalere la propria tornando così alle camere dell’eco in cui vi è un’esposizione selettiva seguita da un bias di conferma. A tal proposito è stato svolto uno studio58 su un campione di 1,2 milioni di utenti volto a capire come le informazioni relative ad argomenti molto distanti fra loro, cioè le notizie scientifiche e di cospirazione mainstream, siano consumate e modellate dalle comunità su Facebook. In particolare, le informazioni scientifiche hanno delle fonti e delle metodologie attendibili a differenza di quelle cospirative che tendono a ridurre la complessità e semplificare le cause al fine di essere più fruibile dal popolo online.

Questo viene visto come uno dei maggiori pericoli per la società di oggi tanto che sono state proposte delle soluzioni basate su algoritmi (es. Google) oppure sulla consapevolezza da parte degli utenti ai quali viene data la possibilità di segnalare gli articoli falsi. Queste soluzioni portano con sé diversi problemi, quali la discrezione degli utenti e quella di alimentare il flusso di false informazioni che implementano le credenze degli utenti non in grado di modificare le proprie idee una volta immessi in queste echo-chambers. Il risultato di questo lavoro afferma che per entrambi gli argomenti si creano comunità omogenee e polarizzate in cui sono simili le modalità di consumo delle informazioni ma l’effetto cascata fra i due argomenti è differente.

Il metodo di ricerca tiene in considerazione soltanto dati pubblici di Facebook, lo spazio di investigazione è stato definito tramite gruppi di Facebook sono attivi nel debunking della misinformazione, il dataset risultante è composto da 67 pagine pubbliche di cui 35 su notizie scientifiche e le altre 32 su teorie di cospirazione. Un secondo set, che include due pagine troll, è stato preso in considerazione per fittare il modello basato sui dati. Lo studio comincia con il download di tutti i post e le relative interazioni in un periodo di 5 anni tra il 2010 e il 2014.

Definiamo la polarizzazione di un utente come {σ =2ᵨ - 1 con 0≤ ᵨ≤1 e quindi -1≤ σ ≤1.

Dalla polarizzazione degli utenti, viene definita l’omogeneità marginale, pr ogni bordo eij tra i nodi i

e j come σij = σi σj con -1≤σij≤1. Questa riflette il livello di similarità tra la polarizzazione dei due nodi

condivisi, un link nell’albero delle condivisioni è omogeneo se il suo margine di omogeneità è

58 www.pnas.org/content/113/3/554

35

positivo. Definiamo allora un sentiero di condivisione come un sentiero dalla rotta da una delle foglie dell’albero della condivisione.

Un path omogeneo è un path condiviso per cui il margine di omogeneità di ogni elemento è positivo, per esempio un path condiviso composto solo da link omogenei. L’analisi parte dalla caratteristica delle cascate per ogni tipo di informazione: il livello massimo per le notizie scientifiche è di 952, 2422 per le notizie di cospirazione e addirittura 3945 per le pagine troll; l’esponente ϒ è stimato 2,21, 2,47 e 2,44 per i post di ogni categoria. L’altezza degli alberi varia da 1 a 5 e raggiunge il picco massimo per notizie scientifiche e di cospirazione mentre ha un valore di 4 per i trolling post.

Fig.17 – Probabile densità delle notizie59

La figura 17 mostra la funzione di probabile densità del periodo di vita calcolato in ore per le notizie scientifiche e di cospirazione. I picchi si hanno in entrambi i casi a ~1-2 ore e a ~20 ore dalla pubblicazione, si registra quindi una similitudine nella diffusione anche se gli argomenti sono tra loro differenti, inoltre si nota come la maggior parte dell’informazione pari al 63% viene diffusa nelle prime cinque ore dalla pubblicazione.

59 www.pnas.org/content/113/3/554

36

Fig.18 – Dimensione delle cascate in relazioni al tempo di vita60

La figura 18 invece, ci mostra le dimensioni delle cascate in relazione al tempo di vita di una notizia e quindi l’assimilazione di queste notizie suddivise in 2 categorie (news cospirative e scientifiche). Nel primo caso la misura della cascata aumenta all’aumentare del periodo di vita, mentre nel secondo caso il picco si ha quando la dimensione della cascata è ≃200 per poi diminuire col passare del tempo. Questi risultati ci suggeriscono che la capacità di assimilazione delle notizie per gli utenti è diversa: le news scientifiche raggiungono rapidamente un alto livello di diffusione ma una vita più lunga non corrisponde ad un aumento di interesse come invece accade con le notizie cospirative che mostrano una relazione positiva fra dimensione e durata di vita.

Fig.19 – Omogeneità delle notizie in relazione alle cascate61

Come fanno ancora vedere Quattrociocchi et al., lo studio pone l’attenzione sulle determinanti social che guidano la diffusione delle notizie con un focus sul ruolo dell’omogeneità nei network di amicizia. Per fare ciò gli autori si focalizzano sulla figura 19 che mostra il bordo medio di

60 www.pnas.org/content/113/3/554 61 www.pnas.org/content/113/3/554

37

omogeneità in relazione alle cascate per entrambe le tipologie di notizie, la maggior parte dei link tra condivisioni consecutive degli utenti è omogeneo. La media è sempre poco più grande o uguale a zero inizialmente indicando che la trasmissione di entrambi i tipi di informazione avviene all’interno di cluster omogenei, tuttavia la probabilità di chiudere a zero è molto bassa perchè le informazioni comunque si diffondono anche se soltanto nelle echo-chambers.

Per verificare con maggiore accuratezza le forme delle cascate delle condivisioni vengono messe in relazione le dimensioni delle cascate con il bordo medio di omogeneità per entrambe le tipologie di news. Nel caso di notizie scientifiche, i più alti livelli di omogeneità si hanno nell’intervallo [0,5 – 0,8] corrispondente alle cascate più larghe, nel caso delle teorie cospirative invece, in corrispondenza delle cascate più larghe si ha un livello di omogeneità più basso ~0,25. Ciò denota che mentre i patterns virali correlati ai due contenuti differiscono, l’omogeneità è chiaramente il driver della diffusione dell’informazione, in altre parole i diversi contenuti creano camere dell’eco differenti ma comunque caratterizzate da un alto livello di omogeneità al loro interno.

Come fanno vedere Quattrociocchi et al., alla CCDF del numero di tutti i path di condivisione comparati con il CCDF del numero di path omogenei per news scientifiche, cospirative ed entrambe prese insieme. Eseguendo i test viene evidenziato che per tutte le coppie di distribuzione considerate non vi sono differenze statistiche significative pertanto viene confermata la pervasività dei path omogenei, infatti il tempo di vita delle cascate di entrambe le news mostra un picco di probabilità nelle prime due ore per poi decrescere rapidamente nelle ore successive. Nonostante il modello di consumo sia simile, il tempo di vita della cascata espresso come una funzione di misura della cascata stessa è fortemente diversa per le due tipologie di notizie, tuttavia l’omogeneità rimane il più importante driver per la propagazione delle cascate. Le distribuzioni dei numeri totali e i path di condivisione omogenei sono molto simili per entrambe le categorie. In sostanza i modelli virali correlati ai contenuti appartenenti alle due narrative differiscono ma l’omogeneità resta sempre il driver primario di diffusione dei contenuti.

I risultati ottenuti mostrano che la maggior parte degli utenti tendono a concentrarsi, selezionare e condividere contenuti di un certo tipo, ignorando il resto; ciò suggerisce che la determinante per la formazione delle camere dell’eco è il bias di conferma.

Viene infine costruito un modello che permette di riassumere quanto detto: il modello per la diffusione delle notizie che considera l’omogeneità e la polarizzazione. Gli autori prendono in considerazione n utenti connessi da un piccolo network con una probabilità di riconnessione r, ogni nodo ha un’opinione ωi, con i ϵ {1, n} uniformemente distribuito tra [0,1] ed esposti a m notizie con

un determinato contenuto ϑj, j ϵ {1, m} uniformemente distribuito tra [0,1]. Ad ogni step le notizie

38

news passano nel network di amici dei primi condivisori, se tra questi amici vi è un’affinità di pensiero col primo condivisore in merito alla notizia, allora la stessa verrà condivisa una seconda volta. Quando |ωi – ϑj| ≤ δ l’utente i condivide la notizia j e δ è la soglia di condivisione. Visto che δ da sola

non riesce a catturare i cluster omogenei osservati nei dati, si crea un modello di connettività dei pattern come un network che considera diverse frazioni di link omogenei e che quindi restringe la diffusione delle news solo ai link omogenei. Come fanno vedere gli autori, dunque ФHL è la frazione

di link omogenei nel network, M è il numero di link totali e nh invece è il numero di link omogenei:

ФHL= nh /M, 0 ≤ nh ≤ M. Notiamo che 0 ≤ ФHL ≤ 1 e che 1 - ФHL, la funzione complementare ai link

omogenei, permette di ridurre lo spazio considerato per il parametro ФHL ϵ [0.5,1] per poter

focalizzare l’attenzione su uno dei due settori, link omogenei e non.

Il modello può essere visto come un processo dove la soglia di condivisione δ e la dimensione dei network z sono i parametri chiave, in altre parole fittando θj della j-esima notizia e l’opinione ωi dell’i-

esimo utente sarà uniformemente indipendente e identicamente distribuito tra [0,1].

Allora la probabilità p che un utente i condivida un post j è così definita: p= min (1, θ + δ) – max (0, θ – δ) ≃ 2δ perchè θ e ω sono uniformemente indipendenti e distribuiti allo stesso modo.

In generale quindi se ω e θ hanno distribuzioni f(θ) e f(ω), allora p dipenderà da θ:

pθ = f(θ)∫max(0,θ – δ)min(1,θ + δ)𝑓(ω)dω

Se ci si trova in un albero di di grado z, la media di condivisione è definita da µ= zp ≃ 2δ z, con una dimensione di cascata critica S= (1 - µ)-1. Se invece, si parte dall’assunto che la distribuzione

del numero m dei primi condivisori è f(m), allora la cascata media è S=∑f(m)m(1- µ)-1= (𝑚)𝑓 1− µ≃ (𝑚)𝑓

1−2𝛿𝑧 dove (m)f=∑m…..f(m) è la media rispetto a f.

Nella simulazione gli autori hanno posto la dimensione del network z = 8 perchè la ratio di ramificazione µ dipende dal prodotto di z e δ per cui, senza perdita di generalità, è possibile considerare la variazione di uno solo tra i due. Considerando la probabilità che un vicino di un utente ha una diversa polarizzazione, allora la ratio di ramificazione diventa µ=z(1 – q)p. Se un reticolo ha un grado di distribuzione d(k)(k=z+1), si può allora assumere un usuale processo che fornisce una ratio di ramificazione critica e che è lineare in (k2)d/(k)d (µ≃(1 – q)p(z2)/(z)).

39

Inoltre, sono state fatte delle simulazioni sul modello con i parametri n=5000 nodi e m=1000 notizie con il numero dei primi condivisori tramite Gaussiana inversa, log normale, Poisson, distribuzione uniforme e la distribuzione reale dei dati. Di seguito sono riportati i dati rilevanti ai fini statistici da comparare con i dati reali della distribuzione dei primi condivisori con le distribuzioni fittate.

Valori Dato Gaussiana inversa Log normale Poisson Minimo 1 0,36 0,1 20 Primo quantile 5 4,16 3,16 35 Mediana 10 10,45 6,99 39 Media 39,34 39,28 13,04 39,24 Terzo quantile 27 31,59 14,85 43 Massimo 3,033 1814 486,1 66

Tab.2 – Risultati ottenuti62

Per la prima la soglia di distribuzione δ varia nell’intervallo [0.01,0.05] e la frazione dei link omogenei ФHL nell’intervallo [0.5,1], inoltre, per evitare influenze date dalle fluttuazioni statistiche

nel processo, ogni punto dei parametri ha avuto oltre 100 interazioni: quando ФHL≃0.5 si ha una

buona stima dei dati reali. In particolare, mantenendo costante la divisione in due camere dell’eco, il network è diviso in due cluster in cui ogni notizia rimane all’interno e viene trasmessa solamente all’interno della community.

In più è stato esaminato un set di 1072 alberi di condivisione di false informazioni derivanti da pagine troll, queste notizie sono abitualmente prese in considerazione e condivise da consumatori di pagine cospirative. Queste sono state computate con la media e la deviazione standard della dimensione e dell’altezza di tutti gli alberi di condivisione troll e infine sono stati riprodotti i dati adoperando il modello elaborato. Sono stati adoperati parametri fissati da messaggi di troll e si è variato la frazione dei link omogenei ФHL, la probabilità r e la soglia di

condivisione δ. Dai risultati la distribuzione Gaussiana inversa è quella che meglio fitta i dati di tutte le tipologie prese in considerazione, per questa ragione, è stata eseguite un’ulteriore simulazione con la distribuzione Gaussiana inversa del numero dei primi condivisori 1072

62 www.pnas.org/content/113/3/554

40

notizie, 16889 utenti e la migliore combinazione dei parametri ottenuta nelle simulazioni. La CCDF e la CDF fittano molto bene i dati reali.

Fig. 20 – CCDF e CDF per la migliore combinazione dei parametri che fitta i valori dei dati reali, (ФHL, r, δ)=(0.56,0.01,0.015) e I

primi condivisori distribuiti come IG(18.73,9.63)63

Si è arrivati dunque al risultato che le comunità polarizzate emergono attorno a tipi distinti di contenuti e i consumatori di notizie sulla cospirazione tendono ad essere estremamente focalizzati su contenuti specifici tanto che gli utenti a cui piacciono i post di una pagina, mettono mi piace sulle pagine di una specifica categoria il 95% delle volte. Gli autori hanno inoltre considerato i commenti arrivando al risultato che gli utenti polarizzati delle notizie sulla cospirazione sono più concentrati sui post della loro comunità, in pratica sono più inclini a mettere like e condividere messaggi da pagine di cospirazione. D'altra parte, le persone che consumano notizie scientifiche condividono e amano di meno, ma commentano di più le pagine della cospirazione. I risultati indicano che esiste una relazione tra le credenze e il bisogno di chiusura cognitiva. Ciò fornisce una visione importante sulla diffusione di voci non verificate, nel senso che attraverso la polarizzazione possiamo scoprire dove è più probabile che le voci fuorvianti si diffondano. Questo è il fattore trainante degli incendi digitali. Tra le dinamiche sociali più affascinanti osservate c'è sicuramente quella di trolling. I troll oggi agiscono per deridere la cultura del "credere in qualsiasi cosa" di queste camere a eco attaccando le contraddizioni attraverso la parodia. Le attività dei troll spaziano da contenuti controversi e satirici alla produzione di affermazioni puramente fittizie, fortemente irrealistiche e sarcastiche. Per esempio, i troll si aggregano in gruppi e costruiscono le pagine di Facebook come una caricatura di notizie

63 www.pnas.org/content/113/3/554

41

sulla cospirazione. Un esempio recente è una pubblicazione falsa di "scoperte" che mostravano che le scie chimiche avevano tracce di viagra in esse. Ciò che rende la loro attività così interessante è che, molto spesso, queste battute diventano virali, finendo spesso per essere utilizzate come prove nei dibattiti online degli attivisti politici. La misinformazione online è divenuta così pervasiva nei social media online che è stata annoverata dal WEF come una delle più pericolose minacce per la società umana.

Documenti correlati