• Non ci sono risultati.

Un'analisi preliminare della rete dei ringraziamenti su Wikipedia 

Valerio Perticone

1​

, Marco Elio Tabacchi

1,2 1​

Dipartimento di Matematica e Informatica,  

Università degli Studi di Palermo 

2​

Istituto Nazionale di Ricerche Demopolis 

valerio.perticone|marcoelio.tabacchi@unipa.it 

INTRODUZIONE 

L’enciclopedia gratuita online Wikipedia fornisce ad ogni collaboratore la        possibilità di esprimere agli altri autori apprezzamento per la creazione o        modifica di una specifica voce attraverso la funzionalità ​ringraziamenti      ​,  implementata dall’aprile 2013 per mezzo del sistema di notifiche ​echo      ​: ​accanto  ad ogni modifica, un link ‘ringrazia’ permette di inviare all’autore un        messaggio standard di ringraziamento (Wikipedia, 2015). L’insieme dei        ringraziamenti può essere visto come una rete sociale direzionata, rappresentata        da un multigrafo in cui gli utenti sono i nodi ed i ringraziamenti archi orientati.        Ignorando gli archi multipli ed il verso dell’arco si ha una rete in cui l'esistenza        di un ringraziamento stabilisce una relazione tra due collaboratori, come nei        modelli di social network descritti da Boyd e Ellison (2007).  

Lo studio della topologia di questa rete può rivelare informazioni sulle        relazioni tra i collaboratori, senza dover conoscere in dettaglio le modifiche        effettuate dagli utenti e studiare eventuali interazioni pregresse tra i soggetti,        come ad es. modifiche effettuate dagli utenti nelle stesse voci, discussioni        svolte nelle pagine comunitarie, interessi comuni dichiarati dagli utenti nei        relativi profili. 

Nonostante l'assenza di una esplicita componente sociale nella redazione di        una enciclopedia è possibile ipotizzare, a partire dalle modalità di formazione e        tenendo conto delle evidenti analogie tra essa e le reti sociali più diffuse, che la        rete dei ringraziamenti abbia una topologia ​small world e scale-free (Barabási e              Frangos, 2002). In letteratura esistono numerosi esempi naturali ed artificiali di        reti con tale topologia, che garantisce doti di robustezza e resilienza alla rete        (Petrou, Tabacchi, Piroddi, 2010). Nelle reti ​small world        ​, tipiche dei social        network di tipo simmetrico (Caci, Cardaci, Tabacchi, 2012), i nodi hanno un        alto coefficiente di clustering rispetto ad una rete casuale di pari dimensioni        (Newman, 2003), ovvero le cerchie di amicizia sono molto dense e le persone        che fanno parte di una cerchia tendono ad essere in collegamento tra loro.        Inoltre il cammino medio da compiere per andare da un nodo all’altro è breve       

rispetto alla dimensione del network, fenomeno noto popolarmente come ​sei        gradi di separazione    ​. Le reti scale-free presentano un alto numero di nodi con        pochi collegamenti, e un ristretto numero di nodi (i cd. ​hub      ​) con moltissimi      collegamenti, secondo la distribuzione esponenziale         P(x) = x−α (Barabási e    Frangos, 2002), proprietà verificabile usando un algoritmo basato sul test di        Kolmogorov-Smirnov (Clauset et al. 2009). 

Scopo di questo lavoro pilota è verificare l’ipotesi topologica descritta        dianzi con l’ausilio dei dati disponibili, al fine di verificare le doti di robustezza        e resilienza e la presenza di hub della rete dei ringraziamenti, ed eventualmente        di esprimere delle ipotesi su un eventuale scostamento. 

ESPERIMENTO 

La raccolta dati, disponibili pubblicamente, è stata effettuata utilizzando le        API di MediaWiki. In particolare la funzionalità ​logevents ha permesso di avere        accesso alle informazioni presenti nel registro ringraziamenti in formato JSON.  Abbiamo raccolto oltre 420.000 ringraziamenti effettuati su Wikipedia in        lingua inglese nell'arco temporale maggio 2013 – marzo 2015, che hanno        interessato circa 83.700 utenti distinti. Considerando le relazioni come uniche e        prive di verso, il 98% delle interazioni coinvolge un'unica componente        connessa costituita da 75.920 nodi e 245.135 archi, che è stata oggetto della        nostra analisi.  

I parametri analizzati per stabilire se la rete dei ringraziamenti sia ​small        world scale-free sono stati il coefficiente di clustering e la lunghezza media dei        cammini tra due nodi (​small world          ​) e la distribuzione del numero di        collegamenti dei nodi (scale­free). I risultati sono esposti in Tabella 1. 

N=75.920  ringraziamenti  rete dei  random network valori attesi  valori attesi small world  valori attesi scale-free 

Coefficiente di 

clustering  0.13  ≈ 0.00009  >> 0.00009  – 

Lunghezza 

media cammini  4.06  ≈ 4.61  ≈ 4.88  – 

Distribuzione  Esponenziale α = 1.65  Binomiale  –  Esponenziale 2 ≤ α ≤ 3 

Tabella 1: risultati dell’analisi sulla rete dei ringraziamenti di Wikipedia EN  DISCUSSIONE E CONCLUSIONI 

Dai risultati emerge che la topologia della rete dei ringraziamenti può essere        approssimata a quella ​small world         ​scale-free. In particolare il risultato relativo        al cammino medio ed al coefficiente di clustering rispetta perfettamente i        parametri di riferimento per le reti ​small world        ​, mentre il coefficiente della          distribuzione esponenziale è di poco inferiore al minimo previsto per le reti        scale-free, indicando una predominanza dell’influenza degli ​hub      ​. Risultati    simili sono stati ottenuti in altre reti sociali (si veda Seyed-allaei, Ginestra        Bianconi, Marsili, 2006 per una review ed una possibile modellizzazione). 

Questo risultato è di particolare interesse se si nota che il network        analizzato non deriva da un servizio di social network in senso stretto, nel quale        lo scambio di amicizie o messaggi rappresenta la principale attività degli utenti,        ma dalla rete di relazioni tra i redattori di una enciclopedia nella quale il        ringraziamento è una forma di cortesia non imperativa e non correlata        all’attività principale, ovvero la redazione e la manutenzione di voci. È        possibile che caratteristiche analoghe possano riscontrarsi in altri progetti di        carattere simile, ad esempio contribuzione volontaria nello sviluppo di software        open source o partecipazione a forum e discussioni online. 

In tale analisi preliminare abbiamo deliberatamente tralasciato di        considerare il verso ed il peso delle relazioni; e l'evoluzione temporale della        funzionalità. In particolare si dovrebbe analizzare come i ringraziamenti        effettuati dagli ​early adopters abbiano stimolato l'uso della funzionalità da            parte di utenti che non ne erano a conoscenza. 

Va inoltre notato che Wikipedia in lingua inglese è la più grande delle        comunità esistenti, sia per numero di collaboratori che per nazionalità degli        utenti. L'esperimento andrebbe riprodotto per le differenti versioni linguistiche        dell'enciclopedia, al fine di verificare se diversi contesti culturali, modalità        differenti nell’uso dello strumento Wikipedia, numeri più ristretti di        collaboratori e condizioni esterne (aree geografiche di provenienza, relazioni        sociali su altri network o personali) possano modificare la topologia. Possibili        sviluppi futuri potrebbero riguardare anche l’analisi delle motivazioni che        spingono ad effettuare o meno un ringraziamento, anche tramite l’uso di        interviste dirette e questionari. 

Bibliografia 

Barabási, A. L., & Frangos, J. (2002). Linked: The New Science Of Networks        Science Of Networks. Basic Books. 

Boyd, D., & Ellison, N. (2007). Social Network Sites: Definition, History, and        Scholarship. Journal of Computer­Mediated Communication, 13(1).  Caci, B., Cardaci, M., & Tabacchi, M. E. (2012). Facebook as a small world: a       

topological hypothesis. Social Network Analysis and Mining, 2(2),.  Clauset, A., Shalizi, C. R., & Newman, M. E. (2009). Power-law distributions       

in empirical data. SIAM review, 51(4), 661­703. 

Newman, M. E. (2003). Random graphs as models of networks. Handbook of        graphs and networks, 35. 

Petrou, M., Tabacchi, M. E., & Piroddi, R. (2010). Networks of concepts and        ideas. The Computer Journal, 53(10), 1738­1751. 

Seyed-Allaei, H., Bianconi, G., & Marsili, M. (2006). Scale-free networks with        an exponent less than two. Phys. Rev. E, 73:046113. 

Wikipedia (2015). Wikipedia:Notifications/Thanks. Wikipedia, the Free        Encyclopedia. 

Alla ricerca del circuito per l’intelligenza