Valerio Perticone
1, Marco Elio Tabacchi
1,2 1Dipartimento di Matematica e Informatica,
Università degli Studi di Palermo
2Istituto Nazionale di Ricerche Demopolis
valerio.perticone|marcoelio.tabacchi@unipa.it
INTRODUZIONEL’enciclopedia gratuita online Wikipedia fornisce ad ogni collaboratore la possibilità di esprimere agli altri autori apprezzamento per la creazione o modifica di una specifica voce attraverso la funzionalità ringraziamenti , implementata dall’aprile 2013 per mezzo del sistema di notifiche echo : accanto ad ogni modifica, un link ‘ringrazia’ permette di inviare all’autore un messaggio standard di ringraziamento (Wikipedia, 2015). L’insieme dei ringraziamenti può essere visto come una rete sociale direzionata, rappresentata da un multigrafo in cui gli utenti sono i nodi ed i ringraziamenti archi orientati. Ignorando gli archi multipli ed il verso dell’arco si ha una rete in cui l'esistenza di un ringraziamento stabilisce una relazione tra due collaboratori, come nei modelli di social network descritti da Boyd e Ellison (2007).
Lo studio della topologia di questa rete può rivelare informazioni sulle relazioni tra i collaboratori, senza dover conoscere in dettaglio le modifiche effettuate dagli utenti e studiare eventuali interazioni pregresse tra i soggetti, come ad es. modifiche effettuate dagli utenti nelle stesse voci, discussioni svolte nelle pagine comunitarie, interessi comuni dichiarati dagli utenti nei relativi profili.
Nonostante l'assenza di una esplicita componente sociale nella redazione di una enciclopedia è possibile ipotizzare, a partire dalle modalità di formazione e tenendo conto delle evidenti analogie tra essa e le reti sociali più diffuse, che la rete dei ringraziamenti abbia una topologia small world e scale-free (Barabási e Frangos, 2002). In letteratura esistono numerosi esempi naturali ed artificiali di reti con tale topologia, che garantisce doti di robustezza e resilienza alla rete (Petrou, Tabacchi, Piroddi, 2010). Nelle reti small world , tipiche dei social network di tipo simmetrico (Caci, Cardaci, Tabacchi, 2012), i nodi hanno un alto coefficiente di clustering rispetto ad una rete casuale di pari dimensioni (Newman, 2003), ovvero le cerchie di amicizia sono molto dense e le persone che fanno parte di una cerchia tendono ad essere in collegamento tra loro. Inoltre il cammino medio da compiere per andare da un nodo all’altro è breve
rispetto alla dimensione del network, fenomeno noto popolarmente come sei gradi di separazione . Le reti scale-free presentano un alto numero di nodi con pochi collegamenti, e un ristretto numero di nodi (i cd. hub ) con moltissimi collegamenti, secondo la distribuzione esponenziale P(x) = x−α (Barabási e Frangos, 2002), proprietà verificabile usando un algoritmo basato sul test di Kolmogorov-Smirnov (Clauset et al. 2009).
Scopo di questo lavoro pilota è verificare l’ipotesi topologica descritta dianzi con l’ausilio dei dati disponibili, al fine di verificare le doti di robustezza e resilienza e la presenza di hub della rete dei ringraziamenti, ed eventualmente di esprimere delle ipotesi su un eventuale scostamento.
ESPERIMENTO
La raccolta dati, disponibili pubblicamente, è stata effettuata utilizzando le API di MediaWiki. In particolare la funzionalità logevents ha permesso di avere accesso alle informazioni presenti nel registro ringraziamenti in formato JSON. Abbiamo raccolto oltre 420.000 ringraziamenti effettuati su Wikipedia in lingua inglese nell'arco temporale maggio 2013 – marzo 2015, che hanno interessato circa 83.700 utenti distinti. Considerando le relazioni come uniche e prive di verso, il 98% delle interazioni coinvolge un'unica componente connessa costituita da 75.920 nodi e 245.135 archi, che è stata oggetto della nostra analisi.
I parametri analizzati per stabilire se la rete dei ringraziamenti sia small world scale-free sono stati il coefficiente di clustering e la lunghezza media dei cammini tra due nodi (small world ) e la distribuzione del numero di collegamenti dei nodi (scalefree). I risultati sono esposti in Tabella 1.
N=75.920 ringraziamenti rete dei random network valori attesi valori attesi small world valori attesi scale-free
Coefficiente di
clustering 0.13 ≈ 0.00009 >> 0.00009 –
Lunghezza
media cammini 4.06 ≈ 4.61 ≈ 4.88 –
Distribuzione Esponenziale α = 1.65 Binomiale – Esponenziale 2 ≤ α ≤ 3
Tabella 1: risultati dell’analisi sulla rete dei ringraziamenti di Wikipedia EN DISCUSSIONE E CONCLUSIONI
Dai risultati emerge che la topologia della rete dei ringraziamenti può essere approssimata a quella small world scale-free. In particolare il risultato relativo al cammino medio ed al coefficiente di clustering rispetta perfettamente i parametri di riferimento per le reti small world , mentre il coefficiente della distribuzione esponenziale è di poco inferiore al minimo previsto per le reti scale-free, indicando una predominanza dell’influenza degli hub . Risultati simili sono stati ottenuti in altre reti sociali (si veda Seyed-allaei, Ginestra Bianconi, Marsili, 2006 per una review ed una possibile modellizzazione).
Questo risultato è di particolare interesse se si nota che il network analizzato non deriva da un servizio di social network in senso stretto, nel quale lo scambio di amicizie o messaggi rappresenta la principale attività degli utenti, ma dalla rete di relazioni tra i redattori di una enciclopedia nella quale il ringraziamento è una forma di cortesia non imperativa e non correlata all’attività principale, ovvero la redazione e la manutenzione di voci. È possibile che caratteristiche analoghe possano riscontrarsi in altri progetti di carattere simile, ad esempio contribuzione volontaria nello sviluppo di software open source o partecipazione a forum e discussioni online.
In tale analisi preliminare abbiamo deliberatamente tralasciato di considerare il verso ed il peso delle relazioni; e l'evoluzione temporale della funzionalità. In particolare si dovrebbe analizzare come i ringraziamenti effettuati dagli early adopters abbiano stimolato l'uso della funzionalità da parte di utenti che non ne erano a conoscenza.
Va inoltre notato che Wikipedia in lingua inglese è la più grande delle comunità esistenti, sia per numero di collaboratori che per nazionalità degli utenti. L'esperimento andrebbe riprodotto per le differenti versioni linguistiche dell'enciclopedia, al fine di verificare se diversi contesti culturali, modalità differenti nell’uso dello strumento Wikipedia, numeri più ristretti di collaboratori e condizioni esterne (aree geografiche di provenienza, relazioni sociali su altri network o personali) possano modificare la topologia. Possibili sviluppi futuri potrebbero riguardare anche l’analisi delle motivazioni che spingono ad effettuare o meno un ringraziamento, anche tramite l’uso di interviste dirette e questionari.
Bibliografia
Barabási, A. L., & Frangos, J. (2002). Linked: The New Science Of Networks Science Of Networks. Basic Books.
Boyd, D., & Ellison, N. (2007). Social Network Sites: Definition, History, and Scholarship. Journal of ComputerMediated Communication, 13(1). Caci, B., Cardaci, M., & Tabacchi, M. E. (2012). Facebook as a small world: a
topological hypothesis. Social Network Analysis and Mining, 2(2),. Clauset, A., Shalizi, C. R., & Newman, M. E. (2009). Power-law distributions
in empirical data. SIAM review, 51(4), 661703.
Newman, M. E. (2003). Random graphs as models of networks. Handbook of graphs and networks, 35.
Petrou, M., Tabacchi, M. E., & Piroddi, R. (2010). Networks of concepts and ideas. The Computer Journal, 53(10), 17381751.
Seyed-Allaei, H., Bianconi, G., & Marsili, M. (2006). Scale-free networks with an exponent less than two. Phys. Rev. E, 73:046113.
Wikipedia (2015). Wikipedia:Notifications/Thanks. Wikipedia, the Free Encyclopedia.