• Non ci sono risultati.

Un’analisi preliminare della rete sociale di StackExchange

Nel documento Apprendimento, cognizione e tecnologia (pagine 98-103)

Gianluca Di Gesaro

Dip. di Matematica e Informatica,Università degli Studi di Palermo gianlucadigesaro@gmail.com

Valerio Perticone

Dip. di Matematica e Informatica,Università degli Studi di Palermo valerio.perticone@unipa.it

Marco Elio Tabacchi

Dip. di Matematica e Informatica,Università degli Studi di Palermo metabacchi@unipa.it

1. Introduzione

Stack Exchange è una rete di siti web a domanda e risposta (Q&A), o- gnuno dei quali ricopre un particolare argomento. Domande, risposte e utenti sono soggetti ad un processo di voti di reputazione che permette ai suddetti siti di auto moderarsi. La rete è nata dal modello di Stack Overflow, un sito Q&A dedicato alla programmazione, che era il sito originale della rete (Wi- kipedia, 2016). I siti di Q&A sono ormai una parte molto importante e popo- lare del Web essendo diventati una risorse fondamentale nella ricerca di in- formazioni e nella risoluzione di problemi. Nonostante non siano esplicita-

mente una rete sociale grazie alla loro natura di siti collaborativi e di condivi- sione delle risorse formano implicitamente una comunità le quali sono delle ottime candidate ad essere analizzare come una rete sociale. Infatti l’insieme formato da domande, risposte e commenti può essere visto come una rete so- ciale direzionata, rappresentata da un multigrafo in cui gli utenti sono i nodi e le risposte ed i commenti alle domande sono archi orientati. Ignorando gli archi multipli ed il verso dell’arco si ha una rete in cui l'esistenza di una delle coppie precedentemente indicate stabilisce una relazione tra due utenti, come nei modelli di social network descritti da Boyd e Ellison (2007).

Lo studio della topologia di questa rete può rivelare informazioni sulle relazioni tra gli utenti, senza dover conoscere in dettaglio i post degli utenti e studiare eventuali interazioni pregresse tra i soggetti, come ad esempio voti per lo stesso post, discussioni svolte nello stesso post, interessi comuni di- chiarati dagli utenti nei relativi profili.

È possibile ipotizzare, a partire dalle modalità di formazione e tenendo conto delle evidenti analogie tra essa e le reti sociali più diffuse, che la rete così formata abbia una topologia small world e scale-free (Barabásie Fran- gos, 2002). In letteratura esistono numerosi esempi naturali ed artificiali di reti con tale topologia, che garantisce doti di robustezza e resilienza alla rete (Petrou, Tabacchi, Piroddi, 2010). Nelle reti small world, tipiche dei social network di tipo simmetrico (Caci, Cardaci, Tabacchi, 2012), i nodi hanno un alto coefficiente di clustering rispetto ad una rete casuale di pari dimensioni (Newman, 2003), ovvero le cerchie di amicizia sono molto dense e le persone che fanno parte di una cerchia tendono ad essere in collegamento tra loro. I- noltre il cammino medio da compiere per andare da un nodo all’altro è breve rispetto alla dimensione del network, fenomeno noto popolarmente come sei

gradi di separazione. Le reti scale-free presentano un alto numero di nodi

con pochi collegamenti, e un ristretto numero di nodi (i cd. hub) con moltis- simi collegamenti, secondo la distribuzione esponenziale (Bara- bási e Frangos, 2002), proprietà verificabile usando un algoritmo basato sul test di Kolmogorov-Smirnov (Clauset et al. 2009).

Scopo di questo lavoro pilota è verificare l’ipotesi topologica descritta dianzi con l’ausilio dei dati disponibili, al fine di verificare le doti di robu- stezza e resilienza e la presenza di hub delle reti, ed eventualmente di espri- mere delle ipotesi su un eventuale scostamento.

2. Esperimento

La raccolta dei dati, disponibili pubblicamente, è stata effettuata utiliz- zando gli export completi dei singoli siti. In particolare per ogni sito vengono messi a disposizione dei file xml contenenti i dati delle singole entità (post, commenti, etc...).

Gli esperimenti sono stati svolti su alcune delle comunità più piccole. Considerando le relazioni come uniche e prive di verso, in ognuna delle reti, circa il 99% delle relazioni coinvolge un’unica componente connessa che è stata oggetto della nostra analisi. In Tabella 1 una sintesi dei dati raccolti per ognuno dei siti analizzati.

Cardinalità (utenti) Archi Cardinalità componente connessa Archi compo- nente connessa Beer 2318 1492 562 (24%) 1488 (99.7%) OpenSource 2644 2047 555 (20%) 2043 (99.8%) Es 3915 3551 878 (22%) 3544 (99.8%) Sports 5018 6443 2101 (42%) 6431 (99.8%) Chess 5620 6818 1626 (29%) 6879 (99.9%) Startups 6884 4650 1626 (23%) 4637 (99.7%) Space 8013 10060 2172 (27%) 10057 (99.9%)

Tabella 1: sintesi dei dati relativa alla raccolta di informazioni effettuata

I parametri analizzati per stabilire se le reti siano small world scale-free sono stati il coefficiente di clustering e la lunghezza media dei cammini tra due nodi (small world) e la distribuzione del numero di collegamenti dei nodi (scalefree). I risultati sono esposti in Tabella 2.

Coefficente di clustering

Lunghezza cammini

Small

world Scale free

Beer 0.141 3.57 Si No OpenSource 0.350 2.87 Si No Es 0.275 3.09 Si No Sports 0.240 3.42 Si No Chess 0.268 3.14 Si No Startups 0.203 3.47 Si No Space 0.375 2.91 Si No

Tabella 2: Risultati delle analisi sulle singole reti

3. Risultati e conclusioni

Dai risultati emerge che la topologia delle reti può essere approssimata a quella delle reti small world ma non a quelle scale free. In particolare il risul- tato relativo al cammino medio ed al coefficiente di clustering rispetta perfet- tamente i parametri di riferimento per le reti small world, mentre per il test basato sull’algoritmo di Kolmogorov-Smirnov (Clauset et al. 2009) per le reti

scale free ha dato esito negativo.

L’analisi dell’ipotesi scale free però richiede ancora degli approfondi- menti a causa delle dimensioni esigue delle comunità analizzate (tutte le comnità analizzare hanno meno di 10000 utenti e le componenti connesse so- no formate in media dal 25% di questi). Potrebbe quindi risultare utile sotto- porre dei questionari sull’utilizzo della piattaforma agli utenti delle varie co- munità al fine di far emergere informazioni utili per l’analisi di questo aspet- to. È inoltre ipotizzabile, considerando che l’informazione statistica possa essere persa a causa del binning dei dati, una power law di tipo “binned” (Vikar e Clauset 2012).

Questa analisi preliminare va quindi estesa per analizzare al meglio l’ipotesi scale free sia tramite l’utilizzo di comunità più grandi in cui la flut- tazione nella distrubuzione dei dati non influenzi il fitting della power law che utilizzando l’algoritmo sopracitato per verificare una possibile power law di tipo “binned”.

Questi primi risultati sono comunque di particolare interesse se si nota che la rete analizzata non è un social network in senso stretto, nel quale lo

scambio di amicizie e/o messaggi rappresenta la principale attività degli uten- ti, ma dalle rete di relazione tra gli utenti di una comunità nella quale il voto è una forma di automoderazione non correlata all’attività principale, ovvero ottenere delle risposte alle proprie domande.

Bibliografia

Barabási, A.L., Frangos, J. (2002) Linked: The New Science Of Networks,Perseus Books Group.

Boyd, D., Ellison, N. (2007) Social Network Sites: Definition, History, and Scholar- ship. Journal of Computer-Mediated Communication, 13(1).

Caci, B., Cardaci, M., Tabacchi, M.E. (2012) Facebook as asmall world: a topological hypothesis. Social Network Analysis and Mining, 2(2).

Clauset, A., Shalizi, C.R., Newman, M.E. (2009) Power-law distributions in empirical data. SIAM review, 51(4), 661-703.

Newman, M.E. (2003) Random graphs as models of networks. Handbook of graphs and networks, 35.

Petrou, M., Tabacchi, M.E., Piroddi, R. (2010) Networks of concepts and ideas. The Computer Journal, 53(10), 1738-1751.

Vikar, Y., Clauset, A. (2012) Power-law distributions in binned empirical data. The Annals of Applied Statistics, 8(1), 89-119.

Prevenzione del rischio: come la fiducia promuove

Nel documento Apprendimento, cognizione e tecnologia (pagine 98-103)

Outline

Documenti correlati