• Non ci sono risultati.

6.2.1 Parametri per la ricerca delle finestre

L’idea di base dietro alla ricerca delle finestre spaziali e temporali è quella di cercare dei valori tali da permettere di osservare una percentuale di collaborazione signifi- cativa. Si vuole quindi evitare di utilizzare finestre sia troppo grandi che troppo pic- cole, siccome in entrambi i casi la collaborazione risulterebbe appiattita verso uno dei due estremi (o completamente assente, o presente in ogni modifica).

Prima di passare a parlare in dettaglio dell’analisi effettuata sulle finestre spaziali e temporali, è necessario descrivere tre nuovi insiemi considerati per ogni tipo di distanza, chiamati Q1, Q2 e Q3. Questi tre insiemi contengono rispettivamente il primo, secondo e terzo quartile di ogni file, e.g., un valore contenuto nel Q2 della

FIGURA6.3: Gli intervalli scelti per definire le finestre. L’immagine mostra la situazione che intendono catturare.

distanza collaborativa spaziale sarà pari al valore del secondo quartile delle distanze collaborative spaziali in uno dei file esaminati (fig. 6.2).

I tre insiemi appena descritti potranno quindi essere utilizzati per la ricerca delle finestre. Q1 conterrà un valore per ogni file, corrispondente al suo primo quartile, e si potrà usare per giustificare la scelta di finestre molto piccole e vicine al valore mi- nimo, mostrando come molti file abbiano comunque un ingente numero di distanze sotto ad una certa soglia. Insieme a Q2 e Q3 invece, potrà essere usato in maniera opposta per cercare una soglia massima per la scelta delle finestre. Un eventuale insieme Q4 non viene considerato così come non viene calcolato il quarto quartile di ogni file poichè banalmente corrispondenti al più alto valore che compare.

Pertanto, partendo da queste considerazioni, sono stati scelti i seguenti intervalli indicativi entro i quali dovranno essere compresi i valori delle finestre. (fig. 6.3):

• Tra il 25% e il 75% dei valori in Q1 • Tra lo 0% e il 50% dei valori in Q2 • Tra lo 0% e il 25% dei valori in Q3

A questo punto, si può cominciare con l’analisi delle finestre.

6.2.2 Finestre spaziali

Si parta considerando le finestre spaziali. L’articolo prende in considerazione quat- tro finestre, da 10, da 80, da 400 e da 800 caratteri. Utilizzando Q3 si possono veloce- mente scartare le finestre da 400 e 800 perché estremamente grandi. Infatti, per circa il 60% dei file, più di tre quarti di tutte le distanze è inferiore al 400 (fig. 6.4). Questo significa che, prendendo come finestra 400, in più della metà dei file avrei più del 75% degli edit marcati come collaborativi.

La finestra da 80 caratteri risulta sempre piuttosto grande poiché include più della metà delle distanze per più del 50% dei file (fig. 6.5), tuttavia può avere senso come valore più alto.

Quindi, una finestra massima da 80 caratteri sembra risultare adeguata, rimane solamente da cercare un valore minimo. A tal proposito, si può notare come 10 sia un valore troppo elevato per consistere nella minima finestra analizzata. Infatti,

28 Capitolo 6. Esperimento

FIGURA6.4: Distribuzione dei valori del Q3 delle distanze spaziali. Il 68.6% dei suoi valori è inferiore a 400.

FIGURA6.5: Distribuzione dei valori del Q2 delle distanze spaziali. Il 64.7% dei suoi valori è inferiore a 80.

FIGURA6.6: Distribuzione dei valori del Q1 delle distanze spaziali. Il 66.9% dei suoi valori è inferiore a 2.

osservando il Q1 (fig. 6.6) delle distanze spaziali nei vari file, si può notare come per più della metà di questi più di un quarto delle distanze risulta inferiore o uguale a 1. Può quindi aver senso partire da una finestra molto piccola, come 1 o 2 caratteri.

Pertanto:

• Tra le finestre spaziali prese dall’articolo, quelle da 10 e 80 caratteri sembrano le più interessanti, che quindi può avere senso riprendere.

• Difficilmente le finestre spaziali da 400 e 800 caratteri avranno risultati degni di nota.

• Una finestra spaziale da 1 o 2 caratteri può essere molto interessante.

• Può avere senso inserire un’ulteriore finestra spaziale da 5 caratteri per osser- vare l’andamento tra la prima finestra e quella da 10, così come una finestra da 40 caratteri per quello tra la finestra da 10 e quella da 80.

6.2.3 Finestre temporali

Si prendano in considerazione le finestre temporali. L’articolo prende in considera- zione tre finestre, da 5, 10 e 60 secondi. A differenza delle finestre spaziali, quelle temporali sembrano molto più adeguate. Infatti, il Q1 delle distanze temporali asso- lute contiene valori molto più elevati rispetto a quello delle distanze spaziali. Mentre nel caso spaziale si aveva un valore inferiore a 2 caratteri nel 66% dei casi, in questo il valore è superiore a 60 secondi in più del 60% dei casi (Fig. 6.7). Si deve quindi ragionare in maniera diversa, cercando finestre temporali più alte.

Osservando il Q3 delle distanze temporali assolute (fig. 6.8), si nota come la finestra di 900 secondi scelta dai ricercatori di Google per i loro studi [15] può avere risultati interessanti. Può quindi avere senso considerare la finestra come massima e prenderne una intermedia tra quella e 60 secondi per avere un’idea dell’andamento.

30 Capitolo 6. Esperimento

FIGURA6.7: Distribuzione dei valori del Q1 delle distanze temporali

assolute. Il 61,3% dei suoi valori è superiore a 60.

FIGURA6.8: Distribuzione dei valori del Q3 delle distanze temporali assolute. Il 64,1% dei valori è superiore a 900.

FIGURA 6.9: Distribuzione dei valori del Q1 delle delle distanze temporali relative. Circa il 25% dei valori è inferiore a 10.

• Tra le finestre temporali prese dall’articolo, quelle da 5, 10 e 60 secondi sem- brano le più interessanti, che quindi può avere senso riprendere.

• Non ci dovrebbero essere differenze molto rilevanti tra la finestra da 5 secondi e quella da 10, può avere senso considerarne solo una.

• Una finestra spaziale sopra ai 60 secondi può essere molto interessante. • Può avere senso considerare la stessa finestra da 900 secondi scelta dai ri-

cercatori di Google in [15], e un eventuale finestra intermedia da 300 o 600 secondi.

6.2.4 Finestre temporali relative

Potrebbe essere interessante proporre delle finestre temporali relative attraverso l’a- nalisi delle distanze temporali relative, in maniera analoga a quanto fatto negli altri casi. A tal proposito, osservando il Q1 delle distanze temporali relative (fig. 6.9) si può notare come una finestra minima adeguata potrebbe essere di 10 edit, poi- ché risulta superiore solo al 24,4% dei valori. Una finestra di 1 risulta estremamente piccola, così come una finestra minima di 5, superiore al 13,9% dei valori.

Un valore massimo potrebbe essere di 80 edit, che risulta inferiore circa al 30% dei terzi quartili di tutti i file (Fig. 6.10), mentre un eventuale valore intermedio potrebbe essere 40, posto a metà tra i due in entrambi i grafici.

Pertanto per la misura di un concetto di collaborazione temporale relativa, si potrebbero considerare delle finestre da 10, 40 e 80 edit.

Documenti correlati