STUDI SPERIMENTALI
5.4 Disegno Sperimentale
ogni team è coordinato da un Team Lead. Invece i Product Owner e gli Architecture Owner non coordinano risorse, ma ciascuno di loro ha la responsabilità di organizzare e gestire una soluzione software. Pertanto, avendo coinvolto 34 Team Lead, 22 Architecture Owner, 11 Product Owner e 77 Team Member abbiamo rappresentato l’ecosistema di sviluppo di una grande azienda strutturata che consta di 34 team di sviluppo (per un totale di circa 600 sviluppatori‐programmatori) e che manutiene un catalogo di circa 30 soluzioni software complesse. Quindi possiamo sostenere di aver costruito un campione composto da soggetti con ruoli di coordinamento e con competenze specialistiche estremamente rilevanti.
5.4 Disegno Sperimentale
Al fine di osservare gli effetti principali e di interazione fra le euristiche coinvolte in due differenti momenti del processo decisionale a cui si è sottoposti nella progettazione e realizzazione di software complessi, il disegno sperimentale adottato prevede quattro variabili indipendenti: sesso, ruolo, classe di età e classe di anzianità
Le variabili indipendenti sono state costruite su più livelli. In dettaglio, per la variabile indipendente sesso abbiamo due livelli (maschio/femmina); per la variabile ruolo abbiamo quattro livelli (Team Lead [TL], Product Owner [PO], Architecture Owner [AO], Team Member [TM]); per la variabile classe di anzianità abbiamo 4 livelli (1‐5 anni, 6‐10 anni, 11‐15 anni, 16‐20 anni); infine per la variabile classe di età abbiamo 4 livelli (25‐34 anni, 35‐44anni, 45‐54 anni, 55‐64 anni).
Come tecnica di ottimizzazione abbiamo usato il Fisher’s scoring, ovvero la varianza del gradiente del logaritmo della funzione di verosimiglianza. Come metodo di analisi statistica abbiamo scelto il modello di regressione logistica perché interessati ad analizzare la relazione causale tra una variabile dipendente dicotomica e più variabili indipendenti quantitative e qualitative (Keppel, 2001).
Come nella regressione lineare, nell’analisi della regressione logistica l’interpretazione della relazione tra variabili indipendenti e variabile dipendente
avviene mediante la valutazione dei parametri del modello. Nella pratica, i valori dei parametri della popolazione non sono noti, essi vengono stimati a partire dalle osservazioni del nostro campione (Caudek, Luccio, 2001).
Nella stima dei parametri della regressione logistica il metodo dei minimi quadrati (in inglese OLS: Ordinary Least Squares) non può essere applicato, pertanto abbiamo utilizzato l’algoritmo di massima verosimiglianza (maximum likelihood ‐ ML) che stima i parametri del modello in modo da massimizzare la funzione (log‐
likelihood function) che indica quanto è probabile ottenere il valore atteso di Y dati
i valori delle variabili indipendenti.
Nel metodo della massima verosimiglianza, la soluzione ottimale viene raggiunta partendo da dei valori di prova per i parametri (valori arbitrari) i quali successivamente vengono modificati per vedere se la funzione può essere migliorata. Il processo viene ripetuto (iteration) fino a quando la capacità di miglioramento della funzione è infinitesimale (converge) (Berry, Feldman, 1985).
Per l’interpretazione del modello della regressione logistica ci si è avvalsi di statistiche del tutto simili a quelle che esprimono l’adeguatezza del modello nel riprodurre i dati osservati nella regressione lineare. Similmente alla somma dei quadrati, nella regressione logistica si utilizza il log likelihood come criterio per la scelta dei parametri del modello. In particolare, per ragioni matematiche, si utilizza il valore del log likelihood moltiplicato per –2, e abbreviato come –2LL. Valori grandi e positivi indicano una bassa capacità di previsione del modello. Nel modello con la sola intercetta il valore della statistica –2LL rappresenta quello che nella regressione lineare corrisponde alla devianza (o somma dei quadrati totale). In aggiunta alle statistiche relative alla valutazione dell’adeguatezza del modello (goodness of fit), abbiamo preso in considerazione la capacità predittiva dello stesso. Per la valutazione dell’efficienza predittiva del modello abbiamo impiegato molti test comunemente utilizzati per analizzare le tabelle di contingenza: Tau di Kendall, Somers’ Delta, Gamma di Goodman e Kruskal e gli Odds Ratio (Menard, 2001).
Al pari della regressione lineare, anche nella regressione logistica siamo interessati a valutare il contributo specifico di ogni variabile indipendente sulla
variabile dipendente, testandone la sua significatività. Come nella regressione lineare, la valutazione dei singoli contributi viene fatta solo quando il modello nel suo complesso si è rivelato utile a migliorare la previsione della variabile dipendente. Per valutare il contributo di ciascun predittore sulla variabile dipendente abbiamo applicato i seguenti test: Likelihood Ratio, Score e Wald (Baron, Kenny, 1986).
5.5 Compito decisionale
Il compito decisionale per i due esperimenti prevedeva di rispondere ad un questionario composto da 18 domande (10 domande per l’esperimento 1 e 8 domande per l’esperimento 2). L’esperimento 1 voleva indagare il processo decisionale attivato per stimare i tempi di realizzazione di una funzionalità applicativa di un sistema software complesso, l’esperimento 2 aveva l’obiettivo di indagare il processo decisionale attivato quando ci si trova nella condizione di poter scegliere se mantenere o rifare (refactoring) una soluzione software complessa.
Ciascuna domanda descriveva una situazione di decisione. Ogni domanda presentava scenari che attivavano una o più euristiche diverse per ogni situazione rappresentata. La figura 11a presenta i biases e le euristiche indagate nel nostro lavoro perché rilevanti in merito agli scenari presi in analisi. EURISTICA/BIAS DEFINIZIONE SINTETICA Euristica della rappresentatività descrive la tendenza ad attribuire caratteristiche simili a oggetti simili, spesso ignorando informazioni che dovrebbero far pensare il contrario. Euristica dell’ancoraggio descrive la tendenza a fare troppo affidamento sulle prime informazioni che si trovano quando si cerca di prendere una decisione Euristica della simulazionec descrive il processo attraverso il quale smontiamo il passato e ricostruiamo il futuro che si sarebbe potuto realizzare, ma che non è stato Euristica della disponibilità descrive la tendenza a stimare la probabilità di un evento sulla base della vividezza e dell'impatto emotivo di un ricordo, piuttosto che sulla probabilità oggettiva Euristica del riconoscimento descrive la tendenza ad orientare la scelta tra due elementi, sempre verso ciò che viene riconosciuto, verso qualcosa di familiare. Status quo bias descrive la tendenza ad avere una particolare preferenze per lo status quo quando ci si trova a prendere decisioni Omission bias descrive la tendenza a giudicare le azioni dannose come peggiori delle omission altrettanto dannose Euristica dell’affetto descrive la tendenza a prendere i giudizi e decisioni partendo dalle emozioni suscitate dal problema e dal modo in cui lo stesso è posto