• Non ci sono risultati.

STUDI SPERIMENTALI 

5.4      Disegno Sperimentale

ogni team è coordinato da un Team Lead. Invece i Product Owner e gli Architecture  Owner non coordinano risorse, ma ciascuno di loro ha la responsabilità di organizzare  e  gestire  una  soluzione  software.  Pertanto,  avendo  coinvolto  34  Team  Lead,  22  Architecture Owner, 11 Product Owner e 77 Team Member abbiamo rappresentato  l’ecosistema di sviluppo di una grande azienda strutturata che consta di 34 team di  sviluppo (per un totale di circa 600 sviluppatori‐programmatori) e che manutiene un  catalogo di circa 30 soluzioni software complesse. Quindi possiamo sostenere di aver  costruito  un  campione  composto  da  soggetti  con  ruoli  di  coordinamento  e  con  competenze specialistiche estremamente rilevanti. 

 

5.4     Disegno Sperimentale   

Al  fine  di  osservare  gli  effetti  principali  e  di  interazione  fra  le  euristiche  coinvolte in due differenti momenti del processo decisionale a cui si è sottoposti nella  progettazione  e  realizzazione  di  software  complessi,  il  disegno  sperimentale  adottato prevede quattro variabili indipendenti: sesso, ruolo, classe di età e classe  di anzianità  

Le variabili indipendenti sono state costruite su più livelli. In dettaglio, per la  variabile indipendente sesso abbiamo due livelli (maschio/femmina); per la variabile  ruolo  abbiamo  quattro  livelli  (Team  Lead  [TL],  Product  Owner  [PO],  Architecture  Owner  [AO],  Team  Member  [TM]);  per  la  variabile  classe  di  anzianità  abbiamo  4  livelli (1‐5 anni, 6‐10 anni, 11‐15 anni, 16‐20 anni); infine per la variabile classe di età  abbiamo 4 livelli (25‐34 anni, 35‐44anni, 45‐54 anni, 55‐64 anni). 

Come  tecnica  di  ottimizzazione  abbiamo  usato  il  Fisher’s  scoring,  ovvero  la  varianza del gradiente del logaritmo della funzione di verosimiglianza. Come metodo  di  analisi  statistica  abbiamo  scelto  il  modello  di  regressione  logistica  perché  interessati  ad  analizzare  la  relazione  causale  tra  una  variabile  dipendente  dicotomica e più variabili indipendenti quantitative e qualitative (Keppel, 2001).  

Come  nella  regressione  lineare,  nell’analisi  della  regressione  logistica  l’interpretazione  della  relazione  tra  variabili  indipendenti  e  variabile  dipendente 

avviene mediante la valutazione dei parametri del modello. Nella pratica, i valori dei  parametri  della  popolazione  non  sono  noti,  essi  vengono  stimati  a  partire  dalle  osservazioni del nostro campione (Caudek, Luccio, 2001). 

Nella  stima  dei  parametri  della  regressione  logistica  il  metodo  dei  minimi  quadrati (in inglese OLS: Ordinary Least Squares) non può essere applicato, pertanto  abbiamo  utilizzato  l’algoritmo  di  massima  verosimiglianza  (maximum  likelihood  ‐  ML) che stima i parametri del modello in modo da massimizzare la funzione (log‐

likelihood function) che indica quanto è probabile ottenere il valore atteso di Y dati 

i valori delle variabili indipendenti. 

Nel  metodo  della  massima  verosimiglianza,  la  soluzione  ottimale  viene  raggiunta  partendo  da  dei  valori  di  prova  per  i  parametri  (valori  arbitrari)  i  quali  successivamente  vengono  modificati  per  vedere  se  la  funzione  può  essere  migliorata.  Il  processo  viene  ripetuto  (iteration)  fino  a  quando  la  capacità  di  miglioramento della funzione è infinitesimale (converge) (Berry, Feldman, 1985). 

Per l’interpretazione del modello della regressione logistica ci si è avvalsi di  statistiche  del  tutto  simili  a  quelle  che  esprimono  l’adeguatezza  del  modello  nel  riprodurre  i  dati  osservati  nella  regressione  lineare.  Similmente  alla  somma  dei  quadrati, nella regressione logistica si utilizza il log likelihood come criterio per la  scelta dei parametri del modello. In particolare, per ragioni matematiche, si utilizza  il valore del log likelihood moltiplicato per –2, e abbreviato come –2LL. Valori grandi  e positivi indicano una bassa capacità di previsione del modello. Nel modello con la  sola intercetta il valore della statistica –2LL rappresenta quello che nella regressione  lineare corrisponde alla devianza (o  somma  dei  quadrati totale). In aggiunta alle  statistiche relative alla valutazione dell’adeguatezza del modello (goodness of fit),  abbiamo  preso  in  considerazione  la  capacità  predittiva  dello  stesso.  Per  la  valutazione  dell’efficienza  predittiva  del  modello  abbiamo  impiegato  molti  test  comunemente  utilizzati  per  analizzare  le  tabelle  di  contingenza:  Tau  di  Kendall,  Somers’ Delta, Gamma di Goodman e Kruskal e gli Odds Ratio (Menard, 2001).  

Al  pari  della  regressione  lineare,  anche  nella  regressione  logistica  siamo  interessati  a  valutare  il  contributo  specifico  di  ogni  variabile  indipendente  sulla 

variabile  dipendente,  testandone  la  sua  significatività.  Come  nella  regressione  lineare,  la  valutazione  dei  singoli  contributi  viene  fatta  solo  quando  il  modello  nel  suo  complesso  si  è  rivelato  utile  a  migliorare  la  previsione della variabile  dipendente.  Per  valutare  il  contributo  di  ciascun  predittore  sulla  variabile  dipendente abbiamo applicato i seguenti test: Likelihood Ratio, Score e Wald (Baron,  Kenny, 1986). 

 

5.5     Compito decisionale   

Il  compito  decisionale  per  i  due  esperimenti  prevedeva  di  rispondere  ad  un  questionario  composto  da  18  domande  (10  domande  per  l’esperimento  1  e  8  domande  per  l’esperimento  2).  L’esperimento  1  voleva  indagare  il  processo  decisionale attivato per stimare i tempi di realizzazione di una funzionalità applicativa  di  un  sistema  software  complesso,  l’esperimento  2  aveva  l’obiettivo  di  indagare  il  processo decisionale attivato quando ci si trova nella condizione di poter scegliere se  mantenere o rifare (refactoring) una soluzione software complessa. 

Ciascuna  domanda  descriveva  una  situazione  di  decisione.  Ogni  domanda  presentava scenari che attivavano una o più euristiche diverse per ogni situazione  rappresentata.  La  figura  11a  presenta  i  biases  e  le  euristiche  indagate  nel  nostro  lavoro perché rilevanti in merito agli scenari presi in analisi.    EURISTICA/BIAS   DEFINIZIONE SINTETICA  Euristica della  rappresentatività  descrive la tendenza ad attribuire caratteristiche simili a oggetti simili, spesso  ignorando informazioni che dovrebbero far pensare il contrario.  Euristica  dell’ancoraggio  descrive la tendenza a fare troppo affidamento sulle prime informazioni che si  trovano quando si cerca di prendere una decisione  Euristica della  simulazionec  descrive il processo attraverso il quale smontiamo il passato e   ricostruiamo il futuro che si sarebbe potuto realizzare, ma che non è stato  Euristica della  disponibilità   descrive la tendenza a stimare la probabilità di un evento sulla base   della vividezza e dell'impatto emotivo di un ricordo, piuttosto che sulla   probabilità oggettiva  Euristica del  riconoscimento  descrive la tendenza ad orientare la scelta tra due elementi, sempre   verso ciò che viene riconosciuto, verso qualcosa di familiare.  Status quo bias  descrive la tendenza ad avere una particolare preferenze per lo   status quo quando ci si trova a prendere decisioni  Omission bias  descrive la tendenza a giudicare le azioni dannose come peggiori delle omission altrettanto dannose   Euristica dell’affetto  descrive la tendenza a prendere i giudizi e decisioni partendo dalle emozioni  suscitate dal problema e dal modo in cui lo stesso è posto