• Non ci sono risultati.

CAPITOLO 4 – APPROCCIO METODOLOGICO DELLA RICERCA E STRUMENTI DI ANALISI

4.4 Metodologia di elaborazione e analisi

4.4.3 Bayesian network analysis

4.4.3.1 Confronto con la statistica classica

L’approccio Bayesiano consente di superare alcuni limiti tipici delle tecniche di statistica classica che si applica generalmente alle tematiche oggetto di studio, come i modelli di regressione (regressione lineare, analisi discriminante, modelli Tobit e modelli logit) presentano alcune limitazioni rilevanti, tra cui alcune caratteristiche particolari dei dati e della grandezza del campione. Ad esempio, la regressione e altre statistiche possono essere utilizzate per identificare ed esplorare l'intensità delle relazioni tra le variabili ma i modelli possono essere fortemente influenzate da valori estremi (outliers) oppure sono necessarie

135

grandi dimensioni del campione per fornire un numero sufficiente di entrambe le categorie di risposta variabile (es. sì / no).

Per quanto concerne la valutazione della significatività di un’ipotesi, mentre la statistica classica utilizza generalmente il calcolo del p-value, fissando un'ipotesi nulla e un valore soglia α (per convenzione di solito 0,05) che indica il livello di significatività del test, il fattore di Bayes fornisce diversi vantaggi, in particolare permette al ricercatore di fare una dichiarazione circa l'ipotesi alternativa, piuttosto che l'ipotesi nulla (Jarosz & Wiley 2014). Il fattore di Bayes è un rapporto che confronta la validità dell’adattamento dei dati sotto l'ipotesi nulla con la validità dell’adattamento sotto l'ipotesi alternativa. Un modo semplificato per esprimere questo è:

BF01 = probabilità di dati di H0 / probabilità di dati di H1.

Pertanto, all'aumentare BF01, ci sono più prove a sostegno dell'ipotesi nulla, e meno a favore dell'ipotesi alternativa. Invertendo si ottiene il contrario; se 1 / BF01 = 5, i dati hanno cinque volte più probabilità di verificarsi sotto l'ipotesi alternativa rispetto alla ipotesi nulla.

I due metodi, p-value e fattore di Bayes, sono confrontati da (Wagenmakers, 2007):

1. Il p-value dipende da dati ipotetici. L'approccio bayesiano considera solo i dati osservati, e come quei dati si riferiscono alle ipotesi nulla ed alternativa.

2. Il p-value è condizionato dalle intenzioni del ricercatore. L'approccio bayesiano non è alterato da interruzioni o criteri di valutazione (Rouder, 2014). Infatti, in una analisi bayesiana completa, l’analisi di un lotto di dati può essere utilizzata per informare l'analisi del lotto successivo.

3. Il p-value non concede evidenza statistica. Poiché i fattori di Bayes sono rapporti di probabilità, due fattori di Bayes di pari valore rappresentano la stessa quantità di prove a favore dell'ipotesi alternativa, indipendentemente dalla dimensione del campione o da altri fattori esterni.

4. L’approccio che utilizza il p-value considera solo i dati estremi sotto l'ipotesi nulla, senza alcuna considerazione per l'ipotesi alternativa. Tutti gli approcci bayesiani sono confronto di modelli. Ciò significa che un fattore di Bayes considera la probabilità che si verifichi sia l’ipotesi nulla che l’ipotesi alternativa. Nell’ottica del ricercatore, questo dovrebbe essere più conforme agli obiettivi generali piuttosto che semplicemente rifiutare l'ipotesi nulla.

Oltre alla valutazione delle ipotesi tramite l’applicazione del fattore di Bayes, l’efficacia del modello bayesiano può essere valutata attraverso l'analisi di sensibilità, una tecnica comunemente utilizzata nei modelli matematici e nel campo della teoria delle decisioni per indagare l'incertezza dei parametri di un modello ed il loro effetto sulla produzione del modello (Hamby, 1994; Coupe et al., 2000). Per i BN questo significa studiare le variazioni delle probabilità del nodo di destinazione a seguito di variazioni di valori della rete (Coupe et al., 2000). L'analisi di sensibilità è considerata cruciale per la validazione del modello e per

136

definire gli obiettivi di ulteriori ricerche (Hamby, 1994). Viene eseguita sul modello BN per ridurre l'incertezza nel nodo bersaglio e per identificare quei nodi che hanno il maggiore impatto sul nodo bersaglio (Hamby, 1994; Coupe et al., 2000; Johnson et al., 2012).

I punti di forza e le limitazioni potenziali per l'utilizzo dei BN sono descritti da Ticehurst et al., (2008). I punti di forza sono i seguenti:

 Forniscono una rappresentazione concettuale di causa ed effetto, e quindi quantificano i rapporti in esame.

 Sono in grado di incorporare gli aspetti quantitativi e qualitativi dei dati rendendo l'approccio adatto all'integrazione dei fattori sociali, ecologici ed economici per esaminare questioni complesse (Bromley et al., 2005).

 La distribuzione delle probabilità cerca di riflettere le incertezze inevitabili legate all'impatto delle variabili l'una sull'altra (Varis & Kuikka, 1997). Questo permette all'utente di effettuare un giudizio sull'affidabilità delle previsioni del modello.

 Il processo utilizzato per sviluppare i BN è particolarmente adatto per facilitare la partecipazione delle parti interessate allo sviluppo, alla sperimentazione e all’utilizzo del modello.

 Gli stati, o classi, utilizzati per definire ogni variabile nel BN possono essere determinati in modo da riflettere importanti e adeguate soglie che sono rilevanti per i decisori (ad esempio, una soglia di reddito annuo sotto la quale la gente non investirà più in NRM sulle loro proprietà).

 Forniscono un mezzo per documentare la comprensione dei fruitori e i presupposti di funzionamento del sistema, che possono poi essere rivisti e aggiornati, mantenendo così un record della conoscenza aziendale in corso.

 Sono ben adatti al processo di gestione flessibile in cui i manager sono sollecitati a pianificare, attuare azioni, monitorare i risultati, rivedere e aggiornare le programmazioni (Smith et al., 2007). Alcuni limiti dei BN sono:

 Non possono incorporare cicli di feedback e, nella loro forma più elementare, rappresentano grossolanamente le dinamiche spaziali e temporali.

 Gli stati o classi utilizzate per definire ciascuna variabile, se mal definite, possono mascherare l'impatto di un particolare scenario o condizione di ingresso.

 Un BN mal strutturato potrebbe non essere in grado di fornire una conoscenza delle questioni di interesse, e potrebbe anche mascherare alcuni degli impatti importanti dei diversi scenari.

Per questi motivi, la scelta metodologica per l’elaborazione e l’interpretazione dei dati è ricaduta sul modello Bayesiano. Inoltre, tale modello è visivamente accattivante, facile da usare, da comprendere e da interagire. Per informazioni più dettagliate sui vantaggi e gli

137

svantaggi dei BN e confronti con metodi statistici alternativi, si rimanda a Wilson et al, 2006; Uusitalo, 2007; Ahmed et al., 2009; Ticehurst et al., 2011.