2. MATERIALI E METODI 19
2.3 ANALISI DEI DATI 28
2.3.2 Relazioni tra le praterie e le variabili abiotiche 31
Allo scopo di individuare ed analizzare delle relazioni maggiormente significative tra variabili biotiche e abiotiche valide per l’intero bacino del Mediterraneo, dopo aver identificato quali sono le variabili biotiche da prendere in considerazione ci si è concentrati sull’analisi delle relazioni tra variabili abiotiche e variabili biotiche.
2.3.2.1 Approccio di meta-‐analisi
Dal momento che i dati derivano da studi diversi tra loro si è ritenuto opportuno utilizzare il metodo della meta-‐analisi per verificare la generalità relazioni tra praterie e caratteristiche abiotiche. In particolare è stato adottato uno schema ricavato da (Harrison, 2011), che prevede una serie di step:
-‐ eseguire una ricerca sistematica della letteratura approfondita tramite parole chiave e metodologie di ricerca ben precise, valutando criticamente i risultati degli studi e quali inserire nella review;
-‐ scegliere un’appropriata misura della dimensione dell’effetto; -‐ identificare possibili fattori che possono influenzare i risultati
degli studi;
L’effetto da considerare e le metodologie della ricerca in letteratura sono già stati spiegati nei precedenti capitoli mentre per quanto riguarda la scelta della misura della dimensione dell’effetto da calcolare, trovandoci difronte a dati continui che sono risposta a variabili indipendenti continue, risulta necessario utilizzare la correlazione come misure della dimensione dell’effetto.
Per quanto riguarda i possibili fattori che possono influenzare i risultati dei singoli studi sono in parte già stati già individuati (distribuzione latitudinale e longitudinale, distribuzione per bacino, substrato).
Per quanto riguarda i metodi di analisi si è iniziato da un’analisi delle correlazioni suddivise per i diversi studi. In seguito sono state considerate tutte le correlazioni tra variabili biotiche e abiotiche che hanno almeno 5 studi con una correlazione significativa.
Per questo sottogruppo di correlazioni sono stati creati dei grafici di tipo "Forest plot" in cui sono stati inseriti tutti gli studi con un numero di punti su cui è stata stimata la correlazione maggiore o uguale a 20 in modo da prendere in considerazione solo dataset con adeguata robustezza. Attraverso Scatter plot, per ciascuno studio in esame, è stato verificato che la correlazione fosse stata stimata con un adeguato range di variabilità delle variabili abiotiche (evitando, ad esempio dataset con valori delle variabili abiotiche con varianza nulla perché i punti di campionamento sono stati presi nel medesimo sito). Dataset ritenuti non adeguati, se presenti, sono stati eliminati dall'analisi.
Tramite il Forest plot si ha quindi una rappresentazione grafica in cui sono riportati, per ogni studio incluso, i valori relativi alle dimensioni dell’effetto (correlazione) e dell’intervallo di confidenza oltre alla dimensione dell’effetto
degli effetti di vari studi e utilizzare la dimensione dell’effetto complessiva si possono utilizzare due tipologie di modelli (Harrison, 2011):
-‐ il modello ad effetti fissi (fixed effects model) assume che le eventuali differenze tra i risultati dei diversi studi inclusi nella meta-‐analisi sono dovute solo variazioni casuali;
-‐ il modello ad effetti casuali (random effects model) fa alcune assunzioni conservative con l’obbiettivo di combinare i diversi studi. Il risultato complessivo è interpretato con cautela dal momento che ogni studio potrebbe misurare qualcosa di leggermente differente dagli altri.
Per decidere quale stima usare, è stata calcolata l'eterogeneità dell'effect size (correlazioni).
Quando l’eterogeneità è alta ma le differenze tra gli studi potrebbero essere dovute a fattori ben conosciuti possono esistere dei possibili sottogruppi di studi determinati da questi fattori. In questo caso è opportuno di individuare i sottogruppi di studi che differiscono tra loro per la stima della dimensione dell’effetto.
Di conseguenza si è proceduto nella seguente maniera:
-‐ in una situazione di non eterogeneità delle stime delle dimensione dell’effetto si è proceduto ad utilizzare il modello a effetti fissi;
-‐ in caso di eterogeneità delle stime delle dimensioni dell’effetto si è proceduto ad una prima valutazione per verificare la presenza di possibili sottogruppi di studi legati a determinati fattori (stabiliti a priori; questi sono latitudine, longitudine e sottobacino) di influenza che vanno poi rianalizzati separatamente. In manca di sottogruppi si è considerato come valore della dimensione dell’effetto quello ottenuto tramite il modello ad effetti casuali.
2.3.2.2 Relazioni a scala di bacino
Per le relazioni che hanno mostrato una consistenza tra i diversi studi e ritenute più rilevanti alla luce delle esplorazioni effettuate nell'ambito di questa tesi, è stato effettuato un approfondimento a scala regionale, sviluppando dei modelli statistici per capire il ruolo delle variabili ambientali nell'influenzare le praterie.
A questo fine sono stati utilizzati tutti i punti del database sviluppato (escludendo le osservazioni con valori nulli per le variabili in esame) e calibrati dei Modelli Addittivi Generalizzati (GAM; Hastie and Tibshirani, 1990), seguendo l'approccio proposto da Wood (2006) nella libreria 'mgcv' (Wood, 2000) all'interno dell'ambiente statistico R (R Development Core Team, 2014). I GAM rappresentano una estensione dei modelli lineari, che permettono di associare a ciascun predittore (variabile indipendente) uno "smoother", garantendo un'elevata flessibilità del modello e permettendo un'immediata visualizzazione dell'effetto di ciascuna variabile in input sulla variabile di risposta. Dal momento che le diverse fonti di dati non sono bilanciate in termini di numero di osservazioni, è possibile che si manifesti eterogeneità della varianza dei residui del modello. Per ovviare a questo problema, sono stati calibrati modelli valutando diverse strutture della matrice di covarianza degli errori. In particolare, seguendo il protocollo proposto da Zuur et al. (2009), prima è stata valutata la struttura ideale del modello analizzando la distribuzione dei residui, poi è stata ricercata la migliore struttura della parte fissa considerando l'AIC (Akaike Information Criterion; Akaike, 1973). I modelli alternativi sono stati costruiti seguendo le alternative:
1. la variabile abiotica principale (quella più fortemente correlata alla variabile biotica di risposta);
2. la variabile abiotica principale e le altre variabili abiotiche continue correlate con la variabile biotica selezionata;
3. la variabile abiotica principale, le altre variabili abiotiche continue correlate con la variabile biotica selezionata e il fattore impatto;
4. la variabile abiotica principale (quella più fortemente correlata alla variabile biotica di risposta) e il fattore impatto;
5. la variabile abiotica principale, le altre variabili abiotiche continue correlate con la variabile biotica selezionata e i fattori geografici;
6. la variabile abiotica principale (quella più fortemente correlata alla variabile biotica di risposta) e i fattori geografici;
8. la variabile abiotica principale (quella più fortemente correlata alla variabile biotica di risposta), il fattore impatto e i fattori geografici;
Riassumendo, i passaggi effettuati possono essere rappresentati in uno schema logico presentato in figura 3.
Figura 3. Schema logico del lavoro