1 Plot di rilevamento vegetazionale
3.3 Analisi dei dat
3.3.3 Modelli occupancy
Le variazioni nei tassi di estinzione e colonizzazione in popolazioni locali instabili determinano la persistenza a livello regionale di specie sensibili alla frammentazione (Hanski, 1998). Per studiare le dinamiche esistenti in popolazioni spazialmente strutturate e definire quali tra le variabili esaminate sono maggiormente implicate negli eventi di estinzione e colonizzazione è stata effettuata una analisi dei dati di presenza/assenza delle diverse specie nei frammenti campionati.
101 In una prima fase è stato creato un database che ricostruisse gli eventi di presenza/assenza (detection history) delle quattro specie studiate in ogni controllo effettuato. La presenza delle specie è stata determinata in base agli eventi di cattura nel corso delle varie sessioni.
Per il moscardino, a causa della maggiore elusività della specie (Bright e Morris, 1996), sono stati utilizzati anche segni indiretti della presenza della specie come la presenza di nuovi nidi all‟interno dei nest-box. Questo è stato possibile grazie alla caratteristica forma con cui il moscardino realizza il nido, difficilmente confondibile con quello di altre specie (Juškaitis, 2008).
Per quanto riguarda il genere Apodemus, la distinzione tra A. flavicollis e A. sylvaticus nelle popolazioni dell‟Europa meridionale non è sempre facile (vedi paragrafo 2.2.3). Quindi, per avere maggiore supporto nella distinzione e nei dati di presenza delle due specie, si è scelto di effettuare la determinazione della specie mediante PCR (Polymerase Chain Reaction) di alcuni campioni di tessuto provenienti da individui catturati in tutti i frammenti del paesaggio. Le analisi PCR sino ad ora effettuate (165 campioni su un totale di circa 2900 individui catturati pari al 5,6%) sono piuttosto esigue in rapporto al numero di individui marcati e quindi di campioni raccolti (Iannarilli, 2012); altri campioni saranno analizzati prima della conclusione del progetto. Tuttavia i dati parziali mostrano un errore di determinazione da parte dei rilevatori pari al 29%.
I dati di presenza/assenza sono stati analizzati secondo l‟approccio proposto da MacKenzie et
al. (2003). Un altro approccio comunemente usato per stimare la probabilità di colonizzazione ed
estinzione è quello dell‟incidence function (Hanski, 1998), nel quale l‟”incidenza” è considerata sia come la probabilità che una specie occupi un sito specifico che come la proporzione attesa di siti simili occupati. Questo approccio presume che conoscendo il pattern di siti occupati si possano stimare la probabilità di estinzione e di colonizzazione. Tuttavia, è sempre difficile inferire il processo (dinamiche di estinzione/colonizzazione) dal modello (presenza nei siti di campionamento) e, generalmente, i pattern che si osservano possono essere generati da diversi processi (Clinchy et al., 2002). Inoltre, questo modello non tiene conto delle false assenze: se la specie viene trovata in un sito, questo ne indica chiaramente la presenza; al contrario, quando la specie non viene catturata, ciò può essere dovuto a due circostanze: o la specie non è presente nel sito (quindi è realmente assente) oppure la specie è presente ma non è stata catturata. Non tenere conto di questa seconda eventualità (delle cosiddette false assenze), comporta:
una sottostima della proporzione di area occupata (PAO); un bias nella stima dei tassi di colonizzazione ed estinzione;
errate conclusioni riguardo le relazioni esistenti tra la presenza della specie e le caratteristiche dell‟habitat, soprattutto in presenza di un grado di catturabilità della specie che varia a seconda dell‟habitat (MacKenzie, 2005).
102 Per stimare la proporzione di siti occupati da una specie in un certo intervallo di tempo, MacKenzie et al. (2003) hanno elaborato un metodo che tiene conto della possibilità che la specie non venga rilevata, anche se essa è presente nel sito (imperfect detectability); questi eventi hanno luogo quando la probabilità di cattura della specie è inferiore ad 1 (p < 1).
Il disegno di campionamento (Multi-season occupancy model) che permette di applicare questo metodo presuppone che un certo numero di siti N, vengano visitati per un dato numero di periodi primari di campionamento T; ognuno di questi periodi primari include un certo numero k di visite al sito. In ogni occasione, vengono raccolti dati sulla presenza o l‟assenza della specie in ciascun sito. Secondo MacKenzie et al. (2003; 2005) gli assunti di questo metodo sono:
1. Durante le k visite al sito il sistema è considerato demograficamente chiuso, ciò significa che in ogni sito campionato non si sono verificati processi di colonizzazione/estinzione o immigrazione/emigrazione. Gli schemi di presenza della specie nei siti possono invece variare (sono considerati demograficamente aperti) tra i diversi periodi primari di campionamento T.
2. Le specie non sono falsamente rilevate.
3. I siti di rilevamento sono tra loro indipendenti. Questo significa che i siti dovrebbero essere abbastanza lontani da essere biologicamente indipendenti.
4. In un dato momento tutti i parametri sono costanti in tutti i siti.
La violazione degli assunti comporta un inevitabile bias nella stima dei parametri e conseguentemente nei modelli occupancy.
La probabilità di presenza φ ad un determinato tempo t è definita dall‟equazione:
φ
t =φ
t-1(1 -ε
t-1) + (1 -φ
t-1) γt-1in cui la probabilità di presenza φ al tempo t dipende dalla probabilità di presenza della specie al tempo t - 1, dalla probabilità di estinzione
ε
, e dalla probabilità di colonizzazione γ.Le potenziali relazioni tra un particolare parametro della precedente equazione e le covariate di interesse, possono essere analizzate usando il modello logistico:
θ = EXP(Yβ) 1 + EXP (Yβ)
103 in cui θ è la probabilità di interesse (ad esempio φ), Y è la matrice contenente le informazioni relative alla covariata e β è il vettore del coefficiente del modello logistico da stimare (MacKenzie
et al., 2003).
Possono essere elaborati e testati una serie di modelli, costruiti per riflettere le ipotesi formulate circa il funzionamento del sistema in esame. In Tabella 5 sono riportate le covariate in funzione delle quali sono stati modellizzati i diversi parametri relativi alle probabilità di presenza, colonizzazione, estinzione e cattura.
Tabella 5. Riassunto delle ipotesi testate e lista delle covariate utilizzate come variabili predittive per i modelli
occupancy. Il simbolo x indica che le probabilità di presenza φ, colonizzazione γ, estinzione ε, e cattura p sono state
modellizzate in funzione delle covariate indicate nella colonna “Lista delle covariate”. Covariate: Pch_area = area del frammento; Pch_perimeter = perimetro del frammento; Grid_area = area della griglia; Grid/pch_area = rapporto tra le aree della griglia e del frammento; Hdg_tot = numero di siepi che originano dal frammento focale; Hdg_conn = numero di siepi che connettono ad altri frammenti; Pch_conn = numero di frammenti connessi al frammento focale; Pch_conn_area = area dei frammenti connessi; Nearest_dist = distanza dal frammento più vicino; Overl/buff = area di superficie boscata inclusa nel buffer rispetto all‟estensione del buffer stesso; N_pch_buff = numero di frammenti all‟interno dei buffer; N_hdg_buff = numero di siepi all‟interno dei buffer; Dist_big_buff = distanza del frammento più grande all‟interno dei buffer; PI = Proximity Index; PM = maturità del bosco; OD = dominanza di specie quercine; SA = disponibilità di arbusti; GLC = copertura a livello del suolo (erba + lettiera + suolo nudo); RA = disponibilità di risorse; SS_0.5-4m = struttura dello strato arbustivo tra 0.5 e 4 m; Gh_tot = produzione totale di ghiande; Gh_cer = produzione di ghiande di Quercus cerris; Gh_rov = produzione di ghiande di Q. pubescens; AA_ago/nov = cover delle specie arbustive che fruttificano tra agosto e novembre; AS = cover di specie arbustive selezionate perché perché importanti nella dieta; Mean_Tmed = media delle temperature medie giornaliere; Max_Tmax = massima delle temperature massime giornaliere; Min_Tmin = minima delle temperature minime giornaliere; Mean_rain = media dei mm di pioggia giornalieri.
Tipo di covariate Lista delle covariate φ γ ε p
Geometriche Pch_area; Pch_perimeter; Grid_area; Grid/pch_area x x x x Connessione e
isolamento
Hdg_tot; Hdg_conn; Pch_conn; Pch_conn_area; Nearest_dist; Overl/buff;
N_Pch_buff; N_hdg_buff; Dist_big_buff; PI x x x
Risorse PM; OD; SA; GLC; RA; SS_0.5-4m; Gh_tot; Gh_cer; Gh_rov; AA_ago/nov;
AS x x x
Meteorologiche Mean_Tmed; Max_Tmax; Min_Tmin; Mean_rain x
Questo tipo di analisi, non si basa sull‟approccio statistico classico del testare un‟ipotesi nulla, per supportare o meno un ipotesi, così da poterla categorizzare come significativa o non significativa, ma è fondato sul più complesso information theoretic approach, cioè sulla selezione del modello (o del set di modelli) che meglio fitta i dati raccolti (Burnham e Anderson, 2002). Questo approccio nega l‟esistenza di un “vero modello” semplice, in grado di descrivere la realtà: ogni modello è, invece, visto come un‟approssimazione della realtà. L‟obiettivo è quello di determinare quale, tra i modelli elaborati, si avvicina maggiormente alla realtà sconosciuta che ha generato i dati (Cooch e White, 2012) e per farlo esistono diversi criteri. In questo studio è stato utilizzato l‟Akaike’s Information Criterion (AIC). Come base teorica del suo approccio, Akaike
104 (1973) propose l‟uso del Kullback-Leibler information (K-L) (Kullback e Leibler, 1951), definita come la distanza tra un modello e la realtà osservata. Nel momento in cui viene definito un altro modello, può essere elaborata una misura relativa della distanza K-L. Sottraendo la distanza K-L di uno dei due modelli a quella dell‟altro, il membro dell‟equazione che rappresenta il vero modello si annulla. Come mostrato nel riquadro seguente, la differenza ottenuta stabilisce il modello migliore tra i due elaborati, cioè quello che si avvicina maggiormente alla realtà.
K-L1 = Realtà - modello1
K-L2 = Realtà - modello2
(K-L1) - (K-L2) = (Realtà - modello1) - (Realtà - modello2) =
= Realtà - modello1 - Realtà modello2 =
= modello2 – modello1
In questo modo Akaike definì una misura per stimare quale, tra tutti i modelli delineati, si avvicina maggiormente alla realtà sconosciuta che ha generato i dati e che minimizza la distanza K- L (Cooch e White, 2012). Inoltre, Akaike dimostrò la relazione esistente tra la distanza K-L e la funzione di Fisher che massimizza il log-likelihood (Burnham e Anderson, 2002) come si può evincere anche dalla formula che esprime l‟AIC:
AIC = −2 log ℒ θ y + 2K
dove l‟espressione log(ℒ(θ y)) è il valore di log-likelihood al suo punto massimo così come teorizzato da Fisher (1922), θ è il vettore del parametro da stimare, y rappresenta il dato empirico e
k è il numero di parametri stimati.
I modelli testati vengono ordinati in base all‟AIC e il modello con il valore di AIC più basso è il
best model. Gli altri modelli sono classificati in base alla differenza tra il proprio AIC e quello del
modello migliore (ΔAIC = AICbest - AICx). Questa misura, definita ΔAIC, ha grande importanza
nella fase di selezione dei modelli che meglio fittano i dati raccolti. Secondo Burnham e Anderson (2002), si può affermare con una ragionevole sicurezza che, entro i 2*ΔAIC, i modelli hanno approssimativamente lo stesso peso nei dati, e rappresentano quindi buoni modelli.
Il modello con il valore di AIC più basso (best model) può essere definito anche come il modello più “parsimonioso”, ovvero quello che trova il giusto compromesso tra “precisione” e massimo adattamento alla realtà o tra distorsione e varianza (Fig. 19). La precisione (o la distanza K-L) può essere aumentata con l'aggiunta di altri parametri nel modello, ma ad un certo punto, l‟ulteriore aggiunta avrà l'effetto opposto a quello desiderato, cioè la stima della distanza relativa K-
105 L aumenterà a causa del "rumore" nei parametri stimati che non sono realmente necessari per ottenere un buon modello (Burnham e Anderson, 2002). Questo concetto è espresso anche nella formula dell‟AIC, dove il primo termine sul lato destro (-2log(ℒ(θ y))) tende a diminuire con l‟aggiunta di parametri al modello, mentre il secondo termine (2k) aumenta quanti più parametri sono aggiunti al modello.
Nel caso di survey con basso numero di siti campionati, il parametro AIC viene corretto per tenere conto dell‟effettivo numero di siti e viene indicato con la sigla AICc:
AIC = −2 log ℒ θ y + 2K n − K − 1n
dove n è la dimensione del campione.
Dato il numero di frammenti campionati in questo studio (29 per i terricoli, 30 per il moscardino) si è scelto di utilizzare nelle nostre analisi l‟AICc.
Fig. 19. In questo grafico è schematizzato il concetto di scelta del best model, ovvero il giusto compromesso tra “precisione” e massimo adattamento alla realtà o tra distorsione e varianza.
b i a s v a r i a n c e best model few many
106
4. Risultati