• Non ci sono risultati.

Il percorso della ricerca: tecniche e modell

un’analisi empirica delle intenzioni individuali di fecondità

4.5. Il percorso della ricerca: tecniche e modell

La selezione delle tecniche da utilizzare per l’analisi dei dati rappresenta un passaggio cruciale nel percorso di una ricerca sociale. In questo caso, la decisione da un lato di servirsi di una base informativa quantitativa, composta dai dataset raccolti nell’ambito della Generations and Gender Survey, e dall’altro di verificare ipotesi formulate principalmente nei termini di una valutazione dell’effetto che alcuni fattori esercitano sullo stato di una variabile considerata da essi dipendente ha orientato verso un’analisi condotta attraverso la specificazione di una serie di modelli di regressione.

La scelta di trattare un tema come le intenzioni di fecondità a livello individuale con un’analisi quantitativa anziché un approfondimento qualitativo volto ad indagare, ad esempio, come, perché e attraverso quali processi gli individui giungono a formulare l’intenzione o meno di avere un figlio, è legato all’obiettivo della ricerca. In particolare, come si è visto, pur dovendo rinunciare in questo modo alla

variabili in grado di esprimerle, contribuendo anche a specificare le relazioni tra i concetti e le variabili macro con i concetti e le variabili micro in modo da supportare le analisi multilivello (Spielauer, 2004a, 2004b).

243 I database raccolti nell’ambito del Generations and Gender Programme sono alla base anche del progetto REPRO Reproductive Decision-Making in a Macro-Micro Perspective, condotto nell’ambito del settimo Programma Quadro della Commissione Europea, che si propone di studiare le intenzioni di fecondità nell’ottica della teoria socio-psicologica del comportamento pianificato e, indagando il legame con le caratteristiche del contesto, chiarire il ruolo che le condizioni macro (e in particolare le politiche familiari) rivestono all’interno dei processi decisionali individuali.

177

comprensione delle ragioni e del senso che gli individui stessi conferiscono all’azione, il fine che si intendeva perseguire era quello di realizzare un confronto fra più paesi volto a decifrare le cause di alcune incoerenze tra attese teoriche e comportamenti riproduttivi a partire dal quale cercare di individuare una serie di elementi in grado di contribuire alla spiegazione di tali differenze. L’obiettivo dunque non era quello di comprendere perché gli individui decidono o meno di avere un figlio, ma in primo luogo perché si riscontrano intenzioni (e comportamenti) così diverse nei diversi paesi e in secondo luogo come gli individui intervistati giungono a formulare le proprie intenzioni a partire dalla situazione e dal contesto in cui si trovano. Per questa ragione, si è individuato una cornice interpretativa da applicare tanto al livello macro quanto al livello micro in modo da poter mettere in relazione e confrontare i principali fattori in gioco costituiti dalle tre precondizioni RWA –

ready, willing, able – espresse attraverso indici appositamente costruiti.

A livello macro ciò si è tradotto, essenzialmente, in un confronto dapprima tra vari macro-indicatori socio-economici e i tassi di fecondità – esaminati nella veste di variabile “dipendente” come ipotizzato dalle teorie classiche – e in seguito in un confronto dei tassi di fecondità dei diversi paesi con il punteggio raggiunto negli indici RWA-macro sintetizzati a partire da una serie di indicatori appositamente selezionati. In questo caso, come si è visto, l’obiettivo era innanzitutto quello di valutare la validità e l’affidabilità degli indici stessi nell’esprimere le situazioni dei rispettivi paesi in modo da poterli poi utilizzare nell’analisi individuale.

A livello micro, invece, il percorso si è sviluppato in modo più complesso e ha previsto una suddivisione in diverse fasi corrispondenti alla verifica dei singoli interrogativi in cui sono state suddivise le ipotesi. Anche in questo caso si è proceduto prima di tutto alla costruzione degli indici RWA a partire da variabili raccolte e sintetizzate a livello individuale (cfr. par. x), su cui sono state condotte una serie di analisi bivariate per osservarli nel loro andamento nei diversi paesi, per poi proseguire con l’analisi multivariata condotta attraverso la specificazione di una serie di modelli di regressione – logistica, lineare e multilivello244.

A livello generale, l’analisi dei dati realizzata attraverso la stima di modelli di regressione implica una serie di assunti i cui aspetti comuni ai diversi tipi di regressione utilizzati possono essere riassunti nel fatto che, attraverso la valutazione simultanea degli effetti che una serie di variabili assunte come indipendenti o covariate esercitano su una variabile che è stata definita come dipendente.

In particolare, a differenza di quanto avviene in altri ambiti disciplinari (in particolare demografia ed economia), l’obiettivo della stima di tali modelli in sociologia riguarda tipicamente la valutazione dell’effetto che una specifica variabile indipendente, definita variabile di interesse, esercita sulla dipendente a parità di altre condizioni rappresentate dalle altre variabili inserite nel modello (Corbetta,

244 Tutte le elaborazioni bivariate, le regressioni logistiche e le regressioni lineari sono state realizzate utilizzando il programma statistico SPSS versione 17.0, mentre per le regressioni multilivello si è utilizzato il programma STATA versione 11.2 (i modelli sono stati stimati con la procedura xtmixed).

178

Gasperoni, Pisati, 2001). Il fine dunque non è né quello di “spiegare” tutta la variabilità della variabile dipendente né di stabilire una sorta di graduatoria tra variabili indipendenti più o meno influenti in base ai coefficienti stimati, ma di capire se e in che misura, una volta controllate le altre condizioni che potrebbero incidere sulla variabile dipendente, quella su cui ci si interroga eserciti o meno un proprio effetto.

Un secondo assunto sottinteso e generalmente sottovalutato (ma che porta alcuni studiosi a considerare l’analisi di regressione solo apparentemente una tecnica multivariata) è costituito dal fatto che le stime dei coefficienti sono effettuate a partire da un unico stato su ciascuna variabile indipendente – la media nel caso si tratti di variabili cardinali, la condizione di riferimento nel caso si tratti di variabili nominali – facendo variare, a parità di tutte le altre, lo stato assunto da una singola variabile alla volta. Tale caratteristica contribuisce a chiarire la ragione dell’impossibilità di ricostruire in un’ottica esplorativa la dinamica delle relazioni tra le variabili indipendenti perché gli effetti di ciascuna di esse vengono stimati singolarmente e solo in relazione alla variabile dipendente.

Inoltre, a circoscrivere ulteriormente il potere esplicativo dei modelli di regressione contribuisce anche un ulteriore aspetto rappresentato dal fatto che, in assenza di indicazioni specifiche (come ad esempio l’indicazione di interazioni), la stima dei coefficienti segue una logica additiva tale per cui tutti gli effetti delle variabili inserite sono considerati indipendenti uno dall’altro e per ottenere la variazione complessiva della variabile dipendente è necessario sommare algebricamente tutti gli effetti calcolati per tutti i regressori inseriti. Nel caso della regressione logistica tale logica additiva si rivela particolarmente problematica, soprattutto in sede di confronto tra modelli (Mood, 2009) poiché la stima dei coefficienti viene effettuata a partire da un valore fisso, legato al calcolo dei residui rispetto alla distribuzione logistica stessa, per cui ogni volta che si inserisce una nuova variabile indipendente tutti i coefficienti vengono riscalati in base a tale valore e risultano pertanto inadatti ad un confronto diretto e puntuale (per cui sarebbe necessario il calcolo degli effetti marginali riferiti alla componente di varianza espressa dal regressore di interesse prima e dopo l’inserimento della nuova variabile di controllo) anche se possono essere analizzati in termini di aumento/diminuzione.

Infine, merita di essere ricordato come qualsiasi modello, per quanto complesso, costituisca in ogni caso una semplificazione della realtà sia per i limiti posti dagli assunti citati, sia perché include solo gli aspetti esplicitamente inseriti come regressori (e dunque osserva solo gli effetti di alcune caratteristiche) e in nessun caso consente di trarre conclusioni sostantive. Gli effetti delle variabili di interesse devono infatti essere interpretati sempre alla luce di un adeguato quadro teorico di riferimento perché la stima di un modello di regressione non consente di verificare l’esistenza di causazione ma solo di una associazione tra indipendente e dipendente (che potrebbe non avere senso dal punto di vista concettuale, oltre a poter non essere

179

reale dal punto di vista statistico a causa di effetti spuri non tenuti sotto controllo)245. L’esigenza di ricorrere a modelli di regressione di tipo diverso – logistici, lineari e multilivello – è dovuta tanto alle proprietà delle variabili che ci si propone di studiare quanto al carattere dell’ipotesi che si intende verificare.

I modelli di regressione logistici si caratterizzano per il fatto che la variabile dipendente oggetto di analisi è costituita da una variabile dicotomica: l’obiettivo è stimare in che misura il variare della variabile di interesse incida sulla propensione a compiere un’azione piuttosto che a non compierla. In questo caso, si tratta del modello utilizzato per valutare l’effetto esercitato dal superamento delle precondizioni RWA sulla propensione ad esprimere o meno un’intenzione di fecondità positiva che come si è visto stata ricodificata in formato sì/no.

I modelli lineari hanno come variabile dipendente una variabile cardinale per cui la stima dei coefficienti in questo caso riguarda l’effetto che un incremento unitario nella variabili indipendente di interesse provoca sulla variabile dipendente e sono stati utilizzati per stimare l’effetto delle variabili willing e able sulla variabile ready rappresentata da un indice misura su un intervallo 0-10.

I modelli multilivello, invece, possono avere come dipendente una variabile sia dicotomica sia lineare ma si caratterizzano per includere tra i regressori variabili appartenenti a unità di analisi di livello diverso inseriti (nested) l’uno nell’altro, in questo caso individui inseriti in gruppi (clustered), i paesi. Il ricorso a tali modelli, pur con i limiti e le cautele che si vedranno, è legato all’esigenza di valutare se sia possibile riscontrare un effetto esercitato da variabili registrate a livello macro – cioè di paese – sulla variabile dipendente costituita dalla valutazione espressa tramite l’indice ready ovvero se una parte della varianza di tale variabile sia ascrivibile alle differenze tra i contesti anziché alle differenze tra individui. Lo scopo dei modelli multilivello, costituiti da due (o più se i livelli sono più di due) regressioni stimate simultaneamente, è infatti quello di separare la parte di variabilità della dipendente che viene spiegata attraverso i coefficienti calcolati a livello individuale e che distinguono i singoli individui l’uno dall’altro, indipendentemente dal gruppo di cui fanno parte – definiti effetti fissi – dalla parte che invece va ricondotta alle caratteristiche che accomunano gli appartenenti a un medesimo gruppo ma li distinguono da quelli che appartengono ad un altro gruppo e dunque possono essere considerati effetti di contesto – definiti effetti casuali o random (Bickel, 2008; Hox, 2010).

In particolare il presupposto di base di tali regressioni è costituito dalla violazione di uno dei requisiti previsti per le regressioni unilivello ovvero l’indipendenza delle osservazioni. Per stimare correttamente un modello ad un solo livello, infatti, si assume che non vi siano legami tra le caratteristiche riportate da casi diversi, ma in alcune situazioni (tipico è l’esempio delle classi scolastiche) è possibile che esistano

245 Per approfondire ulteriori assunti e requisiti delle regressioni (tra cui in particolare indipendenza delle osservazioni, multicollinearità e omoschedasticità) si rinvia in particolare a (Corbetta, Gasperoni, Pisati, 2001).

180

aspetti, rilevati o meno, che influenzano alcuni individui e non altri rendendoli eventualmente più simili tra loro (e più diversi dagli altri) rispetto anche alle variabili sotto esame. La regressione multilivello consente dunque non solo di prendere atto di tale similarità ma addirittura di farne un elemento di forza per stimare in modo più preciso i coefficienti delle variabili indipendenti che di fatto, nei risultati della regressione multilivello, presenteranno errori standard più ampi rispetto a quella unilivello dal momento che l’errore tiene conto anche della variabilità tra gruppi, ma che può essere scorporata nel momento in cui si inseriscono variabili relative al secondo livello. Dal punto di vista concreto, in una regressione multilivello le variabili possono essere costituite da variabili proprie del livello a cui si riferiscono – dette globali – misurate cioè o a livello individuale (ad esempio l’età) o a livello contestuale (ad esempio il prodotto interno lordo di un paese); variabili operazionalizzate ad un livello inferiore a quello a cui sono utilizzate e dunque aggregate – dette anche strutturali (ad esempio quando si utilizza la media di una caratteristica individuale calcolata per ogni gruppo per riferirla al gruppo stesso); variabili operazionalizzate ad un livello superiore a quello a cui in cui sono utilizzate e dunque disaggregate – dette contestuali (ad esempio i punteggi degli indici RWA- macro calcolati per ciascun paese e inseriti come variabili negli individui appartenenti a quel paese) (Hox, 2010, 2).

In realtà, la specificazione di modelli multilivello in questo caso ha il solo scopo di valutare se sia possibile o meno identificare un ambito di variabilità tra paesi e, in subordine, se parte della varianza eventualmente riscontrata possa essere spiegata dalle variabili contestuali considerate in grado di influire sulla valutazione ready a livello individuale e in particolare da able-macro. Per questa ragione non ci si sofferma sugli aspetti statistici tesi a valutare o a migliorare l’affidabilità delle stime246, nella consapevolezza che gli 11 paesi analizzati rappresentano un campione macro decisamente limitato e non in grado di garantire risultati attendibili247. In ogni caso, pur ribadendo come le stime calcolate non vadano considerate del tutto affidabili neppure quando presentano buoni risultati in termini di errore standard e significatività, a causa del numero ridotto di unità di secondo livello, è possibile affermare (seguendo Entwisle, Mason, 1985, 629) che tra di esse la variabilità in termini di macro-caratteristiche (gli indici RWA-macro) sia abbastanza elevata, come evidenziato anche nell’analisi contestuale, tanto da poter calcolare le stime stesse a partire da ventaglio sufficientemente ampio di valori, sebbene non

246 Per cui si rinvia, in particolare a Hox (2010).

247 Sebbene il criterio di casualità dell’estrazione delle unità di secondo livello non sia considerato vincolante (e in generale neppure citato), va segnalato come il “campione” macro utilizzano non sia frutto di una selezione random, dal momento che risulta condizionato in primo luogo dall’avvenuto rilascio o meno del database (dei 19 paesi partecipanti alla prima wave dell’indagine GGS, a fine 2012 erano disponibili i dati solo di 15) e, in secondo luogo, dall’eliminazione di ulteriori 4 paesi a causa della disomogeneità dei database stessi.

181

sufficientemente numeroso da renderle stabili248. Un’ulteriore conseguenza della ristrettezza del “campione” di secondo livello è costituita dall’impossibilità di inserire un numero elevato di variabili (per non peggiorare ulteriormente l’efficienza dei calcoli), per cui anche in presenza di risultati coerenti con le ipotesi non implica che non ci siano altre variabili influenti che meriterebbero di essere inserite e valutate nei loro effetti (Bickel, 2008). D’altra parte, come si è più volte ripetuto, l’obiettivo dei modelli presentati non è tanto quello di ottenere i valori stimati degli effetti delle variabili di interesse sulla variabile dipendente quanto piuttosto quello di valutare la capacità del framework RWA di tenere conto degli elementi in gioco e di qualificarsi, potenzialmente, come uno strumento utile per analizzare le intenzioni (ed eventualmente i comportamenti) di fecondità, rinviando a successive analisi per una modellazione più accurata rivolta a stabilire influenze precise.

Dal punto di vista operativo il processo di verifica delle ipotesi e di analisi dei dati è stato scomposto, come già accennato in una serie di passaggi separati che corrispondono alla specificazione di una serie di modelli di regressione che verranno illustrati più nel dettaglio nel capitolo 5.

Innanzitutto, per valutare l’utilità del framework RWA nel rendere conto delle intenzioni individuali, è stato stimato un modello di regressione logistica in cui l’intenzione di avere un figlio entro 3 anni rappresentava variabile dipendente, l’età dell’intervistata, il livello di istruzione, la presenza di un partner, la presenza di altri figli in età 0-3 anni e la presenza di un’occupazione le variabili di controllo e le tre precondizioni RWA-micro, trasformate in variabili dicotomiche, costituivano le variabili di interesse. La stessa relazione è stata poi verificata anche utilizzando le tre variabili ready, willing, able nel formato originale e, inserendo in successione i tre indici, si è cercato di verificare anche se sia la dimensione ready ad essere determinante così come ipotizzato e al netto degli effetti esercitati da willing e able (oltre che da parte delle altre variabili di controllo).

Per verificare l’effetto delle dimensioni willing e able su ready, invece, il modello stimato prevedeva come variabile dipendente l’indice ready e, a parità di altre condizioni, si è verificata l’eventuale relazione tra le tre componenti e, in particolare, tra il punteggio totalizzato nella dimensione able e quello della valutazione ready in modo da poter poi utilizzare l’indice ready nella successiva analisi multilivello in sostituzione delle intenzioni.

Considerato l’obiettivo solo indicativo attribuibile alla specificazione dei modelli multilivello (a causa dei limiti già segnalati), si è ritenuto eccessivamente complessa l’interpretazione delle componenti della varianza fissa e random stimate attraverso una regressione multilivello logistica e ci si è orientati verso un modello lineare attraverso cui osservare se le condizioni di contesto, rappresentate dalle variabili able e/o willing di livello macro siano in grado o meno di ridurre la variabilità tra gruppi.

248 In sostanza, mancando un adeguato numero di “posizioni intermedie” che consentirebbe di consolidare il valore calcolato confermandolo, le stime sono stabilite sulla base di valori piuttosto distanti tra loro e dunque il dato “reale” potrebbe collocarsi in un punto qualsiasi dell’intervallo.

182

La decisione di giungere in ogni caso alla stima di un modello multilivello, nonostante non consenta di ottenere parametri pienamente utilizzabili, è dovuta alla volontà di andare oltre la stima separata dello stesso modello per paese e l’analisi descrittiva dei singoli parametri calcolati per ciascuno di essi poiché la specificazione di un modello multilivello consente di osservare gli stessi dati in una prospettiva diversa. L’analisi di tanti modelli unilivello separati, infatti, comporta una diversa stima di tutti i parametri inseriti per cui la comparazione effettuata tra i coefficienti della variabile di interesse soffre di tale disomogeneità, mentre la stima simultanea attraverso un modello multilivello calcola i medesimi coefficienti per tutti i regressori e scorpora la variabilità che si rileva tra i paesi “etichettandola” come effetto random.

Considerazioni conclusive

L’interrogativo principale a cui ci si propone di cercare una risposta attraverso l’analisi dei dati è costituito dalle differenze nell’andamento della fecondità all’interno di paesi considerati simili sotto altri punti di vista e dalle “apparenti” contraddizioni rispetto a quanto previsto innanzitutto dalla teoria della Seconda transizione demografica.

Per valutare a partire dalle coordinate definite nel framework concettuale RWA la sostenibilità dell’ipotesi di un ruolo non secondario giocato dal contesto istituzionale e socio-culturale nel definire il milieu a partire dal quale gli individui prendono le loro decisioni di fecondità, si è fatto ricorso ai database messi a punto dall’Unece nell’ambito del Generations and Gender Programme (http://www.ggp-i.org/). Il programma, finalizzato all’approfondimento delle trasformazioni demografiche nei paesi sviluppati con una particolare attenzione alle relazioni intergenerazionali e di genere, comprende un database contestuale che fornisce un ampio ventaglio di macro-indicatori comparabili – demografici, economici e sociali (occupazione, cura dei figli, pensioni, salute, ecc..) – relativi a circa 60 paesi e una serie di database di micro-dati individuali, raccolti attraverso un questionario comune, somministrato in 19 paesi a campioni rappresentativi di uomini e donne tra i 18 e i 79 anni, e successivamente armonizzati.

A differenza di altri programmi simili, compresa l’indagine Fertility and Family Survey che ne costituisce l’antecedente, Generations and Gender Survey è stata disegnata come indagine longitudinale (il panel sarà intervistato per 3 volte a distanza di 3 anni) secondo una prospettiva life-course rispetto agli eventi demografici ed è stata progettata a partire da un approccio teorico multidisciplinare – demografico, economico, sociologico, psicologico – che tiene conto anche dei differenti livelli a cui operano le determinanti dei comportamenti studiati. Per queste ragioni, da un lato le domande all’interno del questionario coprono anche ambiti tipicamente esclusi dalle indagini di impostazione puramente demografica e sono

183

state scelte e formulate in modo da consentire la verifica di ipotesi di matrice diversa, dall’altro il database contestuale è esplicitamente pensato per supportare l’analisi di modelli multilivello in cui i fattori contestuali sono utilizzati per spiegare le differenze nei comportamenti demografici registrati nei diversi paesi.

La mancata omogeneità rispetto alla somministrazione di alcune domande ha costretto a ridurre drasticamente il campione di unità di secondo livello – i paesi – ipotecando così la possibilità di giungere a stime realmente affidabili attraverso l’analisi multilivello. Tuttavia, si è deciso di procedere ugualmente soprattutto nell’ottica di testare un modello – il framework RWA declinato a livello individuale e sociale – e valutarne la capacità di adattarsi ai dati, evitando di porsi come obiettivo

Outline

Documenti correlati