• Non ci sono risultati.

7. Estensioni dell’analisi

7.1 Analisi multi-episode

Rispetto alle tipologie di processi discusse finora, è opportuno contemplare la possibilità che un dato evento si verifichi più volte nel corso della carriera di un soggetto; questo può accadere ad esempio nello studio della mobilità lavorati-

va, nell’analisi migratoria e demografica in genere, nelle indagini sulla fecondità e in molti altri ambiti: com’è ovvio, uno stesso individuo può infatti cambiare più volte occupazione o residenza, ammalarsi ripetutamente di una stessa malattia, sposarsi nuovamente dopo un divorzio, avere più di un figlio, ecc.

Rispetto all’analisi standard, i metodi di stima utilizzabili sono gli stessi; tut- tavia, vi sono due elementi di novità da prendere in considerazione:

1) il tipo di dato richiesto per affrontare l’analisi: la struttura del database de- ve infatti essere tale da gestire agevolmente la ripetibilità degli eventi. A questo scopo, è sufficiente utilizzare tre variabili: la prima è identificativa del soggetto (id) e rimane costante per tutti gli episodi attribuiti allo stesso individuo; la se- conda è un numero seriale (sn) che “conta” gli eventi successivi a parità di id; l’ultima indica semplicemente l’istante in cui l’evento si è verificato (t). Ovvia- mente, si avrà la consueta informazione relativa all’eventuale censura a destra.

A titolo esemplificativo, la seguente tabella mostra la carriera lavorativa di 4 persone a partire dal loro ingresso nel mondo del lavoro:

id sn t censura 1 1 2 1 1 2 6 1 1 3 19 0 2 1 4 1 2 2 8 0 3 1 1 1 3 2 5 1 3 3 6 1 3 4 9 1 3 5 20 1 3 6 35 1 4 1 11 0

Nell’esempio, il primo individuo ha lasciato la sua prima occupazione dopo 2 anni, senza cambiare nuovamente impiego per i 4 successivi e raggiungendo così 6 anni di carriera.

A questo punto, ha intrapreso una nuova attività, nella quale è tuttora impe- gnato a 19 anni di distanza dall’inizio del follow-up: l’intervallo è dunque censu- rato a destra.

Analogo ragionamento può essere applicato al soggetto numero 2, che però ha cambiato occupazione solo una volta. Il terzo individuo invece ha sperimenta- to 6 impieghi differenti e attualmente non lavora (si suppone che sia andato in pensione): infatti, l’ultima occupazione si è conclusa (non essendo censurata) do- po 35 anni di lavoro.

Infine, l’individuo numero 4 non ha mai conosciuto l’evento, permanendo nello stesso stato da 11 anni; dato che non si è ancora ritirato, l’episodio è nuova- mente soggetto alla troncatura a destra;

2) i possibili approcci allo studio della sopravvivenza nel caso di fenomeni ripe- tibili. I tempi di attesa possono essere infatti analizzati seguendo due possibili criteri: a) eseguendo un’analisi separata per ogni evento successivo, ovvero suddivi- dendo i tempi in base al rango rappresentato dalla variabile “serial num- ber”. Si ottiene in questo caso una curva di sopravvivenza per ogni inter- tempo: ad esempio, è possibile stimare un modello per il tempo di attesa fra il matrimonio e la nascita del primo figlio, un altro modello per l’inter- vallo fra il primo e il secondo figlio, e così via;

b) trattando il problema secondo un approccio single-episode: in questo mo- do, viene ignorato il rango dell’evento e la sopravvivenza viene calcolata in base al tempo trascorso fra due eventi successivi qualsiasi; in altre paro- le, ogni individuo viene trattato come se la sua carriera fosse composta di k soggetti distinti e indipendenti, ad ognuno dei quali viene attribuito uno dei k intervalli in cui la biografia originale era suddivisa. Nel caso della natalità, questo significa studiare il tempo che intercorre fra la nascita di un figlio e quella del successivo, senza porsi il problema dell’ordine se- condo il quale le nascite si susseguono.

Chiaramente, il primo approccio non richiede particolari ipotesi ed è piutto- sto maneggevole; tuttavia, in molti casi il processo è approssimativamente omo- geneo, a prescindere dal rango per il quale l’intervallo è definito: questo significa che la sopravvivenza all’evento di rango j e quella all’evento di rango h (calcolate a partire dall’episodio immediatamente precedente) non differiscono in maniera significativa, per qualunque valore di j e h. A questo punto, un’analisi separata ha poco motivo di esistere, considerata anche la minore consistenza associata a sti- me compiute su campioni di dimensione troppo esigua.

D’altro canto, il secondo tipo di approccio può essere utilizzato solo nel caso in cui l’indipendenza fra intervalli successivi sia un’assunzione valida dal punto di vista teorico ed empirico; tuttavia, in molte situazioni reali, i tempi di attesa di- ventano via via più lunghi (o più brevi) all’aumentare del numero di episodi pre- cedenti: questo accade ad esempio nello studio di fenomeni di “devianza sociale” (criminalità, alcolismo, droga, ecc.), per i quali una sorta di “assuefazione” può rendere sempre più frequente il verificarsi dell’evento (l’arresto per furto, l’abuso di alcol, l’assunzione di stupefacenti o quant’altro). L’esempio opposto può esse- re tratto dalle biografie “sentimentali”, in cui una serie iniziale di relazioni fugaci e di breve durata viene spesso seguita da una ricerca di stabilità e dal prolungarsi di permanenza nella stessa situazione di coppia.

Un’ultima importante osservazione sull’analisi multi-episode è relativa allo

starting point del tempo di attesa di un evento: come si è detto, in linea di massi-

ma si considera la sopravvivenza all’evento di ordine j a partire dall’istante in cui si è verificato quello di ordine j–1; questa scelta non è sempre la più opportuna, soprattutto per quanto riguarda alcuni specifici ambiti di studio. Nell’analisi della natalità, ad esempio, può essere piuttosto svantaggioso modellare l’intervallo di tempo fra un evento e il successivo, tanto più in un’ottica interpretativa volta allo studio della fecondità. Può essere assai più opportuno studiare il tasso di accadi- mento a partire da un istante di partenza comune a tutti gli eventi di qualsiasi ran- go: infatti, dal punto di vista empirico, risulta molto più efficace analizzare la fe- condità in funzione dell’età al parto piuttosto che metterla in relazione col tempo

intercorso dalla nascita precedente. Sarà in generale compito dello studioso stabi- lire quale approccio sia più interessante dal punto di vista teorico e al tempo stes- so efficace nell’interpretazione empirica del processo.

Documenti correlati