Riferimenti bibliografici
2. LÊUSO DELLE LISTE ANAGRAFICHE COMUNALI 1
2.2 Le Liste anagrafiche comunali nelle indagini sulle famiglie
2.2.2 La definizione delle stime campionarie
La mancata risposta totale è, ormai, una caratteristica sempre più frequente nel-le rinel-levazioni statistiche. Di conseguenza, anche da un punto di vista teorico, è ne-cessario che se ne tenga conto, a partire dalla definizione della strategia di indagine (Särndal e Lundström 2005; Nicolini et al. 2013).
Sono molteplici i fattori che incidono e condizionano il comportamento dei rileva-tori, come quello dei potenziali rispondenti e che vanno a incrementare sia il numero dei mancati contatti, sia il numero di rifiuti alla partecipazione.
La complessità delle indagini, soprattutto in campo socio-economico, la conco-mitanza di differenti tecniche di rilevazione, l’utilizzo di differenti reti di rilevazione impongono risposte metodologiche più articolate che prevedono l’utilizzo di informa-zioni anche per i non rispondenti: lo sfruttamento di fonti aggiuntive può limitare gli effetti distorsivi dei meccanismi di mancata risposta totale sulle stime finali.
A livello di costruzione delle stime, già a partire dagli stimatori post-stratificati e soprattutto dopo l’introduzione degli stimatori calibrati (Deville e Särndal 1992), l’im-piego di informazioni ausiliarie da fonti esterne è ormai consuetudine nelle indagini campionarie, anche nel trattamento delle mancate risposte totali (Kott 2006; Cecca-relli, Cutillo 2007; Ceccarelli et al. 2008).
È noto che i passaggi che dal campione teorico portano alla determinazione delle stime finali, o meglio, alla determinazione dei coefficienti di riporto all’universo, possono essere riassunti in due macro fasi ben distinte:
• raccolte le informazioni e determinato il coefficiente di riporto all’universo da disegno, si procede ad adeguare il campione realizzato a quello teorico, in modo da tener conto della mancata risposta totale e ripristinare sia la numerosità campionaria di partenza, sia la struttura del campione inizialmente estratto; • grazie all’uso di stimatori più o meno complessi, che sfruttano informazioni
ausiliarie, si arriva alla determinazione dei coefficienti di riporto all’universo finali, che eliminano anche la distorsione dovuta alla sotto copertura delle liste di campionamento.
Proprio nel contesto della prima fase si inseriscono le sperimentazioni sull’utilizzo delle
Lac, per la determinazione dei coefficienti per la correzione della mancata risposta totale. Senza perdere di generalità possiamo considerare che, a posteriori, il numero di interviste realizzato si discosta dalla numerosità campionaria da disegno a causa: del numero di unità statistiche non intervistate, di errori di lista, del numero di famiglie che non è stato possibile contattare e del numero di famiglie che hanno rifiutato il contatto.
Ognuna di queste grandezze è funzione di vari fattori. In particolare, gli errori di lista sono funzione del grado di aggiornamento delle liste stesse da cui sono estratti i campioni. Il mancato contatto è funzione della capacità della rete di rilevazione di ga-rantire l’adeguata capillarità sul territorio e di riuscire a contattare le famiglie, rispetto alle consuetudini e agli stili di vita delle famiglie stesse. La mancata partecipazione, infine, è funzione del lavoro di sensibilizzazione da parte degli Istituti di statistica e della capacità di ogni singolo intervistatore di coinvolgere la famiglia nell’intervista.
In considerazione dei fattori sopraelencati e delle loro possibili interazioni, si pro-pone una metodologia che si basa essenzialmente sull’assunto che il meccanismo che genera la mancata risposta totale si possa considerare ragionevolmente missing at random (Mar), all’interno di gruppi omogenei di famiglie. In altri termini, si ipotizza che, in sottoclassi della popolazione, il comportamento degli intervistati sia del tutto analogo a quello di coloro che, a vario titolo, non hanno partecipato all’indagine.
In uno scenario basato su tale ipotesi giocano un ruolo fondamentale le variabili di classificazione che si utilizzano per la costruzione delle sottoclassi della popolazione. Quanto più è elevata la correlazione tra le variabili che determinano le sottoclassi, tan-to più è ammissibile l’ipotesi Mar all’interno delle sottan-toclassi stesse. In tale contestan-to, le informazioni contenute nelle Lac offrono la possibilità di costruire una serie di distribu-zioni sulle caratteristiche degli individui e delle famiglie, tali da poter essere utilizzate per la costruzione di sottoclassi della popolazione, dove il meccanismo che genera la mancata risposta possa essere ipotizzato come Mar, a meno di fattori non controllabili, così da ridurre la distorsione complessiva, dovuta a meccanismi non casuali di gene-razione della mancata risposta stessa (Särndal e Lundström 2005, pp. 94-96; Nicolini et al. 2013, pp. 149-153).
Com’è noto, tra i possibili fattori che producono mancata risposta totale c’è, sen-za dubbio, quello legato al numero di componenti della famiglia. Nella fattispecie è stato sperimentato l’utilizzo della tipologia familiare, costruita in base alla presenza in famiglia di uno o più componenti a seconda del sesso e della classe d’età. In questo modo, oltre al numero di componenti si considerano anche le loro caratteristiche, per rendere le sottoclassi più omogenee possibili rispetto ai fattori che concorrono a generare la mancata risposta totale.
L’introduzione della tipologia familiare è in corso di sperimentazione anche nella fase di estrazione delle famiglie dalle Lac, per la determinazione dei campioni delle indagini che prevedono le sostituzioni delle famiglie che non partecipano all’intervista.
33
2. L’uso delle Liste anagrafi che comunali
Riferimenti bibliografici
Ceccarelli C., Coppola L., Cutillo A., Di Laurea D. 2008. “Combining survey and administrative data in the Italian Eu-Silc experience: positive and critical aspects”. Conference of European Statisticians - Working Session on Statistical Data Editing, 1–10. Unece. http://www.unece.org/fileadmin/DAM/stats/documents/2008/04/sde/wp.14.e.pdf.
Ceccarelli C., Cutillo A. 2007. “Il trattamento della mancata risposta totale nell’Indagine Eu-Silc: una valutazione tramite una misura del cambiamento”. Congiuntura. Udine: CREF, 1° Trimestre: 91-112.
Ceccarelli C., Pezone A., Rosati S. 2013. “L’utilizzo delle liste anagrafiche comunali nella statistica ufficiale”. Rivista di Economia demografia statistica, LXVII n. 3-4.
Deville J.C. and Särndal C.E. 1992. “Calibration estimators in survey sampling”. Journal of the American Statistical Association, 87 (418): 376–382.
Kott P.S. 2006. “Using calibration weighting to adjust for nonresponse and coverage errors”. Survey Methodology, 32 (2): 133–142.
Särndal C.E., Lundström S. 2005. Estimation in Survey with nonresponse. New York: John Wiley & Sons Ltd.
Nicolini G., Marasini D., Montanari G. E., Pratesi M., Ranalli G. M., Rocco E. 2013. Metodi di stima in presenza di errori. Milano: Springer-Verlag.
Pezone A., Pellizzaro F. 2012. “The use of population registers in the 15th italian census: challenges and preliminary evidence”. Joint Unece/Eurostat Meeting on Population and Housing Censuses Expert Group Meeting on Censuses Using Registers, Geneva, Switzerland, 22-23 May.
Pezone A., Scavalli M. 2010. “Using population registers as a population list: some results from the pilot survey 2009”. Joint Unece/Eurostat Expert Group Meeting on Register-Based Censuses, The Hague, Netherlands, 10-11 May.