• Non ci sono risultati.

La rilevazione dei permessi di costruire: il controllo e la correzione dei dati

Tavola 5: Esempio di alcune descrizioni di errori, estratte dalla lista generale

2.3. Rilevazione rapida dei permessi di costruire - campionaria

Come si è detto, gli 814 comuni campione inviano mensilmente i questionari compilati direttamente all’Istat di Roma, presso un’apposita casella postale dedicata alla rilevazione rapida, in modo da ridurre i tempi di raccolta.

2.3.1. Microediting sui questionari/record (primo livello)

I questionari, pervenuti dagli 814 comuni campione, vengono sottoposti ad una lavorazione rapida che prevede la revisione manuale e la registrazione, all’interno dell’unità operativa, delle sole variabili utili al calcolo degli indicatori congiunturali.

Ciascun questionario viene, quindi, sottoposto ad una parziale revisione manuale, relativa soltanto alla parte contenente le informazioni da digitare.

I criteri di revisione sono gli stessi di quelli utilizzati nella rilevazione censuaria e quindi, anche in questo caso, vengono corretti gli errori riguardanti le mancate risposte parziali, i valori fuori dominio, le incompatibilità e i valori anomali.

La tavola 7 contiene il numero di record in assoluto e in percentuale sottoposti a parziale controllo nell’ambito dell’indagine rapida. In totale i questionari o record relativi ai soli comuni campione sono circa 27.000 all’anno, che costituiscono il 22% circa rispetto al totale comuni.

In percentuale, a differenza di quanto visto per l’indagine censuaria, si ha una netta predominanza di record relativi a fabbricati residenziali, con oltre il 70% di questionari sul totale. Per contro la percentuale di record negativi si presenta, in questo caso, piuttosto esigua aggirandosi intorno all’8%. Ciò si spiega per il fatto che, in questo caso, è maggiore il peso dei 160 comuni capoluogo o con più di 50.000 abitanti, per i quali si può ipotizzare una concentrazione più alta del fenomeno residenziale e nello stesso tempo una scarsa propensione all’assenza del fenomeno. Infine, i record relativi a fabbricati non residenziali rappresentano, come per l’indagine censuaria, il 20% circa dei questionari lavorati.

Tavola 7: Numero di record registrati per anno

Rilevazione Rapida Tipo record 2003 2004 2005 2003 2004 2005 Residenziale 18.388 20.188 19.079 69% 74% 72% Non Residenziale 6.295 5.196 5.382 23% 19% 20% Negativi 2.161 1.935 2.072 8% 7% 8% Totale 26.844 27.319 26.533 100% 100% 100%

La registrazione avviene mediante un software ad hoc che prevede l’immissione autocontrollata dei dati di ciascun record con controlli, in minima parte di tipo automatico con approccio deterministico e in parte di tipo interattivo con l’intervento dell’operatore. I controlli automatici prevedono l’immissione, per ciascun record, di alcune informazioni come il nome dell’operatore, la data di inserimento e di un numero progressivo. I controlli di tipo interattivo sono contestuali all’immissione dei dati e finalizzati alla correzione degli errori non risolti in fase di revisione e degli errori di digitazione.

Dopo questa serie di operazioni il record viene, quindi, validato e memorizzato nell’archivio dell’indagine rapida.

La Maschera che segue è quella utilizzata per la digitazione autocontrollata di ogni singolo record relativo a un fabbricato di tipo residenziale. Analogamente si ha un pannello per la registrazione dei record di tipo non residenziale ed inoltre uno per la registrazione dei record negativi

In alto a sinistra appare il nome del database in cui vengono archiviati, una volta validati, tutti record residenziali e non residenziali e il nome dell’utente che immette i dati. In alto a destra viene indicato il numero di record totale contenuti in archivio e il corrispondente numero record oggetto di nuova immissione o di modifica. Mentre la parte centrale della maschera contiene le informazioni di carattere generale e le variabili specifiche che vengono immesse per ciascun record di tipo residenziale. Infine, in basso si hanno i pulsanti di comando che consentono di operare l’immissione, la modifica o la validazione di un record.

Figura 3: Maschera per la registrazione controllata dei questionari dei comuni campione

2.3.2. Macroediting sui dati comunali (secondo livello)

Per quanto riguarda la correzione delle MR dovute alla mancata collaborazione dei comuni, anche qui si distingue l’insieme dei 160 comuni autorappresentativi (quelli capoluogo e quelli con più di 50.000 abitanti) da quello costituito dai restanti comuni, come nel caso della rilevazione censuaria, ma a differenza di quest’ultima, non si imputano i microdati, bensì i dati aggregati per comune.

Tale diversità è dovuta al fatto che la rilevazione censuaria permette di produrre numerose tabelle che prevedono incroci non solo tra variabili di tipo quantitativo ma anche di tipo qualitativo, la cui aggregazione non renderebbe possibile una serie di analisi strutturali.

Invece, nel caso della rilevazione rapida, l’obiettivo specifico è quello di stimare gli indicatori richiesti dal regolamento STS, che riguardano esclusivamente variabili di tipo quantitativo, e il cui obiettivo è principalmente quello di descrivere la dinamica del fenomeno.

Come si dirà nel seguito, sono in corso delle sperimentazioni alternative ai metodi attualmente in uso per l’imputazione delle MR per verificare la possibilità di ottenere dei miglioramenti della qualità delle stime prodotte, sia per i comuni autorappresentativi sia per i restanti comuni.

Per quanto riguarda il sottoinsieme dei 160 comuni autorappresentativi, l’imputazione mensile in caso di MRP, sui dati aggregati a livello comunale, avviene attraverso il valore medio che le variabili (abitazioni e superfici) assumono nello stesso comune nei 12 mesi precedenti in cui ha risposto, compreso il mese che si sta elaborando.

Una sperimentazione condotta per valutare la capacità di tale tecnica d’imputazione ha portato alla conclusione che il metodo usato è migliore rispetto ad altri metodi alternativi.

In particolare, all’interno dell’Unità operativa “Metodi per il trattamento degli errori non campionari”

sull’applicazione comparativa del metodo attuale della media longitudinale e di diverse tecniche da donatore di distanza minima longitudinale per strati.

Il metodo del donatore mostra una buona capacità di ricostruzione del valore totale mensile delle variabili da stimare, ma il metodo attuale, sfruttando in modo diretto l’informazione longitudinale della stessa unità oggetto d’imputazione, risulta leggermente preferibile, in parte anche a causa dell’esiguità del numero di unità (160 comuni) e dalla loro eterogeneità, che non costituiscono dei buoni presupposti per l’imputazione tramite donatore (Di Zio, Guarnera e Luzi , 2007).

In caso di MRT, quando cioè il comune non ha mai risposto nei 12 mesi precedenti, non viene imputato nessun valore, con una conseguente leggera sottostima del fenomeno.

Questo problema è stato di recente oggetto di ulteriori sperimentazioni, svolte nell’ambito dell’Unità operativa “Metodi per il trattamento degli errori non campionari” (MTS/G), per trovare una soluzione ed adottare un opportuno metodo d’imputazione anche per le MRT.

Tenuto conto degli obiettivi dell’indagine e che il fenomeno delle MRT nell’insieme dei comuni autorappresentativi è piuttosto esiguo, sono stati messi a confronto due diversi metodi, uno basato sulla media trasversale per classi e uno basato sul donatore trasversale di minima distanza, sempre per classi. La sperimentazione ha mostrato che i due metodi hanno prestazioni pressoché analoghe. Il metodo della media sembra da preferire in relazione alle finalità dell’indagine (stima di totali), alla semplicità dell’approccio e all’omogeneità di trattamento rispetto alle MRP. Mentre il metodo del donatore è da preferire per omogeneità di trattamento delle MRT rispetto al metodo usato nella rilevazione censuaria (Di Zio, 2007).

In ogni caso, data la sostanziale equivalenza delle prestazioni, si valuterà all’interno della struttura responsabile della rilevazione l’opportunità di scegliere l’uno o l’altro dei due metodi, anche in base a considerazioni di tipo operativo.

Per quanto riguarda le MR, nell’insieme dei restanti 654 comuni campione stratificati si applica una diversa metodologia che, anziché utilizzare l’imputazione, si basa sulla riponderazione delle osservazioni rilevate sui comuni rispondenti in modo da rappresentare i restanti comuni.

Inoltre, tenendo conto del fatto che, al momento del calcolo delle stime, la copertura del campione non è completa, mentre sono disponibili informazioni su alcune unità non incluse nel campione, si è ritenuto opportuno sfruttare non solo le informazioni pervenute dai 654 comuni campione ma anche quelle pervenute, entro i termini utili per l’invio delle variabili ad Eurostat, dagli altri 7286 comuni non campionari.

A tale scopo, quindi, è stata messa a punto una metodologia d’imputazione che, a partire dai dati aggregati per comune, stima per mese il numero totale delle abitazioni in nuovi fabbricati residenziali e la superficie totale non residenziale per i 7940 comuni (di cui 654 campionari e 7286 non campionari), attribuendo un peso al valore assunto dalle variabili d’interesse nei comuni rispondenti nel periodo considerato.

Lo stimatore attualmente utilizzato, denominato stimatore FABI, è il seguente:

k t r k k t t y a Y t , , ~

=

Dove yt,k è la variabile d’interesse al tempo t nella k-esima unità e a t,k è il peso attribuito alla stessa unità determinato in base ai parametri stimati da una regressione logistica (vedi Falorsi, Alleva, Bacchini, Iannaccone, 2005).

Tale stimatore ha spesso evidenziato una sistematica sovrastima degli indicatori calcolati a 90 giorni dal trimestre di riferimento rispetto a quelli rivisti a distanza di tre mesi.

Pertanto, nell’ottica di migliorare la qualità delle stime preliminari a 90 giorni, si è introdotto un altro stimatore che attualmente è in sperimentazione.

Il nuovo stimatore, di tipo Shrinkage, anziché combinare insieme le informazioni campionarie e non campionarie, calcola separatamente le due stime indipendenti, una basata sui comuni campione e l’altra

sui comuni non campione, combinandole in modo ottimale al fine di rendere minima la varianza complessiva (Bacchini, Falorsi e Iannaccone, 2005).

Dopo avere stimato il numero delle abitazioni in nuovi fabbricati, si moltiplica tale valore per la superficie utile abitabile media, riscontrata sui dati rilevati, ottenendo così il corrispondente valore della Superficie Utile abitabile.

Dalla somma dei valori stimati precedentemente per il gruppo dei 160 comuni autorappresentativi e per quello dei restanti 7940 comuni, si ottiene il numero totale delle abitazioni nei nuovi fabbricati residenziali, la relativa superficie utile abitabile e la superficie totale non residenziale (compresa la superficie per collettività) per l’universo degli 8100 comuni italiani.

Nella tavola 8 vengono riportati i tassi di risposta per mese dei vari gruppi di comuni che entrano a far parte della metodologia di calcolo delle stime.

Tali tassi si riferiscono al momento in cui avviene la revisione delle stime congiunturali che diventano, quindi, definitive e che vengono elaborate a 180 dal periodo di riferimento.

I tassi più elevati si registrano per lo strato dei 160 comuni autorappresentativi, per i quali in media si ha ben oltre l’80% di rispondenti per mese. I restanti 654 comuni campione raggiungono mediamente un tasso di risposta del 70% ed, infine, gli oltre 7000 comuni non campione rispondenti per mese superano in media il 40%.

In generale, per tutti e tre i gruppi di comuni considerati si nota una leggera tendenza alla diminuzione del tasso di risposta man mano che ci si sposta dai primi mesi dell’anno fino a dicembre.

Al fine di mantenere un contatto con i comuni, finalizzato a mantenere oltre che migliorare il livello dei tassi di risposta, si effettuano periodicamente dei solleciti telefonici ai comuni campione e, tramite le Camere di commercio, ai comuni non campione.

Tavola 8: Tassi di risposta mensile - anno 2005 *

mese Comuni autorappresentativi (160 unità) Restanti comuni campione (654 unità)

Totale comuni campione (814 unità)

Comuni non campione (7286 unità) gen 83,1 69,7 72,4 46,4 feb 84,4 69,0 72,0 44,5 mar 83,8 69,9 72,6 38,2 apr 87,5 71,3 74,4 42,1 mag 81,9 69,7 72,1 37,1 giu 78,1 65,0 67,6 34,6 lug 82,5 69,0 71,6 44,2 ago 80,0 67,7 70,1 44,9 set 79,4 66,7 69,2 43,1 ott 84,4 70,5 73,2 49,0 nov 83,1 67,6 70,6 46,3 dic 83,1 67,0 70,1 42,0

* A 180 giorni dal periodo di riferimento degli indicatori trimestrali