• Non ci sono risultati.

Prevenzione degli errori, integrazione dei dati e metodi statistici nel processo di controllo e correzione dell'Indagine trimestrale sui posti

Tavola 4: Tasso medio di posti vacanti, imprese imputate e non imputate - terzo trimestre 2006

PMI GI Tutte

numero Tpv post Tpv pre numero Tpv post Tpv pre numero Tpv post Tpv pre

Imputate 2.381 0,873 - 343 0,990 - 2.724 0.888

-Non imputate 6.375 0,899 0,899 762 0,897 0,897 7.137 0.898 0.898

Tutte 8.756 0,891 0,899 1.105 0,926 0,897 9.861 0,896 0,898

5.5 Il controllo dei dati influenti

L’ultima fase di controllo e correzione, prima della compilazione dei dati aggregati, consiste in un editing selettivo delle osservazioni influenti. A questo punto del processo tutti i dati sono stati imputati e i pesi sono stati assegnati dalla procedura di riponderazione. L’inserimento in questo punto del processo di una procedura di controllo di dati influenti rispecchia proprio la necessità di tenere conto di questi due elementi: da un lato controllare che l’insieme delle procedure di imputazione non abbia generato valori anomali e dall’altro che eventuali anomalie rimaste o lasciate nei dati non abbiano ricevuto un peso campionario troppo elevato.

L’influenza dell’i-esima osservazione è calcolata semplicemente come la sensibilità della stima del parametro di interesse a quella osservazione, ovvero come la differenza tra la stima che include tale osservazione e quella che la esclude. Dato che in questa fase di sviluppo dell’indagine si è interessati principalmente al tasso di posti vacanti, l’influenza è calcolata come:

100 ( i ) ( i ) j j j j j S j S i j j j j j S j S k pv k pv g k of k of = ⋅

∑ ∑

dove l’indice j indica l’osservazione j-esima, kj è il suo peso di riporto all’universo, pvj è il numero di posti vacanti, ofj è il numero di posti occupati a fine trimestre. Infine S rappresenta il campione complessivo nel trimestre, mentre S(i) rappresenta il campione dal quale è stata esclusa l’osservazione i-esima.

Un indicatore alternativo, la differenza dovuta alla osservazione i-esima rispetto al tasso di posti vacanti complessivo, è rappresentabile come:

1 100 i i j j j S j j j S g g k pv k of = ⋅

Gli indicatori gi e 1 i

g sono calcolati per ogni dominio di pubblicazione, le sezioni di attività economica. Le osservazioni influenti sono individuate come quelle osservazioni per cui gi ≥0,2 o gi1≥8. La scelta delle soglie si è basata anche in questo caso su un’analisi tesa a determinare livelli che minimizzassero il numero di osservazioni da studiare e trattare interattivamente, senza tuttavia escludere quelle che si ritiene opportuno verificare.

Questo metodo conduce ad analizzare circa 20 osservazioni al trimestre. Anche in questo caso, come per il controllo degli outlier, le osservazioni sono controllate interattivamente, basandosi anche sui

valori storici dell’impresa. Inoltre, in questa fase un’attenzione particolare è posta alle imprese che hanno subito imputazione per le quali sono controllati anche i dati precedenti a tale trattamento.

Grazie a questi controlli si è potuto individuare un possibile punto critico della procedura di imputazione. Talvolta infatti assegnare il tasso di posti vacanti rilevato dall’indagine ad una osservazione le cui posizioni lavorative occupate sono state imputate tramite OROS conduce ad un valore troppo influente sulle stime. Ciò avviene quando le posizioni occupate di OROS sono molto maggiori rispetto a quelle di VELA e il tasso di posti vacanti rilevato da VELA è elevato. Questa correzione delle posizioni occupate non comporta, infatti, che il tasso di posti vacanti rilevato da VELA venga modificato. Tuttavia, riferendosi dopo l’imputazione delle posizioni occupate ad un’impresa più grande, può diventare non più accettabile. In questo e negli altri casi in cui si riscontra un errore nei dati dovuto all’imputazione oppure un valore anomalo cui viene attribuito un peso campionario molto elevato la procedura è quella di porre a missing il dato sui posti vacanti che verrà poi re-imputato tramite la media, nella cella di imputazione, del tasso di posti vacanti di tutte le altre imprese rispondenti ed imputate.

5.6 La validazione dei dati aggregati

L’ultima fase di controllo e correzione consiste nell’analisi e nella validazione dei dati aggregati. Questa fase è, al momento in cui si scrive, in via di sperimentazione e sviluppo e qui di seguito si descrivono brevemente gli esercizi esplorativi in corso.

Gli scopi di questa fase sono di due tipi. Un primo, che classicamente si persegue in tutte le indagini congiunturali, è l’identificazione di eventuali valori anomali nei dati aggregati. Un secondo scopo consiste nell’analizzare le relazioni sia tra le dinamiche degli indicatori prodotti dall’indagine, che fra queste ultime e gli andamenti di indicatori derivanti da altre fonti. Questo secondo tipo di analisi è di particolare importanza per gli indicatori sui posti vacanti che sono ritenuti fondamentali nell’analisi del ciclo economico: in particolare si ritiene che siano indicatori anticipatori, specialmente di variabili relative al mercato del lavoro. A questo proposito è in corso di sviluppo un’analisi grafica mirante a confrontare il tasso di posti vacanti con i tassi di crescita delle posizioni occupate e, per il solo settore manifatturiero, con la produzione industriale. Il secondo tipo di confronto mira a verificare la congruenza ciclica dei posti vacanti con quella del prodotto delle imprese: in particolare, si può pensare che i posti vacanti possano crescere dopo un incremento del livello della produzione che sia giudicato come persistente dall’imprenditore. Sulla base di questa ipotesi si è cominciato a verificare se il tasso di posti vacanti nel settore manifatturiero abbia un profilo ciclico simile, ma ritardato rispetto a quello dell’indice mensile della produzione industriale. Simili confronti possono essere fatti anche fra il tasso di posti vacanti nei servizi e indicatori (deflazionati) del fatturato nei medesimi settori.

Le relazioni tra posti vacanti e tassi di crescita delle posizioni occupate (o i tassi di entrata), entrambi di fonte VELA, studiate per singola sezione di attività economica e per gli aggregati di livello superiore, sono invece di immediato interesse per comprendere se il tasso di posti vacanti possa essere considerato un leading indicator dell’occupazione. È ragionevole ipotizzare, infatti, che un incremento dei posti vacanti possa essere un segnale anticipatore di un successivo aumento nelle posizioni occupate. In futuro verrà sviluppato uno studio analogo sulle eventuali relazioni tra il tasso di posti vacanti e il tasso di disoccupazione.

Un diverso tipo di analisi è, invece, svolto per confrontare gli indicatori italiani sul tasso di posti vacanti con quelli di altri Paesi europei e dell’intera Unione, al fine di capire se l’ordine di grandezza dei livelli e le dinamiche congiunturali siano o meno simili. Si deve però sottolineare che eventuali discrepanze, sia nei livelli che nel profilo ciclico, non sono di per sé immediatamente interpretabili come segnali di limitata affidabilità dei dati italiani, perché potrebbero invece riflettere differenze nella struttura e/o nel ciclo delle economie dei diversi Paesi.

6. Conclusioni

Nel presente documento sono state descritte le procedure di controllo e correzione adoperate dall’Indagine Trimestrale Istat sui Posti Vacanti e le Ore Lavorate. Come si è detto, i tre pilastri sui quali poggia la strategia del processo sono: l’organizzazione della raccolta dati, curata in dettaglio a partire dalla formazione dei rilevatori CATI fino al monitoraggio durante la rilevazione e finalizzata a massimizzare le risposte e a prevenire errori; l’integrazione con altre fonti statistiche, che consente di ridurre la molestia statistica nei confronti delle imprese, di razionalizzare il sistema dei processi produttivi e produrre indicatori coerenti con le indagini GI e OROS: il trattamento delle Grandi Imprese, in particolare, va nella direzione frequentemente discussa e auspicata di una raccolta il più possibile centralizzata dei dati e di trattamento omogeneo tra le indagini; il processo di controllo e correzione in senso stretto che, con particolare riferimento ai posti vacanti, è stato elaborato dopo un’attenta analisi dei parametri da stimare e delle caratteristiche della variabile.

Per quanto riguarda le variabili sulle posizioni occupate e sui posti vacanti lo stadio di sviluppo e verifica delle procedure è quasi completato. In un prossimo futuro, queste ultime saranno estese per includere le variabili relative alle ore lavorate. Nei piani di sviluppo dell’indagine è prevista, inoltre, una fase di analisi mirante a valutare da un lato l’impatto delle singole fasi del processo di controllo e correzione sulle stime e dall’altro l’efficacia delle procedure in circostanze di raccolta dati differenti che si verificano di wave in wave.

Bibliografia

Bellisai D. Confronti tra occupazione trimestrale OROS e occupazione VELA media trimestrale. Mimeo, 2006. Bellisai D., Pacini S. e M.A. Pennucci. Analisi preliminare sui dati OROS e VELA – 1a parte. Mimeo,

2005a.

Bellisai D., Pacini S. e M.A. Pennucci. Analisi preliminare sui dati OROS e VELA – 2a parte. Mimeo,

2005b.

Chen C. Robust Regression and Outlier Detection with the ROBUSTREG Procedure. Proceedings of the Twenty-Seventh Annual SAS Users Group, 2002.

Hidiroglou M.A. e J.M. Berthelot. “Statistical editing and imputation for periodic business surveys”.

Survey Methodology, 12, (1986): 73-83.

Luzi O., Di Zio M., Guarnera U., Manzari A., De Waal T., Pannekoek J., Hoogland J., Templeman C., Hulliger B. e D. Kilchman. Recommended Practices for Editing and Imputation in Cross-Sectional Business

Surveys. Lussemburgo: Technical report of the European EDIMBUS project, http://edimbus.istat.it, 2007.

Statistics Canada. Banff – Functional Description of the Banff System for Edit and Imputation – Version 1.02. Statistics Canada December 2003.

Yohai V.J. “High breakdown point and high efficiency robust estimates for regression”. Annals of

Le indagini sul fatturato degli altri servizi: metodi di controllo e