• Non ci sono risultati.

Il controllo e la correzione in una indagine congiunturale basata su dati amministrativi. Il caso della rilevazione Oros

6. Il micro editing sui dati mensili nella stima preliminare

Una volta ricostruite le variabili utilizzabili a fini statistici si deve procedere al controllo e correzione dei micro dati mensili con l’obiettivo di individuare ed eventualmente correggere gli errori di misura, in particolare i valori estremi. Il livello di aggregazione delle variabili su cui viene effettuato il controllo è mirato esclusivamente alle variabili obiettivo. Come è stato accennato nel paragrafo precedente, poiché gli indicatori congiunturali Oros si riferiscono all’insieme dei dipendenti con l’esclusione dei dirigenti si è ritenuto opportuno sottoporre alla procedura di micro editing tutte le variabili di interesse distinte per soli due aggregati: il totale dei dipendenti e il “di cui” dei dirigenti in modo da ottenere per semplice differenza l’insieme del totale dei dipendenti esclusi i dirigenti.

I controlli si basano sia su rapporti caratteristici trasversali a livello di singola osservazione sia su informazioni longitudinali riferite alla stessa unità nel mese precedente. Alcune sperimentazioni hanno consentito di escludere la possibilità di fare riferimento al mese corrispondente dell’anno precedente. I benefici di cogliere la stagionalità sono inferiori ai costi in termini di minore compresenza delle unità nei due mesi25 e di maggiore complessità della procedura. Quindi, il controllo viene effettuato sul mese in esame (m) con l’ausilio delle informazioni del mese precedente (m-1) già eventualmente corrette. Questa procedura viene eseguita a catena sui tre mesi del trimestre oggetto di controllo.

I. Per le sottopopolazioni delle GI-INPS e delle imprese interinali il controllo è esaustivo. Per le PMI, vista la numerosità (oltre 1,2 milioni di unità), il controllo non può che essere di tipo selettivo. Le soglie di selezione sono state scelte in modo altamente prudenziale cercando di minimizzare la probabilità di controllare valori corretti.

25 Il forte e continuo turnover demografico in particolare di piccole e piccolissime imprese che iniziano attività con dipendenti o che la cessano comporta che fra il mese corrente m e quello relativo all’anno precedente m-12 vi sia una così elevata quota di unità presenti soltanto in uno due mesi che viene meno l’utilità del controllo longitudinale.

Figura 2: Le procedure del trattamento preliminare

Si

File microdati amministrativi inviati dall’INPS

- Decriptazione, conversione formato file ed eliminazione caratteri sporchi/errati - Controlli quantitativi sulla numerosità e

le relazioni tra i record

File utilizzabile, numerosità adeguata?

Si No

Si contatta immediatamente l’INPS per chiarimenti e si chiede una nuova versione dei file o scarichi aggiuntivi

Controlli errori formali nei codici associati ai micro dati

Corretti ? (19 possibili errori) Si No E’ possibile correggerli? No

Controlli di compatibilità delle variabili quantitative associate ai singoli codici (zeri impossibili) e trattamento dei codici ripetuti all’interno dello stesso DM10

Controllo di compatibilità sulla relazione tra codici diversi all’interno dello stesso DM10

Ricostruzione variabili statistiche all’interno del singolo DM10

Micro dati statistici pronti per il processo di controllo e correzione Codici irrecuperabili inutilizzabili Si No Corretti? Codici ripetuti? Elenco codici ammissibili nel trimestre Elenco e significato campi associati ai singoli codici Relazioni tra codici No Si Elenco aliquote INPS a carico del lavoratore e INAIL Identificazione DM10 ripetuti FONTI: - circolari INPS - tabelle sito web INPS - circolari INAIL Banca dati normativa Oros aggiornata trimestralmente Correzione delle duplicazioni Correzione duplicati Dipendenti e retribuzioni per - qualifica e - tempo di lavoro Contributi a carico

del datore di lavoro Elenco codici

da riaggregare a fini statistici

BANCA DATI NORMATIVA FASI AZIONI CORRETTIVE

Correzione codici errati

Per effettuare il micro editing mensile è stata progettata e realizzata una “maschera di controllo” sviluppata ad hoc con la procedura FSEDIT di Sas, che riporta un insieme di variabili e indicatori che letti in modo combinato consentono all’operatore di discriminare, in modo rapido ed efficace se si è in presenza di osservazioni corrette o di errori. Le variabili riportate dalla “maschera di controllo” sono numerose e possono essere raggruppate in quattro sottoinsiemi:

II. informazioni identificative dell’unità: numero di matricola, attività economica nel mese m e nel mese m-1;

III. variabili di interesse:

a. il numero totale dei dipendenti, distinguendo ulteriormente quelli a tempo pieno e quelli a tempo parziale26, il totale delle giornate retribuite, il monte retributivo e il monte oneri;

b. alcuni rapporti caratteristici calcolati combinando le suddette variabili: retribuzione media pro capite mensile, retribuzione media giornaliera, oneri medi pro capite mensili, rapporto percentuale fra oneri e retribuzione;

IV. variabili ausiliarie, rappresentate dalle variabili di interesse e dai rapporti caratteristici citati sopra riferite al mese precedente (m-1) e da altri indicatori come: la variazione del numero dei dipendenti, la variazione del rapporto percentuale tra gli oneri e le retribuzioni, le aliquote contributive percentuali a carico del lavoratore nei due mesi analizzati;

informazioni sul numero delle unità e il numero di occupati totali nella divisione in cui è classificata l’osservazione, derivati dall’universo dei dati INPS dell’anno precedente.

Per il controllo di un generico mese m la procedura può essere suddivisa in 5 passi (Figura 3).

1. Abbinamento delle informazioni economiche relative al mese in esame m con le stesse informazioni relative al mese precedente m-1 a livello di ogni singola unità.

2. Abbinamento con la lista GI che consente di individuare le unità abbinate che vanno escluse (poiché esse verranno stimate in modo censuario utilizzando la rilevazione sulle GI) e le tre sottopopolazioni da controllare con diversa procedura: le unità GI-INPS, le imprese Interinali e le PMI.

3. Controllo e correzione della variabile “giornate retribuite” totali partendo dall’analisi delle distribuzioni mensili delle giornate retribuite pro capite, aggiustate per i lavoratori part-time e gli apprendisti27. Il controllo è necessario per l'individuazione di valori impossibili nelle giornate retribuite, variabile che in seguito contribuisce all’analisi interattiva degli errori.

4. Controllo esaustivo ed eventuale correzione interattiva delle variabili delle unità appartenenti alle sottopopolazioni GI-INPS e delle imprese Interinali. Le correzioni, effettuate attraverso la maschera di controllo interattiva, vengono segnalate con un flag e quelle sugli occupati vengono riportate anche sulle variabili utili alla costruzione delle Ula (part-time, full-time, ecc.).

5. Nella sottopopolazione PMI si procede con le seguenti fasi:

• controllo longitudinale della variabile totale occupazione ed eventuale correzione interattiva. A tale scopo, si utilizza la distribuzione delle variazioni mensili del numero di dipendenti. Ordinando in modo decrescente le osservazioni secondo la stessa variabile si limita il controllo interattivo alle imprese con variazioni (positive o negative) superiori a 80 dipendenti. Sulla base dell’esperienza si è osservato che eventuali errori compaiono ai due estremi della distribuzione: basta scorrere poche decine di unità che hanno subito forti variazioni, per individuare eventuali valori estremi errati. Se necessario si effettuano le correzioni attraverso la maschera interattiva e, anche in questo caso, quelle sugli occupati vengono riportate anche sulle variabili utili alla costruzione delle Ula;

• individuazione di un insieme “sospetto” di unità che rispetto a diversi rapporti caratteristici (retribuzioni medie pro capite e oneri medi pro capite) superano dei valori soglia prestabiliti. Inizialmente modulando opportunamente i valori soglia, erano stati individuati due insiemi: il primo che conteneva le poche osservazioni caratterizzate da situazioni molto anomale (probabili errori casuali) o sistematicamente distaccati dal corpo delle distribuzioni (errori

26 Informazioni indispensabili per il calcolo delle Ula.

nell’unità di misura) su cui era possibile effettuare correzioni automatiche; il secondo contenente altri valori anomali da valutare interattivamente. Dopo un certo periodo di esperienza si è preferito far rientrare in un unico insieme tutte le unità anomale e non procedere più a correzioni automatiche ma controllare interattivamente tutte le unità;

Figura 3: Le fasi del micro editing interattivo sui dati mensili

• ordinamento decrescente delle unità dell’insieme “sospetto” in base ad un indicatore di sintesi della dimensione della unità (media fra il totale delle retribuzioni e il totale degli oneri del mese

m) in modo da controllare per prime le osservazioni che dovrebbero avere un impatto maggiore

sulle stime. Successivamente si procede al controllo interattivo ed all’eventuale correzione delle variabili retributive e contributive scorrendo le osservazioni fino a quando si valuta che la dimensione decrescente delle unità rende inutile continuare l’esame. Nel caso si identifichino degli errori, le singole variabili vengono corrette sostituendo valori più plausibili basati sulle

Micro dati mensili mese m Si Errori nelle variabili? Si SI - Abbinamento dati mensili

- Controllo giornate retribuite

No Micro dati mensili

mese m-1

Abbinamento con lista codici fiscali GI

Lista codici fiscali indagine GI del

mese m e m-1

Calcolo dei rapporti caratteristici e controllo esaustivo interattivo GI-INPS e imprese interinali PMI imprese abbinate con GI Correzione interattiva GI-INPS e imprese interinali corrette

Calcolo dei rapporti caratteristici, ordinamento decrescente

e controllo del numero dei dipendenti Correzione interattiva e ricalcolo rapporti caratteristici Errori nel numero dei dipendenti? Selezione unità anomale o “sospette” Unità anomale o sospette? Correzione interattiva var. retribuzioni ed oneri Microdati mensili del mese m corretti No PMI corrette No

variabili ausiliarie del mese precedente o, in caso di errori nell’unità di misura, dividendo o moltiplicando per multipli di 10.

6. Una volta effettuate tutte le eventuali correzioni si procede alla riunificazione dei diversi file contenenti le unità appartenenti alle sottopopolazione delle GI-INPS e delle imprese Interinali, con quelle della sottopopolazione PMI ottenendo il file dei micro dati corretti.

Va segnalato che la particolarità dei dati, legati alla provenienza amministrativa, ha un notevole impatto anche sulla distribuzione delle variabili retribuzioni e oneri sociali e sulla identificazione di valori soglia che riescano a discriminare fra valori accettabili ed errori. La distribuzione della retribuzione pro capite media mensile delle PMI come prevedibile presenta una certa asimmetria con una lunga coda a destra di retribuzioni pro capite molto elevate. Ma presenta anche una coda a sinistra con un considerevole numero di osservazioni con retribuzioni estremamente ridotte che declinano lentamente fino allo zero. In altri contesti queste osservazioni sarebbero considerate affette da errori ma in questo caso si tratta di fenomeni reali dovuti all’erogazione di retribuzioni ridotte o integrazioni salariali alle indennità erogate dall’INPS per maternità, malattia, CIG, in imprese con un numero di dipendenti estremamente ridotto. Il caso degli oneri sociali è ancora più particolare perché questa variabile a livello mensile può assumere addirittura valori negativi. Le imprese, infatti, a causa di modifiche normative relative, ad esempio, a determinati gruppi di lavoratori, frequentemente hanno diritto a sgravi contributivi o al recupero di contributi pagati in eccesso nei mesi precedenti che possono compensare riducendo i versamenti nel mese corrente. Questo fenomeno interessa maggiormente le imprese con pochi dipendenti perché, in genere, in quelle grandi i recuperi contributivi vengono più che compensati da altri versamenti. Nell’editing delle PMI, pertanto, si sono dovute fissare soglie con valori negativi accettabili.

Il numero delle correzioni effettuate complessivamente sulle imprese grandi, sulle interinali e sulle PMI risulta estremamente ridotto, relativamente al totale dei record sottoposti al micro editing. Tuttavia, l’entità di queste correzioni di frequente può essere molto rilevante. A titolo di esempio un caso estremo di errore nelle posizioni lavorative di una singola impresa che non venisse eliminato correttamente dalla procedura di micro editing, nel terzo trimestre del 2007 comporterebbe un impatto nella variazione tendenziale della sezione G di 2,2 punti percentuali (che corretta è pari allo 0,8 per cento, in luogo del 3,0 per cento affetto da errore).