• Non ci sono risultati.

Calcolo delle medie mensili e collocazione delle unità nel campo di osservazione

4. DAL DATO AMMINISTRATIVO ALLE INFORMAZIONI STATISTICHE. BANCA DATI

5.3 Calcolo delle medie mensili e collocazione delle unità nel campo di osservazione

Per costruzione il coefficiente q è minore di 1, per cui il termine q-1 è negativo e risulta pertanto minore di 1 anche il rapporto tra Ula e posizioni lavorative. L’ultimo termine della formula descrive la dipendenza del rapporto dalla quota dei part-time sul totale dipendenti p) e dalla stima del coefficiente. Il rapporto tende ad 1 come caso estremo se il peso dei time tende a 0 oppure se il coefficiente q tende a 1, caso in cui le ore medie dei part-time coincidono con quelle dei full-part-time. Il rapporto tende a 0 se il peso dei part-part-time tende ad 1 e il coefficiente q tende a 0, ossia il contributo orario dei part-time si riduce man mano a fronte di una percentuale alta di part-time.

5.3 Calcolo delle medie mensili e collocazione delle unità nel campo di osservazione

I dati relativi alle principali variabili economiche disponibili a questo livello sono espressi come monte trimestrale. Il passaggio successivo è il calcolo di medie mensili nel trimestre, ottenute dividendo il monte trimestrale per tre (numero di mesi del trimestre). Tale procedimento implica che eventuali situazioni di assenza nel trimestre contribuiscano con un valore pari a 0 nella media mensile. Mentre nei dati finali eventuali assenze sono da attribuirsi a stati di inattività6, nei dati preliminari la presenza di rispondenti ritardatari, che comporta valori nulli su tutte le variabili7, a questo stadio non può essere discriminata da situazioni di reale inattività, a causa dell’assenza di una lista teorica di rispondenti rapidi (cfr. §6.2.4). In tale versione dei dati, quindi, la media mensile delle variabili espresse come livelli risulta una sottostima del valore finale se a una determinata assenza corrisponde non uno status di inattività ma un ritardo nell’invio della dichiarazione contributiva (evento non noto a priori), rendendo necessaria una correzione attraverso procedura di imputazione. Le principali variabili target della rilevazione, tuttavia, sono espresse come rapporto (cfr. §2.1). In tal caso, la distorsione della variabile dipende da un’eventuale periodicità tra i mesi del trimestre delle variabili che contribuiscono a numeratore e denominatore. Se vi è uniformità nei tre mesi del trimestre, la distorsione scompare con il rapporto, proprio grazie all’assenza di mancate risposte parziali nel mese. Tuttavia, le variabili trattate da Oros sono notoriamente molto periodiche (es. tredicesima mensilità a dicembre e quattordicesima a giugno se si parla di retribuzioni), producendo microdati medi mensili distorti (in sovra-stima o sottosovra-stima). Di fatto, data l’esigua incidenza dei rispondenti ritardatari (cfr. §6.2.3) e la loro distribuzione molto uniforme all’interno dei domini di stima, la distorsione del-le variabili pro-capite per risposta ritardataria nei dati provvisori è pressoché trascurabidel-le negli aggregati per attività economica, rendendo un’eventuale procedura generalizzata di imputazione delle variabili pro-capite non consigliabile, poiché molto costosa in termini di implementazione e gestione, a fronte di miglioramenti della stima poco rilevanti. Si ricorre,

6 Fanno eccezione le matricole caratterizzate da DM 2013 “anomali” che vengono sottoposte ad un trattamento specifico (cfr. §6.5).

7 Nei dati relativi ai DM2013 il fenomeno delle “mancate risposte parziali” ossia assenza per omessa dichiarazione di alcune variabili del modello utilizzate da Oros è assente.

62

La rilevazione trimestrale Oros su occupazione e costo del lavoro tuttavia, a una procedura di imputazione micro sulle variabili target per un limitato numero di mancate risposte ritenute influenti secondo criteri di selettività (cfr. §6.6). Per correg-gere la distorsione sulle variabili espresse in livello (posizioni lavorative) l’imputazione a livello micro viene, invece, effettuata attraverso una procedura che corregge tutte le unità potenzialmente caratterizzate da mancata risposta (cfr. §6.2 e §6.3). Nei dati finali, le man-cate risposte hanno un peso irrilevante e sono circoscritte ai cosiddetti DM2013 “anomali” richiedendo, anche in questo caso, un intervento di imputazione delle posizioni lavorative, di incidenza molto contenuta (cfr. §6.5).

Attraverso aggregazione per codice fiscale8 viene individuata la dimensione media dell’impresa e attribuiti alle singole unità dei flag di appartenenza a sottopopolazioni pre-fissate. Tale suddivisione è utile sia a fini di controllo (cross-section e longitudinale), sia di trattamento dei dati. In particolare, nelle stime Oros la popolazione complessiva viene suddivisa in:

- piccole e medie imprese stimate con dati amministrativi (d’ora in avanti PMI); - grandi imprese di rilevazione (GI). Questo insieme verrà successivamente sostitu-ito con i dati di fonte rilevazione;

- grandi imprese che rientrano nella popolazione coperta dalla rilevazione e stimate con dati amministrativi. Sono le unità che non rientrano nell’insieme delle GI e che nell’i-stante in cui compaiono per la prima volta hanno più di 500 dipendenti. Tali unità vengono distinte dalle PMI poiché potenzialmente rilevanti sulle stime e oggetto di eventuali trasfor-mazioni giuridiche che provengono dall’insieme GI (d’ora in poi GI_DA, dove DA indica dati amministrativi). Tale distinzione, tuttavia, è utile solo ai fini dei controlli. In fase di stima esse vengono accorpate e trattate allo stesso modo delle PMI;

- unità che fanno riferimento ad agenzie di somministrazione di lavoro temporaneo (ex-interinali) (d’ora in poi INTER). La necessità di isolare questa sottopopolazione è dovuta al loro rilevante peso occupazionale concentrato tra pochissime unità e la frequente e per-sistente presenza di risposte ritardatarie nei dati provvisori. La loro influenza sulla sezione N (Noleggio, agenzie di viaggio, servizi di supporto alle imprese) suggerisce l’applicazione di una procedura specifica di editing sulle variabili target, nonché di ricostruzione di dati mancanti sulle posizioni lavorative ai fini delle stime provvisorie (cfr. §6.3).

La sottopopolazione di appartenenza viene individuata all’anno base o all’istante di nascita del codice fiscale e lo status conservato sino al successivo cambio base. Fanno eccezione le GI e le INTER (le prime hanno priorità sulle seconde), che possono diventare tali in ogni istante di riferimento, una volta acquisite le caratteristiche. Nel processo Oros, alcune operazioni vengono effettuate trattando separatamente le sottopopolazioni elencate sopra. In altri casi, si rende necessario unicamente distinguere tra unità stimate con dati GI e restanti unità stimate con dati amministrativi ossia le PMI, le GI_DA e le INTER che, per semplicità espositiva, verranno indicate con NO_GI.

Successivamente, combinando informazioni anagrafiche viene attribuito anche lo sta-tus di appartenenza al dominio di riferimento della rilevazione. In particolare, come am-piamente descritto nel capitolo 3, vengono etichettate come escluse dalle stime le unità che non rientrano nei settori economici da B a N e da P a S (S94 esclusa) e che non sono né imprese né istituzioni private. Inoltre, a questo livello vengono individuate come non rientranti nelle stime anche quelle unità che, pur risultanti attive secondo le informazione anagrafica nei trimestri di stima provvisoria, non presentano dichiarazione contributiva da

8 Dall’aggregazione vengono esclusi i codici fiscali formalmente errati oppure “atipici” (cfr. §3.2.1). Le matricole aziendali di queste unità vengono considerate singole imprese.

63

5. Il trattamento trimestrale

almeno 12 mesi. Queste unità non rientreranno nel processo successivo d’imputazione delle mancate risposte.

Una volta definito lo status di appartenenza al dominio della rilevazione e l’eventuale flag di esclusione dalle stime, vengono effettuati dei controlli di coerenza tra i flag e le in-formazioni utilizzate per definirli, tramite tabulazioni e distribuzioni.

I dati relativi alle unità che rientrano nelle stime prima di essere aggregati per le variabili di classificazione d’interesse per la rilevazione e sottopopolazione di riferimento vengono sottoposti alla successive fasi di editing e imputazione, di cui al capitolo 6 che segue.

65

6. EDITING E IMPUTAZIONE

1

6.1 Introduzione

Prima di procedere alle operazioni di aggregazione per il calcolo delle variabili target i microdati da fonte amministrativa trimestralizzati, sia nella versione per le stime preliminari sia finali, vengono sottoposti a controlli volti ad individuare e correggere mancate risposte e/o valori anomali che indurrebbero distorsioni sulle stime.

Nei dati amministrativi le mancate risposte equivalgono a DM relativi ad imprese attive che sono assenti negli scarichi al momento dell’acquisizione dei dati da parte dell’Istat (cfr. §2.2). Vi sono almeno due ordini di motivi per tali assenze: 1) dichiarazioni contributive inviate oltre la scadenza amministrativa da parte delle aziende, in alcuni casi a seguito di particolari deroghe; 2) ritardi o mancata virtualizzazione degli Uniemens in DM2013 per motivi amministrativi o anche per problematiche informatiche in ambito Inps. Nei DM2013 sono, invece, rari i casi di mancata risposta parziale, ossia di assenza di parte delle infor-mazioni all’interno delle dichiarazioni. Questa caratteristica è conseguenza dei molteplici controlli gestionali presenti sia nei software di “procedura paghe”, utilizzati dalle aziende per generare gli Uniemens, sia nelle successive procedure on-line di controllo dell’Inps, per le quali le aziende devono passare prima di poter trasmettere il flusso: considerata l’elevata copertura in termini di rispondenti, l’intervento sulle mancate risposte riguarda solo dichia-razioni totalmente assenti. Per la stessa motivazione, sono rari i casi di errori nei microdati di origine: eventuali errori possono essere più facilmente generati dalle procedure di stima di Oros e su tali casi si interviene con la correzione della procedura errata e l’elaborazione viene interamente ripercorsa.

Sull’assenza di dichiarazioni contributive per ritardo d’invio si interviene con imputa-zione dei microdati delle principali variabili target. Mentre per le posizioni lavorative dipen-denti l’imputazione avviene in modo estensivo (tutte le unità entrano nella procedura di trattamento), la correzione per mancata risposta delle variabili di costo del lavoro, anch’es-sa attuata a livello di microdati, si baanch’es-sa sull’individuazione selettiva di un insieme ridotto di unità da trattare: il ridotto impatto che le dichiarazioni ritardatarie hanno su tali variabili, espresse come pro-capite e la tempestività con cui gli indicatori devono essere rilasciati, suggerisce un approccio più mirato, in cui vengono controllate ed eventualmente corrette solo le unità rilevanti per le stime (cfr. §6.5).

Il processo di imputazione riguarda sia i dati della stima provvisoria sia quelli della stima finale sebbene le mancate risposte nei dati finali siano pressoché trascurabili. Mentre per le prime la ricostruzione del dato mancante richiede una preliminare predizione dello “status di attività” a causa dell’assenza di informazioni anagrafiche aggiornate che consentano di stabilire se un’assenza sia o meno mancata risposta (cfr. §6.2) per queste ultime, prodotte

1 I paragrafi 6.1, 6.2.2, 6.2.3, 6.5.1 di questo capitolo sono a cura di Donatella Tuzi; il paragrafo 6.2.1 è a cura di Donatella Tuzi e Francesca Romana Pogelli; i paragrafi 6.2.4, 6.2.5 e 6.4 sono a cura di Francesca Romana Pogelli e Marco Lattanzio; il paragrafo 6.3 è a cura di Elisabetta Aquilini; il paragrafo 6.5.2 è a cura di Marco Lattanzio; il paragrafo 6.6 è a cura di Eleonora Cimino e Marco Lattanzio.

66

La rilevazione trimestrale Oros su occupazione e costo del lavoro dalla procedura di virtualizzazione, lo status di attive è certo (cfr. §6.4). Un trattamento a parte è riservato all’imputazione delle mancate risposte relative alle agenzie di somministra-zione di lavoro (nel documento INTER): data la loro peculiarità rispetto alle variabili consi-derate in Oros e il rilevante peso nel settore di attività economica in cui sono classificate, per la loro stima preliminare è stata predisposta una procedura ad hoc nella quale sia nella ricostruzione della lista dei rispondenti ritardatari sia nell’imputazione del dato mancante, si tengono fortemente in considerazione le informazioni longitudinali disponibili sulle singole unità, successivamente controllate e validate caso per caso (cfr. §6.3).

L’imputazione degli errori e delle mancate risposte viene condotta solo sulle unità sti-mate con dati da fonte amministrativa, ossia le piccole e medie imprese, le grandi imprese non presenti nei dati d’indagine e le interinali (PMI+GI_DA e INTER). I dati tratti dall’indagi-ne GI sono acquisiti in Oros già inclusivi delle operazioni di E&I effettuate ai fini dell’indagi-ne (Rocci e Serbassi, 2008). Eventuali errori dell’indagi-nei dati d’indagidell’indagi-ne individuati ex-post vengono concordati e corretti ai fini di Oros dopo un’attenta valutazione con gli esperti dell’indagine (cfr. §7.4). Una scomposizione dell’errore di stima per cause consente, infine, di tenere sot-to controllo vari aspetti del processo di stima provvisoria, indicando alcune criticità su cui intervenire al fine di correggere le stime e migliorarne il processo di produzione (cfr. §6.4).