• Non ci sono risultati.

L’individuazione della lista anagrafica Oros del panel dell’indagine sulle grandi imprese

7. INTEGRAZIONE CON I DATI DI FONTE INDAGINE. L’INDIVIDUAZIONE DELLA LISTA

7.3 L’individuazione della lista anagrafica Oros del panel dell’indagine sulle grandi imprese

La fase principale del processo di integrazione micro tra le due fonti è rappresentata dall’identificazione di una lista trimestrale di unità compresenti in base alla quale escludere dalla fonte Oros le unità appartenenti al panel GI. Occorre sottolineare che il linkage tra le due fonti si configura come un processo molto complesso e non come un semplice abbinamento tra unità, a causa dell’elevato grado di dinamicità che caratterizza la demografia delle impre-se di grande dimensione (trasferimenti d’azienda, fusioni, scissioni, subentri, ecc.). Inoltre, poiché i movimenti anagrafici non sempre sono colti contestualmente dalle due fonti, si possono verificare errori di mismatch con conseguente impatto sulla qualità delle stime.

All’interno del processo di individuazione della lista GI, se da un lato è utile distinguere la fase della sua definizione in un dato anno base e il suo mantenimento/aggiornamento trime-strale sino al cambio base successivo, dall’altro, queste due macro fasi sono fortemente con-nesse. Infatti, il processo Oros che garantisce la diffusione di indicatori congiunturali nella base di riferimento data, parallelamente, imposta i lavori preparatori al cambio base successivo.

7.3.1 Definizione e mantenimento trimestrale

Dato il panel chiuso GI delle imprese con 500 e più dipendenti, il processo prevede la creazione e l’aggiornamento di una lista trimestrale delle unità Oros appartenenti al panel GI complementare a quella delle restanti unità Oros (in breve: PMI+GI_DA) (figura 7.3.1.1). Il primo passo del processo di definizione della lista trimestrale consiste nel matching esatto tra le unità delle due fonti (fase automatica). Le fonti Oros e GI utilizzano come identificativi delle proprie unità di analisi, rispettivamente, la matricola aziendale Inps e il codice identificativo interno all’indagine GI. Essendo tali identificativi diversi tra loro, l’uni-co matching possibile è quello che utilizza il l’uni-codice fiscale (CF) l’uni-come chiave identificativa unica a livello di impresa. Il CF presenta elevati livelli di qualità in termini di completezza e correttezza in entrambe le fonti, garantiti da un trattamento preliminare cui viene sottoposto il CF di fonte amministrativa (cfr. §3.2.1) e da un’attenzione sempre crescente posta dagli

97

7. Integrazione con i dati di fonte indagine

esperti d’indagine nei confronti di questa variabile, divenuta nel tempo fondamentale per collegare a livello micro i dati d’indagine con i dati di altre fonti (Rocci e Serbassi, 2008).

La lista trimestrale così individuata presenta, tuttavia, problemi residui di mismatch data la diversa tempistica con cui vengono registrati nelle due fonti eventuali cambiamenti di CF legati a movimenti demografici d’impresa5. In particolare, possono verificarsi casi di errato abbinamento, quando la stessa impresa viene registrata con CF diversi nelle due fonti, oppure, quando una trasformazione giuridica comporta la nascita di una nuova im-presa a partire da un’imim-presa già presente nella lista ottenuta attraverso il matching esatto; in entrambi i casi il nuovo CF non risulta ancora presente nella lista GI. Per trattare tali casi, ogni trimestre, dopo la fase automatica, viene avviata una fase interattiva basata su una funzione di controllo che valuta la differenza tra il numero dei dipendenti nelle due fonti per lo stesso CF (fase manuale). Tuttavia, tale indicatore segnala non solo casi con pro-babile trasformazione giuridica, ma anche casi con presenza di mancate risposte imputate o meno. Per le imprese che superano una soglia limite prescelta, quindi, vengono isolati i casi di corretto abbinamento sui quali non sia stato effettuato un adeguato trattamento delle mancate risposte sul dato occupazionale, dai casi di errato/incompleto abbinamento tra imprese. In quest’ultimo caso, in cui la differenza nei dipendenti è attribuibile ad una vera trasformazione giuridica6, si inserisce il momento più delicato della fase manuale che ha come obiettivo la ricerca dei CF da aggiungere per ottenere una lista GI completa.

A tale scopo, è fondamentale l’uso congiunto delle informazioni sulle trasformazioni longitudinali delle imprese GI raccolte e aggiornate in uno specifico data base “di eventi” Istat7, di quelle provenienti dal Registro imprese delle Camere di Commercio (Telemaco) e dal Portale delle imprese dell’Istat. Nei casi residui in cui la trasformazione giuridica non risulti da tali informazioni, si cercano le connessioni tra imprese collegate tramite i siti web o il ricontatto diretto delle imprese.

Come è facile intuire, questa seconda fase del processo di integrazione teso a garan-tire la coerenza tra la lista trimestrale e i movimenti demografici delle unità appartenenti al panel chiuso, risulta essere quella che richiede il maggiore sforzo in termini di risorse e di tempo essendo difficilmente generalizzabile, ed assume rilevanza maggiore man mano che ci si allontana dall’anno base.

La lista trimestrale Oros delle imprese GI così definita non è solo output di un processo unidirezionale, ma è anche fonte d’informazione aggiornata che contribuisce al manteni-mento della rappresentatività nel tempo del panel GI seguendo un processo ciclico di ag-giornamento automatico e interattivo. Infatti, le trasformazioni giuridiche emerse vengono valutate dall’indagine GI ed eventualmente acquisite una volta l’anno, in occasione della revisione degli indicatori, per tutte le occorrenze dell’anno precedente implicando una re-visione delle liste trimestrali Oros delle imprese GI. Tuttavia, per una gestione efficiente delle diverse fasi del processo Oros integrato, la revisione delle liste viene acquisita nelle stime definitive Oros un trimestre alla volta e non contemporaneamente su tutti i trimestri dell’ultimo anno completo.

5 La fonte amministrativa Inps, avendo finalità contributive contabili di legge, registra con tempestività le modifiche aziendali che comportano una nuova iscrizione anagrafica, mentre non sempre la cancellazione anagrafica viene dichiarata tempestivamente dall’impresa coinvolta, in assenza di una sanzione amministrativa.

6 Tra le trasformazioni giuridiche più frequenti si segnalano la cessione di dipendenti in impresa già esistente o in impresa di nuova iscrizione anagrafica, l’acquisizione dei dipendenti di altra impresa già esistente, ecc..

7 La necessità di tenere aggiornate le informazioni deriva dal fatto che gran parte delle imprese di grande dimensione subiscono modifiche anagrafiche e, se non si tenesse conto della loro evoluzione demografica, dopo poco tempo il panel chiuso GI non sarebbe più rappresentativo.

98

La rilevazione trimestrale Oros su occupazione e costo del lavoro

Figura 7.3.1.1 - Integrazione dei dati Inps con dati dell’indagine GI: il processo trimestrale

7.3.2 Definizione trimestrale per il cambio base

Accanto al processo trimestrale a regime sin qui descritto, si aggiunge ogni cinque anni l’attività straordinaria di ridefinizione delle liste trimestrali Oros per tener conto del cambio base GI che comporta la definizione di un nuovo panel d’imprese. Questa attività procede per passi: un’analisi preliminare ha inizio non appena i referenti dell’indagine GI definiscono le unità che entreranno nel nuovo panel e le rendono disponibili su un DB-sviluppo con un ritardo di circa 2 anni dalla fine dell’anno base, mentre la definizione delle nuove liste trime-strali Oros delle imprese GI avviene non appena le unità del nuovo panel vengono messe a disposizione sul DB-produzione due mesi dopo (figura 7.3.2.1).

Si Sistema Asia Portale Imprese Rilevazione mensile GI Si No Lista imprese INPS Abbinamento utilizzando come chiave di link il

codice fiscale Stesso codice fiscale? No Numero di dipendenti simile? Trasformazioni giuridiche GI Controlli interattivi:

- utilizzo di chiavi di link alternative (ragione sociale) - ricorso a fonti esterne

Fonti on-line su Internet No Lista Codici Fiscali da eli-minare dalla lista INPS in quanto apparte-nenti al panel GI o ad esso riconducibili (lista GI) Stessa impresa? Si

Lista imprese INPS complementare alla lista GI

(lista PMI+GI_DA) Lista imprese GI Dati INPS Telemaco Fase automatica Fase manuale

99

7. Integrazione con i dati di fonte indagine

Le informazioni estratte appositamente dal DB-sviluppo riguardano la lista dei codici im-presa (identificativo dell’indagine GI) appartenenti ad almeno uno dei due panel consecutivi, il CF collegato che rappresenta la chiave di abbinamento con Oros (unico se il CF è invariato tra l’anno di riferimento della base e l’anno in cui è stato creato il DB-sviluppo, annuale in caso contrario), un flag stato del codice rispetto al panel precedente (flag stato 1 se nuovo entrato, 2 se uscito e 3 se panel) che rappresenta il legame tra i due panel consecutivi.

L’analisi preliminare ha come obiettivo la definizione di una lista univoca di CF determi-nata a partire dalla lista dei codice impresa GI, appartenenti ad almeno uno dei due panel consecutivi d’imprese, con associato il flag stato e la ragione sociale univoci. Nei casi non univoci, quando lo stesso CF presenta più codici, in cui almeno uno è qualificato ‘panel’ e, ad esempio, l’altro ‘uscito’ la regola definita comporta il mantenimento del CF nella li-sta. La lista dei CF così ottenuta si utilizza per individuare all’interno delle liste trimestrali Oros delle imprese GI del vecchio panel, il sottoinsieme di quelli ad essa complementare con l’obiettivo di assegnare anche a questi CF un flag stato corretto. Questo sottoinsieme include i CF che sono stati individuati durante tutte le attività trimestrali di profiling delle imprese portate avanti nel periodo che intercorre tra i due cambi base (CF-connessi), du-rante le fasi automatica e manuale di definizione delle liste trimestrali Oros delle imprese GI. Dato che nel nuovo panel GI gran parte delle imprese provengono dal vecchio panel, non è conveniente fare ex-novo il profiling ma si rivalutano le connessioni già individuate in precedenza per escludere connessioni non più valide. Alcuni dei CF-connessi potrebbero appartenere ad imprese che escono dal nuovo panel GI, oppure appartenere a connessioni di un passato non recente e in entrambe i casi vanno esclusi. Il criterio di esclusione usato utilizza un indicatore di probabile cessazione che tiene conto della persistenza del mancato matching con i micro dati trimestrali Oros (98 per la base 2010 su 534), per tutti i trimestri che vanno dal primo trimestre dell’anno base all’ultimo trimestre dell’anno base+2 e un indicatore di sovracopertura dell’anagrafe Inps per mancata cancellazione del CF, che valuta la costante assenza di dipendenti nel CF in caso di matching (366 codici fiscali per la base 2010 su 534).

I CF-connessi al netto degli esclusi (70 per la base 2010 su 534) possono presentare ragione sociale mancante, che viene recuperata da micro dati anagrafici precedenti all’anno base in quanto informazione utile nella fase manuale.

Al termine di questa fase si perviene a liste preliminari trimestrali Oros dei CF ‘panel’, ‘nuovi entrati’ e ‘CF-connessi ai panel’ per il periodo che include l’anno base e i 2 anni suc-cessivi.

Per perfezionare queste liste e renderle definitive, nella fase finale sul DB-produzione si utilizza nuovamente la funzione di controllo basata sulla differenza nell’occupazione tra le due fonti Oros e GI superiore ad una soglia prescelta.

100

La rilevazione trimestrale Oros su occupazione e costo del lavoro

Figura 7.3.2.1 - Integrazione dei dati Inps con dati dell’indagine GI: il processo per il cambio base

4

Liste GI trimestrali (base corrente) 3 2 trimestre 1 anno a 4 3 2 trimestre 1 anno a+1 4 3 2 trimestre 1 anno a+2

Liste GI trimestrali Panel+Entrate rispetto alla base corrente (nuova base)

Uscite Panel

Entrate

trimestre 1 anno a

Liste PMI+GI_DA trimestrali (base corrente)

4

Trimestri, anno …., a+1 …., a+2 …., a+3

Uscite Panel Entrate Uscite Panel Entrate trimestre 1 anno a+3 3 2 trimestre 1 anno a+1 4 3 2 trimestre 1 anno a+2 4 3 2

Liste PMI+GI_DA trimestrali Entrate+Panel rispetto alla base corrente (nuova base)

Entrate PMI Uscite panel

Trimestri, anno a …., a+1 …,a+2

trimestre 1 anno a+3

101

7. Integrazione con i dati di fonte indagine