• Non ci sono risultati.

Imprese da contattare da VELA e rispondenti a OROS, rispondenti e non rispondenti a VELA, con

Prevenzione degli errori, integrazione dei dati e metodi statistici nel processo di controllo e correzione dell'Indagine trimestrale sui posti

Tavola 3: Imprese da contattare da VELA e rispondenti a OROS, rispondenti e non rispondenti a VELA, con

e i OROS i i i i OROS i i i o o of of o o oi oi = = .

Si può mostrare analiticamente (si veda Bellisai, 2006) che, a causa della differenza nelle definizioni, possono esistere sia situazioni in cui, per una certa impresa e in un dato trimestre, le posizioni occupate medie secondo OROS sono maggiori della media di quelle rilevate a inizio e fine trimestre da VELA, sia situazioni in cui la relazione vale nel verso opposto. Tuttavia, analiticamente non risulta semplice definire insiemi di condizioni associati a ciascuna di queste due situazioni.

Tavola 3: Imprese da contattare da VELA e rispondenti a OROS, rispondenti e non rispondenti a VELA, con

posizioni lavorative non imputate e imputate – terzo trimestre 2006

Numero Imprese Composizione percentuale

Imprese da contattare e rispondenti a OROS 8.756 100,0

di cui rispondenti a VELA 6.413 73,2

di cui con posizioni lavorative imputate tramite OROS (per differenza sostanziale fra i dati delle

due rilevazioni) 446 5,1

di cui non rispondenti a VELA 2.343 26,8

di cui con posizioni lavorative imputate tramite la risposta a VELA nel trimestre precedente e

tramite OROS 649 7,4

di cui con posizioni lavorative imputate solo

tramite OROS 1.694 19,3

NOTA: la tavola si riferisce alle sole imprese coinvolte nella rilevazione VELA, ma non in GI.

La scelta di usare le informazioni rilevate da OROS per integrare le posizioni occupate in VELA è comunque supportata da una serie di studi da cui risulta che in generale la differenza fra le posizioni occupate medie secondo OROS e la media di quelle rilevate a inizio e fine trimestre da VELA è vicina a zero (si vedano Bellisai, Pacini, Pennucci, 2005a e 2005b).

Come si può vedere dalla tavola 3 che descrive la situazione in un trimestre rappresentativo (il terzo del 2006) per le sole imprese coinvolte nella rilevazione VELA ma non in GI, il 73% delle imprese contattate ha risposto sia a VELA che a OROS, mentre il restante 27% non ha risposto a VELA pur potendo essere ritenuto attivo (in quanto rispondente a OROS). A poco più di un quarto delle imprese affette da mancata risposta totale sono state imputate posizioni lavorative occupate sia sulla base della risposta fornita dalle medesime imprese a VELA nel trimestre precedente che dei dati di OROS, mentre per le restanti si sono utilizzati i soli dati di OROS. Infine, solo nel 7% delle imprese rispondenti a entrambe le rilevazioni si sono riscontrati dati sostanzialmente diversi presso le due fonti.

5.4 L’imputazione del tasso di posti vacanti

Il passo successivo all’imputazione delle posizioni occupate a fine trimestre consiste nell’identificazione delle imprese alle quali deve essere imputato il tasso di posti vacanti (definito, in questo paragrafo, come il numero di posti vacanti a fine trimestre diviso per il numero di posizioni occupate a fine trimestre) e nella loro successiva imputazione.

La fase di imputazione del tasso di posti vacanti procede separatamente per le imprese della rilevazione che fanno parte anche del panel della rilevazione GI e per quelle che non ne fanno parte (da ora in poi chiamate PMI). Questo a causa delle diverse caratteristiche intrinseche e della disponibilità di differenti variabili ausiliarie per le due tipologie di imprese.

Le PMI alle quali va imputato il tasso di posti vacanti si suddividono in tre tipologie:

1. le imprese rispondenti alla rilevazione che non hanno risposto alla domanda sulla presenza o meno di posti vacanti (mancata risposta parziale)

2. le imprese rispondenti alla rilevazione che hanno fornito una risposta sul tasso di posti vacanti identificata come outlier nella fase iniziale e, per tale ragione, posta a missing

3. le imprese non rispondenti alle quali sono state precedentemente imputate le posizioni occupate Per quanto riguarda le PMI, l’obiettivo della fase di imputazione è quello di stimare il tasso di posti vacanti per tutte le imprese contattate nei trimestri di un blocco di rotazione (dal quarto trimestre di un anno al terzo del successivo). Per quanto riguarda invece le GI, l’obiettivo è quello di stimare il tasso di posti vacanti per tutte le imprese della rilevazione GI che sono state contattate, indipendentemente dal blocco di rotazione, in quanto queste imprese fanno sempre parte del campione della rilevazione. Le GI alle quali va imputato il tasso di posti vacanti si suddividono in cinque tipologie, di cui tre analoghe a quelle identificate per le PMI. I due casi aggiuntivi corrispondono a:

1. le imprese rispondenti che hanno fornito una risposta sul tasso di posti vacanti, ma la cui risposta sulle posizioni occupate a fine trimestre è ritenuta non compatibile con la stessa risposta alla rilevazione GI. Si ritiene in questo caso che la risposta a VELA non sia rappresentativa dell’impresa nel suo complesso e si pone a missing il valore dei posti vacanti dichiarato. In breve, il dato sul tasso dei posti vacanti di VELA è ritenuto accettabile se, in termini di posizioni occupate, l’impresa VELA è più grande di quella GI o se, pur essendo più piccola, la differenza è contenuta. In caso contrario l’impresa VELA non è ritenuta rappresentativa dell’impresa GI e il dato sul tasso dei posti vacanti non è ritenuto affidabile. Nel primo caso, il numero dei posti vacanti è ottenuto moltiplicando il tasso di posti vacanti rilevati da VELA per le posizioni occupate secondo la rilevazione GI.

Riassumendo in formule, nel primo caso:

se ( GI) i i of >of oppure ( ) 0 0,5 GI i i i of of of − ≤ ≤

dove con ofiGI si intende il numero di posizioni occupate rilevate da GI alla fine del terzo mese del trimestre di riferimento, allora

GI i i i tpv of pv = ⋅

2. le imprese rispondenti con almeno 10.000 posizioni occupate a fine trimestre che dichiarino di non avere posti vacanti e che non forniscano, mediante una nota, una spiegazione per questo dato. Per quanto detto sulla relazione tra il numero di posti vacanti e la dimensione dell’impresa, è improbabile che un’impresa di grandissime dimensioni (che ha quindi un

turnover pressoché continuo) non stia cercando personale all’esterno (si veda la sezione 2)62. In questo caso si pone a missing il valore dei posti vacanti dichiarato per una successiva imputazione.

Anche la strategia di imputazione, analogamente all’identificazione dei record da imputare, procede separatamente per le PMI e per le GI, differenziandosi ulteriormente nell’ambito delle GI stesse.

Si suddividono innanzitutto le imprese rispondenti alla rilevazione GI in due sottoinsiemi:

• le imprese che almeno in un trimestre dei primi nove della rilevazione avevano più di 10.000 posizioni occupate a fine trimestre (definite “grandissime”)

• le imprese che in nessuno dei primi nove trimestri della rilevazione avevano più di 10.000 posizioni occupate a fine trimestre (definite “medio-grandi”)

Per quanto riguarda le PMI e le imprese medio-grandi, l’imputazione del tasso di posti vacanti viene fatta mediante donatore hot-deck di minima distanza. Viene utilizzata a tale scopo la procedura DONORIMPUTATION del software generalizzato BANFF sviluppato da Statistics Canada (Statistics Canada, 2003).

Questa procedura utilizza la tecnica del donatore di minima distanza per trovare, per ogni record che necessita di essere imputato, il record valido che abbia le caratteristiche più simili ad esso e che permetta al record imputato di soddisfare eventuali regole di edit imposte dall’utente. L’imputazione viene effettuata se un tale record viene trovato. Uno dei maggiori vantaggi di questa tecnica di imputazione risiede nel fatto che tutti i campi che devono essere imputati in un record provengono dallo stesso record donatore e quindi le relazioni tra le variabili imputate vengono mantenute. Questo rende il metodo particolarmente utile in vista dell’estensione della metodologia di imputazione per ulteriori variabili rilevate da VELA, quali le ore lavorate.

La distanza tra il record i-esimo (ricevente) con valori

{ }

1 N ik k

x = delle N variabili di matching (che sono le variabili sulle quali definire la distanza scelte dall’utente) e un altro record (possibile donatore) con valori

{ }

1

N jk k

x

= delle variabili di matching è data da63

( , )= min max(| |) j i j x X ik jk k D x x x x  −   

dove X è il dominio dei possibili donatori. Il donatore viene quindi identificato come quel record, tra tutti i record del dominio dei possibili donatori, che minimizza la distanza tra le variabili di matching del donatore e del ricevente. La distanza così definita viene anche chiamata “distanza minimax” in quanto il donatore prescelto è quello che ha la minore differenza massima assoluta tra i valori delle variabili di matching e del ricevente, avendo dato pari peso a tutte le variabili di matching.

Per evitare che la donazione sia sistematicamente dominata dalle variabili di matching che assumono valori in intervalli di grandi dimensioni, la distanza viene calcolata dopo avere compiuto una trasformazione che induce una normalizzazione della scala sulle variabili di matching.

Nel caso dell’imputazione del tasso di posti vacanti, i possibili donatori vengono scelti all’interno di classi determinate da posizioni occupate e sezione di attività economica, e vengono utilizzati diversi insiemi di variabili di matching (a seconda della disponibilità delle variabili per le imprese riceventi e potenziali donatrici).

In particolare, per le PMI le classi di donazione risultano dall’intersezione di tre partizioni, definite da:

62 E’ stato osservato, tra l’altro, che molte imprese di grandi dimensioni tendono a rispondere che non hanno posti vacanti aperti, puntualizzando però in nota che è impossibile o molto difficile quantificare la ricerca di personale. È questa una conseguenza della difficoltà di misurazione per le imprese della variabile posti vacanti, menzionata nel paragrafo 2.

63 La distanza è definita dalla norma L, sullo spazio definito dall’intersezione dei domini di definizione delle variabili di matching.

- il numero di posizioni occupate a fine trimestre, sulla base delle seguenti quattro classi: meno di 50, 50-100,100-500 e oltre 500

- un flag che caratterizza se un’impresa è una società di fornitura di lavoro temporaneo o meno (tutte le imprese di questo tipo sono trattate tra le PMI, indipendentemente dalla dimensione, in quanto non fanno parte del panel della rilevazione GI)

- l’attività economica prevalente sulla base delle seguenti classi: le sezioni C, E, F, G, H, I, J, K della classificazione Ateco 2002 e quattro sottoinsiemi della sezione D.

Le variabili di matching sono:

• il numero di posizioni lavorative occupate a fine trimestre (sempre disponibile)

• il tasso di posti vacanti medio negli eventuali trimestri precedenti quello corrente e appartenenti allo stesso blocco di imputazione (ove disponibile)

• il tasso di posti vacanti medio nei trimestri del precedente blocco di rotazione (ove disponibile)

• l’età dell’impresa in anni, sulla base della data di inizio attività fornita dall’archivio OROS (sempre disponibile).

Per le imprese medio-grandi invece le classi di donazione risultano dall’intersezione di due partizioni definite da:

- il numero di posizioni occupate a fine trimestre, sulla base delle seguenti due classi: meno di 1000, 1000-10000

- aggregazioni delle sezioni di attività economica prevalente (C-E-F aggregate, D, G-H aggregate, I, J, K)

In questo caso, le variabili di matching sono:

• il numero di posizioni occupate a fine trimestre (sempre disponibile)

• il tasso di posti vacanti medio negli ultimi 3 trimestri (ove disponibile)

• il rango del tasso di crescita dell’occupazione nell’ultimo trimestre (sempre disponibile)

• il tasso di entrata medio negli ultimi 3 trimestri (sempre disponibile solo per le GI, in quanto la rilevazione OROS non fornisce questa informazione).

Per quanto riguarda invece ciascuna impresa grandissima, avendo queste caratteristiche uniche e quindi non simulabili mediante altre, l’imputazione dei valori mancanti viene effettuata con un modello basato sulla serie storica delle risposte dell’impresa stessa, nel caso in cui si abbiano a disposizione sufficienti informazioni storiche su alcune variabili dell’impresa quali tasso di posti vacanti e tasso di entrata. Per le imprese medio-grandi per cui non sia possibile utilizzare il donatore di minima distanza, e per quelle grandissime per cui non sia applicabile il modello di serie storica, l’imputazione del tasso di posti vacanti viene effettuata assegnando la media sulla sezione di attività economica del tasso di posti vacanti calcolata sulle grandi imprese rispondenti o imputate nel trimestre.

La tavola 4 mostra, separatamente per le PMI e le GI e per il totale delle imprese, il tasso medio di posti vacanti (moltiplicato per 100) prima (pre) e dopo (post) la fase di imputazione.

Come si può notare, per le PMI, come pure per il totale delle imprese, la differenza tra il tasso di posti vacanti calcolato sulle sole rispondenti e su tutte le imprese è trascurabile. Per quanto riguarda le GI la differenza (tra le imputate e le non imputate), pur essendo di maggiore entità, non è molto rilevante. L’ultimo passo di questa fase consiste nell’imputazione del numero di posti vacanti, il quale è ottenuto semplicemente moltiplicando il tasso di posti vacanti (effettivo o imputato) per i posti occupati a fine trimestre quali risultano dalla fase di imputazione di cui alla sezione 5.3.