• Non ci sono risultati.

Le funzioni di influenza: funzione finalizzata all’imputazione

4. DAL DATO AMMINISTRATIVO ALLE INFORMAZIONI STATISTICHE. BANCA DATI

6.6 Editing selettivo e imputazione

6.6.3 Le funzioni di influenza: funzione finalizzata all’imputazione

In questo paragrafo si presentata la funzione finalizzata alla selezione di eventuali uni-tà influenti da sottoporre ad imputazione di mancate risposte. La necessiuni-tà di procedere all’imputazione (che non era tra le finalità della precedente procedura di controllo e cor-rezione) emerge da un’attenta analisi dei diversi fattori che intervengono nel calcolo di un indice aggregato relativo a variabili espresse nei rapporti; con particolare riferimento alla variabile retribuzioni per Ula, l’indice aggregato, la cui trattazione estesa è presentata nel paragrafo 9.2.2, può essere espresso dalla seguente espressione:

(22)

La relazione evidenzia che, sebbene il calcolo di variabili pro-capite (Ij,tRU) possa ridurre, in molti casi, la sensibilità delle variabili in relazione all’effetto delle mancate risposte (che riguardano sia il numeratore sia il denominatore, cfr. §6.2.3)15, d’altra parte lo stesso non può dirsi per il fattore di ricomposizione occupazionale ( ) il cui effetto, influenzato dalla presenza delle mancate risposte, risulta essere sistematicamente sottostimato (Lattanzio, 2016a e 2016b).

Come premesso all’inizio di questo paragrafo, la procedura di controllo e correzione implementata prevede il calcolo di una funzione di influenza per ciascuna delle tre variabili retribuzioni pro-capite, oneri pro-capite e posizioni lavorative dipendenti. Nel caso specifico relativo alla selezione di unità influenti potenzialmente imputabili, occorre specificare che, sebbene le funzioni di influenza individuate per le tre variabili in questione siano analoghe, le finalità che esse si prefiggono sono sostanzialmente diverse; in particolare, mentre per le variabili di costo l’obiettivo finale è l’imputazione delle mancate risposte influenti, per le posizioni lavorative dipendenti, le unità selezionate (le più influenti) sono sottoposte ad un controllo interattivo finalizzato alla validazione del metodo di imputazione da modello appli-cato in precedenza (cfr. §6.2 e §6.3).

Per ogni unità k affetta da mancata risposta, appartenente all’aggregato S (sezione Ateco 2007), la funzione di influenza scelta per la generica variabile X (così come definita nel §6.6.2) è calcolata come differenza tra la variazione tendenziale relativa all’aggregato in cui l’unità è stata imputata ( (XS )) e la stessa variazione in cui l’unità in questione non è stata imputata (V(XS )), espressa dalla seguente funzione indicatrice:

(23)

14 Si tratta, nello specifico delle squadre di calcio (Divisione 93 della classificazione Ateco 2007) che presentano outlier nei valori retributivi per effetto dei compensi molto elevati corrisposti ai calciatori.

15 Ciò non si verifica nel caso di mancate risposte caratterizzate da periodicità infra annuale (ad esempio la tredicesime e la quattordicesime mensilità) la cui presenza può avere effetti anche sugli indici relativi ai valori pro-capite.

������ ���������� ��1 �������� ����� (11) �����(�)� � �[����)[ | ��(��) � �(��) | ] ௝ǡ࢚ �����(�)� � �[����)[ | ��(�) � �(��) | ]

90

La rilevazione trimestrale Oros su occupazione e costo del lavoro La scelta di questa funzione permette di valutare il contributo dell’imputazione di una mancata risposta sulla variazione tendenziale dell’aggregato considerato.

In particolare per la generica unità k, sia Xk,m la variabile da imputare relativa al mese m (con m=1,2,3) del trimestre t sia mrk,t il numero di mancate risposte da imputare nel trimestre t, il valore imputato della variabile ( ) è stato calcolato, nel caso in cui l’unità sia rispondente in almeno un mese nel trimestre, secondo il criterio dell’imputazione con media, ossia:

(24)

dove R indica l’insieme dei mesi di risposta e R

k,t è la media dei dati relativi ai soli rispon-denti. Ne consegue che la media trimestrale imputata della variabile, , è pari a:

(25)

La (25) mostra come il valore medio trimestrale ottenuto a seguito dell’imputazione coincida con il dato medio mensile calcolato sui mesi non affetti da mancata risposta. Va osservato, tuttavia, che il valore così imputato risente del metodo di imputazione scelto. Questa evidenza potrebbe rappresentare una criticità nella selezione di unità con mancate risposte in trimestri caratterizzati da valori outlier periodici (stagionali). Sebbene il metodo garantisca la selezione di unità imputate con media calcolata su almeno un mese outlier, ciò non è garantito per le unità in cui l’imputazione avviene attraverso la media di dati non outlier, per le quali sarà la variazione del fattore di ricomposizione occupazionale a deter-minare o meno la selezione16.

Nel caso in cui vi sia mancata risposta totale in tutti i mesi del trimestre (diverso dal caso di mancata risposta totale nei record, si ricordi che Oros non presenta casi di mancata risposta parziale nello stesso record) l’imputazione viene effettuata con il dato medio trime-strale dello stesso trimestre dell’anno precedente17:

(26) Le unità con mancate risposte influenti così selezionate sono sottoposte ad analisi interattive finalizzate all’individuazione di quelle che necessitano correzioni ad hoc, come i casi già citati di unità con outlier non periodici nel trimestre. Le restanti unità sono

anch’es-16 Si sta valutando l’opportunità di affinare la metodologia per tenere adeguatamente conto di tali specificità.

17 Per completezza informativa si precisa che il dato medio trimestrale dello stesso trimestre dell’anno precedente potrebbe essere stato calcolato a sua volta secondo la (24).

���,�= ���,� ��� �  R ���,� =� � ��1 �,�� ��,� ��� ��� ���,�= 1, 2 (24) ������ =������� �������� 1 3 � �����∑�������� 3 = 1 3 3�∑�������� 3 � ����� =3 � ��1 ��� � ���� ��� = ����� (14) ܺ෠௞ǡ௠ ������=������� �������� 1 3 � ������������� 3 = 1 3 3�∑������ 3 � ����� =3 � ��1 ��� � ���� ��� = ����� (14) ������= X������ con ����� = 3 ������ = 1 3 � �����∑�������� 3 = 1 3 3�∑�������� 3 � ����� =3 � ��1 ��� � ���� ��� = ����� (14)

91

6. Editing e imputazione

se valutate caso per caso per stabilire l’opportunità di effettuare o meno un’imputazione completa (in tutti i mesi che presentano la mancata risposta) o parziale che preservi la presenza di eventuale periodicità e, in caso affermativo, sono successivamente imputate con procedure generalizzate basate sui criteri deterministici espressi dalla (24) e dalla (25).

Infine, è utile ricordare che, come accennato in precedenza (cfr. §6.6.1), essendo le due funzioni di influenza finalizzate all’editing e all’imputazione delle mancate risposte totali indipendenti tra loro, sono sottoposte al controllo e correzione le unità non ancora imputate per eventuali mancate risposte e viceversa. Nell’evidenza dei dati Oros, gli insiemi delle uni-tà influenti selezionate per i due scopi sono tra loro interdipendenti; infatti, la maggior parte delle unità selezionate per l’imputazione delle mancate risposte è selezionata anche per l’e-diting (a conferma dell’indipendenza dell’influenza di queste unità da una eventuale prece-dente imputazione); d’altra parte, il sotto insieme di unità selezionate per l’imputazione ma non per l’editing include soltanto pochissime unità che presentano valori outlier ricorrenti ma non periodici per i quali la procedura prevede un trattamento ad hoc che prescinde dal loro grado d’influenza (cfr. nota 14).

93