• Non ci sono risultati.

Metodi di controllo e correzione dei dati nell’indagine mensile sulla produzione industriale: stato attuale e possibili sviluppi

Annarita Mancini, Istat, Servizio Statistiche congiunturali dell'industria e delle costruzioni Teresa Gambuti90, Istat, Servizio Statistiche congiunturali dell'industria e delle costruzioni

Sommario: Il presente lavoro descrive i metodi di controllo e correzione utilizzati nell’indagine sulla

produzione industriale mensile con particolare attenzione alle innovazioni di processo conseguite con il passaggio al nuovo sistema informativo la cui fase di sviluppo non è ancora terminata. Le funzionalità descritte sono, pertanto, quelle disponibili al momento della presentazione al seminario “Strategie e metodi per il controllo e la correzione dei dati nelle indagini sulle imprese: alcune esperienze nel settore delle statistiche congiunturali” tenutosi a Roma il 15 novembre 2007.

Parole chiave: Indagine mensile sulla produzione industriale, sistema informativo, metodi di controllo

e correzione.

Le collane esistenti presso l'ISTAT - Contributi e Documenti - costituiscono strumenti per promuovere e valorizzare l'attività di ricerca e per diffondere i risultati degli studi svolti, in materia di statistica ufficiale, all'interno dell'ISTAT e del Sistan, o da studiosi esterni.

I lavori pubblicati Contributi Istat vengono fatti circolare allo scopo di suscitare la discussione attorno ai risultati preliminare di ricerca in corso.

I Documenti Istat hanno lo scopo di fornire indicazioni circa le linee, i progressi ed i miglioramenti di prodotto e di processo che caratterizzano l'attività dell'Istituto.

I lavori pubblicati riflettono esclusivamente le opinioni degli autori e non impegnano la responsabilità dell'Istituto.

90 I paragrafi da 1 a 4 sono a cura di Annarita Mancini, il paragrafo 5 è a cura di Teresa Gambuti, l’appendice a cura di Maria Bruno.

1. L’indagine mensile sulla produzione industriale

1.1 Caratteristiche generali dell’indagine

L’indice della produzione industriale (IPI) misura la variazione nel tempo del volume fisico della produzione effettuata dall’industria in senso stretto (ovvero dell’industria con esclusione delle costruzioni). Esso si basa sui risultati di una rilevazione statistica longitudinale condotta presso un panel di imprese comprendente quelle più rappresentative dell’industria manifatturiera (sezione C, D ed E della NACE Rev1.1 ad esclusione della NACE 41 e 40.3 della sezione E). In conformità a quanto stabilito dal Regolamento STS n. 1165/98 del Consiglio dell’Unione europea relativo alle statistiche congiunturali, tale rilevazione misura la variazione nel tempo del volume di produzione dei beni inclusi in un paniere rappresentativo di prodotti. Ciò consente di calcolare i numeri indici per ciascuna voce di prodotto inserita nel paniere (indici elementari) che, a loro volta, sono sintetizzati per attività economica secondo la formula di Laspeyres.

Più in dettaglio, l'indagine mensile sulla produzione industriale viene effettuata direttamente presso un panel longitudinale di circa 6.000 unità rispondenti91, che comunicano i volumi di produzione mensili relativi ad oltre 1.100 prodotti92, definiti generalmente in termini di quantità fisiche93. Ad integrazione di tali dati, per la stima degli andamenti produttivi di specifici settori industriali, come ad esempio quello energetico e estrattivo, vengono utilizzate altre fonti che ne curano la collezione statistica in maniera aggregata e totalitaria.

Di tutti i prodotti rilevati, 848 sono utilizzati94 per calcolare i 548 indici elementari grezzi, con uno sfasamento di 40 giorni, secondo quanto stabilito dal Regolamento STS Emendato (Regolamento STS n. 1158/2005).

Negli ultimi anni è fortemente cresciuta, in campo nazionale ed internazionale, l’esigenza di produrre un’informazione sempre più completa e tempestiva. Ciò ha comportato, oltre ad un progressivo e maggior carico di informazioni da rilevare ed elaborare mensilmente, anche una progressiva riduzione del tempo necessario a diffondere le stime richieste, tanto che il comunicato stampa viene diffuso attualmente a poco più di 40 giorni dal mese di riferimento (anziché dopo 45 giorni come richiesto dal vecchio Regolamento STS). I dati devono venire comunque inviati ad EUROSTAT tassativamente non oltre il 10 del secondo mese successivo a quello di rilevazione, eventualmente sotto embargo, come richiesto nella nuova versione del suddetto Regolamento STS, entrata in vigore l’11 agosto 2005.

La spinta alla tempestività conduce quindi a diffondere dati con maggior grado di provvisorietà, ovvero stimati sulla base delle risposte pervenute entro un tempo utile rispetto alla data prefissata. Al contempo, si richiede che le stime provvisorie siano affidabili e che si discostino il meno possibile da quelle definitive, con il conseguente obiettivo di ridurre al minimo le revisioni delle stime precedentemente diffuse in via provvisoria. Diventa imperativa, quindi, l’esigenza di affinare le tecniche di Controllo e Correzione (indicate con C&C di seguito). In particolare, per le indagini congiunturali, per le quali la tempestività è un requisito fondamentale, le mancate risposte e/o gli errori, soprattutto quelli influenti, impattano in maniera importante sulla qualità delle stime provvisorie dato che è spesso

91 Circa 5.100 nel panel corrente di indagine e oltre 1.000 in un panel sostitutivo.

92 Uno o più prodotti elementari j formano il macroprodotto k (o serie elementare) inserito nel paniere rappresentativo della base di riferimento dell’indice. L’indice della produzione industriale, infatti, è un indice a base fissa, aggiornata ogni 5 anni in termini di panel di imprese, ponderazione e paniere. Questi microprodotti sviluppano oltre 12000 microdati nel computo dell’indice mensile.

93 A seconda delle specificità intrinseche del settore/prodotto oggetto di rilevazione si può far ricorso a dati di input (ore lavoro) oppure a dati di output (quantità prodotte, valore della produzione al netto delle variazioni dei prezzi).

94 In realtà in precedenza il numero dei prodotti utilizzati nel calcolo dell’indice era maggiore (circa 950), in seguito tutta la nomenclatura dei prodotti IPI ha subito una riorganizzazione ai fini della spedizione relativa all’anno 2005 (coincidente con l’inizio della nuova base 2005) che ha comportato, in dettaglio, l’eliminazione di alcune voci di prodotto ormai obsolete, definizioni più fini e conformi alle classificazioni europee, l’inserimento di nuove voci di prodotto per le classi ATECO poco rappresentate, la modificazione, quando necessario, dell’intero questionario, l’introduzione e/o la modificazione delle avvertenze di compilazione relative a determinati prodotti e, infine l’aggiunta di unità di misura più adatte a osservare il prodotto rilevato oltre a quelle attualmente richieste (si veda Mancini A., 2005).

problematico il ricorso a tecniche di imputazione o di riponderazione efficienti, non applicabili nel breve arco temporale intercorrente tra l’acquisizione dei microdati e la data di diffusione delle stime a causa della mancanza di tempo e/o della non disponibilità di variabili ausiliarie.

1.2 Il modello di rilevazione

A partire dalla spedizione relativa all’anno 2007, al fine di rendere più agevole il compito delle imprese, riducendone quindi il carico statistico, a ciascuna unità rispondente viene inviato un questionario mensile personalizzato95 in termini di lista delle voci di prodotto96 inserite nel modello stesso. Per ognuna delle voci inserite nel questionario vengono richieste le quantità prodotte97 nel mese corrente e nel mese precedente; è richiesto, inoltre, alla stessa unità rispondente i-ma di segnalare il numero di giorni lavorati nel mese corrente, inteso come il numero di giorni in cui l’unità ha svolto attività produttiva, a prescindere dal reale volume di lavoro impiegato in ciascuna linea produttiva. Per il solo mese di dicembre, inoltre, viene richiesto il numero medio di addetti dell’anno appena trascorso. Per alcuni prodotti, infine, è prevista un’unità di misura accessoria. Questa, in particolare, ha il duplice scopo di unità di misura di controllo e unità di misura “pilota”98.

Tuttavia, i giorni lavorati, il numero medio di addetti e l’eventuale volume di produzione espresso nella seconda unità di misura, non sono utilizzati ai fini della costruzione dell’indice mensile della produzione industriale, per cui non sempre sono oggetto di controlli capillari e, inoltre, qualora mancanti, non determinano necessariamente la mancata risposta parziale dell’unità rispondente che, quindi, non viene sollecitata in caso abbia risposto alla variabile principale.

Sono altresì richieste nel modello informazioni relative ad eventuali cambiamenti anagrafici e il nome del compilatore (se diverso da quello del mese precedente). Eventuali definizioni o avvertenze di compilazione sono esplicitate nel modello stesso.

95 Fino al 2006 venivano spediti 44 questionari disegnati in funzione dell’omogeneità di settore (ovvero in ciascun modello venivano elencate tutte le voci di prodotto della nomenclatura d’indagine appartenenti ad una o più classi ATECO). Alle imprese, quindi, potevano venire inviati più modelli nel caso in cui i prodotti manufatti da queste erano eterogenei in termini di classe ATECO. Ad esempio, alcune unità rispondenti operanti nel settore chimico ricevevano addirittura fino a 5 questionari, essendo tale settore molto complesso, in termini di prodotti rilevati, al punto di dover utilizzare 9 modelli di rilevazione. A volte accadeva, inoltre, che le imprese ricevevano più modelli ma il numero di prodotti, specifici della produzione della stessa impresa, in ognuno di essi poteva essere esiguo. Alla luce di ciò, si è disegnato un modello “personalizzato”, definito a partire dalle unità rispondenti anziché dai prodotti inseriti nel campo di osservazione dell’indagine. Così anziché avere 44 modelli di rilevazione definiti sulla base delle produzioni omogenee di ciascun settore, attualmente si definiscono circa 6000 modelli, tanti quante sono le unità rispondenti dell’indagine.

96 In fase di definizione del modello di rilevazione per la spedizione annuale (che attualmente avviene ad inizio dell’anno con l’invio dei 12 modelli mensili) vengono agganciate a ciascuna unità rispondente i codici prodotti j della nomenclatura IPI per cui ci sia stata almeno una risposta negli ultimi 24 mesi rilevati.

97 Il volume di produzione può essere misurato in diverse unità di misura. Queste sono predefinite nella nomenclatura IPI e specifiche per ogni tipologia di manufatto rilevato. Si veda MANCINI A.et altri (2005 bis), per approfondimenti.

98 Si inserisce un’altra unità di misura al fine di avere una misurazione alternativa del volume di produzione. Se si osserva che tale unità è più affidabile a misurare i volumi produttivi di uno specifico prodotto j si valuterà la possibilità di utilizzare tale unità per il computo dell’indice di produzione nella base successiva a quella di riferimento.

Figura 1.1 Modello di rilevazione ISTAT–SCI/PM

La struttura del modello rimane, quindi, sostanzialmente snella e semplice nella compilazione e ulteriormente alleggerita dal fatto che vengono elencati esclusivamente i prodotti che l’impresa produce, sulla base delle informazioni caricate nel database.

Una novità del modello “personalizzato” è la sezione dedicata ad altre produzioni, dove l’unità rispondente potrà annotare sia le produzioni che non rientrano nel campo di osservazione dell’indagine, sia quelle che, pur facendone parte, non risultavano essere prodotte dall’unità. In tal modo si possono avere informazioni aggiuntive per l’aggiornamento della base degli indici, rispettivamente sull’ampliamento del paniere con l’inserimento di nuovi prodotti e sull’allargamento del panel di imprese rispondenti al paniere dei prodotti già rilevati con l’attuale base.

1.3 Modalità di acquisizione dati

Per la raccolta dei dati si inviano a ciascuna unità rispondente 12 modelli ISTAT/SCI/PM (uno per ogni mese). Ciascun questionario mensile compilato deve essere inviato all’ISTAT, non oltre il giorno 10 del mese successivo a quello di riferimento per via telematica (da gennaio 2007), tramite fax o tramite posta. In aggiunta i dati possono essere acquisiti telefonicamente, soprattutto per effetto dei solleciti.

Mentre i dati trasmessi via web sono acquisiti direttamente e, quindi, sottoposti a microediting automatico, tutte le altre modalità di trasmissione prevedono una revisione preliminare interattiva del questionario prima della registrazione interna sul database, dove viene effettuato il microediting automatizzato.

Di seguito si riporta la percentuale di risposte, per tipologia di trasmissione, acquisite in media per il 2007:

• Questionario cartaceo autocompilato (via fax) 79%

• Questionario elettronico autocompilato 15%

• Dati inviati per e-mail99 4%

• Dati acquisiti per telefono in fase sollecito 2%

La modalità di trasmissione per posta, anche se prevista, non è idonea per un’indagine tempestiva come quella della produzione industriale, per cui resta con un’incidenza marginale, per lo più già comunicati per telefono.

99 Tale modalità in realtà a partire dal mese di agosto è stata inibita ed è probabile che le risposte confluiranno nella trasmissione via web.

Solo per il mese di dicembre

1.4 La revisione periodica dei dati grezzi

Gli indici della produzione industriale sono soggetti a due revisioni che si effettuano per motivi differenti.

Una prima revisione viene effettuata nel mese successivo al rilascio della prima stima, sulla base di informazioni aggiuntive che pervengono dalle imprese.

Una seconda revisione, che è stata introdotta a partire dal comunicato relativo ai dati di agosto 2004, avviene a cadenza semestrale e riguarda le serie storiche degli indici. Tale revisione ha lo scopo di incorporare negli indici tre tipologie di informazioni che si rendono disponibili successivamente alla pubblicazione della prima rettifica. Nello specifico, gli elementi considerati nel processo di revisione sono:

1. le risposte pervenute dalle imprese dopo la chiusura degli indici rettificati (che avviene di regola intorno a 60 giorni dalla fine del periodo di riferimento); si tratta di una quota di risposte molto limitata, ma che può determinare rettifiche di un qualche rilievo sugli indici disaggregati.

2. le correzioni a posteriori di informazioni già pervenute dalle imprese e che sulla base di successive verifiche sono risultate affette da imprecisioni nella misurazione del fenomeno. Si tratta di modifiche che hanno, in media, un effetto contenuto sugli indici aggregati ma che, occasionalmente, possono causare revisioni significative per specifici settori.

3. l’aggiornamento e la periodica revisione (relativa all’ultimo triennio), delle stime di contabilità nazionale degli aggregati di valore aggiunto e sulle ore effettivamente lavorate su cui si basano i coefficienti annuali di produttività utilizzati per i prodotti rilevati tramite i flussi mensili di ore lavorate100. Ne deriva che l’effetto della revisione dei coefficienti può risultare sensibile per quegli specifici settori.

Queste revisioni avvengono in occasione della diffusione degli indici relativi al mese di febbraio e di agosto. Nella prima sono incorporate sia le nuove stime annuali di contabilità nazionale per i tre anni precedenti, sia le rettifiche basate sulle risposte giunte con ritardo e sulle correzioni di informazioni già pervenute. Nella seconda si tiene conto della sola componente dovuta a informazioni supplementari e rettifiche, operando una revisione a partire dal gennaio dell’anno corrente; questa, inoltre, ha lo scopo di verificare la significatività di dati anomali riscontrati in corso di rilevazione 101.

2. Problematiche principali

2.1 Individuazione degli outlier

Nell’indagine mensile sulla produzione industriale i dati anomali sono individuati confrontando i volumi di produzione mensile relativi all’unità i per il prodotto j con il range del volume di produzione osservato nella serie storica del microdato:

[

i

]