• Non ci sono risultati.

La rilevazione mensile sulle vendite al dettaglio: metodi per il controllo e la correzione dei dati

Tavola 1: percentuale di risposte per modalità e tipo di indice (gennaio 2006-luglio 2007)

Periodo Indici a 30 giorni Indici a 54 giorni

Modalità POSTA FAX WEB POSTA FAX WEB

2006 Gennaio (*) 28,0 72,0 0,0 43,9 56,1 0,0 Febbraio 44,4 53,4 2,2 54,0 43,8 2,2 Marzo 31,8 65,0 3,1 38,7 58,7 2,7 Aprile 23,5 72,3 4,2 42,2 54,7 3,1 Maggio 49,0 46,0 5,0 40,5 56,7 2,9 Giugno 31,0 65,5 3,5 35,1 61,9 3,0 Luglio 19,6 75,8 4,6 41,2 55,5 3,3 Agosto 39,3 56,5 4,1 39,3 57,1 3,5 Settembre 21,9 68,7 9,3 41,9 53,7 4,4 Ottobre 41,5 55,4 3,1 41,2 56,2 2,6 Novembre 37,9 57,1 5,0 42,0 55,1 2,9 Dicembre 37,2 59,2 3,6 45,0 52,2 2,8 2007 Gennaio 1,0 95,5 3,4 28,4 68,3 3,3 Febbraio 20,7 74,7 4,6 39,1 57,3 3,6 Marzo 12,9 81,5 5,5 41,9 54,1 4,0 Aprile 43,7 50,1 6,2 51,4 42,9 5,7 Maggio 49,1 44,2 6,7 42,7 52,4 4,9 Giugno 41,8 53,5 4,7 44,3 51,1 4,6 Luglio 48,2 46,2 5,6 42,9 51,9 5,2

(*) L'assenza di risposte via web per questo mese è da attribuire a problemi di natura tecnica che hanno riguardato il sistema di acquisizione dati

Il campione dei rispondenti effettivi, su cui si basa il calcolo degli indici mensili supera le 4.000 imprese. Al momento dell’elaborazione delle stime che verranno diffuse mediante il comunicato stampa il tasso di risposta si aggira intorno al 50%. Per ciascun periodo di riferimento (mese), successivamente alla diffusione del comunicato continuano ad arrivare altri questionari le cui informazioni vengono registrate ma non utilizzate nelle fasi di calcolo degli indici. Il numero di risposte pervenute in ritardo varia molto di mese in mese e può, in alcuni casi, essere influenzato da fattori stagionali (es. periodi di chiusura per ferie delle imprese). In generale va comunque sottolineato che l’incremento del tasso di risposta mensile costituisce uno degli obiettivi costantemente perseguiti nell’ottica del miglioramento della qualità delle statistiche prodotte. Compatibilmente con le regole di contenimento della pressione statistica, infatti, si cerca di incoraggiare i rispondenti mettendo a loro disposizione, come detto in precedenza, diverse opportunità per la restituzione dei questionari compilati ed offrendo tutto il supporto richiesto in termini di chiarimenti o aiuto alla compilazione.

Nella figura che segue sono rappresentati i tassi di risposta mensili rispettivamente per gli indici a 30 e a 54 giorni per il periodo che va da gennaio 2004 a luglio 2007.

0 10 20 30 40 50 60 G 2004 F M A M G L A S O N D G 2005 F M A M G L A S O N D G 2006 F M A M G L A S O N D G 2007 F M A M G L

tasso di rispo sta a 30 gio rni tasso di rispo sta a 54 gio rni

Figura 1: tassi di risposta mensili della rilevazione sulle vendite al dettaglio relativi all’elaborazione degli indici a 30 e a 54 giorni (gennaio 2004-luglio 2007)

A parte l’anno 2004, per il quale i tassi di risposta sono più contenuti, soprattutto a causa della fase di rodaggio del processo relativo agli indicatori anticipati, dalla figura si nota come nell’ultimo periodo il tasso di risposta a 54 giorni sembra essersi stabilizzato intorno al 50%, mentre il tasso di risposta relativo agli indici a 30 giorni mostra un lieve trend crescente78.

Tra le attività intraprese per limitare l’effetto delle mancate risposte è il ricorso a solleciti telefonici mirati che riguardano soprattutto le imprese più grandi e quelle appartenenti agli strati per i quali è necessario disporre di un numero maggiore di risposte. Con l’avvio del calcolo delle stime anticipate è stato sperimentato un sistema automatico di solleciti realizzati sfruttando il servizio fax-server dell’Istat. Tale sistema tuttavia si è rivelato troppo oneroso per le imprese che comunque sono chiamate a rispondere mensilmente e con scadenze piuttosto rigide. Un sistema di tal genere potrebbe funzionare perfettamente se, date le scadenze, fosse possibile monitorare in tempo reale i ritorni dei questionari, anche di quelli restituiti via posta.

Come si è detto la popolazione di riferimento per la rilevazione è costituita da un insieme di imprese classificate nella divisione 52 dell’ATECO 2002. Tale insieme è composto da oltre 500mila unità che occupano più di un milione e 500mila addetti. Va comunque osservato che si tratta in larga parte di imprese di piccole dimensioni, spesso addirittura individuali. Ciò produce degli effetti sia sulla definizione della metodologia della rilevazione sia sulle fasi operative.

L’unità di rilevazione, che coincide con l’unità di analisi (come richiesto dal Regolamento STS), è dunque l’impresa definita come sopra.

La lista di riferimento dalla quale viene estratto il campione è costituita dall’archivio ASIA79.

Le informazioni rilevate sono quasi tutte di natura quantitativa e le corrispondenti variabili sono: valore delle vendite relativo al mese di riferimento, valore delle vendite relativo allo stesso mese dell’anno precedente e valore delle vendite realizzato nel corso del mese di riferimento attraverso la vendita di beni appartenenti a 15 gruppi di prodotti. Tali variabili vengono rilevate in corrispondenza di ciascuna forma di vendita80 attraverso la quale l’impresa esercita la propria attività. Inoltre, per ciascuna forma di vendita, viene rilevato il numero complessivo degli addetti (indipendenti e dipendenti), il numero di punti di vendita, la superficie di vendita complessiva e il numero medio di giorni in cui i punti di vendita dell’impresa sono rimasti aperti al pubblico. Il valore delle vendite viene richiesto, in generale, a lordo dell’IVA81

78 I valori più contenuti relativi ai mesi di gennaio degli anni rappresentati sono dovuti ad un ritardo nella raccolta dei dati che è conseguenza delle fasi di aggiornamento annuale del campione.

79 La lista derivata dall’archivio ASIA presenta un ritardo nell’aggiornamento di oltre 20 mesi rispetto alla rilevazione. 80 Per forma di vendita si intende il “modo” attraverso il quale l’impresa effettua l’attività di vendita, ovvero il tipo di organizzazione della distribuzione.

81 Il regolamento STS prevede che il valore delle vendite sia rilevato al netto dell’IVA. Tuttavia per facilitare i rispondenti e in considerazione del fatto che l’obiettivo fondamentale è la stima della variazione tendenziale del valore delle vendite si è ritenuto finora di poter considerare dati che comprendessero anche l’IVA.

L’indagine è di tipo campionario e il relativo disegno prevede un campione casuale all’interno di strati individuati incrociando l’attività economica (a livello di classe ATECO), cinque classi dimensionali determinate sulla base del numero di addetti delle imprese (1-2, 3-5, 6-9, 10-19 e >19) e da due forme di vendita definite come “Grande distribuzione” e “imprese operanti su piccole superfici”. I punti di vendita che fanno capo a tali imprese operano su tutto il territorio nazionale.

All’inizio di ciascun anno il campione viene aggiornato, ovvero parte delle unità vengono sostituite, soprattutto imprese di piccola dimensione. L’aggiornamento si rende necessario per tener conto delle trasformazioni strutturali delle unità e della natimortalità delle imprese oltre che per contenere il carico statistico. Per il 2007 il campione è composto da circa 8.000 imprese.

Obiettivo dell’indagine è la stima della variazione del valore mensile delle vendite riferito alle imprese nel complesso e classificate secondo opportuni domini di riferimento identificati dalla forma di vendita, dal settore merceologico o dalla dimensione determinata sulla base del numero di addetti. Tali domini sono di seguito elencati nel dettaglio:

ƒ Alimentari e non alimentari (settore merceologico)

ƒ Grande distribuzione e imprese operanti su piccole superfici (forma di vendita) ƒ Forme di vendita della Grande distribuzione

ƒ Classi di addetti delle imprese

Vengono inoltre elaborati indici relativi a quattro ripartizioni geografiche (Nord-ovest, Nord-est, Centro, Sud e isole) e ai principali settori merceologici.

Gli indici per i domini sopra elencati sono ottenuti come media aritmetica ponderata di un opportuno insieme di indici elementari di strato; l’aggregazione viene effettuata utilizzando pesi proporzionali al fatturato stimato per ciascuno strato con riferimento all’anno 2000 (anno base).

Gli indici di strato si ottengono moltiplicando il corrispondente indice relativo allo stesso mese dell’anno precedente82 per il rapporto tra le medie campionarie dello strato stesso – riferite rispettivamente ai due mesi messi a confronto - che rappresenta il rapporto tendenziale rilevato per ciascuno strato nel mese di riferimento.

2. Problematiche principali

Gli aspetti più problematici della rilevazione sono connessi essenzialmente a due fattori: la tempestività e le caratteristiche strutturali della popolazione di riferimento.

Per quanto riguarda la tempestività, la riduzione dei tempi di rilascio dei dati è un obiettivo costante che si è rafforzato nel corso degli ultimi anni fino all’emendamento del Regolamento STS che stabilisce che le stime relative agli aggregati principali vengano trasmesse entro 30 giorni rispetto al mese di riferimento.

L’avvio del calcolo delle stime anticipate di cui si è parlato in precedenza, finalizzato alla produzione da parte di Eurostat di indicatori sulle vendite al dettaglio per l’insieme degli aggregati europei (Ue ed Uem) a poco più un mese dalla fine del periodo di riferimento, ha comportato profondi cambiamenti nel processo che fa capo alla rilevazione. Grazie ad essi è possibile rispettare la tempistica fissata e, allo stesso tempo, elaborare indici anticipati la cui qualità – misurata in termini di revisione per la stima finale – ha raggiunto livelli soddisfacenti.

L’ulteriore impegno richiesto dal Regolamento STS emendato comporta lo sforzo di curare anche la diffusione delle stime anticipate che, nel momento in cui non saranno più considerate “confidenziali” da parte di Eurostat, saranno effettivamente disponibili agli utilizzatori. La naturale conseguenza di tutto ciò sarà la pubblicazione degli indicatori anticipati anche a livello nazionale e la necessità di curare le informazioni relative al rilascio delle informazioni anticipate e definitive, al fine di favorire una corretta interpretazione degli indicatori stessi.

82 In realtà questa è soltanto una delle dimensioni della qualità delle stime prodotte, ma è quella che ne giustifica l’interesse da parte degli utilizzatori (primo fra tutti la Banca Centrale Europea) che, all’interno dell’UEM si trovano a decidere in merito alle strategie di politica monetaria.

Le caratteristiche strutturali della popolazione di riferimento costituiscono un ulteriore elemento critico. Innanzitutto, come si è detto, la compresenza di un insieme relativamente poco numeroso di imprese di grandi dimensioni e di un insieme ben più ampio di imprese piccole, spesso individuali e/o a conduzione familiare rende necessaria, nelle varie fasi del processo, l’adozione di opportune strategie che consentano di gestire tali elementi.

In primo luogo il campione mensile non permette di garantire, per l’insieme delle imprese piccole, una copertura elevata in termini di numero di unità. Al contrario si cerca di raccogliere informazioni per un numero di imprese grandi che, in alcuni strati, si avvicina molto alla numerosità della popolazione di riferimento. D’altra parte, poiché esse rappresentano le unità che hanno un peso maggiore in termini di fatturato e valore delle vendite, è fondamentale disporre tempestivamente delle informazioni che le riguardano. A questo proposito va osservato che le imprese più grandi sono quelle più organizzate e informatizzate, ovvero quelle per cui, almeno in linea teorica, la pressione statistica dovrebbe avere un peso meno rilevante. Viceversa sono molto numerosi i casi in cui gli esercizi commerciali di dimensioni più ridotte debbano ricorrere all’assistenza di un commercialista per la compilazione del questionario; da ciò deriva un costo per le imprese e un ritardo nella disponibilità dei dati determinati da tale intermediazione. Il ricorso al web per la compilazione e la trasmissione dei dati mensili all’Istat potrebbe costituire una soluzione per questo tipo di problema ma, come già osservato, la diffusione di questa modalità di fornitura dei dati resta limitata.

Un’altra caratteristica della popolazione di riferimento che incide fortemente sulle informazioni raccolte è l’elevato dinamismo di un settore nel quale sia la nascita di nuovi esercizi commerciali sia la cessazione di attività sono fenomeni particolarmente frequenti. Accanto a ciò va tenuta in considerazione una serie di eventi relativi alle imprese e che si manifestano in quantità rilevante, quali fusioni, scorpori, cessioni di rami d’azienda ecc… Ne derivano mutamenti significativi che riguardano struttura delle unità e molto spesso sanciscono la cessazione di una specifica attività. Tali eventi sono di frequente rilevati direttamente e in anticipo rispetto alla lista di estrazione, che di fatto viene aggiornata ogni anno. Tuttavia è indispensabile tener conto di essi nelle fasi di controllo dei valori anomali, dal momento che l’obiettivo fondamentale è l’elaborazione di indicatori di tipo longitudinale basati sul confronto dei risultati relativi ad una stessa unità osservata in due tempi diversi.

Accanto alle criticità di cui si è appena parlato vanno segnalati ulteriori aspetti che possono essere fonte di problemi. Un esempio è costituito dalla superficie di vendita; tale variabile viene utilizzata convenzionalmente anche per la definizione delle diverse forme distributive, ma può accadere che non vi sia esatta corrispondenza tra la definizione teorica basata sulla superficie di vendita e l’attività svolta di fatto. In conseguenza di ciò in molti casi si rende necessario effettuare degli accertamenti al fine di evitare errori nell’attribuzione dell’attività prevalente effettivamente svolta.

Questo tipo di problemi ha effetto anche sull’identificazione dell’insieme delle imprese che fanno parte della Grande distribuzione83 e riguarda principalmente gli esercizi non specializzati, ovvero quelli per i quali non esiste una tipologia prevalente di prodotti venduti (si pensi ad esempio agli ipermercati o ai grandi magazzini).

3. Strategie di controllo e correzione

La rilevazione mensile sulle vendite al dettaglio prevede un processo di controllo e correzione dei dati in parte automatizzato, in parte interattivo. Tale processo coinvolge la rilevazione nel complesso, dalla raccolta dei dati, alla registrazione fino alle fasi successive e ha l’obiettivo di ridurre o eliminare gli errori non campionari laddove possono avere origine.

L’identificazione e la correzione di errori non influenti e l’accertamento del rispetto dei principali vincoli di compatibilità vengono effettuati tramite un controllo di tipo automatizzato. Le regole di compatibilità possono essere schematizzate come segue:

83 Tale insieme non è automaticamente identificabile attraverso la classificazione ATECO poiché i criteri che permettono di identificare un’impresa come appartenente alla Grande distribuzione non tengono conto solo dell’attività economica prevalente ma anche di un’altra serie di caratteristiche, prima fra tutte il tipo di organizzazione attraverso il quale la suddetta attività si realizza.

ƒ condizione di validità di un questionario: deve contenere almeno un valore per le vendite mensili maggiore di zero

ƒ controllo delle varie sezioni del questionario (dati strutturali, valori mensili, sezione rimanente)

ƒ controllo sull’attività economica dell’impresa e sulla forma di vendita ƒ controllo sul numero degli addetti.

Il controllo interattivo, al contrario, viene effettuato per l’individuazione e la correzione di errori influenti e nei casi in cui si ritiene necessario condurre degli accertamenti preliminari.

In linea di principio la regola sottostante l’intero processo di controllo e correzione riguarda la necessità di ridurre al minimo gli interventi sui dati e, allo stesso tempo, eliminare il maggior numero di errori.

I controlli effettuati riguardano principalmente i microdati (microediting) e sono finalizzati sia a garantire una buona qualità degli indicatori prodotti, sia alla costruzione di una base dati che fosse utilizzabile anche per i controlli di tipo longitudinale.

La predisposizione di una base di dati da utilizzare per il calcolo degli indici mensili delle vendite al dettaglio richiede che, a partire dall’insieme dei dati grezzi, vengano completati due processi di controllo, l’editing e l’imputazione delle mancate risposte. Tali processi hanno una doppia dimensione, trasversale e longitudinale. A questo proposito va osservato come essi possono, in alcuni casi, andare oltre il momento di rilascio delle stime. Ove infatti vengano accertati degli errori oppure nei casi in cui le imprese stesse comunichino una revisione dei dati si effettuano comunque le opportune correzioni sul database dei microdati

Le tipologie di errori da cui sono più frequentemente affetti i dati raccolti riguardano:

ƒ le caratteristiche strutturali dell’impresa commerciale inserita nel campione, ovvero derivare da errori della lista di estrazione;

ƒ le informazioni mensili delle singole unità.

In entrambi i casi occorre distinguere il caso in cui si tratti di errori influenti, ovvero tali da avere un effetto diretto sulle stime finali, dal caso in cui gli errori siano non influenti. Le unità influenti che presentano anomalie nei dati sono spesso ricontattate per accertare il tipo di problema ed eventualmente apportare una correzione. Le imprese della Grande distribuzione richiedono dei controlli particolari in quanto sono quelle che presentano una complessità maggiore e hanno un peso rilevante all’interno dei domini di cui fanno parte.

E’ importante osservare che in alcuni casi l’individuazione di errori trova un ostacolo nella coerenza delle informazioni: può accadere, infatti, che a livello di singola impresa (ovvero di questionario) le informazioni fornite nel complesso siano coerenti, ma contengano ugualmente degli errori.

I controlli vengono effettuati sia nella fase di raccolta, soprattutto web con i vincoli nella maschera. Ciò permette di eliminare già nella fase di compilazione alcuni tipi di errore.

Condizione fondamentale affinché un questionario sia utilizzabile è che il valore delle vendite del mese di riferimento sia maggiore di zero. Raramente si presentano casi in cui un valore delle vendite uguale a zero sia di fatto corretto; tali casi vanno approfonditi singolarmente in quanto possono riferirsi ad imprese con attività stagionale (ma in tal caso sono i controlli longitudinali che prevalgono) oppure essere determinati da altri fattori occasionali. In generale i valori anomali per effetto della stagionalità non producono variazioni errate (si ricorda che la stima della variazione tendenziale è l’obiettivo principale). Tuttavia va precisato che un valore delle vendite pari a zero viene comunque considerato anomalo e pertanto imputato.

Di seguito si cercherà di illustrare in modo più dettagliato l’insieme delle operazioni eseguite per l’individuazione di errori nei dati e la correzione degli stessi.

Per quanto riguarda i dati anagrafici dell’impresa, i controlli vengono svolti senza soluzione di continuità trasversalmente al processo produttivo. In altre parole ogni occasione di contatto con l’impresa (e non solo le occasioni d’indagine) può fornire elementi utili per la verifica di tali informazioni. Nella maggior parte dei casi sono le imprese a fornire volontariamente indicazioni circa le

variazioni anagrafiche ma in alcuni casi, a fronte di segnali significativi, si provvede a contattare le unità per la verifica delle informazioni.

Diverso è il caso delle verifiche sull’attività prevalente dell’impresa. Errori su questo tipo di informazione pregiudicano non soltanto il contatto con l’unità rispondente ma anche tutte le informazioni fornite nel complesso. Gli errori relativi alla classificazione ATECO vengono individuati prima di tutto verificando che ci sia coerenza tra: valore mensile delle vendite, gruppo di prodotti venduti, forma di vendita dell’impresa. Qualora venga riscontrato un errore di questo tipo si procede con un accertamento presso l’impresa.

A proposito degli errori relativi alle informazioni strutturali si ricorda che il campione della rilevazione viene aggiornato all’inizio di ciascun anno. Affinché l’assegnazione delle imprese ai diversi strati venga effettuata nel modo più corretto si cerca di effettuare il maggior numero di verifiche a priori (in fase di estrazione dell’unità). Il progressivo incremento della qualità dell’archivio ASIA ha portato alla riduzione di errori di tal genere.

La tabella a pagina seguente illustra, con riferimento ai mesi compresi nel periodo gennaio 2006-luglio 2007, la composizione delle unità campionarie in relazione al loro stato.

Si osservi come in corrispondenza dei dati di gennaio i valori riportati sono più bassi rispetto agli altri mesi a causa degli effetti derivanti dalla revisione del campione dell’indagine. In particolare possono essere considerate “risolte” con certezza tutte e sole le unità rispondenti e le stesse sono automaticamente considerate “eleggibili”.

Negli stessi mesi invece non si hanno informazioni relative al numero di unità fuori campo di osservazione, cessate oppure che sono state interessate da variazioni di stato.

In generale occorre attendere almeno l’occasione d’indagine successiva, ovvero quella di febbraio per iniziare a raccogliere informazioni che riguardano lo stato delle unità.

Sia la percentuale di unità risolte sia la percentuale di unità eleggibili aumenta di mese in mese anche se alla fine di ciascun anno il numero di unità non risolte e non eleggibili risulta ancora non trascurabile.