4.1. Obiettivi e metodologia dell’indagine
Per analizzare gli eventuali cambiamenti subiti dal comportamento d’acquisto del consumatore italiano per effetto della crisi economica si è proceduto a formulare un sistema di domanda di natura Almost Ideal [Deaton e Muellbauer, 1980].
I dati adoperati sono stati ricavati dall’indagine sui consumi delle famiglie condotta dall’Istat negli anni 2007 e 2009, attraverso gli strumenti del Libretto degli Acquisti, del Taccuino degli Autoconsumi e del questionario di riepilogo delle spese familiari. Si è scelto di includere nella disamina solamente queste due annate per semplicità e per la significatività e l’importanza che ricoprono nell’epoca complicata che sta affrontando il nostro Paese.
Come si è già ribadito precedentemente nel corso della trattazione (capitolo 1), il piano di campionamento è stratificato: nel primo stadio si contemplano come unità statistiche i comuni e nel secondo i nuclei familiari. Il campione sul quale è stato effettuato lo studio in questione prende in esame nell’anno 2007 circa 24.400 famiglie residenti nella nostra penisola, mentre nel 2009 le dimensioni ammontano a circa 17.712 nuclei familiari. Questi ultimi, nel periodo di rilevazione di sette giorni, devono annotare sul Libretto degli Acquisti le uscite monetarie destinate all’acquisto dei prodotti di largo consumo, in particolare si trascrive “nelle prime due pagine di ciascun giorno l’importo
della spesa per i generi alimentari e nelle due pagine successive l’importo della spesa per articoli e servizi correnti”570. Se sussiste, inoltre, una fattispecie di beni prodotti autonomamente e consumati nell’epoca temporale analizzata, si redige il Taccuino degli
570
184
Autoconsumi. All’interno “per ogni giorno sono previste due colonne in cui vanno
indicate sia le quantità, espresse in grammi, salvo diversa indicazione, sia i valori dei generi espressi in euro”571. Sono contemplate, in aggiunta, delle righe vuote per annotare i generi alimentari non considerati antecedentemente. L’ultima pagina dei due registri sopradescritti mira a rilevare eventuali problematiche e suggerimenti che forniscono le famiglie per migliorare l’erogazione del servizio. Infine, il questionario che viene compilato tramite intervista personale prevede la somministrazione di quesiti sia di natura quantitativa che qualitativa572. Le modalità di risposta considerano l’apposizione di una barra nella casella conforme, lo riempimento di quadratini lasciati vuoti e degli spazi in cui si richiede di annotare la somma monetaria destinata all’acquisto dei vari beni.
4.2. I dataset degli anni 2007 e 2009: operazioni attuate
Dall’indagine sui consumi delle famiglie effettuata dall’Istat si sono ricavati due dataset corrispondenti ai due anni esaminati. Originariamente il primo era costituito da 24.400 unità statistiche e da 43 variabili di natura quantitativa, qualitativa e ordinale573. Il secondo, invece, contemplava 17.712 unità statistiche e il medesimo numero di variabili del caso precedente.
Visto che i dati presentavano scale di misura differenti tra loro e sussisteva la presenza di dati mancanti, si è attuata dapprima una validazione dei dati in un’ottica di maggiore rappresentatività e correttezza dei risultati e successivamente una riduzione delle dimensioni dei dataset a livello di record.
571
Si precisa che si fa riferimento ai prezzi esibiti nei punti vendita locali [fonte: http://www.istat.it/it/files/2012/02/Taccuino-degli-acquisti.pdf ].
572
Si parla di dati quantitativi quando sussiste una diversità che può essere misurata in termini numerici. Ad esempio se uno studente universitario ad un esame riporta come punteggio 27/30 ed un altro 22/30 questa difformità esprime uno specifico concetto ed è misurabile. Al contrario se ad un giocatore di calcio viene assegnata la maglia 12 e ad un altro la 14 questa differenza non può essere quantificata numericamente e non significa che il primo segna un numero maggiore di goal rispetto al secondo. In quest’ultimo caso si è in presenza di dati qualitativi.
573
Nella casistica di variabili ordinale sussiste una classificazione gerarchica delle possibili risposte però “non c’è nessun significato misurabile nella differenza d’intensità tra le risposte” [fonte: Newbold P. Carlson William L., Thorne B. (2007), “Statistica”, Milano, Pearson Paravia Bruno Mondadori S.p.A.]. Un esempio è dato dalla variabile “statura” con la codifica 1 = alto, 2 = medio, 3 = basso, oppure dalla variabile “voto” con 1=ottimo, 2=distinto, 3=buono, 4=sufficiente 5=insufficiente. Il grado di evidenza nelle diverse fasce contemplate potrebbe essere difforme.
185
Nel primo caso si fa riferimento al cambiamento subito da alcune variabili che assumono natura dicotomica574. A titolo esemplificativo si cita il caso della variabile
“regione”. Sono state inserite quattro macrocategorie (Nord, Centro, Sud e Isole) e si è
adottata la seguente scala di misurazione: 1 indicando l’appartenenza ad una determinata area geografica e 0 il contrario. Lo stesso fenomeno si registra per “sesso”,
“stato civile”, “titolo di studio”, “condizione professionale”, “posizione professionale” ed “età”. Nella fattispecie contemplata rientra l’immissione di nuove
caratteristiche da considerare, di particolare interesse per la formulazione del modello rispetto a quelle predisposte nei dataset originari. Sono state introdotte, infatti, gli attributi “alimentari” (food) e “alcool e tabacchi” (alctab). Il primo è dato dalla somma destinata dai nuclei familiari all’acquisizione dei generi alimentari come pane e cereali, carne e così via e da quella riservata alle bevande di natura analcolica. Il secondo rileva i versamenti allocati per acquistare le bevande alcoliche e i tabacchi, come si intuisce dalla sua denominazione. Inoltre, si nota la presenza della variabile
“totale spese”, indicante l’esborso monetario complessivo che ogni famiglia sostiene in
un’ottica di consumo dei vari beni e di quella definita “quote di spesa”in un numero eguale a quello delle macrocategorie considerate (w1,w2,…w10). Esse rappresentano la
porzione del bilancio familiare espressa in percentuale per ottenere i vari prodotti. Si rammenta che la loro sommatoria deve restituire un valore numerico pari a 1. In aggiunta è stato calcolato il logaritmo naturale di ogni indice di prezzo575, visto che sono parte integrante del processo di formulazione dell’approccio. Infine, non bisogna dimenticare l’inserimento di alcune variabili dummy576 per valutare un possibile effetto stagionalità. Osservando la natura dei dati, naturalmente nel modello bisogna contemplare le conseguenze apportate dalle componenti di stagionalità e di trend in modo da depurarlo per un miglioramento nella stima dei parametri.
Nel secondo caso, invece, si è deciso di non includere nella formulazione dell’approccio i record che presentavano dati mancati, in quanto collegati a informazioni personali e
574
Una variabile si definisce dicotomica se le p misurazioni realizzate su un campione composto da n individui hanno come obiettivo dimostrare la presenza (1) o la mancanza (0) di una determinata caratteristica.
575
Si precisa che gli indici di prezzo relativi alla classificazione COICOP/NIC “Abbigliamento e calzature” (clothing) e “Servizi sanitari e spese per la salute” (health) sono stati ricavati dal dataset I.Stat, in quanto assenti dai dataset originari.
576
La variabile dummy è di natura dicotomica e assume valori pari a 1 o a 0 a seconda di ciò che si considera un “successo” o un “insuccesso”.