• Non ci sono risultati.

La metodologia utilizzata per la creazione del software

Allegato 1 – KW MEDI DELLE TIPOLOGIE DI NUCLEI FAMILIARI RELATIVI AI MEZZI DI TRASPORTO

3.4 Il “Redditest”: strumento per controllare la “coerenza” del reddito dichiarato

3.4.1 La metodologia utilizzata per la creazione del software

Per la ricostruzione della popolazione di riferimento sono state elaborate le informazioni per 59 milioni di contribuenti, le quali sono state ricavate:

- dalla sperimentazione con dati campionari su 833.601 di soggetti (periodo d’imposta 2007);

- dall’utilizzo dei dati presenti in anagrafe tributaria per 58.664.189 di soggetti (periodo d’imposta 2009), tra quelli acquisiti tramite scambi di informazioni con le altre Agenzie fiscali, Enti ed Autorità Pubbliche e tra quelli reperiti tramite specifiche e dedicate campagne di raccolta sul territorio anche in collaborazione con la Guardia di Finanza;

- dall’archivio della Famiglia Fiscale dell’Agenzia delle Entrate, il quale possiede i dati per tutti i componenti compresi i familiari a carico.

Inoltre, le informazioni relative al contribuente sono state raccolte da più di 20 archivi diversi (abitazioni, PRA, barche, lavoratori domestici, viaggi e vacanze, affitti, ristrutturazioni, spese sanitarie, leasing e noleggio, mutui, etc...).

Il passaggio successivo alla suddetta raccolta di dati ha permesso di ricostruire la famiglia fiscale (dal contribuente alla famiglia) per un totale di oltre 22 milioni di famiglie.

I passi dell’analisi si possono così distinguere:

1. Individuazione dei gruppi omogenei di famiglie;

2. Selezione delle famiglie in condizioni di normalità con riferimento ad indicatori di coerenza tra voci indicative di capacità di spesa e il reddito dichiarato;

3. Stima della relazione tra reddito e voci indicative della capacità di spesa (funzione di coerenza);

4. Fase di Test e Sperimentazione con le Associazioni di Categoria e con gli ordini professionali;

5. Personalizzazione della funzione di coerenza per tipologia di famiglia, area territoriale e dimensione del comune.

Al fine di tenere conto della diversa propensione al consumo e al risparmio delle famiglie, la popolazione, come già precedentemente evidenziato, è stata suddivisa per lifestage145 e per area territoriale, per un totale di 55 gruppi omogenei.

In letteratura, un modello di regressione è di frequente utilizzato per spiegare i consumi in funzione del reddito. Nel caso del Redditest, una funzione di regressione multilivello è stata utilizzata per definire il reddito in funzione del livello dei consumi e degli investimenti.

Le voci indicative di capacità di spesa sono riferite ai seguenti capitoli146:

 Abitazione;

 Mezzi di trasporto;

 Assicurazioni e Contributi;

 Istruzione;

 Attività sportive e ricreative e cura della persona;

 Altre spese significative;

 Investimenti immobiliari e mobiliari netti

L’utilizzo di un modello di regressione multilivello ha permesso di personalizzare la funzione di coerenza per tipologia di famiglia, per area territoriale e per dimensione del comune, arrivando così a definire 220 gruppi omogenei e 220 differenti funzioni di coerenza.

Al fine di definire e costruire la funzione di coerenza idonea al meccanismo di funzionamento dello strumento in esame, gli esperti SOSE hanno fatto ricorso ai cosiddetti “modelli misti”, i quali costituiscono una metodologia mirata per l’analisi di dati con una struttura di varianza complessa in cui i diversi livelli di classificazione risultano fonti di variabilità distinte che possono essere inserite nel modello come fattori casuali.

145

Dalla famiglia fiscale alla famiglia anagrafica: l’introduzione del lifestage “Altre Tipologie” consente di superare il concetto di famiglia fiscale, isolando quelle famiglie che non rientrano nella definizione della famiglia tradizionale ovvero le famiglie “estese” e “altre tipologie” di famiglia.

146

Vedi in Appendice la distinzione, in riferimento agli indicatori di spesa, tra il “dato richiesto” e il “dato possibile”.

Con riferimento al Redditest, i modelli di regressione per dati multilivello, anche detti “modelli a effetti casuali”, hanno consentito di stimare il reddito delle famiglie tenendo conto della struttura gerarchica dei dati, e quindi, della correlazione esistente fra le osservazioni di uno stesso livello (lifestage, gruppo territoriale, dimensione del comune) o di uno stesso gruppo.

Il modello utilizzato risulta composto da una parte fissa e da una parte random; in particolare per la parte fissa del modello sono state utilizzate le seguenti variabili:

1. Contributi previdenziali; 2. Spese per assegni al coniuge; 3. Spesa per mutui;

4. Restituzione di prestiti; 5. Spese per assicurazioni;

6. Valore figurativo OMI per l'abitazione principale in proprietà;

7. Spesa per canone di locazione (avente causa) per l'abitazione principale;

8. Valore figurativo OMI per le altre abitazioni principali (non in proprietà e non in locazione);

9. Valore figurativo OMI per le altre abitazioni in proprietà; 10. Spesa per locazione (avente causa) per le altre abitazioni;

11. Consumi di energia elettrica residenziale e non residenziale (KWH); 12. Spese per consumi di gas;

13. Spese per lavoro domestico;

14. Spese totali per ristrutturazioni, riqualificazioni, acquisto di piscine; 15. Spese totali per telefonia;

16. Spese totali per arredi, elettrodomestici e apparecchiature elettroniche; 17. Numero di Kw relativi alle automobili;

18. Numero di Kw relativi alle automobili oltre i 100; 19. Numero di minicar;

20. Numero di caravan;

21. Numero di Kw relativi alle moto; 22. Lunghezza in metri delle barche a vela; 23. Lunghezza in metri delle barche a motore; 24. Numero aerei aeroclub;

25. Numero aerei Enac;

26. Spese per noleggio e di leasing; 27. Spese sanitarie;

28. Spese di istruzione;

29. Spese per canoni di locazione sostenute da studenti universitari fuori sede; 30. Cavalli (numero di giorni di possesso);

31. Spese per viaggi e vacanze; 32. Spese per case d'asta; 33. Spese per il tempo libero;

34. Spese per intermediazione immobiliare; 35. Altre spese per oneri;

36. Totale Investimenti a seguito del riproporzionamento (triennio 2007-2009);

37. Totale Investimenti: acquisto di azioni e/o di imbarcazione/aereo e/o di terreno edificabile;

La parte random, invece, risulta composta da 3 effetti random:

Variabile Raggruppamento

Numero di Kw relativi alle automobili distinti per: Area geografica e Classe dimensionale del Comune Numero di Kw relativi alle automobili distinti per: Tipologia di famiglia

Spese per lavoro domestico Tipologia di famiglia

Una volta evidenziato il modello sottostante lo strumento, si è passati alla fase di sperimentazione dei dati con l’obiettivo di testare e valutare, mediante casi pratici, in modo dialogato con le associazioni di categoria e con i vari ordini professionali, le modalità di calcolo del prodotto “Redditest”.

Inoltre tale fase di verifica e di analisi dei risultati si è rivelata utile al fine di verificare l’aderenza dei risultati del software stesso.