• Non ci sono risultati.

I dati dell’indagine IT-SILC e gli archivi amministrativi dell’INPS sono stati impiegati sin dalla costruzione del primo dataset AD-SILC. Il primo obiettivo del progetto MOSPI è stato quello di aggiornarli, ampliando il numero di variabili a nostra disposizione e allargando il campione. Nel presente paragrafo, esploreremo le fonti di dati aggiuntive considerate per un’ulteriore espansione di AD-SILC 3.0.

1.3.1 Dati amministrativi su dichiarazioni fiscali e registri catastali (Dipartimento delle Finanze)

Il Dipartimento delle Finanze del Ministero dell’Economia e delle finanze detiene tutti i dati nazionali sulle dichiarazioni fiscali annuali9 e tutte le registrazioni catastali10. A seguito di recenti interazioni, il Dipartimento delle Finanze ha accettato di condividere i dati relativi alle persone intervistate nelle waves SILC 2010, 2012, 2014, 2016 e 2018, con le informazioni relative all’anno fiscale precedente.

Nonostante la quantità di informazioni condivise non ci consenta di costruire una struttura di panel completa (non tutte le waves SILC sono coperte), il guadagno in termini di informazioni aggiuntive è molto elevato.

Dai dati delle dichiarazioni fiscali, otterremo: i) reddito lordo soggetto all’imposta sul reddito delle persone fisiche (IRPEF), inclusi reddito da lavoro, prestazioni pensionistiche, reddito catastale, reddito da capitale e plusvalenze; ii) crediti e detrazioni fiscali IRPEF; iii) reddito lordo soggetto a tassazione proporzionale (es. reddito da locazione soggetto a cedolare secca, premi di produttività, reddito da lavoro autonomo soggetto a regimi fiscali sostitutivi come regime fiscale di vantaggio e regime forfettario).

Dal registro catastale otterremo: i) comune in cui è situata l’unità immobiliare; ii) categoria catastale; iii) superficie in metri quadrati (solo per unità abitative residenziali);

iv) valore catastale; v) quota di possesso. Oltre a questi dati del Catasto, il Dipartimento delle Finanze fornirà anche una corrispondenza con il valore di mercato delle unità abitative residenziali secondo l’Osservatorio del mercato immobiliare (OMI)11, gestito dall’Agenzia delle Entrate.

Sono in fase di valutazione le potenzialità dell’inclusione delle informazioni elencate nello sviluppo del modello e nelle analisi delle dinamiche del mercato del lavoro. Il livello di dettaglio dei dati sulle fonti di reddito delle dichiarazioni fiscali può essere utile per meglio identificare una serie di categorie di lavoratori non standard (lavoratori occasionali, lavoratori autonomi ai sensi di regimi fiscali sostitutivi), mentre i dati sugli immobili dovrebbero fornire un contributo significativo allo sviluppo del Modulo

9 Per statistiche ufficiali e informazioni metodologiche, consultare: https://bit.ly/3cxwURV.

10 Per statistiche ufficiali e informazioni metodologiche, consultare: https://bit.ly/2MsK48j.

11 Vedi: https://bit.ly/36XPQYU.

22 1. Il dataset AD-SILC

Ricchezza (si veda più avanti nel rapporto). Inoltre, queste fonti di dati saranno di grande valore per un’identificazione più precisa delle famiglie e/o degli individui beneficiari di prestazioni di previdenza sociale, dove sia le informazioni sul reddito sia sulla ricchezza sono utilizzate per il loro calcolo.

1.3.2 L’Indagine sui bilanci delle famiglie (SHIW)

L’Indagine sui bilanci delle famiglie (Survey on Household Income and Wealth, SHIW) è un’indagine campionaria sulle famiglie italiane condotta ogni due anni dal 1977 al 2018 (con un gap di tre anni nel periodo 1995-1998) da parte della Banca d’Italia.

L’indagine intende studiare il comportamento economico delle famiglie italiane, definite come insieme di persone legate da vincoli di matrimonio, parentela o adozione e che condividono la stessa abitazione. L’ampiezza del campione comprende circa 8.000 famiglie all’anno, estratte dalle liste anagrafiche. L’indagine contiene una considerevole componente panel, che consente di stimare i processi e le transizioni delle variabili target. Il capofamiglia è il responsabile delle finanze domestiche, è la principale fonte di guadagno della famiglia ed è etichettato con un numero d’ordine uguale a uno (NORD = 1). La componente longitudinale consente di seguire potenzialmente oltre il 50% delle famiglie in due periodi di osservazione ripetuti due volte.

La raccolta dei dati è affidata a una società specializzata che si avvale di intervistatori professionisti e utilizza la metodologia CAPI (Computer Assisted Personal Interview).

L’indagine raccoglie le seguenti informazioni:

• caratteristiche della famiglia e dei suoi membri (numero di percettori di reddito, genere, età, istruzione, condizione lavorativa, settore industriale e caratteristiche dell’abitazione);

• entrate (salari e stipendi, redditi da lavoro autonomo, pensioni e altri trasferimenti finanziari, redditi da attività finanziarie e immobili);

• consumo e risparmio (consumo di alimenti, altri beni non durevoli, spese per l’edilizia abitativa, sanità, assicurazione, spesa per beni durevoli e risparmio delle famiglie);

• ricchezza in termini di beni immobili, attività finanziarie, passività;

• moduli speciali come plusvalenze, eredità, avversione al rischio, lavoro non retribuito, mobilità economica, capitale sociale, evasione fiscale, alfabetizzazione finanziaria.

Nell’ambito del progetto MOSPI utilizzeremo le waves SHIW 2004-2016 (in linea con l’intervallo di tempo del dataset di riferimento AD-SILC 3.0 al fine di integrare AD-SILC con la ricchezza netta delle famiglie12 e informazioni su consumi/risparmi, ogni volta che non sono disponibili da una fonte amministrativa.

12 Sotto forma di immobili (case), risorse finanziarie, mutui, regimi pensionistici integrativi, oltre a informazioni sull’alfabetizzazione finanziaria.

23

1. Il dataset AD-SILC

Una delle problematiche di questa fonte di dati, in particolare per quanto riguarda le variabili finanziarie, è costituita dalla sottostima delle attività finanziarie. Numerose pubblicazioni hanno affrontato questo problema, in particolare D’Aurizio et al. (2006).

Gli autori riallineano i dati sulla ricchezza abbinando la wave SHIW del 2002 con dati anonimi ricavati da un’indagine campionaria sui clienti di una banca privata (Banca Unicredit) riguardo i beni effettivamente posseduti. Il nostro obiettivo è quello di applicare la stessa correzione ai dati, combinandola con un’altra forma di correzione proposta da Brandolini et al. (2009), che aiuta a ridurre le distorsioni in termini di proprietà delle risorse finanziarie. Questa procedura combinata segue ciò che è stato recentemente proposto da Boscolo (2019).

Il collegamento tra il dataset SHIW e AD-SILC sarà realizzato attraverso una tecnica di merging al livello familiare. Il nostro obiettivo è quello di adottare la tecnica del Propensity Score Matching seguendo Tedeschi et al. (2014), che hanno unito SHIW all’Indagine sui consumi delle famiglie (Household Budget Survey, HBS). Una variabile cruciale per costruire il collegamento tra i dati è il reddito da lavoro familiare che nell’ultima wave disponibile di SHIW si riferisce al 2016, il che implica una perfetta sovrapposizione con l’anno fiscale delle informazioni sul reddito contenute in IT-SILC. In questa procedura, concepiremo AD-SILC 3.0 come campione ‘destinatario’ e SHIW come

‘donatore’ di alcune informazioni mancanti.

Le informazioni dell’indagine ‘importata’ sugli immobili verranno confrontate e adeguate con i dati amministrativi, quali i registri fiscali e catastali forniti dal Dipartimento delle Finanze, nonché l’elenco dei valori immobiliari dell’OMI.

1.3.3 Dati d’indagine provenienti da INAPP

L’Istituto nazionale per l’analisi delle politiche pubbliche (INAPP) svolge una serie di indagini volte ad analizzare il mercato del lavoro, sia dal lato della domanda che dell’offerta. Due di queste indagini sembrano promettenti per i nostri scopi: l’Indagine sulla partecipazione al lavoro e la disoccupazione (PLUS), un’indagine campionaria sull’offerta del mercato del lavoro italiano e (in misura minore) l’Indagine RIL (Rilevazione longitudinale su imprese e lavoro), che raccoglie informazioni dalle imprese.

Come osservato nel “Rapporto sul Futuro del Lavoro: Le Dinamiche del Lavoro Non-Standard in Italia” (primo rapporto intermedio MOSPI redatto dall’INAPP), l’obiettivo principale dell’indagine PLUS è quello di fornire stime statisticamente affidabili di fenomeni rari o marginalmente esplorati da altre indagini riguardanti il mercato del lavoro italiano. L’indagine, avviata nel 2018 su un campione di circa 45.000 individui, dedica un’attenzione particolare ai lavoratori delle piattaforme (divisi in piattaforme di lavoro, piattaforme di capitale e vendita online di beni di consumo) e riporta informazioni dettagliate su istruzione, età, status lavorativo, pertinenza di guadagni relativi alle piattaforme, tipologia di contratto (solo per piattaforme di lavoro) e capacità di gestire spese impreviste (cure mediche e cure dentistiche).

24 1. Il dataset AD-SILC

Sebbene l’indagine sia disponibile solo per l’anno 2018, questi dati possono contribuire ad estendere le informazioni sui lavoratori non standard già a nostra disposizione attraverso i dati dell’INPS e delle dichiarazioni fiscali, consentendo così una rappresentazione più accurata delle traiettorie di lavoro e dei problemi specifici di welfare. Una corretta descrizione del fenomeno di nicchia dei lavoratori delle piattaforme può inoltre permetterci di implementare scenari ed elaborare proposte politiche mirate da testare in T-DYMM.

Allo stesso modo, le informazioni sull’automazione e sugli investimenti nella digitalizzazione contenute nelle indagini PLUS e RIL possono essere utili per definire scenari di lavoro futuri, in modo da valutare l’effetto del processo di digitalizzazione su specifici settori e categorie di lavoratori.

Poiché le indagini SILC e INAPP sono condotte su campioni diversi (e poiché i dati amministrativi sullo stesso argomento non sono disponibili), le informazioni non possono essere direttamente collegate ad AD-SILC. Tuttavia, la vasta informazione già contenuta in AD-SILC potrebbe consentire l’uso di tecniche di matching statistico per associare le sue osservazioni a variabili riportate in indagini esterne per casi che mostrano caratteristiche simili a quelle di AD-SILC. Tecniche simili a quelle sopra menzionate per SHIW possono essere impiegate anche in questo contesto.

1.3.4 Eventuali ulteriori espansioni del dataset

Come notato sopra, i dati complessivamente impiegati nell’ambito del progetto MOSPI provengono da una moltitudine di fonti. Tutte le informazioni raccolte possono essere essenzialmente divise in due categorie: i) dati che sono direttamente collegabili a singole osservazioni tramite il codice fiscale (dati IT-SILC, INPS e del Dipartimento delle Finanze); ii) dati d’indagine che non consentono un collegamento diretto (indagini SHIW e INAPP).

Dal momento che il Dipartimento del Tesoro ha accesso ai codici fiscali relativi alle persone intervistate in IT-SILC, previo accordo con le Istituzioni competenti, la prima categoria potrebbe essere ulteriormente ampliata in futuro. L’Agenzia delle Entrate ha recentemente sviluppato un archivio che raccoglie informazioni sui saldi dei conti e sulle operazioni finanziarie13. Il database è in costruzione e il suo utilizzo è limitato e regolato dalla legge. Tuttavia, abbiamo aperto un canale per un potenziale dialogo, in futuro, di AD-SILC con i dati dell’Agenzia delle Entrate sulle operazioni finanziarie. I codici fiscali

13 Il decreto legge n. 201/2011 (il cosiddetto Decreto Salva Italia) ha introdotto l’obbligo, per gli operatori finanziari, di comunicare all’Anagrafe tributaria – denominata Archivio dei rapporti con operatori finanziari – le informazioni sui saldi e sulle movimentazioni dei rapporti attivi. La comunicazione – effettuata attraverso l’infrastruttura SID – si affianca a quella relativa all’Anagrafe dei rapporti finanziari, regolata dai provvedimenti del 19 gennaio 2007 e del 29 febbraio 2008. A partire da gennaio 2016, le comunicazioni delle informazioni mensili (aperture e cessazioni di rapporti) e annuali (saldi, movimenti e altri dati contabili) sono effettuate in base al tracciato e alle specifiche tecniche stabilite nello stesso mese tramite l’infrastruttura SID.

25

1. Il dataset AD-SILC

possono anche essere collegati ai dati amministrativi relativi alle informazioni sulla salute (ad es. spese relative alla salute, schede di dimissione ospedaliera), consentendo in tal modo di effettuare un’analisi sui determinanti socio-economici dello stato di salute e lo sviluppo di un modulo sanitario all’interno di T-DYMM.