Il calcolo dell’indice a livello nazionale sulla base delle fonti statistiche integrate

4. L’AGGIORNAMENTO DELL’INDICE 1

4.3 Il calcolo dell’indice a livello nazionale sulla base delle fonti statistiche integrate

Per verificare la possibilità di replicare il calcolo dell’IVSM utilizzando le fonti statistiche integrate su descritte, si è ritenuto necessario condurre un’ulteriore analisi basata sul con-fronto degli indicatori calcolati per dimensione demografica (Tavola 4.3). Quest’approccio è sembrato infatti utile per valutare l’andamento dei parametri adottati per confrontare le due distribuzioni per aree omogenee in termini di insediamento di popolazione, una delle caratteri-stiche maggiormente discriminanti per descrivere la struttura socio-economica del territorio. L’analisi dei parametri, definiti nel paragrafo 4.2, condotta sui comuni presenti nella base dati di ARCH.I.M.E.DE e classificati per dimensione demografica11, conferma in parte i risultati del pre-cedente approfondimento concernente la possibilità di individuare delle proxy valide degli indica-tori censuari (Tavola 4.3).

Gli indici di correlazione più elevati si rilevano infatti per le famiglie numerose, per gli indicatori di basso livello di istruzione e di disagio economico (oscillanti fra r = 0,96 e 0,95). Il confronto delle intensità delle due distribuzioni evidenzia per tutti e tre gli indicatori anche un buon livello di similarità (rispettivamente I_d = 0,18, 0,76 e 1,37).

Valori più bassi di correlazione e via via più alti di dissimilarità si osservano invece per gli altri tre indicatori. Le famiglie monogenitoriali a fronte di un basso livello di dissimilarità (I_d = 0,51) presentano una correlazione leggermente inferiore (r = 0,85). Gli altri due indicatori, sul disagio assistenziale e sui giovani fuori dal mercato del lavoro e della formazione, per i quali gli incroci e le definizioni delle variabili disponibili non consentono di replicare esattamente gli indicatori cen-suari adottati per la costruzione dell’indice composito, presentano livelli di dissimilarità più elevati (rispettivamente I_d = 19,89 e 10,68), nonostante un pur soddisfacente grado di correlazione lineare tra le due distribuzioni (r = 0,79).

11 Per garantire la confrontabilità territoriale fra le due basi dati, l’analisi è stata condotta solo sui comuni esistenti al 31.12 2017 che non hanno subito variazioni territoriali tra il 31.12.2014 e il 31.12.2017. La dimensione demografica dei comuni è definita sulla base delle consistenza della popolazione rilevata con il l 15° Censimento della Popolazione e delle Abitazioni 2011.

Tavola 4.3 Confronto fra indicatori tratti dalla dal Censimento della popolazione e delle abitazioni 2011 e dalla fonte ARCH.I.M.E.DE 2014 – Indici di correlazione e dissimilarità per dimensione demografica

DIMEN-SIONE DEMO-GRAFICA

Famiglie

monogenitoriali numerose^Famiglie ^{Incidenza senza}titolo di studio economico^Disagio

Giovani fuori dal mercato del lavoro e dalla

formazione Disagio assistenziale Indice di correlazione r Indice di dissimilarità Id Indice di correlazione r Indice di dissimilarità Id Indice di correlazione r Indice di dissimilarità Id Indice di correlazione r Indice di dissimilarità Id Indice di correlazione r Indice di dissimilarità Id Indice di correlazione r Indice di dissimilarità Id 5001 -10.000 0,89 0,50 0.94 0,20 0,94 0,71 0.93 1,38 0,73 10,43 0,76 20,07 10.001 -15.000 0,87 0,47 0,96 0,17 0,96 0,77 0,97 1,38 0,83 10,30 0,81 19,54 15001 -20.000 0,75 0,55 0,97 0,17 0,97 0,83 0,91 1,33 0,80 10,43 0,79 19,58 20.001 -50.000 0,75 0,57 0,98 0,15 0,98 0,83 0,96 1,36 0,85 11,50 0,85 19,84 Oltre 50.000 0,81 0,58 0,99 0,12 0,98 0,79 0,97 1,29 0,87 12,34 0,90 20,24 Totale 0,85 0,51 0,96 0,18 0,96 0,76 0,95 1,37 0,79 10,68 0,79 19,89

Anche l’analisi delle correlazione fra ranghi, coerentemente con studi precedentemente condotti sulla base dati ARCH.I.M.E.DE (Bianchino e Garofalo, 2017), conferma che nonostante le differenze fra i valori di alcuni indicatori desunti dalla fonte integrata e quella censuaria, la gra-duatoria dei comuni per gli ambiti analizzati rimane pressoché uguale, soprattutto per le classi demografiche più ampie (Tavola 4.4).

Nonostante la dissimilarità fra le due distribuzioni assuma valori più elevati nei due indicatori più “critici” a causa della loro diversa costruzione, i buoni risultati ottenuti sull’andamento della correlazione lineare e per ranghi ha orientato la scelta di adottare i comuni con oltre 50 mila abitanti come ambito ottimale per una replica dell’IVSM sulla base della fonte ARCH.I.M.E.DE e

successi-Tavola 4.4 Confronto fra indicatori tratti dal Censimento della popolazione e delle abitazioni 2011 e dalla fonte ARCH.I.M.E.DE 2014 – Indici di cograduazione per dimensione demografica

DIMENSIONE

DEMOGRAFICA monogenitoriali^Famiglie numerose^Famiglie ^{Incidenza senza}titolo di studio economico^Disagio

Giovani fuori dal mercato del lavoro e

dalla formazione Disagio assistenziale 5001 - 10.000 0,86 0,93 0,91 0,88 0,68 0,77 10.001 - 15.000 0,89 0,95 0,93 0,92 0,77 0,81 15001 - 20.000 0,84 0,95 0,93 0,90 0,69 0,77 20.001 - 50.000 0,90 0,96 0,94 0,94 0,78 0,84 Oltre 50.000 0,91 0,97 0,98 0,97 0,84 0,86 Totale 0,88 0,94 0,93 0,91 0,72 0,80

Fonte: Elaborazioni su dati Istat, 15° Censimento Generale della Popolazione e delle Abitazioni 2011 e Arch.i.m.e.de. 2014

Figura 4.1 - Indice di vulnerabilità sociale e materiale (IVSM) – Comuni con oltre 50 mila abitanti - Anni 2011 e 2014

(quartili)

vamente di effettuare un confronto con l’indice calcolato per gli stessi comuni utilizzando la fonte censuaria12. Questo aggregato territoriale rappresenta peraltro un ambito omogeneo per caratteri-stiche strutturali, entro cui diventa più significativo valutare i diversi gradienti di vulnerabilità, come del resto emerso nelle analisi condotte nel capitolo 2.

Le due distribuzioni comunali dell’IVSM riferite alla soglia demografica individuata13, calcolate la prima con la fonte censuaria e la seconda con la fonte ARCH.I.M.E.DE, presentano un’elevata correlazione lineare (r= 0,95) e un indice di dissimilarità molto basso pari a 0,37.

Come si può osservare dalla rappresentazione per quartili, le due distribuzioni, a meno di qualche eccezione, si sovrappongono confermando la presenza di un forte divario Nord Sud (Fi-gura 4.1). I centri con valori critici rientranti nel quarto quartile si trovano esclusivamente nelle regioni del Mezzogiorno, mentre quelli inclusi nel terzo quartile, quello a ridosso dell’area critica di vulnerabilità, sono presenti nel Centro Italia e soprattutto nell’hinterland di Roma.

Da un’analisi più dettagliata emergono pochi punti critici che confermano tuttavia alcuni limiti della fonte integrata nel determinare la consistenza di alcuni aggregati utilizzati nel calcolo dell’IVSM.

Nella distribuzione dei comuni per quartili in soli tre casi (Como, Varese e Bisceglie) si ri-scontra uno slittamento di due quartili, che determina la comparsa, nell’analisi basata sulla fonte integrata, di alcuni territori più deprivati nel Nord Italia (Como e Varese passano dal primo al terzo quartile) e di comuni meno vulnerabili nel Sud (è il caso di Bisceglie in Puglia che dal terzo quartile slitta nel primo meno deprivato).

Questo slittamento è in gran parte dovuto ad una significativa differenza riscontra-ta soprattutto nei valori normalizzati dell’indicatore relativo ai giovani fuori del mercato del lavoro e della formazione (lo scarto fra il valore censuario e quello amministrativo è di - 9,8 e - 12,2 rispettivamente a Varese e Como, mentre è pari a +11,2 a Bisceglie). In quest’ultimo comune si registra peraltro una rilevante differenza anche nei valori relativi al grado di istruzione: nella fonte amministrativa integrata si osserva infatti uno scarto negativo rispetto all’indicatore censuario di quasi 13 punti normalizzati, il che migliora decisamente la collocazione del comune nella graduatoria generale dell’indice IVSM.

Quanto emerso per i comuni di Como e Varese, conferma la presenza di una sovra-stima delle persone che non studiano e non lavorano (Neet), particolarmente significa-tiva nei territori collocati lungo i confini nazionali con la Svizzera (Verrecchia 2019). In alcune aree lombarde infatti il fenomeno del pendolarismo oltre confine per fini lavo-rativi è la fonte di distorsione più consistente nelle determinazione dell’aggregato dei Neet in quanto nella base dati AR.CHI.M.E.D.E non sono disponibili le informazioni sul reddito e sull’occupazione delle persone residenti in Italia ma occupate in Svizzera14.

Sul totale dei 138 comuni considerati, solo altri 42 comuni hanno cambiato quartile spostandosi in quello più vicino, non alterando dunque eccessivamente la distribuzione comunale definita con la fonte censuaria.

12 La robustezza dei risultati ottenuti con le tecniche di integrazione utilizzate per la costruzione della base dati integrata ARCH.I.M.E.DE cresce con l’aumentare della dimensione demografica delle unità territoriali trattate.

13 Per effettuare un confronto corretto fra le due distribuzioni l’analisi si è basata su un insieme di 138 comuni, rappresentati da tutti i territori rientranti in questa fascia demografica al Censimento 2011, al netto dei comuni per i quali nella base dati ARCH.I.M.E.DE 2014 non erano disponibili le informazioni provenienti dalle Anagrafi comunali necessarie per il calcolo degli indicatori.

14 Per costruzione in AR.CHI.M.E.D.E figurano i dati delle dichiarazioni dei redditi trasmesse all’Agenzia delle Entrate da parte dei contribuenti, eccetto quello degli italiani che lavorano in Svizzera che sono esentati dal presentarle in Italia Per questo motivo AR.CHI.M.E.DE non rileva gli spostamenti (quotidiani o settimanali) di coloro che pur risiedendo nei comuni di confine italo-svizzero (entro i 20 km), lavorano o studiano oltre confine Questa mancanza determina una sovrastima della componente di coloro che non studiano e non lavorano (Neet) non corrispondente alla realtà di fatto (Verrecchia 2019).

I risultati ottenuti, confermati anche da un valore elevato del coefficiente di correlazione fra i ranghi delle due distribuzioni (p= 0,89), mettono dunque in evidenza come:

• la valorizzazione ed integrazione delle fonti amministrative siano sempre più un riferimento ormai ineludibile nei processi di produzione di informazione statistica di qualità;

• sia comunque necessario utilizzare l’analisi di queste fonti integrate di dati, quali quelle condotte in questo studio, per migliorare la qualità degli archivi amministrativi di base approfondendo la natura di eventuali carenze informative e/o di copertura rilevate nelle fonti amministrative;

• questo processo di produzione dei dati diventi tanto più utile quando riferito a territori di minor peso demografico (sia a livello comunale e sub-comunale), dove eventuali anomalie nei dati amministrativi possono incidere maggiormente sulla qualità dei risultati, ma la cui indagine, specie per aree omogenee, è sempre più motivata dalle esigenze conoscitive espresse dal territorio (come del resto sottolineato dagli studi presentati nel capitolo 2).

Nonostante i buoni risultati dell’analisi condotta su una fonte sperimentale come la base dati del progetto AR.CHI.M.E.DE, permane tuttavia l’esigenza di disporre dei dati ri-levati con il nuovo Censimento Permanente della Popolazione e delle Abitazioni avviato dall’Istat nel 2018, sulla cui base aggiornare il calcolo dell’IVSM in modo più coerente ed esaustivo rispetto a quello prodotto con i dati censuari già diffusi.

Nel documento LE MISURE DELLA VULNERABILITÀ: UN’APPLICAZIONE A DIVERSI AMBITI TERRITORIALI (pagine 69-72)