• Non ci sono risultati.

I dati al servizio della conoscenza

Nel documento ATTIRoma, 22-24 giugno 2016 (pagine 81-107)

Buonasera a tutti, benvenuti a questa sessione sui dati al servizio della conoscenza, ringrazio i nostri ospiti Maurizio Franzini e Francesca Perucci da New York in video-conferenza.

Purtroppo non abbiamo Giorgio Parisi, che mi ha comunicato poco fa che ha un’indi-sposizione e non può intervenire. Naturalmente nel parterre era importante avere uno scienziato del livello di Giorgio Parisi, un fisico di livello mondiale, uno tra i migliori scienziati italiani, ma potremo comunque affrontare il tema da diversi punti di vista. Il tema è quello del rapporto fra i dati, tra la produzione di dati e la conoscenza, con il punto di vista di un economista e con il punto di vista di un’organizzazione interna-zionale, Le Nazioni Unite, che valorizza i dati con un riferimento fondamentale come quello dell’Agenda 2030 e quindi della misurazione dei progressi nel mondo, della riduzione delle disuguaglianze a livello globale.

Nella società dell’informazione i dati sono ormai un asset cruciale, ma il dato è sino-nimo di informazione e conoscenza? oppure esiste un filo conduttore che lega questi tre stati? Un aiuto ci viene dalla definizione di questi termini, d’altra parte noi statistici abbiamo ragionato a fondo sulle diverse fasi che portano dai dati all’informazione statistica, alla conoscenza.

A partire dagli anni ’40, le prime distinzioni e formalizzazioni di questi tre stati arriva-no grazie all’avvento della teoria dell’informazione e delle relative tecarriva-nologie informa-tiche. Fu Claude Shannon, nel suo celebre Mathematical Theory of Communication del 1948 che, definendo i concetti alla base delle comunicazioni digitali, fece emergere la necessità di distinguere e definire in modo categorico i concetti di conoscenza, in-formazione e dato. Termini che fino ad allora erano considerati dei sinonimi. Bisogna ricordare peraltro che, Shannon nello stesso lavoro, sviluppò anche i concetti di entro-pia e ridondanza, a noi fortemente familiari.

Tornando alla corrispondenza tra i diversi stati, è utile osservare come il dato, pur essendo qualcosa di percettibile, assume un valore intrinseco solamente quando viene collocato in un determinato contesto. Nella statistica ufficiale i dati statistici proven-gono tradizionalmente da apposite rilevazioni, totali o parziali, campionarie, e i dati possono essere resi disponibili ad altri - e in generale lo sono se vengono prodotti da soggetto pubblico – ma affinché si trasformino in informazione è necessaria una tran-sizione in cui ci sia un arricchimento, collegato proprio al fatto che il dato raggiunge un destinatario.

È fondamentale, quindi, che il soggetto al quale sono destinati i nostri dati, o che li acquisisca per propria iniziativa, abbiano valore in quanto ne venga colto il signifi-cato e soprattutto siano utilizzati. Certamente l’utilizzo è un modo attraverso il quale possiamo misurare il fatto che i dati abbiano assunto un significato per i destinatari. È sempre opportuno ricordare, quando si parla di dati, che la teoria ci ha oramai di-mostrato che i nostri dati sono inevitabilmente incerti, ma ci ha anche consentito di quantificare e misurare, secondo schemi consolidati, il livello di questa incertezza, con paradigmi molto solidi quando utilizziamo metodi tradizionali che presuppongono un

sessione plenaria

Giorgio Alleva

sessione plenaria

disegno di indagine, quindi una raccolta di dati, ad esempio selezionati con un metodo probabilistico.

Detto questo, oggi il nostro mestiere è molto più difficile, dobbiamo saper valutare e misurare incertezza in condizioni assai differenti, abbiamo parlato in questi giorni di integrazione di diverse fonti e quando andiamo a integrare i dati campionari con dati amministrativi, o a usare altre fonti di informazioni, i cosiddetti Big data, natural-mente questi paradigmi non sono immediatanatural-mente utilizzabili. La sfida della misura dell’errore, della capacità nostra di leggere quei dati con dei riferimenti di carattere generale, è assai complessa. Da molti anni ormai ci cimentiamo anche con la misura di errori di natura non campionaria.

Detto questo, si possono produrre dati statistici, ma non si produce informazione stati-stica se non con l’intento di comunicarne il significato e suscitare un’interazione con il soggetto ricettore. Allora è sempre più importante, per i produttori, saper diffondere e comunicare, il che vuol dire sviluppare anche con metodi avanzati, nuovi formati di diffusione, finalizzati a raggiungere destinatari con diversi linguaggi, con diverse modalità.

Su questo si sono sviluppate tante tecniche e modalità nuove, in particolare si uti-lizzano sempre più rappresentazioni di carattere grafico e info grafico, capaci di ag-giungere valori e dati, con la loro capacità di ragag-giungere destinatari con linguaggi appropriati. L’importanza attribuita alla produzione di dati pone così una seria sfida alla statistica ufficiale, chiamata a relazionarsi con un numero sempre maggiore di interlocutori, i destinatari dei nostri dati, che sono sia produttori alternativi dell’infor-mazione statistica, con i quali dobbiamo fare partnership, e, soprattutto i consumatori di dati, quindi gli utilizzatori di tutte le diverse categorie: i cittadini e le imprese, le istituzioni, il mondo della ricerca, i media.

Le tematiche e i campi di azione coinvolti sono numerosi, ne stiamo parlando anche qui in Conferenza: gli Open data, i Big data, in generale la modernizzazione dei pro-cessi di produzione e diffusione dell’informazione statistica, i censimenti permanenti e poi il tema del monitoraggio dell’agenda digitale, l’e-government, le smart cities. L’informazione acquisita assume tanto valore quanto più si diffonde e viene utilizza-ta. Noi produciamo una buona informazione di qualità, abbiamo una produzione di volume sempre maggiore. Quello che dobbiamo promuovere in misura maggiore cer-tamente è il suo utilizzo e, tra gli elementi di qualità, la rilevanza, dunque la capacità di produrre informazioni che siano in grado di soddisfare domande e più facilmente di raggiungere i destinatari e trovarli pronti all’utilizzo dei dati, è fondamentale. Naturalmente non ci basta saper rispondere a domande, dobbiamo anche essere in grado di capire, comprendere quali sono le domande che ci verranno dalla società e saper investire in quella direzione, quindi anticipare i fabbisogni è anche un tema importante.

Ebbene, a questo punto non posso che concludere ricordando che in tutto ciò è fonda-mentale avere una buona reputazione, riuscire a qualificare la propria informazione e raggiungere i destinatari, anche sapendo comunicare la qualità della nostra infor-mazione. Stiamo parlando molto di questo, di come poter in qualche modo consentire, da parte degli utenti, un riconoscimento del valore della statistica. Si parla, in ambito europeo, anche della necessità di processi di certificazione, di brand comuni a livello europeo dell’informazione statistica ufficiale.

Questa reputazione, questa credibilità non la si può ottenere soltanto con dei bollini, ma va costruita giorno per giorno ed è a partire dalla credibilità di quell’informazione quotidiana, dall’esperienza delle persone nell’utilizzo di quell’informazione in modo

sessione plenaria

utile, che si costruisce questa credibilità. Credibilità che ha bisogno di un lavoro co-stante e che, invece, può essere persa in pochi minuti, quindi è un lavoro sempre molto difficile anche questo.

Bene, cedo la parola a Maurizio Franzini, Ordinario di politica economica dell’Univer-sità Sapienza di Roma, Direttore della Scuola del dottorato di Economia, Direttore del Centro interdipartimentale Tarantelli e membro del Consiglio dell’Istat.

Il tema di questa sessione è “I dati al servizio della conoscenza” e io intenderò la co-noscenza come coco-noscenza economica. Di questo tema avrei potuto parlare in tanti modi, a cominciare dalla mia esperienza diretta sul ruolo e il modo in cui i dati hanno influenzato la mia attività. Oppure avrei potuto cominciare da una precisazione dei termini che sono più complessi di quanto sembri: dati, informazione, conoscenza, ec-cetera.

Assumerò, invece, che su questo più o meno ci intendiamo e parto da una banale con-siderazione: l’effetto dei dati (quelli buoni, naturalmente) sulla conoscenza dipende anche da come si comportano coloro che di quei dati vengono in possesso e dovrebbero utilizzare. Non potendo condurre un’indagine sul campo ho fatto una ben più mode-sta indagine nella mia mente al termine della quale ho trovato quattro categorie di persone i cui comportamenti sono rilevanti per gli effetti dei dati sulla conoscenza. Per classificarle. una classificazione certamente migliorabile - ho usato termini anglofoni, semplicemente perché sembra che funzionino meglio.

La prima categoria è formata banalmente da coloro che ignorano i dati; si tratta dei

data ignoring people, quelli che per vari motivi i dati non li considerano proprio.

La seconda categoria è formata, invece, da quelli che sono un po’ fobici nei confronti dei dati, quindi li chiamiamo data phobic; è una forma di fobia che può essere seletti-va, nel senso che la fobia può portare ad allontanarsi soltanto da alcuni dati.

Poi ci sono i data addicted, cioè coloro che soffrono di una sindrome particolare: più dati metti a loro disposizione più dati chiedono, come in un normale processo di assuefazione, appunto.

Infine c’è la categoria dei data rational che sono coloro i quali usano in modo ra-zionale i dati e quindi rappresentano una sorta di categoria benchmark, quella sulla quale appuntare maggiormente l’attenzione.

Dai risultati preliminari sembra emergere che esiste una certa eterogeneità nella po-polazione, con degli addensamenti settoriali di queste figure in vari ambiti; peraltro non è chiaro di che cosa parlino tra loro quando si incontrano, perché in questi adden-samenti ci sono figure diverse con conseguenti difficoltà di comunicazione.

La prima categoria che analizzo è quella dei data phobic, Vorrei partire da una cita-zione, che proviene da un economista che ha avuto una straordinaria influenza: John Maynard Keynes. È una frase che ho letto molte volte, ma rileggendola mi sono reso conto di non aver dato il giusto peso a tutte le parole che la compongono.

La frase si trova nell’ultima pagina della General Theory, cioè dell’opera più impor-tante di Keynes, ed è quella in cui egli sostanzialmente afferma che sono le idee a determinare quello che accade, le idee degli economisti e dei filosofi politici che, sia quando sono giuste sia quando sono sbagliate - questa è la parte da sottolineare - sono più potenti di quanto si ritenga comunemente. Il mondo è governato da poco altro che da questo e gli interessi sono meno importanti delle idee.

Questa è la famosa affermazione di Keynes. La cosa che mi ha colpito rileggendola, e alla quale non avevo dato l’importanza che merita in precedenza, è l’affermazione che

Maurizio Franzini

sessione plenaria

non importa se le idee siano giuste o sbagliate. I dati qui sembrano non avere alcun ruolo, cioè sembra che Keynes non dia importanza ad essi o forse pensa che le idee, anche quelle cattive, possano imporsi al di là dei dati.

Viene quindi da chiedersi se Keynes, quando parlava di idee, in realtà intendesse riferirsi alle ideologie invece che alle teorie. Il dubbio sembra giustificato e si rafforza se consi-deriamo quello che scrisse nel 1969 un grande storico-economico, Gerschenkron: “se le teorie fossero state sostenute da un sufficientemente grande ammontare di conoscenza empirica il loro impatto sugli eventi sarebbe stato maggiore”. Questa affermazione, che potrebbe essere considerata un’integrazione di quella di Keynes, contiene una certa dose di ottimismo perché lascia intendere che dalla maggiore disponibilità di dati po-trebbe derivare una maggiore efficacia delle teorie-idee, naturalmente quelle buone. Possiamo chiederci se le cose sono andate in questo modo da quando la disponibilità di dati è molto cresciuta. E se la risposta fosse, come è plausibile, negativa, bisognereb-be andare in cerca di altre spiegazioni. E si potrebbisognereb-be iniziare da molto lontano, dalle famose corn laws del 1847, quando in pratica venne introdotto il libero scambio. Gli economisti avevano da tempo prodotto, e senza effetti, l’idea che il libero scambio fosse la forma migliore di organizzazione dei rapporti internazionali, in contrasto con l’as-setto istituzionale prevalente. Ma soltanto molto tempo dopo avvenne il cambiamento. Leslie Stephen, scrivendo nel 1900, si chiese: assistiamo al trionfo di un’idea ragione-vole e forte, oppure si è verificato che gli interessi di coloro che, consumandolo, ragione- vole-vano il pane a basso prezzo hanno dominato quelli di coloro che, invece, volevole-vano che il prezzo del pane fosse elevato per guadagnarci di più? C’è stata cioè una coincidenza tra interessi e idee, oppure è l’idea di per sé che si è imposta?

Possiamo chiederci se oggi le cose stanno in maniera diversa e se per caso Keynes non abbia sottovalutato un po’ la presenza dei data phobic tra i policy makers, cioè tra coloro che dovrebbero tradurre le teorie in comportamenti pratici. Probabilmente li ha sottovalutati, perché qualche esempio di apparente data phobia nel policy making corrente noi lo possiamo facilmente rilevare.

Faccio due esempi. Il primo è la perseveranza nel sostenere, pur di fronte a dati con-trari, la teoria dell’austerità espansiva, cioè l’idea che i tagli alla spesa pubblica favo-riscono la crescita economica e fanno anche diminuire il rapporto debito-Pil (e che questa sarebbe una legge generale, non qualcosa che può valere in particolari circo-stanze e sotto determinate condizioni). Allo stesso modo continua ad essere enunciata come legge generale l’idea che la disuguaglianza faccia bene alla crescita, quando sono ormai molte le prove del contrario, come documentano anche pubblicazioni di organismi che in passato la pensavano diversamente. Mi riferisco al Fondo monetario internazionale o all’Ocse.

Siamo, quindi, in presenza di persistenti politiche ispirate a idee in contrasto con l’e-videnza - e molte altre ne potremmo enunciare. Viene da chiedersi: ma l’Evidence

based policy making, di cui si è parlato molto anche in questi giorni, che fine ha

fatto? Se l’evidence non serve a fare policy making non si può parlare tanto di questo, forse qualcuno un po’ burlone potrebbe sostenere che invece di evidence based policy

making noi siamo di fronte a una sorta di policy based evidence making, cioè di

creazione dell’evidenza in base alle politiche che si intende (a prescindere) adottare. Questa è un’eventualità un po’ inquietante, che però in qualche caso merita di essere attentamente considerata.

Se i data phobic sono quelli che vi ho descritto, a loro si potrebbe adattare un motto di Mark Twain: “supporre va bene, ma approfondire è meglio”, ma rovesciato: “appro-fondire va bene, ma supporre è meglio”.

sessione plenaria

Veniamo adesso ai data ignoring, Dove è probabile che si abbia il maggiore adden-samento dei data ignoring? Tra i consumatori, i cittadini, noi individui comuni. Ab-biamo moltissimi esempi di comportamenti assai poco ispirati alla conoscenza e alla considerazione dei dati; se ne potrebbe fare una lista lunghissima. Ne elenco alcuni. Il primo è quello dei cosiddetti effetti bandwagon: si fa quello che gli altri fanno, senza avere idea se il loro comportamento sia corretto, basato su buone informazioni e diretto agli stessi nostri obiettivi. Si tratta, in definitiva, di comportamenti conformi-sti, frequenti anche nei mercati finanziari, per i quali più dei dati conta il gruppo di riferimento.

Il secondo esempio è l’importanza che attribuiamo alle percezioni, o addirittura alle percezioni che abbiamo delle percezioni degli altri.

Il terzo è quello di farsi guidare dai ranking fatti da altri, di decidere sulla base di clas-sifiche che neanche sappiamo come sono state compilate, ma che dovrebbero dirci chi è il professionista più bravo, qual è la migliore università, qual è il vino più buono e così via. La questione è importante: potremmo trovarci di fronte a classifiche fatte con criteri assolutamente irrilevanti, che però hanno un effetto enorme sui comportamen-ti delle persone, che le seguono, rinunciando a muoversi autonomamente tra i dacomportamen-ti. Poi c’è l’inerzia, che è il risparmio dei costi della decisione, il risparmio dei costi del cambiamento delle idee. I dati qualche volta sono fastidiosi, perché potrebbero obbli-garci a rivedere ciò che siamo abituati a fare e dunque ad affrontare tutti i disagi del cambiamento.

Infine, c’è il rifiuto ammettere la propria ignoranza. A questo riguardo vorrei citare un episodio che mi ha molto colpito. Nel 1976 si chiese ad un campione della popolazione americana di esprimere un giudizio sul Public Affairs Act del 1975. L’esito di questo sondaggio fu che parecchi erano favorevoli, qualcuno contrario mentre pochissimi dissero: “non ho idea, non lo so”. Vent’anni dopo in un altro esperimento si chiese se si era d’accordo con Clinton che voleva tenere il Public Affairs Act, quello di cui al son-daggio del 1976, oppure con i repubblicani che, invece, volevano abrogarlo. In molti votarono, esprimendo il loro parere e venne fuori una maggioranza per Clinton. Che c’è di strano tutto in questo? La cosa strana è che il Public Affairs Act non è mai esistito. Ecco una dimostrazione del fatto che è difficile ammettere la propria ignoranza e che si tende a esprimere opinioni su cose di cui si ignora perfino se davvero esistano. Tutto ciò ostacola l’utilizzo dei dati per scegliere i comportamenti migliori e prendere le decisioni più appropriate.

L’istruzione e l’educazione svolgono certamente un ruolo importante a questo riguar-do. Viene in mente, al riguardo, il caso della finanza, degli scandali bancari e delle perdite dei risparmiatori, che si tende ad attribuire, appunto, alla loro incompetenza finanziaria che rende per loro muti i dati di cui eventualmente venissero in possesso. Il rimedio sarebbe, dunque, rappresentato dall’educazione finanziaria. Il problema però è più profondo. C’è una sorta di debolezza della razionalità e di esposizione all’ingan-no altrui della quale danall’ingan-no conto nel loro libro Akerlof e Shiller, due premi Nobel. Un libro che personalmente considero molto importante e interessante In inglese si chia-mava “Phishing for Phools”, in italiano, con un po’ di non proprio raffinata fantasia, “Ci prendono per fessi”.

La tesi contenuta nel libro è che, appunto, ci sono forme di debolezza della razionalità che non soltanto ci impediscono di migliorare i comportamenti, ma che si trasforma-no in occasione di improprio vantaggio per coloro che sotrasforma-no in grado di sfruttare que-ste nostre debolezze. E ciò, tra l’altro, determina situazioni di grande disuguaglianza, poco accettabili proprio perché dovute alla debolezza della razionalità e all’inganno.

sessione plenaria

Per i data ignoring il motto potrebbe essere: “data is the plural of anecdote”, cioè l’idea è che i dati siano soltanto il plurale degli aneddoti, che spesso risultano molto più “comprensibili”. Questa frase ricorre spesso, ma non si sa bene dove sia nata. Si dice che l’abbia citata per primo George Stigler, un economista che ha avuto il premio Nobel, ma non c’è certezza. Peraltro non si sa se la frase originale fosse data “is not

the plural of”, ma cambia poco. In ogni caso, essa richiama la nostra attenzione sul

potere degli aneddoti rispetto al potere dei dati.

Come dirò tra poco c’è anche un’altra categoria di individui che vorrebbe ignorare i dati perché li ritiene superflui, si tratta di ricercatori anche di economisti raffinati. Tra poco mi soffermerò su di loro.

Veniamo ai data addicted, cioè a coloro che sviluppano una sindrome di dipendenza dai dati, quasi si assuefazione, e ne chiedono sempre di più. Qui è facile individuare dove si trovano: nel mondo della ricerca. Costoro si caratterizzano per la tendenza a pensare che in qualche modo i dati parlino da soli e che più se ne hanno, più chiaro è il loro messaggio. In generale questa sindrome deriva da una scarsa fiducia, o se volete da una scarsa familiarità, con l’elaborazione teorica e quindi il dato rappresenta il rifugio e la soluzione.

All’opposto – e qui vengo agli economisti di cui parlavo prima - ci sono coloro i quali sembrano ritenere che si possa fare completamente a meno dei dati. Un esem-pio è quello del filone che chiamiamo nuova economia classica, che si caratterizza per l’assunzione che la razionalità degli agenti – sulla quale poggiano le cosiddette microfondazioni della macroeconomia - più la coerenza logica siano tutto quello

Nel documento ATTIRoma, 22-24 giugno 2016 (pagine 81-107)