• Non ci sono risultati.

La catena del valore del dato

Volume, varietà, velocità dei dati ne generano il valore.

Il volume dei dati, come abbiamo già visto, rappresenta sicuramente la caratteristica che più facilmente si può accostare ai big data. L’unità di misura più idonea appare quella dei zettabyte: uno zettabyte corrisponde a una capacità di archiviazione pari a oltre 36.000 anni (in termini di durata) di video in Hd ovvero una pila composta da 250 miliardi di Dvd.

44 una massa di dati di ammontare pari a 163 zettabyte, con una crescita del volume di circa dieci volte rispetto a quello registrato nel 201688. In particolare, una mole di dati sempre maggiore deriverà dal consumo di video online e dalla presenza di sensori legati all’Internet delle cose - dalla domotica alle automobili - dei quali ci si aspetta, già nel prossimo quinquennio, una crescita esponenziale, grazie all’avvento delle connessioni 5G. Siamo entrati nell’«età dello zettabyte»89 e ciò sperimenta un nuovo rapporto tra l’uomo e la società dell’Ict, nell’archiviazione, valorizzazione e memorizzazione di tutte queste informazioni.

C’è poi la varietà dei dati che si riferisce all’eterogeneità delle fonti sorgenti dei dati, dei formati con cui vengono acquisite le informazioni (tradizionali/strutturate e, soprattutto, non strutturate) e della rappresentazione e dell’analisi (anche semantica) dei dati immagazzinati.

Sebbene i dati strutturati cioè organizzati secondo una precisa struttura, siano spesso quelli che contengono una densità di informazioni maggiore, circa 1’80% dei dati oggi disponibili ha una natura non strutturata cui è associato un enorme potenziale informativo e semantico. In questi casi, occorrono tecniche molto sofisticate per trattare dati così diversi e tramutarli in informazione (immagini, foto, testi, email, Rss

feed, video, sensori, social media, ecc.)90. Ci sono poi i dati semi-strutturati. Un caso tipico è quello delle e-mail: qualsiasi servizio di posta elettronica presenta una serie di dati strutturati (che può essere raccolto e organizzato in database relazionali). Il corpo dell’e-mail, tuttavia, è generalmente composto da un testo non strutturato e dati con formati assai diversi: immagini, video, audio, ecc. Per analizzare il comportamento degli utenti sul web e costruirne una profilazione sono disponibili diversi strumenti che tracciano e memorizzano: cache del computer, cookies, cronologia dei siti visitati e vari strumenti di advertising online personalizzato, dai banner ai pop-up, agli spot realizzati in base alle preferenze espresse dagli utenti nella loro navigazione91.

Infine, la velocità dei dati risulta connessa, in primo luogo, alle tempistiche con cui le banche dati vengono alimentate, in particolare all’alta frequenza con cui i dati

88 QUINTARELLI S., Capitalismo immateriale. Le tecnologie digitali e il nuovo conflitto sociale, op. cit.,

p. 153.

89 Ibidem, p. 154.

90 ROCCASALVA G., I Big Data e gli strumenti di visualizzazione analitica: interazioni e studi induttivi

per le P.A., op. cit., p. 87.

45 circolano da un punto di origine a uno di raccolta. La velocità non riguarda esclusi- vamente il flusso di dati, ma anche la necessità di processare i dati in maniera rapida, per prendere decisioni ad un ritmo sempre più veloce, spesso in tempo reale (cd. real-

time action e real-time processing)92.

C’è chi si è divertito a contare oltre 70 v dei dati, includendo ad esempio la veridicità (la fiducia che in essi si può riporre), la valenza (cresce nel tempo e riguarda le connessioni fra dati), la visualizzazione dei dati (il modo in cui riusciamo a rappresentarli)93.

La v più importante, tuttavia, è quella che deriva da tutte le altre ed è legata alla capacità di estrarre valore dai big data. Ovviamente l’aspetto preponderante risiede nell’attività di raccolta pubblicitaria online (digital advertising) per la commercializza- zione di prodotti e servizi indirizzata verso una domanda già profilata (Figura 1).

FIG. 1. - Andamento dei ricavi pubblicitari online nel mondo (2007-2017).

Fonte: Elaborazioni Agcom (2018) su dati lab.

Accanto al valore privato per le imprese (e per i consumatori che risparmiano costi transattivi), c’è anche il valore pubblico dei dati che possono essere impiegati per il disegno di politiche volte ad accrescere il benessere complessivo della società.

92 REZZANI A., Big data. Architettura, tecnologie e metodi per l'utilizzo di grandi basi di dati, op. cit.,

p. 111.

46 Affinché i dati acquisiscano davvero un valore economico essi devono essere funzionali allo svolgimento di analisi economico-statistiche.

Secondo uno studio condotto nel 2013, e pubblicato dalla «Mit Technology Review»94, soltanto lo 0,5% dei dati disponibili sarebbe oggetto di analisi. Lo sfruttamento dei dati digitali generati dagli utenti, inoltre, permette di rispondere a specifiche domande di ricerca (uso primario), quando queste esistono, e di sfruttarne, nel tempo, il loro «valore opzionale» (uso secondario), di cui quasi sempre non si conosce neppure l’esistenza, al momento della raccolta dei dati. Il riutilizzo dei dati è alla base dei numerosi progetti che Google e altre società della rete hanno in cantiere (e sono resi al pubblico spesso in versioni c.d. beta, ossia sperimentali)95.

Volendo individuare una «catena del valore del dato», il primo scalino è dato dalla sua

acquisizione. Essa dipende anche dal tipo di dato raccolto. Oggi si raccolgono dati da

una varietà di fonti molto eterogenee. Per evitare il rischio che un sistema così diffuso di raccolta possa generare un fenomeno di over-colleclion, cioè di ridondanza del dato, si opera una seconda fase di lavorazione che riguarda la preparazione e la

conservazione del dato per gli usi successivi (data silos, data warehouse, data marts)96.

Oggi, il nuovo paradigma del data lake si basa sulla condivisione di dati grezzi - strutturati, semi-strutturati e destrutturati - nel loro formato originario, permettendone così l’analisi e, in ultima istanza, la massima estrazione di valore. Le fasi successive della catena del valore riguardano l’analisi e le relative attività di esplorazione,

trasformazione e modellazione. Infine, si ha l’immagazzinamento, un processo che

deve rispettare precisi criteri che consentano una facile scalabilità e memorizzazione. Per grandi aziende o per grandi quantità di dati, la realtà odierna è quella dei database

distribuiti. Nel mondo dei big data, i dati possono essere distribuiti sulle memorie di

massa dei diversi computer (o nodi) che costituiscono la rete di un’organizzazione i cui nodi possono anche essere fisicamente molto distanti. Lo stadio finale del dato è quello in cui da semplice informazione si trasforma in conoscenza e visione (o

wisdom). Tutte queste fasi della catena del valore del dato consentono così di model-

lare il sistema dei big data e, di conseguenza, di identificare i vari passaggi attraverso

94 OVI A.,JACOBELLI G.P., Lo sfruttamento dei dati digitali, in MIT Technology Review, 2013. 95 Ibidem.

47 cui generare valore, e, più in generale, conoscenza. Ma quanto vale il nostro dato?97 L’analogia dei dati con il petrolio funziona solo in parte: un barile di petrolio ha di per sé un valore, chiaro e osservabile, ma ciò non vale per i dati. Mentre il prezzo di equilibrio sul mercato del petrolio deriva dalla sua scarsità, nella tensione tra domanda e offerta, ciò non vale per il prezzo di mercato dei dati che, al contrario del petrolio, possono essere riprodotti, riutilizzati e riorganizzati. Chi saprebbe dire qual è il prezzo di un certo volume di dati? Dipende da tante cose: dalla varietà, dal numero di azioni e di individui che lo ha generato, dallo specifico impiego attuale e prospettico98. Una risposta ha provato a darla il «Financial Times»99, mettendo online, a disposizione dei suoi lettori, un vero e proprio calcolatore che consente di avere un’idea del valore del dato del singolo individuo a seconda delle caratteristiche personali. Come emerge dall’uso del calcolatore online, se da un lato, il valore del dato personale cambia al mutare delle caratteristiche dell’individuo, dall’altro, la comparazione tra persone con redditi diversi fa emergere un differenziale nel valore dei relativi dati di solo qualche decina di centesimi di dollaro. Nello stesso spirito, è stata di recente lanciata a Londra un’app (ErnieApp) frutto di una start up italiana. Attraverso una serie di indicatori l’app rivela agli utenti quanto valore le piattaforme digitali stanno estraendo dall’uso dei loro dati, permettendo così agli utenti di «negoziare» potenzialmente, in modo semplice e istantaneo, il livello di permessi circa la privacy digitale, in funzione della condivisione o restituzione di parte del valore generato100.

Tutto ciò mostra, concretamente, l’esistenza di un potenziale mercato che caratterizza l’ecosistema dei big data e ne spiega il funzionamento. Ma, come ha ben chiarito il premio Nobel Ronald Coase, perché un mercato funzioni occorre (almeno) che i beni in esso scambiati abbiano diritti di proprietà ben definiti, attribuendo ai proprietari il diritto di controllo sui beni.

97 REZZANI A., Big data. Architettura, tecnologie e metodi per l'utilizzo di grandi basi di dati, op. cit.,

p. 132.

98 Ibidem, p. 133.

99 HARFORD T., Big data are we making a big mistake?, in Financial Times, 28 marzo 2014, p. 14. 100 Ibidem, p. 17.

48