• Non ci sono risultati.

La dimensione tecnica ed economica

La società dei dati e degli algoritmi Open data e big data

3.1. Open data: principi e caratteristiche

3.1.2. La dimensione tecnica ed economica

La dimensione tecnologica si traduce nel fatto che, per essere open, i dati devono essere «accessibili attraverso le tecnologie dell’informazione e della comunicazione, ivi

comprese le reti telematiche pubbliche e private, in formati aperti ai sensi della lettera l-bis)», «adatti all’utilizzo automatico da parte di programmi per elaboratori», ossia machine readable418, e «provvisti dei relativi metadati».

Pertanto i dati devono essere rilasciati in formato aperto, ossia «un formato di dati

reso pubblico, documentato esaustivamente e neutro rispetto agli strumenti tecnologici necessari per la fruizione dei dati stessi» (art. 1, comma 1, lett. l-bis), d.lgs. 82/2005)419. La norma prescrive, inoltre, la necessità che tali dati siano adatti all’utilizzo automatico da parte dei software e siano accompagnati da metadati, intendendosi per tali le informazioni e i dati che descrivono altri dati. Sono metadati il titolo del dataset, la data di ultimo aggiornamento, il soggetto che detiene e gestisce i diritti sui dati, la licenza utilizzata e la descrizione del dataset. La presenza dei metadati è particolarmente significativa per la ricerca, la localizzazione, l’interoperabilità e la correlazione di dati e per traghettare così anche l’amministrazione pubblica verso il web

416 Cfr. B.PONTI, Il regime dei dati oggetto di pubblicazione obbligatoria: i tempi, le modalità ed i

limiti della diffusione; l’accesso civico; il diritto di riutilizzo, cit., p. 118 ss., secondo cui mentre la

disposizione del d.lgs. 82/2005, originariamente l’art. 68 e oggi l’art. 1, comma 1, lett. l-ter), indica in positivo il contenuto della licenza, l’art. 7 del d.lgs. 33/2013 la indica in negativo, ponendo le clausole restrittive da osservare (rispettare l’integrità e citare la fonte); sostanzialmente i due articoli si integrano a definire le condizioni giuridiche che regolano la disponibilità dei dati a fini di riutilizzo.

417 In tal senso le citate linee guida dell’AgID per l’anno 2017. 418 G.MODESTI, op. cit., p. 31.

419 Come per la definizione di open data, anche nel caso della definizione di formato aperto il d.lgs. 217/2017 ha previsto l’opportuno spostamento dall’originario art. 68, dove era collocata, all’art. 1, comma 1, dedicato alle definizioni.

134

semantico o web of data420.

Per quanto riguarda il profilo tecnologico e il grado di “apertura” è comunemente richiamata la classificazione “5 stars” di Tim Berners-Lee421:

1 stella, il dato è disponibile sul web in qualunque formato, ma con una licenza

aperta (si parla anche di dato grezzo, data raw), es. pdf422;

2 stelle, formato strutturato processabile in modo automatico da software, di tipo

proprietario, accompagnato da licenza aperta, es. excel;

3 stelle, condivide le caratteristiche delle 2 stelle, ma in tal caso il formato è

aperto, non proprietario, es. csv423;

4 stelle, formati strutturati in formato aperto con licenza open, che seguono gli

standard aperti proposti da W3C, dotati di URI (Uniform Resource Identifier) e quindi indirizzabili in rete e utilizzabili online, es. RDF (Resource Description Framework)424;

420 I metadati richiamati nel testo sono descrittivi, ma esistono altre tipologie come quelli amministrativi e gestionali e quelli strutturali; cfr. Vademecum “Open data. Come rendere aperti i dati delle pubbliche amministrazioni” (2011), curato da Formez PA. Secondo D.SOLDA KUTZMANN, op. cit., i

metadati «hanno l’obiettivo di agevolare l’individuazione di un’informazione esistente, permettere la sua localizzazione, rintracciare una particolare occorrenza del dato, semplificarne la sua selezione, e, attraverso tecniche di analisi e valutazione, garantire la cosiddetta interoperabilità semantica, per permettere la ricerca in ambiti disciplinari diversi grazie a una serie di equivalenze fra descrittori. È questo il motivo, peraltro, per cui, nei progetti di digitalizzazione e nelle attività di gestione degli archivi di oggetti digitali, i metadati rivestono un’importanza tanto determinante, da essere considerati parte costituente dell’informazione stessa, e numerose politiche comunitarie siano dirette in tal senso verso la creazione di principi comuni per l’archiviazione e la descrizione dei dati». Cfr.F.MINAZZI, op. cit., p. 10,

secondo cui grazie ai metadati e alla pubblicazione dei dati tramite ontologie (sistemi di metadati strutturati in modo gerarchico) è possibile favorire la transizione verso il web semantico.

421 Si tratta di un modello di classificazione in cui ogni livello successivo ha i requisiti di quello precedente e alcune caratteristiche ulteriori che rendono i dati maggiormente aperti.

422 In tal caso i dati sono semplicemente resi disponibili in rete e sono open da un punto di vista giuridico, grazie al fatto che sono accompagnati da una licenza aperta. Dal dato grezzo, grazie a operazioni di data scraping, è possibile estrarre i dati e convertirli in un formato aperto.

423 Il livello 3 stars consente di rimuovere le barriere tecnologiche di accesso che vincolano all’uso di determinate piattaforme, promuovendo neutralità e interoperabilità; cfr. T.AGNOLONI, Dall’informazione

giuridica agli open data giuridici, cit., p. 585.

424 In tal modo i dati si svincolano in modo permanente dalla locazione fisica della risorsa e possono collegarsi tra loro: grazie a RDF due risorse, soggetto e oggetto, sono in relazione grazie a un predicato

135

5 stelle, i linked open data (LOD), dove i dati di livello 4 stelle contengono anche

link ad altri dati e quindi, fornendo un contesto e un collegamento dinamico, acquisiscono maggior valore425. I dataset sono messi a disposizione come servizi (data as a service) per l’utilizzo e la correlazione con altri dataset426.

Viene comunemente utilizzato un “catalogo” standard di principi e caratteristiche che i dati aperti devono possedere per essere autenticamente tali: completi; primari427; tempestivi; accessibili; processabili da computer428; non discriminatori429; non proprietari430; liberi da licenze che ne limitino l’uso431; riutilizzabili; ricercabili432; permanenti433.

(tripla, in cui ogni elemento è identificato da URI); T.AGNOLONI, Dall’informazione giuridica agli open

data giuridici, cit., p. 585 ss.

425 Cfr. 5stardata.info. I linked open data si situano nel passaggio da una rete che connette documenti con html e hyperlink al web basato su un’interconnessione di dati o risorse digitali univocamente identificate tramite URI e linkate con RDF. I requisiti base per pubblicare linked open data consistono, quindi, nell’utilizzo di URI per l’identificazione, nell’esposizione dei dati per l’accesso tramite protocollo http e nell’uso, per descrivere i contenuti e collegarli, del modello di dati RDF, che codifica le relazioni tra dati in base ad asserzioni costituite da triple (soggetto, predicato, oggetto). Le triple linkate creano grafi sempre più complessi; SPARQL, Simple protocol and RDF Query Language, è lo standard per interrogare archivi conformi a RDF. Cfr.T.AGNOLONI, Linked Open Data nel dominio giuridico, cit., p.

411 ss., secondo cui il vantaggio dei linked open data sta nell’interoperabilità: «il valore dei dati si accresce significativamente quando dataset diversi creati e pubblicati indipendentemente da soggetti diversi, possono essere riutilizzati liberamente e messi in correlazione da terze parti senza barriere tecniche» (p. 414). Secondo G. RIZZO -F.MORANDO -J.C.DE MARTIN, op. cit., p. 493 ss. «il web è lo spazio di tutte le cose (web of Things), le quali sono rappresentate mediante dei dati (web of Data)» (p. 503) e «il sottosuolo è il luogo ove i dati vengono inseriti, Open Data, mentre la pianta nasce dall’unione delle radici, Linked Data. L’incontro tra le radici crea nuove piante, dalle quali nasce un nuovo dato. Ma il dato più fertile è il dato raw» (p. 510).

426 T.AGNOLONI, Dall’informazione giuridica agli open data giuridici, cit., p. 586 ss. 427 I dati sono prelevati dalla fonte e possiedono il massimo grado di granularità.

428 I dati sono strutturati in modo da consentire un’elaborazione automatica da parte delle macchine. 429 Disponibili per chiunque, senza requisiti di autenticazione.

430 Dati in formato non proprietario.

431 Sono ammesse ragionevoli restrizioni di privacy, sicurezza e privilegi di accesso. 432 Facilmente identificabili in rete, grazie a cataloghi indicizzabili dai motori di ricerca.

433 In tal senso il manifesto di attivisti e sostenitori del movimento open government del 2007 (che prevede i primi otto principi indicati), noto come “8 principles of Government Data”, elaborato in un

136 Alla dimensione giuridica e tecnica si sposa quella economica: per essere open i dati «sono resi disponibili gratuitamente attraverso le tecnologie dell’informazione e

della comunicazione, ivi comprese le reti telematiche pubbliche e private, oppure sono resi disponibili ai costi marginali sostenuti per la loro riproduzione e divulgazione, salvo quanto previsto dall’articolo 7 del decreto legislativo 24 gennaio 2006, n. 36».

Le linee guida dell’AgID per l’anno 2017 suggeriscono espressamente azioni volte a rendere gli open data disponibili esclusivamente a titolo gratuito. La possibilità di richiedere un corrispettivo specifico per il riutilizzo dei dati è limitata ai costi sostenuti effettivamente per la riproduzione, messa a disposizione e divulgazione dei dati, in base a tariffe standard determinate, su proposta motivata del titolare del dato, dall’AgID sulla base dei costi marginali, corrispondenti ai costi effettivi e pubblicate sul proprio sito istituzionale434.

L’art. 7 del d.lgs. 36/2006 prevede casi specifici per i quali non si applicano tali previsioni e per i quali, di conseguenza, è possibile determinare tariffe superiori ai costi marginali in deroga al principio generale: è il caso delle biblioteche, comprese quelle universitarie, dei musei e degli archivi; delle pubbliche amministrazioni e degli organismi di diritto pubblico, che devono generare utili per coprire una parte sostanziale dei costi inerenti allo svolgimento dei propri compiti di servizio pubblico; dei casi eccezionali relativi a documenti per i quali le pubbliche amministrazioni e gli organismi di diritto pubblico sono tenuti a generare utili sufficienti per coprire una parte sostanziale dei costi di raccolta, produzione, riproduzione e diffusione. In queste ipotesi, i Ministeri competenti, di concerto con il Ministero dell’economia e delle finanze, sentita l’AgID, determinano, con appositi decreti, i criteri generali per le tariffe e le relative modalità di versamento, mantenendo aggiornate le stesse ogni due anni.

meeting negli Stati Uniti guidato da Tim O’ Reilly e Carl Malamud e divenuto standard per valutare gli

open data, e il Vademecum “Open data. Come rendere aperti i dati delle pubbliche amministrazioni”

(2011), curato da Formez PA e realizzato nell’ambito delle attività finalizzate all’elaborazione delle linee guida per i siti web delle pubbliche amministrazioni (previste dalla direttiva n. 8 del 26 novembre 2009 del Ministro per la pubblica amministrazione e l’innovazione).

137