• Non ci sono risultati.

I linked open data rappresentano una possibilità, non l’unica, per integrare dati nel web e per renderli maggiormente interoperabili. Essendo una tecnologia ancora sperimentale servirà del tempo affinchè le istituzioni che hanno deciso di adottare queste tecnologie condividano in modo più approfondito le principali criticità. Tuttavia alcune perplessità sono già state espresse.

Un problema è dato dalla difficoltà di rappresentare in modo efficace la semantica dei contenuti informativi e in particolare di quelli più complessi e articolati. Un’analisi di OCLC, condotta tra il 2014 e il 2015, ha evidenziato, tra le principali barriere per pubblicare linked open data, proprio la selezione di un’ontologia appropriata306. Inoltre

non si è ancora in grado di gestire in modo completamente automatico l’assegnazione di notazioni di significato ai dati, poiché “le componenti architetturali, i linguaggi, i vocabolari, non sono del tutto trasparenti e capaci di comunicare tra di loro”307.

Interrogare i dati con SPARQL non è semplice, per farlo non solo serve conoscere SPARQL ma bisogna anche avere familiarità con lo schema dei dati che si vogliono esplorare308. In pratica se si vogliono creare query, ad esempio sullo SPARQL Endpoint di DBpedia, si deve conoscere l’ontologia di DBpedia altrimenti non è possibile richiamare i dati attraverso i metadati applicati alle informazioni. Per questo è molto importante che venga condivisa la documentazione sulla scelta degli elementi e sui vocabolari di riferimento. A questo proposito si rivelano utili i profili di applicazioni, sia per le istituzioni che possono utilizzarli come punto di partenza di un progetto, sia per le persone che fanno ricerca sui dati. Considerare uno SPARQL Endpoint alla stregua di un’API può poi essere fuorviante, come scrive Dimitri van Hees “it’s equivalent to giving

306 Karen Smith-Yoshimura, «Analysis of International Linked Data Survey for Implementers», D-Lib Magazine 22, n. 7/8 (2016), doi:10.1045/july2016-smith-yoshimura.

307 Lo Castro, «Web Semantico e Linked Open Data: best practices, prospettive e criticità»: 218. 308 Matthew Lincoln, «Linked Open Realities: The Joys and Pains of Using LOD for Research»,

matthewlincoln.net, 2016, http://matthewlincoln.net/2016/06/06/linked-open-realities-the-joys-and-

75 the whole world real access to your SQL database”309, nel senso che i dati risultano spesso

troppo complessi per essere riutilizzati da terzi, ad esempio in nuove applicazioni. Un altro problema riguarda la qualità dei dataset, spesso soggetti a interruzioni o perdite o con informazioni poco affidabili, questo riguarda la fiducia e la credibilità dei dati che provengono da repository remoti310, elementi tra l’altro presenti nelle rappresentazioni dell’architettura del web semantico311 sulla quale si stanno concentrando molte energie in

termini di ricerca. “Fiducia” può avere molti significati, ma essa dipende principalmente dalla fonte da cui sono tratte le informazioni e dalle politiche adottate da chi detiene i dati312. È anche per questo che i dati delle biblioteche sono molto ambiti dalle comunità del web, sono infatti considerati semanticamente molto ricchi e strutturati, dati che possono in qualche modo aumentare il grado di fiducia generale del web.

Esistono anche problemi legati alla manutenzione degli URI, possono infatti esistere diversi identificativi univoci per una stessa entità o adirittura si può commettere l’errore di duplicare uno stesso URI inserendolo in più triplestore. Inoltre non sempre vengono stipulate le dovute relazioni tra i dati e questo incide sulla navigazione e sulla possibilità di scoprire altre risorse313. Spesso poi non viene applicata la dereferenziazione agli URI,

cioè non viene predisposta una pagina HTML visibile agli utenti con informazioni sui dati.

Il formato MARC, pur con tutte le sue limitazioni, ha comunque garantito la conservazione di informazioni semanticamente ricchissime, ed è importante che nella conversione dei dati si cerchi di non perdere questa specifità314.

Infine non va sottovalutato il rapporto tra costi e benefici, elemento che dovrebbe essere soppesato dalle biblioteche che intendano convertire i propri dati in linked open data.

309 Dimitri Van Hees, «Why APIs are the missing ‘link’ in Linked Open Data», 2015,

https://www.linkedin.com/pulse/why-apis-missing-link-linked-open-data-dimitri-van-hees.

310 Lo Castro, «Web Semantico e Linked Open Data: best practices, prospettive e criticità». 311 Gordon, «Semantic Web Specification at W3C - Slide list».

312 Adis Medic e Adis Golubovic, «Making secure Semantic Web», Universal Journal of Computer Science and Engineering Technology 2, n. 1 (2010): 99–104.

313 Trombone, «Cataloghi, modelli concettuali, data model». 314 Ibid.

76 Berners-Lee ha proposto un sistema di valutazione della qualità dei dati aperti315. Affinchè essi possano essere considerati linked open data a tutti gli effetti e ottenere il

rating massimo, devono avere le seguenti caratteristiche:

- essere dati aperti;

- essere strutturati in formati leggibili da una macchina, utilizzando RDF e SPARQL;

- essere connessi ad altri dati attraverso l’interlinking.

Ma cosa comporta questo in termini di costi e benefici316? Per avere dati aperti basta scegliere quale licenza applicare, convertire i dati in RDF invece comporta un investimento maggiore poiché sono necessarie professionalità che conoscano i linguaggi e le tecnologie del web semantico. Servono inoltre strumenti adeguati e la possibilità di investire il tempo necessario alla realizzazione di un progetto. Sempre nel rapporto di OCLC, il 61% delle istituzioni intervistate ha dichiarato di aver impiegato più di due anni per portare a termine la conversione e la pubblicazione dei dati317.

Creare connessioni con altri dataset presuppone la conoscenza del proprio dominio, la capacità di valutare la qualità e la credibilità dei dataset esterni. L’interlinking spesso comporta la mappatura tra i diversi vocabolari che sono stati usati, e di conseguenza la gestione della disambiguazione tra metadati, anche in lingue diverse, e il loro allineamento318. Va considerato poi il tempo necessario a gestire gli URI, che a volte non sono stabili e persistenti.

I benefici, come abbiamo visto, sono principalmente dati dalla possibilità di avere dati accessibili, riutilizzabili e modificabili, che consentono di poter essere annotati e arricchiti perché chiunque può aggiungere link e aumentare il valore di un’informazione. Per le biblioteche i linked open data rappresentano ancora una terra poco esplorata, valutare la loro reale portata richiede un’attenta analisi da parte della comunità bibliotecaria. Man mano che i progetti e le realizzazioni aumenteranno sarà possibile

315 Berners-Lee, «Linked Data - Design Issues». 316 «5-star Open Data», http://5stardata.info/en/.

317 Smith-Yoshimura, «Analysis of International Linked Data Survey for Implementers». 318 Ibid.

77 avere un quadro più chiaro sui vantaggi e sugli svantaggi di questa tecnologia, che appunto è solamente un mezzo, uno strumento, e non il fine delle biblioteche. Le biblioteche non devono semplicemente ridursi a convertire i propri dati in linked open data, ma devono valutare se questa tecnologia può garantire il raggiungimento degli obiettivi specifici di questo ambito. Nel caso dei dati bibliografici è importante capire quali sono i mezzi migliori per concretizzare gli indirizzi degli ICP. Per valutare appieno la portata dei linked open data, ai bibliotecari, ma in particolare di chi si occupa di catalogazione, è richiesto lo sforzo di avvicinarsi ad un linguaggio nuovo, a strumenti nuovi, cioè quelli proposti dal web semantico. Dal momento che tutte le nostre informazioni sono destinate ad essere sempre più gestite da software e ricercate attraverso la rete e saranno più o meno utili in base a sistemi di ricerca informatici, non possiamo ignorare queste tecnologie 319.

78

CAPITOLO QUARTO

Casi di applicazione dei linked open data

In questo capitolo vengono presi in esame tre casi di studio. La scelta è ricaduta sui progetti più completi e con maggiore visibilità a livello internazionale.