Disponibilit` a e accesso ai dati - Attivit` a di modellazione e conversione semantica de

3.3 Attivit` a di modellazione e conversione semantica de

3.3.2 Disponibilit` a e accesso ai dati

In conformit`a alle linee guida proposte in [SCA08] e ai principi del Linked Data, in OpenERCH esiste una netta distinzione tra le risorse vere e proprie e i documenti che le descrivono. Ad ogni risorsa sono pertanto associati diversi URI in aggiunta a quelli a cui si `e fatto riferimento prima e che indicano la risorsa vera e propria; ognuno di questi nuovi indirizzi indica infatti specifiche rappresentazioni documentali. In altre parole, deve essere possibile ottenere la descrizione di ogni risorsa presente nel dataset digitandone l’URI relativo all’interno di un web browser.

L’attività appena descritta rappresenta una delle metodologie di base per l’accesso e la navigazione dei dati presenti all’interno di in una sorgente pub- blicata nel Linked Data. Affinché i dati di OpenERCH siano raggiungibili e consultabili via web, essi sono mantenuti all’interno di una sorta di raccogli- tore semantico dei dati, chiamato RDF Store, che si occupa di memorizzare e mantenere le informazioni, analogamente a quello che fa un DBMS. Affinché tali dati siano consultabili fornendo la propria rappresentazione documentale, è stata necessaria la creazione di un’applicazione web che si occupi di recu- perare e fornire tali documenti. Ciò mette in evidenza come l’attività svolta da OpenERCH, e in generale quanto richiesto per rendere delle informazioni disponibili nel Web of Data, non si limiti alla sola attività di conversione ma anche alla realizzazione di quanto necessario per ottemperare ai principi del Linked Data.

Gli URI delle specifiche rappresentazioni delle risorse possono essere ottenuti a partire dall’indirizzo di identificazione della risorsa, e aggiungendo la tipologia di documento desiderata. Per ottenere, ad esempio, un documento HTML che descrive la risorsa relativa al Museo Civico ‘Il Correggio’ `e possibile utilizzare l’URI ‘http://dominioIBC/resource/Museo Civico Il Correggio/html ’, ottenendo, tramite l’inserimento di tale indirizzo all’interno del browser, un risultato come quello proposto in figura 3.2. Come si pu`o notare, tale rappresentazione mette in evidenza tutte le relazioni che la risorsa indicata possiede con altre risorse presenti nel sistema, fornendo quindi una completa descri-

zione delle caratteristiche del museo presenti nel catalogo. Cliccando su altre eventuali risorse oggetto delle relazioni indicate, si ottiene la loro descrizione. Tramite l’URI ‘http://dominioIBC/resource/Museo Civico Il Correggio/rdf ’ è possibile invece ottenere un documento RDF contenente tutti gli statement in cui compare la risorsa indicata; oltre alla serializzazione in XML (conside- rata come il modello di rappresentazione RDF standard), tali informazioni possono essere ottenute anche in altri formati di serializzazione (Turtle, N3, ecc.). Tramite queste attività è possibile, in definitiva, ottenere la descrizione dei dati in diverse tipologie a seconda delle esigenze e della natura del richiedente (un essere umano sarà sicuramente più interessato alla rappresentazione HTML, mentre un agente automatico sarà in grado di comprendere più facilmente quella in RDF). Dalla figura 3.2 si può notare come la descrizione degli oggetti in OpenERCH differisca in modo sostanziale da quella ottenibile, ad esempio, nel sito di Samira. Entrambe sono pensate per l’essere umano, tuttavia esse sono state create per esigenze diverse: mentre la seconda propone una descrizione testuale delle varie caratteristiche degli oggetti, l’altra permette di ottenere, in un formato più comprensibile e leggibile rispetto all’RDF, la descrizione formale di tali oggetti aderente all’ontologia CIDOC-CRM e nella forma a grafo tipica del Semantic Web. Quest’ultima può essere utile, ad esempio, per chi intende navigare tra le risorse presenti nel dataset, eventualmente per utilizzarle successivamente per lo sviluppo di qualche applicazione o per correlarle con quelle presenti in una propria sorgente dati.

I principi del Linked Data richiedono che le informazioni, oltre ad essere descritte nei modi appena delineati, siano accessibili tramite le tecnologie standard proposte dal Semantic Web, facendo riferimento in particolare ai linguaggi RDF e SPARQL. Il primo rappresenta il linguaggio di base con cui i dati sono descritti e memorizzati in OpenERCH; per ottemperare a tali principi il sistema permette inoltre di accedere ai dati anche tramite delle interrogazioni SPARQL. A tale scopo il sistema mette a disposizione uno SPARQL Endpoint, ossia una sorta di servizio, conforme al protocol-

3.3 Attivit`a di modellazione e conversione semantica dei dati 53

Figura 3.2: Esempio di rappresentazione in HTML delle informazioni presenti nel sistema relative alla risorsa che rappresenta il museo del prosciutto di Parma

lo proposto dal Semantic Web, che `e in grado di accettare delle richieste di interrogazione in linguaggio SPARQL restituendone gli eventuali risultati. OpenERCH accetta tutte le tipologie di query possibili e permette di ottenere i risultati in diversi formati. Le richieste SPARQL possono essere effettuate anche attraverso una semplice interfaccia web, creata apposita- mente, tramite la quale, come mostrato in figura 3.3, `e possibile inserire la propria interrogazione, scegliendo lo specifico linguaggio (oltre a SPARQL

Figura 3.3: Interfaccia web proposta da OpenERCH per effettuare interrogazioni in SPARQL.

è possibile utilizzare linguaggi proprietari simili) e il formato di ritorno dei risultati. In particolare è possibile scegliere l’HTML se si intende ottenere una visualizzazione dei risultati direttamente nella pagina in forma tabella- re (come mostrato in figura 3.3), oppure specifiche serializzazioni RDF per ottenere il relativo documento con i risultati. I formati di ritorno cambia- no automaticamente a seconda della tipologia di query inserita nell’apposita area. Ovviamente le interrogazioni possono essere effettuate anche senza fare riferimento a tale interfaccia grafica, interrogando l’endpoint SPARQL tramite richieste HTTP o tramite linguaggi di programmazione, utilizzando le funzioni messe a disposizione da tutte le librerie per il Semantic Web. L’accesso ai dati tramite l’utilizzo di interrogazioni SPARQL rappresenta un metodo alternativo per visualizzare le informazioni di interesse rispetto a quello effettuato tramite la deferenziazione degli URI prima descritto. Que- st’ultimo può essere utilizzato, ad esempio, per ottenere la descrizione com-

3.3 Attivit`a di modellazione e conversione semantica dei dati 55

pleta di una risorsa e per comprendere quindi come questa è rappresentata, ottenendo informazioni utili su come strutturare eventuali interrogazioni. La creazione di query richiede infatti una conoscenza precisa del modo in cui i dati sono descritti, e quindi dell’ontologia utilizzata, ma risulta un meccani- smo molto potente per filtrare e individuare precisamente le informazioni di interesse. Tramite specifiche interrogazioni è possibile ottenere, ad esempio, tutti i musei che contengono oggetti di artisti nati in un certo anno piut- tosto che le città in cui sono presenti edifici storici che contengono oggetti d’arte astratta e sono gestiti da un privato. L’individuazione di informazione cos`ı precisa risulta, in questo modo, molto più semplice ed efficace rispetto a quella ottenibile basandosi sui meccnismi standard del web costruiti sulla corrispondenza di termini e parole chiave.

Nel documento Conversione per il Semantic Web e pubblicazione nel Linked Data di dati relativi ai beni artistici e culturali della regione Emilia Romagna (pagine 68-72)