• Non ci sono risultati.

3.3 Attivit` a di modellazione e conversione semantica de

3.3.2 Disponibilit` a e accesso ai dati

In conformit`a alle linee guida proposte in [SCA08] e ai principi del Linked Data, in OpenERCH esiste una netta distinzione tra le risorse vere e proprie e i documenti che le descrivono. Ad ogni risorsa sono pertanto associati diversi URI in aggiunta a quelli a cui si `e fatto riferimento prima e che indicano la risorsa vera e propria; ognuno di questi nuovi indirizzi indica infatti specifiche rappresentazioni documentali. In altre parole, deve essere possibile ottenere la descrizione di ogni risorsa presente nel dataset digitandone l’URI relativo all’interno di un web browser.

L’attivit`a appena descritta rappresenta una delle metodologie di base per l’accesso e la navigazione dei dati presenti all’interno di in una sorgente pub- blicata nel Linked Data. Affinch´e i dati di OpenERCH siano raggiungibili e consultabili via web, essi sono mantenuti all’interno di una sorta di raccogli- tore semantico dei dati, chiamato RDF Store, che si occupa di memorizzare e mantenere le informazioni, analogamente a quello che fa un DBMS. Affinch´e tali dati siano consultabili fornendo la propria rappresentazione documentale, `e stata necessaria la creazione di un’applicazione web che si occupi di recu- perare e fornire tali documenti. Ci`o mette in evidenza come l’attivit`a svolta da OpenERCH, e in generale quanto richiesto per rendere delle informazioni disponibili nel Web of Data, non si limiti alla sola attivit`a di conversione ma anche alla realizzazione di quanto necessario per ottemperare ai principi del Linked Data.

Gli URI delle specifiche rappresentazioni delle risorse possono essere ottenuti a partire dall’indirizzo di identificazione della risorsa, e aggiungendo la tipolo- gia di documento desiderata. Per ottenere, ad esempio, un documento HTML che descrive la risorsa relativa al Museo Civico ‘Il Correggio’ `e possibile utiliz- zare l’URI ‘http://dominioIBC/resource/Museo Civico Il Correggio/html ’, ot- tenendo, tramite l’inserimento di tale indirizzo all’interno del browser, un risultato come quello proposto in figura 3.2. Come si pu`o notare, tale rappre- sentazione mette in evidenza tutte le relazioni che la risorsa indicata possiede con altre risorse presenti nel sistema, fornendo quindi una completa descri-

zione delle caratteristiche del museo presenti nel catalogo. Cliccando su altre eventuali risorse oggetto delle relazioni indicate, si ottiene la loro descrizione. Tramite l’URI ‘http://dominioIBC/resource/Museo Civico Il Correggio/rdf ’ `e possibile invece ottenere un documento RDF contenente tutti gli statement in cui compare la risorsa indicata; oltre alla serializzazione in XML (conside- rata come il modello di rappresentazione RDF standard), tali informazioni possono essere ottenute anche in altri formati di serializzazione (Turtle, N3, ecc.). Tramite queste attivit`a `e possibile, in definitiva, ottenere la descri- zione dei dati in diverse tipologie a seconda delle esigenze e della natura del richiedente (un essere umano sar`a sicuramente pi`u interessato alla rappresen- tazione HTML, mentre un agente automatico sar`a in grado di comprendere pi`u facilmente quella in RDF). Dalla figura 3.2 si pu`o notare come la de- scrizione degli oggetti in OpenERCH differisca in modo sostanziale da quella ottenibile, ad esempio, nel sito di Samira. Entrambe sono pensate per l’es- sere umano, tuttavia esse sono state create per esigenze diverse: mentre la seconda propone una descrizione testuale delle varie caratteristiche degli og- getti, l’altra permette di ottenere, in un formato pi`u comprensibile e leggibile rispetto all’RDF, la descrizione formale di tali oggetti aderente all’ontologia CIDOC-CRM e nella forma a grafo tipica del Semantic Web. Quest’ultima pu`o essere utile, ad esempio, per chi intende navigare tra le risorse presenti nel dataset, eventualmente per utilizzarle successivamente per lo sviluppo di qualche applicazione o per correlarle con quelle presenti in una propria sor- gente dati.

I principi del Linked Data richiedono che le informazioni, oltre ad essere descritte nei modi appena delineati, siano accessibili tramite le tecnologie standard proposte dal Semantic Web, facendo riferimento in particolare ai linguaggi RDF e SPARQL. Il primo rappresenta il linguaggio di base con cui i dati sono descritti e memorizzati in OpenERCH; per ottemperare a tali principi il sistema permette inoltre di accedere ai dati anche tramite delle interrogazioni SPARQL. A tale scopo il sistema mette a disposizione uno SPARQL Endpoint, ossia una sorta di servizio, conforme al protocol-

3.3 Attivit`a di modellazione e conversione semantica dei dati 53

Figura 3.2: Esempio di rappresentazione in HTML delle informazioni pre- senti nel sistema relative alla risorsa che rappresenta il museo del prosciutto di Parma

lo proposto dal Semantic Web, che `e in grado di accettare delle richieste di interrogazione in linguaggio SPARQL restituendone gli eventuali risulta- ti. OpenERCH accetta tutte le tipologie di query possibili e permette di ottenere i risultati in diversi formati. Le richieste SPARQL possono essere effettuate anche attraverso una semplice interfaccia web, creata apposita- mente, tramite la quale, come mostrato in figura 3.3, `e possibile inserire la propria interrogazione, scegliendo lo specifico linguaggio (oltre a SPARQL

Figura 3.3: Interfaccia web proposta da OpenERCH per effettuare interrogazioni in SPARQL.

`e possibile utilizzare linguaggi proprietari simili) e il formato di ritorno dei risultati. In particolare `e possibile scegliere l’HTML se si intende ottenere una visualizzazione dei risultati direttamente nella pagina in forma tabella- re (come mostrato in figura 3.3), oppure specifiche serializzazioni RDF per ottenere il relativo documento con i risultati. I formati di ritorno cambia- no automaticamente a seconda della tipologia di query inserita nell’apposita area. Ovviamente le interrogazioni possono essere effettuate anche senza fare riferimento a tale interfaccia grafica, interrogando l’endpoint SPARQL tra- mite richieste HTTP o tramite linguaggi di programmazione, utilizzando le funzioni messe a disposizione da tutte le librerie per il Semantic Web. L’accesso ai dati tramite l’utilizzo di interrogazioni SPARQL rappresenta un metodo alternativo per visualizzare le informazioni di interesse rispetto a quello effettuato tramite la deferenziazione degli URI prima descritto. Que- st’ultimo pu`o essere utilizzato, ad esempio, per ottenere la descrizione com-

3.3 Attivit`a di modellazione e conversione semantica dei dati 55

pleta di una risorsa e per comprendere quindi come questa `e rappresentata, ottenendo informazioni utili su come strutturare eventuali interrogazioni. La creazione di query richiede infatti una conoscenza precisa del modo in cui i dati sono descritti, e quindi dell’ontologia utilizzata, ma risulta un meccani- smo molto potente per filtrare e individuare precisamente le informazioni di interesse. Tramite specifiche interrogazioni `e possibile ottenere, ad esempio, tutti i musei che contengono oggetti di artisti nati in un certo anno piut- tosto che le citt`a in cui sono presenti edifici storici che contengono oggetti d’arte astratta e sono gestiti da un privato. L’individuazione di informazione cos`ı precisa risulta, in questo modo, molto pi`u semplice ed efficace rispetto a quella ottenibile basandosi sui meccnismi standard del web costruiti sulla corrispondenza di termini e parole chiave.

Documenti correlati