• Non ci sono risultati.

RDF: Il futuro del web in una tripla

2. Caratteristiche generali del web semantico

2.1. RDF: Il futuro del web in una tripla

Al web semantico servono, dunque, relazioni tra i dati capaci di contenere dei significati attraverso una metadatazione che porti dentro XML la semantica che ad esso manca. In tal senso il data-model di RDF consente di creare collegamenti tipizzati (typed) tra le cose, ovvero esplicita la natura del collegamento dotandolo di un significato: il legame non è più costruito a partire da documenti testuali ma dai dati stessi. In tal modo ogni risorsa è collegata attraverso un nodo ad un’altra (Figura 1.3.5).

RDF sta alla base del Linked Data modellando le informazioni attraverso un sistema di triple costituite da soggetto, predicato, oggetto.

Il Soggetto (Resources): Le risorse sono individuate tramite URI e rappresentano qualsiasi oggetto direttamente o indirettamente accessibile via web.

Predicato (Properties): si tratta di un aspetto specifico, una caratteristica, un attributo, o una relazione utilizzata per descrivere una risorsa (il soggetto). Le proprietà hanno significati specifici e definiscono i valori ammissibili, i tipi di risorse che può descrivere, e le sue relazioni con altre proprietà. É espresso da un URI che proviene da vocabolari controllati.

Oggetto (Value): Quando le proprietà sono associate alle risorse identificano e assumono dei valori. Il valore è riferito alla risorsa o una stringa di caratteri.

Lo Statement o “asserti”: è una tripla composta da un soggetto, un predicato e un oggetto. L’oggetto di uno statement può essere un’espressione oppure un’altra risorsa. (Signore, 2003, Iacono, 2014).

Immaginiamo dunque di voler descrivere un’asserzione, quale ad esempio John Ronald Reuel Tolkien (s) è autore di (p) Il Signore degli Anelli (o):

John%Ronald%Reuel%Tolkien È%autore%di% Il%Signore%degli%Anelli%

Sogge6o%% Risorsa Predicato%% Proprietà Ogge6o%% Valore%

Figura 1.3.5 Rappresentazione del Web Of Data attraverso i collegamenti tipizzati RDF. Fonte: Linked Date per Biblioteche Musei e Archivi (Guerrini, Possemato,

Le triple RDF possono anche essere espresse attraverso un grafo:

Al fine di pubblicare dati in RDF è necessario l’utilizzo di una sintassi e di un vocabolario controllato, in quanto RDF suggerisce soltanto le schema con cui le asserzioni possono essere organizzate. La sintassi su cui si basa RDF è l’XML che consente allo schema di triple di adottare formati di “serializzazione”, ovvero una rappresentazione testuale che consente di pubblicare Linked Data sul web. Il vocabolario, un elemento fondamentale del web semantico, è fornito da RDFSchema , un linguaggio dichiarativo raccomandato dal 121 consorzio W3C. Facendo riferimento all’esempio subito sopra riportato, l’asserzione John Ronald Reuel Tolkien è autore di Il Signore degli anelli risulterebbe rappresentato RDF/XML e RDFSchema così descritto:

Dalle pagine web del Consorzio è possibile leggere il documento relativo al RDFSchema, realizzato da RDF

121

Working Group, cioè del gruppo di lavoro che fino al 1 luglio 2014 ha lavorato all’aggiornamento di RDF. Il

documento, aggiornato al 2014, mostra oltre alla definizione del vocabolario per RDF anche gli elementi base per la creazione di dati in RDF: «RDF Schema provides a data-modelling vocabulary for RDF data. It is

complemented by several companion documents which describe the basic concepts and abstract syntax of RDF, the formal semantics of RDF, and various concrete syntaxes for RDF, such as Turtle, TriG, and JSON-LD. RDF Schema is a semantic exstention of RDF. It provides mechanisms for describing groups of related resources and the relationships between these resources. RDF Schema is written in RDF using the terms described in this document. These resources are used to determine characteristics of other resources, such as the domains and ranges of properties. […].

The RDF Schema class and property system is similar to the type systems of object-oriented programming languages such as Java. RDF Schema differs from many such systems in that instead of defining a class in terms of the properties its instances may have, RDF Schema describes properties in terms of the classes of resource to which they apply. This is the role of the domain and range mechanisms described in this specification. […]. This specification does not attempt to enumerate all the possible forms of representing the meaning of RDF classes and properties. Instead, the RDF Schema strategy is to acknowledge that there are many techniques through which the meaning of classes and properties can be described. Richer vocabulary or 'ontology' languages such as OWL, inference rule languages and other formalisms (for example temporal logics) will each contribute to our ability to capture meaningful generalizations about data in the Web.

The language defined in this specification consists of a collection of RDF resources that can be used to describe other RDF resources in application-specific RDF vocabularies. […]» <https://www.w3.org/TR/rdf-schema/,

2014>

Figura 1.3.6 Esempio di tripla rappresentata in forma di grafo.

J o h n% R o n a l d% R e u e l% Tolkien%

Il%Signore%degli%Anelli% È%autore%di%

<rdf:Description rdf:about=“http://sitoweb/J._R._R._Tolkien> <name xml:lang=“en”> John Ronald Reuel Tolkien </name>

<isAuthorOf rdf:resource=“http//sitoweb/123”> </rdf:Description>

<rdf:Description rdf:about=“http://sitoweb/Il_Signore_degli_Anelli”> <type xml:lang=“ita”>Libro</ type> <title>Il Signore degli Anelli </title></rdf:description>

Gli elementi delle triple possono collegarsi ad elementi di altre triple costituendo dei reticoli tramite relazioni significative, che poi è l’essenza dei Linked Data. Le relazioni tra le parti della vengono definite qualificate poiché esprimono la tipologia di relazione tra le entità. É possibile includere dei link nei soggetti così come negli oggetti delle triple: i “Link RDF esterni” o interlink, che rimandano a dataset disponibili sul web e fortemente stabili come le risorse contenute ad esempio in DBpedia o in Geonames (Figura 1.3.7). Questo rimando permette al primo link di essere collegato al secondo e di fornire maggiori informazioni sull’entità che abbiamo categorizzato, qualificando la relazione. Si innesca, o meglio si innescherebbe, un sistema virtuoso a catena che permetterebbe la dereferenziazione degli URI per la descrizione della risorsa che a sua volta può contenere altri link RDF, i quali possono essere dereferenziati e così via. É dunque intuitivo comprendere come il sistema sia una concatenazione di legami, i Linked Data, che consentono di passare da una risorsa a un’altra e a un’altra ancora, navigando in un reticolo virtuale (Guerrini, Possemato, 2015).

John%Ronald%Reuel%Tolkien% È%autore%di% Il%Signore%degli%Anelli%

http://dbpedia.org/page/J._R._R._Tolkien http://dbpedia.org/page/The_Lord_of_the_Rings

db Persone db Opere

Figura 1.3.7 Schema di collegamento delle risorse che compongono la tripla appartenenti anche a dataset disponibili nel web. Nell’esempio di fa riferimento alle risorse contenute in Dbpedia

Attraverso RDF e RDF/XML è possibile costruire qualunque tipo di affermazione: «J. R. R. Tolkien era sottotenente inglese»; «J.R.R. Tolkien fu un docente di filologia»; «Barbalbero è un personaggio del Signore degli Anelli» e dall’insieme di queste asserzioni dovremmo desumere conoscenza, ad esempio che «un sottotenente inglese ha inventato il personaggio Barbalbero». In realtà RDF non consente di poter svolgere tali operazione con i dati, ovvero non è possibile attraverso questi soli strumenti esercitare inferenze quali ad esempio la sussunzione o la classificazione. Ricorrendo di nuovo all’esempio dell’asserzione “John Ronald Reuel Tolkien è autore di Il Signore degli Anelli” attraverso RDF non è possibile desumere che Il Signore degli Anelli sia un libro di John Ronald Reuel Tolkien, né che l’autore inglese sia l’inventore di Barbalbero. Con gli strumenti fino ad ora illustrati non siamo ancora in grado di compiere inferenze o applicare procedimenti logici utili a migliorare le capacità di ricerca del web.

Per permettere alla macchina inferenze di questo tipo sono necessari vocabolari e ontologie, indispensabili a creare dataset di collezione di risorse e grafi facenti riferimento allo stesso dominio o accomunati da una qualche caratteristica identificabili tramite URI (Iacono, 2014). I vocabolari permettono ai metadati di acquisire un valore specifico selezionato in un insieme di valori, rispondendo alla necessità di univocità semantica. La scelta del vocabolario è legata alla sua gerarchia di riferimento, uno schema in cui vengono definite classi o categorie all’interno delle quali i termini siano organizzati secondo relazioni di specificità o categorie (Tomasi, 2010, Iacono 2014). Obiettivo della tassonomia è la classificazione delle informazioni che però non ne esplicita la natura dei collegamenti. I collegamenti tra gli oggetti vengono descritti dai thesauri, grazie ai quali avviene anche il superamento dei problemi legati al linguaggio naturale. Nell’ambito delle biblioteche digitali esempi famosi e molto diffusi di vocabolari sono ad esempio Library of Congress Subject Headings (LCSH) e Library Congress Classification (LCC).