• Non ci sono risultati.

Sin dalla sua nascita ad opera di Tim Berners Lee (1989) [BL89], il Web `e stato oggetto di una evoluzione continua con fasi di sviluppo che oggi vengono denominate Web 1.0 e Web 2.0.

Tuttavia, nonostante si sia verificata una modifica dell’interazione tra l’uten- te e il Web tale da giustificare la classificazione citata, non `e mai cambiato il paradigma alla base dell’organizzazione dell’informazione, il cosiddetto

1.4 Read-Write Web of Data 9

ipertesto; esso pu`o essere considerato come un insieme di documenti colle- gati tra loro tramite “ancore” all’interno dei documenti stessi, i cosiddetti collegamenti ipertestuali.

Pertanto si pu`o dire che il Web `e costituito, in ultima analisi, da una grande quantit`a di documenti collegati fra loro, i quali risultano essere il mezzo principale per convogliare informazioni su di esso. Tuttavia, tali documenti non sono strutturati ovvero permettono la lettura e l’estrapolazione delle informazioni solo da parte di un utente umano e non da parte di un software, poich´e non sono dotati di un qualsiasi tipo di struttura predefinita.

Quest’ultima possibilit`a risulta acquisire un interesse crescente, come dimo- strato ad esempio dalla recente diffusione delle Web API, le quali permettono alle applicazioni di interagire con i dati contenuti in sorgenti diverse tramite il Web, come avviene ad esempio per le API di Google Maps [Goo12b]. Tuttavia si `e ancora lontani dal realizzare un Web che possa essere gestito in modo automatico dalle applicazioni, in analogia a quanto viene fatto dagli esseri umani per i documenti; le Web API ad esempio sono semplicemente soluzioni realizzate ad-hoc per lo specifico servizio che si intende integrare. Si pu`o concludere pertanto che allo stato attuale `e ancora lontana dal con- cretizzarsi all’interno del panorama Web la possibilit`a di liberare i grandi potenziali informativi presenti al suo interno.

In tale direzione, lo stesso Tim Berners-Lee, introdusse nel 2001 il termine “Semantic Web” per indicare la sua visione di quello che avrebbe dovuto essere il Web del futuro, ovvero un’estensione del Web attuale in cui “verr`a data una struttura al contenuto significativo delle pagine” [BLHL01]. Il primo periodo di studi sul Semantic Web (dal 2001 al 2007 circa) fu ca- ratterizzato dalla fondamentale importanza delle competenze sviluppate in molti anni nell’ambito di ricerca relativo all’Intelligenza Artificiale, concen- trandosi sul problema dell’inferenza, della rappresentazione della conoscenza mediante ontologie e della codifica delle stesse tramite il linguaggio RDF 6 [KC04]. Nonostante l’intenso lavoro a livello mondiale, i risultati ottenu- ti non condussero alla effettiva realizzazione di un Semantic Web a livello globale, ma ad una serie di “semantic web locali” che costituivano delle soluzioni idonee per contesti particolari all’interno di un ambito chiuso. Secondo lo stesso Berners-Lee tale approccio si rivel`o insoddisfacente poich´e fu trascurato l’aspetto Web del problema, per concentrarsi sul solo lato Semantic [Mac09].

Tali difficolt`a condussero alla nascita di una serie di riflessioni in seno alla comunit`a scientifica, che portarono dapprima ad una critica sull’approccio adottato [SHBL06] ed in seguito ad un cambio della prospettiva con cui affrontare il problema.

6Il linguaggio RDF (Resource Description Framework ) `e illustrato all’interno del

Questo nuovo filone di ricerca, attivo dal 2007 sino ad oggi, ha raggiunto risultati concreti pi`u consistenti rispetto al lavoro svolto in precedenza, so- prattutto grazie al fatto di avere riportato l’attenzione sullo spazio globale di dati fittamente interconnessi, integrati a partire dal basso. In tal modo diviene possibile la convergenza su alcuni concetti condivisi (a partire dall’e- terogenea miriade di entit`a di cui ogni organizzazione dispone per la gestione del proprio dominio di interesse) tramite l’uso di opportuni collegamenti (i cosiddetti owl:sameAs [BM12]).

Questo nuovo filone di ricerca si `e inoltre focalizzato sull’importanza di un cambio di paradigma nei confronti delle informazioni sul Web, attraverso il passaggio dall’attuale “Web of Documents” al cosiddetto “Web of Data”. Lo stesso inventore del Web, nel 2006 riconobbe la necessit`a di indicare alcuni capisaldi per la realizzazione di un effettivo Semantic Web globale, che si concretizzarono nei “Linked Data Principles” [BL06], ovvero delle regole per definire la struttura dei dati da pubblicare sul Web come Linked Data. Tali principi sono:

1. usare gli URI per assegnare nomi alle cose;

2. usare URI HTTP di modo che le persone possano cercare questi nomi; 3. quando qualcuno visita un URI, fornire informazioni utili mediante gli

standard;

4. includere link ad altri URI, di modo che sia possibile scoprire altro. Il primo principio afferma la necessit`a di utilizzare URI 7 come nomi per identificare le “cose”; questo ultimo termine non `e erroneo, ma vuole espri- mere la volont`a di utilizzare i principi Linked Data come regole di pubbli- cazione sia per le risorse informative (ovvero le informazioni “pure” come un articolo scientifico, o una pagina web) sia per le cosiddette risorse non informative (ossia tutto ci`o che non `e informazione di per s´e, come un’auto, una citt`a)8.

Il secondo principio fornisce l’indicazione di utilizzare URI HTTP, tenendo conto dell’esistenza di una infrastruttura funzionante per la gestione di tali identificatori. Per quanto riguarda le risorse non informative, il Technical Architecture Group del W3C suggerisce l’uso del codice di stato HTTP 303 See Other, corrispondente alla dereferenziazione verso l’URI di una risorsa informativa contenente una rappresentazione della risorsa non informativa in questione.

7Un URI (Uniform Resource Identifier ) [BLFM05] `e una stringa che identifica univo-

camente una risorsa generica come un documento, un’immagine, ecc. . . Gli URI possono

rendere disponibili risorse per vari protocolli di rete, tra i quali `e incluso anche HTTP.

8Risulta normale rappresentare risorse non informative con una o pi`u risorse

1.4 Read-Write Web of Data 11

Il terzo principio (detto “follow your nose”) indica la necessit`a di fornire informazioni utili per la dereferenziazione di un URI in particolare mediante l’adozione degli standard RDF [KC04] e SPARQL9 [PS08].

Il quarto principio, infine, evidenzia la necessit`a di realizzare collegamenti fra gli URI in modo da poter navigare da una risorsa ad un’altra, poich´e si desidera realizzare dei Linked Data, ovvero costruire una ragnatela mon- diale di dati che possa essere navigata per mezzo di apposite applicazioni, cos`ı come avviene oggi con la navigazione delle pagine Web attraverso i collegamenti ipertestuali.

Dai suddetti principi `e nato il “Linking Open Data (LOD) project” [BCH07], che ha portato alla realizzazione di uno spazio globale di dati interconnessi, la cosiddetta nuvola LOD, illustrata in figura 1.2, costituita da milioni di triple RDF.

Tale successo ha provocato un grande entusiasmo in seguito al quale lo stesso Berners Lee afferm`o che il “Web of Data `e il Semantic Web fatto bene”, ovvero che si era finalmente giunti ad una base infrastrutturale su cui sarebbe stato possibile implementare le applicazioni ideate per il Semantic Web nel corso della prima fase della ricerca.

Tuttavia, nonostante l’evidenza di tali risultati, il Web of Data `e rimasto tema dell’ambito della ricerca scientifica senza riuscire ad entrare nell’uso quotidiano da parte dell’uomo comune, come dimostra l’assoluta carenza di applicazioni diffuse su larga scala che sfruttino tale tecnologia. Questo insuccesso `e dovuto soprattutto al fatto che il Web of Data attuale `e stato realizzato utilizzando le tecnologie del Web corrente, dove i dati possono essere dereferenziati, ma non `e possibile manipolarli in modo uniforme. Il processo di pubblicazione `e infatti esterno alla struttura stessa del Web, e sebbene il tipico utente Web 2.0 abbia la sensazione di scrivere utilizzando il Web stesso, questo `e in realt`a una caratteristica legata a contesti locali e chiusi, i cosiddetti walled-garden.

La necessit`a di manipolare ed elaborare i dati risulta essere quindi un aspetto molto importante per il Web of Data e gli sforzi della ricerca scientifica si stanno concentrando in questa direzione, mirando a realizzare un vero Read-Write Web of Data, nella cui struttura il processo di scrittura sia inserito direttamente; le soluzioni attualmente proposte soffrono tuttavia di mancanza di uniformit`a [HKO+09, BL09].

La ricerca scientifica internazionale ha rivolto la propria attenzione ai pro- blemi tecnici legati alla realizzazione di applicazioni che manipolano i dati, trascurando tuttavia gli aspetti legati all’utilizzo degli stessi. In particolare non sono stati tenuti in considerazione alcuni importanti campi applicativi, quali le applicazioni enterprise o l’e-Government 10; entrambi i settori ne-

9

Il linguaggio SPARQL `e illustrato all’interno del paragrafo 1.5.

10

L’e-Government `e uno dei settori su cui si concentra attualmente l’attenzione dei go-

verni di alcuni paesi anglosassoni, come dimostrato dal movimento Open Data, presentato al capitolo 2.