1
INTRODUZIONE
La rivoluzione digitale è ormai una realtà in continuo divenire, ma che inesorabilmente comincia a consolidarsi. La schiera degli attuali trentenni è considerata la prima generazione di “Nativi Digitali”. Ciononostante anche chi non si sia trovato nei primissimi anni della propria vita a contatto con personal computer, tablet e smartphone è ormai irrimediabilmente
“schiavo” delle nuove tecnologie.
Siamo ben consapevoli che il valore della cultura e della conoscenza, trasmessa da secoli - dapprima oralmente - in forma scritta attraverso supporti fisici sia imprescindibile, nonostante ciò bisogna considerare come nel caso dei supporti vi sia stata una trasformazione e un’evoluzione in base alle esigenze del luogo e del periodo. Dalle tavolette in argilla mesopotamiche, passando per i papiri egizi, dalla pergamena alla carta, attualmente il supporto digitale rappresenta una valida alternativa, in termini di efficacia di diffusione, abbattimento dei costi, impatto ambientale ecc.
E’ innegabile, al giorno d’oggi, non accorgersi di quanto il digitale abbia velocizzato non solo la comunicazione, la condivisione “social” di contenuti e stati d’animo. A questo proposito esistono veri e propri settori di ricerca nell’ambito del marketing - dalla sentiment analysis ai big data -che analizzano i grossi flussi di dati che attraversano il Web ogni giorno, cercando di captare le preferenze e i gusti degli utenti.
Se le aziende e il settore privato hanno sin da subito sfruttato l’opportunità di analisi offerta dal Web è necessario che il settore pubblico, la ricerca e il
2
mondo accademico non restino relegati ad un reazionarismo che talvolta ostacola solamente l’innovazione.
Ci troviamo a vivere nell’epoca della crisi, ma anche dell’organizzazione dal basso che si concretizza più facilmente grazie alla creazione di grosse piattaforme digitali. E’ possibile autofinanziare progetti con l’aiuto della
“folla” grazie al crowdfunding, si creano intere enciclopedie universali con il crowdsourcing volontario, si diffonde la cultura dello sharing attraverso portali che ci permettono di condividere viaggi in auto, case, cene e quant’altro, a prezzi contenuti.
Partendo quindi da questi presupposti è importante sottolineare che la cultura della condivisione e la condivisione della cultura debbano muoversi di pari passo. Studi applicati sul Knowledge Management (KM) e sulle cd.
Comunità di Pratica (CdP) hanno comprovato che in ambiente lavorativo la produttività e la qualità aumentano in maniera direttamente proporzionale alla collaborazione tra individui che condividono le stesse mansioni, lo stesso know how e know that. Un progetto vincente molto spesso è realizzato da un gruppo, un gruppo altamente specializzato e formato che possa trasmettere al proprio interno la quantità di conoscenza tacita che si esprime lavorando fianco a fianco.
Questi concetti applicati al mondo dell’archeologia possono essere riutilizzati in maniera calzante, in quanto un team archeologico rappresenta una CdP per eccellenza, la capacità di lavorare in gruppo risulta fondamentale e solo attraverso la collaborazione e l’affiatamento è possibile raggiungere dei risultati. Che si parta dall’attività sul campo a quella importantissima della ricerca, ciò che resta del lavoro distruttivo dello scavatore è il dato.
Il dato che si pone alla base della piramide della conoscenza, postulata in ambito di KM, che necessita di una formalizzazione che ne permetta il riuso. Tali argomentazioni troveranno spazio all’interno del primo capitolo,
3
dove cercheremo di porre i presupposti teorici per i formalismi più prettamente informatici presentati nei capitoli successivi.
Nel secondo capitolo, infatti, tratteremo l’argomento del Web Semantico.
Partendo dall’analisi del Web 2.0, definito Web of Documents, ancora altamente caotico in cui il linguaggio HTML non aiuta nella fase di information retrieval, si esporrano le istanze del Web 3.0, così come lo ha progettato e voluto dalla prima ora lo stesso inventore del Web, Mr. Tim Berners-Lee. Un Web of Data che somiglierà quindi ad un grande database di dati grezzi e standardizzati, altamente qualificati contenuti in archivi interoperabili.
Per far in modo che ciò avvenga è necessario il passaggio fondamentale riguardante gli standard raccomandati dal World Wide Web Consortium (W3C) che negli anni fornisce linee-guida e formalismi adatti alla unificazione dei formati. Saranno infatti presentati il linguaggio XML, RDF e OWL come pilastri del Semantic Web. La questione dei linked open data sarà affrontata per comprendere come ottimizzare e rendere integrabili i dati esposti on-line.
Nel terzo capitolo ci addentriamo più prettamente nello scenario archeologico, trattando di metadati, ontologie e thesauri, attraverso i formalismi realizzati ad hoc per il settore.
Gli schemi di metadati, performati a seconda delle esigenze, costituiscono un tassello importante sia per il sistema di tagging e di indicizzazione, forniscono inoltre delle informazioni importantissime sui processi di acquisizione dei dati e su come essi vengono processati. Nell’ambito archeologico, con la distruzione delle evidenze e la produzione di dati come unico materiale informativo “tangibile” lasciare una traccia sulla strumentazione utilizzata per il rilevamento, sulle scelte effettuate durante la fase di acquisizione, elaborazione, post-processing può risultare molto utile in termini di comprensione e riutilizzo del dato da parte di terzi. In ambito quindi collaborativo fornire i metadati è di fondamentale
4
importanza. Analogamente parlando di ontologie e di CIDOC CRM daremo un’idea generale dei processi di formalizzazione della conoscenza, concettualizzazione e delle relazioni tra concetti, che nell’ambito soprattutto dell’Intelligenza Artificiale forniscono la “materia prima” per l’elaborazione automatica da parte di una macchina. Agganciandoci a strumenti terminologici come thesauri, soggettari e tassonomie è infine possibile creare standard di tipo linguistico che forniscano una piattaforma comune da cui attingere termini per la classificazione.
Grazie a tali strumenti si favorisce inoltre la long-term preservation, superando il problema dell’obsolescenza dei formati fornendo dati machine readable.
I contenitori di dati, archivi e DL, saranno pertanto approfonditi nel quarto capitolo, prestando particolare attenzione alle esperienze nazionali e internazionali di maggior successo.
I progetti “colossali” di biblioteche per i beni culturali, come Europeana e CulturaItalia per il patrimonio nostrano, passando per repositories archeologici come ADS e lo STARCrepository, fino ad arrivare a progetti che promuovono la collaborazione e l’integrazione di infrastrutture già esistenti, come ARIADNE.
Parte della lavorazione di questo capitolo, in particolare l’approfondimento del paragrafo sullo STARCrepository nasce da una esperienza diretta effettuata nella struttura del The Cyprus Institute, dove grazie alla collaborazione con importanti ricercatori italiani è stato possibile approcciarsi a queste tematiche e capire come l’eccellenza della ricerca nostrana raggiunga risultati importanti anche all’estero.
Infine, nel quinto capitolo, si presenterà un case-study nato in seno al Laboratorio Mappa dell’Università di Pisa, applicato all’archivio digitale MOD – MappaOpenData. Sulla base delle esperienze e dei formalismi presentati nella parte più propriamente teorica del lavoro di tesi, sarà presentata una proposta di modello-dati che possa supportare la mole di
5
informazioni presenti nell’archivio. Attraverso l’utilizzo di software open source e prendendo a modello le best practices del settore si avrà la produzione di un file RDF che rappresenta una concettualizzazione di un thesaurus per il MOD, integrato ai campi dello schema Dublin Core Metadata Initiative per una proposta di standardizzazione in fieri, che possa essere da input per la versione 2.0 del portale. Ricerca a faccette, geographic search e altri spunti potranno servire per l’ottimizzazione e per il data retrieval.