• Non ci sono risultati.

Gli istituti di memoria: verso le Digital Libraries

4. I Luoghi

4.1. Gli istituti di memoria: verso le Digital Libraries

L’archivio si costituisce solitamente come atto spontaneo da parte di una persona fisica o giuridica pubblica o 136

privata che per lo svolgimento di una data attività produce un nucleo di raccolta di documenti. Ogni documento è dunque legato all’altro da un vincolo originario, necessario e determinato (Romiti, 2011). Per il catalogo dei libri il vincolo del legame non è dato dall’atto della produzione del documento, quanto piuttosto dal suo contenuto.

Negli ultimi anni i progetti, istituzionali e non, di digitalizzazione delle raccolte documentaria hanno puntato non solo alla conservazione su altri supporti di documenti meno sensibili alla corruzione dovuta al tempo (nonché alla sempre più rara possibilità di fruizione dovuta alla rapida obsolescenza dei supporti di trasmissione), ma anche alla messa on line che prevede in alcuni casi la condivisione tra diverse piattaforme. Allora cosa si intende quando ci riferiamo alle biblioteche, ai musei o gli archivi digitali? La digitalizzazione di una raccolta museale, archivistica o bibliotecaria, non è da intendersi come la produzione di “doppioni”, ma altresì di rappresentazioni, creazioni di nuovi oggetti con regole e possibilità diverse, ma uguali sul piano del contenuto agli originali “analogici”. Pensiamo alla riproduzione digitale di un oggetto custodito in un museo, ad esempio un cratere attico: ma cosa cambia nell’esperienza del fruitore? Se lo stesso oggetto digitale potrà essere scomposto, ingrandito, analizzato nei dettagli ma soprattutto potrà contenere informazioni a loro volta manipolabili e condivisibili, allora avremo fornito “un valore aggiunto”, non solo all’oggetto reale, analogico, custodito dentro il museo, ma all’esperienza conoscitiva dell’utente in remoto. «la digitalizzazione non va considerata soltanto come il procedimento tecnico di trasformazione in codice binario delle opere, ma come un modo di collegare in uno stesso codice le conoscenze sulle opere alla loro riproduzione attraverso una sceneggiatura dei contenuti, dei link e di tutte le interazioni attraverso le quali si vede che la trasmissione di tale conoscenza risulti efficace ai fini della diffusione, della ricerca o della formazione» (Sbrilli, 2001). Il passaggio appena descritto ci pare indispensabile per comprendere il cambiamento di filosofia che in qualche maniere lega il web semantico agli istituti di memoria: la mediazione delle informazioni è consentita dai dati, dalle informazioni fornite all’utente per consentirgli sempre e comunque di ricostruire il contesto di un tale documento archivistico, libro manoscritto, cratere attico. «L’obiettivo in questo senso, è quello di mettere a punto risorse che siano in grado di offrire agli utenti le stesse opportunità all’interno di ambienti e di modelli di circolazione delle informazioni profondamente diversi da quelli “fisici”, magari riflettendo sulle opportunità generate da determinate soluzioni tecnologiche in termini di semplificazione ed efficacia nel recupero delle informazioni. Il prerequisito essenziale è rappresentato dall’esigenza di ricostruire in maniera virtuale tutti gli elementi di contestualizzazione che garantiscono la mediazione.» (Valacchi, 2010). Il concetto di Digital Library137 si distingue da una collezione di documenti o di oggetti digitali on line proprio per l’organizzazione semantica e tematica

L’argomento relativo alle Digital Libraries meriterebbe un approfondimento maggiore che non può essere 137

affrontato in questo lavoro perché esula dai fini stessi della ricerca. L’inserimento dell’argomento è funzionale per un discorso più ampio sulle Digital Humanities e sulle tecnologie semantiche in campo umanistico e sul ruolo sociale che le biblioteche, gli archivi e i musei rivestono nella società dell’informazione.

delle sue parti, questa organizzazione si manifesta tramite un apparato metainformativo (i metadati appunto). Tutto il resto è una collezione di documenti o “depositi testuali” più o meno disponibili sul WWW (Tomasi, 2008).

Abbiamo visto che gli obiettivi del del Semantic Web sono principalmente due: semplificare il recupero delle informazioni nel mare magnum del grande archivio di dati del WWW e permettere ai programmi (ad esempio ai motori di ricerca) di comprendere il significato dei documenti, «consentendo alle applicazioni di dialogare tra di loro, condividendo la funzione semantica del vocabolario in uso nei testi che circolano sul web» (Tomasi, 2008). I dati delle biblioteche, dei musei e degli archivi sono preziosi, innanzitutto perché già esistenti vista la tradizione che la prassi della catalogazione informatica ha rivestivo nel corso del XX secolo, seppur con linguaggi e standard non del tutto idonei alle funzionalità del web, e quindi utilizzabili, e non in ultimo perché gli istituti di cultura non possono e non vogliono tirarsi indietro rispetto al ruolo locale che rivestono, scalabile in termini di comunità virtuale. «L’archivio digitale espande e reticola in modo innovativo le memorie depositarie nei repertori […] “analogici” in rapporto a esigenze di fruizione distribuite su scala sovranazionale. L’archivio digitale rende percepibile - e soprattutto attivo - in maniera diretta il nodo fra globale e locale» (Frezza, 2008).

In principio erano i metadati, utilizzati da sempre nell’ambito della catalogazione e degli archivi in quanto descrizione dei dati sui dati, quali informazioni vicarie (Guerrini, Possemato, 2015); essi non permettevano alla macchina di comprendere il significato del dato <titolo> come abbiamo già visto. La migrazione verso sistemi informatizzati ha provocato il bisogno di avere un formato per la rappresentazione di metadati per gli archivi adottando lo standard Encoding Archival Description (EAD) che era stato pensato per SGML e poi ristrutturato per XML, standard che può essere utilizzato, come spesso avviene, anche per oggetti manoscritti, fondi manoscritti o museali (Tomasi, 2008). In ambito bibliotecario nasceva MARC, molto ricco dal punto di vista dell’espressività e pienamente concentrato sul record come si mostra in Figura 1.3.11. La grande mole di informazioni che MARC si porta dietro, però, è quasi del tutto inutilizzabile al di fuori del mondo bibliotecario per la

complessità delle informazioni138 e soprattutto viaggia in una direzione opposta agli standard del web tradizionale. Di fatto il contenuto dei record sono perduti o trattati come blocchi di testo dai browser. In nocciolo della questione è dunque proprio questo la missione della “digitalizzazione” delle informazioni catalografiche è stata eseguita egregiamente da MARC nei cataloghi OPAC ad esempio, ma l’utente, a cui in teoria il catalogo si riferisce, difficilmente nel web tradizionale entra in contatto con i suoi contenuti, perché la ricerca delle informazioni passa sempre dai motori di ricerca che non indicizzano le informazioni contenute nel cataloghi OPAC, almeno così è per il web tradizionale (Iacono, 2014).

Libraries exist to serve the present and future needs of a community of users. To do this well, they need to use the very best that technology has to offer. With the advent of the web, XML, portable computing, and other technological advances, libraries can become flexible, responsive organizations that serve their users in exciting new ways. Or not. If libraries cling to outdated standards, they will find it increasingly difficult to serve their clients as they expect and deserve.

To create standards that are both adequate for present needs and flexible enough to offer new opportunities, we should begin with the requirements of bibliographic description […] and devise an encoding standard that provides power and flexibility. This is clearly a huge undertaking and one that will take commitment from organizations [...]. (Tennant, 2002)

Per il web semantico il dati contenuti nei record in MARC divengono preziosi proprio per la loro ricchezza ma bisogna prima operare una sorta di riconversione con «gli stessi metadati codificati nei tag del record, tradotti in asserzioni, riconquistano il valore semantico originario, che diventa comprensibile e usabile da una macchina» (Guerrini, Possemato, 2015).

Marc è stato introdotto negli anni Sessanta e si caratterizza per campi di compilazione di record numerici 138

pienamente codificabili solo attraverso l’uso dei manuali; i campi non sono etichettati esplicitamente ma codificati con uno schema di numerazione che non può essere letto dall’uomo in quanto la sua sintassi è davvero complicata. Roy Tennant in un suo articolo ha sintetizzato quali sono i limiti attuali del formato MARC in

Granularity: i record appaiono eccessivamente carichi di informazioni provocando paradossalmente la perdita di

buona parte delle informazioni essenziali;

Extensibility and language: Marc rispondere alle esigenze delle singole biblioteche che hanno prodotto il

catalogo per cui i dataset creati spesso non sono utili né comprensibili in termini di informazioni a coloro che ne hanno bisogno;

Technical marginalization: la creazione di risorse chiuse che possono essere usate solo nel modo bibliotecario

Il centralismo del record in MARC pare dunque iniziare a vacillare in favore dell’utente perché «se gli utenti non troveranno i dati delle biblioteche liberamente accessibili nel web tenderanno ad ignorare le biblioteche e i sevizi da esse offerti» (Iacono, 2014). IFLA - The International Federation of Library Associations and Institutions - non parla più di record ma di dati bibliografici portando l’attenzione sull’interoperabilità dei sistemi cartografici degli istituti di memoria, genericamente i GLAM , ispirandosi agli standard del web semantico e 139

seguendo le linee guida dei Linked Data. Il modello FRBR (Functional Requirements for Bibliographic Records) licenziato da IFLA nel 1998 è uno schema concettuale che pone al centro le esigenze dell’utente perché mette in relazione tra le entità a cui sono associati degli attributi nei record catalografici, defindendo quali entità Opera, Manifestazione, Espressione

Con questo acronimo si intendono genericamente gli istituti culturali, Galleries Libraries Archivies and 139

Museums, che hanno aderito al movimento di liberalizzazione l’accesso delle proprie collezioni attraverso

pratiche innovative solitamente legate al mondo del digitale. Il termine è apparso per la prima volta nel 2003 in occasione nel titolo della conferenza annuale della Australian Society of Archivists ma è entrato nell’uso comune nel settore culturale soprattutto per i progetti portati aventi da Wikimedia con il Progetto GLAM seguito in Italia dal gruppo MAB - Musei Archivi e Biblioteche. Il progetto è interessante da diversi punti: innanzitutto per il ruolo che lo storico dell’arte, il bibliotecario, l’archivista inizia a rivestire in progetti bottom-up. L’esigenza di Wikipedia di essere riconosciuta e accreditata anche per la validità dei suoi contenuti (cfr Bennato, 2011) ha spinto la più famosa tra tutte le enciclopedie a chiedere la validazione e il supporto per la certificazione dell’affidabilità delle fonti presenti nelle sue voci a coloro che meglio conoscono alcuni i settori. D’altro canto forniscono un potente mezzo tecnologico a costo zero per la digitalizzazione delle risorse presententi nelle raccolte.

< https://it.wikipedia.org/wiki/Progetto:GLAM> < https://outreach.wikimedia.org/wiki/GLAM>

Figura 1.3.11 Esempio di scheda in Marc21 su una ricerca in OPAC del titolo “Il Signore degli Anelli” Fonte: OPAC SNB - Catalogo del Servizio Bibliotecario Nazionale

ecc (Figura 1.3.12). FRBR140 ha trovato la sua espressione nello standard catalografico RDA (Resource Description and Access). le prime sperimentazioni in RDA risalgono al 2010 anche se il suo rilascio ufficiale è solo del 2013 . 141

Si tratta di uno standard che descrive gli elementi essenziali delle risorse, fornendone anche l’accesso. É particolarmente interessante perché indirizzato, vista la sua natura, al dato in

Ispirato a FRBR è BIBFRAME - Bibliographic Framework che «attribuisce un grande rilievo 140

all’identificazione dei dati, richiama l’importanza dei vocabolari controllati, pone molta enfasi sulle relazioni tra le entità Functional Requirements for Bibliographic Records (FRBR). Il progetto prevede di assemblare i dati dell’attuale ‘risorsa MARC’ in una nuova architettura coerente, che consenta la catalogazione […] cooperativa a un livello più granulare. […] BIBFRAME si propone di distinguere tra con- tenuto concettuale e manifestazione fisica, cioè tra l’opera e l’istanza dell’opera; di identificare un’entità in maniera non ambigua e di evidenziare le relazioni tra le entità mostrando la natura della correlazione. Esso tiene particolarmente conto di RDA [..], evoluzione di AACR2 (AngloAmerican Cataloguing Rules, 2nd edition), nonché dei desiderata formulati da editori, librari, distributori e altri soggetti della filiera della comunicazione, i quali si sono interrogati sugli elementi descrittivi necessari affinché una risorsa sia riconosciuta nella sua unicità e consultata sulla base dei metadati. RDA, sul modello FRBR, focalizza l’attenzione sul piano concettuale, e quindi sull’opera, prescindendo dal supporto su cui essa è memorizzata e conservata. È proprio su questo livello di astrattezza che BIBFRAME si colloca in relazione a RDA, poiché ciò che è fondamentale è l’opera». (Guerrini, 2014)

Share Catalogue è un interessante progetto che unisce le biblioteche universitarie meridionali di Università 141

degli Studi di Napoli Federico II, Università degli Studi della Basilicata Università degli Studi del Sannio, Università degli Studi di Salerno Università degli Studi di Napoli Parthenope, Università degli Studi del Salento, Università degli Studi di Napoli L’Orientale. Le biblioteche universitarie pur mantenendo i propri cataloghi e i propri cataloghi d’ateneo, hanno “unificato” i dataset convertendo i formati MARC in RDF. Share Catalogue è di fatto una semplice piattaforma che permette all’utente la ricerca tramite autore o opera, ma la sua caratteristica è che i cataloghi sono organizzati secondo il data model BIBFRAME Linked Data. Il portale, quale unico punto di accesso al patrimonio delle risorse integrate, permette di ottimizzare tempi e raffinare modi dell'esperienza di ricerca, restituendo risultati arricchiti da fonti esterne ai cataloghi.

Figura 1.3.12 Schema di FRBR - Il primo riquadro rappresenta gli aspetti della opera intellettuale e le relazioni che intercorrono tra le entità. Nel secondo riquadro vengono evidenziati le relazioni che l’opera ha con entità che ne gestiscono la realizzazione, la distribuzione o la conservazione.

quanto elemento riusabile in altri contesti, a differenti istituti di memoria quindi non solo alle biblioteche ma anche agli archivi e ai musei .142

Nel contesto delle Digital Library vale la pena menzionare, insieme alle più citate digital libraries Gallica e Europeana Collection, anche il progetto di integrazione e comunicazione tra dei sistemi di ricerca e di descrizione archivistica di differenti istituti, sviluppato dal SAN - Sistema Archivistico Nazionale ancora una volta senza che questi perdessero la propria autonomia e la loro specificità. Chi aderisce al SAN gode dell’opportunità di poter condividere i propri dati con altri archivi, portali e raccolte attraverso gli standard condivisi . 143

Il progetto risalente al 2010 ha la visto la creazione di uno spazio web userfriendly da cui è possibile non solo scegliere dei percorsi specifici attraverso i portali tematici, ma anche scaricare i dati provenienti dagli archivi aderenti. In SAN è possibile costruire un proprio profilo che consente una molteplicità di operazione come la creazione di gruppi di archivi, l’inserimento di tag e di commenti alle raccolte e apporre segnalibri. Questo aspetto ci pare interessante perché è una forma di profilazione dell’utente utile a comprende quale tipologia di “consumo” di dati e di documenti svolge il proprio pubblico, ma soprattutto per la costruzione di servizi migliori. Il merito di SAN è il progetto SAN Open Data che raccoglie 128 dataset aderenti all’iniziativa di pubblicazione in Linked Open Data dei dati del Sistema Archivistico Nazionale e degli istituti aderenti.

Il Progetto ha visto la realizzazione dell’Ontologia SAN - LOD144 in linguaggio OWL, un thesauro SKOS SAN sempre secondo gli standard del web semantico navigabile anche graficamente. Un endpoint SPARQL dedicato e un’area di download organizzata in specifici

Per i musei abbiamo già visto il modello concettuale di CIDOC - CRM a cui bisogna aggiungere AAT - 142

Art&Architectur Thesaurus e il CDWA - Categories for the Description of Works of Arts. A questi standard ne va

aggiunto un ultimo forse il più noto che è Dublin Core (DC) che è lo strumento più usato per la rappresentazione degli oggetti digitali.

Gli standard di SAN sono: 143

«CAT-SAN: tracciato di esportazione dai sistemi aderenti al SAN delle schede descrittive dei complessi archivistici di primo livello (fondi, complessi di fondi) o di livello inferiore, dei soggetti conservatori, dei soggetti produttori e degli strumenti di ricerca;

METS -SAN: set di metadati descrittivi, tecnici e strutturali (Metadata Encoding and Transmission Standard) relativi agli oggetti digitali presenti che confluiscono nella Digital Library del SAN;

NIERA(EPF): Norme italiane per l’elaborazione dei record di autorità archivistiche di enti, persone, famiglie NIERA(EPF), che forniscono le linee guida per l’individuazione, identificazione e descrizione di tali entità.» Per quanto riguarda i tracciati CAT - SAN sono stati elaborati per XML in EAD - Encoded Archival Description riconosciuto a livello internazionale come standard per la metadatazione ed inoltre per i record METS-SAN è obbligatoria la sezione descrittiva in standard EAD, un’area che contiene le relazioni tra risorse archivistiche del Catalogo delle risorse archivistiche (CAT) e gli oggetti digitali dell'archivio digitale del SAN, espresse nel formato Resource Description Framework (RDF). < http://www.icar.beniculturali.it/index.php?id=107>

http://www.san.beniculturali.it/SAN/san-lod.owl

datasets necessari alla pubblicazione e alle interrogazioni. I dati sono anche navigabili attraverso ambiente Virtuoso. 145