L'Open Archives Initiative (OAI) [V. sito] è un progetto nato nel 1999 per rendere facilmente fruibili le piattaforme di Archivi che contengono documenti prodotti in ambito accademico.
Il mondo accademico statunitense ha cominciato a utilizzare il termine Archive o l’espressione Open Archives per indicare quelle collezioni ospitate in server gestiti da Università e da altri istituti, che si arricchivano dei risultati delle ricerche in corso e dei prodotti di ricerche concluse, lavori rivolti principalmente ad altri studiosi e liberamente accessibili a tutti tramite il Web [Guerrini, 2010, p.9].
Secondo il «Glossario delle organizzazioni internazionali e dei termini più comunemente utilizzati negli Open Archives» [V. sito]: “Open Archive è un Archivio di lavori scientifici in formato elettronico organizzati con metadati descrittivi, liberamente accessibile in rete”.
L’OAI promuove:
1) Software Open Source basati sul protocollo di interoperabilità OAI-PMH (Protocol for Metadata Harvesting)[V. sito], al fine di consentire la creazione di servizi per:
a) rendere utilizzabili tutti i contenuti dell'attività di ricerca degli Atenei attraverso le piattaforme digitali di Archivi aperti;
b) abilitare queste piattaforme a interagire tra loro (l’interoperabilità tecnica) e rendere possibile una ricerca su più Archivi simultaneamente;
2) lo sviluppo di Standard aperti a supporto della gestione di Archivi;
3) la creazione di metadati di qualità regolati da professionisti dell'informazione; 4) la creazione di servizi di valore aggiunto per le biblioteche digitali;
5) i metodi dell'integrazione delle risorse nel contesto della biblioteca ibrida e lo sviluppo di Portali tematici e istituzionali.
Il modello OAI ha la possibilità di fornire informazione specializzata a vari livelli, catturando i metadati a livello dai diversi Archivi tramite lo schema XML (eXtensibleMarkupLanguage) [V. sito]. Tale schema – riconosciuto come uno standard del W3C (Consorzio Worlrd Wide Web) per la strutturazione di dati atti a facilitare la condivisione/scambio tra moduli applicativi in
26 forma sintatticamente e semanticamente non ambigua - specifica quali sono i diritti di utilizzo dei metadati a livello di ogni record (scheda descrittiva della risorsa informativa digitale) e dell'intero Archivio, riferendosi in primo luogo ai metadati descrittivi Dublin Core (DC) semplice (simple, non qualificato) costituito da 15 elementi per la descrizione di una risorsa [V. Appendice I]. Accanto alla complessità di formati di metadati completamente differenti (es. metadati strutturali METS), i metadati descrittivi DC simple vengono scelti come un “mandatory element set” o il denominatore minimo comune a supporto delle funzionalità del protocollo OAI-PMH.
Il modello OAI può essere descritto a due livelli:
I. Modello funzionale (Figura 5):
1) Data Provider (DP), o Web Servers Repositories che gestiscono uno o più Archivi (Repositories) di collezioni di oggetti digitali e sono responsabili del loro mantenimento, accesso e della generazione dei metadati che li caratterizzano;
2) Service Provider (SP), che possono essere Harvesters, Aggregators, Caches, Proxies, Gateways. SP confezionano servizi di ricerca a valore aggiunto, basandosi sull'aggregazione e l'indicizzazione di metadati raccolti dagli Archivi dei DP attraverso le richieste del protocollo OAI-PMH sfruttando le migliori potenzialità del digitale.
Figura 5: Il modello funzionale Open Archive
Initiative: Dara e Service Provider Ogni nuova installazione di “Archivi aperti” (DP e SP) - per essere ricercabile, ritrovabile e visibile a livello globale in rete - deve essere opportunamente registrata nel registro
internazionale presso il sito OAI per ottenere “OAI:identificatore_archivio”.
Il protocollo dell'interoperabilità, da una parte favorisce la comunicazione, dall'altra
limita gli elementi interoperabili a quelli indicati dallo schema DC non qualificato, con il risultato di un certo appiattimento dei risultati della ricerca o di innalzamento della quantità di rumore, con il vantaggio, tuttavia, di permettere ai gestori dei Data Provider di condividere i propri dati senza uno sforzo organizzativo gravoso, che in molti casi sarebbe fin troppo penalizzante, limitando così la circolazione delle risorse [Guerrini, 2010, p. 41].
Considerando tale limitazione, sarebbe opportuno un
Service Provider che abbia l’obiettivo di raccogliere metadati da Archivi diversi [riuscisse] a trovare il corretto equilibrio attraverso una mappatura tra differenti stili di indicizzazione per Soggetto o uso di Schemi di Classificazione [De Robbio, 2007, p. 147].
Un buon esempio di un SP è il Portale unificato degli Archivi aperti nazionali di ricerca NARCIS [V. sito], che offre l'Accesso Aperto al maggior numero dell'informazione scientifica aggregata dal Portale prodotta dal mondo accademico e dalle istituzioni scientifiche olandesi (Figura 6).
27 Figura 6. Il Portale unificato degli Archivi aperti nazionali olandesi della ricerca NARCIS
II. Modello tecnico che riguarda la raccolta (harvesting) di metadati da parte di SP tramite il
protocollo di interoperabilità OAI-PMH, attraverso le seguenti richieste: a) GetRecord = raccogliere record di metadati;
b) ListIdentifier e ListRecord = raccogliere le liste di identificatori delle unità informative e di record di metadati;
c) Identify = raccogliere le informazioni generali sugli Archivi e sui loro contenuti; d) ListMetadataFormats = interpretare i formati di metadati raccolti;
e) ListSets = interrogare gli Archivi e le partizioni in cui i medesimi hanno organizzato i dati.
I SP si pongono più vicino all'utente finale offrendone ricche possibilità di ricerca sui contenuti digitali aggregati. Il contenuto digitale può essere considerato su tre livelli:
1) risorsa (dati, documenti o oggetti digitali) contenuta negli Archivi mantenuti dai DP e descritta da record di metadati (scheda descrittiva);
2) record che rappresentano i metadati espressi in sintassi XML secondo lo schema di metadati DC simple, ma anche secondo gli altri metadati definiti in specifici domini di applicazione per la descrizione delle Risorse. Ogni record deve avere:
a) record di metadati (DC simple) che lo descrivono (catalogano); b) un codice univoco ed identificativo;
c) la struttura secondo un determinato layout, perché ogni Risorsa è granulare (atomi di informazione collegati, espressi tramite lo schema standard XML);
3) item è un contenitore di tipo logico a partire dal quale vengono diffusi i metadati.
Il protocollo OAI-PMH - che permette a SP di raccogliere i record di metadati da DP – può essere definito come un insieme delle strategie di marketing per DP, fondate sulla tecnologia per l’interoperabilità tecnica delle informazioni a livello di record, item, e risorsa attraverso l’utilizzo di standard tecnici aperti comuni.
Grazie all`OAI-PMH, gli Archivi aperti (DP e SP) possono dialogare non solo tra di loro, ma anche con i principali motori di ricerca - sia specialistici che generalisti (Google, Yahoo, Google Scholar, Scientific Commons, Base, OAIster) - che indicizzano i metadati e li rendono disponibili per la meta-ricerca.
Accanto all’interoperabilità tecnica, è opportuno che per ogni Archivio preposto alla ricerca dei contenuti vengano sviluppati i meccanismi a supporto dell’interoperabilità semantica [V.
28 Appendice I, “Linguaggi e soluzioni tecnologiche del Web Semantico”] facilitata dall’uso di terminologie e vocabolari controllati.
L’interoperabilità è un aspetto di cui ogni Istituzione, che produce e gestisce i contenuti digitali deve tener conto, in quanto essa:
•facilita il ritrovamento dei contenuti depositati in un Archivio digitali da un ampio numero di agenti (Portali, Aggregatori di metadati, Motori di ricerca);
•produce traffico di contenuti verso l’Archivio di riferimento;
•accresce la visibilità dei contenuti dell’Istituzione.