• Non ci sono risultati.

L’attività di metadatazione è finalizzata all’individuazione di set di metadati (tra gli Standard internazionali e nazionali esistenti) più idonei a descrivere le collezioni e le singole risorse documentarie. I metadati:

sono la colla che tiene insieme le informazioni sugli oggetti digitali, garantendone la qualità e l’accesso, e, al contempo,

rappresentano la struttura logica che consente flussi (fruizione) di informazioni e nuove relazioni tra le risorse digitali;

favoriscono l’identificazione univoca, l’individuazione e la localizzazione di una risorsa; facilitano l’aggregazione e l’organizzazione dinamiche di risorse con caratteristiche comuni; possono garantire la conservazione a lungo termine delle rappresentazioni digitali delle risorse documentarie.

Metadata plays a crucial role in the functioning of individual Repositories, and also networks of Open Access Repositories […] Because of the crucial role that metadata plays in making the content of Repositories discoverable and searchable not only within an individual Repository, but also within a network of them, its creation is an extremely important step of the submission process

[Gunning, p.3].

Per ogni oggetto e collezione si applicherà una metadatazione leggera (di base, es. Dublin Core simple) dal punto di vista descrittivo e conservativo.

Il profilo descrittivo dei materiali dell’Archivio Istituzionale “non è un Catalogo, è uno strumento fondamentalmente diverso e quindi sia l’interfaccia sia i metadati devono essere “a portata di mano” dell’utente finale, così come lo schema disciplinare per il browsing utile alla collocazione entro uno schema disciplinare o anche puramente gerarchico che dovrà essere il più semplice possibile

[De Robbio, 2007, p.106].

La qualità di metadati si raggiunge tramite la conformità agli Standard e l’arricchimento delle proprietà di metadati con elementi semantici (soggetti, temi, generi ecc.), generati utilizzando Schemi di Classificazione e vocabolari controllati (Authority File, ontologie, Thesauri), a seconda del dominio disciplinare di appartenenza dei singoli oggetti e delle aggregazioni per collezioni.

Il rapporto tra la qualità di metadati e gli Archivi Istituzionali “riveste un’importanza primaria considerando che la qualità dei primi ha una profonda incidenza sul livello qualitativo dei servizi offerti all’utente.

La qualità dei metadati riflette il grado con cui i metadati esercitano le fondamentali funzioni bibliografiche di ricerca, uso, diffusione, autenticità e gestione in un contesto di interoperabilità, quale quello promosso dal modello OAI, la qualità dei metadati utilizzati nei Data Provider influenza sia i servizi agli utenti locali, sia i servizi forniti dai Service Provider e può determinare gravi problemi nel trasferimento dati nel caso di migrazioni tra piattaforme diverse (anche compatibili con le specifiche del protocollo OAI-PMH).

La ricerca di risorse in rete risulta molto più agevole se si usano Schemi di metadati definiti, protocolli di trasferimento condivisi e mappature tra gli schemi.

[Guerrini, 2010 a, p. 42].

In seguito saranno esposte informazioni, elencate fonti, e forniti rimandi di approfondimento relativamente al tema del presente paragrafo.

“Understanding metadata“ (NISO):

<http://www.niso.org/publications/press/UnderstandingMetadata.pdf> L’introduzione al mondo di metadati (registri, schemi, standard).

“Linee Guida per gli Archivi Istituzionali” (CRUI, Italia):

125 Scegliere metadati che possono adeguatamente coprire gli aspetti descrittivi, strutturali, tecnici, amministrativi, di diritti per rappresentare e gestire le risorse informative depositate nell’Archivio.

Procedere con una adeguata mappatura tra diversi schemi di metadati.

Per una maggiore visibilità dell’Archivio Istituzionale, anche a livello europeo, i metadati dovranno essere compatibili con le specifiche del progetto DRIVER6, particolarmente con le Linee Guida “Digital Repository Infrastructure Vision for European Research” 2.0: <https://issue.guidelines.driver.research-infrastructures.eu/>, sulla base di cui sono state sviluppate le Linee Guida “OpenAIRE” 1.1:

<http://www.openaire.eu/component/content/article/207>. Le Linee Guida DRIVER possono servire ai gestori di:

Archivi Istituzionali nuovi per definire le Politiche relative ai formati delle risorse e ai metadati (mappatura di metadati nel formato Dublin Core);

Archivi già avviati per poter, ove è necessario, riorientare le scelte fatte.

Se un Archivio corrisponde alle caratteristiche ritenute indispensabili dalle Linee Guida DRIVER, esso acquista lo status di “DRIVER Provider” e diventa il partner dei Repository accolti entro l’infrastruttura digitale di DRIVER. Il primo requisito obbligatorio per la compatibilità con il progetto DRIVER è la presenza entro gli Archivi Istituzionali delle risorse informative a testo pieno (full-text).

Metadati Dublin Core: <http://www.dublincore.org/documents/usageguide/#whatismetadata> V. ALLEGATO A

Di buona norma, alla base della descrizione delle risorse digitali negli Archivi Istituzionali devono essere i metadati Dublin Core (DC) semplici (15 elementi) - Dublin Core Metadata Element Set (DCMES). Tramite questi elementi – che nell’ambiente web vengono supportati dal protocollo dell`interoperabilità tecnica OAI-PMH - gli Archivi (Data e Service Provider) possono comunicare tra loro.

Nonostante gli elementi di metadati DC possono essere ripetibili, al fine di creare più descrittori per rappresentare una risorsa, l'adozione del solo DC semplice non è in grado di coprire tutte le esigenze di rappresentazione dei contenuti digitali in un Archivio di ricerca.

Dublin Core Metadata Element Set (DCMES) nella versione italiana:

<http://www.iccu.sbn.it/opencms/opencms/it/main/standard/metadati/pagina_116.html>,

pubblicato dall’Istituto Centrale per il Catalogo Unico delle biblioteche italiane e per le informazioni (ICCU).

1. Titolo (un nome dato alla risorsa);

2. Creatore (un’entità che ha la responsabilità principale della produzione del

contenuto della risorsa);

3. Soggetto (l’argomento della risorsa);

4. Descrizione (una spiegazione del contenuto della risorsa);

5. Editore (un’entità responsabile della produzione della risorsa, disponibile nella

sua forma presente);

6. Autore di contributo subordinato (un’entità responsabile della produzione di

un contributo al contenuto della risorsa);

7. Data (una data associata a un evento del ciclo di vita della risorsa). 8. Tipo (la natura o il genere del contenuto della risorsa);

6 DRIVER è un progetto di un Consorzio Europeo (formato da enti di ricerca, università, biblioteche, progetti nazionali) finanziato dalla Unione Europea, che offre servizi avanzati atti a raccogliere, aggregare ed organizzare le risorse presenti nei diversi Archivi Istituzionali e Disciplinari.

126

9. Formato (la manifestazione fisica o digitale della risorsa);

10. Identificatore (un riferimento univoco alla risorsa nell’ambito di un dato

contesto);

10. Fonte (un riferimento a una risorsa dalla quale è derivata la risorsa in oggetto); 11. Lingua (la lingua del contenuto intellettuale della risorsa);

12. Relazione (un riferimento alla risorsa correlata);

13. Copertura (l’estensione o scopo del contenuto della risorsa);

14. Gestione dei diritti (l`informazione sui diritti esercitati sulla risorsa). “Open Metadata Handbook/Metadata Standards”:

<http://en.wikibooks.org/wiki/Open_Metadata_Handbook/Metadata_Standards#BibJSON> Modelli di dati, schemi di metadati, protocolli di metadati

Metadati “item-level”. Mappature (crosswalks) tra elementi di diversi schemi di metadati

Nella prassi descrittiva delle risorse digitali depositati negli Archivi Istituzionali, il set di metadati DC semplice (elementi generali) rappresenta spesso la base per un più ricco corredo di metadati “item-level” (Figura 28) il quale di buona norma deve essere documentato attraverso le mappature (crosswalks) tra diversi elementi di metadati scelte per raffinare il livello della granularità della descrizione.

Figura 28. Esempio di uno schema concettuale di metadati “item-level”

Esempi di metadati “item-level”

Profili applicativi e Schemi di metadati:

Dublin Core Libraries Working Group Application Profile (LAP): <http://dublincore.org/documents/library-application-profile/>.

Dallo schema LAP possono essere attinti dei qualificatori per gli elementi DC. Altri qualificatori possono essere creati in autonomia (es. valori di metadati opportunamente qualificati attraverso le voci di vocabolari controllati).

Dublin Core Application Profiles (DCAP):

<http://dublincore.org/documents/profile-guidelines/index.shtml> Images Application Profile (IAP):

<http://www.ukoln.ac.uk/repositories/digirep/index/Images_Application_Profile> Geospatial Application Profile (GAP):

127 Learning Materials Application Profile (DC Education AP) (LMAP):

<http://www.icbl.hw.ac.uk/lmap/lmapscopingreport.pdf> Time-Based Media Application Profile (TBMAP):

<http://www.jisc.ac.uk/whatwedo/programmes/reppres/tbmap.aspx> Scholarly Works Application Profile (SWAP):

<http://www.ukoln.ac.uk/repositories/digirep/index/Eprints_Application_Profile>

Metadata Object Description Schema (MODS): <http://www.loc.gov/standards/mods/>. I Software più diffusi per la creazione di archivi OA (per esempio Eprints e DSpace) prevedono Profili Applicativi di metadati estensibili che, in fase di esportazione, possono essere codificati in diversi formati e schemi come MODS, RDF [Guerrini, 2010 a, p.42]

Bibliographic Ontology (BIBO): <http://bibliontology.com/>

Learning Object Metadata (IEEE LOM): <http://ltsc.ieee.org/wg12/>

Metadata for Learning Resources (MLR), uno schema compatibile con i metadati DC e IEEE LOM: <http://en.wikipedia.org/wiki/ISO/IEC_19788>

XMetaDiss (metadati specifici per la descrizione delle Tesi):

<http://www.nb.admin.ch/nb_professionnel/01693/01699/01873/01894/index.html?lang=it&d ownload=NHzLpZeg7t,lnp6I0NTU042l2Z6ln1ah2oZn4Z2qZpnO2Yuq2Z6gpJCDeHx2hGym 162epYbg2c_JjKbNoKSn6A-->

Per approfondire l’argomento su crosswalks si vedono le seguenti fonti:

“Linee guida tecniche per i programmi di creazione di contenuti culturali digitali”: Edizione italiana 2.0. Progetto Minevra, il Gruppo di lavoro italiano "Interoperabilità e servizi" WP4, 2007:

<http://www.minervaeurope.org/publications/lineeguidatecnicheita/riperimento.html> Metadata Standards Crosswalk:

<http://www.getty.edu/research/conducting_research/standards/intrometadata/crosswalks.ht ml>

MARC Mappings: <http://www.loc.gov/marc/marcdocz.html>

MODS Mappings: <http://www.loc.gov/standards/mods/mods-conversions.html> Mappatura tra LOM e DC [Koutsomitropoulos, 2010]

Mappatura tra DC e UNIMARC:

<http://www.iccu.sbn.it/opencms/opencms/it/main/standard/metadati/pagina_118.html> Mappatura tra DC e RDF: <http://dublincore.org/documents/dc-rdf/>

Applicazione delle mappature (crosswalks) tra elementi di diversi schemi di metadati comporta i vantaggi ai Repositori in termini di interoperabilità interna ed esterna di loro contenuti.

128 L’uso delle mappature ampiamente

condivise tra Data Provider (DP, Archivi digitali) e Service Provider (SP, servizi federati, aggregatori di Archivi) farà si che i metadati sviluppati nei DP non saranno appiattiti a 15 elementi di metadati DC simple durante il processo di loro raccolta (harvesting) da parte di SP attraverso il protocollo OAI-PMH, bensì affronteranno coerentemente tutte le conversioni necessarie (Figura 29).

I metadati raccolti da DP vengono interpretati da parte di SP con il loro successivo confezionamento in diversi tipi di informazione per fornire servizi a valore aggiunto

[De Robbio, 2012, p. 12].

Figura 29. Schema di interazione tra Data e Service Provider OAI

Esempi di SP:

ArXiv: <http://arxiv.org/>

È un Repository su modello accentrato di e-print (materiale digitale) dei seguenti campi: fisica, matematica, scienza non lineare, informatica, biologia quantitativa e statistica. Offre la possibilità di meta-ricerca; è possibile quindi effettuare un'unica ricerca simultanea in queste ed altre banche dati, attraverso la ricerca multipla.

RePEc: <http://repec.org/>

È un Repository federato che contiene la più ampia collezione distribuita al mondo di articoli accademici sull’economia e sulle discipline collegate. RePeC collega e raccoglie informazioni sui lavori, pubblicati e non, di migliaia di economisti che hanno depositato i loro lavori nei Repository locali che aderiscono al Network.

SSRN:

<http://ppers.ssrn.com/sol3/DisplayJournalBrowse.cfm#>; <http://repositories.webometrics.info/toprep.asp>

È un Repository su modello accentrato a sé che "indicizza" il materiale nelle Scienze Umane solo dei Repository aderiti. Offre i servizi basati su specializzazioni disciplinari. Contiene anche papers ad accesso chiuso che vengono venduti. Nell'edizione di luglio 2011 di Ranking web of world Repositories, SSRN è stato considerato il miglior Repository dell'anno.

DART-Europe (E-Thesis Portal): <http://www.dart-europe.eu/basic-search.php>;

NARCIS (National Academic Research and Collaborations Information System): <http://www.narcis.nl/>;

OaiSter: <http://www.oclc.org/oaister/>;

DRIVER (Digital Repository Infrastructure Vision for European Research): <http://search.driver.research-infrastructures.eu/Help.action?type=collection>;

<http://www.driver-repository.eu/>

Specifiche di integrazione e specificazione di metadati (documenti del Progetto VOA3R)

“Specifications for the integration of components”:

<http://agroknow.redpanda.gr/content/d421uahdraft20110221-specifications-integration- components>

Le soluzioni di integrazione tecnica per ciascuno dei componenti del Sistema (Repository) comprendono la configurazione dei componenti per poter lavorare con i protocolli aperti per l'integrazione e la configurazione di metadati, per adattarli ai Profili di applicazione e mapping.

129 “Specification of Metadata Profiles and mappings to existing technology”:

<http://www.ieru.org/voa3r//wiki/images/b/bb/20120913-D3.5-PartB.pdf>

“Resource Description and Access” (RDA). Standard compatibile con lo schema di metadati Dublin Core: <http://www.ppt2txt.com/r/ffc282c8/>

RDA può essere applicato per il controllo della forma di descrizione bibliografica.

Elenco di alcuni importanti “Metadata Value Standards and Resources”

<http://www.neal-schuman.com/metadata-digital-collections/MDC_Resources.html>

“Repositories Support Project” (UK): Software e schemi di metadati <http://www.rsp.ac.uk/>

Il progetto specifica gli schemi di metadati supportati nativamente da diversi Software (Tabella 12).

Tabella 12. Schemi di metadati supportati da diversi Software

Supporto del formato di metadati semantici RDF(Resource Description Framework )

Le recenti versioni dei Software DSpace e Fedora supportano il formato dati RDF per esprimere le relazioni tra le triple (“Soggetto”/Risorsa - ha - “Predicato”/Proprietà – ha - “Oggetto”/Valore).

V. i documenti:

DSpace 2.0 - Expressing DSpace Domain Model in RDF:

<https://wiki.duraspace.org/display/DSPACE/DSpace+2.0+Expressing+DSpace+Domain+Mod el+In+RDF>

Fedora Commons. All Documentation:

<https://wiki.duraspace.org/display/FEDORA/All+Documentation>

Attraverso il modello dati RDF - diversi dataset (metadati, unità concettuali predefinite, voci dei vocabolari controllati, altri oggetti digitali) - identificati univocamente da http_URIs possono essere pubblicati in modalità Linked (Open) Data sul Web Semantico (Web di dati, Web 3.0) di dati interconnessi.

V. il documento “Linked Open Data for DSpace”:

<https://wiki.duraspace.org/display/DSPACE/Linked+Open+Data+for+DSpace>

Oggetti digitali rappresentati tramite i meccanismi Linked (Open) Data diventano non solo “machine readable” ma anche “machine linkabile”, quindi possono essere collegati e riusati da diversi agenti (produttori di Linked Data a loro volta) operanti sul Web di dati, quindi anche al

130 di fuori dell’originale contesto di utilizzo. Tale approccio offre una straordinaria possibilità a diversi di essere interconnessi tra di loro in base all’affinità semantica o all’area di interesse, indipendentemente dai formati e dai Software utilizzati per la loro produzione, liberando, allo stesso tempo, le istituzioni culturali dalla “dipendenza” da un limitato numero di fornitori tecnologici specializzati.

V. il documento “Library Linked Data Incubator Group Final Report”. W3C Incubator Group Report 25 October 2011, <http://www.w3.org/2005/Incubator/lld/XGR-lld-20111025/>

“Metadata Handbook”: <http://en.wikibooks.org/wiki/Open_Metadata_Handbook>

È un’iniziativa lanciata dal Public Domain e dall’Open Bibiographic Working Group dell’OKF (Open Knowledge Foundation) che sta mettendo in pratica le Raccomandazioni del Gruppo Library Linked Data.

“OpenAIRE Guidelines”:

<http://www.openaire.eu/en/component/content/article/9-news-events/427-openaire-releases- version-20-of-the-openaire-guidelines>

Sono le specifiche per i metadati degli Archivi aperti Open Access pubblicate sulla base delle Linee Guida DRIVER:

OpenAIRE Guidelines 1.1 (Guidelines for content providers of the OpenAIRE information space): <http://www.openaire.eu/component/content/article/207>;

OpenAIRE Guidelines 2. 0 <http://www.openaire.eu/en/component/content/article/9-news- events/427-openaire-releases-version-20-of-the-openaire-guidelines>.

Attraverso OpenAIRE Guidelines manager di Repository possono definire Politiche locali per la gestione di metadati in conformità con le esigenze dell’Area Europea di Ricerca (ERA), con l’obiettivo di contribuire alla creazione di una infrastruttura digitale capace di raccogliere, arricchire e conservare i metadati dei set di dati scientifici e per sostenere la gestione e il collegamento tra i dati scientifici ad Accesso Aperto.

Secondo “OpenAIRE Guidelines” la descrizione di una risorsa di ricerca digitale entro un Archivio ad Accesso Aperto deve essere obbligatoriamente affiancata dai seguenti metadati:

Title, Creator,

Date (Publication), Type,

Identifier,

Relation (Project Id) (il numero di Grant Agreement), accessRights (il tipo d’accesso),

embargoEndDate (la data del periodo dell’embargo che deve essere rispettata dopo la pubblicazione effettiva dei lavori di ricerca sulle Riviste Scientifiche “tradizionali”).

“Linee Guida per la creazione e la gestione di metadati nei Repository Istituzionali”:

<http://www.openaire.eu/en/component/content/article/9-news-events/427-openaire-releases- version-20-of-the-openaire-guidelines>

Queste Linee Guida sono redatte in conformità alle Linee Guida DRIVER e OpenAIRE, entro la Commissione CRUI (gruppo Open Access). Hanno l’obiettivo di suggerire come descrivere i lavori di ricerca entro gli Archivi Istituzionali attraverso uno schema di metadati DC minimo, per provvedere a una maggiore interoperabilità tra i contenuti di diversi Archivi Istituzionali.

“L’interoperabilità è la capacità, posseduta dai sistemi multipli, di scambiarsi dati con una perdita minima di contenuto e funzionalità, nonostante i sistemi multipli siano caratterizzati da Hardware, piattaforme di Software, strutture di dati e interfacce differenti” [V. sito ”Linee Guida per la creazione e la gestione di metadati nei Repository Istituzionali” p. 11].

131 strutturali) e quelli legati al contesto di appartenenza di un documento (es. informazioni amministrativo-gestionali relative ad afferenza dipartimentale, Settori Scientifico-Disciplinari: SSD) in grado di garantire la massima visibilità e la disseminazione alla produzione scientifica di un Ateneo, anche nell’ambito dell’Anagrafe Nazionale delle Ricerche (Sito Docente M.I.U.R).

Viene prevista la mappatura dei metadati con il modello di metadati per i lavori accademici SWAP (Scholarly Works Application Profile) .

Viene preso in considerazione il modello di dati di CERIF (Common European Research Information Format)<http://cordis.europa.eu/cerif/src/about.htm>, uno Standard per favorire lo scambio delle informazioni in diversi formati tra i vari CRIS (Current Research Information System).

“Il fatto che i Software maggiormente utilizzati per la gestione di tali Repository utilizzino all’interno della Banca Dati dei formati specifici, collegati alla struttura stessa del Database, permetterà senza grosse difficoltà l’esposizione di metadati di formati diversi, a seconda delle diverse necessità, a partire dai medesimi dati descrittivi” [ivi, p. 31].

Metadati amministrativi e gestionali

Questi metadati [V. sito “MAG Metadati Amministrativi e Gestionali“], più che quelli descrittivi, assumono un’importanza preponderante ai fini della gestione, del mantenimento e dell’accessibilità a lungo termine degli oggetti digitali, in quanto documentano le modalità di generazione, immissione, archiviazione e manutenzione dei medesimi e forniscono specifiche formali per le fasi di raccolta e archiviazione dei metadati [V. sito “Reference Model for an Open Archival Information System: OAIS “].

Lo schema di metadati METS (Metadata Encoding and Transmission Standard) [V. sito].

è uno standard per codificare metadati descrittivi, amministrativi e strutturali relativi a oggetti all'interno di una Biblioteca Digitale, esattamente come MAG, ma che, a differenza di MAG, si propone più come "schema contenitore" che come risposta o punto di riferimento per la registrazione di metadati. METS può integrare al suo interno diversi schemi di codifica non predeterminati, mentre da ben poche indicazioni su come e cosa si debba codificare” [V. sito “MAG“].

Ogni collezione deve essere descritta da un file METS specifico che contiene al suo interno i riferimenti utili ad individuare gli oggetti di appartenenza e le informazioni di sintesi per ogni risorsa.

Secondo le regole definite nel profilo METS, l’oggetto informativo digitale ospitato da una piattaforma deve:

avere il proprio identificativo univoco (secondo la buona pratica, un PID/Persistent Identifier che garantisce all’oggetto l’unicità e la persistenza a livello di Repository). PID deve permettere la generazione di oggetti di livello gerarchico inferiore. In questo modo, gli oggetti “figli”, oltre ad avere una relazione che li lega all’oggetto padre, potranno avere un identificativo ricavato gerarchicamente dall’identificativo del padre. Gli oggetti “padre” ospitati entro la piattaforma Software Open Source Fedora sono in relazione con gli oggetti “figli” sulla base di relazioni RDF che descrivono anche la semantica della relazione stessa (modellazione atomistica);

essere individuato nel sistema da un file METS avente il medesimo identificativo e che contiene tutti i metadati utili e le informazioni necessarie per la corretta esecuzione dell’ingestion (caricamento) dell’oggetto, la collezione di oggetti digitali e i loro metadati;

appartenere necessariamente ad una collezione (solo se la risorsa deve essere indicizzata e visionabile da un’applicazione client mentre in caso di sola conservazione l’appartenenza ad una collezione non e’ vincolante);

132 essere riconosciuto dal sistema come appartenente ad una specifica tipologia tra quelle definite dall’Archivio e come tale trattato per l’attivazione di specifici servizi.

Standard di metadati e protocolli raccomandati per gli Archivi digitali:

<http://62.204.194.27/necobelac/generalita.jsp?id=id8752> (Figura 30)

Figura 30. Tecnologia e standard per gli Archivi digitali

Strettamente connessi tra di loro sono i temi della leggibilità del Repository e della capacità dell’utente di utilizzarlo. Da una parte è necessario informare, formare e sensibilizzare l’utente, che nel caso degli Archivi Aperti può essere anche un produttore del record [scheda di metadati descrittivi della risorsa