Open Archive
di Antonella De Robbio
Referente SBA per il diritto d'autore Università degli Studi di Padova
Archivi Aperti
• Noti come Open Archive, o E-prints server, sono
archivi preposti al deposito dei documenti scientifici, in forma elettronica, alla loro gestione e
conservazione.
• Possono essere organizzati a livello istituzionale o a livello disciplinare.
• I documenti elettronici possono essere depositati
direttamente dagli autori attraverso un semplice processo noto come auto-archiviazione.
• Non va confuso il termine auto-archiviazione archiving) con quello di auto-pubblicazione (self-publishing)
Cosa sono gli e-prints?
•
Gli e-prints sono copie elettroniche di
papers accademici.
•
Gli
archivi di e-prints
consentono agli
autori di rendere i propri prints
pre-referati, e i propri lavori post-print
referati, liberamente disponibili alla
comunità internazionale scientifica,
disseminandoli su scala mondiale, cosa
impossibile per un lavoro su carta
L’auto-archiviazione
• Molti sono i ricercatori che da alcuni anni archiviano i loro lavori sui server delle loro
istituzioni o in server disciplinari, per esempio per la biomedicina, l'astronomia, la chimica, ...
• la matematica, dopo la fisica, è il campo, dove si è fatto l'uso più massiccio di server di pre-print
• Anche all'interno di una stessa disciplina però, non sempre i comportamenti sono omogenei
Tipologie di Open Archive
• Numerose sono le esperienze nel mondo e anche
le tipologie tecniche
– modello accentrato – modello distribuito
• A livello organizzativo le scelte possono essere
– server istituzionali (institutional
repositories)
– server subject-based o disciplinari – esistono inoltre altre soluzioni:
• gli “umbrella server” (specie di MetaOA) • individual data provider (modello Kepler)
Archivi Aperti e interoperabilità
• Ciascun documento depositato è corredato da
metadati in formato standard che vengono esposti per la raccolta (harvesting)
• Gli archivi sono detti “aperti” in quanto possono
essere interrogati da un servizio (“service provider”) che si occupa di indicizzare i metadati raccolti dai vari archivi attraverso la funzione di harvesting
• Un deposito entro l’architettura OAI Open Archive
Big versus small
Modello accentrato
HEP e discipline correlate nasce nel 1991
80.000 utenti / 70 Paesi 13 mil, doc. scaricati annui 3500 nuovi lavori annui 33.000 sottomissioni al 2001
Modello distribuito
•
RePEc, la più grande collezione del mondo
di documenti per l'economia ad accesso
libero, a modello distribuito
•
collega oltre 200 archivi con oltre 60.000
articoli e rapporti tecnici di ambito
economico disponibili online
•
sorto nel 1999 per opera di Thomas Krichel
•
ciascuno diventa mirror e garantisce
l’accesso anche ai dati di tutti gli altri
archivi
Il modello di pubblicazione scientifica
decostruito
[termine coniato da J. Smith]
• I depositi istituzionali possono giocare un ruolo significativo del
processo evolutivo della ristrutturazione della comunicazione scientifica
• Le tradizionali pubblicazioni a stampa integrano in un unico
modello 4 componenti essenziali nella comunicazione scientifica
[da Roosendaal e Geurts]
– Registrazione: stabilire la priorità intellettuale di un’idea, un concetto, o una scoperta scientifica
– Certificazione: certificare la qualità della ricerca e/o la validità delle scoperte dichiarate;
– Consapevolezza: assicurare la disseminazione e l’accessibilità delle produzioni della ricerca, fornendo meccanismi di alerting
Institutional repositories:
cosa sono
• I depositi istituzionali di documenti sono
collezioni digitali che raccolgono e conservano la produzione intellettuale delle comunità
accademiche (singoli o multi Atenei)
• possono essere considerati estensione naturale
delle responsabilità dell’istituzione accademica in qualità di generatori di ricerca primaria
• sono potenzialmente la componente più
importante nell’evoluzione della struttura dei nuovi modelli di comunicazione scientifica
Institutional repositories:
a cosa servono
• offrono una risposta strategica ai problemi esistenti
nel sistema che regola i periodici scientifici
• offrono un immediato complemento di qualità al modello di pubblicazione scientifica ad oggi
esistente
• stimolano l’innovazione entro una struttura di
editoria disaggregata
• servono come indicatori tangibili della qualità di un’istituzione, ne incrementano la visibilità, il prestigio e il valore a livello pubblico
Situazione frammentaria
•
Centinaia di e-server: istituzionali,
disciplinari, accentrati, distribuiti, piccoli,
grandi, depositi di collezioni, ...
•
Papers sparsi sui siti Web
•
Umbrella servers es. MPRESS)
•
MetaMotori OA (service provider)
•
CiteSeer, servizio precedentemente
chiamato ResearchIndex, costruito da NEC
Research Institute
Due le aree di intervento
•
Da una parte si trovano iniziative come OAI
nata con lo scopo di
– sviluppare e promuovere standard per l'interoperabilità tra archivi
– essere di supporto ad un'efficiente disseminazione di contenuti;
•
Dall'altra si collocano iniziative come
– Budapest Open Access Initiative BOAI – movimento Free Online Scholarship FOS
– Public Library of Science (30.000 scienziati di 180 Paesi
Open Archive Initiative
• OAI è supportata nelle sue iniziative dalla Digital Library Federation e da Coalition for Networked Information e riceve finanziamenti da National Science Fundation
• fonda le sue radici nel continuo sforzo teso al
miglioramento dell'accesso ai documenti entro gli archivi e-print,
• mette a disposizione strumenti, software e documentazione (protocolli, standard)
In OAI esistono
due categorie di server
•
i
data provider
, i quali contengono i
documenti depositati e che supportano il
protocollo OAI esponendo i metadati
relativi ai lavori contenuti nel server. Un
data provider gestisce uno o più server, per
il deposito (Web servers repositories)
•
i
service provider
, usano i metadati dei
data provider come base per la costruzione
di servizi a valore aggiunto.
harvesting
•
Open Archives Initiative Protocol for
Metadata Harvesting Protocol
indispensabile per rendersi visibili ai fini
della raccolta
•
è necessario esporre i propri metadati al
colloquio entro la comunità internazionale
in un formato compatibile
Budapest Open Access Initiative
BOAI
• nata il 14 febbraio 2002 conta oggi oltre 2484 firmatari
(178 organizzazioni)
• finanziata dalla Fondazione Soros di OSI Open Society Institute
• il suo scopo è di fare pressione sugli autori al fine di
ottenere un consenso generalizzato per l’auto-archiviazione
• non si occupa di applicazioni software o di aspetti
tecnologici, ma è focalizzata principalmente sui processi di peer-reviews.
I Software disponibili
• ArXive, Kit NCSTRL (ex-protocollo Dienst): per server disciplinari
• Eprints software (OAI compatibile): per server istituzionali
• Kepler software: per server individuali • DSpace di MIT. Gestisce anche formati
multimediali utili alla didattica
• CDSware del CERN: funge anche da portale con motore che ricerca entro le collezioni della
biblioteca
Cosa è EPrints ?
• E’ un software Open source per costruire,
gestire e fornire accesso ad archivi di e-print entro un quadro di Digital Library
• Nato dall’idea del prof. S. Harnad è sviluppato alla Southampton Univ (Chris Gutteridge)
• E’ un software libero rilasciato con licenza GNU
GPL (General Public License), fa uso di
numerosi altri software liberi (Apache, MySQL, PERL, Plug-ins for PERL).
• E’ pienamente interoperabile con il protocollo
OAI (Open Archives Initiative) per la raccolta dei metadati
Kepler framework
• Strumento per la creazione di “personal data provider” o
“archivelets” indipendenti dalla piattaforma (Mac, Win, Unix, …)
• scarico e auto-installazione semplice e rapida su workstation PC individuali (facilità di utilizzo)
• struttura molto simile a un broker basato su modello di rete P2P
• servizio di registrazione automatica: tiene traccia dello status di registrazione dell’archivelet (attivo/non attivo), attraverso un modello istant-messenger, mutuato da Napster, dove nel server centrale viene mantenuta traccia (in cache) dei client attivi
• servizio di raccolta di metadati dagli archivelet semplice e poco pesante
Service provider Arc: risultato ricerca
DSpace: nuova soluzione al MIT
• DSpace è una piattaforma software open source
(licenza BSD) OAI compatibile, adatta agli atenei
– cattura e descrive opere digitali utilizzando moduli
Web per la sottomissione dei lavori
– aggrega e recupera i lavori dell’istituzione: didattica
e ricerca
– conserva a lungo termine le opere digitali
– crea un sistema elettronico per la disseminazione
delle produzioni intellettuali
– gestisce utenze diversificate (studenti) con controllo
degli accessi
– gestisce multimedialità:supporta formati numerosi
SCHOOLS
DEPARTMENTS
LABS
CENTERS
PROGRAMS
Communities DSpace system
Web User Interface
USER USER SCHOOL DEPARTMENT LAB CENTER PROGRAM Archival Storage Metadata (Database) Search/Browse Subsystem Collection Collection Collection Collection USER S ub m is si on S ub sy st em Ite m Ite m Ite m Ite m
I blocchi di un copyright iniquo
• possono essere un forte ostacolo
– ad una crescita scientifico-culturale
– allo sviluppo sociale ed economico dei Paesi (teorie economiche lo
confermano)
• le questioni connesse al diritto d'autore o copyright, incidono sui processi della comunicazione scientifica e sul flusso dei contenuti intellettuali
Va posta differenza tra ...
• quello che l'autore cede a seguito di compenso
(royalty)
• quello che l'autore cede gratuitamente (give
away)
Non è la stessa cosa scrivere un articolo giornalistico, o per una rivista popolare,
e scrivere un articolo scientifico di ricerca. I meccanismi sono diversi.
Tutta la ricerca dovrebbe passare attraverso i canali dell'accesso libero,
in quanto nessuno paga gli autori per i loro lavori scientifici
La linea di demarcazione
• Stevan Harnad individua "una linea di
demarcazione profonda ed essenziale nella galassia Post-Gutenberg" tra
– le opere che rientrano nel circuito commerciale: fasi che coinvolgono l'autore nella cessione dei diritti dietro compenso (royalty), accessibili a pagamento (libri, giornali, programmi, musica)
– le opere che rientrano nel circuito della comunicazione scientifica: articoli di ricerca pubblicati nelle riviste scientifiche.
La trasformazione dell’OA
• il concetto OpenArchive si trasforma: da pre-print
diviene e-print, perde il prefisso "pre" a ricomprendere tutti i documenti
• il vero OA è un deposito di documenti appartenenti a
una determinata comunità
• ruolo dell'EPrints di Harnad è assai più ampio rispetto
al semplice pre-print server
• combatte il copyright iniquo con le stesse armi del
Il vero OA
•
modello che porta dentro il "seme" della
parola "disseminazione”
•
concetto profondamente diverso da quello
della “distribuzione”
•
disseminazione implica una crescita
•
incrementato a tal punto da evolvere e
divenire una forma di comunicazione e
immagazzinamento della produzione
scientifica nella sua interezza
“In the life, there are no
solution. There are forces in
motion: they need to be created
and solutions follow”
[In: Volo di notte, Antoine de Saint-Exupéry, Chap. 19]