Open Archive

(1)

Open Archive

di Antonella De Robbio

Referente SBA per il diritto d'autore Università degli Studi di Padova

(2)

Archivi Aperti

• _{Noti come Open Archive, o E-prints server, sono}

archivi preposti al deposito dei documenti scientifici, in forma elettronica, alla loro gestione e

conservazione.

• Possono essere organizzati a livello istituzionale o a livello disciplinare.

• _{I documenti elettronici possono essere depositati}

direttamente dagli autori attraverso un semplice processo noto come auto-archiviazione.

• Non va confuso il termine auto-archiviazione archiving) con quello di auto-pubblicazione (self-publishing)

(3)

Cosa sono gli e-prints?

• _{Gli e-prints sono copie elettroniche di}

papers accademici.

• _Gli

_{archivi di e-prints}

_{consentono agli}

autori di rendere i propri prints

pre-referati, e i propri lavori post-print

referati, liberamente disponibili alla

comunità internazionale scientifica,

disseminandoli su scala mondiale, cosa

impossibile per un lavoro su carta

(4)

L’auto-archiviazione

• _{Molti sono i ricercatori che da alcuni anni} archiviano i loro lavori sui server delle loro

istituzioni o in server disciplinari, per esempio per la biomedicina, l'astronomia, la chimica, ...

• _{la matematica, dopo la fisica, è il campo, dove si} è fatto l'uso più massiccio di server di pre-print

• _{Anche all'interno di una stessa disciplina però, non} sempre i comportamenti sono omogenei

(5)

Tipologie di Open Archive

• _{Numerose sono le esperienze nel mondo e anche}

le tipologie tecniche

– modello accentrato – modello distribuito

• A livello organizzativo le scelte possono essere

– server istituzionali (institutional

repositories)

– server subject-based o disciplinari – esistono inoltre altre soluzioni:

• gli “umbrella server” (specie di MetaOA) • individual data provider (modello Kepler)

(6)

Archivi Aperti e interoperabilità

• _{Ciascun documento depositato è corredato da}

metadati in formato standard che vengono esposti per la raccolta (harvesting)

• _{Gli archivi sono detti “aperti” in quanto possono}

essere interrogati da un servizio (“service provider”) che si occupa di indicizzare i metadati raccolti dai vari archivi attraverso la funzione di harvesting

• _{Un deposito entro l’architettura OAI Open Archive}

(7)

Big versus small

Modello accentrato

HEP e discipline correlate nasce nel 1991

80.000 utenti / 70 Paesi 13 mil, doc. scaricati annui 3500 nuovi lavori annui 33.000 sottomissioni al 2001

(8)

Modello distribuito

• _{RePEc, la più grande collezione del mondo}

di documenti per l'economia ad accesso

libero, a modello distribuito

• _{collega oltre 200 archivi con oltre 60.000}

articoli e rapporti tecnici di ambito

economico disponibili online

• _{sorto nel 1999 per opera di Thomas Krichel}

• _{ciascuno diventa mirror e garantisce}

l’accesso anche ai dati di tutti gli altri

archivi

(9)

Il modello di pubblicazione scientifica

decostruito

[termine coniato da J. Smith]

• I depositi istituzionali possono giocare un ruolo significativo del

processo evolutivo della ristrutturazione della comunicazione scientifica

• Le tradizionali pubblicazioni a stampa integrano in un unico

modello 4 componenti essenziali nella comunicazione scientifica

[da Roosendaal e Geurts]

– Registrazione: stabilire la priorità intellettuale di un’idea, un concetto, o una scoperta scientifica

– Certificazione: certificare la qualità della ricerca e/o la validità delle scoperte dichiarate;

– Consapevolezza: assicurare la disseminazione e l’accessibilità delle produzioni della ricerca, fornendo meccanismi di alerting

(10)

Institutional repositories:

cosa sono

• _{I depositi istituzionali di documenti sono}

collezioni digitali che raccolgono e conservano la produzione intellettuale delle comunità

accademiche (singoli o multi Atenei)

• _{possono essere considerati estensione naturale}

delle responsabilità dell’istituzione accademica in qualità di generatori di ricerca primaria

• _{sono potenzialmente la componente più}

importante nell’evoluzione della struttura dei nuovi modelli di comunicazione scientifica

(11)

Institutional repositories:

a cosa servono

• _{offrono una risposta strategica ai problemi esistenti}

nel sistema che regola i periodici scientifici

• offrono un immediato complemento di qualità al modello di pubblicazione scientifica ad oggi

esistente

• _{stimolano l’innovazione entro una struttura di}

editoria disaggregata

• servono come indicatori tangibili della qualità di un’istituzione, ne incrementano la visibilità, il prestigio e il valore a livello pubblico

(12)

Situazione frammentaria

• _{Centinaia di e-server: istituzionali,}

disciplinari, accentrati, distribuiti, piccoli,

grandi, depositi di collezioni, ...

• _{Papers sparsi sui siti Web}

• _{Umbrella servers es. MPRESS)}

• _{MetaMotori OA (service provider)}

• _{CiteSeer, servizio precedentemente}

chiamato ResearchIndex, costruito da NEC

Research Institute

(13)

Due le aree di intervento

• _{Da una parte si trovano iniziative come OAI}

nata con lo scopo di

– sviluppare e promuovere standard per l'interoperabilità tra archivi

– essere di supporto ad un'efficiente disseminazione di contenuti;

• _{Dall'altra si collocano iniziative come}

– Budapest Open Access Initiative BOAI – movimento Free Online Scholarship FOS

– Public Library of Science (30.000 scienziati di 180 Paesi

(14)

Open Archive Initiative

• _{OAI è supportata nelle sue iniziative dalla Digital} Library Federation e da Coalition for Networked Information e riceve finanziamenti da National Science Fundation

• _{fonda le sue radici nel continuo sforzo teso al}

miglioramento dell'accesso ai documenti entro gli archivi e-print,

• _{mette a disposizione strumenti, software e} documentazione (protocolli, standard)

(15)

In OAI esistono

due categorie di server

• _i

_{data provider}

_{, i quali contengono i}

documenti depositati e che supportano il

protocollo OAI esponendo i metadati

relativi ai lavori contenuti nel server. Un

data provider gestisce uno o più server, per

il deposito (Web servers repositories)

• _i

_{service provider}

_{, usano i metadati dei}

data provider come base per la costruzione

di servizi a valore aggiunto.

(16)

harvesting

• _{Open Archives Initiative Protocol for}

Metadata Harvesting Protocol

indispensabile per rendersi visibili ai fini

della raccolta

• _{è necessario esporre i propri metadati al}

colloquio entro la comunità internazionale

in un formato compatibile

(17)

Budapest Open Access Initiative

BOAI

• _{nata il 14 febbraio 2002 conta oggi oltre 2484} _firmatari

(178 organizzazioni)

• finanziata dalla Fondazione Soros di OSI Open Society Institute

• _{il suo scopo è di fare pressione sugli autori al fine di}

ottenere un consenso generalizzato per l’auto-archiviazione

• non si occupa di applicazioni software o di aspetti

tecnologici, ma è focalizzata principalmente sui processi di peer-reviews.

(18)

I Software disponibili

• _{ArXive, Kit NCSTRL (ex-protocollo Dienst): per} server disciplinari

• _{Eprints software (OAI compatibile): per server} istituzionali

• _{Kepler software: per server individuali} • _{DSpace di MIT. Gestisce anche formati}

multimediali utili alla didattica

• _{CDSware del CERN: funge anche da portale con} motore che ricerca entro le collezioni della

biblioteca

(19)

Cosa è EPrints ?

• _{E’ un software} _{Open source per costruire,}

gestire e fornire accesso ad archivi di e-print entro un quadro di Digital Library

• Nato dall’idea del prof. S. Harnad è sviluppato alla Southampton Univ (Chris Gutteridge)

• _{E’ un software libero rilasciato con licenza GNU}

GPL (General Public License), fa uso di

numerosi altri software liberi (Apache, MySQL, PERL, Plug-ins for PERL).

• _{E’ pienamente interoperabile con il protocollo}

OAI (Open Archives Initiative) per la raccolta dei metadati

(20)

(21)

(22)

(23)

(24)

Kepler framework

• Strumento per la creazione di “personal data provider” o

“archivelets” indipendenti dalla piattaforma (Mac, Win, Unix, …)

• scarico e auto-installazione semplice e rapida su workstation PC individuali (facilità di utilizzo)

• struttura molto simile a un broker basato su modello di rete P2P

• servizio di registrazione automatica: tiene traccia dello status di registrazione dell’archivelet (attivo/non attivo), attraverso un modello istant-messenger, mutuato da Napster, dove nel server centrale viene mantenuta traccia (in cache) dei client attivi

• servizio di raccolta di metadati dagli archivelet semplice e poco pesante

(25)

(26)

Service provider Arc: risultato ricerca

(27)

DSpace: nuova soluzione al MIT

• _{DSpace è una piattaforma software open source}

(licenza BSD) OAI compatibile, adatta agli atenei

– cattura e descrive opere digitali utilizzando moduli

Web per la sottomissione dei lavori

– aggrega e recupera i lavori dell’istituzione: didattica

e ricerca

– conserva a lungo termine le opere digitali

– crea un sistema elettronico per la disseminazione

delle produzioni intellettuali

– gestisce utenze diversificate (studenti) con controllo

degli accessi

– gestisce multimedialità:supporta formati numerosi

(28)

(29)

(30)

(31)

SCHOOLS

DEPARTMENTS

LABS

CENTERS

PROGRAMS

Communities DSpace system

Web User Interface

USER USER SCHOOL DEPARTMENT LAB CENTER PROGRAM Archival Storage Metadata (Database) Search/Browse Subsystem Collection Collection Collection Collection USER S ub m is si on S ub sy st em Ite m Ite m Ite m Ite m

(32)

I blocchi di un copyright iniquo

• possono essere un forte ostacolo

– ad una crescita scientifico-culturale

– allo sviluppo sociale ed economico dei Paesi (teorie economiche lo

confermano)

• _{le questioni connesse al diritto d'autore} o copyright, incidono sui processi della comunicazione scientifica e sul flusso dei contenuti intellettuali

(33)

Va posta differenza tra ...

• _{quello che l'autore cede a seguito di compenso}

(royalty)

• _{quello che l'autore cede gratuitamente (give}

away)

Non è la stessa cosa scrivere un articolo giornalistico, o per una rivista popolare,

e scrivere un articolo scientifico di ricerca. I meccanismi sono diversi.

Tutta la ricerca dovrebbe passare attraverso i canali dell'accesso libero,

in quanto nessuno paga gli autori per i loro lavori scientifici

(34)

La linea di demarcazione

• _{Stevan Harnad individua "}_{una linea di}

demarcazione profonda ed essenziale nella galassia Post-Gutenberg" tra

– le opere che rientrano nel circuito commerciale: fasi che coinvolgono l'autore nella cessione dei diritti dietro compenso (royalty), accessibili a pagamento (libri, giornali, programmi, musica)

– le opere che rientrano nel circuito della comunicazione scientifica: articoli di ricerca pubblicati nelle riviste scientifiche.

(35)

La trasformazione dell’OA

• _{il concetto OpenArchive si trasforma: da pre-print}

diviene e-print, perde il prefisso "pre" a ricomprendere tutti i documenti

• il vero OA è un deposito di documenti appartenenti a

una determinata comunità

• _{ruolo dell'EPrints di Harnad è assai più ampio rispetto}

al semplice pre-print server

• combatte il copyright iniquo con le stesse armi del

(36)

Il vero OA

• _{modello che porta dentro il "seme" della}

parola "disseminazione”

• _{concetto profondamente diverso da quello}

della “distribuzione”

• _{disseminazione implica una crescita}

• _{incrementato a tal punto da evolvere e}

divenire una forma di comunicazione e

immagazzinamento della produzione

scientifica nella sua interezza

(37)

“In the life, there are no

solution. There are forces in

motion: they need to be created

and solutions follow”

[In: Volo di notte, Antoine de Saint-Exupéry, Chap. 19]