1
Laura Ciancio
Responsabile Area per lo sviluppo dei servizi di digitalizzazione e per l’accesso ai documenti, TDI e Internet Culturale - ICCU - Roma
Internet Culturale tra presente e futuro
Milano, 15 settembre 2020
• III Conferenza nazionale delle biblioteche della DG Beni librari del Mibac, febbraio 2001. Studio di fattibilità da qui nasce il progetto della Biblioteca Digitale Italiana.
• definire regole e standard nazionali per inserirsi nel contesto europeo.
– gruppo di studio 2000-2002, per lo studio dei metadati e della conservazione di documenti digitali e per favorire l'interoperabilità di metadati nei diversi settori.
Nel 2003 Comitato MAG che ha promosso la diffusione ed evoluzione del set di Metadati Amministrativi Gestionali (MAG)
• creare coordinamento delle iniziative e finanziamenti alle digitalizzazioni del patrimonio librario antico e dei cataloghi
– Comitato guida
• Dal 2002 fino al 2011 Progetto MINERVA (Ministrial Network for Valorising Activities in digitisation) coordinato dall’Italia – Mibact. Rete di
coordinamento tra i paesi europei e curatore di manualistica di buone pratiche. – Dal 2008 il gruppo italiano sede all’ICCU - Europeana collections
• Lo Studio di fattibilità per la biblioteca digitale (1999), è il quadro di riferimento per la III Conferenza nazionale delle biblioteche della DG Beni librari del Mibac, febbraio 2001. Da qui prende avvio il progetto della Biblioteca Digitale Italiana.
• Necessario definire regole e standard nazionali per inserirsi nel
contesto europeo, visto la carenza di coordinamento delle iniziative e di standard comuni, applicati dalla comunità.
• Gruppo di studio 2000-2002 che ha operato per l’applicazione
uniforme di standard di metadati per la ricerca e la conservazione di documenti digitali e per favorire l'interoperabilità di metadati nei diversi settori. Nel 2003 prende il nome di Comitato MAG che ha promosso la diffusione ed evoluzione del set di Metadati
Amministrativi Gestionali (MAG)
3
Internet Culturale - 2005 integrazione tra cultura digitale, patrimonio bibliotecario e turismo nell’ambito del progetto BDI e NTC (Biblioteca digitale italiana e Network turistico culturale).
La v. 2.0 giugno 2011 definisce nuova mission e destinatari. il
sottotitolo “Cataloghi e collezioni digitali delle biblioteche italiane”
evoca le finalità. L’adozione del motore di ricerca, l’applicazione di standard per tutti i suoi processi, e il conseguente e costante
arricchimento digitale, hanno reso Internet Culturale, un punto di riferimento nazionale per le biblioteche e per gli utenti.
• la funzione Full-Text, per la ricerca di parole contenute nei file immagine di periodici e libri a stampa
• un viewer in HTML5 per la visibilità delle immagini digitali su tablet e smartphone e responsive design, e per il Full-text
La v. 3.0 giugno 2018 amplia l’offerta (specializzazione PERIODICI), preceduta da una serie attività incluse nel progetto finalizzate al
miglioramento dei servizi
• Codificato metodologie e processi produttivi
• Standard nella produzione del digitale:
– Formati di conservazione e di fruizione;
– Modalità della scansione - documentare il manufatto
• Standard nella produzione dei metadati
– Applicazione dello schema MAG con le norme redazionali per la pubblicazione su Internet Culturale
– Controlli di qualità dei prodotti
• The Open Archives Initiative Protocol for Metadata Harvesting (OAI-PMH)
• Teca digitale (repository) per la gestione di collezioni digitali, servizio gratuito per le istituzioni.
• Assistenza alla produzione di collezioni digitali dell’Area del digitale dell’ICCU
5
ACCESSIBILITA’
VALORI SEMANTICI
RICERCABILI TA’
Portale aggregatore di biblioteche digitali – 15.500.000 file digitali
Licenze di distribuzione applicate da Internet Culturale
• file digitali (risoluzione web), non a scopo di lucro, accesso libero e gratuito su cui si applica una licenza Creative Commons (CC BY-NC-SA 3.0 IT) di
attribuzione, non commerciale. Per l'uso commerciale è fatto obbligo di rivolgersi ai proprietari dei
contenuti digitali.
• metadati relativi ai contenuti digitali si applica una licenza Creative Commons "CC0 1.0 Universal
Public Domain Dedication";
7
(CC BY-NC-SA 3.0 IT)
• Condividere — riprodurre, distribuire, comunicare al pubblico, esporre in pubblico, rappresentare, eseguire e recitare questo materiale con qualsiasi mezzo e formato
• Modificare — remixare, trasformare il materiale e basarti su di esso per le tue opere
Alle seguenti condizioni
• Attribuzione — Devi riconoscere una menzione di paternità adeguata, fornire un link alla licenza e indicare se sono state effettuate delle modifiche. Puoi fare ciò in qualsiasi maniera
ragionevole possibile, ma non con modalità tali da suggerire che il licenziante avalli te o il tuo utilizzo del materiale.
• Non Commerciale — Non puoi utilizzare il materiale per scopi commerciali.
• Stessa Licenza — Se remixi, trasformi il materiale o ti basi su di esso, devi distribuire i tuoi contributi con la stessa licenza del materiale originario.
9
google like - Cataloghi
I diversi cataloghi alimentano il MetaIndice attraverso formati di scambio: DC, tramite scarichi
Unimarc trimestrali per Opac SBN, generando dunque un
disallineamento, anche con gli altri db ICCU.
I contenuti indicizzati da Solr rispondono alla ricerca semplice alla google like.
Il sistema attuale (progetto del 2009) notifica tutte le occorrenze sia che si trovino nel catalogo sia che si trovino nella BD.
Sovrapposizioni inutili tra cataloghi bibliografici e biblioteca digitale.
Nel progetto SRI viene
superata la sovrapposizione tra catalogo bibliografico e
catalogo digitale
11
google like - Biblioteca digitale
Il catalogo del digitale risponde dei metadati creati con schema MAG e METS di Google.
Solr indicizza tutti i contenuti nei metadati fornendo dei filtri ulteriori per la ricerca con le faccette a sinistra della pagina di risposta.
Il cuore della Biblioteca digitale sono i metadati e il viewer.
Il viewer unico fu scelto per facilitare l’esperienza dell’utente, e sfrutta i tag del MAG per le sue prestazioni.
13
ricerca dei contenuti: Full-Text
15
ricerca dei periodici: per titolo di testata
3.112 titoli di periodici italiani. 890 della Lombardia
17
rappresentazione dei titoli ad albero
19
SOLR è in grado di indicizzare con processi specifici immagini senza OCR.
Dunque è possibile la ricerca Full-Text anche per quei periodici privi del pdf/OCR
21
Presentazione delle immagini: funzioni del viewer
ingrandimento
23
ritaglio e riuso – licenza d’uso
puntamento all’indice o alle unità codicologiche
25
http://www.internetculturale.it/jmms/iccuviewer/iccu.jsp?id=oai%3Awww.internetculturale.sbn.it%2FTeca%3A20%3ANT0000%3AN%3AMIL0869122&mode=all&t eca=MagTeca+-+ICCU&fulltext=1
27
ricerca per collezione : 215 collezioni digitali
ricerca per istituto : sono presenti 166 schede su 280 partner
29
Ricerca per tipologia
31
ricerca dalla Mappa del Thesauro
33
Indice MAG.xml della BIBLIOTECA DIGITALE
15 data provider vengono harvestati periodicamente con
protocollo OAI-PMH per la raccolta dei metadati MAG e
METS di Google.
35
Pannello di
controllo di staging e di esercizio
Harvesting e Ottimizzazioni su 15 provider
Full-Text - SOLR
Normalizzazioni
Esportazioni in csv/mag
Allineamento degli indici
Emeroteca
Diritti biblioteche 15 milioni di immagini ; 370 mila
audio ; 30.500 trascrizioni digitali;
1.334.000 file OCR (+ ocr di Solr);
1.067.000 metadati
Governo della Biblioteca digitale
36
Teca Digitale Italiana (ex MagTeca)
import
export
oai pmh
editor mag
(genera sez. BIB da Opac sbn,
scrivendo il solo BID)
normalizza
statistiche
sets oai provider
167 (su 215) collezioni digitali ; 6.500.000 immagini ; 53.000 file sonori ; 387.000 metadati
Teca Digitale Italiana repository per la gestione
di collezioni digitali – Editor di metadati
tipologie
edizioni periodici immagini sonoro
manoscritto cartografia spartiti-libretti bandi
37
contenuti della Biblioteca Digitale
Statistiche visitatori Internet Culturale 2019
39
Dati sull’uso dei servizi digitali delle biblioteche italiane ai tempi
del Covid 19
A confronto i
primi 4 mesi
del 2020 con i
primi 4 mesi
del 2019.
SRI Sistema di Ricerca Integrato è un progetto dell’ICCU
Accesso unico configurato sul profilo di ricerca SBN, con Edit16 e Manusonline, arricchito delle informazioni sulla presenza di copie digitali qualora presenti nel catalogo collettivo altrimenti arricchito dall’Indice unico del digitale. Una rappresentazione grafica per ogni tipo di documento (libro, sonoro, score,
grafico, ecc.
Integrazione non solo nella ricerca: le diverse basi dati vengono rimodellate e reingegnerizzate e comprese dentro questo unico complesso architetturale.
La biblioteca digitale di IC diventa Indice unico del digitale
SRI Sistema di Ricerca Integrato
41