• Non ci sono risultati.

Per digitalizzazione s'intende il processo di trasformazione dello stato originale di oggetti, quali documenti cartacei, di pellicole fotografiche, cinematografiche, microfiche o microfilm, lastre o pellicole radiologiche, cassette e nastri magnetici audio o video, dal formato analogico a quello digitale, interpretabile da computer. Il formato digitale è un codice binario in cui tutto è rappresentato da combinazioni di zero od uno, quindi da stati del tipo acceso/spento.

Un Archivio Istituzionale (Institutional Repository, IR) – oltre a rappresentare un luogo virtuale per l’auto-archiviazione dei contenuti di ricerca prodotti direttamente in formato digitale - può includere nelle loro collezioni anche i contenuti digitalizzati10:

10

La digitalizzazione dei materiali protetti da COPYRIGHT è possibile invocando l’Istituto del fair use e rendendo accessibili all’utenza solo brevi frammenti di testo, detti snippet. L’idea è quella che gli utenti potessero ricercare

163 A Repository […] can also contain the Institutions Digital Library, the collection of printed and manuscript documents, public archives, and graphic material, originating from the Institution or elsewhere, that the University has converted to digital form for use within the University, and generally available to anyone […] The main reasons to digitize are to enhance access and improve preservation. It is a means of creating a database of materials like Theses and Dissertations and other resources that worth preservation [Eke, 2011, online, non impaginato].

Un esempio dell’IR che ospita anche i prodotti digitalizzati è “Labordoc” (implementato sul Software Open Source Invenio). Esso contiene più di 80.000 risorse in versione digitale dell’International Labor Organization a partire dal 1919 [V. sito: Labordoc].

“Ma se non viene digitalizzato e reso accessibile online, questo patrimonio domani potrebbe non riuscire a svolgere il suo ruolo determinante nella futura geografia della conoscenza” [De Robbio, 2007, p.284].

L’espressione italiana:

“Digitalizzazione” indica tendenzialmente il processo di “Conservazione digitale” di documenti analogici, mentre

“Conservazione del documento” (della memoria/ informazione/ risorsa digitale) è la più comune traduzione dell’espressione Digital Preservation [Faiella, 2000, p.64]

La digitalizzazione insieme con conservazione del materiale negli Archivi Istituzionali non deve essere

la singola soluzione del COME, piuttosto che del CHI o del CHE COSA, a fornire una rete di sicurezza in grado di garantire l’ACCESSO alla documentazione elettronica nel FUTURO, che si potrà costruire invece solo assicurando STRATEGIE EFFICACI ed INFRASTRUTTURE organizzative ADEGUATE a fronteggiare i problemi attuali e quelli futuri [Faiella, 2000, p.68] I dati del file digitalizzato (scansionato) possono essere “catturati” tramite:

BarCode (1D e 2D);

Field OCR (Optical Character Recognition) per il riconoscimento di parole-numeri su zone specifiche;

Free Form OCR (riconoscimento “semantico” del campo: ricerca nel documento del campo voluto e cattura del contenuto);

OMR (Optical Mark Recognition) per il riconoscimento segni o box anneriti; ICR per il riconoscimento della scrittura umana

[V. sito: “Archiviazione documentale: 2C Solution”]. I file digitalizzati possono essere:

a) ulteriormente elaborati per eventuali attività di: pulizia e riconoscimento del testo (OCR);

riconoscimento delle marcature su questionari, check-list e simili tramite OMR; creazione o conversione file in formato Acrobat (PDF e PDF/A);

masterizzazione di file immagine per una successiva elaborazione CAD (Computing Aided Design)

b) indicizzati in modo:

manuale da professionisti del settore o semi-automatico o automatico.

Per l’indicizzazione automatica basata su parole-chiave del materiale digitalizzato, negli IR in Italia può essere impiegato il Thesaurus del Nuovo Soggettario o un Thesaurus Specializzato creato a livello locale e basato sulle voci del Thesaurus del Nuovo Soggettario e con esso interoperabile. Tale prospettiva di indicizzazione dei documenti

liberamente il materiale e visualizzare i risultati in un gruppo (cluster) di 2-3 frasi in cui compare l’elemento ricercato entro un testo connesso con il mercato editoriale (per l’eventuale acquisto qualora in commercio) o presente in qualche Biblioteca (se fuori dal circuito commerciale. In questo modo si da accesso a libri che altrimenti non si sarebbero mai potuti ottenere – come è in larga parte tutt'ora. A consultazione per intero, previa digitalizzazione, dei libri di pubblico dominio (70 anni dopo la morte dell’autore) non presenta aspetti particolarmente problematici.

164

potrebbe rappresentare la migliore soluzione per uniformare il trattamento semantico delle risorse documentarie istituzionali all’interno di Enti diversi, come pure per correlare fra loro IR e OPAC, strutture documentarie sicuramente raccordabili e che possono superare ogni forma di incomunicabilità [Guerrini, 2010a, p.48].

In seguito saranno esposte informazioni, elencate fonti, e forniti rimandi di approfondimento relativamente al tema del presente paragrafo.

Supporto al processo OCR (Optical Character Recognition)

“Sperimentazione e analisi di tecniche di Riconoscimento dei Caratteri (OCR) per la

digitalizzazione di documenti” [Caruso]:

<https://www.cnipa.gov.it/site/_files/Refo2_RS_11.0_Caruso.pdf>

La relazione viene messa a disposizione degli esperti e specialisti del settore, nel mondo accademico ed in quello della ricerca industriale.

Software FineReader per Linux: <http://www.abbyy.com/ocr_sdk_linux/>

Tale Software puo’ essere integrato nel sistema per realizzare un servizio di OCR scalabile (es. durante l’ingestion, la dematerializzazione). Le caratteristiche del FineReader:

trascrizione del testo, indicizzazione, ricerca full-text;

capacità di trascrizione testo anche se organizzato in colonne o in modo strutturato nella pagina e diversi formati di outputi;

trascrizione automatica delle immagini (TIFF, JPG) in testo (file di testo, XML, PDF con testo selezionabile) e ricerca full-text tramite trascrizione XML;

riconoscimento multi-lingua tramite l’utilizzo di dizionari a supporto di più di 190 lingue nazionali antiche e moderne.

Il testo ottenuto con OCR è una base essenziale per ulteriori analisi semantiche che permettono di identificare concetti all’interno dei testi.

Le “Linee Guida sulla digitalizzazione”.

Il Gruppo di lavoro dell’Archivio digitale PHAIDRA, Padova: <https://phaidra.cab.unipd.it/static/linee-guida-digitalizzazione.pdf>

Le Linee descrivono le procedure coinvolte nella digitalizzazione “in-house” o “in outsourcing”, in coerenza con le Buone Pratiche e Standard nazionali e internazionali per una riproduzione qualitativa di documenti.

In linea di principio, tutti i Progetti di digitalizzazione devono essere coerenti con uno o più dei seguenti scopi generali:

valorizzare il patrimonio documentale rilevante a fini scientifici e culturali; ampliare l'accesso del pubblico al medesimo patrimonio documentale;

favorire gli studi interdisciplinari sul materiale digitalizzato e promuovere la collaborazione tra diverse istituzioni del territorio;

promuovere la conoscenza di collezioni locali o uniche, mediante la loro diffusione su larga scala;

creare collezioni virtuali attraverso l'integrazione di vari formati o di materiali distribuiti in luoghi diversi;

limitare la consultazione diretta di documenti originali in particolari condizioni di criticità;

facilitare l'accesso a materiale di difficile fruizione;

assicurare che il materiale documentale sia disponibile alle future generazioni di lettori;

velocizzare la gestione documentale di un’Istituzione.

165 immagazzinarli e, inoltre, aumenta di molto la loro vita.

Il passaggio dei documenti al digitale permette una loro migliore Classificazione e di conseguenza una semplice e veloce reperibilità.

“Guidelines for digitization projects” (International Federation of Library Associations and Institutions/IFLA): <http://archive.ifla.org/VII/s19/pubs/digit-guide.pdf>

Criteri per la selezione dei documenti per la digitalizzazione; Conversione dei documenti in digitale;

Controllo di qualità;

Gestione delle collezioni dei documenti digitalizzati; Aspetti legali.

In certi stati, come la Francia, il Ministero della ricerca si fa carico di tutelare le Biblioteche digitali nel caso gli autori reclamassero diritti per il materiale digitalizzato, in quanto anche la Francia, essendo come l’ITALIA in regime di DIRITTO d’AUTORE e non di Copyright, necessiterebbe anche dell’autorizzazione dell’autore prima di mettere a disposizione il lavoro nella versione digitale [De Robbio, 2007, p.132];

Costi;

Programmazione di risorse umane;

Sviluppo e mantenimento di interfacce web per documenti digitalizzati; Preservazione dei contenuti digitali.

State-of-the-art Tools for Text Digitisation:

<http://tpdl2013.upatras.gr/tut-digit.php>

Tecniche di digitalizzazione del testo;

Identificazione dei punti di forza e di debolezza di usabilità di strumenti di digitalizzazione esistenti;

Raggiungimento di una migliore conoscenza sui requisiti e gli effetti dell’integrazione degli strumenti di digitalizzazione nel flusso di lavoro di produzione dei documenti digitali.

Linee Guida e tecniche necessari al coordinamento dei Progetti di Digitalizzazione.

Istituto centrale per il Catalogo Unico delle Biblioteche italiane e per le informazioni bibliografiche (ICCU):

<http://www.iccu.sbn.it/opencms/opencms/it/main/bdi/linee_guida_standard/>

Tali Linee di indirizzo sono necessarie agli Enti che stanno già programmando, eseguendo o gestendo Progetti di digitalizzazione e funzionali alla creazione di un sistema di servizi informativi e di valorizzazione del patrimonio culturale in Italia.

“Linee di indirizzo per i progetti di digitalizzazione del Materiale Fotografico”: <http://www.iccu.sbn.it/upload/documenti/Linee_guida_fotografie.pdf>

“Linee Guida per la digitalizzazione del materiale Cartografico“:

<http://www.iccu.sbn.it/opencms/export/sites/iccu/documenti/linee_guida_digit_cartografia_0 5_2006.pdf>

Linee Guida per la digitalizzazione di bandi, manifesti e fogli volanti:

<http://www.iccu.sbn.it/opencms/export/sites/iccu/documenti/linee_guida_bandi_sett.2006.pd f>

Linee Guida tecniche per i programmi di creazione di contenuti culturali digitali: <http://www.minervaeurope.org/publications/Linee_%20guida_%20tecniche.pdf>;

<http://www.minervaeurope.org/publications/technicalguidelines_it.htm>

“Tecniche di Digitalizzazione - Istituto Centrale Beni Sonori e Audiovisivi”:

<http://ceaih.dds.it/index.php?it/137/tecniche-di-digitalizzazione-istituto-centrale-beni-sonori- e-audiovisivi>

166

Progetto MINERVA: <http://www.minervaeurope.org/publications/buonepratiche.htm>

Identificazione delle buone pratiche e dei centri di competenza per la digitalizzazione. “Collection Digitization Policy”. National Library of Australia:

<http://www.nla.gov.au/policy/digitisation.html>

Questa Politica viene monitorata annualmente dalla “Digitisation & Photography Branche“ e dal “Library’s Collection Development and Management Committee“ per verificare i

cambiamenti nelle politiche delle Biblioteche relative alla pianificazione strategica che tiene conto degli sviluppi del settore in attività di digitalizzazione.

“The NINCH Guide to Good Practice in the Digital Representation and Management of Cultural Heritage Materials”: <http://www.nyu.edu/its/humanities/ninchguide/>

Buone pratiche nella digitalizzazione e nella gestione dei materiali del patrimonio culturale: Project Planning;

Selezione dei materiali: un processo iterativo; Gestione dei diritti;

Digitalizzazione e codifica dei testi; Cattura e gestione delle immagini; Cattura di audio/video e loro gestione; Controllo e garanzia di qualita’; Distribuzione;

Sostenibilita’: modelli per il finanziamento a lungo termine; Valutazione di Progetti dagli utenti;

Gestione di risorse digitali; Preservazione di risorse digitali.

“Manuale virtuale per la Progettazione digitale” .

Regione Toscana. Settore biblioteche, archivi, istituzioni culturali e catalogo dei beni culturali: <http://www.cultura.toscana.it/biblioteche/biblioteca_digitale/manuale/>

Definzione del Progetto; Produzione;

Metadati;

Pubblicazione sul web; Conservazione;

Costi.

“Minimum Digitization. Capture Recommendations”.

The Association for Library Collections and Technical Services Preservation and

Reformatting Section: <http://connect.ala.org/files/43293/MCTF_Draft_Recommendation.pdf>

Le Raccomandazioni per le Biblioteche che hanno intenzione di digitalizzare contenuti disponibili (“static media” e “time-based media”) e conservarli a lungo termine. Le Raccomandazioni hanno l’obiettivo di dare indicazioni di base in modo che il lavoro di digitalizzazione possa essere fruibile anche in futuro.

“Il patrimonio Culturale Europeo: basta un clic.

Progressi in materia di digitalizzazione e accessibilità on-line del materiale culturale e della conservazione digitale nell'UE”.

Comunicazione della Commissione al Consiglio, al Parlamento europeo:

<http://eur-lex.europa.eu/LexUriServ/LexUriServ.do?uri=CELEX:52008DC0513:IT:NOT> La presente comunicazione illustra i progressi realizzati fino a questo momento e le misure da adottare per la creazione del Portale EUROPEANA: una biblioteca digitale europea che offre l’accesso a oltre 5 milioni di libri, giornali, filmati, carte, fotografie e documenti digitalizzati, provenienti da oltre 1000 istituzioni culturali: <http://www.europeana.eu/>

167 “Raccomandazione sulla “Digitalizzazione e sulla conservazione digitale nel lungo

periodo”:

<

http://www.libereurope.eu/news/european-commission%E2%80%99s-recommendation-on- digitisation-and-digital-preservation

>

La Commissione Europea invita gli stati membri di concentrare le risorse per la digitalizzazione del materiale culturale rendendolo disponibile attraverso EUROPEANA.

Raccomandazione sulla ”Digitalizzazione e l’accessibilità in rete dei materiali culturali e sulla conservazione digitale”:

<

http://eur-

lex.europa.eu/LexUriServ/LexUriServ.do?uri=OJ:L:2011:283:0039:0045:IT:PDF

>

La Commissione sottolinea la necessità di rendere accessibili i materiali digitalizzati attraverso il Portale EUROPEANA, di garantire l’uso di norme comuni per la digitalizzazione, per favorire l’interoperabilità, di rendere disponibili a titolo gratuito i metadati esistenti, con l’obiettivo finale di rendere accessibili in EUROPEANA tutte le principali opere in pubblico dominio pubblicate in Europa, a partire dal 2015 [Casella, 2013, pp. 227, 228].

“Digitizing Dissertations for an Institutional Repository: A Process and Cost Analysis”: <http://www.ncbi.nlm.nih.gov/pmc/articles/PMC2479051/>

La descrizione di un Progetto di digitalizzazione delle Dissertazioni per un Archivio Istituzionale. “Each Dissertation was:

scanned,

reviewed for Quality Control, enhanced with a Table of Contents,

processed through an Optical Character Recognition function, and added to the Institutional Repository”.

Alcune semplici Guide online a supporto dei processi di digitalizzazione di testi e immagini

“Uso dello scanner per digitalizzare testi ed immagini”:

<http://www.multimediadidattica.it/dm/scanner/scanner.htm>

”Come digitalizzare un testo con lo scanner e convertirlo in .doc, .txt, .pdf, ecc.”:

<http://www.programmifree.com/guide/digitalizzare-scanner.htm>

Alcuni casi d’uso della rappresentazione dei contenuti digitalizzati

“Integrating Digitized material into an Institutional Repository:

the case of “SOMNI” and “EUROPEANA REGIA” at the Universitat De València”: <http://indicotest.eblida.org/getFile.py/access?contribId=57&sessionId=12&resId=0&material Id=0&confId=22>

La descrizione di un Progetto di digitalizzazione dei Manoscritti e il loro deposito nell’Archivio Istituzionale dell’Università di Valentia (Figura 42) .

168 Figura 42. Rappresentazione dei digitalizzati nell’Archivio Istituzionale dell’Università di Valentia

L’Archivio Istituzionale DSpace@Cambridge: <http://www.lib.cam.ac.uk/repository/theses/>

prevede la possibilità del deposito delle Tesi disponibili originalmente nelle copie cartacee (“Deposit of old Thesis“) (Figura 43), dopo essere digitalizzate e convertite in determinati formati.

Figura 43. “Deposit of old Thesis“ nell’Archivio Istituzionale DSpace@Cambridge L’Archivio Istituzionale Phaidra (Università di Vienna):

<https://fedora.phaidra.univie.ac.at/fedora/get/o:69507/bdef:Book/view>

169 Figura 44. Rappresentazione dei contenuti di una Tesi digitalizzata nell’Archivio PHAIDRA

(Università di Vienna)