• Non ci sono risultati.

6. Esperienze internazionali nell’ambito dell’interoperabilità: dalla teoria alla

6.1 Il progetto MACS

Il World Wide Web, ormai, offre la possibilità ai propri utenti di interrogare qualsiasi catalogo online, tuttavia un importante ostacolo ad un recupero bibliografico esaustivo è l’impossibilità di poter ricercare nel campo soggetto immettendo il termine di ricerca in una lingua diversa da quella del catalogo consultato. Infatti, per molte biblioteche nazionali europee è diventato un valore aggiunto offrire nei propri OPAC un accesso per soggetto impiegando molte lingue.

Tutti i vocabolari controllati dovrebbero eseguire le stesse scelte morfologiche e semantiche relativamente ai termini, ai nomi o ai soggetti in modo da garantire un’uniformità ogni volta che questi stessi ricorrono nei record bibliografici o nei metadati.

Il progetto MACS, iniziato nel 1997 sotto gli auspici della Conference of European National Libraries (CENL), è un’iniziativa europea che ha lo scopo di reperire tutti i documenti pertinenti, indicizzati dalle biblioteche associate al progetto, a partire da una sola interrogazione fatta nella lingua scelta dall’utente (inglese, francese e tedesco).156

Le biblioteche che partecipano al progetto sono quattro: la Swiss National Library (SNL), leader del progetto,157 la Bibliotèque Nationale de France (BNF), la British Library (BL) e la Die Deutsche Nationalbibliothek (DDB).

La ricerca multilingua è resa possibile grazie all’uso di concordanze tra le intestazioni per soggetto dei tre linguaggi d’indicizzazione che sono creati e alimentati dalle succitate biblioteche e che sono ampiamente usati per creare

context : Cologne conference on interoperability and semantics in knowledge organization, July 19th and 20th 2010.

<http://linux2.fbi.fh-koeln.de/cisko2010/mp3/2-01_dextre_clarke.mp3> [MP3].

156LANDRY PATRICE. Providing multilingual subject access through linking of subject heading languages: the MACS approach / Patrice Landry. – In: Cataloging & classification quarterly. – V. 31, f. 3-4 (2004). – P. 177-191.

<http://www.cacaoproject.eu/fileadmin/media/AT4DL/paper-09.pdf>;

CLAVEL-MERRIN GENEVIEVE. MACS : Multilingual Access to Subject : un authority file virtuale multilingue / Genevieve Clavel Merrin. – In: Authority control : definizione ed esperienze internazionali / Mauro Guerrini, Barbara Tillet. – Firenze : FUP, ©2003. – P. 237-243.

<http://www.sba.unifi.it/ac/relazioni/clavel-merrin_ita.pdf>;

LANDRY PATRICE. La recherche par sujet multilingue dans les catalogues de bibliothèque: la solution MACS / Patrice Landry. – In: Actes du premier congrès de l’Association Internationale Francophone dés Bibliothecairés et Documentalistes, Montréal, 3-6 août 2008. <http://aifbd.org/doc/actes_montreal.pdf>.

157La Svizzera, fin dall’inizio, ha avuto un interesse particolare per la realizzazione del progetto perché è un paese in cui francese, tedesco e italiano sono lingue ufficiali e nazionali (il romancio è lingua nazionale dal 1938 ed è parzialmente lingua ufficiale dal 1996) e quindi vi è la necessità di ubbidire ad esigenze di multilinguismo.

Tesi di dottorato di Elisabetta Viti, discussa presso l’Università degli Studi di Udine 137

accessi per soggetto a milioni di documenti: SWD/RSWK

(Schalagwortnormadatei/Regeln fur den Schlagwortkatalog, per la lingua tedesca, utilizzati oltre che in Germania anche in Austria e Svizzera), RAMEAU (Répertoire d’Autorité-Matièere Encyclopédique et Alphabétique, per la lingua francese, utilizzato in Francia e nei paesi Francofoni) e le LCSH (Library of Congress Subject Headings, per la lingua inglese, adottato anche dalla British Library, nel 1995, oltre che da altre biblioteche del mondo). Di questi stessi non viene fatta né una traduzione né una fusione né viene costruito un nuovo vocabolario ma le singole intestazioni vengono analizzate per verificare se è possibile individuare un’equivalenza esatta o parziale, di natura semplice o composta. Quindi non ci sono una lingua o un linguaggio d’indicizzazione preferiti rispetto agli altri ma MACS sviluppa un approccio base sull’uguaglianza e sull’autonomia delle lingue, stabilendo delle equivalenze fisse considerate come differenti grappoli concettuali e validati secondo la coerenza dei risultati di ricerca.

Il gruppo di ricerca ha affrontato le problematiche delle varie tipologie di equivalenza 1:1 e 1:n, determinando che un’intestazione per soggetto in un vocabolario fonte può essere collegata a più di una intestazione per soggetto in altre lingue.

Si possono riassumere le seguenti tipologie:

1. Intestazione A= Intestazione B o Intestazione C; 2. Intestazione A= Intestazione B e Intestazione C

Per es.

LCSH SWD/RSWK RAMEAU

Child actors = SchauspielerAND Kind = Enfants acteur

Si può anche presentare il caso in cui alcune intestazioni per soggetto non abbiano l’equivalente in altre lingue, come per esempio:

LCSH SWD/RSWK RAMEAU

Living newspaper Kasperleteather ---

Le scelte di base del progetto MACS possono essere così riassunte:158

158 CESTONE GIOVANNA. L’allestimento dei thesauri multilingue: problemi e prospettive / Giovanna Cestone ; relatore Anna Lucarelli, correlatore Pino Buizza. – Tesi di Master universitario di secondo livello in Archivistica, biblioteconomia e codicologia. – Firenze : Università degli studi di Firenze, anno accademico 2005-2006. – P. 72-75

Tesi di dottorato di Elisabetta Viti, discussa presso l’Università degli Studi di Udine 138

1. tutte le lingue hanno parità di status, come indicato dalla norma ISO 5964 e dalle Linee guida dell’IFLA. Le equivalenze interlinguistiche vengono considerate grappoli concettuali, a cui viene attributo un identificativo;

2. sono mappate solo le intestazioni accettate. Le strutture gerarchiche e le relazioni thesaurali non sono mappate; 3. non tutte le intestazioni hanno un equivalente nelle altre

lingue ma vengono inserite comunque nel sistema per non precludere possibilità future.

La metodologia di mappatura usata dal MACS prende in considerazione i collegamenti analizzando la corrispondenza concettuale a livello terminologico (intestazioni di soggetto), a livello semantico (authority record) e a livello sintattico (l’indicizzazione). Questo progetto assolve al proprio scopo nel momento in cui il lettore riceve risultati coerenti e rilevanti da tutti i cataloghi partecipanti al progetto, indipendentemente dalla lingua usata per impostare la ricerca.

Nel periodo 1997-1999 si è sviluppato uno studio di fattibilità, con la creazione di un prototipo tra il 2000 e il 2001.

Nel prototipo è stato analizzato un sottoinsieme di intestazioni, comuni ai tre linguaggi, nel campo dello Sport e del Teatro, aggiungendo anche 500 intestazioni usate con maggior frequenza per indicizzare i documenti della Bibliotèque Nationale de France e successivamentele intestazioni loro equivalenti in LCSH e SWD. Per un totale di 3000 intestazioni e 1200 collegamenti creati tra concetti.

Nel caso dello Sport, le influenze culturali e nazionali in ambiti linguistici diversi sono limitate e quindi la terminologia dei tre linguaggi risulta semanticamente coincidente, infatti:

86% delle intestazioni sono correlate nei tre strumenti di indicizzazione;

8% delle intestazioni sono correlate in due strumenti di indicizzazione;

6% delle intestazioni non sono correlate.

Nel caso del Teatro, le influenze culturali e nazionali in ambiti linguistici diversi sono più marcate e quindi le percentuali di correlazione semantica si abbassano:

Tesi di dottorato di Elisabetta Viti, discussa presso l’Università degli Studi di Udine 139

60% delle intestazioni sono correlate nei tre strumenti di indicizzazione;

18% delle intestazioni sono correlate in due strumenti di indicizzazione;

22% delle intestazioni non sono correlate.

Il prototipo è un’applicazione web costituita da due moduli:

1. un’interfaccia gestionale di collegamento, che permette la gestione e la creazione dei collegamenti. Ogni lingua viene gestita autonomamente, esternamente al progetto e tutti i linguaggi hanno pari status. Sono oggetto di collegamento solo le intestazioni accettate, la struttura gerarchica e le relazioni thesaurali, in particolare di sinonimia, non vengono prese in considerazione. Qualora un’intestazione non abbia un’equivalenza corrispondente negli altri sistemi, viene registrata comunque perché il concetto potrebbe essere potenzialmente utile per applicazioni future;

2. un’interfaccia di ricerca per l’utente finale, che permette un’interrogazione simultanea per soggetto in più cataloghi, grazie al protocollo Z39.50. L’utente scegliendo la terminologia controllata da una delle tre liste di intestazioni per soggetto (LCSH, SWD/RSWK e RAMEAU), dopo aver selezionato uno o più cataloghi, può scegliere di ottenere immediatamente i record bibliografici o una lista di intestazioni per soggetto che gli consente di raffinare la ricerca.

Per rendere il progetto meno oneroso, in un primo momento è stata adottata la soluzione pragmatica di alimentare la base dati dei legami più velocemente, riutilizzando le equivalenze RAMEAU-LCSH registrate dentro le notizie di autorità di RAMEAU. Sono state estratte ed introdotte nella base dei legami di MACS 30.000 delle 88.000 equivalenze presenti dentro l’archivio di autorità di RAMEAU e i legami sono stati poi validati dai bibliotecari.

Nel 2005 la Biblioteca nazionale svizzera si è posta l’obiettivo di rendere operativo il progetto, delineando tre scopi principali:

1. integrare i compiti di creazione dei legami dentro il processo di lavoro di ciascuna istituzione partecipante;

2. sviluppare un’interfaccia di ricerca che permetta di utilizzare i legami per la ricerca;

3. realizzare una struttura amministrativa permanente per coordinare il lavoro relativo ai legami. Per quanto riguarda la produzione dei

Tesi di dottorato di Elisabetta Viti, discussa presso l’Università degli Studi di Udine 140

legami si è iniziato ad aggiungere le vedette SWD dentro i legami contenenti le vedette di RAMEAU e LCSH.

Nell’ottobre del 2008, il progetto ha raggiunto una tappa importante con l’aggiornamento mensile delle vedette per materia dei singoli sistemi di indicizzazione, messe a disposizione da ciascuna biblioteca, dentro la base di gestione dei legami MACS, e con l’implementazione dei legami RAMEAU-LCSH inviati dalla base dati della Biblioteca nazionale francese. Dopo dieci anni dalla sua ideazione, il progetto è passato allo stato operativo: i collegamenti tra intestazioni per soggetto vengono impiegati nel catalogo integrato di The European Library, un portale di ricerca che fornisce l’accesso a 11 milioni di risorse informative di 43 biblioteche nazionali europee.

The European Library è stata ufficialmente riconosciuta dalla Commissione europea (i partner del MACS sono membri del CENL) come fondamento per la struttura organizzativa alla base della creazione di Europeana (European Digital Library, Museum and Archive), che ha sviluppato un sito web che fornisce l’accesso a 2 milioni di oggetti digitali (libri, riviste, manoscritti, carte d’archivio, film, foto, dipinti, musica, mappe).

Un primo prototipo di The European Library è stato sviluppato nel 2007 con ulteriori versioni successive. Ad oggi, la maschera di ricerca permette di interrogare simultaneamente con un termine, per esempio in lingua francese, tutti i cataloghi delle biblioteche nazionali europee che aderiscono al progetto e di raffinare la ricerca, scegliendo la tipologia di materiale (collezioni digitali, musica, immagini, etc.) e l’opzione di interrogazione sul full-text.

Tesi di dottorato di Elisabetta Viti, discussa presso l’Università degli Studi di Udine 141

L’importanza acquisita dai linguaggi di indicizzazione in Europa, rappresenta una base solida per lo sviluppo di nuove iniziative. Per esempio nel progetto TELplus, che è un ampliamento di The European Library viene testata la possibilità della creazione semiautomatica di concordanze tra vocabolari e l’impiego di MACS è utile per verificare l’esattezza dei metodi testati. Infatti, nel rapporto del progetto di ricerca tra le tappe menzionate vi è la creazione di un prototipo in grado di gestire la ricerca sul full-text.159

Il progetto TELplus ha come scopo principale di sviluppare un allineamento automatico di vocabolari, usando i dati semantici dei vocabolari controllati forniti da MACS, con una possibile strategia complementare di collegamenti. Il progetto TELplus ha dimostrato che nel 50% dei casi si possono produrre dei link affidabili e rilevanti, soprattutto nell’allineamento di termini non ambigui. Il parametro di valutazione di questi collegamenti è stato il vocabolario di MACS.

Questo processo di mappatura coinvolge circa 130.000 mappature trilingua, che coinvolgono approssimativamente 100.000 soggetti di RAMEAU, 90.000 delle LCSH e 15.000 di SWD.

159ISAAC ANTOINE - CHAMBERS SALLY. Prototype integrating MACS initial data and new alignments into TEL framework : TELplus project, 4 Juanuary 2010 / Antoine Isaac, Sally Chambers.

<http://www.theeuropeanlibrary.org/portal/organisation/cooperation/telplus/documents/TE Lplus_D3.4_04012010.pdf>.

Tesi di dottorato di Elisabetta Viti, discussa presso l’Università degli Studi di Udine 142

Nel prototipo, il processo di mappatura si è basato su modalità differenti:

1. mappatura lessicale senza traduzione: la mappatura si è basata sulla comparazione delle etichette dei concetti da mappare. Se sono equivalenti si può considerare attivabile la mappatura;

2. mappatura lessicale con traduzione: la mappatura è prodotta usando una procedura simile al primo caso ma qui le etichette di soggetto sono state tradotte (usando il servizio di traduzione di Google) nella lingua del vocabolario con il quale deve essere mappato, prima del processo di comparazione lessicale;

3. mappatura estesa basata su libri con doppia intestazione: le tre collezioni hanno una piccola percentuale di patrimonio bibliografico comune, così è stato fatto il tentativo di indicizzare alcuni libri con una doppia intestazione proveniente dai due vocabolari differenti; tuttavia il numero dei libri condiviso è esiguo e quindi il risultato poco soddisfacente. Nella pratica è stato creato un corpus di libri indicizzati virtualmente con doppia intestazione: ogni metadato di ogni libro A presente nella collezione 1, viene comparato con i corrispettivi metadati dei libri della collezione 2. Poi, viene considerato il libro più simile, che è indicizzato con i concetti provenienti dal vocabolario 2 e il suo soggetto viene aggiunto al soggetto del vocabolario 1. Il libro A ha così una doppia indicizzazione.

Come abbiamo visto, il progetto MACS ha avuto alcune applicazioni pratiche che hanno portato ad un incremento delle funzionalità di ricerca multilingua come in Europeana e nel sito web della Deutsche Nationalbibliothek.160 Tuttavia, uno dei limiti di MACS è di aver scelto di creare un collegamento solo fra intestazioni accettate rendendo difficile all’utente la ricerca senza l’aiuto dei rinvii. Genevieve Clavel-Merrin, nel proprio contributo al congresso svoltosi a Firenze nel 2003 sull’Authority control, sottolinea la possibilità di risolvere questo problema integrando gli authority file nazionali come opzioni di ricerca per gli utenti che desiderassero verificare le intestazioni e raffinare la ricerca.

160JAHNS YVONNE - KARG HELGA. Translingual retrieval: moving between vocabularies / Yvonne Yahns, Helga Karg. ‒ Relazione al convegno: Concepts in context : Cologne conference on interoperability and semantics in knowledge organization, 19-20 July 2010. <http://linux2.fbi.fh-koeln.de/cisko2010/praesentationen/2010-07-19_jahns_karg.ppt> [Slides].

Tesi di dottorato di Elisabetta Viti, discussa presso l’Università degli Studi di Udine 143

Come Freyre e Naudi161 hanno sottolineato, MACS potrebbe essere considerato un vocabolario multilingua e quindi l’integrazione con altri elementi degli authority record di authority file nazionali potrebbe contribuire a far crescere ed evolvere la struttura del MACS verso quella di un authority file multilingue.

161 FREYRE ELISABETH -NAUDI MAX. MACS: subjects access accross languages and networks / Elisabeth Freyre, Max Naudi. – In: Subject retrieval in a networked environments: papers presented at IFLA satellite meeting sponsored by IFLA Section on Classification and Indexing and IFLA Section on Information Technology, OCLC, Dublin, OH, USA, 14-16 August 2001. – Dublin, OH : OCLC, 2001.

Tesi di dottorato di Elisabetta Viti, discussa presso l’Università degli Studi di Udine 144