• Non ci sono risultati.

6. Esperienze internazionali nell’ambito dell’interoperabilità: dalla teoria alla

6.2 Il progetto CrissCross

Il progetto CrissCross162 nato nel 2006 e concluso nel 2010, è stato finanziato dal Deutsche Forschungsgemeinschaft (German Research Foundation, <http://www.dfg.de/en/index.jsp>) ed eseguito in cooperazione con la Biblioteca nazionale tedesca e con l’Università di scienze applicate di Colonia.

Lo scopo principale è stato quello di creare un thesaurus multilingua e un vocabolario user friendly, per facilitare la ricerca in collezioni indicizzate in modo eterogeneo, attraverso la mappatura di intestazioni di soggetto del German Subject Headings Authority File (SWD, Schlagwortnormdatei) con le notazioni della Dewey Decimal Classification (basate sul principio della garanzia bibliografica).163

Questo progetto ha così contribuito ad ampliare i risultati del sopraccitato progetto MACS (la Biblioteca nazionale tedesca continua il link tra le SWD con le corrispondenti intestazioni della Library of Congress Subject Headings (LCSH) e con il vocabolario francese di indicizzazione RAMEAU) ed ha preparato le basi per il progetto RESEDA, cioè per lo sviluppo di un modello di interoperabilità concettuale che connette metodi di rappresentazione semantica della conoscenza con il piano di scenari di recupero dell’informazione.

Il Subject Headings Authority File (SWD, Schlagwortnormdatei) è un vocabolario controllato, che nasce nel 1980 con una prima lista di 120.000 intestazioni di soggetto, prodotte dalla Deutsche Nationalbibliothek (DNB) e da alcune biblioteche bavaresi. È un vocabolario universale che copre tutti i campi del sapere (molto simile alle LCSH e a RAMEAU), è strutturato in 37 gruppi di soggetto e contiene 550.000 intestazioni. I descrittori appartengono alle categorie dei: nomi geografici, dei soggetti comuni (concetti e oggetti), del tempo e della forma, nomi di intestazioni, titoli di opere (i nomi di persona sono conservati in un authority file separato, PND (German Name Authority

162Progetto CrissCross.

<http://linux2.fbi.fh-koeln.de/crisscross/index_en.html>.

163 JACOBS JAN-HELGE MENGEL TINA MÜLLER KATRIN. Insights and outlooks : a retrospective view on the CrissCross project / Jan-Helge Jacobs, Tina Mengel, Katrin Müller. – Relazione al convegno: Concepts in context : Cologne conference on interoperability and semantics in knowledge organization, 19-20 July 2010.

<http://linux2.fbi.fh-koeln.de/cisko2010/praesentationen/2010-07 19_jacobs_mueller_mengel.ppt> [Slides].

Tesi di dottorato di Elisabetta Viti, discussa presso l’Università degli Studi di Udine 145

File), usato inoltre per catalogare i nomi di persona). Le intestazioni per soggetto possono essere parole singole o frasi complesse e nomi.

I tipi di relazioni possibili tra termini sono quelle classiche dei thesauri e sono di tre tipi : equivalenza, gerarchica e associativa.

La Dewey Decimal Classification è il sistema di classificazione più usato nel mondo (200.000 biblioteche in 135 paesi) ed è stato tradotto in più di 30 lingue. Contiene circa 50.000 classi, che sono organizzate secondo una struttura logica il cui primo livello di divisione è costituito dalle discipline (religione, scienze sociali, tecnologia). Dal 2006 viene impiegato dalla Biblioteca nazionale tedesca per l’indicizzazione per soggetto.

In questo progetto, sono state mappate circa 70.000 intestazioni di soggetto e la strategia di mappatura scelta è unidirezionale, cioè dal termine alla classe: il SWD assume il ruolo di vocabolario ‚fonte‛ e la DDC come classificazione meta (e non viceversa). Inoltre, siccome molte intestazioni di soggetto possono avere un valore polisemico e quindi una corrispondenza semantica con più di una classe Dewey, il modello di mappatura seguito è ‚uno a molti‛.

Per es.:

Cardigan  391 Costume and personal apparence

 646 Sewing, clothing, management of personal and Family life

 687 Clothing and accessories

La mappatura concettuale è ottenuta nel modo più specifico possibile (Deep level mapping = mappatura a livello profondo) e quindi, se necessario, un’intestazione può avere come corrispondente una notazione Dewey, costruita seguendo le istruzioni di base di costruzione del numero.

Per es.:

Breeding of coffee = produzione del caffé

633.72 Coffee + [631.5]2Production of propagational organism

Tesi di dottorato di Elisabetta Viti, discussa presso l’Università degli Studi di Udine 146

Il grado di corrispondenza dei termini di SWD e delle classi DDC è espresso da un codice, il così detto ‚livello di determinazione‛. Quest’ultimo rappresenta i livelli differenti di congruenza concettuale tra intestazioni del SWD e le notazioni DDC, che viene individuata sulla base della comparazione del loro significato. Logicamente, nei sistemi di recupero dell’informazione, il livello di determinazione della corrispondenza concettuale condiziona le percentuali di richiamo e di precisione.

Nel CrissCross sono stati stabiliti 4 livelli di determinazione, da copertura totale a parziale

Livello 4 (D4)

L’ambito di connotazione dell’intestazione del SWD è identico a quello del tema enfatizzato nella classe d’intestazione della DDC. Secondo CrissCross (D4) i risultati di ricerca dovrebbero fornire ‚reperimenti diretti‛.

Per es.:

Steppe animals = 591. 744

Livello 3 (D3)

L’ambito di connotazione dell’intestazione SWD è identico o quasi identico a quello di un tema che si approssima all’intero della classe DDC assegnata. Secondo le clausole della DDC, le categorie di soggetti che si considerano approssimarsi all’intero sono: 1) i temi che sono strettamente coestensivi con il significato pieno di una classe o coprono più della metà del contenuto della classe approssimata all’intero della classe DDC; 2) i soggetti enunciati nelle note ‚qui‛; 3) i soggetti che coprono almeno tre suddivisioni di uno stesso numero (se il numero ne ha soltanto tre , i soggetti che ne coprono due).

Secondo il CrissCross (D3) i risultati di ricerca dovrebbero essere piuttosto pertinenti.

Per es.:

Tesi di dottorato di Elisabetta Viti, discussa presso l’Università degli Studi di Udine 147

Livello 2 (D2)

L’ambito di connotazione dell’intestazione SWD è identico o quasi identico a quello di un tema che è parte logica della classe ma è meno estensivo nell’ambito del concetto rappresentato dal numero di classe. Anche in questo caso, i temi nelle note d’inclusione sono dei tipici esempi poiché possono riferirsi a soggetti più specifici rispetto al soggetto coperto dall’intestazione. Secondo il CrissCross (D2) i risultati di ricerca dovrebbero essere adeguati.

Per es.:

House wife = 640.92 (Home economists)

Livello 1 (D1)

L’ambito di connotazione dell’intestazione SWD dovrebbe rispondere in piccola parte all’ambito di connotazione della classe DDC assegnata. Secondo il CrissCross (D1) i risultati di ricerca dovrebbero fornire una piccola percentuale d’intersezione.

Per es.:

Lavender oil = 668.542 (Natural perfumes) *c’è una nota di inclusione relativa alle essenze e alle acque odorose vegetali].

Tesi di dottorato di Elisabetta Viti, discussa presso l’Università degli Studi di Udine 148