• Non ci sono risultati.

Indicizzazione per soggetto

F. Forme di indicizzazione

F.1 Indicizzazione pre-coordinata e indicizzazione post-coordinata

Per rappresentare il soggetto di un’opera, i termini di indicizzazione possono essere impiegati secondo due modalità:

indicizzazione pre-coordinata: i termini vengono combinati fra loro secondo le regole di una sintassi predefinita, costruendo sequenze ordinate (stringhe di soggetto) per rappresentare soggetti complessi;

indicizzazione post-coordinata: i termini vengono impiegati in modo indipendente l’uno dall’altro senza che siano esplicitamente indicate le loro relazioni sintattiche, lasciando all’utente la possibilità di associare i termini nella fase di ricerca.

In entrambi i casi i termini sono generalmente attinti da un vocabolario controllato e, nel caso di nomi propri, assunti nella forma prevista da liste di autorità o da altre fonti autorevoli. Per questo, l’indicizzazione post-coordinata non va confusa con forme di indicizzazione basate sul libero impiego di parole della lingua naturale o sull’estrazione di parole dai titoli o dai testi.

Quando, in un’indicizzazione post-coordinata, si stabilisce la relazione di soggetto fra i singoli concetti e l’opera di cui esprimono il tema, questo atto presuppone il riconoscimento delle relazioni sintattiche che esistono fra questi concetti e instaura di fatto una relazione di componente fra i singoli concetti e il loro insieme. Tuttavia, le relazioni stesse non sono indicate esplicitamente e, dunque, non sono rese disponibili all’utente in modo evidente. Parallelamente, quando l’utente coordina i medesimi concetti durante le operazioni di ricerca, questo atto si basa sul presupposto dell’esistenza di determinate relazioni sintattiche fra

questi concetti in una o più opere. La fondatezza di questo presupposto poggia sulla condivisione di quadri di riferimento comuni, soprattutto nell’ambito delle scienze esatte, che rendono più facile il compito di prevedere i contesti in cui un determinato concetto ricorre e, conseguentemente, di combinare i concetti fra loro in modo appropriato. Ciò, tuttavia, non mette al riparo dal rischio di false combinazioni, e quindi di risposte incongrue, per esempio nel caso in cui vengano combinati insieme concetti appartenenti a temi diversi della stessa opera.

In un’indicizzazione pre-coordinata, invece, il tema viene presentato come un insieme strutturato di concetti, collegati da determinate relazioni sintattiche. Le relazioni sono generalmente indicate mediante la costruzione di stringhe di soggetto in cui i termini sono ordinati secondo regole sintattiche esplicite, così che le risultanti sequenze comunichino con sufficiente chiarezza e precisione il tema trattato. Questa modalità offre maggiori vantaggi, soprattutto in un’indicizzazione non limitata a uno specifico ambito disciplinare e, in particolare, in quei settori di studio in cui i concetti possono essere collegati fra loro in vari modi, più difficilmente prevedibili. Con un’indicizzazione pre-coordinata, infatti, è possibile creare relazioni di soggetto sia fra i singoli concetti e l’opera, come in quella post-coordinata, sia fra l’opera e il tema nel suo insieme espresso dalla stringa di soggetto; inoltre, ciascun concetto è collegabile al tema di cui fa parte.

In questo modo, si mettono a disposizione più punti di accesso alle risorse e percorsi di ricerca più articolati.

F.2 Altre forme di indicizzazione

Esistono altre forme di indicizzazione e recupero dell’informazione, non necessariamente basate sull’impiego di vocabolari controllati.

L’impiego di parole del linguaggio naturale, per esempio, è tipico del social tagging, la modalità di indicizzazione mediante parole-chiave attribuite direttamente dagli utenti che interagiscono liberamente con i cataloghi o altre basi dati e ne integrano i contenuti, divenendo così indicizzatori attivi. In questo caso è l’utente ad associare, alla descrizione della risorsa, parole del linguaggio naturale riferite al contenuto concettuale dell’opera.

Tale modalità va attentamente valutata a partire dalle circostanze in cui sia conveniente metterla a disposizione, verificandone i risultati in termini di pertinenza, efficacia, economicità.

Un’altra forma di indicizzazione è quella automatica, applicabile a risorse digitali (native o non). Le metodologie impiegate per automatizzare parzialmente o totalmente il processo di indicizzazione, sperimentate inizialmente soprattutto nell’ambito della documentazione scientifica, si sono sviluppate e raffinate nel corso del tempo. Dai progetti di estrazione automatica di parole/frasi chiave, basati principalmente su rilevazioni statistiche delle occorrenze di un termine all’interno di documenti testuali, si è arrivati all’impiego di strumenti più sofisticati per l’indicizzazione di risorse eterogenee (non solo testuali), tuttora in fase di sviluppo e basati su tecnologie di intelligenza

artificiale e machine learning47.

È opportuno precisare che anche queste forme di indicizzazione traggono vantaggio dall’impiego di vocabolari controllati, basati su standard condivisi, corredati di relazioni semantiche e che offrono una terminologia con garanzia bibliografica riconosciuta e accettata dagli specialisti di vari settori. Questi strumenti infatti possono integrare, sostenere e guidare sia procedure di social tagging sia di indicizzazione automatica, risolvendo problemi di sinonimia/polisemia, aumentando l’indice di pertinenza semantica, ecc. D’altro canto, dal social tagging e da procedure di indicizzazione automatica è possibile derivare e acquisire terminologia che integri i thesauri, con vantaggio per chi ne fa uso anche nell’ambito dell’indicizzazione tradizionale.

F.3 Indicizzazione per genere/forma

L’espressione genere/forma indica unitariamente due tipi distinti di caratteristiche delle opere (i generi e le forme) che hanno una funzione comune (descrivere ‘ciò che l’opera è’) e possono essere usati in combinazione per distinguere la forma di un’opera secondo un particolare genere. Per esempio Musica sacra denota un genere musicale, Canti denota una forma musicale, Canti sacri denota una forma musicale caratterizzata da un particolare genere; nel termine Film di fantascienza, ‘film’ indica la forma, ‘di fantascienza’ indica il genere.

Il genere e la forma sono attributi di un’opera che non si riferiscono direttamente al suo contenuto concettuale; tuttavia, possono essere elementi importanti nei linguaggi di indicizzazione per caratterizzare più precisamente le opere stesse, per favorirne il recupero e la selezione. In che modo?

In B, Isness, le caratteristiche formali di un’opera (‘ciò che l’opera è’) sono state considerate un aspetto distinto dal tema (‘ciò su cui l’opera è’) ma tuttavia unito al tema nella formulazione del soggetto. Infatti, pur essendo attributi dell’opera, queste caratteristiche servono a precisare l’approccio intellettuale al tema, una particolare modalità, livello o tipo di organizzazione della trattazione, ecc., influenzando il giudizio di rilevanza dell’utente. Nel Nuovo soggettario un concetto di forma che compare nell’enunciato di soggetto in correlazione a concetti che esprimono il tema, assume nella stringa di soggetto il ruolo complementare di forma intellettuale o bibliografica (vedi 3.6.2.3 e 3.6.2.5). L’indicazione della forma nella stringa è particolarmente utile, ai fini della selezione da parte dell’utente, quando si consulta una lista di stringhe di soggetto o si esaminano le stringhe associate a una determinata registrazione bibliografica.

Concetti di genere/forma che caratterizzano opere non tematiche (ossia che non hanno un tema o il cui tema è considerato irrilevante), oppure opere di cui sia impossibile o complesso identificare un tema unico o specifico, possono essere usati nell’indicizzazione per soggetto di tali opere. Si tratta, in questo caso, di ‘soggetti

47 Alcune biblioteche nazionali europee stanno già adottando questa modalità di indicizzazione (fra le prime la Deutsche Nationalbibliothek). Per informazioni sui lavori dell’IFLA Automated Subject Analysis and Access Working Group, vedi <https://www.ifla.org/node/92551>.

formali’, adottati tradizionalmente per indicizzare opere generali in una specifica forma bibliografica (es. Enciclopedie), nonostante ciò comporti una sovrapposizione di significati nell’impiego dello stesso termine, che non permette di distinguere le opere sulle enciclopedie dalle opere che sono enciclopedie.

Un modo alternativo o complementare di impiegare i concetti di genere/forma è farne oggetto di un’indicizzazione distinta, registrata in un campo dedicato del catalogo, diverso da quello in cui è indicato il soggetto. Si parla, in questo caso, di indicizzazione per genere/forma. A questo tipo di indicizzazione vengono attribuiti i seguenti vantaggi:

− ampliare le possibilità di ricerca, fornendo all’utente punti di accesso diretti e specifici relativi a termini che rappresentano il genere e la forma delle opere, distinti da quelli che ne descrivono il soggetto;

− consentire all’utente di filtrare le ricerche mediante uno specifico genere o forma;

− sviluppare una terminologia specializzata nella descrizione dei generi e delle forme delle opere.

Questo tipo di indicizzazione viene applicato da tempo in vari Paesi, sia per collezioni generali sia per particolari tipologie di risorse, anche se i generi caratterizzano più frequentemente le opere creative nell’ambito della letteratura, dello spettacolo, della musica, delle arti figurative, ecc., che presentano strutture retoriche comuni. L’IFLA ha istituito un gruppo di lavoro che ha preso avvio da un progetto della Library of Congress e sta interessando altre biblioteche nazionali48. L’implementazione dell’indicizzazione per genere/forma presenta una modularità molto ampia. In alcune di queste esperienze i termini genere/forma sono gestiti in uno o più vocabolari dedicati, distinti dal vocabolario dei termini impiegati nelle intestazioni di soggetto; in altre, sono inclusi in un unico vocabolario di termini di indicizzazione. In qualche caso, i termini genere/forma continuano ad essere impiegati anche come ‘suddivisioni formali’ nelle intestazioni di soggetto; in altri, sono impiegati solo in questa forma di indicizzazione dedicata, così che la rappresentazione completa di tema e forma, prima uniti nella stringa, si ottiene ora solo dalla combinazione dei valori registrati in due diversi campi del record.

Come precisato in B, il Nuovo soggettario prevede l’impiego nella stringa di soggetto di termini che indicano la forma intellettuale e bibliografica di un’opera, allo scopo di fornire elementi aggiuntivi e complementari alla descrizione del tema, utili per la selezione dei soggetti e delle opere. Tuttavia, questa modalità non esclude la possibilità di un’indicizzazione per genere/forma distinta e separata dall’indicizzazione per soggetto, che offra all’utente un accesso diretto alle opere mediante termini che ne rappresentano in modo specifico il genere e la forma. Le due modalità hanno funzioni solo parzialmente coincidenti e, per una stessa opera, i termini che indicano la forma nella stringa di soggetto e nell’indicizzazione genere/forma possono non essere gli stessi.

Infatti, nella prima modalità si impiegano quasi esclusivamente termini di forma, espressi a un livello di specificità adeguato alla funzione che devono svolgere nella stringa, mentre di norma non vi compaiono termini che ne specificano il genere. Inoltre, le

48 Per informazioni sulle finalità del progetto, i lavori dell’IFLA Genre/Form Working Group e i risultati dell’indagine condotta presso le biblioteche nazionali, vedi <https://www.ifla.org/node/8526>.

forme impiegate nella stringa sono sempre correlate alla trattazione di un tema, mentre i termini genere/forma sono assegnati anche a opere non tematiche o di cui non sia identificabile un tema unico o specifico, inglobando così la funzione tradizionalmente svolta dai ‘soggetti formali’.

Ai fini del controllo terminologico il Nuovo soggettario prevede di adottare (sia per i termini di forma impiegati nelle stringhe, sia per i termini genere/forma oggetto di un’indicizzazione a sé stante) la terminologia del Thesaurus, adeguatamente sviluppata per entrambi gli scopi. I termini del Thesaurus, infatti, rappresentano singoli concetti, indipendenti dal ruolo che svolgono nelle stringhe di soggetto. L’impiego di un unico vocabolario anziché di vocabolari separati e diversificati favorisce la coerenza e l’uniformità nel controllo dei termini e delle loro relazioni semantiche, siano essi impiegati nelle stringhe di soggetto come tema o come forma, oppure assegnati alle opere in un’indicizzazione per genere/forma.

Nel Thesaurus, nell’ambito della categoria di concetti relativi alle Forme nei diversi campi del linguaggio e della comunicazione, della letteratura, della musica, delle arti figurative e dello spettacolo (vedi 2.5.2.3.5), è contenuta la maggior parte dei termini che possono essere impiegati anche nell’indicizzazione per genere/forma.