• Non ci sono risultati.

2. Realizzazione del sistema di organizzazione della conoscenza

2.2 Principali funzionalità di un thesaurus

Le funzionalità alle quali tale strumento ha da sempre assolto hanno dunque subito una valorizzazione dovuta all’allargamento dei contesti d’uso e alle potenzialità che il thesaurus ha dimostrato di possedere nella gestione dell’informazione digitale. Disporre di una risorsa che raccolga e strutturi i concetti rappresentativi di un dominio, più o meno specialistico, attraverso relazioni di equivalenza, gerarchiche e associative95 definite sulle proprietà intrinseche dei concetti stessi, comporta un valore aggiunto per qualsiasi contesto che richieda descrizione, rappresentazione e recupero di informazione e documenti.

Nello specifico, le principali funzionalità, strettamente interrelate, del thesaurus possono essere presentate come segue. Controllo terminologico, indicizzazione, supporto nella definizione dei metadati e classificazione sono attività che competono al professionista dell’informazione, mentre navigazione, ricerca ed espansione dei risultati delle ricerche coinvolgono direttamente l’utente come utilizzatore di tale strumento.

- Controllo terminologico

Tale funzione viene esercitata prevalentemente per il controllo dei fenomeni di sinonimia e di polisemia. All’interno di un thesaurus il significato di un termine deve essere chiaro ed assolutamente non ambiguo e la definizione della rete semantica tra i concetti permette di specificare quanto più possibile il significato che si vuole privilegiare in uno specifico contesto. In tal senso anche l’utilizzo di note d’ambito, che consentono di inserire delle definizioni o delle specificazioni ulteriori circa un dato termine, e di qualificatori, che permettono di specificare l’ambito o il sottoambito al quale un termine appartiene, contribuisce alla determinazione univoca di un concetto. Allo stesso modo, le relazioni di equivalenza gestiscono la presenza di sinonimi, varianti lessicali, quasi - sinonimi, attraverso l’elezione, sulla base di diversi criteri, di un termine preferito al quale gli altri restano legati in quanto punti di accesso all’informazione. Tale legame permette di essere indirizzati verso il termine preferito e di arrivare comunque

95 Si tratta delle classiche relazioni thesaurali, esplicitate per mezzo di sigle, sulle quali ci si soffermerà con maggiore dettaglio nel paragrafo (2.4.5.1), relativo alla selezione e all’organizzazione dei termini all’interno del thesaurus.

46

all’informazione ricercata, anche se indicizzata tramite i descrittori. Nei domini specialistici tali problematiche esistono, ma in misura minore rispetto ai thesauri che interessano più settori della conoscenza.

Tale funzione si esercita anche attraverso il controllo della forma e del numero di termini e dell’introduzione di termini composti.

- Indicizzazione

L’indicizzazione è la funzionalità principale riconosciuta ad un thesaurus. Tale strumento, infatti, struttura un set di termini che possono essere selezionati ed attribuiti ad un documento96 in quanto rappresentativi del suo contenuto concettuale. Le relazioni tra i concetti consentono al professionista dell’informazione, in un contesto di indicizzazione manuale, di scegliere i termini in base al livello di specificità che più si adatta alle caratteristiche della collezione documentale, sia questa in forma cartacea o digitale.

I descrittori associati ai documenti ne permettono poi il recupero a partire da differenti modalità di accesso all’informazione.

- Metadati

Il thesaurus può fornire un supporto nella descrizione standardizzata dei documenti per mezzo di set di metadati appositamente definiti, come è il caso del Dublin Core (3.1), che prevede un elemento subject all’interno del quale è possibile inserire una o più voci indice rappresentative del contenuto concettuale del documento. Tali descrittori, soprattutto in ambienti quali i database bibliografici o le banche dati, possono essere selezionati a partire da un thesaurus all’interno del quale gli stessi sono messi in relazione tra di loro ed opportunamente strutturati.

- Navigazione e ricerca

Nei sistemi di content management che prevedono l’integrazione di un thesaurus, la presentazione sistematica che mette in evidenza la struttura classificatoria definita, può rappresentare il punto di partenza per operazioni di browsing. Anche la presentazione alfabetica può tuttavia essere navigata per orientare la ricerca di informazione da parte

96

Le operazioni di indicizzazione, supportate o meno dall’utilizzo di un thesaurus, non riguardano solo documenti testuali, ma possono interessare anche oggetti, opere d’arte, immagini, ecc. delle quali se ne rappresenta il contenuto anche per finalità di recupero, per mezzo di voci indice.

47

dell’utente, soprattutto in contesti in cui il suo bisogno informativo non è perfettamente definito. La visualizzazione delle relazioni tra i termini fornisce un indubbio supporto anche per la migliore conoscenza del dominio, soprattutto per utenti con poche competenze specialistiche. La presenza di relazioni di equivalenza permette principalmente di far fronte alla disomogeneità di competenze e di conoscenze da parte degli utenti, ma anche alla varietà della lingua, che comporta, anche in contesti specialistici, la presenza massiccia di sinonimi e varianti, al fine di recuperare l’informazione indipendentemente dal termine utilizzato per la ricerca o di guidare l’utente verso l’utilizzo del termine scelto come preferito.

- Espansione o raffinamento delle query

A seguito di una ricerca, all’utente vengono proposti i documenti rilevanti rispetto ai termini utilizzati per esprimere il suo bisogno informativo. In ambienti software che prevedono l’integrazione di un thesaurus, tale set di documenti può essere esteso sulla base delle relazioni tra i concetti preliminarmente definite. Si parla in questo caso di query expansion e l’estensione può avvenire automaticamente, nel senso che il sistema stesso restituisce ulteriori documenti sulla base di relazioni associative tra i descrittori, o sono gli utenti stessi che navigano tra i termini legati alle parole chiave utilizzate per la ricerca. - Organizzazione della conoscenza di dominio

Accanto alle funzionalità finora presentate, il thesaurus, proprio in quanto risorsa terminologica all’interno della quale i concetti relativi ad una data area della conoscenza vengono organizzati sulla base di relazioni semantiche e, in taluni casi, attribuiti a categorie rappresentative della stessa, costituisce uno strumento di classificazione e di sistematizzazione della conoscenza. Esso può assolvere alla funzione di standard di riferimento, non necessariamente realizzato per finalità specifiche o circoscritte, al quale, anzi, è possibile ricorrere per scopi di indicizzazione di collezioni documentali dalla copertura semantica più o meno identica, di predisposizione di documenti, di scambio non ambiguo dell’informazione, di normalizzazione terminologica. Il thesaurus che assolve a tale funzione è di norma accompagnato da un sistema di codificazione che associa un codice univoco a ciascun concetto.

48

Anche nell’ambito del presente progetto, quindi, le funzioni attribuite al thesaurus saranno molteplici: classificazione e controllo terminologico da un lato, ricerca di informazione e indicizzazione dall’altro. Sarà, perciò, utilizzato sia dagli operatori dell’informazione per la traduzione del contenuto concettuale dei documenti inseriti nel centro di documentazione nei termini del linguaggio di indicizzazione, sia dagli utenti finali, con finalità di supporto nella ricerca di informazione e di riferimento per la scelta univoca dei termini e l’individuazione di possibili criteri di classificazione.