• Non ci sono risultati.

Indicizzazione per soggetto

D. Processo di indicizzazione

D.1 Analisi concettuale dei documenti

Scopo dell’analisi concettuale è individuare e definire con la maggiore precisione possibile il soggetto di un’opera. Quest’operazione richiede da un lato la comprensione del contenuto e dell’ambito disciplinare dell’opera, dall’altro l’attivazione di conoscenze di natura linguistica, contestuale e intertestuale, fra cui la competenza nel linguaggio di indicizzazione e la capacità di prevedere le esigenze informative degli utenti.

Sul buon esito dell’analisi concettuale del documento, in termini di coerenza e funzionalità, influiscono alcune condizioni, ossia:

− che le operazioni siano condotte secondo una procedura sistematica e normalizzata, in grado di produrre risultati sostanzialmente uguali o condivisibili, anche se eseguita in contesti diversi;

− che il giudizio di pertinenza e di rilevanza, nella selezione dei temi e di altre caratteristiche ritenute importanti ai fini dell’indicizzazione e del recupero dei documenti, sia esercitato nell’ambito di pratiche collettive, sulla base di criteri e strumenti condivisi, in modo da ridurre il più possibile valutazioni arbitrarie.

A questi obiettivi mirano lo standard ISO 5963:1985 e la Guida all’indicizzazione per soggetto del GRIS, le cui raccomandazioni sono accolte nelle indicazioni contenute nei paragrafi seguenti.

L’interazione fra le due componenti del processo di analisi concettuale dei documenti – cioè le conoscenze acquisite mediante l’analisi del testo (conoscenze

apprese o esplicite) e quelle attivate dal contesto (conoscenze possedute o implicite) – conferiscono all’analisi concettuale la natura di un processo inferenziale di tipo abduttivo. Si tratta infatti di un’attività interpretativa, vincolata al testo (ossia verificabile sui dati testuali), il cui risultato è una previsione probabilistica sulla validità di un soggetto come mezzo efficace di reperimento del documento, in risposta alle presumibili esigenze informative degli utenti.

Il modello interattivo – cioè l’intreccio di informazioni testuali e informazioni contestuali – opera nelle diverse fasi del processo di analisi, dalla comprensione del significato delle singole parole all’identificazione di unità più complesse (temi), fino alla loro formulazione nel linguaggio di indicizzazione. Sul piano lessicale, per esempio, la traduzione di una parola ricorrente nel testo con un determinato termine di indicizzazione implica un confronto fra il significato della parola nel testo e il significato del termine registrato nel Thesaurus, allo scopo di verificarne la corrispondenza dal punto di vista semantico. Un’applicazione peculiare del Nuovo soggettario è l’impiego dello schema dei ruoli come strumento per individuare le funzioni sintattiche fondamentali attorno alle quali si organizza il contenuto concettuale del testo a un livello globale (vedi D.1.3). Più in generale, l’indicizzatore dovrebbe avere presenti le componenti del Nuovo soggettario (il Thesaurus e la sintassi) anche nella fase dell’analisi concettuale del documento, come mezzi euristici per l’identificazione del soggetto, oltre che per la sua traduzione nel linguaggio di indicizzazione. Infine, l’interazione fra testo e contesto è un presupposto necessario del giudizio di rilevanza, dal momento che, come si è visto in B, la rilevanza di un tema è data non solo da fattori testuali, ma anche contestuali.

D.1.1 Esame dei documenti

L’esame del documento viene condotto mediante l’analisi e il confronto di alcune fonti interne, soprattutto di quelle parti che normalmente si riferiscono al contenuto dell’opera, indicandone i principali temi, e alla sua forma. In particolare, per opere di carattere testuale, le fonti sono citate in ISO 5963:1985 e UNI ISO 5963:1989 secondo il seguente ordine:

a) titolo;

b) riassunto analitico o abstract;

c) sommario;

d) introduzione, frasi iniziali dei capitoli e dei paragrafi, conclusione;

e) illustrazioni, diagrammi, tavole con relative didascalie;

f) parole o gruppi di parole in evidenza;

g) riferimenti bibliografici42.

Altre parti del documento possono essere utilmente impiegate come fonti per l’analisi concettuale. Per esempio nel libro antico la dedica, oltre all’intento celebrativo nei

42 La fonte al punto g) è suggerita nella Guida GRIS cit., p. 15.

confronti del dedicatario e a quello di legittimazione dell’opera, fornisce spesso una spiegazione e presentazione dell’opera con riferimenti al suo contenuto.

Di ciascuna fonte devono essere accertati i requisiti di attendibilità e completezza.

Occorre cioè chiedersi se la fonte considerata sia affidabile per il tipo di informazione necessaria all’indicizzatore e se contenga tutti gli elementi indispensabili a descrivere il soggetto dell’opera, integrandola in caso contrario con altre fonti.

È talvolta necessario considerare anche fonti esterne (repertori bibliografici o biografici, cataloghi, dizionari, enciclopedie, ecc.), soprattutto quando si debba verificare l’esistenza di fattori contestuali importanti ai fini dell’analisi: la fortuna dell’opera, le relazioni con altre opere dello stesso autore o di autori diversi, altre edizioni della stessa opera, la biografia dell’autore, ecc. Il ricorso a fonti esterne può essere più frequente nel caso di particolari tipi di opere (es. le opere letterarie o iconografiche), per mancanza o insufficienza di apparati paratestuali.

L’esame delle fonti richiede che si osservino alcune cautele, qui elencate a scopo esemplificativo e non esaustivo.

− I titoli hanno un ruolo importante nell’indicare il contenuto globale dell’opera e, soprattutto in ambito scientifico e tecnico, presentano un alto grado di affidabilità. Tuttavia, possono essere fuorvianti o inadeguati quando alla funzione di ‘indicatori tematici’ se ne sovrappongono altre (es. di valorizzazione editoriale della pubblicazione), oppure quando la funzione descrittiva è svolta in forma metaforica o in modo parziale. Pertanto è sconsigliato indicizzare avvalendosi solo del titolo.

− Testi preliminari o conclusivi come prefazioni, introduzioni, conclusioni, ecc.

hanno uno stretto legame con l’argomento dell’opera, la sua organizzazione tematica, le intenzioni dell’autore: sono perciò una fonte prioritaria. Tuttavia, l’esame di questi testi deve trovare un riscontro nell’analisi diretta del contenuto dell’opera.

− La lettura dell’intera opera non è generalmente necessaria. In presenza di testi di una certa ampiezza l’indicizzatore dovrebbe adottare tecniche di lettura idonee a ottenere l’informazione cercata nel minor tempo possibile, per esempio esplorando il testo alla ricerca di agganci (parole ricorrenti, titoli, sintagmi nominali con funzione tematica, ecc.) in grado di offrire punti di appoggio affidabili nella ricerca di una comprensione globale dell’opera o di una sua parte. Tempi e modi di questa esplorazione del testo dipendono anche dal grado di profondità e di specificità dell’analisi, in funzione di un’indicizzazione spinta oppure di una sommarizzazione specifica (vedi A.1).

− Nessuna singola fonte dev’essere considerata elemento sufficiente per l’esame del testo, il quale deve implicare sempre un confronto tra più fonti.

D.1.2 Individuazione del soggetto

Spesso le fonti contengono riferimenti chiari e diretti al tema di base, per esempio in quei brani del testo dove compaiono espressioni come ‘il tema centrale di questo libro è

…’, ‘questo libro tratta principalmente di ...’, ecc. Quando tali indicazioni sono insufficienti è necessaria una procedura che può risultare più complessa e che consiste nell’individuare analiticamente i temi particolari trattati nell’opera e nel correlarli poi, sulla base dell’organizzazione tematica del testo, secondo le reciproche connessioni e implicazioni logiche in modo da ricostruire con esattezza il tema di base, che a prima vista non era evidente.

La ricostruzione del tema di base può essere guidata dalle seguenti operazioni43:

cancellazione, che consiste nell’eliminazione dei temi trattati marginalmente o come complementi e sviluppo del tema centrale;

generalizzazione, che consiste nella sostituzione di concetti specifici con un concetto più generale che li comprenda;

costruzione, che consiste nella sostituzione di enunciati particolari che esprimono singoli temi con un enunciato più generale che li comprenda.

Questi procedimenti, che conducono all’individuazione di un tema complessivo, sottostanno ai criteri logici dell’implicazione e della pertinenza: un tema generale (e, al livello più alto, il tema di base) è implicato nell’insieme dei temi particolari da cui è ricavato; ciascun tema particolare dev’essere quindi coerente rispetto al tema generale al quale è riconducibile.

Questi procedimenti possono essere applicati a qualsiasi livello dell’organizzazione tematica di un’opera: non solo per l’individuazione del tema di base, ma anche di altri temi rilevanti.

D.1.3 Identificazione dei concetti

Ai fini di una completa individuazione del soggetto, l’indicizzatore dovrebbe accertarsi di avere identificato tutti i concetti necessari a descriverlo. Per effettuare questa verifica in modo sistematico è opportuno stabilire una lista di controllo.

A questo scopo, si può fare riferimento alle relazioni sintattiche fondamentali (vedi 3.4.3) e allo schema dei ruoli (vedi 3.6): in particolare, nello schema sono codificate le funzioni svolte dai concetti nell’espressione del soggetto. Considerare queste funzioni in sequenza ordinata facilita l’attribuzione ad ogni concetto della relativa funzione e il riconoscimento di concetti eventualmente trascurati in precedenza. La lista di controllo, pensata per un contesto multidisciplinare, comprende:

a. un’azione (attività, operazione, processo);

b. l’oggetto dell’azione;

c. i mezzi per compiere l’azione (strumenti, tecniche, metodi);

d. l’agente e/o il beneficiario dell’azione;

e. una parte o una proprietà riferite a uno o più di questi elementi;

43 Il ricorso a queste operazioni come strumenti utili per la sommarizzazione del contenuto di un testo è suggerito nella Guida GRIS cit., p. 15-16.

f. una localizzazione spaziale e/o temporale del soggetto;

g. aspetti particolari del soggetto o punti di vista particolari dai quali il soggetto è considerato;

h. il caso o la fonte su cui il soggetto è studiato;

i. una particolare forma e/o destinazione del documento.

Con l’ausilio di questa lista, l’indicizzatore dovrebbe porsi domande del tipo: è stato identificato nel soggetto un concetto di azione? È presente l’oggetto dell’azione? L’opera tratta dei mezzi per compierla, del suo agente o del suo beneficiario? E così via.

L’indicizzatore si pone queste domande nel corso stesso dell’esame del documento e delle operazioni di individuazione del soggetto, così che queste fasi, distinte logicamente, tendono ad essere concomitanti nella pratica.

Nell’indicizzazione dedicata a un determinato campo disciplinare, questa lista può essere adattata per evidenziare fattori riconosciuti importanti all’interno di quel campo.

Ai ruoli e alle funzioni logiche loro sottostanti si possono, inoltre, ricondurre alcuni dei fattori rilevanti per la ricerca da parte dell’utente, definiti in IFLA LRM soprattutto in ordine alla funzione selezionare.

I ruoli, prima che uno strumento sintattico per l’ordinamento dei termini nella stringa di soggetto, sono uno strumento analitico per l’identificazione delle funzioni semantiche fondamentali attorno alle quali è organizzato il contenuto concettuale di un testo. Un concetto chiave, le sue parti o proprietà, le azioni compiute o subite, agenti e strumenti, delimitazioni spaziali e temporali, ecc., sono fattori determinanti nell’individuazione di un tema, oltre che criteri regolativi per la costruzione delle stringhe di soggetto. Uno stesso metodo, dunque, guida l’indicizzatore in entrambe le operazioni fondamentali dell’indicizzazione per soggetto: l’identificazione dei concetti e delle relazioni più significative e la loro rappresentazione nel linguaggio di indicizzazione.

Inoltre, per la prima di queste operazioni (quella che si svolge a monte del processo di indicizzazione, in funzione dell’analisi concettuale del documento) l’analisi dei ruoli è utilizzabile sia nella modalità di indicizzazione pre-coordinata, sia in quella post-coordinata (vedi F.1).

D.1.4 Formulazione dell’enunciato di soggetto

Ciascun tema individuato come soggetto di un’opera è espresso con una frase in forma di sintagma nominale, ossia di una sequenza significativa di parole: questa sequenza è costituita da un sostantivo legato sintatticamente a uno o più aggettivi, oppure ad altri sostantivi mediante preposizioni. Tale frase, detta enunciato di soggetto, deve rappresentare con precisione e chiarezza tutti i concetti necessari a identificare il soggetto e le relazioni logico-sintattiche che intercorrono fra essi.

L’enunciato di soggetto è formulato in risposta alle domande: ‘su che cosa è, ossia di che cosa tratta quest’opera?’, ‘di che cosa quest’opera è una raffigurazione, una

rappresentazione o una narrazione?’, ‘che cos'è quest’opera?’.

Esempi:

[l’opera tratta della] gestione finanziaria delle aziende di servizi pubblici [l’opera tratta del] comportamento sociale degli adolescenti

[l’opera tratta dell’] insegnamento della lingua italiana agli immigrati arabi

[l’opera è una] fotografia di una banda musicale dell’esercito britannico nel Canale di Suez nel 1952

[l’opera è un] dizionario per ragazzi della lingua italiana [l’opera è una] guida di Venezia

L’espressione in corsivo di ciascuna di queste frasi costituisce l’enunciato di soggetto, che è la base per la traduzione del soggetto nel linguaggio di indicizzazione.