• Non ci sono risultati.

Lista riassuntiva degli indici e dei collegamenti

3. Un approccio linguistico all'indicizzazione

3.3. L'uso del linguaggio per l'indicizzazione 1. Indicizzazione e linguaggio

3.3.6. La sottolingua documentaria

3.3.6.1. Asse paradigmatico e sintagmatico: seconda parte

3.3.6.2.4. Elementi lessicali in forma semplice e composta

Coerentemente con la precedente discussione sulla relatività della forma semplice o composta degli elementi lessicali, così come con la nostra discussione del carattere

composito dei sememi, il lessico della sottolingua che proponiamo prevede la presenza sia di elementi lessicali in forma semplice (un'unica parola) sia di elementi lessicali in forma composta (sintagmi); prevede inoltre che di uno stesso elemento lessicale siano registrate sia le le forme semplici sia le forme composte: dunque sia “bioetica” (forma semplice) sia “etica della vita” (forma composta).281

3.3.6.2.5. Elementi lessicali in forma composta non collegata, parzialmente 280 K. BHATTACHARYYA, The effectiveness of natural language in science indexing and retrieval, “Journal of documentation”, 30, 3 (1974), p. 251.

collegata e totalmente collegata282

L'impostazione adottata nella precedente sezione del capitolo (vedi 3.2.3, 3.2.6) esclude la possibilità di porre il “singolo concetto” o “unità di pensiero” a base del lessico della sottolingua, ovvero di stabilire in modo aprioristico i confini concettuali degli elementi di significato; lo standard NISO2005, che lo fa, è poi costretto a riconoscere come la

percezione di cosa sia un “singolo concetto” muti da contesto a contesto.283

I limiti di scomposizione semantica sintagmatica vanno stabiliti in modo convenzionale sulla base di criteri precisi; come abbiamo spiegato nel precedente capitolo, quando abbiamo parlato dei nomi complessi (vedi 2.13), il criterio da noi scelto è

l'individuazione, all'interno di un dato elemento lessicale, di un riferimento ad almeno un ulteriore elemento lessicale che sia ritenuto significativo in sé (ovvero relativo a un'entità, nei termini dell'approccio concettuale) e a cui il dato elemento lessicale sia legato da una relazione gerarchica; come già detto, sono esclusi dalla scomposizione sintagmatica quei nomi che facciano riferimento ad altre entità solo in senso figurato o esclusivamente formale; non è dunque possibile scomporre l'elemento lessicale in forma composta “occhi di vetro” in “occhi” e “vetro”, oppure “Biblioteca Alberto Bombace” in “Biblioteca” e “Alberto Bombace”, perché il riferimento a “occhi” in “occhi di vetro” è di senso figurato (non vi è una relazione eponimica tra “occhi” e “occhi di vetro”), e perché “Alberto Bombace” è solo parte del nome proprio della “Biblioteca Alberto Bombace”. Negli elementi lessicali in forma composta che fanno riferimento a ulteriori entità, gli elementi lessicali componenti che specificano l'elemento lessicale in forma composta rispetto alla classe d'appartenenza sono sempre indicativi di ulteriori entità, mentre l'elemento componente che rappresenta la classe d'appartenenza può o meno essere indicativo di un'ulteriore entità.

La sottolingua proposta prevede due tipologie fondamentali di forme per gli elementi lessicali in forma composta che facciano riferimento a ulteriori elementi lessicali con cui intrattengano relazioni gerarchiche: da un lato forme lessicali composte in linguaggio naturale, cioè in forma discorsiva e non controllata formalmente, con le relazioni 282 L'idea della differenza tra tra forme collegate e non collegate degli elementi lessicali, e più in generale tra forme semplici e composte, è scaturita sia da una riflessione sull'attuale struttura delle LCSH, e dalla relativa incoerenza di utilizzo di termini composti, termini in forma inversa e suddivisioni, sia dalla lettura dell'opera di Hutchins, e in particolare della sua discussione della questione della scomposizione semantica dei termini, cfr. W. JOHN HUTCHINS, Languages of indexing and classification, cit., p. 101-102: “What may be expressed in one DL [...] by a single descriptor may be conveyed in another [...] by a syntagm of

descriptors [...] The latter may have fewer and less specific descriptors than the former but it will

compensate for this by a richer syntagmatic organisation [...] For example [...] the specific NL word “aniline” might be expressed by the combination of abstract terms (i.e. IL descriptors) “amine, benzene derivative, six-carbon compund, seven-hydrogen compund, one-nitrogen compound, dye intermediate, ioly substance, toxic substance, combustible base”, each representing either a genus or an attribute of “aniline”. If each genus and each attribute is then further analysed in the samy way into a set of even more “abstract” terms, and each of these into yet more abstract ones, the result is a “compressed vocabulary” of descriptors - a small set of abstract terms that in combination are capable of expressing higly specific DFs. If these descriptors are not themselves capable of further analysis [...] then is legitimate to treat them as the primitives of a “minimum vocabulary” [ o “compressed vocabularies”:] The descriptors of “compressed vocabularies” are often referred to as “semantic factors”, and the technique used for discovering them as “semantic factoring” ”.

283 Cfr. NATIONAL INFORMATION STANDARDS ORGANIZATION, Guidelines for the construction,

sintagmatiche espresse lessicalmente (“etica della vita”); dall'altro forme lessicali composte espresse in forma artificiale, che presentino esclusivamente gli elementi lessicali

significativi componenti, in forma sostantivale e con le reciproche relazioni sintagmatiche espresse in forma metalessicale (p.e. “[deoggettivo:] Etica - [oggettivo:] Vita”).

Quest'ultimo tipo di forme lessicali composte costituisce a tutti gli effetti un ulteriore grado di controllo linguistico esplicito, tramite cui gli elementi componenti di un

elemento lessicale in forma composta vengono messi in relazione grazie alle loro relazioni sintagmatiche interne. Invece che parlare però di forme sintagmatiche non controllate e controllate, ed esclusivamente per non creare confusione con la terminologia utilizzata altrove, parleremo di forme lessicali non collegate per riferirci alle forme composte degli elementi lessicali in linguaggio naturale (forma discorsiva e non controllata;

corrispondono agli indici non collegati dell'approccio concettuale); parleremo invece di forme lessicali collegate per riferirci invece alle forme lessicali composte controllate tramite relazioni sintagmatiche espresse in modo metalessicale (corrispondono agli indici collegati dell'approccio concettuale).

Mentre per le forme sintagmatiche non collegate è opportuno prevedere soltanto quelle esistenti anche nella relativa lingua naturale (p.e. “etica della vita” e basta; “diritto canonico amministrativo” e “diritto amministrativo canonico”), per le forme

sintagmatiche collegate è opportuno prevedere (in fase di indicizzazione o anche solo di visualizzazione, possibilmente automaticamente) un numero di sequenze possibili corrispondente al numero delle relazioni sintagmatiche coinvolte: due sequenze per una relazione (due elementi lessicali in relazione), sei sequenze per due relazioni (tre elementi lessicali in relazione), ventiquattro sequenze per tre relazioni (quattro elementi lessicali in relazione), etc.

Le forme sintagmatiche collegate, evidentemente, sono delle forme lessicali del tutto estranee alla natura del linguaggio naturale, e legate alle finalità dell'accesso bibliografico; si tratta di uno di quei punti del nostro modello di lingua documentaria in cui linguaggio naturale e finalità dell'indicizzazione divergono.

Le forme sintagmatiche collegate svolgono alcune importanti funzioni catalografiche: permettono, congiuntamente alle relazioni di equivalenza con l'elemento lessicale in forma semplice o composta non collegata, di Trovare un elemento lessicale sia a partire dalla sua forma semplice sia a partire da una delle sue forme composte, per poi Navigare attraverso uno dei suoi elementi lessicali componenti: un utente potrebbe partire da “[deoggettivo:] Etica [oggettivo:] Vita” per spostarsi poi all'elemento lessicale “Etica” o “Vita”, etc., senza dover visualizzare la semantica paradigmatica (iperonimi, olonimi, etc.) dell'elemento lessicale; le varie sequenze artificiali che caratterizzano le forme

sintagmatiche collegate rendono inoltre possibile Trovare l'elemento lessicale a partire da qualsiasi suo elemento componente che si riferisca a un elemento lessicale registrato autonomamente. Ovviamente, ciò crea una ridondanza indiretta con la semantica

paradigmatica, in cui gli elementi lessicali componenti riferiti a ulteriori elementi lessicali sono invariabilmente registrati anche tramite relazioni di iperonimia, sememia, olonimia, etc., tuttavia abbiamo spiegato che si tratta di percorsi semantici alternativi (l'utente non è così obbligato ad accedere alla semantica paradigmatica di un elemento) e dunque

entrambi utili.

A questo punto dobbiamo introdurre un'ulteriore differenziazione nell'ambito delle forme sintagmatiche collegate: possiamo suddividerle in parzialmente collegate e

totalmente collegate a seconda che l'elemento lessicale componente che indichi la classe di appartenenza dell'elemento lessicale nel suo complesso sia o meno un elemento lessicale rilevante in sé, ovvero registrato autonomamente; se lo è, ovvero se tutti gli elementi lessicali componenti il sintagma sono ritenuti significativi e controllati fisicamente tramite proprie registrazioni, parleremo di una forma lessicale totalmente collegata; altrimenti di una forma lessicale parzialmente controllata: quest'ultimo tipo di forma lessicale riguarderà quegli elementi relativi a entità individuali che presentino forme lessicali caratterizzate dalla combinazione di un nome comune e uno o più nomi propri, i quali a loro volta corrispondano agli elementi lessicali sovraordinati

gerarchicamente (olonimi e semi non generici). Esempi di forme lessicali parzialmente controllate sono “[meronimico:] Biblioteca - [olonimico:] CGIL”, ovvero “Biblioteca della CGIL”, “[delocativo + detemporale:] Alluvione - [locativo:] Firenze - [temporale:] 1966”, ovvero “Alluvione di Firenze del 1966, “[meronimico:] Cattedrale - [olonimico:] Palermo”, ovvero “Cattedrale di Palermo”.

Abbiamo così distinto quattro tipologie fondamentali di forme lessicali della sottolingua: forme lessicali semplici, forme lessicali composte non collegate, forme lessicali composte parzialmente collegate e totalmente collegate.

Una nota sulla visualizzazione degli elementi lessicali in forma sintagmatica collegata. Mentre a livello di indicizzazione gli elementi lessicali in forma sintagmatica collegata dovrebbero assumere una forma in cui le relazioni sintagmatiche siano esplicitate tramite elementi metalessicali, del tipo “[dedirettivo:] Deportati [direttivo:] Germania”

(“Deportati in Germania”), a livello di visualizzazione è opportuno che l'uso degli elementi metalessicali sia ridotto a quelli indispensabili, per esempio “Deportati [direttivo:] Germania”; inoltre, non è detto che la forma verbale metalessicale debba essere la stessa in fase di indicizzazione e in fase di visualizzazione; la forma metalessicale di visualizzazione potrebbe riprendere direttamente il linguaggio naturale (per esempio “Deportati - [in:] - Germania”).284

3.3.6.2.6. Uso degli elementi lessicali e semantica paradigmatica dei sintagmi