• Non ci sono risultati.

I diversi gradi di controllo linguistico 1. Introduzione

Lista riassuntiva degli indici e dei collegamenti

3. Un approccio linguistico all'indicizzazione

3.3. L'uso del linguaggio per l'indicizzazione 1. Indicizzazione e linguaggio

3.3.4. I diversi gradi di controllo linguistico 1. Introduzione

Il processo di indicizzazione, come affermato nel precedente capitolo (vedi 2.2), consiste fondamentalmente nell'attività di rappresentazione linguistica di determinati oggetti di interesse (entità, attributi, relazioni, etc.) sulla base di specifiche funzioni o esigenze dell'utente. Le registrazioni bibliografiche, che di tale attività sono il prodotto, sono allora “discorsi bibliografici” attorno a entità e relazioni; il catalogo, l'archivio di autorità e ogni altro repertorio bibliografico che di tali registrazioni è la cumulazione, può a sua volta 266 Le funzioni tipiche del social web possono naturalmente essere anche referenziali o d'altro tipo; inoltre spesso esulano dalle funzioni linguistiche sopra delineate. Per una tassonomia più dettagliata delle funzioni svolte dal social tagging cfr. MARLIESE THOMAS — DANA M. CAUDLE — CECILIA M. SCHMITZ, To

tag or not to tag?, “Library hi tech”, 27, 3 (2009), p. 412-413; cfr. anche TOM STEELE, The new cooperative

cataloging, “Library hi tech”, 27, 1 (2009), p. 69; cfr. anche CAIMEI LU — JUNG-RAN PARK — XIAOHUA HU, User tags versus expert-assigned subject terms. A comparison of LibraryThing tags and Library of Congress subject

headings, “Journal of Information Science”, 36, 6 (2010), p. 763–779, disponibile all'indirizzo <http://jis.sagepub.com/content/36/6/763.full.pdf>, p. 764, 777.

essere inteso come insieme di discorsi bibliografici. Riallacciandoci alla differenza tra tema e rema posta nel precedente capitolo (vedi 2.16.5), potremmo anche dire che l'entità di cui di volta in volta si parla costituisce il tema di questi discorsi bibliografici, mentre l'insieme degli attributi e delle relazioni che di quell'entità vengono predicate costituisce il rema. I discorsi bibliografici hanno una duplice natura, linguistica e indicale: essi sono il prodotto dell'interazione del linguaggio con le esigenze e caratteristiche

dell'indicizzazione; le lingue documentarie, allora, sono una sorta di traduzione delle lingue naturali in una forma controllata sulla base delle esigenze e caratteristiche dell'indicizzazione (vedi 2.17); possiamo allora parlare di un vero e proprio controllo linguistico esercitato dalle lingue documentarie.

3.3.4.2. Semantica delle entità concettuali e delle registrazioni

Il primo e fondamentale elemento caratterizzante le lingue documentarie, nessuna eccettuata, è la distinzione e scelta di un certo numero di elementi dell'universo

bibliografico da rappresentare: virtualmente infiniti, ma quelli da noi considerati sono le entità del modello concettuale (vedi 2.6 e ss.). Abbiamo così un primo grado di controllo linguistico delle lingue documentarie; un controllo di natura essenzialmente semantica, con cui un certo numero di elementi di significato del linguaggio naturale (opere, edizioni, persone, etc.) viene selezionato per la sua rilevanza rispetto alle esigenze degli utenti finali e controllato esplicitamente tramite registrazioni bibliografiche. Questi elementi di significato e le registrazioni bibliografiche che li rappresentano costituiscono nel loro insieme la semantica delle entità concettuali e delle registrazioni della lingua documentaria: una semantica “ad hoc”, cioè specifica del contesto dell'indicizzazione, che si sovrappone alla semantica delle tipologie lessicali o “entità” linguistiche del linguaggio naturale più sopra discussa (vedi 2.11, 3.2.5.3.3); così, in alcuni casi le entità concettuali raccolgono una molteplicità di tipologie lessicali; in altri, viceversa, le entità concettuali specificano sottotipi di sottotipi di tipologie lessicali (entità inanimate); etc.

Approfondiremo in 3.3.6.4.2.3 i rapporti tra semantica delle entità concettuali e semantica delle tipologie lessicali.

3.3.4.3. Semantica degli attributi e degli indici

Un secondo elemento caratterizzante la gran parte delle lingue documentarie è la distinzione e scelta di un certo numero di caratteristiche dei suddetti elementi di significato (le entità) da rappresentare: quelle particolari da noi considerate sono gli attributi del nostro modello concettuale; abbiamo qui un secondo grado di controllo linguistico delle lingue documentarie. Anche in questo caso si tratta di un controllo natura essenzialmente semantica, con cui un certo numero di elementi di significato del linguaggio naturale relativi alle caratteristiche delle entità (nomi, responsabili, soggetti, possessori, etc.) viene selezionato per la sua rilevanza rispetto alle esigenze degli utenti finali e controllato esplicitamente tramite indici o elementi indicali — e metaindicali, che forniscono informazioni sugli indici stessi. Tale secondo grado di controllo linguistico costituisce nel suo insieme la semantica degli attributi e degli indici della lingua

documentaria; anch'esso costituisce parte della semantica “ad hoc” (cioè specificamente bibliografica) della lingua documentaria.

3.3.4.4. Modalità di realizzazione del controllo linguistico: linguaggio naturale e lingue documentarie

Il controllo linguistico può almeno in linea di principio essere realizzato in diversi modi. Il linguaggio naturale conosce diversi espedienti per evidenziare o distinguere gli oggetti a cui si riferisce: può distinguerli o spiegarli esplicitandone verbalmente il significato, oppure utilizzare un codice di natura convenzionale sulla base del quale gli elementi lessicali assumono un preciso significato; avviene così per esempio anche nel linguaggio editoriale usato nei libri, in cui alla posizione degli elementi lessicali sul frontespizio e sulle altre parti formali del libro sono associati dei significati, che poi vanno confermati o smentiti con una successiva analisi. Il linguaggio naturale può evidenziare lo specifico significato degli elementi del discorso tramite l'uso della ridondanza, oppure – nel corso di un'interazione linguistica – tramite retroazione; se orale, tramite il sistema

dell'intonazione; in generale, le lingue naturali possono giovarsi dell'uso del contesto (linguistico, cioè sintagmi precedenti e seguenti a quello preso in analisi; ed

extralinguistico: fatti, situazioni e valori condivisi dai parlanti) per spiegare o evidenziare gli oggetti di cui parlano. Le lingue documentarie, come ogni linguaggio scritto, non possono contare su molti dei suddetti espedienti. Per permettere il controllo degli oggetti di interesse (entità, attributi, relazioni, etc.), e dunque il soddisfacimento delle diverse funzioni dell'utente, le lingue documentarie devono allora ricorrere a un contesto artificiale con cui segnalare, distinguere e spiegare il significato di ciascun elemento del discorso bibliografico. In alcuni casi tale contesto artificiale può essere del tutto assente, confidando sull'evidenza della natura semantica degli oggetti di discorso; in altri può essere presente in forma implicita, per esempio tramite l'impiego di un ordine fisso convenzionale tra gli elementi del discorso bibliografico.

Entrambi questi criteri sono fortemente problematici: il primo espone la lingua

documentaria (ammesso sia possibile parlare a questo livello di lingua documentaria) a tutti i rischi dell'ambiguità del linguaggio naturale senza però i meccanismi di

disambiguazione che lo caratterizzano; l'ordine convenzionale è invece un meccanismo che può funzionare bene in un contesto lineare e cartaceo, ma è insufficiente in un ambiente elettronico (quale è l'odierno ambiente dei cataloghi) in cui l'ordine degli elementi può essere manipolato dal computer, ovvero ogni elemento del discorso può essere ricercato autonomamente. Non resta allora che la possibilità di un controllo esplicito di ciascun elemento dei discorsi bibliografici (registrazioni), che può essere verbale (tag o etichette in una delle lingue naturali) o simbolica (per esempio una

punteggiatura convenzionale, o ancora l'utilizzo di etichette numeriche come nel caso del MARC); ciò, come diremo in 3.3.4.7, ha alcune importanti conseguenze linguistiche.

3.3.4.5. Semantica delle relazioni e dei collegamenti

denominate “controllate”) è la distinzione e scelta di un certo numero di relazioni dell'universo bibliografico da rappresentare; quelle da noi considerate sono le relazioni esposte nel predente capitolo (vedi 2.12 e ss.), più, in questo caso, le ulteriori relazioni che svilupperemo nel presente capitolo sulla base di un confronto con la linguistica. Abbiamo così un terzo grado di controllo linguistico, di natura fondamentalmente semantica, con cui un certo numero di relazioni di significato del linguaggio naturale viene selezionato per la sua rilevanza rispetto alle esigenze degli utenti finali e controllato esplicitamente — con le eccezioni che abbiamo già detto268 — tramite indici controllati e collegamenti fisici tra le registrazioni delle entità.

Il controllo esplicito delle relazioni tramite indici controllati e collegamenti non è soltanto un processo tecnico: fino a quando le entità che fungono da attributi di un'altra entità sono registrate come elementi descrittivi esse fungono sì da elementi semantici e metalinguistici rispetto all'entità registrata, ma questa rimane nel suo complesso isolata linguisticamente dalle altre entità. Soltanto quando il controllo linguistico delle relazioni è esplicito le diverse entità menzionate nelle registrazioni vengono collegate tra loro e con ciò comunicano tra loro; in questo caso, entità e relazioni così collegate vanno a formare parte di una medesima e ulteriore lingua documentaria, con un lessico, una semantica e una morfosintassi distinte: una vera e propria lingua nella lingua, o lingua documentaria interna, che chiameremo “sottolingua” documentaria (vedi 3.3.6).

3.3.4.6. Unitarietà e semanticità dell'indicizzazione

Esplicitiamo a questo punto un importante presupposto del nostro approccio linguistico (peraltro già anticipato nel precedente capitolo, vedi 2.27): nella prospettiva sopra esposta, in cui la totalità di entità, attributi e relazioni, e degli elementi indicali che li rappresentano, è parte della semantica della lingua documentaria, risulta evidente il carattere unitario e integralmente semantico dell'indicizzazione: l'indicizzazione nella sua totalità (non soltanto quella per soggetto) è di natura fondamentalmente semantica, poiché ha sempre a che fare con la scelta e rappresentazione di elementi di significato. Ciò vale tanto per le relazioni semantiche tipiche della linguistica quanto per le relazioni semantiche tipiche dell'indicizzazione, le quali costituiscono nel loro complesso una sorta di semantica a posteriori o “ad hoc” della lingua documentaria. Il carattere unitario e integralmente semantico dell'indicizzazione è ancora più evidente nella sottolingua, nella cui rete sindetica possono almeno in linea di principio coesistere le relazioni

dell'indicizzazione per autore e per soggetto.

3.3.4.7. Implicazioni per gli aspetti linguistici: lessicalizzazione e metasintagmi Il controllo linguistico esplicito operato dalle lingue documentarie ha una conseguenza importante: esso comporta una lessicalizzazione degli aspetti linguistici (semantica, morfosintassi, etc.) del linguaggio naturale. Tali aspetti devono cioè essere nella lingua documentaria espressi tramite ulteriori elementi lessicali con funzione metalinguistica, i 268 Relazioni di equivalenza, di omonimia, relazioni tra temi estensionali.

quali possono poi (nel caso del terzo grado di controllo) essere parte integrante del lessico della sottolingua, oppure restare esterni ad esso (primo e secondo grado di controllo, rispetto a elementi espressi in forma discorsiva; terzo grado di controllo, rispetto a elementi lessicali della sottolingua); in questo secondo caso essi costituiscono elementi “metalessicali”, cioè elementi lessicali che forniscono informazioni su altri elementi lessicali della lingua documentaria (vedi 3.3.6.2.3): per esempio, la semantica

paradigmatica delle relazioni della sottolingua può essere esplicitata tramite l'utilizzo di simboli e sigle, quali i vari BT (“broader term”, cioè termine generico), NT (“narrower term”, cioè termine specifico), etc. tipici dei thesauri; anche la semantica paradigmatica delle tipologie lessicali della sottolingua può essere esplicitata sotto forma di norme d'uso per la combinazione degli elementi lessicali, esterne al lessico della sottolingua in quanto tale. A causa di tale funzione essenzialmente metalinguistica delle lingue documentarie, non è azzardato denominarle anche “metalingue”.269

Spingendo oltre queste idee, potremmo arrivare a concepire il rapporto tra elementi lessicali e metalessicali della lingua documentaria come quello tra diversi elementi di un sintagma, in cui il predicato sia presente in forma implicita, in una sorta di

sintagmatizzazione ideale delle relazioni paradigmatiche; per esempio, la relazione tra l'elemento lessicale “Etna”, subordinato genericamente (tramite l'elemento metalessicale “BT” o suo equivalente) all'elemento lessicale “Vulcani”, può essere concepito come sintagma “l'Etna è un vulcano”; la relazione ad hoc tra “Luigi Pirandello” e l'elemento metalessicale “autore” può essere concepito come sintagma “Luigi Pirandello è l'autore” o “l'autore è Luigi Pirandello”. Elementi lessicali e relativi elementi metalessicali formano cioè idealmente dei sintagmi impliciti, che potremmo chiamare metasintagmi. In riferimento al livello fisico dell'indicizzazione, non sarebbe almeno in linea di principio impensabile esplicitare tali metasintagmi in fase di visualizzazione, fornendo all'utente una descrizione dell'entità ricercata in forma discorsiva (per esempio, l'utente finale che cercasse “Etna” troverebbe una registrazione dell'entità accompagnata dalla descrizione “l'Etna è un vulcano”, o l'utente che cercasse materiale relativo a Pirandello potrebbe trovare un insieme di risorse bibliografiche di cui “Luigi Pirandello è l'autore”, o “Luigi Pirandello è il soggetto”, etc.).