Lista riassuntiva degli indici e dei collegamenti
3. Un approccio linguistico all'indicizzazione
3.3. L'uso del linguaggio per l'indicizzazione 1. Indicizzazione e linguaggio
3.3.6. La sottolingua documentaria
3.3.6.4. Semantica 1. Introduzione
3.3.6.4.3. Semantica sintagmatica o sintassi profonda 1. Introduzione
Il linguaggio naturale, come ricorda Hutchins, conosce fondamentalmente quattro generi di espedienti di organizzazione sintagmatica: ordine delle parole, concordanza (basata sul le proprietà morfologiche dei lessemi), sistema dei casi e connettivi di vario tipo (preposi zioni, congiunzioni, verbi ausiliari, etc.).335 Le lingue documentarie che operano un qual che tipo di organizzazione sintagmatica hanno selezionato e semplificato uno o più tra i suddetti espedienti sintagmatici, modificandoli sulla base delle esigenze dell'indicizzazio ne.336
335 W. JOHN HUTCHINS, Languages of indexing and classification, cit., p. 25-26.
336 Cfr. YVES GILBERT COURRIER, Document analysis, verbs and case grammar, cit., p. 54: “Whether few in number or several, whether natural or artificial, they all play the same role: they give a more precise representation of the content of the documents because they reproduce in the document representation the relations among the concepts that were present in the original documents”.
L'espediente sintagmatico in assoluto più utilizzato storicamente dalle lingue documenta rie è quello dell'ordine tra le parole (ordine fisso, ordine di citazione, ordine di combina zione, etc.), utilizzato come mezzo per assegnare un significato relativo agli elementi com ponenti di un elemento lessicale in forma composta. Tuttavia, l'ordine fisso tra le parole è un espediente sintagmatico efficace solo in un ambiente linguistico lineare, quale è il lin guaggio naturale (scritto o orale), non in un ambiente elettronico in cui l'ordine delle pa role può essere manipolato e in cui è possibile l'accesso a singoli elementi lessicali dei sin tagmi a prescindere dalla loro posizione. Continuare a utilizzare l'ordine fisso come espe diente sintagmatico, come tuttora viene fatto in molte lingue documentarie, significa vin colare l'accesso bibliografico a una logica del tutto estranea alle potenzialità dell'ambiente elettronico. Una differenza importante di cui abbiamo parlato è la differenza tra livello di superficie e profondo del linguaggio, e in particolare tra (morfo)sintassi di superficie e profonda; la sintassi profonda del linguaggio ha una natura fondamentalmente semanti ca, e per questo possiamo parlarne anche nei termini di una semantica dell'asse sintagma tico, o semantica sintagmatica. L'ordine delle parole, così come la concordanza, i casi morfosintattici e i connettivi di vario tipo sopra menzionati appartengono alla morfosin tassi di superficie; questa ha un ruolo molto limitato all'interno della lingua documenta ria. Molto più importante nelle lingue documentarie è invece il livello profondo del lin guaggio, quello della sintassi profonda o semantica sintagmatica: le relazioni sintagmati che, le quali sono relativamente indipendenti dall'ordine, dai casi di superficie, dai con nettivi usati, etc. Porre la base dell'organizzazione sintagmatica delle lingue documentarie al livello profondo del linguaggio equivale a dire che è possibile mantenere l'organizzazio ne sintagmatica del linguaggio, la sua contestualità sintagmatica (quella paradigmatica es sendo fornita dalla semantica paradigmatica),337 rinunciando a fissare la sua morfosintassi di superficie e dunque, tra le altre, cose, all'ordine fisso tra gli elementi componenti degli elementi lessicali in forma composta. Quando, nel precedente capitolo, avevamo parlato della coordinazione (vedi 2.18.4), avevamo già detto in nuce la maggior parte di queste cose; avevamo detto anche come la chiave per un'efficace coordinazione fosse quella di escogitare un sistema che permettesse di mantenere la contestualità (sintagmatica) rinun ciando all'ordine fisso: il sistema di relazioni sintagmatiche di cui abbiamo parlato, e che adesso approfondiremo, vuole rappresentare proprio questo.
La teoria dell'indicizzazione e le lingue documentarie tradizionali hanno rifiutato o accol to le teorie grammaticali della linguistica in modo generalmente acritico (con qualche ec cezione, soprattutto autori che erano anche linguisti o che avevano condotto uno studio approfondito della linguistica, vedi sotto); si è spesso pensato o che la sintassi delle lingue naturali non potesse essere una base idonea per quella delle lingue documentarie, o vice versa che le trasformazioni grammaticali elaborate da Chomsky esaurissero le problemati che legate all'organizzazione sintagmatica del linguaggio.338 La teoria dell'indicizzazione 337 Sulla contestualità cfr. ELAINE SVENONIUS, The intellectual foundation of information organization, cit., p. 189: “Related to specificity and expressive power, contextuality is the ability of a subject language to recognize distinctions in meaning. Since the task of vocabulary disambiguation is not limited to omonyms and polysemes but extends to all words whose meaning is in part contributed to by context, context is needed for making distinctions in meaning. The contexts shown by Boolean intersections of terms are relationally indiscriminate and therefore cannot disambiguate sufficiently to achieve acceptable precision”. 338 Cfr. JEAN-CLAUDE GARDIN, Document analysis and linguistic theory, “Journal of documentation”, 29, 2 (1973), p. 142-143: “Our thinking has been somewhat obscured by the stubborness of two extreme views [...] (a) the earlier one, according to which the whole issue was pointless, to the extent that the
co-tradizionale ha inoltre teso a ignorare o confondere la differenza tra sintassi profonda e di superficie,339 tra sintassi e asse sintagmatico del linguaggio — contrapponendo così, erro neamente, sintassi e semantica —, tra relazioni paradigmatiche e sintagmatiche, tra i diver si tipi di relazione sintagmatica.
Nonostante queste imprecisioni, riteniamo utile ripercorrere le categorie, relazioni, e ruo li sintattici elaborati da alcuni autori della teoria dell'indicizzazione. La prima teorizzazio ne rilevante è quella di Kaiser, già menzionata, che categorizzò gli elementi delle voci di soggetto in concreti e processi (e poi anche località).340 S. R. Ranganathan individuò cin que tipologie di relazioni tra “soggetti”, o relazioni di fase: relazione generale, inclinazio ne, comparazione, differenza, influenza; le relazioni di fase furono poi rielaborate da An tony C. Foskett, che vi aggiunse i destinatari; Hutchins offrì a sua volta una reinterpreta zione in termini linguistici delle relazioni di fase di Foskett.341 Proprio Hutchins comparò in modo sistematico le modalità e gli espedienti di organizzazione sintagmatica delle lin gue naturali e delle lingue documentarie; Hutchins fu forse il primo a riprendere e appli care la nozione dei casi profondi di Fillmore alle lingue documentarie; raccomandò che i particolari espedienti scelti dalla lingua documentaria per rappresentare le relazioni sin tagmatiche esplicitassero i casi profondi tra gli elementi del sintagma.342 I casi profondi fu rono proprio in quegli anni (siamo nella metà degli anni Settanta dello scorso secolo) ri presi da Derek Austin, la cui teorizzazione, che sfociò nell'elaborazione del PRECIS, è molto importante per il nostro discorso; Austin: 1) suddivise le relazioni sintagmatiche in relazioni “logiche” (corrispondenti agli operatori booleani) e “grammaticali”;343 2) appro fondì e rielaborò i casi profondi di Fillmore.344 In particolare, considerò i seguenti tipi di relazione sintagmatica o “operatori di ruolo”: locativa, sistema chiave (oggetto dell'azione, è l'operatore di ruolo centrale nella costruzione del sintagma e corrisponde idealmente al verbo della lingua naturale), azione/effetto, agente, punto di vista, regione/popolazione di studio, destinatari (o beneficiari)/forma, più altri tra cui parte/proprietà, membro di occurrence of (index) terms in a given document (representation) was enough to indicate their mutual relations; (b) the other, born with generative grammar, for which the kind of syntactical parsers and trees developed in contemporary linguistics provided “the” answer to the relational requirements of document processing [...] although a large number of information systems do take into account syntactical data, none of them seems ever to have contemplated that NL grammars, including the more traditional ones, provided a convenient framework for that purpose. It is not enough to observe that the more “modern” information systems make no use of the more recent grammatical theories, one has also o acknowledge the much more significant fact that none of the many “conventional” systems evolved in the last hundred years for purposes of document analysis hase deemed it convenitent to use the grammatical tools available in the linguistics of their time for the handling of syntactical relations”.
339 Cfr. JEAN-CLAUDE GARDIN, Document analysis and linguistic theory, “Journal of documentation”, 29, 2 (1973), p. 142.
340 Cfr. ELAINE SVENONIUS, The intellectual foundation of information organization, cit., p. 129. 341 SHIYALI RAMAMRITA RANGANATHAN, Prolegomena to library classification, assisted by M. A. Gopinath, 3rd ed., New York, Asia, 1967, disponibile all'indirizzo
<http://arizona.openrepository.com/arizona/handle/10150/106370>, p. 358, 461-462; ANTONY CHARLES FOSKETT, The subject approach to information, 2nd ed. revised and enlarged, London, Bingley, 1971, p. 125-128; cfr. anche W. JOHN HUTCHINS, Languages of indexing and classification, cit., p. 104-105. 342 W. JOHN HUTCHINS, Languages of indexing and classification, cit., p. 68, 71.
343 DEREK AUSTIN, Basic concept classes and primitive relations, cit., p. 87.
344 JUTTA SØRENSEN — DEREK AUSTIN, PRECIS in a multilingual context. Part 2, cit., p. 108-111; cfr. anche DEREK AUSTIN, Basic concept classes and primitive relations, cit., p. 90; cfr. anche ALBERTO CHETI,
un gruppo quasi-generico, e concetto coordinato.345 Il PRECIS prevede la possibilità di coordinare, cioè congiungere, due elementi che svolgano lo stesso caso profondo all'inter no del sintagma.346 Tra le tassonomie successive, dobbiamo menzionare almeno quella di Coates, simile a quella del PRECIS ma più approfondita,347 e le elaborazioni sorte sulla scorta del PRECIS in ambito italiano: GRIS e Nuovo soggettario — che dal lavoro del GRIS ha preso avvio. La “sintassi” del GRIS prevede diverse relazioni sintagmatiche: agenti, atti vità, strumenti, proprietà, materiali, spazio e tempo; prevede inoltre una suddivisione in ruoli nucleari (azione, oggetto, agente, strumento, beneficiario) e “extranucleari” (locazio ne: luogo, tempo, etc.), nonché in ruoli primari e secondari (cioè dipendenti: parte, pro prietà, etc.).348
3.3.6.4.3.2. Relazioni sintagmatiche
Dopo questo breve excursus, possiamo discutere le relazioni sintagmatiche della nostra sottolingua. Prima di entrare nel vivo della discussione, però, vogliamo esplicitare alcune premesse alla base della nostra trattazione delle relazioni sintagmatiche. Così come per molti altri autori e testi della teoria dell'indicizzazione, per la modellizzazione linguistica della semantica sintagmatica della sottolingua siamo partiti dalla nozione di ruolo o caso. In particolare, il nostro sviluppo della semantica sintagmatica ha preso le mosse dall'idea di Tom Delsey secondo cui l'approfondimento delle relazioni sintagmatiche offrirebbe la possibilità di specificare la modellizzazione concettuale degli indici di soggetto (anche se come diremo noi siamo andati oltre e abbiamo esteso tale possibilità anche agli indici del la catalogazione per autore).349 Nel fare ciò, e come già Hutchins, PRECIS e altri autori 345 JUTTA SØRENSEN — DEREK AUSTIN, PRECIS in a multilingual context. Part 2, cit., p. 108-111; cfr. anche DEREK AUSTIN, Basic concept classes and primitive relations, cit., p. 115. Cfr. anche TOM DELSEY,
Modeling subject access, cit., p. 58-59.
346 JUTTA SØRENSEN — DEREK AUSTIN, PRECIS in a multilingual context. Part 2, cit., p. 118, in cui gli autori spiegano che il PRECIS, pensato per una piena coestensione, prevede la possibilità di coordinare due elementi semantici dello stesso tipo di operatore di ruolo (dunque lo stesso tipo sintattico o sintattico-semantico, cioè che hanno lo stesso caso profondo) in un'unica stringa (per esempio: “Lilies--Growth regulation + Pollination”); cfr. anche DEREK AUSTIN, Basic concept classes and primitive relations, cit., p. 90. 347 ERIC J. COATES, Subject catalogues. Headings and structure, London, Library Association, 1988, p. 55. 348 ASSOCIAZIONE ITALIANA BIBLIOTECHE. GRUPPO DI RICERCA SULL'INDICIZZAZIONE PER SOGGETTO, Guida all'indicizzazione per soggetto, cit., p. 23, che suddivide i ruoli (semantici, ma GRIS li considera relazioni sintattiche) in primari (relazioni sintagmatiche semantiche) e secondari (relazioni sintagmatiche sintattiche: tra questi ultimi include i ruoli di dipendenza e coordinazione. Cfr. anche BIBLIOTECA NAZIONALE CENTRALE DI FIRENZE, Nuovo soggettario, disponibile all'indirizzo <http:// thes.bncf.firenze.sbn.it/>. Cfr. anche MASSIMO ROLLE, Per un nuovo modello di linguaggio documentario, cit., p. 322.
349 TOM DELSEY, Modeling subject access, cit., p. 58-59: “Issues of a different nature will emerge as consideration is given to extending the relationships represented in the FRBR and FRANAR models to cover the syntactic relationships that are reflected within individual indexing strings, as distinct from the semantic relationships between terms, concepts, etc., that are reflected in thesauri and subject heading lists [...] From a modeling perspective, the first issue to be addressed with respect to the representation of syntactic relationships is how to reflect the context-dependent nature of the relationships. The aim would be to delineate the relationships between each of the entities represented in the indexing string and the string as a whole [...] Syntactic relationships could then be defined to operate between specific instances of the entities concept, object, event, place, work, expression, manifestation, item, person, family, and corporate body (as
prima di noi, abbiamo individuato nei casi profondi (o ruoli semantici) di Fillmore la base di partenza ideale per sviluppare il nostro sistema di relazioni sintagmatiche — è per questo motivo che abbiamo discusso in maniera approfondita i casi profondi di Fillmore nel corso della precedente sezione.350
Fatte queste doverose premesse, passiamo a parlare della semantica sintagmatica (o sintas si profonda) della nostra sottolingua e delle sue differenze da un lato rispetto ai casi pro fondi così come concepiti da Fillmore e dalla linguistica successiva, dall'altro rispetto alla teoria dell'indicizzazione tradizionale. Innanzitutto dobbiamo esplicitare una differenza fondamentale tra i casi profondi così come presenti nelle lingue naturali e la loro applica zione alle lingue documentarie (in generale, non solo la sottolingua da noi proposta): mentre i casi profondi funzionano generalmente bene nelle lingue naturali — con qualche eccezione, vedi la già menzionata ambiguità tra casi oggettivo e locativo per alcuni tipi di evento (“Bombardamenti della Sicilia” e “Bombardamenti in Sicilia”) —, la loro applica zione alle lingue documentarie è in alcuni casi problematica; nelle lingue documentarie, infatti, non è auspicabile distinguere significati relativi o sintagmatici che siano molto si mili; per questo motivo, inoltre, non è opportuno che la semantica sintagmatica della sot tolingua preveda tutti i casi profondi che sono stati proposti nel corso degli anni — sui quali non vi è peraltro accordo nemmeno in linguistica.
Con l'avvertenza che non si tratta di una lista esaustiva o obbligatoria (ogni lingua docu mentaria che vorrà applicare il nostro sistema di semantica sintagmatica potrà includere un numero maggiore o minore di casi profondi), i casi profondi previsti dalla nostra se mantica sintagmatica saranno allora: agentivo, strumentale, oggettivo, locativo, benefatti vo, causativo, temporale, funzionale, originario e direttivo; escluderemo invece i casi fatti tivo (coperto dal caso oggettivo) e comitativo (che non riteniamo necessario e che in molti casi si sovrappone casi oggettivo e benefattivo); a ognuno di tali casi corrisponde una spe cifica tipologia di relazione sintagmatica, come diremo sotto.
Abbiamo introdotto tali casi già nella precedente sezione (vedi 3.2.7); discuteremo invece adesso le peculiarità della loro applicazione all'interno del nostro sistema di semantica sin tagmatica. I casi profondi di Fillmore corrispondono fondamentalmente agli argomenti della struttura profonda che ruotano attorno al verbo di una frase. Poiché, con le eccezio ni effettive o ipotetiche che abbiamo detto più sopra (vedi 3.3.6.3), i verbi sono assenti dalla sottolingua proposta, e dunque tutti i sintagmi della sottolingua saranno sintagmi nominali, il ruolo centrale che nel sistema sintagmatico di Fillmore ha il verbo verrà nella nostra sottolingua assunto da un sostantivo che costituisca una nominalizzazione di ver bo. In alcuni casi si tratterà di un sostantivo che rappresenta o faccia riferimento diretta mente a una attività o un processo (“educazione”, “influenze”, “violenza”, etc.); in altri si tratterà di sostantivi che rappresentino entità collettive ma che sussumano in sé o includa no il riferimento ad attività: è il caso di alcune tipologie di nominalizzazioni come “sculto ri”, “scrittori” (entità animate), ma anche “trattori”, “fertilizzanti” (entità inanimate), etc. well as any relevant additional entities defined in the course of extending the models to cover subject access) and specific instances of the newly defined entity topic or subject matter. The second issue to be addressed is how to define and categorize the various types of syntactic relationships. Essentially the model needs to reflect the role or function of each concept, etc., represented in the indexing string relative to the string as a whole, or more precisely, to the topic or subject matter represented by the string”.
350 A differenza del PRECIS, nel nostro approccio il punto di vista è modellato come elemento esterno (ed eventualmente collegato) ai sintagmi utilizzati per rappresentare il tema di un testo; la regione o
Mentre le attività possono reggere tutti i casi profondi, le entità che facciano riferimento ad attività possono reggere un numero più limitato di casi profondi: non, per esempio, i casi strumentale e agentivo.
Inoltre, mentre nel sistema di Fillmore tutti i casi profondi sono singoli elementi lessicali che ruotano attorno al ruolo centrale giocato dal verbo, in modo da configurare una orga nizzazione gerarchica del sintagma di due soli livelli, con un ruolo centrale da un lato e l'insieme dei casi profondi, subordinati al ruolo centrale, dall'altro, nel nostro sistema è prevista la possibilità di un numero maggiore di livelli di organizzazione gerarchica dei sintagmi: ogni caso profondo, infatti, potrà essere costituito da più elementi lessicali com ponenti i quali intrattengano tra loro ulteriori relazioni sintagmatiche, in modo del tutto identico alla struttura del sintagma generale, cioè con un elemento lessicale che svolge un ruolo sovraordinato rispetto a uno o più elementi lessicali che svolgono casi profondi su bordinati (per esempio: in “Valutazione dell'educazione in Italia”, “educazione in Italia” è oggettivo di “Valutazione”; “educazione in Italia” è strutturato a sua volta in modo che “Italia” sia locativo di “educazione”). Una struttura, dunque, gerarchicamente complessa dell'organizzazione dei sintagmi, in cui un ruolo sovraordinato regge uno o più ruoli su bordinati, ciascuno dei quali può a sua volta svolgere un ruolo sovraordinato rispetto ad altri ruoli subordinati; questo tipo di struttura è prevista anche dal GRIS (che non parla di casi o di elementi sovraordinati e subordinati ma di testa e modificatore).351 Proprio per permettere di rappresentare adeguatamente questo tipo di struttura a più livelli gerar chici, oltre che per facilitare la creazione di sequenze artificiali tra gli elementi lessicali del sintagma, nella nostra sottolingua — come si era già accennato indirettamente nella tratta zione delle relazioni paradigmatiche gerarchiche specificate — è prevista la rappresentazio ne obbligatoria non soltanto degli elementi che svolgono un caso profondo, ma anche de gli elementi lessicali che svolgono il caso reciproco (per esempio “Educazione” rispetto al caso oggettivo “Donne” in “Educazione delle donne”), secondo una logica binaria; come anticipato, ci riferiremo a tali casi reciproci aggiungendo il prefisso “de-” al nome del ri spettivo caso profondo (quindi, ritornando all'esempio precedente, la forma sintagmatica collegata sarebbe “[deoggettivo:] Educazione - [oggettivo:] Donne”); questa terminologia non appartiene alla linguistica ma è di nostra invenzione. Ciò ha come conseguenza che l'elemento lessicale che assume il ruolo sovraordinato del sintagma svolgerà, secondo il nostro sistema, un numero di casi profondi (reciproci) pari a quello dei casi profondi che regge (in “Abusi sui detenuti da parte della polizia”, avremmo “[deagentivo + deoggettivo:] Abusi - [agentivo:] Polizia - [oggettivo:] Detenuti”). Precisando quanto detto sopra, possia mo dire che nel nostro sistema sintagmatico ogni elemento lessicale può svolgere più ruo li semantici, secondo una organizzazione sintagmatica al contempo binaria (caso profon do e suo reciproco) e orientata o gerarchizzata (ruolo sovraordinato e ruoli subordinati, che a loro volta possono essere composti da un ruolo sovraordinato con ruoli
subordinati).352
Fin qui ci siamo limitati deliberatamente a esempi in cui il ruolo sovraordinato è svolto da un elemento lessicale che rappresenta un'attività. Un'altra differenza, ancora più im portante della precedente, tra il sistema dei casi di Fillmore e il nostro sistema sintagmati 351 ASSOCIAZIONE ITALIANA BIBLIOTECHE. GRUPPO DI RICERCA SULL'INDICIZZAZIONE PER SOGGETTO, Guida all'indicizzazione per soggetto, cit., p. 22.
352 Anche JEAN-CLAUDE GARDIN, Document analysis and linguistic theory, cit., si schiera a favore della riduzione di relazioni plurime a relazioni binarie.
co è che mentre nel primo i casi profondi si applicano esclusivamente a sintagmi verbali, ovvero a sintagmi nominali in cui sia presente una sostantivo deverbale (nominalizzazione del verbo, che rappresenti un'attività o un'entità la quale faccia riferimento a un'attività), nel nostro sistema abbiamo esteso l'applicazione dei casi profondi anche ai sintagmi no minali in cui sono del tutto assenti sostantivi deverbali o riconducibili a un'attività, e che potremmo chiamare sintagmi nominali non deverbali. Per esempio, all'interno del nostro sistema sintagmatico concepiremo la forma sintagmatica collegata di “Edifici in Italia” come “[delocativo:] Edifici - [locativo:] Italia”. Si tratta di un'operazione non soltanto estranea alla natura dei casi profondi di Fillmore così come originariamente concepiti, ma persino alla stessa nozione di argomento così come intesa in linguistica; un artificio, che