• Non ci sono risultati.

Il Trésor de la Langue Française come corpus a Il corpus di base : il lemmario.

5. Il campione rappresentativo dell'analisi.

5.1. Il Trésor de la Langue Française come corpus a Il corpus di base : il lemmario.

I criteri relativi alla scelta dei lemmi che costituiscono la macrostruttura del

Trésor, nonché le modalità di lemmatizzazione delle parole estratte dai diversi corpora,

sono stati oggetto di ripensamenti, aggiustamenti, modificazioni più che plausibili per un'opera lessicografica la cui redazione si estende su un periodo di più di trent'anni. Le diverse Préfaces che introducono i primi 7 volumi diretti da Paul Imbs rendono conto di ogni minima variazione relativamente alla scelta dei lemmi e ai criteri di lemmatizzazione.

Nella Préface al primo volume, P. Imbs esponeva i principi che giustificavano la scelta dei lemmi entrati a far parte della macrostruttura del dizionario. Oltre ai criteri teorici, ritroviamo, nell'ordine, il principio d'autorità, il principio filologico e il principio morfologico.

Il Trésor è innanzitutto un dizionario generale di lingua che concentra parte della sua attenzione sui termini tecnici e scientifici :

Le dictionnaire tel que nous le concevons doit comprendre le vocabulaire de la langue commune à tous les francophones ayant reçu une telle culture de type humaniste, la part des vocabulaires spéciaux étant limitée à ceux qui ont reçu une diffusion assez large pour n'être plus seulement la propriété du milieu clos qui les a vus naître231

Per quanto riguarda la parte di lessico comune a tutti i francofoni di cultura umanistica, essa doveva includere neologismi - nella misura in cui essi venivano coniati seguendo la regola d'analogia - termini desueti ma utilizzati da scrittori per descrivere una realtà storica232 anteriore al periodo considerato e i derivati di nomi propri di nazioni, popolazioni, città o persone.

Il principio d'autorità può essere considerato un criterio 'esterno' : esso si basa sui lemmari dei diversi dizionari oppure su dati raccolti da indagini di ordine sociologico. Tale criterio è stato applicato principlamente ai termini regionali inclusi nel lemmario solo qualora si fosse sicuri che non si trattasse di termini esclusivamente dialettali, ma che fossero di uso comune in una determinata zona geografica presso parlanti che ignorassero il dialetto e che li usassero spontaneamente.

Per quanto riguarda, poi, l'ammissibilità al lemmario di locuzioni o termini latini e greci risultanti dallo spoglio dei testi, il principio di autorità rimanda al Dictionnaire de

l’Académie, edizioni del XIX e XX secolo, nonché al Grand Littré e al Petit Littré.

Il principio filologico è un criterio 'interno' che autorizza l'ammissione dei termini al lemmario a partire dal modo in cui essi si presentavano all'interno degli enunciati che costituivano il corpus.

Perché il termine potesse far parte del lemmario, era necessario che esso fosse illustrato da un enunciato organizzato, ovvero sintatticamente autonomo. L'applicazione di tale principio ha permesso di scremare termini afferenti soprattutto al lessico scientifico o tecnico; esso ha inoltre contribuito all'eliminazione di termini del lessico storico che non figuravano presso un autore se non in sequenze di pura enumerazione.

Il principio morfologico concerne la produttività della lingua attraverso il procedimento della derivazione prefissale o suffissale. Esso è un principio di ordine misto, sia 'interno' che 'esterno'.

Sulla base di tale principio, la macrostruttura è stata arricchita da parole non risultanti dallo spoglio del corpus ma attestate in alcuni dizionari generali (Académie e

Complément del 1842 – ad esclusione delle parole connotate come "vieux langage" -, Littré e Dictionnaire Général) e in dizionari tecnici del XIX e del XX secolo a

condizione che tali parole fossero morfologicamente riconducibili ad un lemma già incluso nel lemmario e che tali dizionari fornissero una definizione chiara e

232 Per quanto concerne i termini afferenti al lessico storico e i termini stranieri incontrati nel corpus, qualora essi fossero attestati una sola volta in seguito allo spoglio dei testi, si è verificato che fossero

riproducibile con il relativo riferimento e, meglio ancora, con un esempio sintatticamente autonomo.

La parte più interessante per l'applicazione di tale principio consiste nella lemmatizzazione degli elementi formanti del lessico che sono stati accolti allo stesso titolo delle parole. Ai prefissi e ai suffissi sono stati aggiunti quelli che si è convenuto chiamare elementi prefissali o suffissali (elementi formanti), ovvero unità lessicali non autonome, spesso prese a prestito dal latino o dal greco. La struttura dell'articolo riguardante gli affissi e gli elementi formanti del lessico diverge rispetto a quella dell'articolo degli altri lemmi: ritroviamo, infatti, negli articoli dedicati a prefissi, suffissi, elementi prefissali ed elementi suffissali, un numero considerevole di derivati. Tale procedimento ha permesso di alleggerire la macrostruttura da un eccesso di lemmi che iniziano o terminano con lo stesso elemento formante e per le quali la vitalità di utilizzo o la diversità degli esempi sembrano insufficienti.

Un'ulteriore categoria di lemmi che figurano all'interno del lemmario del T.L.F. è rappresentata dai termini afferenti al lessico metalinguistico, ovvero quell'insieme di termini utilizzati ai fini della descrizione lessicografica.

P. Imbs richiamò due regole che il lessicografo era tenuto a rispettare: innanzitutto la regola di discrezione nell'utilizzo della metalingua e, in seguito, la regola di ridondanza, che consiste nell'introdurre anticipatamente nel lemmario un numero più esteso di termini metalinguistici di quanto necessario233.

Nel corso degli anni i criteri per la costituizione del lemmario sono stati a mano a mano modificati: nella Préface al tomo II, P. Imbs annunciava importanti riduzioni non solamente della macrostruttura ma anche del corpo degli articoli. Per quanto riguarda queste ultime, sono state soprattutto le rubriche di contenuto diacronico ("Etymologie et Histoire") e/o fonologico-morfologico ("Prononciation et Orthographe") a farne maggiormente le spese. Per quanto riguarda invece la parte sincronica dell'articolo, essa è stata alleggerita dall'elevato numero di esempi senza che fosse intaccata la parte relativa al metalinguaggio o alla descrizione semantica.

233 Nel rispetto della regola di ridondanza sono stati inseriti nel lemmario termini estratti da J. MAROUZEAU, Lexique de la terminologie linguistique, Paris, P. Geuthner, 1951. La macrostruttura è stata altresì arricchita da termini metalinguistici contenuti in un "dossier" interno appositamente redatto dall'INaLF a partire da opere coeve di linguistica generale o francese. Nelle intenzioni dichiarate da P. Imbs, le analisi semantiche del corpo principale degli articoli del T.L.F. sarebbero dovute essere sottoposte al computer ai fini di una revisione posteriore della macrostruttura e di correzioni o complementi all'opera (cfr. IMBS, Préface in C.N.R.S. Trésor de la langue française..., Tome Premier,

Nella Préface al tomo III venivano maggiormente definiti i criteri relativi alle

riduzioni di cui al tomo II :

La nomenclature est définitivement arrêtée à 80.000 mots, dont environ 60.000 en entrées distinctes, et 20.000 regroupés en alinéas sous un autre mot dont ils sont dérivés, ou placés en simples remarques quand il s'agit par exemple de mots rares qui n'ont eu qu'une existence éphémère ou ne sont que pure jonglerie verbale234.

Tale Préface aggiunse elementi importanti al principio morfologico esposto nel tomo I. Nella prima Préface l'applicazione di tale principio riguardava i soli elementi formanti. Per ragioni di spazio (voluminosità del dizionario) e di tempo (era necessario portare a termine l'opera in tempi ristretti), taluni derivati dovevano essere introdotti all'interno di uno spazio appositamente predisposto del lemma che ne costituiva la base. Il principio morfologico si trovava, inoltre, alla base dell'introduzione, sotto la rubrica "remarques", di eventuali derivati rari, con frequenza ridotta, o che, poiché frutto di fantasie verbali di determinati autori, non trovavano altri riscontri se non nella lingua scritta. Tale principio ha avuto sicuramente, in misura maggiore rispetto agli altri, un risvolto notevole sul numero dei lemmi, data la distinzione fra entrate principali ed entrate secondarie.

L'economia del lemmario è stata realizzata, inoltre, attraverso regole più severe per l'inclusione in seno allo stesso di termini tecnici provenienti dall' I.G.L.F. o da dizionari generali: è stato infatti applicato in modo più restrittivo il principio filologico.

Anche i nomi di etnie, i termini derivati da nomi propri e gli stessi nomi propri sono stati oggetto di una drastica riduzione: solo i termini la cui estensione andasse oltre a una specifica popolazione o a un particolare personaggio potevano entrare di diritto a far parte del lemmario.

Talvolta sono stati modificati anche taluni principi esposti all'interno della Préface al Tomo I: è il caso del principio di autorità che, in certi casi, funziona in commistione con il principio morfologico. Se l'autorità dell'Académie rimaneva indiscutibile, la stessa cosa non può dirsi degli altri dizionari generali: i termini contenuti nella macrostruttura dei grandi dizionari venivano inclusi nel lemmario del Trésor solo se appartenevano alla serie morfologica di un lemma già ammesso nel lemmario e solo se, all'interno di tali dizionari, erano accompagnati da esempi che fossero enunciati organizzati e non semplici sintagmi.

Le restrizioni di cui alla Préface del Tomo III divennero in realtà esecutive a partire dal Tomo V: se "les trois premiers tomes avaient de propos délibéré laissé la bride sur le cou à la rédaction"235, condizionamenti di ordine principalmente economico e secondariamente di tempo e di spazio, hanno ridotto il dizionario a una quindicina di volumi, sicché "il [...] a fallu dès la fin du tome 3 consentir à des réductions, qui vont développer toutes leurs conséquences à partir du tome 5"236. Al di là delle riduzioni riguardanti la microstruttura, a livello di lemmario sono stati ulteriormente aumentati i numeri di casi in di raggruppamento dei derivati sotto il lemma che ne costituiva la base, soprattutto per i casi di derivati di natura tecnica e scientifica, o di parole poco attestate all'interno della documentazione.

Col tomo V i criteri di base relativi alla costituzione del lemmario sembravano essere fissati in modo definitivo: le successive Prefazioni, infatti, non trattano più la macrostruttura ma forniscono, eventualmente, motivazioni relative alla microstruttura e alla composizione delle diverse rubriche.

Con la Préface al tomo VIII Quemada inaugurava la propria direzione, conscio del fatto che era impensabile ogni tipo di cambiamento di ordine teorico e metodologico: "nous nous sommes interdit, par principe, toute modification qui entraînerait une transformation sensible de la forme ou du contenu du dictionnaire"237. Per il resto, dato che il Trésor aveva già - dopo un periodo di gestazione che si estende su quattro tomi - saldamente fissato i propri criteri, altro non restava al secondo direttore se non ricordare il parziale squilibrio esistente fra la redazione degli articoli riguardanti lemmi delle prime tre lettere dell'alfabeto e quella delle successive lettere. Quemada concludeva la

Postface asserendo che, fra le magnificenze del Trésor, il corpo della macrostruttura ne

costituisce una non indifferente, poiché essa è la più estesa di tutti i dizionari del francese moderno. Ciò grazie al fatto che essa non considera esclusivamente termini della lingua letteraria, ma prende in debita considerazione i neologismi nonché termini afferenti a tutti i campi del sapere: filosofia, storia, politica, scienze sociali, economia, scienze esatte e tecnica.

235 P. IMBS, Au lecteur in C.N.R.S., Trésor de la langue française. Dictionnaire du XIXe

et du XXe siècle (1789-1960). Publié sous la direction de Paul Imbs, Tome Quatrième, Paris, 1975, p. VII.

236 Ibidem.

237 QUEMADA, BERNARD, Sans titre in C.N.R.S., Trésor de la langue française. Dictionnaire du XIXe

La versione cartacea e la versione informatizzata del Trésor de la Langue

Française includono, così, 54.280 articoli238 o entrate principali distinte dalle entrate

secondarie o 'sous-vedettes'. La differenza fra le prime e le seconde è di ordine morfologico: le entrate secondarie sono, in genere, derivati o composti a partire dalle entrate principali. Tale relazione morfologica costituisce il criterio lessicografico di base per la costituzione della macrostruttura del TLF: le entrate secondarie non vengono infatti lemmatizzate ma ospitate in una rubrica a parte dell'articolo della base a partire dalla quale esse vengono formate.

Questo comporta una differenza sostanziale fra la ricerca di un termine effettuata su supporto cartaceo e quella effettuata su supporto informatico: per la prima è necessario essere consci del fatto che talune entrate lessicali possono essere sottolemmatizzate ma che non tutti i composti e i derivati sono ospitati all'interno dell'articolo della base. Per la seconda non esiste materialmente nessuna differenza: la digitazione della parola all'interno della maschera iniziale del CD-rom o della relativa pagina internet, restituisce su schermo l'articolo all'interno del quale essa è collocata.

Tenuto conto delle 'sous-vedettes', il lemmario del Trésor de la Langue

Française si estende a 92.997239 articoli. È indubbio che i 38.717 articoli ottenuti

sottraendo il lemmario inclusivo delle 'sous-vedettes' e il totale delle entrate lessicali, costituiscano, quantitativamente, una porzione importante, ma è altresì vero che i sottoarticoli dedicati a tali 'sous-vedettes' costituiscono porzioni estremamente limitate di testo rispetto alla totalità dell'articolo che le contiene: generalmente posti alla fine dell'articolo240, immediatamente dopo la rubrica "Etymologie et Histoire", essi sono costituiti da una definizione, un numero limitato di esempi ed eventuali osservazioni di ordine diacronico.

Date le finalità del presente lavoro, si è ritenuto di non includere nel computo degli articoli di base del Trésor le 'sous-vedettes', ma unicamente le entrate principali.

238 Cfr. C.N.R.S. - UNIVERSITÉ DE NANCY-2 - A.T.I.L.F., Trésor de la Langue Française informatisé, Paris, C.N.R.S. Éditions, 2004, p.161.

239 Cfr. Ibidem. Il lemmario del Trésor de la Langue Française risulta dallo spoglio di 416 opere per il XIX secolo e 586 per il XX. Da tale spoglio sono state rilevate 32.663.549 occorrenze per il XIX secolo corrispondenti a 47.628 lemmi e 37.653.685 occorrenze per il XX secolo, corrispondenti a 59.745 lemmi per un totale di 70.317.234 occorrenze per 71.415 lemmi. La lista dettagliata dei testi oggetto di spoglio è stata pubblicata ne "Le Français Moderne" fra l'aprile 1968 e l'ottobre 1969. (cfr. D. DUGAST, La