CAPITOLO 1. QUESTIONI TEORICHE E TERMINOLOGICHE
1.7 L’ESTENSIONE DEL LESSICO
1.7.1 LESSICO E DIZIONARI
[…] l’immane massa lessicale di una lingua” (De Mauro, 2005: 32), come si è detto, possono costituire un punto di riferimento per capire quante parole può conoscere mediamente un parlante.43
1.7.1 LESSICO E DIZIONARI
Se è vero che determinare l’effettiva estensione del lessico di una lingua risulta un’impresa impossibile, sembrerebbe però lecito pensare che misurare l’estensione del lessico contenuto all’interno di un oggetto che ha la caratteristica di essere finito,44 il
dizionario, sia invece cosa facile. Anche in questo caso però le cose sono solo apparentemente semplici.
A proposito dell’estensione dei dizionari, Valeria Della Valle (2005: 58) osserva che
43 Ovviamente, qui il punto di riferimento non sono i dizionari tascabili che, come dice la parola stessa, hanno un formato tale che si possono mettere in tasca. Infatti, per questa loro caratteristica è chiaro che non possono contenere lo stesso numero di vocaboli di un dizionario in formato standard (a meno che non si utilizzi un formato caratteri davvero molto piccolo e quindi inadeguato alla consultazione). Facendo una piccola ricerca sul web su due siti che, tra le altre cose, si occupano della vendita di libri online, si scopre che le cifre dichiarate possono cambiare anche notevolmente nonostante il formato. Nel caso dei monolingue d’italiano, per esempio, la DeAgostini ha pubblicato diversi dizionarietti in cui si possono trovare dalle circa 27.000 voci del Dizionario della lingua italiana [1994], ai 30.000 vocaboli dichiarati per il Dizionario italiano [2011] a cura di V. Matera e per il Dizionario italiano. Dizionario essenziale [2012]. Si dichiarano invece oltre 20.000 lemmi per il Dizionario italiano. Dizionario della lingua
contemporanea [2014] a cura di L. Craici per la casa editrice Vallardi e più di 23.000 lemmi per il Dizionario italiano [2012] della Keybook. Nel caso dei dizionari bilingui, per l’inglese, si va dagli oltre
20.000 lemmi del Dizionario inglese [2004] a cura di L. Incerti Caselli e F. Cenni per la casa editrice Vallardi, alle 35.000 voci e locuzioni de Il mini di inglese [2007] della Zanichelli, per poi salire ulteriormente ai 40.000 vocaboli del Dizionario inglese [2011] della DeAgostini fino alle 70.000 parole dichiarate invece per il Barron’s Italian-English Pocket Dictionary. Dizionario tascabile Italiano-Inglese [2008] della Barron’s Educational Series Inc. Si potrebbero riportare ulteriori esempi ma già questi mettono in luce le differenze legate alle cifre.
44 D’altronde, è questo uno dei pregi di un’opera come il dizionario. Ne La Fabbrica delle Parole (2005: 32), opera in cui si riporta l’introduzione al GRADIT (1999), poi riproposta anche nella 2° edizione (2007), De Mauro osserva che non avrebbe senso “riprodurre puntualmente l’immane massa lessicale di una lingua in tutti i suoi usi. [Infatti] un dizionario risulta utile solo se è di dimensioni ridotte rispetto a ciò che rappresenta. È inevitabile e benefico lo scarto tra la massa di fatti lessicali da rappresentare e la rappresentazione stessa”. Se così non fosse si incapperebbe nel rischio di seguire “la falsa strada evocata da Borges in un famoso racconto epistemologico: la strada di quegli zelanti geografi che, credendo di fare cosa utile al loro Imperatore e signore, foggiarono per lui una carta geografica vasta tanto quanto l’Impero stesso. Risultò una carta, ovviamente, inutilizzabile”. Il rapporto di 1:1, dunque, nei dizionari come nelle carte geografiche, non ha molto senso.
[u]n luogo comune particolarmente diffuso fa individuare come “miglior dizionario” quello che registra più parole: in realtà la ricchezza del lemmario non è l’elemento più importante, e il valore dell’opera va piuttosto misurato sulla capacità di fornire informazioni grammaticali, indicazioni sul livello stilistico, sulla frequenza d’uso, con numerosi esempi di fraseologia esplicativa.
Dal punto di vista quantitativo De Mauro e Ferreri (2005: 298) osservano che pure mettendo da parte i nomi di numero, che sono potenzialmente infiniti, o le parole occasionali, oppure ancora i lessemi che entrano nell’uso pur provenendo da altre lingue o da altre aree, il lessico di una lingua
è un insieme di una numerosità che trascende di gran lunga le quantità di lemmi delle fonti dizionaristiche anche più estese. Queste […] al massimo sono dell’ordine di 105, mentre quelle delle masse lessicali (in lingue di società complesse e di lunga tradizione) sono dell’ordine di almeno 106, se non 107.
In questa citazione, si ha un primo riferimento utile per capire quale sia il rapporto esistente tra il lessico di una lingua e il lessico contenuto in un dizionario, almeno in termini numerici. Tuttavia, come si è anticipato, le cose non sono affatto così semplici e i due studiosi affermano anche che
in riferimento a lingue vive di lunga tradizione e proprie di società complesse, occorrerebbe ormai dare per acquisito che l’obiettivo di un dizionario non può essere quello di adeguare la effettiva quantità di lessemi utilizzati nei testi e discorsi di una qualunque di esse. […] complice anche una qualche disattenzione della linguistica teorica per la natura intrinsecamente illimite del lessico delle lingue […] le considerazioni che abbiamo fatto stentano a farsi strada anche tra alcuni lessicografi e specialmente tra editori, autori di pubblicità di dizionari, giornalisti improvvisatori di recensioni. Editori [che] si spingono fino alle più sfacciate menzogne credendo di fare cosa buona nel gonfiare le cifre dei lemmi dei loro dizionari […]. Solo in parte essi hanno come alibi l’incertezza e disparità di criteri nel conteggiare ciò che un dizionario offre […] (De Mauro e Ferreri, 2005: 299-300).
L’incertezza e la disparità dei criteri nel conteggio dei vocaboli contenuti in un
dizionario potrebbero apparire a prima vista come un problema superficiale.45
In realtà
45 In questo senso, dal punto di vista di un comune parlante, probabilmente questo fatto potrebbe essere, alla peggio, fonte di delusione in conseguenza delle aspettative create da chi ha l’intento di far vendere una certa opera piuttosto che un’altra. Se infatti il parlante sceglie di comprare un certo dizionario perché in qualche modo lo ritiene superiore qualitativamente e/o quantitativamente rispetto a un altro prodotto, resterà forse deluso se poi la presunta superiorità non si rivela davvero tale. Bisogna però considerare in primo luogo che molto difficilmente egli andrebbe a verificare se quanto dichiarato per vendere una certa opera è vero, anche perché dovrebbe intanto essere in grado di barcamenarsi tra le svariate terminologie utilizzate per farlo che, come si è detto, creano non pochi problemi anche ai professionisti, e in secondo luogo una verifica di questo tipo funzionerebbe meglio attraverso il confronto con altre opere. Inoltre, coloro che devono acquistare un dizionario spesso lo fanno indirizzati da altri, come può accadere in
però qui si ripresenta tutta l’ambiguità e la problematicità del termine ‘parola’ di cui si è discusso sopra poiché la terminologia adottata per dare conto di quanto e cosa un dizionario offre, “limita le possibilità di comparazione e ingenera dissimetrie nelle quantificazioni” ma soprattutto “ostacola la proiezione dell’estensione lessicale individuale sull’insieme dei vocaboli di una lingua”. Questo non è certamente un problema di superficie perché chiunque voglia attuare una buona pratica didattica, per poterlo fare in maniera adeguata e sulla base dei bisogni dell’apprendente, deve avere accesso anche a questo tipo di informazioni, e di informazioni il più possibile attendibili, tanto più che attualmente, e di pari passo con lo sviluppo di nuove tecnologie, l’informatizzazione di diversi dizionari di nuova generazione
potrebbe e dovrebbe consentire agli stessi autori e editori di stabilire e dichiarare numeri attendibili di lemmi. Naturalmente restano le incertezze di criteri e degli stessi oggetti di computo, anche automatico. […] se [però] l’intero impianto del dizionario è accuratamente informatizzato secondo criteri formali ed espliciti, il risultato dei computi può aspirare a essere attendibile (De Mauro e Ferreri, 2005: 300).
In Italia, da questo punto di vista, nell’ultimo quarto di secolo si è assistito a una fioritura di strumenti lessicografici che “almeno per qualche aspetto possono essere definiti di nuova concezione” (Ferreri, 2005b: 51). Riferendosi all’opera di De Mauro, che nel 1999 pubblica la prima edizione del GRADIT, Valentina Bisconti (2012) parla di una ‘svolta lessicografica’, ma in realtà con queste parole ci si può riferire all’intero panorama lessicografico italiano. Si concretizza infatti l’auspicio espresso da Della Valle quando nel 1993 scriveva:
l’insieme delle opere […] appena messe in cantiere fanno sperare che la lessicografia italiana […] sia ormai in grado di restituirci contemporaneamente l’immagine di una società più omogenea socialmente e culturalmente, e di una lingua rappresentata per quello che è, nelle sue varietà, nella sua mobilità, nel suo indissolubile legame col passato (Della Valle, 1993: 91).
Molti dei dizionari messi in cantiere qualche tempo fa vanno dunque a compimento differenziandosi per impostazione e per consistenza. In misura e modi diversi, essi infatti per qualche aspetto innovano “nel tipo di informazioni che forniscono per
ambito scolastico quando un insegnante raccomanda una certa opera. In questo caso si potrebbe presumere che quello/a stesso/a insegnante abbia una certa familiarità con gli strumenti lessicografici, familiarità che gli permette di fare delle scelte basate anche sul confronto tra le opere, ma non è affatto detto che non si lasci influenzare semplicemente da slogan e vesti grafiche accattivanti, soprattutto se nella didattica opera in quella visione statica del lessico dalla quale mette in guardia Ferreri.
ciascun lemma” e nell’offrire “indicazioni degli usi sintattici e pragmatici adottati dalla comunità dei parlanti […] nella stessa struttura delle voci” venendo così “a configurarsi sempre più […] come spaccato della lingua nel suo complesso” (Ferreri, 2005b: 51-52; 2006: 132).
Intorno allo stesso arco di tempo vengono infatti pubblicate delle opere che riescono finalmente a descrivere adeguatamente la lingua italiana sia dal punto di vista diacronico sia dal punto di vista sincronico.
Per quanto riguarda i dizionari storici e quindi di impostazione diacronica,46 nel
2002 arriva a compimento il Grande Dizionario della lingua italiana (in sigla GDLI), 47
opera il cui lavoro è stato ideato e diretto dal filologo romanzo Salvatore Battaglia a partire dal 1961, e poi portato a termine dal critico letterario Giorgio Bàrberi Squarotti.48
L’opera consta di 21 volumi e si stima che al suo interno si trovino circa 180.000 lemmi, ognuno dei quali offre “una ricchissima messe di riferimenti d’autore, con esempi che permettono di cogliere attraversi i secoli il nascere e consolidarsi dei significati e delle accezioni di senso che con il tempo si sono stabilizzati nella lingua” (Ferreri, 2005b: 51 e 2006: 132).49
46 Nella sua descrizione dei dizionari storici Della Valle scrive che essi “registrano la tradizione letteraria scritta attraverso la citazione di esempi di autori, per testimoniare l’uso delle singole parole o delle locuzioni nelle varie epoche. Si tratta, dunque, di dizionari di tipo diacronico, che descrivono la lingua nella sua evoluzione storica, basandosi su una fraseologia tratta da testi letterari di ogni tempo. […] La fisionomia tradizionale dei dizionari storici, che si proponevano fino a qualche tempo fa di registrare esclusivamente la lingua letteraria, si è progressivamente modificata, fino ad accogliere anche testi non letterari […]” (2005: 53-54).
47
A integrazione dell’opera nel 2004 sono stati pubblicati il Supplemento 2004, diretto da Edoardo Sanguineti, e l’Indice degli autori citati nei volumi I-XXI e nel Supplemento 2004 a cura di G. Ronco. Successivamente è stato pubblicato Supplemento 2009, a cura di Edoardo Sanguineti.
48 Della Valle scrive che “nel settore dei dizionari storici […] gli studiosi hanno ora a disposizione un vastissimo dizionario compiuto, e due opere in progress che riguardano la lingua antica” (2007: 23). I due dizionari storici che si trovano ancora in corso d’opera sono il Tesoro della lingua italiana delle origini (in sigla TLIO), diretto dal 1992 da Pietro G. Beltrami che si occupa del periodo che va dalle origini fino al 1375, anno della morte del Boccaccio, la cui novità risiede nel fatto che si basa su uno spoglio di testi non solo letterari e che in esso si considerano tutte le varietà dell’italiano antico, e non solo il toscano; vi è poi il Glossario degli antichi volgari italiani (in sigla GAVI) di Giorgio Colussi, recentemente affiancato da Marco Berisso, del quale finora sono stati pubblicati 32 volumi che contengono le voci corrispondenti a otto lettere dell’alfabeto (A, B, C, D, S, U, V, Z). Quest’opera raccoglie le voci tratte da opere a stampa scritte nei volgari antichi e si fonda su una raccolta di testi non selezionati sulla base del loro valore letterario e scritti prima del 1321, anno della morte di Dante. La raccolta fu poi ampliata con testi di tutto il Trecento, il Quattrocento e parte del Cinquecento.
49 Come osserva Della Valle (2007: 20-21), il GDLI nacque con l’intento di rinnovare il Dizionario della
lingua italiana di Tommaseo-Bellini e inizialmente erano previsti solo quattro volumi. Come è noto,
l’opera ha poi raggiunto i 21 volumi (esclusi i supplementi) pubblicati nell’arco di ben 41 anni. Questi fatti, nel tempo, hanno creato le condizioni per un cambiamento nei criteri e nell’impostazione adottati
Secondo Della Valle (2007: 21-22), un'altra opera che può essere assimilata a questa tipologia di dizionari è il Primo tesoro della lingua letteraria italiana del
Novecento, diretto da Tullio De Mauro e pubblicato nel 2007. Essa, si basa su una
raccolta di cento romanzi scritti tra il 1947 e il 2006, sessanta dei quali hanno vinto il Premio Strega mentre i rimanenti quaranta sono testi hanno partecipato alla selezione.50
All’interno del corpus sono state rinvenute 157.670 forme di diverso tipo che poi sono state ricondotte al loro lemma di riferimento. In questo modo il lemmario, che esiste solo in formato elettronico, risulta costituito da 94.254 voci registrate e ordinate alfabeticamente, ognuna delle quali è accompagnata dal contesto in cui appare. Della Valle nota che “la costruzione del thesaurus ha consentito di individuare e includere nel lemmario molto materiale lessicale non rintracciabile nei dizionari, ma che in essi meriterebbe di trovare ospitalità” (2007: 21-22).
La lista delle novità lessicografiche risulta però ben più lunga per quanto riguarda le opere che descrivono la lingua dal punto di vista sincronico e quindi la lingua d’uso e su questo fronte, alla fine del Novecento, appaiono due grandi opere: una è il
Vocabolario della lingua italiana (in sigla VOLIT), edito dalla Treccani negli anni
1986-1994 e del quale fu autore e direttore Aldo Duro; l’altra invece è il già citato
Grande dizionario italiano dell’uso (in sigla GRADIT), ideato e diretto da Tullio De
Mauro, la cui prima edizione risale al 1999.
Il VOLIT “si presenta, per l’esaustività e l’ampiezza delle definizioni, come un’enciclopedia fondata sulla lingua” (Della Valle, 2007: 25) che segue la tradizione iniziata col Dizionario enciclopedico italiano, realizzato tra il 1955 e il 1961 dall’Istituto dell’Enciclopedia Italiana, con i suoi riferimenti alla lingua letteraria presenti nella fraseologia, ma distinguendosi per “una nuova attenzione […] riservata alla lingua moderna e ai nuovi usi legati alla lingua di tutti i giorni, documentati attraverso una ricca esemplificazione, nonché alla terminologia scientifica, ai linguaggi
inizialmente. I primi volumi dell’opera, infatti, si basavano su una nutrita raccolta di testi letterari dell’Ottocento e del Novecento e si caratterizzavano per un grande numero di esempi che servivano ad illustrare anche le voci più comuni. In seguito però, la raccolta dei documenti si è estesa basandosi non solo su fonti letterarie ma anche su quotidiani, rotocalchi, riviste, saggi di diverse materie, ecc. Questo, insieme ad altri fattori, ha fatto sì che l’opera passasse “dal carattere iniziale di dizionario storico della lingua letteraria a dizionario storico dei vari aspetti e realizzazioni della lingua scritta”.
50 In realtà, la proposta iniziale del progetto prevedeva di includere 240 romanzi, cioè i sessanta vincitori e altri tre per ciascun anno. L’entità del corpus scese poi a 100 romanzi poiché nel 2003, la Presidenza del Consiglio dei Ministri ridusse il finanziamento.
settoriali, ai forestierismi e ai neologismi già stabilmente penetrati nella lingua italiana” (2007: 25). La seconda edizione di quest’opera (1997) comprende cinque volumi all’interno dei quali sono presenti circa 125.000 lemmi, che salgono a 160.000 se si considerano anche i sottolemmi.
Il Grande dizionario italiano dell’uso di De Mauro, invece, è un’opera che si innesta su un altro tipo di ‘tradizione’ legata indissolubilmente all’attività lessicografica che il suo ideatore, al momento della sua pubblicazione, portava avanti già da circa un ventennio. Nel 1980, infatti, De Mauro pubblicava Guida all’uso delle parole, un’importante opera all’interno della quale egli inserì un’appendice altrettanto importante contenente il primo ‘vocabolario di base’ (in sigla VdB)51
della lingua italiana.52
Questo fatto è molto importante dal momento che i vocabolari di base di diverse altre lingue erano stati approntati ormai molto tempo prima.53
51 Per l’elaborazione del VdB, De Mauro si avvalse della collaborazione di Stefano Gensini ed Emilia Passaponti.
52
In realtà, come segnalato da diversi studiosi (cfr. Bortolini et al., 1971; Kardos, 2002: 24-39; Bisconti, 2012: 10; Chiari e De Mauro, 2012: 24; ma si vedano anche gli importanti lavori di Sgroi, 1981: 281-295 e 1994: 207-244; e Marello, 1996: 146-147), alcuni lavori (sia dizionari che liste) che andavano in questa direzione hanno preceduto il progetto del VdB, discostandosi però da esso sia perché sviluppati principalmente come strumenti didattici (soprattutto per l’insegnamento dell’italiano agli stranieri) sia perché utilizzano diversi approcci e metodologie nella selezione dei lemmi. In ordine cronologico questi sono: Thompson M.E. [1927], A study in Italian vocabulary frequency, University of Iowa Master’s Thesis, [unpublished] (500 vocaboli, fra cui anche parole grammaticali, ricavati da un campione di 100.000 occorrenze presenti in 10 manuali di lettura per stranieri, con frequenza non inferiore a 30); Knease T.M. [1933], An Italian word list from literary sources, Toronto, The University of Toronto Press (2.080 o 2.097 parole tratte da un campione di 400.000 occorrenze presenti nelle opere in prosa e poesia di 40 autori (pubblicate tra il 1870 e il 1930), con frequenza e dispersione superiori a 9); Skinner L.H. [1935], ‘A Comparative Study of the Vocabularies of Forty-Five Italian Textbooks’, The Modern
Language Journal, 20(2): 67-84 (2.962 parole tratte da un campione di 19.800 voci di partenza presenti
nei glossari appartenenti a 45 testi di cui 20 grammatiche, manuali e libri di testo, e 25 antologie utilizzati nelle scuole americane per l’insegnamento dell’italiano, con dispersione compresa fra 45 e 10); Migliorini B. [1943], Der grundlegende Wortschatz des Italienischen, Marburg, Elwert (1.500 lemmi selezionati secondo le intuizioni del linguista piuttosto che su dati statistici, fornendo la traduzione tedesca e la pronuncia IPA); Russo G.A. [1947], ‘A Combined Italian Word List’, The Modern Language
Journal, 31(4): 218-240 (3.173 parole ottenute dalla somma dell’elenco di Knease (1933) e di Skinner
(1935), di cui 1.870 in comune e 1.303 presenti o nell’una o nell’altra lista) a cui segue Russo J.A. [1962], ‘An Italian Idiom List’, The Modern Language Journal, 46(1): 14-21 (malgrado le lettere diverse del nome si dovrebbe trattare dello stesso Russo; la lista contiene le 452 locuzioni più frequenti presenti in 25 testi per l’insegnamento dell’italiano nelle scuole americane, anche se la loro dispersione varia da 1 a 21); Giovannelli P. [1966], Grund-und Aufbauwortschatz. Italienisch, Stuttgart, E.Klett (dizionario che include 74 parole grammaticali, 2.000 parole di base disposte in ordine alfabetico, e 2.500 di perfezionamento organizzate in campi concettuali; tutte le parole sono accompagnate dalla traduzione tedesca e da qualche esempio e sono state selezionate in base all’esperienza dell’autore); Juilland A.G. and Traversa V. [1973], Frequency Dictionary of Italian Words, Mouton, The Hague (5.014 parole tratte da un corpus di 500.000 occorrenze, formato da testi pubblicati tra il 1920 e il 1940, raggruppati in 5 sezioni costituite da opere teatrali, romanzi e novelle, saggistica, periodici, e testi tecnici e scientifici, e
Il VdB si basa, in buona parte, sui risultati che emersero agli inizi degli anni Settanta nel lavoro di Bortolini et al. (1971), il cosiddetto Lessico di frequenza della
lingua italiana contemporanea, meglio noto con la sigla LIF. Esso è il risultato dello
spoglio di un corpus di 500.000 occorrenze della lingua italiana contemporanea, tratte in parti uguali (100.000) da cinque gruppi di testi apparsi tra il 1947 e il 1968 che consistevano in: sussidiari per le scuole elementari, quotidiani e settimanali, testi teatrali, copioni cinematografici e romanzi.54
Questi testi sono poi stati schedati dal Centro Nazionale Universitario di Calcolo Elettronico di Pisa (CNUCE), e si è potuta stabilire la frequenza con cui ogni parola che compariva nel campione era usata nel
composte da 100.000 parole ciascuna. Il limite inferiore è la frequenza superiore a 4, l’indice di uso superiore a 2, e l’occorrenza in almeno 3 sottoinsiemi); Reiske H. [1974], VHS-Italienisch Unterricht und
VHS-Zertifikat Italienisch, Frankfurt, Pädagogische Arbeitsstelle Deutscher Volkhochschul-Verband (si
tratta di una lista di 1.580 lemmi tra cui i termini grammaticali; è ricca di esemplificazioni e di indicazioni di tipo grammaticale; la lista è stata preparata per l’unione delle scuole popolari per adulti e le parole scelte in base all’esperienza dell’autore); Baldelli I., Mazzetti A. [1974], Vocabolario minimo della
lingua italiana per stranieri, Firenze, Le Monnier (contiene un repertorio di 1741 parole e termini
grammaticali con esemplificazioni e con le rispettive traduzioni in inglese, francese, tedesco e spagnolo; anche in questo caso la scelta delle parole è basata sull’esperienza degli autori); Sciarone A.G. [1977],
Vocabolario fondamentale della lingua italiana, Perugia, Guerra (2.726 parole, tratte da un corpus di