• Non ci sono risultati.

Comparazione del parlato e dello scritto

III. 3.1.3.2 I risultati emersi dall’analisi strutturale

III.3.3 Comparazione del parlato e dello scritto

Come questa ricerca ha illustrato, la pervasività dei lexical bundles può essere misurata – tramite la numerosità dei diversi lexical bundles, la frequenza d'occorrenza dei bundles e la proporzione delle parole di un corpus rappresentate in forma di lexical

bundles.

Sommando i bundles di tre e quattro segmenti in sequenza del corpus del parlato analizzato, si nota che ci sono quasi 4000 lexical bundles diversi, con una frequenza di 39.000 volte su circa 500.000 parole, ovvero 78.000 occorrenza su un milione di parole. Seguendo la regola di normalizzazione, i bundles di tre parole occorrono 75.000 volte su un milione di parole, i bundles di quattro segmenti hanno una frequenza di 6.000 volte su un milione di parole.

Già nella sezione precedente sono stati evidenziati i dati quantitativi circa la numerosità e frequenza di occorrenza dei lexical bundles nella scrittura accademica. Dai dati si evince come la frequenza di occorrenza di lexical bundles di 4 parole in tutti e due i registri – conversazione e discorso accademico – è alta. Nella conversazione risulta tuttavia più alta.

Grafico 6 – Numero di lexical bundles nella conversazione e nella prosa accademica

0 500 1000 1500 2000 2500 3000 3500 4000 Bundles di 3 parole Bundles di 4 parole Conversazione Prosa accademica

Per rendere possibile il confronto tra lo scritto e il parlato si deve considerare anche la frequenza dei singoli lexical bundles. Si può constatare che il linguaggio parlato presenta solo alcune sequenze con una frequenza abbastanza alta – cosa riscontrata già in lingua inglese (Conrad, Biber, 2004). Da contro, nella scrittura accademica riscontriamo nelle prime cinquanta posizioni bundles che sono molto frequenti.

A mo' di esempio indichiamo il bundle di tre parole non lo so, che presenta un'occorrenza di 356 su un milione di parole, il più frequente lexical bundle di quattro parole – va bene va bene – ha una frequenza di 92 volte su un milione di parole. D'altro canto, le sequenze di quattro parole più frequenti nella prosa accademica occorrono da 200 a 400 volte su un milione di parole.

Ulteriori dati quantitativi riguardano la proporzione delle parole presenti in forma di lexical bundles di 3 e 4 parole in sequenza. La proporzione risulta più alta nella conversazione – le sequenze di 3 parole coprono una percentuale del 24%, quelle di 4 parole in sequenza una percentuale del 2,8%. La percentuale nella scrittura accademica si rivela alquanto più bassa – i lexical bundles di 3 parole presentano una copertura del 12% di tutte le parole, quelli di 4 parole in successione una copertura dell'1,6% – osservabile nel grafico 7 e 8..

Grafico 7 – Percentuale delle parole in lexical bundles in conversazione

Grafico 8 – Percentuale delle parole in lexical bundles nella scrittura accademica 0% 5% 10% 15% 20% 25% 30% % di tokens

La necessità di un confronto tra il parlato e lo scritto non deve portare a dimenticare l'arbitrarietà del criterio imposto all'inizio della presente ricerca. Il limite dell'occorrenza dei lexical bundles stabilito su 10 volte su un milione di parole impone un'alta percentuale delle parole precostituite di 3 e 4 parole in sequenza. Da questa prospettiva, il loro uso ricorrente non sembra essere un puro caso (Conrad, Biber, 2004). Nell'effettuare il confronto si è inoltre partiti dalla struttura grammaticale dei

lexical bundles. Lo studio ha mostrato che la generalità dei clusters nel discorso

accademico dispone di una struttura frammentata, con una tendenza verso i bundles nominali e preposizionali.

Come riportato da Biber ed altri (1999), solo il 15% dei lexical bundles nella conversazione può essere guardato come composto da frasi o clausole complete, mentre il resto è composto da frasi frammentate o clausole con nuovi frammenti incorporati.

Dallo spoglio svolto sul corpus LIP è emerso che il 18,4% delle espressioni di quattro parole è composto da sintagmi completi, mentre nella prosa accademica il 35% di tutti i lexical bundles rappresenta sintagmi completi. Questo dato illustra la divergenza tra il discorso accademico in lingua inglese e in lingua italiana – la scrittura scientifica inglese dispone del 5% di clausole complete. La diversa proporzione potrebbe essere attribuita alla diversa tipologia linguistica.

Un altro insieme di elementi interessanti per individuare la differenza tra il parlato e lo scritto è la struttura dei lexical bundles di quattro parole in tutti e due i corpora analizzati.

Il 62% di tutte le sequenze di quattro parole identificate nel corpus del parlato include un elemento verbale, da contro la struttura verbale è presente solo in una

0% 5% 10% 15% 20% 25% 30% % di tokens

proporzione equivalente al 12,3 % nel corpus specialistico. Piuttosto, l'87% di tutte le espressioni di quattro parole nella scrittura accademica risulta avere una struttura nominale o preposizionale.

I risultati possono essere comparati con quelli ottenuti nella ricerca sulla lingua inglese, mostrando un carattere concorde.

Ci sembra importante mettere in luce un'ulteriore divergenza tra il parlato e lo scritto: nel corpus del parlato è stato riscontrato un gruppo di lexical bundles avente struttura clausale. Questo gruppo copre il 29,5% di tutti i bundles di quattro parole nel

corpus del parlato, da contro, nella scrittura accademica la stessa forma strutturale

presenta solo il 7,3% delle forme dei bundles nel corpus. Il carattere clausale della conversazione è una caratteristica tipica del parlato inglese – paragonando i risultati tra il parlato e lo scritto in lingua italiana questa struttura viene preferita nella lingua parlata.

Tracy-Ventura ed altri (2007) hanno paragonato i modelli di utilizzo nelle tipologie e nelle distribuzioni per la lingua spagnola. Lo studio svolto sulla prosa accademica e sulle interviste sociolinguistiche ha mostrato la prevalenza dei bundles nominali e preposizionali nella prosa accademica, mentre il parlato dispone di più

lexical bundles verbali. La lingua italiana si presenta da questa prospettiva vicina alla

lingua spagnola, mostrando una tendenza verso i bundles preposizionali e nominali nel discorso scientifico.

Inoltre, le ricerche di Tracy-Ventura ed altri (2007) hanno mostrato che lo spagnolo accademico – paragonato alle interviste sociolinguistiche – dispone di una varietà più alta di lexical bundles. Da contro, gli studi di Butler (1997, in Tracy- Ventura, 2007) hanno rilevato un più alto numero di sequenze ripetute di quattro parole nei registri parlati. Gli studi svolti sulla lingua inglese (Biber ed altri, 1999, 2006) indicano una maggiore densità dei lexical bundles nel registro parlato.

I risultati delle ricerche sulla lingua italiana sono congruenti con i dati sulla lingua inglese – i lexical bundles nel registro parlato sono più numerosi. Quest’osservazione mette in luce la variazione della quantità dei lexical bundles attraverso i registri – un altro fattore che non deve essere dimenticato è la loro variazione quantitativa attraverso le discipline scientifiche. Come hanno rivelato le ricerche parziali sulla lingua italiana,

la numerosità di lexical bundles varia attraverso le discipline scientifiche, mostrando una maggiore densità dei lexical bundles nella scienza applicata.

Sulla base di quanto premesso possiamo concludere che i risultati di questa parte della ricerca coincidono con le ipotesi formulate all’inizio dello studio. Anche se i

lexical bundles nella maggioranza dei casi presentano delle strutture grammaticalmente

incomplete, possono essere classificati strutturalmente, confermando le ipotesi tradizionali sul carattere prevalentemente verbale del parlato e sul carattere nominale dello scritto. Considerando questo fatto, i lexical bundles sembrano essere dei blocchi importanti nella costruzione del discorso (Biber ed altri, 1999).

Questa parte della ricerca ha voluto mostrare la diversa struttura dei lexical

bundles in registri diversi, senza addentrarci nelle funzioni discorsive delle sequenze di

quattro parole, che saranno approfondite nella sezione seguente e riguardano solo il discorso accademico.

III.3.4 Variazione funzionale dei lexical bundles nel discorso accademico –