• Non ci sono risultati.

La definizione dei lexical bundles

I.6 I LEXICAL BUNDLES

I.6.1 La definizione dei lexical bundles

L'oggetto principale della presente ricerca si basa sui modelli lessicali, su sequenze di quattro parole, bundles di parole, anche conosciuti come gruppi (clusters) o blocchi (chunks) (Hyland, 2008a) che mostrano una tendenza statistica alla co- occorrenza.

Queste combinazioni di parole possono essere guardate come espressioni multiparola e vengono chiamate lexical bundles. Il termine lexical bundles è stato

coniato da Biber insieme ad altri autori (1999: 90) in un'innovativa e approfondita trattazione della grammatica inglese, in cui i lexical bundles vengono definiti come:

"the most frequent recurring lexical sequences in a register, regardless of their idiomaticity, and regardless of their structural status. That is, lexical bundles are simply sequences of word forms that commonly go together in natural discourse22

Nel Longman Grammar of Spoken and Written English

".

23

Circa il 21% della componente accademica del Longman Spoken and Written

English corpus rappresenta questi bundles comuni e circa il 30% delle parole nella

conversazione si presenta in un lexical bundle ricorrente, mentre le combinazioni di tre

(Biber ed altri, 1999) –

un lavoro basato esclusivamente sul British National Corpus di 100.000 milioni di parole – i lexical bundles vengono identificati in base alla loro lunghezza. Nei primi studi, Biber insieme ad altri studiosi (1999) ha analizzato bundles composti da tre parole, mentre nei lavori successivi (Biber ed altri, 2004, Biber, 2006) i ricercatori si concentrano anche sulle sequenze di 4 parole, specificando che i lexical bundles più lunghi sono di solito estensioni o formazioni di uno o più bundles più brevi.

Una gamma di studi di corpus ha mostrato quanto i lexical bundles siano onnipresenti nella conversazione e nei generi accademici. Biber ed altri (1999) hanno suggerito che i bundles di tre parole ricorrono più di 60.000 volte nella prosa accademica e più di 80.000 volte nella conversazione, mentre i bundles di quattro parole ricorrono più di 5.000 volte su un milione di parole nella prosa accademica e 8.500 volte nella conversazione. Hanno riportato che i bundles individuali di tre parole sono leggermente più frequenti che i bundles di quattro parole: il bundle di tre parole medio ricorre 25 volte su un milione di parole, mentre il bundle di quattro parole medio ricorre 20 volte su un milione di parole.

22 Traduzione: "le sequenze lessicali che ricorrono più frequentemente in un registro, indipendentemente

dalla loro idiomaticità, e indipendentemente dal loro status strutturale. Cioè, i lexical bundles sono semplicemnete delle sequenze di forme di parole vanno comunemente insieme nel discorso naturale".

23 Il Longman Spoken and Written English Corpus comprime quattro milioni di parole da conversazioni

in inglese britannico; circa tre milioni di parole da conversazioni in inglese americano; circa 5.3 milioni di parole in prosa accademica. Il corpus di prosa accademica comprende sia articoli di ricerca accademica (1.7 milioni di parole) e libri accademici avanzati (circa 2.6 milioni di parole). Per approfondimenti vedi Biber ed altri (1999).

parole più frequenti appaiono più di 200 volte su un milione di parole e le combinazioni di quattro parole circa 100 volte. Le ricerche considerano la frequenza come la caratteristica più saliente e determinante dei bundles: i lexical bundles sono semplicemente espressioni fisse determinate dalla frequenza, che è specificata dal programma informatico. L'utilità dei dati di frequenza e dell'analisi del corpus risiede nell'identificazione di modelli di utilizzo che altrimenti non verrebbero notati, rendendo possibile lo studio di parole particolari e delle loro funzioni particolari all'interno di date classi grammaticali, un aspetto del linguaggio che è spesso ignorato (Biber ed altri, 1999).

In verità il punto limite usato per identificare i lexical bundles varia a seconda del ricercatore ed è in qualche modo arbitrario, poiché può variare da 10 a 40 su un milione di parole. Per esempio, in uno studio Biber ed altri (1999) considerano 10 occorrenze su un milione di parole come punto limite, mentre nello studio dei lexical bundles nei libri di testo e nell'insegnamento universitario il punto limite è di 40 occorrenze su un milione di parole (Biber ed altri, 2004).

Biber ed altri (1999) hanno riportato che alcune combinazioni di parole sono molto più comuni e occorrono più di 200 volte su un milione di parole. Altri studiosi che hanno analizzato le microlingue come Cortes (2002, 2004) e Hyland (2008a, 2008b) hanno usato un punto limite di frequenza di 20 volte per identificare una combinazione di parole come lexical bundle.

Sulla base degli studi precedenti sui lexical bundles per la lingua inglese, il presente lavoro adotta un approccio conservativo: si considera come punto limite la frequenza di 10 volte su un milione di parole.

Un'ulteriore restrizione è data dal fatto che una combinazione di parole deve essere usata in almeno cinque testi differenti per poter essere considerata un lexical

bundle, questo per evitare usi idiosincratici da parte di parlanti individuali o autori o

anche usi ripetitivi da parte di autori che possono mancare di buona maestria, almeno nell'uso delle sequenze di parole preferite dagli esperti (Jalali ed altri, 2008). Biber e altri (2004) hanno rilevato che questa restrizione ha poco effetto mentre anche i lexical

bundles meno comuni sono usati in almeno 20 testi differenti. La stessa restrizione è

Anche se la serie identificata di lexical bundles è basata solo su criteri distribuzionali (tasso di occorrenza e distribuzione nei testi), sembra che i bundles presentino diverse caratteristiche che li distinguono da altri tipi di espressioni formulaiche: sono estremamente comuni, non sono idiomatici e non rappresentano un'unità strutturale completa (Biber ed altri, 2004). Come già menzionato, la struttura è un'altra caratteristica principale dei bundles; solitamente non è una struttura grammaticale completa.

Come riportato da Biber ed altri (1999), solo il 15% dei lexical bundles nella conversazione può essere guardato come composto da frasi o clausole complete, mentre meno del 5% dei lexical bundles nella prosa accademica è composto da unità strutturali complete, ma piuttosto da frasi frammentate o clausole con nuovi frammenti incorporati.

I lexical bundles hanno forti correlazioni grammaticali, cosa che facilita il loro raggruppamento in tipi strutturali (Biber ed altri, 1999). Secondo Biber ed altri (1999), la maggior parte dei lexical bundles in inglese collega due unità strutturali: per esempio i bundles nella prosa accademica collegano due frasi (ad esempio, the nature of the, as a

result of), mentre i bundles nella conversazione collegano due clausole, ad esempio I don't know why.

Come riportato dai ricercatori, nelle conversazioni molti bundles contengono l'inizio di una clausola principale, seguita dall'inizio di una clausola complemento incorporata. Lo studio ha mostrato che la maggioranza dei lexical bundles nella prosa accademica è composta da unità strutturali incomplete, tendendo ad essere composta da blocchi nominali piuttosto che da blocchi clausali. Circa il 90% dei lexical bundles nella conversazione include parte di una frase verbale e circa il 60% di tutti i bundles nella prosa accademica sono parti di frasi nominali o di frasi preposizionali (Biber ed altri, 1999). Come vedremo in prosieguo, i risultati ottenuti dall'analisi dei lexical bundles confermano le ipotesi tradizionali sulla distinzione tra la lingua parlata e lingua scritta.

Sulla base di quanto premesso, proponiamo la seguente definizione di lexical

bundles: I lexical bundles sono combinazioni di parole ricorrenti in un registro. Le loro

caratteristiche salienti sono la fissità, la non idiomaticità, la trasparenza del significato, che è completamente deducibile dal significato dei singoli membri che compongono un

indicare le seguenti combinazioni di parole: allora vediamo un po', e che ne so, non ci

sono più, io gli ho detto, se non ricordo male, ecc.