• Non ci sono risultati.

3.1.2.2 I risultati emersi dall’analisi strutturale

La lettura empirica dei dati manifestatisi nel corpus di filosofia ci permette di trarre qualche osservazione. L’analisi ha mostrato che la maggioranza dei bundles appartiene a due categorie principali – i bundles preposizionali e nominali. Queste due categorie coprono in totale il 79,6% di tutte le forme precostituite nel corpus. Come già riscontrato nell’ambito scientifico di storia, il terzo posto è riservato ai clusters verbali. Queste combinazioni di parole rappresentano il 19,2 % di tutti i lexical bundles identificati nel corpus. Questi dati risultano particolarmente importanti perché consentono di applicare al corpus di filosofia la suddivisione interna del corpus di storia, poiché le percentuali della partizione dei bundles preposizionali e nominali

risultano concordanti. Questi dati confermano le nostre ipotesi, concordando pienamente con i risultati ottenuti per le scienze sociali della lingua inglese. Come indicato da Cortes (2004), i lexical bundles identificati nel linguaggio scientifico delle scienze sociali possono essere classificati in due categorie principali – le sequenze preposizionali e quelle nominali.

I risultati del confronto relativo alle percentuali indicano che il ricorso ai diversi tipi di lexical bundles di entrambe le discipline scientifiche risulta quasi congruente. Su questo dato si può notare una minima divergenza nell’uso dei lexical bundles verbali, l’uso dei quali si dimostra un po’ più alto nell’ambito di filosofia. Infatti l’utilizzo dei

clusters verbali corrisponde al 9,8% in storia e al 19,2% in filosofia.

Tabella 17: Distribuzione strutturale dei lexical bundles di 4 parole in sequenza nel corpus di filosofia

Lexical bundles di 4 parole Bundles diversi Percentuale

Preposizionali 161 49,1 % Nominali 100 30,4 % Verbali 63 19,3% Congiunzionali 3 0,9 % Avverbiali 1 0,3% Totale 328 100 %

Come già più volte accennato, queste combinazioni ricorrenti di parole non fanno parte della grammatica tradizionale, poiché nella maggior parte dei casi non dispongono di una struttura completa. Dal computo sono state evidenziate 54 forme complete, costituendo una percentuale del 16,5%. La generalità dei lexical bundles riscontrati risulta avere una struttura frammentata – un dato concordante con le ricerche sui lexical

bundles nella prosa accademica della lingua inglese (Biber, 1999). Dobbiamo precisare

che la frammentarietà dei lexical bundles risulta in lingua inglese un po' più bassa, aggirandosi intorno al 5%.

Tabella 18: Distribuzione strutturale dei lexical bundles di 4 parole completi e frammentati nel corpus di filosofia

Lexical bundles di 4 parole Completi Frammentati Preposizionali 31 130 Nominali 23 77 Verbali 0 63 Congiunzionali 0 3 Avverbiali 0 1 Totale 54 274

Qui di seguito esamineremo il corpus di medicina del lavoro secondo la prospettiva della struttura dei lexical bundles; in un secondo luogo passeremo all’esame di tutti e tre gli ambiti scientifici secondo la struttura delle sequenze di quattro segmenti. I dati saranno infine comparati con i risultati ottenuti dall’analisi del corpus della lingua parlata (LIP).

III.3.1.3 I lexical bundles nel corpus di medicina del lavoro

Il corpus di medicina del lavoro comprende 1.047.442 tokens o parole e 38.365

types o parole diverse. La reperibilità del materiale online ha condizionato la scelta della

rivista scientifica di medicina del lavoro – Giornale di medicina del lavoro ed

ergonomia. Sono state scelte per la ricerca le annate più recenti, poiché si è voluto

presentare lo stato attuale delle sequenze precostituite. La ricerca include 496 articoli scientifici differenti, scritti da 2415 studiosi – un dato interessante che tocca il nucleo della disciplina, la quale incrementa la collaborazione tra pari.

Tabella 19: Dati statistici del corpus di medicina del lavoro

Dati statistici del corpus di medicina del lavoro

Tokens 1.047.442

Types 38.365

Numero articoli scientifici 496

Lexical bundles diversi – occorrenza minima 10 volte 890

Frequenza dei bundles 18.454

Come si vede dalla tabella 19, il corpus di medicina del lavoro presenta 890

lexical bundles diversi, con una frequenza di 18.454 volte su circa un milione di parole.

Lo spoglio incorpora solo le sequenze comparse in almeno cinque articoli scientifici diversi, con un’occorrenza di almeno 10 volte su un milione di parole. Esaminando la fascia fino a 100 sequenze di quattro parole si può notare che i lexical bundles figurano in media in 25 articoli scientifici diversi, manifestandosi da in un massimo di 43 a in un minimo di 7 testi diversi (vedi Appendice 4).

L'analisi dei clusters del corpus di medicina del lavoro ha riconfermato il fatto che i clusters di quattro parole sono delle estensioni dei clusters di tre parole, mentre le sequenze di cinque parole incorporano quelle di quattro parole. Riportiamo a titolo d'esempio la sequenza più frequente nel corpus di medicina – nei luoghi di lavoro, con l'occorrenza di 215 su 1.047.442 parole o 205 su un milione di parole. La sua versione più breve è luoghi di lavoro, la quale occorre 274 volte su un milione di parole, mentre la sua variante più lunga prevenzione nei luoghi di lavoro si presenta con una frequenza di 51 volte su un milione di parole.

Inoltre, è interessante notare che il corpus di medicina del lavoro presenta nel numero dei lexical bundles identificati una prima divergenza nelle tre microlingue analizzate. Dai dati emerge che il numero dei clusters nella scienza applicata è del 55% più alto che nell'ambito di storia e del 64% più alto che in filosofia. Di conseguenza, la più alta numerosità dei lexical bundles si riflette in una percentuale più alta di sequenze di quattro parole nel corpus analizzato. Su questo dato si nota una divergenza tra le discipline umanistiche da un lato e la scienza applicata dall'altro, sulla quale ci soffermeremo in seguito.

Ulteriori discrepanze quantitative riguardano la media in cui i bundles compaiono nella fascia fino a 10. Le prime dieci posizioni vedono confluire i tre tipi di bundles identificati – preposizionali, nominali e verbali – con una frequenza che varia da 215 a 94 su 1.047.442 parole, ovvero da 205 a 89 su un milione di parole. La loro occorrenza varia da 43 fino a 22 articoli scientifici, in media in 35 testi diversi. Si può notare che la frequenza di occorrenza dei primi dieci lexical bundles del corpus di medicina è assai più alta che l'occorrenza dei bundles nelle discipline umanistiche.

La pervasività dei lexical bundles nel corpus di medicina risulta abbastanza chiara se osserviamo la tabella 20.

Tabella 20: I lexical bundles differenti e la loro frequenza d'occorrenza

Lexical bundles Diversi Occorrenze

2 parole 12.177 431.246 3 parole 4.147 95.690 4 parole 890 18.454 5 parole 255 4.462

La tabella mette in luce un nucleo abbastanza ampio di lexical bundles di tre e quattro segmenti in sequenza – su 38.365 parole distinte riscontriamo quasi 5000

clusters diversi, nei termini della proporzione i lexical bundles di 3 parole in

successione coprono una percentuale del 27,4% di tutte le parole, mentre i bundles di 4 parole una percentuale pari al 2,2%. I bundles di tre parole si presentano con una frequenza di 95.690 volte su un milione di parole; la frequenza delle espressioni di quattro parole è di circa 18.454 volte su un milione di parole. Una prima osservazione che si impone addentrandoci nel corpus è la conferma delle ipotesi poste all’inizio di questa ricerca sulla pervasività dei lexical bundles nel linguaggio scritto, ovvero nelle microlingue scientifico-professionali. Simili dati sono emersi nelle ricerche sulla lingua inglese.