• Non ci sono risultati.

Il corpus di filosofia

III. 3.1.1.2 I risultati emersi dall'analisi strutturale

III.3.1.2 Il corpus di filosofia

Come si evince dalla tabella 15, il corpus di filosofia si compone di 780.989

tokens o parole e di 41.727 types o parole distinte. L’analisi si basa su tre riviste

scientifiche liberamente consultabili online, ovvero Noema, Philosophical News e Segni

e comprensione. Anche in questa parte della ricerca si è preferito optare per le annate

più recenti, per poter offrire un panorama attuale del linguaggio prefabbricato. Sono state pertanto scelte riviste dall’anno 2007 all’anno 2012. Lo spoglio include 100 articoli scientifici e 100 autori differenti – per minimizzare gli effetti idiosincratici relativi ai singoli scrittori.

Tabella 15: Dati statistici del corpus di filosofia

Dati statistici del corpus di filosofia

Tokens 780.989

Types 41.727

Numero articoli scientifici 100

Lexical bundles diversi – occorrenza minima 7 volte 328

Frequenza dei bundles 4.089

% delle parole in bundles 2,1%

Si noterà che il corpus di filosofia consiste di 328 lexical bundles di quattro parole con un'occorrenza minima di 7 su 780.989 tokens, ovvero 10 volte su un milione di parole. Per il calcolo della frequenza di occorrenza, come già indicato in precedenza, si è seguita la regola della normalizzazione. Oltre a questo criterio, lo spoglio include solo i lexical bundles presenti in almeno quattro articoli scientifici diversi. Osservando le prime 100 posizioni (vedi Appendice 3) troviamo espressioni che in media appaiono in 13 articoli scientifici differenti. Questo fatto è riscontrabile anche nella lingua inglese e presenta una caratteristica attesa dei lexical bundles.

I lexical bundles di quattro parole sono il nucleo primario della presente analisi. Lo spoglio dei clusters del corpus di filosofia ha confermato le osservazioni emerse

Come riportato nell'appendice 7, i bundles di 4 parole incorporano nella struttura i

clusters di tre parole e presentano delle estensioni delle sequenze di cinque parole.

Riportiamo qui a titolo di esempio il lexical bundle di quattro segmenti in sequenza dal

punto di vista, con una frequenza di occorrenza 206 su 780.989 parole o 26 volte su un

milione di parole, e in 28 articoli scientifici diversi. I bundles punto di vista e dal punto

di, con un’occorrenza 309 e 107 rispettivamente, sono incorporati nella struttura dei clusters di quattro parole; da contro, la sequenza estesa rappresenta un bundle di cinque

parole – da un punto di vista.

Inoltre, è interessante notare che nella prima posizione del corpus di storia e filosofia troviamo lo stesso lexical bundle. Oltre a ciò, è importante notare che nelle prime dieci posizioni i bundles compaiono in media 62 su 780.989 di parole, ossia 79 volte su un milione di parole. In media, le espressioni di quattro parole nelle prime dieci posizioni sono presenti in 20 articoli scientifici differenti.

È interessante inoltre notare che nelle prime dieci posizioni di entrambi i corpora – il corpus di storia e di filosofia – troviamo quattro lexical bundles identici: dal punto

di vista, nel momento in cui, una vera e propria e si tratta di un. La differenza riguarda

il numero di occorrenze nel corpus.

Va oltre a ciò menzionato che tra i 63 lexical bundles verbali, 2 si trovano tra i top 10: al sesto posto troviamo frammento di una forma impersonale – a che fare con, con una frequenza di 51 volte su 789.989 parole o 65 volte su un milione di parole e in 23 articoli scientifici differenti; all’ottavo posto si colloca la forma impersonale si tratta di

un, con una frequenza di 46 volte su 789.989 tokens o 58 volte su un milione di parole.

Possiamo constatare che i due bundles presentano nella struttura la forma impersonale, uno dei tratti maggiormente riscontrati nel linguaggio scientifico.

La tabella sotto riportata illustra la pervasività delle sequenze di più parole nell'ambito scientifico di filosofia.

Tabella 16: Il numero di lexical bundles differenti e la loro frequenza d'occorrenza nel corpus di filosofia

Lexical bundles Bundles diversi Occorrenze

2 parole 12.606 279.432

4 parole 328 4.089

5 parole 26 310

Come vedremo nello svolgimento della presente ricerca, l'alta frequenza dei

lexical bundles è un dato atteso, un fenomeno già verificatosi nella lingua inglese. I lexical bundles di tre e quattro parole figurano in una percentuale del 19,2% e del 2,1%

di tutte le parole sottoposte allo spoglio. Sommando le sequenze di tre e quattro parole il

corpus consiste di circa 4000 bundles. I clusters di tre parole hanno un'occorrenza di

64.000 volte su un milione di parole, quelli di quattro parole 5.200 volte su un milione di parole. I dati concordano sia con i risultati sulla lingua inglese (Conrad e Biber, 2004; Hyland, 2008a, 2008b), sia con i dati emersi dallo spoglio del corpus di storia.

Va inoltre menzionato che il bundle di quattro segmenti in sequenza più frequente nel corpus di filosofia – dal punto di vista – si presenta con una frequenza di 263 su un milione di parole; la sequenza più frequente di tre parole è di 395 volte su un milione di parole.

Grafico 5: Percentuale delle parole prefabbricate

Come già discusso in precedenza, il confronto relativo alle fasce di copertura dei

lexical bundles mette in luce la loro pervasività.

Le espressioni di 3 segmenti in successione coprono una percentuale del 19,2% fra tutti i tokens analizzati, con le sequenze che compaiono più di 60.000 volte su un milione di parole, mentre le sequenze di 4 parole ricorrono più di 5.000 volte su un milione di parole, coprendo una fascia del 2,1% di tutti i tokens.

0,00% 10,00% 20,00% 30,00% 40,00% 50,00% 60,00% 70,00% 80,00% % di tokens

I dati circa la pervasività dei lexical bundles e la loro frequenza d'occorrenza sono dati attesi e, inoltre, già riscontrati nella lingua inglese.

Nella sezione seguente analizzeremo la struttura dei lexical bundles identificati nel corpus di filosofia.