descrizione dei fenomeni sintattic
4.1 La complessità sintattica
Il primo fenomeno analizzato è la complessità sintattica, ricavata come abbiamo detto (cfr. Schema 22), dalla ratio tra il numero totale degli SoA e il numero delle AS-Unit. Essa fornisce quindi un’idea della complessità ipotattica delle AS-Unit, che può andare da un minimo di 1,00, qualora per ogni AS-Unit sia realizzato un solo SoA, ad un massimo indefinito: maggiore è il valore ottenuto, maggiore è la complessità sintattica. Per ogni soggetto, quindi, viene calcolata la ratio che esprime la complessità sintattica della sua produzione e, dal confronto con le ratio degli altri 47 candidati dello stesso livello, viene calcolata la media delle ratio relative al livello di competenza e vengono isolati il valore massimo e il valore minimo ottenuto. Tali valori sono riportati nelle prime tre colonne della
Tabella 1. Un altro valore fondamentale è quello relativo alla deviazione standard, che come
abbiamo visto nel § 3.3.3, indica il valore di dispersione rispetto al valore medio; esso serve a determinare quanto la media descrive in modo veritiero il comportamento del campione: maggiore è il valore della deviazione standard, maggiore sarà la dispersione rispetto alla media, e minore sarà il potere descrittivo della media stessa.
Tabella 1 Valori descrittivi della complessità sintattica (in neretto i valori distribuiti normalmente: p
> 0,05).
Livello Media Minimo Massimo Deviazione standard
Normalità (p > 0,05) (Kolmogorov – Smirnov) Shapiro - Wilk B1 3,60 1,00 9,00 1,81 0,005 0,003 C2 5,35 2,84 12,08 2,01 0,079 0,000
Nel nostro caso, ad esempio, la deviazione standard della complessità sintattica del livello B1 è di 1,81, mentre del livello C2 è di 2,01: ciò significa che la media relativa al livello B1 è più affidabile rispetto alla media del livello C2.
L’ultimo valore riportato in Tabella 1 è la distribuzione normale o normalità, che si rifà ad un modello teorico per cui la maggior parte dei valori ottenuti per ogni soggetto si colloca in prossimità della media, mentre una minoranza si discosta da essa78. In poche parole, la normalità consiste proprio in una distribuzione che si concentra maggiormente intorno alla media. Nella tabella sono riportati due test per il calcolo della distribuzione: il test «Kolmogorov-Smirnov» e il test «Shapiro-Wilk», mirati a verificare ogni deviazione dalla normalità.
Premettiamo che ogni test statistico dà come risultato un valore conosciuto come «valore di significatività» (p) (anche «valore alpha»), che, per convenzione, negli studi in SLA è fissato a p = 0,05. Se un test statistico dà come p un valore inferiore a 0,05, significa che c’è il 95% di possibilità che il risultato del test sia lo stesso qualora venga ripetuto con lo stesso
78
Secondo tale modello teorico (formulato dal matematico C. F. Gauss), se i dati venissero rappresentati con un diagramma cartesiano, si delineerebbe una funzione a forma di campana, il cui centro corrisponderebbe alla media.
campione. È, in altre parole, un indice di affidabilità del risultato.
Nel nostro caso, applicando i test «Kolmogorov-Smirnov» e «Shapiro-Wilk», che mirano a determinare ogni deviazione dalla distribuzione normale, ci dovremmo aspettare che p sia maggiore a 0,05 per poter affermare che, appunto, ogni devianza non è significativa. Tuttavia, osservando da vicino i nostri dati, solo in un caso i dati sono distribuiti normalmente, ovvero a livello C2 (test «Kolmogorov-Smirnov») con p = 0,079. Quindi i valori della complessità sintattica risultano non distribuiti normalmente, se consideriamo i restanti valori.
La distribuzione normale e la tipologia dei dati costituiscono due criteri che aiutano il ricercatore a stabilire quale tipologia di test applicare ai suoi dati: in caso di distribuzione normale e di dati ad intervalli (come ad esempio i punteggi di un test) si preferisce utilizzare
test statistici parametrici; nel caso in cui, invece, la distribuzione normale viene meno e i dati
sono frequenze - come nel nostro caso - si preferisce applicare test non-parametrici. Come vedremo, nel valutare l’influenza della competenza linguistica e della L1 su ogni fenomeno analizzato ci avvaliamo di test non-parametrici (il Mann - Whitney U e il Kruskal - Wallis).
Ritornando alla Tabella 1, già da un primo confronto delle medie, è possibile notare un’evidente differenza tra i due livelli di competenza. Questo dato impressionistico trova conferma nei risultati del test Mann - Whitney U (cfr. Tabella 2).
Tabella 2 L'influenza della competenza linguistica sulla complessità sintattica: il test Mann - Whitney
U (in neretto i casi significativi: p < 0,05).
Livelli Mann - Whitney U Significatività (p < 0,05) Grado di incidenza
B1 vs C2 U = 518,00 p = 0,000 η2 = 0,23
Nella Tabella 2 è riportato il risultato del test (U = 518,00) e la significatività (p = 0,000); come accennato sopra, un dato importante in ogni test statistico è propro il valore p, che indica la percentuale di affidabilità del test. Esso è stabilito a 0,05 per gli studi in SLA: pertanto si richiede che vi sia un’affidabilità del 95% e un possibilità di errore del 5%. Il test
Mann Whitney U condotto sulle ratio della complessità sintattica è assolutamente significativo
complessità sintattica tra i due livelli può essere ascritta al caso, ovvero 0%. È inoltre possibile calcolare anche il grado di incidenza (effect size) del livello di competenza linguistica sulla complessità sintattica (η2). In sostanza, i risultati di questo test fanno pensare che vi è una notevole differenza nella complessità sintattica tra i due livelli e che la competenza linguistica incide su tale differenza per un 23% (cfr. Tabella 2).
Infine, è interessante analizzare se i dati relativi alla complessità sintattica risentono della L1 dei soggetti. Per fare ciò è necessario applicare il test statistico Kruskal - Wallis. Tale
test sarà ripetuto tre volte:
1. operando un confronto a 12 lingue (ogni lingua / tutte le altre);
2. confrontando le famiglie linguistiche (ogni famiglia / tutte le altre famiglie); 3. confrontando i tipi linguistici (ogni tipo linguistico / tutti gli altri tipi);
Nella Tabella 3 sono riportati i risultati relativi ai due livelli di competenza.
Tabella 3 L'influenza della L1 sulla complessità sintattica: il test Kruskal - Wallis (in neretto i casi significativi: p < 0,05).
Livelli χ2 Significatività (p < 0,05)
Ogni lingua isolatamente
B1 14,934 0,186
C2 15,791 0,149
Per famiglia linguistica
B1 13,372 0,037
C2 7,787 0,254
Per tipologia linguistica
B1 9,120 0,010
C2 3,311 0,191
Il test Kruskal - Wallis dà due risultati: il χ2 e il valore alpha. Da uno sguardo complessivo risulta che la L1 non è influente sulla variazione della complessità sintattica (ovvero tutti i valori p > 0,05), con due eccezioni: per il livello B1 la famiglia linguistica e il tipo linguistico della L1 sembrano essere responsabili della variazione interna al livello di
competenza della complessità sintattica.
Tale discrepanza dei risultati ci obbliga ad applicare ulteriori test (chiamati test post hoc) per verificare più nel dettaglio i risultati ottenuti. Il Kruskal - Wallis test, infatti, confronta globalmente le ratio, ovvero nel nostro caso paragona globalmente tutte le L1 in questione, tutte le famiglie linguistiche e tutti i tipi linguistici, ma non dà un risultato specifico dei singoli confronti (L1 a L1, famiglia a famiglia e tipo a tipo). I test post hoc, invece, permettono un’analisi più dettagliata, poiché confrontano: a) le L1 a coppie (ad es. i soggetti francesi con i soggetti cinesi, o i germanofoni con gli arabofoni, e così via) per un totale di 66 confronti; b) le famiglie linguistiche (ad es. la famiglia romanza con la famiglia germanica, o la famiglia semitica con la famiglia sinotibetana, e così via) per un totale di 21 confronti; c) i tipi linguistici (il tipo flessivo con il tipo agglutinante, il tipo isolante con il tipo flessivo, e il tipo isolante con il tipo agglutinante) per un totale di tre confronti. I risultati, che non riportiamo per motivi di spazio, dimostrano che non vi è nessuna variazione significativa della complessita sintattica79.
In conclusione, dal confronto dei dati emerge che la complessità sintattica (SoA/AS-
Unit) dei soggetti analizzati varia in modo significativo tra i due livelli. Tuttavia, la variazione
della complessità sintattica all’interno di ogni livello non dipende né dalla L1, né dalla
79
I test post hoc legati al test Kruskal - Wallis sono numerosi. In questa sede abbiamo adottato quello suggerito da Field (2009). Esso consiste nel calcolare
1. le medie dei rank dei due gruppi a confronto; 2. la differenza tra le due medie;
3. calcolare il valore al di sopra del quale tale differenza è significativa. Questo valore è il risultato di una formula complessa che varia a seconda delle dimensioni del campione totale e dei due gruppi confrontati.
Una volta ottenute tali cifre non rimane che confrontarle e verificare se la differenza delle medie dei rank dei due gruppi (punto 2) superi o meno il valore di riferimento (punto 3). Ad esempio se la media dei rank della complessità sintattica della famiglia sino-tibetana (cinese) è 5,38 e quella della famiglia albanese è 37,25 (punto 1), la differenza delle medie dei rank è 31,87 (punto 2). Il valore di riferimento (punto 3), che nel nostro caso è calcolato sulla base delle dimensioni totale del campione (96 soggetti) e dei due gruppi a confronto (4 soggetti), ammonta a 44,50. Poiché 31,87 non supera 44,50 il confronto non è significativo. Tale procedura è ripetuta per ogni singolo confronto.
famiglia linguistica né dal tipo linguistico.