• Non ci sono risultati.

3. IL PRIMO CORPUS PER LA SEMPLIFICAZIONE AUTOMATICA DI TEST

3.4. Impatto delle regole sulle caratteristiche linguistiche

3.4.3. Analisi dettagliata su regole e relativo impatto

In questa sezione si tenterà di dare un significato alle correlazioni calcolate, per rispondere alla seguente questione: in che modo e perché l’applicazione di una certa operazione di semplificazione influisce su un testo.

98 Bisogna considerare che nell’insieme di frasi di cui sono state calcolate le correlazioni, vi sono più operazioni che entrano in gioco (ad esempio nelle frasi con almeno un inserimento, potrebbero esserci anche una o più cancellazioni). Il set di frasi è comunque piuttosto ampio da poter dare dei risultati affidabili e da permettere di affermare che le correlazioni nella tabella siano in qualche modo inerenti alle operazioni che si stanno considerando in quel momento (certamente vi saranno anche frasi “outlier”, ovvero che, in questo caso, influiscono in maniera differente dalla maggiora parte delle altre sul calcolo finale). Va inoltre considerato che per determinate operazioni potrebbe non avere senso andare a vedere l’impatto su alcune caratteristiche linguistiche e dunque in seguito saranno effettuati confronti seguendo una certa logica (es: l’inserimento di un verbo non dovrebbe influenzare il numero di aggettivi in un testo, dunque anche se il valore di correlazione fosse elevato, a questo non dovrebbe essere dato troppo peso o una motivazione forzata). Quello che verrà dunque fatto ora è confermare che a determinate operazioni che agiscono in certi modi sul testo corrispondono modifiche attese.

3.4.3.1. Caratteristiche inerenti il testo “grezzo”

La lunghezza media delle frasi e delle parole e la correlazione almeno moderata tra quelle delle frasi originali e quelle semplificate è facilmente spiegabile, in quanto le operazioni considerate per la semplificazione vanno a influire direttamente in maniera visibile su parole e frasi. Ad esempio un’operazione di inserimento di una parola, è evidente, allungherà una frase mentre una cancellazione in generale la accorcerà. Un esempio chiaro di correlazione forte che ci si poteva attendere è quella dello split sulle frasi e la loro lunghezza in parole (0,799): la divisione di una frase in più frasi brevi tende a formare strutture di circa la stessa breve lunghezza quando viene applicata. Si può notare come le correlazioni calcolate siano tutte significative.

3.4.3.2. Caratteristiche lessicali

In questo caso è molto interessante valutare la differenza tra i due corpora, in quanto, mentre nel caso di Terence le operazioni che intervengono a livello lessicale vengono effettuate in maniera strutturata da linee guida (la principale operazione in questo senso è la sostituzione lessicale), nel caso di Teacher la scelta di quali parole sostituire

99 e con cosa rimpiazzarle ricade totalmente nelle mani di insegnanti che si basano sulla loro esperienza e che magari utilizzeranno parole che comunque non sono presenti nel VdB. Si nota che, nel caso di inserimento di un verbo, le correlazioni del secondo corpus sono deboli (tranne che nel caso dell’Alto Uso) e questo deriva quasi certamente dal metodo diverso di semplificazione, in quanto la scelta dei verbi da inserire dipende completamente dalla conoscenza degli insegnanti. In generale per tutte le operazioni notiamo valori di correlazioni forti in molti casi per Terence e poche volte per Teacher.

3.4.3.3. Caratteristiche morfo-sintattiche

Nel caso di Terence le operazioni sembrano influenzare in maniera evidente le caratteristiche morfo-sintattiche considerate, in quanto le correlazioni sono tutte almeno di livello moderato con pochi casi che scendono sotto lo 0,5 e sono quasi tutte fortemente significative, mentre le restanti sono comunque significative. Differente è il discorso nel caso di Teacher; scendendo nel dettaglio si può notare come anche in questo siano caso i verbi a presentare situazioni particolari: le correlazioni superano raramente il grado di moderate e in alcuni casi non sono significative, ad indicare che in Teacher non si trova un utilizzo uniforme e regolato nell’utilizzo di alcuni modi verbali: ad esempio solo per il gerundio c’è una correlazione fortemente significativa quando si va ad inserire un verbo nel testo. Nel caso delle sostituzioni lessicali (di entrambi i tipi) vi sono sempre correlazioni significative, con due soli casi diversi da ciò (per i verbi al passato e al gerundio). Per quanto riguarda le operazioni di inserimento si conferma una certa influenza a livello di caratteristiche morfo- sintattiche, ma si può sottolineare una differenza tra i due corpora notando come la correlazione del numero dei pronomi sia debole e non significativa per Teacher. Questo può significare che le operazioni di inserimento in Teacher spesso non sono mirate ai pronomi e che dunque la correlazione risenta della scelta degli insegnanti; effettivamente quando si pensa alla leggibilità di un testo associata alla presenza di pronomi, si indica che per facilitare la lettura è meglio risolvere le anafore e sostituire i pronomi con gli antecedenti e da questo dovrebbe seguire che non saranno le operazioni di inserimento a influenzare la presenza di pronomi, ma al limite quelle di

100 cancellazione (correlazione che infatti risulta significativa e vicina all’essere moderata) o soprattutto di risoluzione di anafora.

3.4.3.4. Caratteristiche Sintattiche

Con un primo sguardo alla zona della tabella inerente questo tipo di caratteristiche del testo (da [23] in giù), si nota che il corpus Teacher presenta una grande quantità di correlazioni non significative deboli, mentre in precedenza, ma sempre con un minimo di casi del genere, questi valori risultavano almeno significativi e spesso rappresentavano una correlazione moderata. Questo può indicare che l’approccio degli insegnanti è più orientato all’utilizzo di un vocabolario per una semplificazione lessicale più che sintattica e mirata ad accorciare le frasi (ma non solo tramite split, che effettivamente è stato applicato poche volte in tutto il testo), rendendole più comprensibili per il target finale. In effetti, nell’insieme di queste caratteristiche, si trova una buona quantità di correlazioni moderate solo nel caso delle variabili del “sottogruppo” [26-28] contenente le Catene di subordinazione, la Lunghezza dei link di dipendenza e la Media delle altezze massime, valori che dipendono fortemente dalla lunghezza di una frase.

Per quanto riguarda l’operazione di spostamento (o riordinamento), si hanno delle correlazioni significative nei valori inerenti la posizione pre o post verbale di soggetto e oggetto ([32-35]), con casi di valori più alti su Teacher che su Terence (evento raro in tutta la tabella) nel caso dei Soggetti post-verbali e Oggetti pre-verbali. Questo può indicare una maggiore attenzione degli insegnanti all’ordine marcato delle frasi da semplificare.

Si nota infine come la colonna delle sostituzioni lessicali a livello di parola riporti tutti valori di correlazioni fortemente significative e moderate o forti (29 su 32 casi) e i restanti casi sono comunque significative ma deboli. Per quanto riguarda la sostituzione a livello di espressione i risultati sono più o meno gli stessi: 24 su 32 casi sono correlazioni fortemente significative e almeno moderate, 6 su 32 sono significative e deboli, 2 su 32 sono deboli e non significative. Le sostituzioni non sembrano influire in maniera evidente sulla quantità di proposizioni principali di un testo né per quanto riguarda le proposizioni subordinate pre-verbali. Come possono

101 le sostituzione lessicali influenzare la sintassi? La risposta va trovata nel fatto che quando si va ad esempio a sostituire un’intera espressione con una sola parola si vanno a eliminare molte delle dipendenze che modificavano valori come lunghezza dei link di dipendenza, lunghezza delle catene di subordinazione, ecc. Quando vengono sostituite singole parole bisogna invece considerare che spesso come effetto si ottengono ulteriori semplificazioni che vanno a cambiare la struttura sintattica delle frasi in risposta alla nuova parola inserita. Va ricordato infine che le sostituzioni lessicali sono tra le operazioni più frequenti e quindi ogni frase esaminata contiene generalmente ben più di un’unica tipologia di operazione di semplificazione.

3.4.3.5. Conclusioni delle analisi sull’impatto delle regole di

semplificazione sul testo

Da un’analisi dettagliata dei risultati mostrati nelle sezioni precedenti, si nota come le operazioni di semplificazione abbiano un impatto evidente sulle caratteristiche linguistiche di un testo. Nella maggioranza dei casi considerati si è notato come ad una certa operazione corrisponda una correlazione forte o moderata ma comunque significativa, ad indicare che i piani di semplificazione manuale attuati, più per Terence che per Teacher, hanno un riscontro sui testi che porta sempre delle modifiche efficaci. Le correlazioni trovate per Teacher sottolineano come l’approccio degli insegnanti non segua un schema definito come quello di Terence, ma questo, come si è visto, non influisce sul miglioramento degli indici dei leggibilità dei testi, che raggiungono comunque degli ottimi risultati. L’approccio utilizzato nella semplificazione in Terence ha invece condotto ad un modo sistematico di intervenire sul testo, “forzato” dai suggerimenti di semplificazione seguiti da tutte le persone che hanno preso parte all’operazione. Ciò è riscontrato nel testo quando si vede come, alla presenza della maggior parte delle operazioni, corrisponde una correlazione elevata e significativa ad indicare che le operazioni tendono ad essere fatte sempre allo stesso modo e a fornire cambiamenti “proporzionali” tra le caratteristiche linguistiche.

102

4. UN CASO PARTICOLARE DI SEMPLIFICAZIONE: FOCUS