• Non ci sono risultati.

4. UN CASO PARTICOLARE DI SEMPLIFICAZIONE: FOCUS

4.2. Esempi e reperibilità dal contesto degli elementi inseriti

4.2.3. Esempi di inserimento generico: il caso della categoria “Altro” e

La maggior parte degli inserimenti effettuati nei due corpora per l’italiano sono stati classificati come “Altro” e nella sezione 4.1.3. sono stati suddivisi ulteriormente in base a cosa è stato inserito nel testo. Una delle sottocategorie da approfondire è certamente quella che continua a prendere il nome di “Altro”, in quanto gli inserimenti effettuati in questo caso sono troppo differenti tra loro e ognuno potrebbe fare parte di una categoria a sé stante.

ESEMPIO 7 (Estratto da Teacher):

Originale: È interrotto da oasi dove l’acqua affiora in superficie: qui l’uomo

può coltivare il terreno e vivere stabilmente.

Semplificata: Nel deserto ci sono le oasi, cioè dei luoghi dove c’è l'acqua: qui crescono le piante e l’uomo può coltivare la terra.

118 Già da questo primo esempio si può scorgere in che modo l’inserimento effettuato comprenda diverse categorie, ovvero: verbo, articolo, sostantivo e congiunzione (motivo per il quale si è deciso di includerlo in “Altro”). Ciò che va però sottolineato è che l’inserimento deriva direttamente da quanto descritto nella frase originale, ma questo collegamento viene fatto rapidamente solo da un umano (coltivare  crescita piante). Inoltre si assiste alla cancellazione di “vivono stabilmente”, considerata come informazione non essenziale. Questo esempio non può essere preso in considerazione da un sistema di ATS per la creazione di un modello di inserimento automatico. Si può studiare però l’effetto della semplificazione sul testo.

Estraendo i dati sulla proiezione della leggibilità sul testo da READ-IT per le due frasi, si ottengono i risultati mostrati in tabella:

Esempio 7 Base Lessicale Sintattica Globale

Originale 37.1% 48.3% 35.5% 41.0%

Semplificata 43.2% (+6.1%) 37.4% (-10.9%) 36.9% (+1.4%) 16.8% (-24.2%)

Tabella 4.2: dati sulla proiezione della leggibilità sul testo originale e semplificato. Tra parentesi è visualizzato il miglioramento (evidenziato in verde) o il peggioramento (in rosso) degli indici.

Il miglioramento è netto sia a livello lessicale che globale (in questo caso si arriva quasi al 25% di miglioramento). Cosa avviene però se viene analizzata la frase semplificata senza quell’inserimento, ma lasciando la parte dopo i “:” invariata?

Esempio 7 (bis) Base Lessicale Sintattica Globale

Originale 37.1% 48.3% 35.5% 41.0%

Semplificata 41.0% (+4.1%) 46.4% (-1.9%) 35.5% (+0%) 44.2% (+3.2%)

Tabella 4.3: dati sulla proiezione della leggibilità sul testo originale e semplificato alternativo. Tra parentesi è visualizzato il miglioramento (evidenziato in verde) o il peggioramento (in rosso) degli indici.

I miglioramenti ottenuti nell’esempio originale risultano totalmente superiori rispetto a quelli ottenuti nella frase semplificata senza l’inserimento considerato. La conclusione sembra chiara, in quanto dal punto di vista Globale, il miglioramento ottenuto è troppo elevato per non essere tenuto in considerazione, dunque questo inserimento è riuscito nel compito di semplificare il testo (sembra anzi che questa la complessità di questa frase dipenda principalmente da ciò). Il problema principale però resta irrisolto: il sistema dovrà comprendere automaticamente quando inserire determinate parole nel testo e in questo caso la scelta è stata arbitraria

119 dell’insegnante che ha eseguito il compito. Modellare l’arbitrarietà di un sistema di ATS significherebbe insegnare allo stesso che ad ogni azione (es: coltivare) può corrispondere una reazione (es: crescita delle piante) e che questo se possibile e sensato può essere esplicitato nel testo. Dunque nell’esempio 7 si può dire che l’informazione inserita sia direttamente recuperabile dalla frase stessa, ma tramite dei passaggi di complessità evidente.

ESEMPIO 8 (Estratto da Teacher):

 Qui venivano i veneziani che, pagando elevati dazi ai sultani egiziani, acquistavano il pepe e le altre spezie che rivendevano in tutta l'Europa.  Qui venivano i mercanti veneziani per acquistare le spezie. Per poter

trasportare e vendere in Europa queste merci i veneziani pagavano ai sultani

egiziani e siriani tasse molto alte. Per questo i mercanti veneziani vendevano poi le spezie in Europa a prezzi molto alti.

Questo esempio è riportato anche per mostrare la forte diversità che in alcuni casi si evidenzia tra testi originali e semplificati. Si è in presenza di una vera e proprio riscrittura di tutta la frase originale in tre frasi che dividono in punti i passaggi consequenziali che nelle frase iniziale erano espressi in poche parole. La comprensione di ciò che viene descritto è probabilmente più semplice per un poor reader, però è molto difficile che in fase di apprendimento automatico dalle risorse si riesca ad estrapolare informazione da questo esempio. Si potrebbe affermare di essere quindi in presenza di una “semplificazione complessa”, ricca di inserimenti di reperibilità non banale, che sarebbe potuta risultare più digeribile da un sistema se fatta in altri modi (nota: “e siriani” non è considerato nella categoria “Altro”, bensì in “Aggettivo + altro”). Si può proporre dunque, in un caso simile, una soluzione alternativa e verificare se è possibile migliorare i risultati ottenuti sulla proiezione della leggibilità:

Semplificata (versione 2): Qui venivano i mercanti veneziani che pagavano

tasse alte ai sultani egiziani per le spezie. I mercanti rivendevano poi le spezie in Europa.

120

ESEMPIO 8 Base Lessicale Sintattica Globale

Originale 45.6% 53.0% 45.9% 84.0%

Semplificata (Teacher) 46,0% (+0.4) 51,9% (-1.1%) 47,1% (+1.2%) 41,1% (-42.9%) Semplificata (Versione 2) 34,9% (-10.7) 61,4% (+8.4%) 36,0% (-9.9%) 36,3% (-47.3%)

Tabella 4.4: dati sulla proiezione della leggibilità sul testo originale, semplificato e semplificato alternativo. Tra parentesi è visualizzato il miglioramento (evidenziato in verde) o il peggioramento (in rosso) degli indici.

I risultati così ottenuti sono migliori (tranne che per la difficoltà lessicale media) e le semplificazioni effettuate sono inferiori e probabilmente più facilmente comprensibili e modellabili da un sistema, in quanto derivano in maniera più aderente dal testo originale. Ciò fa pensare che, se la necessità forse quella di creare un sistema che apprenda le regole in maniera automatica, le risorse andrebbero espanse, ad esempio fornendo due o più metodi di semplificazione per la stessa frase, con operazioni diverse. Ad esempio, creare una risorsa di testi allineati originali e semplificati la cui semplificazione è avvenuta per mano di più di 3 persone (ognuna delle quali ha lavorato su tutte le frasi indipendentemente dalle altre) potrebbe essere un buon metodo per comprendere se tendenzialmente in certe situazioni si sia portati a applicare le stesse operazioni e quali sono invece gli altri casi in cui ogni persona ha avuto una visione differente per la frase semplificata. Una risorsa costruita in questo modo, in seguito ad una revisione da parte di un’ulteriore persona, potrebbe permettere di scartare le semplificazioni che non danno risultati soddisfacenti o quelle troppo “complesse” per essere apprese da un sistema (se l’intento è quello di creare un sistema totalmente automatico).

ESEMPIO 9 (Estratto da Terence):

Originale: Tutti tranne un cane da caccia, un malconcio gattino tigrato, i

gemelli e la Mamma.

Semplificata: Gli unici tra persone e animali rimasti ancora, erano un vecchio

cane, un gattino tigrato malandato, i gemelli e la Mamma.

La frase originale è il proseguimento naturale della sua frase precedente, che sarebbe “Il corpo dei vigili del fuoco scelse un bulldog, e uno per uno tutti gli animali e le persone se ne andarono.”. Si è dunque in presenza di un verbo sottinteso e la frase originale potrebbe essere letta come “Se ne andarono tutti tranne…”. La semplificazione attuata ha previsto l’eliminazione dell’espressione “Tutti tranne” (e

121 di “da caccia” sostituito con “vecchio”, scelta piuttosto arbitraria che non è ricavabile dal contesto) e l’inserimento di una serie di 8 parole (sottolineata nel testo della semplificata dell’esempio 9). La scelta di specificare che i partecipanti fossero “persone e animali” è ricaduta direttamente sullo specialista che ha effettuato le modifiche.

ESEMPIO 9 Base Lessicale Sintattica Globale

Originale 69.7% 60.7% 70.6% 94.5%

Semplificata (Terence) 39.7% (-30.0%) 49.0% (-11.7%) 39,4% (-31.2%) 50,0% (-44.5%)

Tabella 4.5: dati sulla proiezione della leggibilità sul testo originale e semplificato. Tra parentesi è visualizzato il miglioramento (evidenziato in verde) o il peggioramento (in rosso) degli indici.

La semplificazione attuata in questo caso è evidente a livello di proiezione della leggibilità sul testo, ma la raccolta di informazioni effettuata per la creazione dell’inserimento evidenziato consiste, oltre che nell’esplicitazione di un verbo sottinteso, nella capacità di distinguere tra persone e animali i partecipanti all’azione. In questo caso risulta difficile se si considera che “mamma” e “gemelli” possono senza ombra di dubbio indicare anche degli animali (es: la mamma gatta).