• Non ci sono risultati.

4. UN CASO PARTICOLARE DI SEMPLIFICAZIONE: FOCUS

4.2. Esempi e reperibilità dal contesto degli elementi inseriti

4.2.2. Esempi di esplicitazione del soggetto

Per esplicitare il soggetto di un verbo in una frase, è necessario comprendere il contesto generale nella quale una certa azione si svolge e magari dovrà essere recuperato da una qualche frase precedente quella in analisi. Saranno mostrati dunque alcuni esempi tratti dai corpora per verificare in che modo sia avvenuto questo “recupero” del soggetto.

ESEMPIO 4 (Estratto da Teacher):

Originale: “E la sola immagine sua ch'io abbia mai conosciuta è stata un suo

ritratto su cartolina. Figurina, mediocre, e quasi larvale; ma adorazione fantastica di tutta la mia fanciullezza.”

115  Semplificata: “E la sua unica immagine è una sua fotografia su una cartolina:

non è molto bella, non ha molto colore, ma io l’ho amata durante la mia fanciullezza.”

In questo esempio le semplificazione che intervengono sono molteplici e l’esplicitazione di “io” viene fatta per sottolineare il protagonista dell’azione di “amare”. Il recupero di questo soggetto sottinteso è effettuato direttamente dall’analisi della persona del verbo inserito “ho amata” (prima persona singolare) e la tecnica per fare ciò è attuabile in maniera semplice anche da un computer, in quanto dal PoS tagging si è già in grado di risalire ai tratti morfo-sintattici dei token analizzati.

Figura 4.12: estratto da READ-IT, risultati dell’annotazione dei tratti morfo-sintattici ESEMPIO 5 (Estratto da Terence):

Originale: Raggiunta la cima della quercia, accese il Ventoscopio, che

cominciò a misurare la forza del vento.

Semplificata: Quando fu in cima all’albero, accese il Ventoscopio. Le eliche

cominciarono a girare velocemente e il Ventoscopio misurò la forza del vento.

La frase originale dell’esempio 5 è stata innanzitutto divisa in due parti tramite un’operazione di Split, eliminando la subordinazione della seconda parte della frase. Ciò ha richiesto che il pronome relativo “che” venisse eliminato e sostituito con un punto e che il suo antecedente venisse esplicitato nuovamente nella seconda frase. In questo caso ciò è individuabile, almeno dall’uomo, in maniera semplice. La versione informatica di questa operazione di individuazione del soggetto sottinteso richiede invece un sistema stocastico che sia in grado di determinare il candidato che più probabilmente sarà l’antecedente che si sta cercando. L’operazione di questo poteva anche essere annotata come risoluzione di anafora.

ESEMPIO 6 (Tratto da Teacher):

Originale: Così ha un’aria più allegra.

116 Il soggetto del verbo “ha” è recuperabile dalla frase precedente (dove appare sia con il sinonimo “la cameretta” che come “la stanza”). Se un sistema prendesse in input questa singola frase però non sarebbe in grado di definire il soggetto sottinteso; non potrebbe neanche essere certo se a compiere l’azione sia una persona o un oggetto inanimato (la persona del verbo è la terza singolare ed inoltre il verbo “avere” in quel contesto non esprime con chiarezza il soggetto implicito). Risulta chiaro che in questo caso il sistema non dovrebbe ricorrere all’esplicitazione del soggetto, ma dovrebbe farlo solo quando ci sarà un certo grado di certezza su chi sia il soggetto dell’azione.

4.2.2.1. Quando esplicitare il soggetto?

L’operazione di esplicitazione del soggetto, come quella di inserimento di un verbo, va considerata come diretta conseguenza di altre operazioni di semplificazione. Il procedimento per effettuare ciò potrebbe essere ricavato analizzando con attenzione gli alberi sintattici “intermedi” di una semplificazione, ovvero che rappresentano frasi ancora in via di semplificazione in cui si analizza se può essere fatto dell’altro per eseguire al meglio il compito. Una possibile sequenza potrebbe essere la seguente:

1. C’è un verbo per cui non c’è soggetto nell’albero sintattico? Se sì, si prosegua al punto 2, altrimenti STOP;

2. Il verbo è alla prima o seconda persona singolare o plurale? Si può notare come sia più difficile risalire al soggetto implicito in terza persona, in quanto è uno di quei casi in cui l’azione può essere eseguita da un più ampio range di candidati (“io” non può essere sostituito da nient’altro, mentre “egli” può riferirsi a più entità in una scena). Si dovrebbe proseguire col punto 3 solo se il verbo è in terza persona, in quanto sembra più utile, ai fini della semplificazione, espandere l’informazione del soggetto di un verbo deittico rispetto a un non deittico (es:: “Ho fatto i compiti” e “Ha fatto i compiti” hanno come soggetto rispettivamente il narratore di un eventuale racconto o la persona che dice la frase e potenzialmente qualsiasi personaggio dello stesso racconto, una differenza notevole);

117 3. Il verbo è in terza persona? Applicare un algoritmo di risoluzione del soggetto implicito che implementi il calcolo di una “soglia di sicurezza” che se superata garantisca che il soggetto trovato potrebbe essere quello corretto (es:: il soggetto di “Ha fatto i compiti” è Paolo all’80%, quindi è accettabile e può essere inserito in giusta posizione).

I tre passaggi qui sopra indicati rappresentano unicamente un’idea di come potrebbe funzionare questo tipo di inserimento nel testo, ma non vuole essere preso come l’unico metodo possibile. In generale l’idea che è stata qui espressa indica come la mancanza di soggetto esplicito sia spesso riconducibile a verbi in terza persona e come l’individuazione di questo soggetto sia un compito rischioso che potrebbe fornire risultati errati. Un’idea per ovviare al problema è quella dell’approccio ibrido, con un parser che individua i verbi per cui non c’è un soggetto e che indica all’utente che sta utilizzando il sistema dove intervenire per l’inserimento del soggetto esplicito, fornendo suggerimenti in base ai calcoli effettuati, ma chiedendo sempre la conferma finale dell’essere umano.

4.2.3. Esempi di inserimento generico: il caso della categoria “Altro” e