• Non ci sono risultati.

2.5 Problematiche e sfide della traduzione automatica del parlato

2.5.2 La cooperazione dell’utente come strumento per sopperire ai limiti de

Come già sottolineato nella sezione 1.4 in riferimento alla traduzione automatica, anche per la traduzione aut omatica del linguaggio parlato è attualmente impossibile creare un sistema che sia in grado di tradurre in modo del tutto automatico qualsiasi tipologia di discorso, appartenente a qualsiasi dominio, ottenendo allo stesso tempo un output di alta qualità. In genere l'approccio dei ricercatori alla tradu zione automatica del parlato è sempre stato caratterizzato da una forte consapevolezza di questi limiti. I primi sistemi di SST sviluppati, ad esempio, erano molto limitati in termini linguistici: l'utente doveva attenersi a regole ben precise e utilizzare unicamente le frasi che potevano essere riconosciute dal sistema (Grazina, 2010: 5). Successivamente, sempre per ridurre le difficoltà connesse alla traduzione della lingua parlata, sono stati introdotti sis temi di SST che prevedevano un uso limitato a un solo, o pochi argomenti di conversazione (Hutchins, 2009: 16), come NESPOLE!, incentrato principalmente sull'ambito turistico (Metze et al., 2002), o IraqComm, un sistema di SST sviluppato nell'ambito del progetto TRANSTAC del DARPA e in grado di tradurre fra l'inglese e l'arabo conversazioni limitate all'ambito medico, militare o di primo soccorso (Frandsen et al., 2008: 527). Questo restringeva l'ampiezza del vocabolario utilizzato dagli interlocutori e ren deva la conversazione più prevedibile.

Alcuni sistemi, invece, non prevedevano una traduzione bidirezionale, bensì unidirezionale (come Phaselator), mentre altri ancora erano speaker- dependent, oppure erano dotati di funzioni che permettevano all'utente d i interagire con la macchina, consentendogli ad esempio di verificare la correttezza della traduzione o di segnalare errori e incomprensioni.

Negli ultimi anni la situazione è molto cambiata: gli evidenti miglioramenti delle tecnologie su cui si basa la Sp eech-to-Speech Translation hanno reso più ambiziosi i ricercatori attivi in questo campo. Questo ha permesso il lancio di applicazioni o software commerciali per la traduzione automatica del parlato che, come tali, spesso non si limi tano a coprire un solo dominio

(o argomento) di conversazione e non sono speaker-dependent, ma possono essere utilizzati da tutti.

Questi sistemi di SST, tuttavia, presentano ancora delle imperfezioni, e, sebbene sia sorprendente la loro accuratezza nel tradurre alcune conversazioni o frasi, non di rado forniscono ancora traduzioni errate, che si rivelano più o meno comprensibili per l'utente. Proprio il fatto di essere speaker-independent e applicabili a qualsiasi tipo di discorso e dominio rende i sistemi di SST di ultima gene razione più esposti agli errori.

È dunque ragionevole supporre che anche strumenti come Skype Translator, un'applicazione in grado di tradurre (almeno teoricamente) qualsiasi tipo di conversazione telefonica, trarrebbero beneficio da una cooperazione da pa rte dell'utente. Infatti, come già suggerito nel 2005 da Zong e Seligman, a maggiori livelli di linguistic coverage (ovvero la capacità del sistema di SST di gestire diverse strutture linguistiche e un ampio vocabolario) e di topical coverage (la capacità del sistema di SST di coprire diversi argomenti di conversazione), corrisponde una maggiore probabilità di errore ed è quindi necessaria una maggiore cooperazione da parte dell'utente (Zong e Seligman, 2005) per sopperire alle eventuali mancanze della macc hina.

Occorre tenere a mente che nel 2005, anno di pubblicazione del saggio di Zong e Seligman, lo stato dell'arte era molto diverso rispetto al momento della stesura di questo elaborato: la tecnologia SST era confinata ai laboratori e certamente aveva an cora molta strada da fare per poter essere davvero utilizzabile, tanto che un sistema di traduzione automatica del parlato, applicabile a scenari di vita quotidiana e che non richiedesse una cooperazione da parte dell'utente, veniva etichettato come troppo ambizioso per l'epoca. Gli autori avevano come obiettivo quello di incoraggiare un'applicazione sul campo di questa tecnologia, che avrebbe richiesto, per l'appunto, un certo livello di user cooperation (ibid.).

Nonostante queste evidenti differenze, la teoria di questi due autori sembra conservare la propria validità anche oggi: innanzitutto, come nel 2005, non esiste ancora un sistema di SST “ideale”, che consenta all'utente di ignorare il dispositivo di traduzione e di parlare come se si stesse rivolge ndo a un interlocutore della sua stessa lingua, passando da un argomento all'altro liberamente, utilizzando un'ampia gamma di vocaboli, strutture grammaticali

ed espressioni idiomatiche e inserendo nel discorso false partenze ed esitazioni (Zong e Seligman, 2005); in secondo luogo, come per la MT, ora che la traduzione automatica del parlato è finalmente uscita dal laboratorio ed è accessibile al grande pubblico, è necess ario sensibilizzare gli utenti rispetto a cosa è realistico aspettarsi da questa tecnol ogia, ai suoi limiti, ai modi per arginarli e all'uso più corretto di un sistema di SST. Occorre tenere a mente che anche gli interpreti umani possono incorrere in malintesi o errori di traduzione, e spesso, per risolvere i propri dubbi, si trovano a dover chiedere all'interlocutore di ripetere o riformulare la frase “problematica” (ibid.): sarebbe dunque irrealistico aspettarsi che le prestazioni di una macchina superino quelle di un interprete.

Dal momento che nella traduzione automatica del parlato alcun i errori di traduzione derivano in realtà da errori di riconoscimento vocale, e considerando che è difficile per l'utente intervenire sull'output fornito dal modulo di ASR se questa possibilità non è prevista dal sistema di SST stesso, una prima e immediata forma di cooperazione da parte dell'utente può concentrarsi sul rendere il riconoscimento vocale il più semplice possibile. Escludendo i casi in cui il sistema di SST fornisce all'utente la possibilità di correggere manualmente o tramite input vocale eve ntuali errori di riconoscimento (come succede, ad esempio, in alcuni sistemi automatici di dettatura o app per la SST), la cooperazione da parte dell'utente può avvenire a monte del riconoscimento vocale. Secondo le linee guida fornite da Zong e Seligman, per facilitare il riconoscimento vocale e quindi la conversazione, gli utenti della SST dovrebbero (Zong e Seligman, 2005):

 evitare di utilizzare il sistema di SST in ambienti troppo rumorosi;  parlare in modo chiaro e comprensibile, scandendo bene le parol e,

senza però usare un tono di voce troppo alto, che causerebbe una distorsione del suono;

 evitare parole rare, forme dialettali o espressioni idiomatiche (che, anche in caso di corretto riconoscimento, creerebbero problemi per il modulo di traduzione automatica);

 fornire possibilmente input ben formati, dunque senza false partenze o riformulazioni.

Altre forme di cooperazione richieste all'utente potrebbero prevedere: la correzione di errori di riconoscimento vocale tramite input vocale o altri mezzi, l'addestramento di modelli acustici speaker-dependent, lo spelling di parole che non vengono riconosciute immediatamente, la risoluzione di ambiguità lessicali o strutturali, e così via (Zong e Seligman, 2005). Anche un feedback sulla traduzione potrebbe riv elarsi utile (Seligman, 2000) ai fini della conversazione e per un futuro miglioramento del modulo di traduzione automatica. Come già evidenziato, però, mentre i primi accorgimenti elencati in questa sezione sono applicabili a qualsiasi sistema di SST, que sti ultimi possono essere messi in atto solamente se il sistema stesso lo prevede.

Ammettendo che una forma di cooperazione più o meno pronunciata da parte dell'utente porterebbe a un miglioramento della qualità della traduzione del parlato, occorre tuttavia chiedersi se gli utenti della SST siano effettivamente disposti a fornire questo tipo di contributo, e se sì, in quale misura. Secondo Seligman la risposta a questa domanda, e quindi la disponibilità degli utenti della SST a mettere in campo forme di cooperazione e correzione, dipende in larga parte dall'applicazione pratica della traduzione automatica del parlato. In circostanze in cui si renda necessaria una traduzione la più accurata possibile, come in una conversazione d'affari, in caso di emergenza o in campo militare, la disponibilità degli utenti a interagire con il sistema di SST dovrebbe aumentare (ibid.). Con il miglioramento della tecnologia SST, anche il livello di cooperazione richiesto ai suoi utenti dovrebbe diminuire gradualmente (Zong e Seligman, 2005).