• Non ci sono risultati.

5.3 Discussione dei risultati relativi alla valutazione degli output tradotti

5.3.5 Analisi delle principali problematiche riscontrate nelle traduzioni

Alcuni degli errori di traduzione rilevati sono ricorrenti, ovvero si ripresentano in forma simile in più di un output tradotto. Tali errori sono spesso stati riscontrati sia negli output prodotti da GT, sia negli output prodotti da MsT. Questi talvolta sono identici ( si veda Appendice 1); in altri casi sono diversi, ma presentano errori simili, riconducibili ad una o più tipologie.

Questa sezione sarà dedicata proprio alla discussione delle problematiche e degli errori di traduzione più ricorrenti negli output valutat i. Con questa analisi, tuttavia, non si ha la pretesa di fornire un quadro esaustivo degli errori o delle particolarità delle traduzioni prodotte dalle app valu tate: non si procederà cioè all'analisi di ciascun output, né si descriveranno nel dettaglio tutti gli errori presenti nelle traduzioni. Lo scopo di questa breve sezione è invece quello di fornire una panoramica generale delle principali problematiche riscontrate, la quale potrebbe sia rivelarsi utile per i potenziali utenti del servizio di Speech -to-Speech Translation offerto da GT e MsT, sia fungere da base per studi futuri incentrati su questo aspetto o finalizzati ad apportare migliorie ai sistemi di traduzione di GT e MsT.

Gli errori ricorrenti riscontrati negli output tradotti da GT e MsT posson o essere suddivisi schematicamente nelle seguenti categorie (parzialmente adattate da Grazina, 2010):

 errori di riconoscimento vocale: alcuni degli errori contenuti nelle traduzioni prodotte dalle due app valutate derivano da errori di riconoscimento vocale (si veda 5.3.3). È il caso di toponimi o nomi propri non riconosciuti correttamente dal modulo ASR e sostituiti con termini di uso comune (si veda Appendice 1);

 errori prodotti dal modulo MT, i quali si dividono ulteriormente in:  parole mancanti: alcuni output sono caratterizzati da parole

mancanti, talvolta “parole piene”, ovvero dotate di un significato preciso, come sostantivi, aggettivi, verbi, ecc., talvolta “parole vuote” o function words, prive di significato, ma dotate di una precisa funzione grammaticale, come l'inglese “do” in funzione di verbo ausiliare. Tali output non solo risultano incompleti, ma talvolta anche difficili da comprendere. A titolo di esempio si riportano i seguenti casi, tratti dall'Appendice 1: “From which platform the train to London” (verbo e ausiliare mancanti), “How much?” (verbo e soggetto mancanti), “Könnte sprechen langsamer” (soggetto mancante);

 ordine delle parole: alcuni output presentano errori a livello di ordine o posizione delle parole nella frase, il quale, sopr attutto in tedesco, segue regole ben precise. Per questo tipo di errore si riportano alcuni output in tedesco caratterizzati da Satzstellung errata (si veda Appendice 1): “Wie viel es kostet” (ordine invertito fra soggetto e verbo), “Welche Zeit Sie Frühstück servieren” (ordine invertito fra soggetto e verbo);

 termini errati o errori di senso: in alcuni casi gli output tradotti presentano errori derivanti da una scorretta disambiguazione della frase source o da una scelta lessicale sbagliata. Errori che rie ntrano in questa categoria compaiono nelle segue nti frasi (si veda Appendice 1): “Where is the nearest distributor”, dove “distributor” non è la traduzione corretta del termine source “distributore”, che, se usato in contesto turistico, indica chiaramente una stazione di rifornimento, in inglese “petrol station” o “gas station”. In questo caso, il modulo MT, privo di conoscenza del mondo, non ha compiuto la scelta lessicale più adeguata al contesto; “Leider spricht Italienisch”, dove dall'analisi della frase source “Scusi parla italiano?” il termine “scusi” è stato erroneamente interpretato dal modulo MT come il soggetto di “parla”. In questo caso ci si trova in presenza di una scorretta disambiguazione della frase source, poiché il modulo MT non ha

riconosciuto la forma di cortesia usata per il verbo “parlare”, riconducendo la forma coniugata “parla” alla terza persona singolare dell'indicativo presente;

 frasi interrogative: diverse frasi originariamente interrogative sono state tradotte in inglese e tedesco con sintassi tipicamente affermativa; in questo caso è difficile stabilire se l'errore sia dovuto al riconoscimento vocale o a un errore del modulo di traduzione automatica. Un esempio: “La colazione è inclusa?”, che ha dato origine, fra gli altri, agli o utput “Breakfast is included” e “Frühstück ist inklusive”, entrambi affermativi.

Nella classificazione delle tipologie di errori ricorrenti in una traduzione automatica Grazina (2010) include anche gli errori di punteggiatura. Tuttavia, nell'ambito dello s tudio condotto, considerando da un lato lo scopo della traduzione automatica del parlato offerta dalle due applicazioni e lo scenario d'uso ipotizzato, e dall'altro il fatto che le traduzioni prodotte vengono pronunciate dal modulo TTS, si è concluso che e ventuali errori di punteggiatura non rappresent ano un ostacolo evidente alla comprensione degli output tradotti, benché, come si è visto in 4.5. 2, alcuni dei valutatori coinvolti abbiano dato maggior peso a questo aspetto rispetto ad altri.

VI

Conclusioni

6.1 Contenuti principali dell'elaborato

Il presente elaborato è partito da una panoramica generale sulla traduzione automatica, anche nota come Machine Translation (MT), per approdare all’analisi della Speech-to-Speech Translation (SST), una tecnologia che utilizza il riconoscimento vocale, la traduzione automatica e la sintesi vocale per tradurre automaticamente input vocali da una lingua A a una lingua B, producendo output tradotti che vengono riprodotti acusticamente.

Il primo capitolo, incentrato sul la traduzione automatica di testi scritti, è partito da un excursus storico sulla nascita e l’evoluzione di questa tecnologia per poi analizzare il funzionamento e la struttura dei sistemi di MT, i possibili impieghi e le diverse categorie di utenti di tal i strumenti. Oltre ai numerosi vantaggi offerti dalla traduzione automatica, sono stati delineati anche i limiti e le problematiche inerenti a questa tecnologia, che rendono di fatto impossibile allo stato attuale della conoscenza il raggiungimento della Fully Automatic High Quality Translation (FAHQT). Sono stati poi analizzati i diversi metodi utilizzati per arginare i limiti della traduzione automatica, migliorando la qualità del prodotto finale (pre - editing, post-editing e redazione in linguaggio contro llato). Da qui si è passati alla definizione di qualità nell'ambito della traduzione automatica, per analizzarne infine i possibili metodi di valutazione.

Dalla traduzione automatica di testi scritti il focus è passato alla traduzione automatica di input orali nel secondo capitolo, incentrato sulla traduzione automatica del parlato. In un percorso simile a quello che ha scandito il primo capitolo, sono state analizzate le principali tappe storiche che hanno

portato alla nascita e alla diffusione di questa t ecnologia, il funzionamento e la struttura dei sistemi di SST, nonché le problematiche e le sfide che accompagnano la traduzione automatica della lingua parlata. Anche in questo caso sono stati proposti alcuni metodi per sopperire ai limiti dei sistemi di SST attualmente disponibili, basati ad esempio sulla cooperazione dell’utente sia nella fase di riconoscimento vocale, sia, in misura minore, nella fase successiva alla traduzione. È seguita una descrizione delle diverse applicazioni pratiche della tecnolo gia SST, delle sfide che i ricercatori attivi in questo campo dovranno affrontare nei prossimi anni e delle prospettive future di questa tecnologia. Infine, come per la Machine Translation, anche per la Speech-to-Speech Translation è stata affrontata la qu estione della valutazione della qualità, un tema di fondamentale importanza per lo studio descritto negli ultimi capitoli dell'elaborato.

Tale studio si è incentrato sulla valutazione di Google Translate e Microsoft Translator, due applicazioni per la tra duzione automatica che per alcune coppie di lingue offrono, fra gli altri, anche un servizio di Speech -to-Speech Translation. Nel capitolo III sono stati presentati gli aspetti metodologici del test di valutazione condotto, a partire dagli obiettivi del te st e dalle app oggetto di valutazione, passando per i partecipanti, fino allo svolgimento del test e alle modalità di raccolta dei dati e di redazione dei questionari utilizzati per la valutazione della qualità degli output tradotti.

I risultati della valutazione dei moduli di riconoscimento vocale e di traduzione automatica sono stati esposti nel capitolo IV e discussi nel capitolo V, dove sono state confrontate le performance di Google Translate e Microsoft Translator sia in termini di accuratezza del ri conoscimento vocale, sia in termini di correttezza della traduzione fornita, e sono stati analizzati tutti i dati raccolti alla luce degli obiettivi esposti nel capitolo III.