Traduzione e computer (4)

(1)

Cris%na Bosco

Informa%ca applicata alla comunicazione mul%mediale

2014-‐2015

(2)

Problemi nel valutare la MT

Prima di aﬀrontare il problema della valutazione della MT occorre chiarire che la valutazione

della stessa traduzione in generale è un

problema complesso, non risolto e su cui ci sono molte proposte e modelli in parte in contrasto tra loro.

(3)

Problemi nel valutare la traduzione

Manca chiarezza in generale su come si deve valutare una traduzione perché:

-‐  è un problema estremamente complesso -‐  la valutazione della traduzione implica una

intrinseca ed ineliminabile componente soggeBva

-‐  si parla di metodologia della valutazione della traduzione solo a parCre dal 1959 (convegno della Federazione Internazionale TraduIori)

(4)

Si propongono modelli diversi di valutazione della traduzione, che fanno riferimento a teorie diverse della traduzione.

In parCcolare per alcuni modelli la traduzione deve essere vista come un testo a se’ stante, per altri invece come un’enCtà dipendente dal testo originale.

Una varietà di parametri vengono proposC per confrontare frasi e interi tesC.

(5)

Problemi nel valutare traduzione

I modelli concordano tuIavia su alcuni principi fondamentali generali:

la valutazione deve cercare di misurare il

grado di adeguatezza della traduzione rispeIo

•  al dato semanCco, sintaBco e pragmaCco del testo sorgente

•  al quadro culturale del testo sorgente

•  alle possibilità espressive del testo sorgente

•  tenendo conto dello scopo comunicaCvo.

(6)

L’interesse “teorico” dei modelli di valutazione è spesso inversamente proporzionale alla loro semplicità di applicazione.

Da una parte vi è la ricerca di esausCvità del mondo accademico, dall’altra gli imperaCvi di ordine

economico di chi si trova a gesCre il controllo di qualità in ambito professionale (traduzione giusta al momento giusto, nel posto giusto e al costo

giusto, con la giusta formaIazione).

(7)

Livelli di qualità:

•  qualità-‐traduzione: garanCsce la resCtuzione fedele del contenuto del testo di partenza e la correIezza sintaBca e ortograﬁca del testo di arrivo, ma adaIo comunque solo ad una diﬀusione limitata.

•  qualità-‐adaIamento: il testo viene riﬁnito ﬁno ad

oIenere l’equivalenza totale, testuale e contestuale, sul piano del geosCle e del sociosCle.

•  qualità-‐ediCng: è lo “zero difeB” pronto da

stampare, assemblato con le immagini, le foto ed i disegni.

(8)

Metrica SAE (Society of AutomiCve Engineers) con 7 categorie di errore:

•  errore terminologico, errore sintaBco, omissione, errore di concordanza o di morfologia, errore di ortograﬁa, errore di interpunzione, altro.

Ogni errore è pesato come lieve o grave, cioè che può causare un malinteso o far compiere errore nell’eseguire le istruzioni descriIe.

La somma dei punC è divisa per il numero di parole.

(9)

Valutare la MT

Un problema messo a fuoco dal rapporto ALPAC è quello della valutazione dei risultaC prodoB dai sistemi di MT.

Non esiste tuI’ora una metodologia condivisa

ed universalmente acceIata per la valutazione in toto della MT. Esistono però delle metriche uCli anche per il confronto tra i sistemi e degli aspeB che devono essere consideraC.

(10)

Problemi nel valutare la MT

Uno dei principali problemi è la scelta di chi valuta:

-‐  Se il valutatore è completamente ignorante di MT non esprime una valutazione realisCca e non evidenzia le potenzialità dei limiC

-‐  Se è invece esperto di MT si rischia che si basi su campioni troppo scelC di linguaggio e che evidenzi problemi irrilevanC.

(11)

Passi di sviluppo e valutazione per MT

Nella costruzione di un sistema di MT, il primo

passo è la costruzione di un protoCpo di sistema (esperC).

Il secondo passo è lo sviluppo di un sistema che possa operare in un ambiente reale, con

associate uClity per pre e post ediCng (sviluppatori).

Il terzo passo è la valutazione da parte degli

acquirenC ed uClizzatori che possono esprimere giudizi su come il sistema modiﬁcherebbe il loro lavoro.

(12)

Valutazione dell’output

In tuB i passi occorre valutare l’output che il sistema produce sulla base di 3 parametri:

-‐  Fedeltà o accuratezza -‐ in che misura l’output conCene le stesse informazioni dell’input

-‐  Intelligibilità o chiarezza -‐ la facilità con cui si può comprendere il signiﬁcato della

traduzione

-‐  S%le e registro -‐ in che misura l’output usa un linguaggio appropriato al contesto d’uso

(13)

Fedeltà o accuratezza -‐ in che misura l’output conCene le stesse informazioni dell’input.

Per veriﬁcare si possono applicare tecniche empiriche:

-‐  vedere se seguendo le istruzioni di un manuale tradoIo si possono fare le stesse cose che

seguendo l’originale (leggibilità ed equivalenza di eﬀeIo sul leIore)

-‐  applicare la traduzione all’indietro

(14)

Intelligibilità o chiarezza -‐ la facilità con cui si può comprendere il signiﬁcato della

traduzione.

Viene applicata a frasi isolate o a interi tesC, prendendo in considerazione anche la

coerenza o consistenza traduBva delle varie parC.

Si valuta con scale numeriche standard.

(15)

S%le e registro -‐ in che misura l’output usa un linguaggio appropriato al contesto d’uso.

È un faIore molto importante, sopraIuIo in cerC Cpi di documenC, che richiede una

valutazione diﬃcile da quanCﬁcare.

Vari faIori determinano infaB il Cpo di registro, come la scelta dei termini e il modo in cui ci si rivolge al leIore.

(16)

Analisi dell’errore

Il conteggio degli errori presenC nell’output di un sistema di MT fornisce informazioni molto uCli su come migliorarli.

Si traIa di quanCﬁcare il lavoro da svolgere sull’output per renderlo acceIabile come traduzione. Si contano le aggiunte e

cancellazioni, le sosCtuzioni e si calcola la percentuale di parole correIe nel testo tradoIo. Non è un processo oggeBvo, dipende dal revisore e dal livello di

acceIabilità richiesto, e dai 3 parametri.

(17)

Analisi dell’errore

Si osservi che il semplice conteggio degli errori può non essere suﬃciente: occorre anche

classiﬁcarli in base al fenomeno ed alla diﬃcoltà di correzione.

Il risultato di queste analisi si rivela uCle per lo sviluppatore del sistema e per l’acquirente.

Ma serve anche a confrontare diversi sistemi di MT. Ma questo richiederebbe però

l’applicazione ad un benchmark condiviso.

(18)

Valutazione degli esperC

Durante lo sviluppo del protoCpo la valutazione è faIa dagli esperC allo scopo di decidere in che direzione procedere.

L’output mostra carenze che richiedono

modiﬁche dell’algoritmo o dei daC, perCnenC ad uno o più livelli di analisi o di generazione.

La valutazione viene ripetuta ad ogni modiﬁca del sistema allo scopo di veriﬁcare i progressi, in accordo con i 3 parametri.

(19)

Valutazione degli esperC

Durante lo sviluppo del sistema la valutazione è faIa dagli sviluppatori che si devono

preoccupare del funzionamento del sistema in un ambiente reale, quindi correggere i

problemi correggibili, e costruire uClity per

supplire alle carenze del sistema che si decide di acceIare, cercando di bilanciare cosC e

beneﬁci.

La valutazione viene faIa prima su piccoli frammenC di testo e poi su corpora.

(20)

Valutazione degli acquirenC

Spesso acquirenC ed uClizzatori intervengono

già nella fase di sviluppo, ad es. selezionando i daC su cui testare il sistema.

É una valutazione Cpo scatola-‐nera, solo sul risultato senza pensare al processo per

oIenerlo.

È una valutazione fortemente condizionata da interessi praCci ed economici che devono essere chiaramente deﬁniC (Cpo di tesC,

utenC, pubblicazione o uso interno, quanCtà di tesC …)

(21)

Valutazione degli acquirenC

Per l’uClizzo di un sistema in un ambiente reale occorre anche gesCrne la compaCbilità

rispeIo a sistemi operaCvi ed eventuali sistemi di input e di output, come OCR ed editor di testo o stampanC e scanner.

Molto raramente un sistema di MT è una enCtà isolata, di solito è integrato in un sistema più ampio.

(22)

Valutazione dei traduIori

Gli uClizzatori dei sistemi di MT sono

principalmente i traduIori di professione, che sono quindi coinvolC nei processi di valutazione.

La loro valutazione riguarda i 3 parametri e

sopraIuIo in relazione alla quanCtà di lavoro di pre e post ediCng, e l’uClizzabilità delle relaCve uClity. Il sistema di MT deve garanCre facilità di revisione dell’input e dell’output.