Computer Assisted Transla2on
Informa2ca Applicata alla Comunicazione Mul2mediale
2016/2017
Cris2na Bosco
Ausili alla Traduzione
In senso generale sono ausili alla traduzione gli
strumen2 di elaborazione del linguaggio umano:
• elaboratori di tes2
• soBware OCR (Op#cal Character Recogni#on)
• strumen2 per il riconoscimento e la sintesi vocale
• strumen2 per la ricerca e sos2tuzione di testo
• risorse linguis2che
Sistemi di traduzione
In senso streKo sistemi informa2ci per la traduzione sono invece sistemi che svolgono compi2 di traduzione:
• sos2tuendo il traduKore (traduKori automa2ci = machine transla2on)
• supportando il traduKore con strumen2 per lo svolgimento di aMvità tradizionalmente svolte manualmente come (CAT):
– analisi sul testo sorgente o target
– creazione, ges2one e consultazione di glossari e basi terminologiche
– ricerche in corpora linguis2ci
CAT
Alle applicazioni che supportano il lavoro umano di traduzione si fa riferimento colleMvamente con il nome di CAT (Computer Aided
Transla#on o Computer Assisted Transla#on).
Non sono propriamente strumen2 CAT quelli per la traduzione automa2ca (MT, Machine
Transla#on), anche nella sua varietà assis2ta
(HAMT, Human Aided Machine Transla#on).
CAT e TM
I sistemi per la traduzione assis2ta aKualmente più diffusi forniscono al traduKore
professionista vari strumen2 tra cui
sopraKuKo la memoria di traduzione (TM, Transla#on Memory).
Per questo mo2vo che il termine TM viene
spesso, sebbene in modo impreciso, usato
interscambiabilmente con il termine CAT.
Breve storia
Con il rapporto ALPAC del 1966 la ricerca nel campo della traduzione automa2ca subisce una baKuta di arresto e si cominciano a cercare modi di meKere la tecnologia informa2ca al servizio del traduKore umano.
Le prime soluzioni consistevano essenzialmente in banche da2 terminologiche, che a causa dei cos2 eleva2 delle tecnologie informa2che, negli anni '70, erano retaggio di poche grandi aziende.
Tra la fine degli anni '70 e l'inizio degli anni '80
cominciarono a circolare idee che cos2tuivano la base del conceKo di memoria di traduzione.
Breve storia
"It must in fact be possible to produce a program which would enable the word processor to
'remember' whether any part of a new text typed into it had already been translated, and to fetch this part, together with the transla#on which had already been done, and display it on screen or
print it out, automa#cally."
[P. J. Arthern, Aids unlimited: the scope for machine
aids in a large organiza#on, in Aslib Proceedings
volume 33, no. 8, Machine Aids for Translators,
Aslib, London, 1981.]
Breve storia
Negli anni '80 compaiono sul mercato i primi personal computer e i sistemi di CAT
cominciarono effeMvamente a essere realizza2.
Il pioniere è TSS (Transla2on Support System), un
soBware per sistema opera2vo OS/2 realizzato da ALPS, una società statunitense produKrice di
soBware per applicazioni linguis2che, poi divenuta Alpnet.
TSS fu realizzato aKorno alla metà degli anni '80 e
fu adoKato da alcune grandi società, tra le quali
IBM, per la propria aMvità di traduzione interna.
Breve storia
La seconda metà degli anni '80 vede un grande fermento nel seKore: la società olandese INK realizza nel 1987 un sistema ispirato a TSS e integrato da un componente
terminologico (TermTracer), producendo un paccheKo denominato Text Tools.
La società Trados, fondata nel 1984, oMene il diriKo di
commercializzare tale paccheKo in Germania. Lo stesso anno la società svizzera Star AG, specializzata in
traduzioni tecniche, realizza per i collaboratori interni un soBware di traduzione denominato Transit,
funzionante soKo DOS. Diverse altre aziende realizzano strumen2 simili a uso interno.
Breve storia
La commercializzazione di tali paccheM al di fuori delle grandi aziende inizia nei primi anni '90.
Nel 1990 esce la prima versione di Trados Mul2Term per DOS.
Nel 1992 IBM lancia sul mercato il suo SAA AD/Cycle Transla2on Manager/2 (TM/2) per OS/2.
Lo stesso anno fa il suo esordio sul mercato Trados Translator's Workbench per DOS.
L'anno successivo Atril realizza e immeKe sul mercato Déjà Vu per Windows.
Nel 1994 anche Star meKe in commercio la versione per Windows del proprio sistema.
I prezzi eleva2 di ques2 strumen2 (diversi milioni di lire) e i
requisi2 hardware non contenu2 ne rallentano la diffusione fra i traduKori indipenden2.
Breve storia
Nello stesso quinquennio vedono la luce diversi altri soBware basa2 sul conceKo di memoria di
traduzione, che hanno però scarso successo e il cui sviluppo viene abbandonato.
Nella seconda metà degli anni '90, mentre alcuni dei soBware na2 agli inizi del decennio
conquistano una sempre maggiore popolarità fra
i traduKori, grazie anche a un sostanziale ribasso
dei prezzi, fanno la loro comparsa prodoM nuovi,
tra i quali SDLX (1998).
Breve storia
Alla fine degli ’90 e nel primo decennio del 2000, videro la luce diversi soBware economici
oppure gratui2 come Wordfast (1999), Omega T (2002), Memo Q (2009) o online come
Translator’s Toolkit di Google (2008).
Oggi i sistemi di CAT più no2 sono SDL Trados,
Star Transit, Across, Atril Déjà Vu, incalza2 da
WordFast, Omega T e Memo Q.
Breve storia
Breve storia
L’idea di sistema di CAT nasce negli anni ‘60,
quando la European Coal and Steel Community (ECSC) sviluppa un sistema per la ricerca di
termini e del loro contesto in traduzioni memorizzate in formato eleKronico.
Il principale obieMvo è di mostrare i termini nel
Linguaggio Sorgente (LS) ed i loro equivalen2
nel Linguaggio Target (LT) all’interno dei loro
rispeMvi contes2.
Breve storia
L’idea moderna di sistema consiste invece nel cercare le unità di traduzione uguali per
riu2lizzarle, e la si trova per la prima volta
all’inizio degli anni ‘70, nel modello sviluppato da Krollman per l’esercito tedesco.
“For revised new edi2ons of transla2ons only the changed passages would have to be retyped.
Inser2on of changes and correc2ons into the old text would automa2cally be done by computer.”
(Krollmann 1971)
Breve storia
Alla fine degli anni ‘70 Arthern, un traduKore della EC, propone un ulteriore sviluppo,
nell’ambito di una discussione sull’uso dei database terminologici e l’introduzione di Systran.
Arthern suggerisce di sviluppare il sistema in
modo che possa trovare non solo le unità di
traduzione uguali al testo da tradurre, ma
anche quelle simili.
Breve storia
Accanto all’idea di “exact match” nasce quindi l’idea di “fuzzy match” (the nearest available equivalent), ma anche la proposta di integrare sistemi di CAT e di MT, per poter oKenere
come risultato la maggior quan2tà di
materiale tradoKo e limitare l’intervento umano. Realizzare quindi, in accordo con
ALPAC, sistemi di traduzione con al centro il
traduKore invece della macchina.
Breve storia
Solo all’inizio degli anni ‘80 la ricerca di “exact matches” viene implementata da ALPS
Incorporated, in una semplice componente deKa “repe22ons processing” del Transla2on Support System (TTS), un sistema di MT.
L’idea del “fuzzy matching” è implementata per la prima volta all’inizio degli anni ‘90, nei primi sistemi commercializza2 di TM, IBM
Transla2on Manager e SDL Trados.
Memoria di traduzione: UT
Una memoria di traduzione è un archivio
eleKronico in cui i tes2 in lingua sorgente e i corrisponden2 tes2 in una o più lingue target sono memorizza2 in modo parallelo.
I tes2 sono segmenta2 in unità minime deKe Unità di Traduzione (UT) e allinea2 in modo che ad ogni segmento in lingua sorgente
corrisponda il proprio traducente in ciascuna
delle lingue target.
Memoria di traduzione: creazione
I sistemi di CAT consentono di creare una
memoria di traduzione in due modi differen2:
-‐ costruendola durante il processo di traduzione;
l’utente crea una nuova memoria vuota e il sistema si occupa di riempirla durante la
traduzione, man mano che il traduKore lavora, archiviando in modo automa2co nella
memoria di traduzione le traduzioni prodoKe.
Memoria di traduzione: creazione
-‐ Indipendentemente dal processo di traduzione.
Se sono disponibili in formato eleKronico sia il testo in lingua sorgente, sia il corrispondente testo in lingua target, è infaM possibile
alimentare una memoria di traduzione tramite procedure di allineamento automa2co. I tes2 sorgente e target vengono segmenta2 ed
inseri2 nella memoria di traduzione appaia2
(con interven2 manuali più o meno estesi).
Memoria di traduzione: u2lizzo
Quando si traduce u2lizzando uno strumento di CAT, questo segmenta il testo da tradurre e per ogni segmento, man mano che si traduce, controlla se
esistono corrispondenze nella memoria di traduzione.
Se trova un segmento uguale (exact match,
corrispondenza esaKa) o simile (fuzzy match,
corrispondenza parziale) nella lingua di partenza,
presenta al traduKore il segmento corrispondente nella lingua di arrivo che il traduKore potrà acceKare,
correggere come necessario o ignorare facendo una traduzione ex-‐novo.