Computer Assisted Translation (CAT)
Cristina Bosco
Informatica applicata alla comunicazione multimediale
2015-2016
Breve storia
L’idea di sistema di CAT nasce negli anni ‘60,
quando la European Coal and Steel Community (ECSC) sviluppa un sistema per la ricerca di
termini e del loro contesto in traduzioni memorizzate in formato elettronico.
Il principale obiettivo è di mostrare i termini nel
Linguaggio Sorgente (LS) ed i loro equivalenti
nel Linguaggio Target (LT) all’interno dei loro
rispettivi contesti.
Breve storia
L’idea moderna di sistema consiste invece nel cercare le unità di traduzione uguali per riutilizzarle, e la si trova per la prima volta all’inizio degli anni ‘70, nel modello sviluppato da Krollman per l’esercito
tedesco.
“For revised new editions of translations only the changed passages would have to be retyped.
Insertion of changes and corrections into the old text would automatically be done by computer.”
(Krollmann 1971)
Breve storia
Alla fine degli anni ‘70 Arthern, un traduttore della EC, propone un ulteriore sviluppo,
nell’ambito di una discussione sull’uso dei database terminologici e l’introduzione di Systran.
Arthern suggerisce di sviluppare il sistema in
modo che possa trovare non solo le unità di
traduzione uguali al testo da tradurre, ma
anche quelle simili.
Breve storia
Accanto all’idea di “exact match” nasce quindi l’idea di “fuzzy match” (the nearest available equivalent), ma anche la proposta di integrare sistemi di CAT e di MT, per poter ottenere
come risultato la maggior quantità di
materiale tradotto e limitare l’intervento umano. Realizzare quindi, in accordo con
ALPAC, sistemi di traduzione con al centro il
traduttore invece della macchina.
Breve storia
Solo all’inizio degli anni ‘80 la ricerca di “exact matches” viene implementata da ALPS
Incorporated, in una semplice componente detta “repetitions processing” del Translation Support System (TTS), un sistema di MT.
L’idea del “fuzzy matching” è implementata per la prima volta all’inizio degli anni ‘90, nei primi sistemi commercializzati di TM, IBM
Translation Manager e SDL Trados.
I sistemi di TM
Componenti di un sistema di TM:
• Editor multilingue – serve a leggere il testo in LS e a scriverne la traduzione in tutti i formati necessari
• Manager della terminologia – per gestire tutto ciò che riguarda la memorizzazione e modifica dei
termini organizzati per soggetto, cliente e progetto
• Riconoscitore di termini – per orientare la ricerca
nel database terminologico
I sistemi di TM
Componenti di un sistema di TM:
• Riconoscitore di concordanze – per cercare
tutte le istanze di una stringa di ricerca nel loro contesto
• Calcolatore statistiche – per avere una
panoramica quantitativa sulla TM e sapere ad
es. quanto del materiale esistente è riutilizzato
nella nuova traduzione
I sistemi di TM
Componenti di un sistema di TM:
• Strumenti di allineamento – per creare la TM con dentro i documenti precedentemente
tradotti, confrontarli con i testi da tradurre
facendo il match dei segmenti corrispondenti,
e legare insieme le unità di traduzione.
I sistemi di TM
Alcuni sistemi offrono anche gli strumenti per la creazione e gestione di basi terminologiche, e per l’integrazione con sistemi di MT che
comportano quindi la gestione di vari tipi di file all’interno di progetti complessi.
In sostanza dagli anni ’90 i sistemi di MT sono
rimasti sostanzialmente uguali, con l’eccezione degli algoritmi di matching e l’aggiunta di
funzioni più sofisticate.
I sistemi di TM
I sistemi di TM
Dagli anni ’90 quello che è cambiato è però il modo in cui il processo traduttivo viene
organizzato e il modo in cui le persone
coinvolte in esso possono interagire grazie
all’architettura client/server e grazie al cloud
computing e crowd sourcing.
Cloud computing
Con cloud computing si indica un paradigma di
erogazione di risorse informatiche (archiviazione, elaborazione e trasmissione di dati) on demand tramite il web.
Le risorse non vengono pienamente configurate e messe in opera dal fornitore apposta per l'utente, ma gli sono assegnate, rapidamente e
convenientemente, grazie a procedure
automatizzate, a partire da un insieme di risorse
condivise con altri utenti lasciando all'utente parte
dell'onere della configurazione.
Crowdsourcing
Con crowdsourcing (da crowd, "folla", e outsourcing
"esternalizzazione di una parte delle proprie attività”) si indica un modello di business per cui si affida la
progettazione, la realizzazione o lo sviluppo di un progetto, oggetto o idea ad un insieme indefinito di persone non organizzate precedentemente,
solitamente tramite siti e portali web.
Questo modello è sovente applicato per lo sviluppo di
risorse linguistiche, e consente di ottenere dati che non risentono di bias e sono quindi manifestazione della
conoscenza condivisa dalla comunità dei parlanti.