• Non ci sono risultati.

Capitolo 2 Corpora, Traduzione e Ricerca

2.2 Tipologie di corpora

2.2.1 Corpora parallel

In letteratura, la denominazione “corpus parallelo” è stata utilizzata a volte in maniera ambigua per identificare corpora che, nella terminologia attuale, vengono detti paragonabili, e riservando invece al corpus parallelo propriamente detto l’etichetta di “corpus per la traduzione” (translational corpus). Riprendendo Baker (1993), definiamo in questa sede il corpus parallelo come una raccolta di testi costituiti da originali in una lingua A, allineati alle loro traduzioni in una lingua B. I corpora paralleli possono essere unidirezionali, cioè comprendere testi originali nella lingua A e relativi testi tradotti nella lingua B, oppure bidirezionali, ossia comprendere testi originali in lingua A, paralleli a un corpus di testi di relative traduzioni in lingua B, affiancato a un corpus di testi originali nella lingua B, parallelo a un corpus di relative traduzioni nella lingua A (Bernardini 2000; Ulrych 2001). Questi ultimi, detti corpora paralleli reciproci, sono costruiti in modo tale da essere a loro volta paragonabili: è possibile confrontare testi originali nella lingua A e testi originali nella lingua B, così come testi tradotti nella lingua B e testi tradotti nella lingua A, ampliando notevolmente il ventaglio di studi possibili (Teubert 1996). Tutti i corpora paralleli sono per loro natura bilingui, e talvolta possono essere multilingui, ossia includere testi tradotti in più di una lingua B, C, D, ecc.11

Una delle caratteristiche distintive dei corpora paralleli è l’allineamento. Ciascuna unità testuale (frase, enunciato, periodo o altra stringa di testo eletta a unità di segmentazione minima) nella lingua A deve essere associata alla corrispondente unità testuale nella lingua B. L’allineamento può essere realizzato in maniera manuale o automatica, mediante programmi specifici, spesso corredati

11

Un esempio di corpus reciproco multilingue è l’OMC (Oslo Multilingual Corpus) comprendente inglese, norvegese e tedesco, nato dall’esperienza precedente dell’ENPC (English-

da sistemi di generazione di concordanze, che consentono di visualizzare la stringa ricercata in maniera associata alla stringa corrispondente, in una o più lingue disponibili. Alcuni di questi strumenti sono: MultiConcord, creato da David Woolls nel 1997 nell’ambito del programma LINGUA, Paraconc ideato da Micheal Barlow (ultima versione aggiornata al 1999), e Wordsmith Tools, il più diffuso tra gli strumenti citati, creato da Mike Scott.12

Le difficoltà più comuni di compilazione riguardano in larga misura la reperibilità di testi originali e loro traduzioni nella combinazione linguistica selezionata. La tipologia testuale può infatti porre dei problemi poiché norme discordanti del polisistema di partenza e di arrivo possono prediligere la selezione di generi testuali diversi per la traduzione da e verso determinate lingue (Olohan 2004: 25). Nel caso di corpora paralleli bidirezionali, tale difficoltà può risultare ancora maggiore per lo squilibrio nel numero di testi effettivamente tradotti da e verso una determinata lingua, appartenenti al medesimo genere e tipologia testuale. Nel caso della traduzione audiovisiva, per esempio, compilare un corpus bidirezionale di film doppiati per la coppia inglese/italiano risulta sicuramente più difficile rispetto a una possibile compilazione per la combinazione spagnolo/italiano, tenuto conto della scarsa preferenza del mondo anglosassone per questa modalità di traduzione, almeno per quanto riguarda i film di grande circuito (commedie, thriller, film storici, ecc.). Maggiormente reperibili potrebbero invece risultare i cartoni animati e le serie TV doppiati per un pubblico infantile (cfr. Karamitroglou 2000).

Un’ulteriore difficoltà di ordine metodologico risiede nella difficile definizione di “testo originale”. Sempre nel caso della traduzione audiovisiva, ma ciò accade anche per altri testi la cui paternità è difficilmente attribuibile (si pensi ai documenti reperibili in rete), allorché si voglia compilare un corpus parallelo di film originali in una lingua esotica (per es. il cinese), doppiati o sottotitolati in italiano, è necessario valutare attentamente quale testo abbia realmente funto da “originale” per il traduttore italiano, se il testo cinese o piuttosto il testo “ponte” in inglese della distribuzione internazionale.13

12

L’ultima versione aggiornata, la 5.0, è uscita nel 2008. 13

Per quanto riguarda il testo filmico, come commentato nel primo capitolo, il processo stesso di elaborazione del prodotto genera problematiche specifiche rispetto alla paternità dei vari

Possono infine essere considerate tipologie specifiche di corpora paralleli anche le memorie di traduzione utilizzate in ambito professionale per ottenere concordanze bilingui. Si tratta perlopiù di raccolte di testi spesso specialistici e di piccole dimensioni, archiviati e gestiti in locale, da singoli traduttori o da organizzazioni internazionali e/o imprese multinazionali. L’allineamento avviene in questo caso tramite software specifici inclusi nei pacchetti delle memorie, come Winalign, parte integrante di SDL Trados© (Bernardini et al. 2003: 7-12).14

È utile infine ricordare che molta parte della ricerca che fa uso di corpora di tipo parallelo si incentra sull’analisi contrastiva. Le traduzioni permettono, infatti, di mettere a fuoco, in maniera diretta e circoscritta, categorie di eventi, atti e realizzazioni linguistiche, che si trovano già ordinati in strutture comparabili, e di estrapolare facilmente paradigmi di corrispondenze (Olohan 2004; Granger et. al. 2003). Per questo motivo, la traduzione è stata ritenuta da molti come il miglior tertium comparationis ai fini dell’analisi contrastiva (Johansson 2007: 3). Dato, tuttavia, che i corpora riflettono usi linguistici in specifici contesti di produzione della lingua, obiettivo degli studi contrastivi basati su corpora non è solo il reperimento puntuale delle corrispondenze, sulla base di categorie identificate, ma la determinazione della misura e delle circostanze in cui determinate categorie esprimono la stessa cosa (Altenberg/Granger 2002: 18). Al fine di poter valutare al meglio i livelli di autonomia e interferenza della lingua originale sulla traduzione, molti studiosi hanno più volte sottolineato la necessità di confrontare i risultati dell’analisi contrastiva, ottenuti mediante studi incentrati su corpora paralleli, con i risultati derivanti da studi relativi all’uso linguistico attestato in corpora di testi originali di tipo paragonabile.

passaggi di scrittura e realizzazione del film, cosicché è più opportuno parlare di testo di équipe o testo collettivo, multiautoriale.

14

Nella pratica traduttiva professionale, il World Wide Web viene sempre più utilizzato, alla stregua di un enorme corpus, per lanciare interrogazioni testuali, tramite motori di ricerca altamente qualificati come Google. Per poter sfruttare al meglio la grande mole di dati presenti sulla rete, sono stati sviluppati, nel corso degli ultimi anni, strumenti che utilizzano il Web come fonte di approvvigionamento del materiale, permettendo di estrarre le concordanze testuali dalle pagine selezionate e di visualizzare i risultati mediante le tradizionali opzioni a disposizione nei corpora tradizionali. Un esempio di tali strumenti è WebCorp tool dell’Università di Liverpool e

WebConc dell’Università di Berlino. Più recentemente, sono stati creati sistemi che permettono di

estrarre da Internet vastissime raccolte di testi tramite la tecnica del Web crawling, che prevede l’impostazione di una serie di parametri specifici per la selezione dei siti d’interesse da cui estrarre i dati. Tali progetti riuniscono una vasta comunità di linguisti a livello mondiale (cfr. il progetto