102 Tab 14. Opere di saggistica disponibili sul NKRJa (dicembre 2015)
AUTORE
ANNO e TITOLO (originale e traduzione)
CAPITOLI ALLINEATI
ANNO TRADUZIONE e
TRADUTTORE
N.
PAROLE ru
N. PAROLE ita
Bachtin M.
1929 Problemy poetiki
Dostoevskogo / Dostoevskij:
Poetica e stilistica
cap 1 1968
G. Garritano 12375 15724
Cukovskaja L.
1976 Zapiski ob Annoj
Achmatovoj / Incontri con
Anna Achmatova,
1938-1941
manca suddivisione
in capitoli
1990
G. Moracci 11130 14828
Solovev V.
1874 Krizis zapadnoj filosofii / La crisi
della filosofia occidentale
cap 1 1980
A. Dell’Asta
9465 12810
Bulgakov S.
1922 U sten Chersonisa / Presso le mura
di Chersoneso
cap 1-2
1998
M. Campatelli 13010 16473
Politkovskaja A.
2004 Putinskaja Rossija / La Russia di Putin
manca suddivisione
in capitoli
2010
C. Zonghetti 12605 14679
103
correzione e controllo manuale, ed è per questo motivo che l’eventualità di incontrare degli errori durante l’utilizzo del corpus non è da escludere. Vediamo nel dettaglio i due errori più frequenti:
1) Refusi: parole scritte non correttamente, errori di punteggiatura e spaziatura.
2) Incongruenze nell’allineamento, per cui una frase tradotta non corrisponde all’originale soprastante.
Il primo tipo di errore si verifica generalmente nei testi acquisiti dalla versione cartacea.
Il processo di digitalizzazione di opere cartacee consiste in due fasi: a) scansione delle pagine; b) conversione dell’immagine scansionata in un file di testo modificabile. Questo secondo passo è realizzabile automaticamente mediante uno scanner con opzioni avanzate, oppure attraverso programmi disponibili gratuitamente sul web che permettono di convertire un pdf o un’immagine in file Word. In entrambi i casi i risultati ottenuti esigono però un controllo per verificare che ogni singola parola sia stata correttamente convertita. Un segno di qualsiasi tipo presente sulla pagina scansionata (un appunto, una sottolineatura, un granello di polvere, così come lo scorretto posizionamento della pagina durante la scansione) può compromettere la corretta elaborazione del documento. Inoltre, vanno eliminati i numeri di pagina, eventuali intestazioni, trattini di sillabazione a fine riga e così via. A titolo di esempio, mostriamo qui di seguito un esempio di pagina appena convertita da scansione in pdf a documento in Word, dove le parti sottolineate sono da eliminare o correggere:
“I pugnalatori 285 di Palermo ha dichiarato risultargli bastano oggi duecen-tocinquantamila lire a pagare il servizio di fare uccidere un uomo:
che corrispondono ai tre tarì di allora, tenuto conto dell'attuale leggerezza della moneta e della legge-rezza con cui la si spende. Ci furono altre riunioni: ma non si concludeva nulla, tanto che qualcuno si sentiva rimordere la coscienza, per quei tre tarì al giorno che prendeva senza
"soddisfare" co-lui che li pagava. Finalmente, la sera del 1° ottobre, Ca-stelli disse: "questa sera cí sarà tonnina", cioè un massacro come quello che si faceva nelle tonnare, nei giorni della passa dei tonni. Ad ora di avemaria, agli ordini di Castelli, si trovarono presso il palazzo delle Finanze D'Angelo e Termini (dove andassero gli altri due gruppi D'Angelo non seppe). Ri-masero in quella zona per tre volte eseguendo gli ordini di
104
Castelli. E il primo da ferire se lo giocarono, D'Angelo e Termini, a pari e dispari: e toccò al Termini. Il secondo spettava al D'Angelo: e più vilmente dell'altro, avvicinan-dosi alla vittima con la richiesta della presa di tabacco, eseguì il comando. Il terzo, che sarebbe spettato al Ter-mini, il Castelli — forse per meglio educarlo — lo assegnò al D'Angelo. Creduto pienamente sui nomi degli undici esecutori e sul racconto dei fatti, D'Angelo non fu creduto per niente sul nome del mandante. Si credette cioè che quel nome fosse stato sì detto dal Castelli, in accordo con Masotto e Calì: ma tanto per farne uno che garantisse il soldo e facesse da schermo al mandante vero. Naturalmente, Castelli negò; negò tutto, negò sempre.
E così gli altri. Sí ritenne dunque che il principe di Sant'Elia fosse la quattordicesima vittima: non dí coltello, ma dí calunnia. E questo fino al momento del processo ai dodici pugnalatori, e anche da parte del pro-curatore Giacosa che sostenne l'accusa. Ma nella violenza con cui, nell'arringa, respinge il sospetto che il principe di Sant`.1_-_.lia possa avere avuto mano in quei delitti, è da intra-vedere la volontà di liberarsi appunto dí quel sospetto: che gli si insinuava, che lo inquietava.”
Per questo tipo di lavoro è necessario un buon compromesso tra efficienza e velocità: è impossibile rileggere i testi parola per parola, ma allo stesso tempo bisogna ridurre il più possibile il margine di errore. La segnalazione automatica degli errori compiuta da Word è di grande aiuto per identificare le parole scorrette. In caso di frasi interamente mancanti (succede anche questo talvolta) il testo cartaceo a fronte consente di colmare le lacune. I problemi maggiori sono dati da traduzioni italiane di testi russi contenenti molti segni diacritici. In questo caso l’intervento manuale deve essere più rigoroso, ma soprattutto richiede più tempo.
Il secondo tipo di errore, fortunatamente più raro, poiché di gran lunga più facile da cogliere prima della pubblicazione, riguarda la fase di allineamento. Anche in questo caso, a titolo di esempio, presentiamo un’immagine che esemplifica l’interfaccia del programma di allineamento utilizzato. Una volta che i testi (originale e traduzione) sono stati caricati nel programma, quest’ultimo propone un allineamento che, come si può vedere, in alcuni casi risulta scorretto, poiché frase originale e frase tradotta non coincidono (qui, nello specifico, alla frase italiana numero 2, il russo aggiunge un
105
ulteriore frammento che corrisponderebbe all’italiano numero 3, causando così un errore di allineamento non solo per la frase 2, ma anche per quelle successive). Il nostro lavoro è stato correggere manualmente questi errori, sempre cercando di ottimizzare il compromesso tra precisione e velocità. Nell’esempio sottostante sono inoltre visibili i problemi di punteggiatura menzionati nel primo capitolo, per cui la suddivisione in frasi tramite punto fermo non sempre coincide tra originale e traduzione. Qui nell’esempio 1, dove l’italiano propone i due punti, il russo opta per un punto fermo.
Fig 3. Esempio di testi allineati automaticamente dal programma
La terza fase, ossia l'inserimento dei metadati, avviene al termine dell’allineamento grazie ad un’apposita finestra presente nel programma di allineamento stesso. In questo caso, un’attenta compilazione e rilettura dovrebbe garantire l’assoluta precisione.
Il portale del NKRJa offre uno spazio per segnalare qualsiasi errore riscontrato dagli utenti. Come già accennato nel primo capitolo, durante l’utilizzo del corpus, cliccando su ogni parola nella pagina delle occorrenze compare una finestra con le informazioni grammaticali e semantiche sulla parola in questione. In questa stessa finestra è possibile cliccare sulla voce “soobščit’ ob ošibke” (comunicare un errore) nel caso si riscontrasse un errore nella parola o nell’annotazione. Cliccando poi sul titolo dell’opera o sul nome dell’autore, comparirà una finestra con i metadati. Anche in quest’ultima vi è la voce “soobščit’ ob ošibke”, da utilizzare in caso di errori riscontrati nelle informazioni extralinguistiche inserite.
106