• Non ci sono risultati.

3. PROPOSTA DI LOCALIZZAZIONE DAL FRANCESE ALL’ITALIANO DEL SITO WEB DEL PARC DE

3.3 Il processo di localizzazione

3.3.2 Fase preparatoria

3.3.2.1 Preparazione del materiale per la traduzione

Nella precedente sezione 3.3.1, contenente la premessa al lavoro, abbiamo segnalato l’assenza del “gioco di squadra” fra localizzatore e webmaster in questo progetto. Per la preparazione del materiale da localizzare, pertanto, abbiamo dovuto procedere secondo un metodo meno “ortodosso”, scaricando, cioè, manualmente, le pagine HTML dal sito. Non ci siamo limitati a copiare semplicemente il contenuto testuale in un file word, dato che possedere i documenti in formato HTML sarebbe stato necessario per alcuni interventi legati alla SEO. Per velocizzare il processo di salvataggio manuale delle pagine dal sito, ci siamo serviti di un programma appositamente pensato per salvare l’intero contenuto di un sito in locale, lo spider “HTTrack” (cf. Capitolo 1, Sezione 1.2.4.4). Come già spiegato, questo programma permette velocemente di scaricare, oltre a tutte le pagine HTML, anche le immagini e i fogli di stile (CSS). Una volta scaricato per intero il sito, sono state scelte le pagine da tradurre, essenzialmente quelle maggiormente ricche di contenuti testuali, e che potevano suscitare maggior interesse in fase di localizzazione, per un totale di otto pagine. Come sappiamo, le pagine HTML possono essere direttamente modificate con degli editor di testo o HTML, o tradotte all’interno di CAT tool. Per questo motivo nessun ulteriore processo preliminare alla traduzione è stato necessario, ad esempio, per preparare i file.

La fase di preparazione del materiale da tradurre è stata accompagnata da una fase di documentazione per supportare il processo traduttivo. Il sito, come già accennato nella parte introduttiva, illustra e pubblicizza l’offerta turistica del Parco del Lago di Maine; il contenuto testuale non contiene pertanto una terminologia settoriale specifica, per la quale sarebbe stata necessaria la creazione di glossari supportata da un’abbondante ricerca terminologica. Per supportare ulteriormente la traduzione, tuttavia, si è deciso di creare un piccolo corpus, da poter consultare parallelamente alle ricerche manuali sul Web. Un corpus si definisce come un “insieme di testi in formato elettronico raccolti secondo un’esplicita metodologia in modo da rappresentare una varietà linguistica ben definita” (Bernardini, 2000: 303): il suo utilizzo è spesso raccomandabile, soprattutto in assenza di altri riferimenti, in quanto può contribuire ad una notevole riduzione dei tempi di ricerca manuale, e al tempo stesso riduce il rischio di eventuali scelte poco affidabili o inefficaci (ibid.: 311). Si è deciso di basare il corpus monolingue di riferimento in italiano sulla base di siti web di argomento affine a quello da localizzare, dunque siti web di parchi naturali e simili, soprattutto allo scopo di verificare quali sono le strutture più ricorrenti in questa tipologia testuale in lingua italiana.

94

Per la creazione del corpus, è stato utilizzato il software open source BootCaT81, mentre per la sua successiva analisi è stato impiegato un software di consultazione dei corpora, AntConc82, anch’esso scaricabile gratuitamente da Internet. Il funzionamento di BootCat è piuttosto semplice: un wizard invita l’utente ad inserire una serie di parole chiave, dette seeds, che l’utente sceglie in base al dominio del corpora che intende creare; le seeds vengono combinate in maniera automatica dal programma in stringhe di parole, dette tuple, contenenti un numero di seeds stabilito dall’utente (fino a un massimo di dieci); sulla base di tali tuple, che possono essere scartate o selezionate dall’utente, il software cerca e seleziona siti Web contenenti tali stringhe, e ne raccoglie gli indirizzi URL. I link raccolti possono essere, come le tuple, selezionati ed eliminati dall’utente, qualora non li ritenesse pertinenti: un ottimo modo di “ripulire” l’elenco degli indirizzi URL è quello di eliminare tutti i link a siti di domini diversi da quello della lingua del corpus (nel nostro caso, dunque, tutti i siti che non sono .it), ma anche tutti i siti che non risultano pertinenti al dominio di interesse.

Nel nostro caso, le seeds scelte sono il corrispondente italiano dei termini francesi chiave nel sito, quindi vocaboli ed espressioni come “ambiente protetto”, “passeggiare”, “parco divertimenti”, “lago”, “parco naturale”, “flora e fauna”, “fare pic-nic”, “sport acquatici”, “turismo”, ma anche espressioni tipiche del linguaggio dei siti Web di questo tipo, come “per info”, “dove mangiare”, “dove dormire”, “come arrivare”. Individuate le tuple e in seguito gli URL, abbiamo deciso di scartare tutti quelli ritenuti meno pertinenti e affidabili dal punto di vista linguistico, in quanto probabilmente non scritti da parlanti madrelingua: seguendo questo criterio, sono state eliminate le pagine .org, .com o le pagine italiane di siti web stranieri lasciando soltanto gli URL di siti di parchi naturali italiani, dal contenuto simile a quello da localizzare (ad esempio, lagodigarda.com, lagotrasimeno.net, sibillini.net, gransassolagapark.it, ecc.). Dagli URL, il software raccoglie tutti i testi in un unico file di testo in formato .txt.

Quello ottenuto è perciò il nostro corpus monolingua, che può essere analizzato in AntConc. Questo software permette, fra le molteplici possibilità, di utilizzare lo strumento concordance, ovvero di verificare le occorrenze e il contesto d’utilizzo di una determinata espressione o parola. Questo strumento può essere utile ad esempio per individuare le parole più frequenti in un determinato contesto, accorgimento necessario quando si

81 Disponibile all’indirizzo: http://bootcat.sslmit.unibo.it/

95

traducono contenuti per il Web ed è necessario, come nel nostro caso, far attenzione ad utilizzare nel testo parole chiave molto utilizzate dagli utenti italiani che potrebbero rappresentare l’ipotetica utenza del nostro sito.

Una volta ultimata la creazione del corpus, si ha dunque tutto il necessario per avviare la fase di traduzione vera e propria che, come vedremo in seguito, avverrà con l’ausilio del CAT tool SDL Trados Studio 2015.