5.2. Esercitazioni corpus-based a.a 2018/
5.2.3. Esercitazioni corpus-based/Laurea magistrale
La maggior parte degli studenti della LM aveva frequentato il seminario sulla ricerca corpus-based svolto durante l’anno precedente. Visto che nell’a.a. 2018-2019, durante le ore di Lingua serba e croata il gruppo aveva trattato il tema della traduzione settoriale, si è pensato di integrare il lavoro iniziato con la ricerca sui corpora e di esaminare in modo pratico le possibilità e gli eventuali vantaggi di questo mezzo per la traduzione. Uno dei temi affrontati è stata la traduzione giuridica che si è deciso di approfondire considerata la presenza di alcuni corpora specializzati su Sketch Engine per la lingua croata: DGT Croatian, EUR-Lex Croatian 2/2016, EUR-Lex judgments Croatian 12/2016. Per il lavoro svolto in classe gli studenti hanno utilizzato il corpus Eur-lex nella versione croata e italiana.
La ricerca è stata svolta in due parti.
La prima parte di lavoro è stata articolata nelle seguenti domande:
1. «Accedi al sito Eur-lex54 e fai la ricerca scegliendo una tipologia dei documenti presenti:
Fig. 40. Schermata di ricerca sul sito Eur-lex
Scegli uno dei documenti nella visualizzazione multilingue (fino a tre lingue).»
120 Fig. 41. Opzione di ricerca multilingue sul sito Eur-lex
2. «Cerca sul corpus Eur-lex il lemma zakon.»
3. «Osserva la stessa parola nei due corpora monolingui (italiano, croato) nel contesto con aggettivi e verbi. Utilizza tutti gli strumenti (concordance, Word Sketch, Thesaurus).» 4. «Cerca i sinonimi della parola legge insieme ai termini che designano diverse tipologie
di leggi (decreti, accordi…) in entrambe le lingue.» Eur-lex (croato)
zakon (legge, disposizione legislativa)55, pravo (legislazione, diritto), propis (normativa), zakonodavstvo (legislazione), uredba (regolamento), povelja (carta), odluka, informacija, ugovor, sporazum, konvencija, direktiva;
Eur-lex (italiano)
legge, disposizioni legislative, legislazione, diritto, direttiva (direktiva), regolamento, decisione (odluka), trattato (ugovor), accordo (sporazum), protocollo, informativa, carta (povelja), convenzione (konvencija).
5. «Elenca i verbi, aggettivi o altre parole ricorrenti nel contesto con i termini trovati nelle due lingue»
Agg + zakon
121
nov, Kazneni56, ustavni, izborni, prirodan, posebni, propisan, važeći, postojeći (HrWaC)
nacionalni, izmijenjen, grčki, odgovarajući, Savezni, primenjiv, Opći, Carinski, Regionalni, Antidampinški (Eur-lex).
Verbi + zakon
sx: biti, kršiti, donijeti, poštovati, donositi, prekršiti, postojati, imati (HrWaC) dx: biti, trebati, moći, morati, htjeti, imati, predviđati, kazati (HrWaC)
sx: donositi, biti, objavljivati, donijeti, provoditi, navesti, zahtjevati, razmotriti, poštovati, uskladiti (Eur-lex)
dx: biti, propisati, moći, predviđati, dugovati, trebati, određivati, primjenjivati, morati (Eur-lex).
Aggettivi + legge ItTenTen16:
sx: nuova, presente, stessa, citata, tale, prima, medesima, attuale, recente, ex, ultima, cosiddetta
dx: regionale, elettorale, finanziaria, italiana, nazionale, costituzionale, naturale, provinciale, statale, morale.
EUR-lex Italian:
sx: tale, nuova, presente, stessa, medesima, suddetta, citata, giuridica, ultima, predetta, terza, vecchia, seconda, precedente
dx: applicabile, nazionale, regionale, relativa, federale, tedesca, finanziaria, greca, italiana, generale, olandese, fondamentale, austriaca, francese.
Verbi + legge ItTenTen16:
sx: dettare, essere, diventare
dx: essere, prevedere, dovere, potere, approvare (sempre nella forma “approvata”), presentare (presentata), stabilire, avere, imporre, fare, consentire.
EUR-lex Italian:
122
sx: dettare, summenzionate, menzionare, tale, decretare, divenire, diventare, precitate dx: prevedere, essere, dovere, recare, potere, disporre, stabilire, adottare, modificare, designare, avere, riguardare, consentire, contenere, consolidare, imporre.
Per estendere la ricerca è stato utilizzato lo strumento N-grams impostato per la parola zakon (legge) nel contesto con altre due parole (3-grams). In alcuni casi la ricerca per n-grams può essere molto lenta e si può ricorrere all’utilizzo di un corpus più piccolo (subcorpus) creato per motivi di ricerca/traduzione.
Sono state individuate alcune costruzioni che rappresentano la denominazione di una legge o la sua definizione:
zakon o _____
Zakon o radu, zakon o zaštiti, opći zakon o, novi zakon o, zakon o burzi, zakon o hrani
Agg + zakon:
Ukrajisnki ustavni zakon, nacionalni zakon, okvirni zakon, regionalni zakon, Lenzov zakon legge di ________
profitto, mercato, Unione, Stati, sharia, paese legge su ______
media, lingua, sicurezza, fondazioni, blasfemia, minoranze, stampa, protezione, mercato legge + Agg
ungherese, slovacca, elettorale, europea, superiore, marziale, internazionale.
La seconda parte è consistita nell’uso dello strumento One-term extractor (https://terms.sketchengine.eu/) – il sito è messo a disposizione da SE – che permette di estrarre i termini da un documento in modo semplice e senza dover fare il log-in.
123 Fig. 42. Schermata iniziale del sito One click terms
Nei risultati vengono riportati i termini estratti (single e multi-words) e le parole corrispondenti nel corpus di riferimento. In questo modo, se il numero di occorrenze risulta più elevato nel documento caricato rispetto al corpus referente se ne ricava che è un uso specifico delle parole che permette di individuare l’argomento del testo.
Fig. 43. Parole e multi-words estratte
È possibile allargare il contesto in cui la parola appare cliccando sul numero di occorrenze accanto a ogni risultato. Cliccando invece sui puntini accanto al numero di occorrenze si può accedere alla pagina di Wikipedia collegata alla terminologia in questione.
124 Fig. 44. Pagine di Wikipedia collegate al termine ljekarnički
Per permettere agli studenti di acquisire tutte le competenze di una ricerca corpus-based, un passo ulteriore è consistito nella creazione autonoma di un corpus utilizzando lo strumento predisposto da SE. Il procedimento è stato il seguente.
Creare un corpus con le parole chiave sul Web
Dalla sezione Dashboard di SE (oppure Select corpus) è possibile accedere al pulsante “New corpus”. Seguendo la procedura guidata si può facilmente creare un nuovo corpus a partire dai testi che si intende caricare oppure scaricando i contenuti da Internet. Quest’ultimo passaggio può essere svolto per parole chiave oppure digitando i siti cui si vuole attingere per scaricare le informazioni. Visto l’argomento del corso, le parole chiave utilizzate sono state: ekonomija, BDP, finansije, politika, rast (economia, PIL, finanze, politica, crescita).
Nelle ultime lezioni sono state individuate collocazioni di alcune parole l’unione delle quali rappresentava un pattern fisso caratteristico del linguaggio specialistico. Si è partiti dal testo Privredni rast u 2019 biće manji od planiranih 3,5%57 per individuare diversi pattern d’uso al suo interno e ricercare tutte le parole che possono completarli, nel contesto dalla parte sinistra o destra:
[ekonomska, sigurnosna, računovodstvena] politika [država članica, tržišta, zajednice]
Na osnovu [prikupljenih, njihovih, postojećih] [podataka, informacija, činjenice, plana] Realan/realna [rast, vrednost, mera, uvjet, plaća, broj, pretpostavka, troškovi]
Rasploživ [iznos, dohodak, prostor, kapacitet] U periodu [dužem (od), do, u kojem, između]
Niz [mjera, izmjena, ispitivanja, prilagodbi, čimbenika]
Manji od [(1, 10, 50, 5…) minimalne, dimenzija, polovine, broja].
57 Si è lavorato su una parte del testo presente sul sito: https://novaekonomija.rs/vesti/vesti-iz-zemlje/privredni-
125
Alla conclusione delle lezioni anche la studentessa della LM ha consegnato la relazione sul lavoro di traduzione svolto (Allegato 15).