• Non ci sono risultati.

2.2 Procedura di annotazione

2.2.1 Annotazione

2.2.1.1 Standardizzazione delle occorrenze e assegnazio-

In questa prima fase l’annotatore, dato un lemma, deve esaminarne le occor- renze nel corpus ed interpretarle, per poi derivare da ciascun contesto una frase standardizzata.

Figura 2.3: <Verbs To Be Processed>, lemma attaccare

Dopo aver effettuato l’accesso all’interfaccia, seleziona il verbo da annotare nella tabella <Verbs To Be Processed> della homepage (fig. 2.3); il sistema lo reindi- rizza alla pagina <‌<First annotation>‌> (fig. 2.4), che mostra le occorrenze del verbo nel corpus, nella forma di concordanze (left context, Verb, right context).

Cliccando sulla forma verbale il linguista può visualizzare l’intero testo in cui l’istanza è contenuta, per comprenderne meglio il significato.

Figura 2.5: Standardizzazione dell’occorrenza

Se l’occorrenza non è interpretabile o rappresenta un errore di tagging22, deve

selezionare il check-box nella colonna <Deleted> (a destra della concordanza), escludendola. Altrimenti deve associare all’occorrenza una “standardizzazio- ne”, ovvero scrivere nel box <Standardization> una frase semplice (fig. 2.5), conforme ad alcuni semplici criteri.

La frase standardizzata deve:

• avere forma positiva, voce attiva, terza persona (singolare o plura- le), tempo presente23;

• contenere un unico verbo: è pertanto vietato l’inserimento di frasi subor- dinate e verbi ausiliari e/o modali;

• contenere solo gli elementi essenziali del verbo: eventuali specificatori o ag- giunti utili ad afferrarne il significato devono essere inseriti tra parente- si quadre24.

22Tra gli errori più frequenti, nomi scambiati per participi passati (ad esempio “rosa”, nome,

scambiato per il participio passato del verbo rodere).

23Le espressioni idiomatiche non vengono sottoposte a standardizzazione: vengono trascritte

nella loro forma canonica.

Inoltre:

• espressioni generiche non devono essere usate in funzione di sog- getto o argomento interno (es. qualcuno, un uomo, qualcosa, some- one, a man, something, etc.);

• se disponibili, le “basic level expression” Rosch (1978, 1999) sono pre- feribili. In alternativa deve essere utilizzato un nome proprio;

• l’ordine delle parole nella frase deve necessariamente essere lineare, sen- za embedding e/o relazioni a distanza25.

Contestualmente alla standardizzazione, l’annotatore assegna l’occorrenza ad un “variation field”, utilizzano i radio button sottostanti. Le opzioni possibili sono:

• <PRIMARY> • <MARKED> • <SUPPORT> • <SUBLEMMA>

Criteri per l’assegnazione delle occorrenze ad un “variation field” L’occorrenza può essere taggata come <PRIMARY> se e solo se:

• si riferisce ad una “azione fisica”;

• l’azione a cui il verbo si riferisce è una istanza propria del verbo; ovvero, secondo il criterio operativo derivato da Wittgenstein (1954)26, è possibile

Fabio prende l’astuccio [di Cristina] e riceverà la seguente struttura tematica:

[Fabio]AGENT [prende]VERB [l’astuccio [di Cristina]]TH

25Tale requisito, certo non privo di implicazioni (in particolare con i phrasal verbs in-

glesi), è dettato dalla necessità di rendere le standardizzazioni trattabili automaticamen- te (“parsable”).

standardizzazione corretta:

[[John]AGENT [rolls back]VERB [the change]THEME] standardizzazione scorretta:

[[John]AGENT [rolls [the change]THEME back]VERB

26Il criterio è stato adattato da un passaggio delle “Ricerche Filosofiche”: la variazione prag-

matica degli eventi corrispondenti al nome deverbale "play" che il filosofo propone, dimostra che l’applicazione dei predicati non è strettamente regolata né rigidamente governata da regole semantiche.

dire a qualcuno che non conosce il significato del verbo x, che “l’azione indicata ed eventi simili sono istanze di ciò che intendiamo con x”27.

L’occorrenza viene assegnata al variation field <MARKED> se il verbo è usato in senso metaforico o all’interno di una fraseologia.

Vengono annotati con il tag <SUPPORT> i verbi supporto (Von Polenz, 1963; Elia et al., 1985; Ježek, 2004, 2011b), noti in letteratura anche con la terminolo- gia alternativa “light verb”: seguendo la bibliografia tradizionale, in IMAGACT è definito “verbo supporto” un sintagma verbale (solitamente un verbo + NP/PP) in cui la funzione di predicato è assunta dall’elemento nominale, mentre il verbo si svuota del suo significato originario28, non contribuendo al valore semantico

complessivo.

(2.8) Fabio prende una decisione (= Fabio decide) (2.9) John takes a walk (= John walks)

Infine, l’istanza è annotata <SUBLEMMA> se:

• vi è un chiaro caso di polisemia/omonimia, come nell’esempio (2.10, 2.11): (2.10) Mario attacca il quadro “attaccare”

(2.11) I barbari attaccano la fortezza “attaccare-2” - sublemma • è un phrasal verb (Quirk et al., 1985; Biber et al., 1999) o un “verbo sin-

tagmatico” (Simone, 1997, 2008; Iacobini & Masini, 2006; Masini, 2006, 2008), ovvero un verbo polirematico che ha la struttura verbo+particella (verbo+preposizione oppure verbo+avverbio).

Tali costruzioni vengono identificate dall’annotatore mediante due test: – test semantico: la combinazione degli elementi produce un cambio di

significato o porta significati addizionali (esempi 2.12-2.15): (2.12) look at non è un sublemma

(2.13) give up è un sublemma (= to quit)

“[...] In che modo si delimita il concetto di giuoco? Che cosa è ancora un giuoco e che cosa non lo è più? Puoi indicarne i confini? No. Puoi tracciarne qualcuno, perché non ce ne sono di già tracciati. (Ma quando applicavi la parola «giuochi» ciò non ti ha mai preoccupato.)

[...] Come faremo allora a spiegare a qualcuno che cos’è un giuoco? Io credo che gli descriveremo alcuni giuochi, e poi potremmo aggiungere: «questa, e simili cose, si chiamano ‘giuochi’». E noi stessi, ne sappiamo di più? Forse soltanto all’altro non siamo in grado di dire esattamente che cos’è un giuoco? - Ma questa non è ignoranza. Non conosciamo i confini perché non sono tracciati.”

(Wittgenstein, 1967: 48)

27Seguendo tale criterio azioni fisiche come “prendere l’autobus” e “prendere il caffè” non

possono essere taggate <PRIMARY>.

28Come risulta evidente dagli esempi 2.8 e 2.9, in cui il soggetto non “prende” nulla in senso

(2.14) uscire fuori non è un sublemma

(2.15) mettere sotto è un sublemma (= investire)

– test distribuzionale: invarianza di significato in seguito alla rimozione della preposizione/avverbio (es. 2.16- 2.23).

(2.16) John hangs up his coat (2.17) John hangs his coat

(2.18) Fabio esce fuori dalla stanza (2.19) Fabio esce dalla stanza

Le frasi hanno lo stesso significato: hang up e uscire fuori non sono sublemmi.

(2.20) John gives away his hat to Mary (2.21) John gives his hat to Mary (2.22) Sara tira su la bambina (2.23) Sara tira la bambina

Il cambio di significato è evidente: give away significa “regalare”, “dare permanentemente”; tirare su ha il significato di “allevare”. give away e tirare su sono sublemmi, in questi casi.

• È un verbo intransitivo pronominale (Serianni, 1998)29.

(2.24) Fabio aggira l’ostacolo “aggirare”

(2.25) Fabio si aggira per il quartiere “aggirarsi” - sublemma Solo le occorrenze a cui è stato assegnato il tag <PRIMARY> o <SUBLEMMA> vengono ulteriormente elaborate: tutte le occorrenze primarie devono essere raggruppate in tipi azionali (2.2.1.2) e validate, mentre i sublemmi vengono trattati alla fine dell’annotazione e della validazione del lemma principale (par. 2.2.3); le occorrenze taggate MARKED e SUPPORT sono invece conservate separatamente nel database.