• Non ci sono risultati.

3.2 Dall’annotazione alla produzione del DB 1.0

3.2.2 Mapping

3.2.2.2 Mapping interlinguistico

Quando il supervisore ha esplicitato le relazioni di equivalenza locale che i [VG] delle due lingue intrattengono con i lemmi che gli sono semanticamente affini, passa al confronto interlinguistico tra italiano e inglese (figura 3.13).

Per fare ciò, data la lista di tipi di un verbo nella L1, verifica se il verbo generale corrispondente copre o meno la stessa serie di tipi. Operativamente, per ogni tipo del [VG] della L1 viene cercato un equivalente nel [VG] della L2. Gli scenari possibili sono descritti in tabella 3.6.

SCENARIO AZIONE

È presente nella variazione della L2 un tipo equivalente al tipo della L1 [relazione 1:1].

Il supervisore ipotizza la mappatura. È assente nella variazione della L2 un tipo equivalente o

simile al tipo della L1 [relazione 1:0].

cause: Difetto del corpus: pur essendo il predicatoapplicabile all’evento, non ci sono occorrenze che lo attestino nel corpus.

Il supervisore crea il tipo mancante solo se la relazione

interlinguistica è priva di dubbio: il perfetto allineamento dei due corporaè delegato alla fase di CBE (WP4). Inapplicabilità del predicato a quel tipo di

evento.

Il supervisore si limita a constatare il differenziale cross-linguistico. La variazione primaria del [VG] della L2 contiene due o

più tipi azionali simili al tipo del [VG] della L1 (ovvero più di un tipo riportabile allo stesso prototipo) [relazione n:1 oppure 1:n].

cause: Diversa granularità tra le due annotazioni. Il supervisore sceglie una delle due annotazioni e adegua l’altra, facendo uno split di tipo se l’annotazione granulare è più corretta, oppure un merge tra tipi nel caso contrario.

Figura 3.13: Mapping interlinguistico

Talvolta l’allineamento dei tipi del [VG] di L1 e L2 risulta difficoltoso: le due variazioni tipologiche proposte dagli annotatori riflettono una categorizzazione degli eventi difficilmente confrontabile e conciliabile.

CAUSA AZIONE

Assenza di una effettiva relazione di traduzione tra i due [VG] scelti dal supervisore.

Il supervisore sceglie un altro [VG] per la L2.

Errore di annotazione non ancora corretto.

Il supervisore revisiona nuovamente l’annotazione e ripete la fase di mappingintralinguistico per la L2 (descritto al par. 3.2.2.1).

Tabella 3.7: Problemi di allineamento L1-L2

Concluso il processo di comparazione tra verbi generali la procedura viene ri- petuta per ognuno dei [VE] connessi al [VG], e le relazioni vengono ampliate ricorsivamente.

3.2.2.3 Strumenti di supporto alla gestione del mapping

Considerate la numerosità e la complessità delle relazioni da introdurre nel DB, è stato utilizzato come supporto al mapping il programma open source per la generazione di diagrammi DIA16. Ciò ha consentito di costruire gradualmente la

risorsa e rappresentarne, infine, la struttura complessiva in un unico file, D1— mapping_totale_ontologia_IMAGACT.dia, contenuto in Appendice D17; sca-

ricando il programma è possibile navigare e fare semplici query nel grafico. È a disposizione del lettore anche una versione a bassa definizione e non interrogabile in formato immagine, D2—mapping_totale_ontologia_IMAGACT.jpg. Ogni tipo della variazione primaria di ciascun lemma inserito nel file .DIA è stato rappresentato mediante una casella di testo. Le caselle, ordinate in verticale,

16Documentazione e download all’URL: https://projects.gnome.org/dia/

17I materiali sono scaricabili anche dalla sezione “Ontologia - Tabelle e Grafici” del sito del

sono sormontate da un box di intestazione, contenente l’entrata lessicale/lemma, come mostrato in 3.14.

Figura 3.14: Esempio di lemma nel file DIA

La casella di testo riporta le seguenti informazioni (figura 3.15):

• Numero del tipo: numero progressivo del tipo all’interno della variazione, assegnato in automatico dall’interfaccia in fase di annotazione;

• script: prodotto in fase di annotazione;

• ID del tipo: identificativo univoco del tipo azionale nel DB, assegnato in automatico dall’interfaccia al momento della creazione del tipo.

Figura 3.15: Modello di lemma nel file DIA

Alle caselle di testo sono associate diverse colorazioni, secondo la legenda in figura 3.16

Figura 3.16: Legenda

• linea continua: relazione PRO; • linea tratteggiata: relazione INST.

La relazione INST non è simmetrica, pertanto i segmenti sono orientati: il vettore va dal tipo azionale meno generale al tipo azionale più generale. Tale sistema rappresenta una semplificazione rispetto al modello complessivo; le relazioni PRO e INST infatti, per definizione, connettono i tipi azionali agli elementi scena, non legano i tipi azionali tra di loro (par.3.1.3.2). Laddove non è stato possibile, per ragioni grafiche, collegare direttamente due caselle di testo, si è fatto ricorso ad un richiamo sintetico (fig. 3.17 e 3.18).

Figura 3.17: Modello di richiamo sintetico

Figura 3.18: Esempio di richiamo sintetico

Ogni tipo azionale è stato connesso a tutti i tipi azionali sussunti o che lo sussumono. Senza dubbio ciò riduce sensibilmente la leggibilità del grafo in alcune zone del foglio: tale prassi, forse sconveniente dal punto di vista visivo, è stata però adottata per garantire maggior controllo delle relazioni introdotte nel DB, in virtù di alcune caratteristiche tecniche dell’interfaccia informatica che gestisce la creazioni dell’ontologia. Le relazioni di “incassamento” tra scene (e quindi tra i tipi collegati alle scene) non sono infatti informazione disponibile in maniera esplicita al sistema informatico, che pertanto non eredita le relazioni già inserite. Nell’importare le relazioni nell’infrastruttura il supervisore deve, per ciascuna scena, introdurre manualmente tutti i collegamenti (par. 3.2.3.3). Non è difficile immaginare la complessità del riportare correttamente tutte le relazioni di verbi generali ad alta frequenza come mettere (tipo #2247) e to put (tipo #3174): 32 elementi scena, 26 video, 53 tipi azionali sussunti. Il grafo ha svolto in tal senso un ruolo di grande supporto mnemonico, per evitare che le scene venissero inavvertitamente duplicate o le relazioni dimenticate.

In aggiunta, per i tipi azionali connessi a quattro o più scene, sono stati creati dei grafi che esplicitano le gerarchie dell’ontologia18. Ogni box di questa seconda

tipologia di grafici rappresenta un elemento [scena]: al suo interno sono listati i tipi azionali connessi alla [scena] con relazione PRO. Ogni tipo azionale è identificato mediante l’indicazione del lemma e l’ID univoco. Le frecce che connettono tra di loro i box delle scene riproducono le relazioni implicite IS_A dell’ontologia (figure 3.19 e 3.20).

Figura 3.19: Modello di grafo