DELLO SCHEMA DI CORRISPONDENZE
3. La scelta del modello da impiegare per il mapping tra le risorse
DBpediaItalia, d’altro canto pur non potendo essere annoverato tra i sistemi di organizzazione e gestione della conoscenza veri e propri, in quanto derivato da Wikipedia e quindi non concepito con il precipuo scopo di “mettere ordine”, riflette la percezione di un utente medio, che nel caso del settore delle costruzioni potrebbe riferirsi ai clienti, ai consulenti che non sono esperti di dominio ma che per motivi professionali vi si accostano e necessitano di avere informazioni di tipo specialistico.
3. La scelta del modello da impiegare per il mapping tra le risorse
Terminata la fase di selezione dei vocabolari e prima di procedere alla specificazione dei mapping esterni, è stato importante definire la modalità attraverso la quale esplicitare le correlazioni semantiche. È stato cioè necessario stabilire il source
vocabulary ovvero il vocabolario di partenza, e il target vocabulary ovvero i vocabolari
verso i quali puntare e definire la natura delle relazioni.
In merito alla definizione e al mantenimento di mapping tra più risorse, interviene la ISO 25964-2:2013 summenzionata, la quale riporta le raccomandazioni per formulare collegamenti di questo tipo mostrando contestualmente gli elementi da considerare in sede di definizione dei collegamenti.
La norma inoltre, fa riferimento al suo interno a taluni modelli che possono essere impiegati nel caso in cui ci si appresti all’allineamento di concetti provenienti da più fonti:
! structural unit model: prevede che i vocabolari coinvolti nel processo di mapping siano simmetrici; questo modello è appropriato per i thesauri
multilingue, in cui un dato concetto è identificato per mezzo di un termine preferito in tutte le lingue del thesaurus e la struttura delle relazioni gerarchiche e associative è la medesima;
! direct-linked model: può essere implementato nel caso in cui ad essere coinvolti
nel mapping ci siano due o più vocabolari eterogenei non solo nella struttura (sistemi di classificazione, thesauri, liste controllate, ecc.) ma nella copertura semantica, nella lingua, negli obiettivi che si propongono. In tal caso è possibile specificare relazioni dirette (direct-linked) tra coppie di concetti provenienti da più vocabolari;
! hub structure model: propone di candidare a preferito, per l’appunto hub, uno
dei vocabolari prescelti e mappare i concetti di questo verso i concetti presenti nei vocabolari che assumono la posizione di satelliti. Così facendo, tutti i concetti appartenenti all’hub vocabulary saranno correlati a quelli degli altri vocabolari, e inoltre, qualora le relazioni venissero stabilite anche in senso opposto, cioè dai vocabolari satelliti verso l’hub vocabulary, tutti i concetti saranno relazionati tra di loro creando una vera e propria rete di relazioni;
! selective mapping model: interviene qualora non sia necessario mappare
completamente l’intera collezione dei concetti presenti nei vocabolari ma solo quelli ritenuti utili agli scopi che si intendono perseguire. Questo tipo di modello è previsto qualora la sovrapposizione tra due o più vocabolari sia limitata ad alcuni concetti o nel caso in cui il mapping sia definito a partire da un indice o un catalogo.
In considerazione della natura e della struttura proposta dalle tre risorse coinvolte nel processo di mapping, si è deciso di ricorrere alla definizione di un modello combinato basato sulla compresenza di quelli sopraelencati: direct-linked model, hub structure
model, selective mapping model, al fine di identificare un modello che tenga conto dei
rispettivi punti di forza e che consenta di superarne i limiti.
Di fatto, la norma non impone l’uso di un modello piuttosto che un altro, anzi, incentiva la loro combinazione in considerazione degli obiettivi precipui che ci si propone, della tipologia di vocabolari coinvolti, della natura delle relazioni che si intende esplicitare, della direzione che i collegamenti intendono seguire.
Il modello che ne è scaturito, ha tenuto principalmente conto delle differenze tra le tre risorse coinvolte e che riguardano il contesto e le finalità per cui sono stati concepiti e la non coincidenza della copertura semantica. Come già detto, il lessico INNOVance è di tipo specialistico, in quanto legato ad un dominio del sapere ben preciso, mentre il Nuovo Soggettario e DBpediaItalia seppur condividono il carattere multidisciplinare, non possono essere equiparati dal punto di vista della struttura né nelle funzioni che sono chiamati ad assolvere.
Questi fattori, hanno portato alla definizione di un modello combinato che partendo dalla concezione proposta dall’hub structure model, integra le potenzialità degli altri due: il direct-linked model è infatti maggiormente appropriato qualora si voglia stabilire un mapping diretto tra coppie di concetti mentre il selective mapping model, è una
conseguenza dei primi due in quanto interviene nel caso in cui i vocabolari non condividano la medesima copertura semantica.
L’approccio metodologico adottato, conferisce quindi lo status di hub (centro) al lessico INNOVance mentre il Nuovo Soggettario e DBpediaItalia assumono la posizione di vocabolari satelliti. I mapping sono stati a loro volta stabiliti tra coppie di concetti in maniera diretta e secondo associazioni di tipo unidirezionale, prevedendo quindi che ciascun concetto del lessico INNOVance posa esser associato ad uno o più concetti provenienti dagli altri due vocabolari considerati, di modo da identificare negli altri vocabolari almeno un concetto a cui collegarsi.
Figura 29. Modello prescelto.
La Figura 29 mette in evidenza la centralità del lessico INNOVance poiché è la risorsa da cui partire e specifica che le relazioni possono essere del tipo uno-a-molti e cioè che dato un termine del lessico INNOVance esso può essere correlato ad uno o più termini degli altri vocabolari coinvolti nel processo di mapping, in realtà si tratta solo di una condizione ideale in quanto per ciascun termine è stato identificato un solo termine di arrivo nel Nuovo Soggettario e in DBpediaItalia.
La fase successiva, ha interessato la specificazione della natura dei mapping da stabilire, i quali, data l’eterogeneità e il diverso grado di specializzazione con cui i concetti inerenti ai prodotti da costruzione sono trattati nei tre vocabolari, sono stati definiti in conformità alla normativa vigente ISO 25964-2:2013, la quale prevede, analogamente a quanto avviene all’interno di un medesimo thesaurus, mapping di vario tipo:
! equivalence mapping: stabilito contrariamente a quanto avviene all’interno di
uno stesso thesaurus non tra un termine preferito (TP) e un termine non preferito (TNP) ma tra concetti presenti in vocabolari diversi. Questo tipo di
mapping che si esprime tramite EQ, può essere a sua volta specializzato sulla
base del grado di equivalenza in:
equivalenza esatta (=EQ): si specifica quando i concetti provenienti dai diversi vocabolari possono essere impiegati in maniera interscambiabile, in quanto veicolano esattamente lo stesso concetto:
ad. es. Voc1:Finestra all’inglese =EQ Voc2:Finestra a battente con apertura verso l’esterno
equivalenza inesatta (∼EQ): quando i concetti non sono completamente sovrapponibili e sono quindi equivalenti in alcuni contesti e non in altri:
ad es. Es. Voc1:Canaletta di drenaggio ∼∼∼EQ Voc2: Cunetta ∼
! hierarchical mapping: stabilita tra concetti legati tra loro sulla base di criteri di
classificazione e collocati in una rete di sovra e sotto ordinati gerarchici. La struttura gerarchica lega tra loro concetti in cui il sovra-ordinato rappresenta la classe o il tutto mentre il sotto-ordinato ne costituisce un elemento o una parte. La sigla che definisce la classe generale è BM (Broader Mapping), mentre gli elementi in essa contenuti sono preceduti da NM (Narrower Mapping). Il
mapping di tipo gerarchico analogamente alle relazioni gerarchiche definite
all’interno di un medesimo thesaurus, possono essere generiche (genere-specie) esplicitate dalle sigle BTG (Broader Term Generic) e NTG (Narrower
Term Generic), partitive (parte-tutto) espressa tramite le sigle BTP (Broader Term Partitive) e NTP (Narrower Term Partitive) ed esemplificative
(classe-istanza) le cui sigle sono BTI (Broader Term Instantial) e NTI (Narrower Term
Ad es. Es. Voc1: Finestra BM Voc2:Serramenti
Voc2:Serramenti NM Voc1: Finestra
! related mapping: stabilita qualora non sia possibile specificare relazioni
gerarchiche e/o preferenziali mette in comunicazione concetti che hanno una forte implicazione reciproca. Tale relazione è espressa con la sigla RM (Related
Mapping):
ad es. Voc1:Clinker RM Voc2:Cemento comune
Tali relazioni predisposte dalla ISO 25964-2:2013 trovano una parziale rispondenza nel linguaggio SKOS, il quale predispone un set di tag per definire mapping tra concetti appartenenti a sistemi di organizzazione e gestione della conoscenza differenti favorendo l’allineamento e incoraggiando il colloquio tra KOS eterogenei.
I tag predisposti da SKOS per esprimere le relazioni summenzionate sono i seguenti:
! skos:closeMatch: stabilisce che tra due concetti appartenenti ad altrettanti KOS
sussiste dal punto di vista del significato una similarità molto forte;
! skos:exactMatch: designa una specializzazione del primo e indica che dati due
concetti provenienti da altrettanti KOS, essi possano essere impiegati in maniera interscambiabile indipendentemente dal contesto in cui sono calati:
! skos:broadMatch: introduce un rapporto di sovra-ordinazione tra concetti che
esprimono una classe;
! skos:narrowerMatch: introduce concetti più specifici rispetto alla sua
controparte skos:broadMatch;
! skos:relatedMatch: permette di gestire le altre tipologie di relazioni che non
rientrano in quelle gerarchiche e di equivalenza.
Queste relazioni hanno supportato il processo di mapping tra i concetti appartenenti a fonti eterogenee, con l’unica eccezione che ha riguardato la scelta di utilizzare per
stabilire un equivalence mapping, il solo tag skos:closeMatch perché concettualmente più ampio.del tag skos:exactMatch.