• Non ci sono risultati.

SPAR: Semantic Publishing And Referencing Ontologies

2.3 Semantic Lancet Project

2.3.2 SPAR: Semantic Publishing And Referencing Ontologies

SPAR17`e una suite di ontologie OWL 2 il cui obiettivo `e quello di descrive- re gli aspetti rilevanti del processo di pubblicazione, con particolare attenzio- ne alle pubblicazioni scientifiche[DGP15]; esse rappresentano le principali on- tologie utilizzate per la descrizione dei dati del Semantic Lancet Triplestore. Qui di seguito viene data una rapida descrizione di queste ontologie:

• FaBiO: FRBR-aligned Bibliographic Ontology; descrive le entit`a che sono state pubblicate o che sono potenzialmente pubblicabili e che con- tengono riferimenti bibliografici o sono menzionate da essi. Le classi di FaBiO sono strutturate sul modello dei livelli FRBR: Works, Ex- pressions, Manifestations e Items. Questa ontologia sostanzialmente descrive i metadati fondamentali associati ad un articolo (autori, titolo, DOI, etc...)

• CiTO: Citation Typing Ontology; permette di caratterizzare la natura o il tipo delle citazioni. Ad esempio la propriet`a cito:cites permette di indicare che un articolo ne cita un altro, ci sono inoltre un ampio insieme di sotto-propriet`a di cito:cites che permettono di caratterizzare la tipologia di citazione, il motivo della citazione: citation functions(es. cito:extends, cito:usesMethodIn, etc...)

• BiRO: Bibliographic Reference Ontology; permette di definire i record bibliografici, i riferimenti bibliografici e la loro compilazione in collezioni e liste

• C4O: Citation Counting and Context Characterization Ontology; per- mette di registrare il numero di citazioni in-text (nel testo di un artico-

lo) ricevute da un certo articolo citato, oltre al suo numero di citazioni globali. Essa permette inoltre di caratterizzare il contesto citazionale (citation context ) di ogni citazione

• DoCO: Document Components Ontology; ontologia per la caratteriz- zazione delle varie parti di un documento, sia strutturali (es. sezione, paragrafo), che retoriche (es. introduzione, discussione, etc...)

• PRO: Publishing Roles Ontology; permette di specificare i ruoli di agenti (autori, editori, etc...) coinvolti nel processo di pubblicazione. • PSO: Publishing Status Ontology; caratterizza lo stato della pubbli-

cazione di un documento in ogni fase del processo di pubblicazione (es. in fase di review, pubblicato, etc...)

• PWO: Publishing Workflow Ontology; descrive i passi del flusso di lavoro associato alla pubblicazione di un documento o di altre tipologie di pubblicazioni

L’utilizzo di queste ontologie permette di definire elementi bibliografici, re- cord bibliografici e riferimenti, citazioni, numero di citazioni, contesti cita- zionali e le loro relazioni con sezioni rilevanti degli articoli citati. E ancora, l’organizzazione di record bibliografici, liste ordinate di riferimenti, sezioni dei singoli articoli, ruoli nel processo di pubblicazione e lo stato di pubblicazione degli articoli.

2.3.3

Il triplestore

Figura 2.1: Data model dei Journal Articles in SLT

Figura 2.2: Data model per i Citation Acts

Il Semantic Lancet Triplestore `e un LOD dataset liberamente accessibile e progettato con l’intenzione di fornire una grande quantit`a di dati su articoli scientifici; oltre alle informazioni bibliografiche di base e ai dati di authorship vengono resi disponibili dettagli relativi agli abstract, alle citazioni, ai motivi citazionali, ai contesti citazionali e in generale alla rete citazionale degli ar- ticoli scientifici; quest’ultima permette di collegare un articolo ad un insieme di altri articoli ritenuti rilevanti ed in qualche modo affini a quanto trattato nell’articolo. Tali informazioni sono disponibili grazie all’arricchimento se- mantico di dati estratti direttamente dal contenuto testuale degli articoli. L’intenzione `e quella di fornire una visione pi`u ampia ed approfondita sulle

relazioni che legano papers scientifici rendendo inoltre il loro contenuto espli- citamente formalizzato.

In Figura 2.1 `e illustrato il modello dei dati utilizzato nel dataset per la rappresentazione dei journal articles e nella parte sinistra della Figura 2.2 `e presente il modello che permette di descrivere gli atti citazionali (citation acts) all’interno degli articoli, i motivi citazionali (citation functions) e le frasi nelle quali si parla di un articolo citato (citation context ); oltre alle ontologie SPAR, vengono utilizzate anche altre ontologie, come DCTerms18, PRISM19, Collections Ontology (CO)20, Open Annotation Data Model21 e frbr22. In questo contesto, per comprendere meglio come siano strutturate

le informazioni all’interno del dataset, pu`o essere utile fare degli esempi mo- strando properties e values delle risorse relative ad un articolo; verr`a usato un resource browser per visualizzare tali informazioni. In Figura 2.3 sono rap- presentate le risorse accessibili al livello frbr Work di un articolo dal titolo ”A general Datalog-based framework for tractable query answering over on- tologies”; da qui si possono ottenere le informazioni sulla tipologia di articolo (research paper nell’esempio), sugli autori dell’articolo (property creator ) o ulteriori dettagli sull’articolo spostandosi al livello Expression, cio`e la realiz- zazione del work.

Al livello Expression (Figura 2.4) vengono fornite altre informazioni essenzia- li, ad esempio l’abstract, l’anno di pubblicazione, il DOI, il tipo di articolo, le citazioni globali e i gi`a menzionati cites che puntano ad altre risorse di livello Expression le quali rappresentano gli articoli citati dall’articolo analizzato; `e possibile inoltre, per mezzo della property embodiment, ”scendere” ancora al livello di manifestation per avere informazioni, come nell’esempio in Figura 2.5, sulla manifestazione dell’articolo in formato di pagina web html (`e di- sponibile un link ipertestuale come valore della property exemplar ).

18http://dublincore.org/documents/dcmi-terms/

19http://www.prismstandard.org/resources/mod prism.html 20https://code.google.com/p/collections-ontology/

21http://www.openannotation.org/spec/core/ 22http://vocab.org/frbr/core.html

Figura 2.3: esempio Work

Per avere informazioni sul tipo di citazione, la risorsa fondamentale `e costi- tuita dal Citation Act (Figura 2.6) il quale collega una citing entity (articolo citante) ad una cited entity (articolo citato) e fornisce il dettaglio sulla carat- terizzazione dell’atto citazionale (citation characterization). Da sottolineare il fatto che ci possano essere pi`u citation acts con citing entity un articolo ”X” e cited entity un articolo ”Y”, ma al livello Expression dell’articolo ”X” ci sar`a una sola property cites con value l’Expression dell’articolo ”Y”. La Figura 2.7 presenta un esempio di In Text Reference Pointer il quale identi- fica la posizione, nel testo di un articolo, nella quale `e presente un puntatore ad un elemento della bibliografia; la property has context ha come valore una sentence (Figura 2.8 che permette di accedere al contenuto testuale (has content ) presso il quale viene effettuata la citazione.

Figura 2.4: esempio Expression

Figura 2.6: esempio Citation Act

Figura 2.7: esempio In Text Reference Pointer

2.3.4

Necessit`a di servizi e interfacce user-friendly per

Documenti correlati