• Non ci sono risultati.

2Elementideilinguaggidiinterrogazione 1Nuoveapplicazionideimodellibasatisugrafi Altrimodellideidatibasatisugrafi–Propertygraph AzzoliniRiccardo2020-05-19

N/A
N/A
Protected

Academic year: 2021

Condividi "2Elementideilinguaggidiinterrogazione 1Nuoveapplicazionideimodellibasatisugrafi Altrimodellideidatibasatisugrafi–Propertygraph AzzoliniRiccardo2020-05-19"

Copied!
3
0
0

Testo completo

(1)

Azzolini Riccardo 2020-05-19

Altri modelli dei dati basati su grafi – Property graph

1 Nuove applicazioni dei modelli basati su grafi

Negli ultimi anni (a partire circa dal 2015), si è avuto un ritorno di interesse riguardo ai modelli dei dati basati su grafi, motivato dall’esigenza di analisi dei dati provenienti, ad esempio, dalle reti sociali.

Ciò ha portato allo sviluppo di DBMS nativi basati su grafi, ciascuno con un proprio linguaggio di interrogazione. Al momento, è in corso un processo di standardizzazione finalizzato a cercare di uniformare tutti questi linguaggi: per ora, quello che sembra prevalere è Cypher, il linguaggio associato al DBMS Neo4j.

Come già detto, i precursori di queste tecnologie sono i modelli e linguaggi per la rappre- sentazione della conoscenza, introdotti intorno agli anni ’70 nell’ambito dell’intelligenza artificiale, e poi ripresi per formare le basi del semantic web (con la definizione di RDF, ecc.).

2 Elementi dei linguaggi di interrogazione

In generale, i linguaggi di interrogazione per i modelli dei dati basati su grafi si fondano su due concetti principali:

• graph pattern (pattern di grafi)

• path expression.

Ad esempio, considerando un ipotetico database bibliografico (contenente autori, articoli, ecc.) rappresentato come grafo,

• un esempio di interrogazione basata su graph pattern sarebbe: “trovare tutte le coppie di autori di articoli pubblicati in conferenze”;

• un esempio di interrogazione basata su path expression sarebbe invece: “trovare i cammini più corti tra due autori”.

1

(2)

3 Tipi di grafi

In RDF, il modello dei dati è un edge-labelled multigraph:

• edge-labelled significa che (anche) gli archi (oltre ai nodi) hanno una label (etichet- ta);

• multigraph significa che sono ammessi più archi tra gli stessi due nodi.

Ad esempio:

Clint Eastwood Unforgiven Anna Levine

acts_in

directs

acts_in

Tale approccio è abbastanza limitato nel caso in cui si vogliono aggiungere nuove infor- mazioni sia ai nodi che agli archi: per fare ciò, bisogna infatti modificare la struttura del grafo. Per questo motivo, può essere conveniente associare alle label (dei nodi e degli ar- chi) degli insiemi di coppie chiave–valore, ottenendo così un modello chiamato property graph.

Più in dettaglio, in un property graph ogni nodo e ogni arco è etichettato con un identi- ficativo univoco, che associa al nodo / arco stesso un insieme di coppie proprietà–valore (in questo ambito, si usa prevalentemente il termine “proprietà”, piuttosto che “chiave”) chiamate attributi.

Quindi, attraverso l’aggiunta / modifica degli attributi dei nodi e degli archi, è possibile annotare il grafo senza doverne modificare la struttura.

Ad esempio, le informazioni rappresentate nel grafo mostrato sopra potrebbero essere riportate nel seguente property graph (nel quale sono annotate anche alcune informazioni aggiuntive):

n1: Person name: Clint Eastwood

n2: Movie title: Unforgiven

n3: Person name: Anna Levine e1: acts_in

role: Bill source: IMDb

e2: directs

e3: acts_in role: Delilah source: IMDb

Osservazione: In questo grafo:

2

(3)

• ogni nodo e ogni arco ha una singola label;

• ogni proprietà ha un singolo valore.

Rimuovendo parzialmente o completamente questi vincoli, si ottiene un modello dei dati ancora più generale, talvolta indicato con il termine knowledge graph (ma, in realtà, tale termine non ha una definizione formale, e viene usato per riferirsi a diversi tipi di grafi).

3

Riferimenti

Documenti correlati

almeno dieci giorni prima della data dell'udienza. Entro lo stesso termine è notificata la citazione del responsabile civile e della persona civilmente

Perciò, quando possibile, conviene usare approssimazioni migliori, come ad esempio quella data dal teorema del limite centrale.. 4 Legge dei

Il complemento di termine indica la persona, l'animale o la cosa verso cui va a terminare indirettamante l'azione espressa

L’iniziativa derivava dalla necessità di acquisire il servizio in parola nelle more del completamento della gara europea di FM avviata dalla Direzione Centrale Acquisti e

Questa evoluzione da un lato permette una maggior libertà di composizione delle fonti, ma dall’altro impone alle start-up la stessa attenzione nella scelta che viene richiesta

A febbraio 2020 gli occupati a termine erano 256.000: si tratta di un valore inferiore a quello del corrispondente mese del 2019 perché, come sappiamo, nel corso del 2019 sono

Si ritiene che l’Apatosauro mangiasse principalmente piante basse ma, se il suo collo fosse stato davvero flessibile, potrebbe aver mangiato anche le foglie tenere in cima

sindrome post Covid-19 pazienti con sintomi per più di 12 settima- ne dopo l’inizio dei sintomi acuti.. Il documento suggerisce di indagare all’interno del rapporto medico-pa-