Università degli Studi di Bologna Bologna, 12/12/2002 Corso di Laurea In Informatica. Alessandro Valenti. Sessione II

Testo completo

(1)

Alessandro Valenti

(2)

SOMMARIO:

Scenario

Data Integration

Il Servizio “AnaWeb”

Web Services “ASP.NET”

ADO.NET

(3)
(4)

Obiettivi:

• Integrazione delle anagrafiche “orizzontali” e

“verticali” per ottenere una “VISTA GLOBALE”

completa e aggiornata

• Ricerca Assistito ed Identificazione Ulteriori problematiche:

• Le basi anagrafiche “verticali” differiscono tra loro sia a livello di logico (dove vengono memorizzati i dati) che a livello fisico (i tipi di dati utilizzati per memorizzare i dati) Soluzioni:

• Schema Integration

• Data Integration

(5)

Un Multidatabase è una collezione di database autonomi, i quali partecipano ad una federazione globale ed sono in grado di scambiarsi informazioni. Per creare ed utilizzare questo tipo di sistema è fondamentale determinare ed integrare i dati da ogni database dentro un’unica “vista globale coerente”; il processo di creazione di questa vista globale si chiama Schema Integration.

Fattori di diversità tra schemi:

Equivalenza tra strutture e modelli

Specifiche di progettazione incompatibili

Conflitti strutturali:

Conflitti di tipo

Conflitti di dipendenze Conflitti di chiavi

Conflitti di comportamento

• Tecniche AI

• Semantica Lessicale

• Basati sul Modello

• Utilizzando modelli Object-Oriented

• Integrazione a livello Applicativo

Alta Automazione Algoritmi Euristici

Bassa Automazione

Metodi di Integrazione

(6)

1. Pre-Integrazione

2. Confronto di Schemi

3. Uniformazione di Schemi 4. Unione e Ristrutturazione Metodo basato sul Modello:

Nel 1986 venne definito il primo algoritmo per eseguire l’integrazione degli schemi, il quale consiste in quattro passaggi:

VISTA GLOBALE

DATA INTEGRATION:

Il processo di combinazione dati a

livello entità, il principale problema consiste nell’identificare la stessa entità presente in

diversi database rappresentati da chiavi diverse, alcuni metodi comuni sono:

Virtual

• Equivalenza di Chiavi

• Equivalenza specificata dall’utente

• Chiave Probabilistica

• Attributi Probabilistici

(7)

Un ipergrafo di basso livello (HDM) ed un set di primitive trasformazioni di schemi

definite per questo modello

• Combina i vantaggi di BAV e LAV escludendone i

difetti Ogni elemento della vista

globale viene espresso come vista sulle sorgenti

• Bassa Riutilizzabilità

• Processo Query Design Semplice

Ogni elemento nelle

sorgenti viene espresso come vista sulla vista globale

• Alta Modularità e Riutilizzabilità

• Processo di Query Design Complesso

Both as View (BAV) Global as View (GAV)

Local as View (LAV)

Approcci all’Integrazione Dati

(8)

E’ un servizio di Data Integration orientato all’integrazione di anagrafiche ed alla ricerca di un assistito. Il progetto è stato implementato utilizzando una architettura di tipo 3 Tier.

In particolare implementa i seguenti modelli:

• Integrazione di Schemi Metodo basato sul Modello

• Integrazione di Dati Modello Global as View (GAV)

• Tipo Integrazione Materialized

(9)

Configurazione e Ricerca Assistito

La configurazione del servizio avviene tramite un file XML con la seguente struttura mantenendo come riferimento il modello GAV. In particolare il file consiste in tre tag fondamentali:

• Definizione della Stringa di Connessione ADO.NET

• Definizione delle Tabelle e degli Schemi partecipanti alla Federazione

• DEFINIZIONE DELLA VISTA GLOBALE Ricerche:

• Semplice, ogni parametro rappresenta una clausola che verrà inserita nella query

elaborata dal WRAPPER

• Avanzata, non viene specificata nessuna clausola e tramite un algoritmo vengono generate quattro query; i risultati vengono rielaborati e ordinati secondo assonanza.

(10)

La sincronizzazione avviene mediante una ricerca sul database “verticale”, la risposta viene espressa sulla vista globale ed il servizio provvede ad

aggiornare il database locale. Utilizzando questo meccanismo mi ha permesso di implementare due tipi di sincronizzazioni:

• “On Demand”, quando viene fatta una ricerca sul database Master

• “Schedulata”, quando la ricerca sul database Master viene effettuata secondo criteri prestabiliti ad intervalli prestabiliti

“Health Level 7” è uno standard per lo scambio di dati elettronici in ambiente sanitario. Il termine “Level 7” deriva dal livello ISO/OSI a cui appartiene.

HL7, come un’organizzazione e ad oggi conta approssimativamente 1600 membri e il “Working Group” si riunisce approssimativamente ogni tre o quattro mesi dal 1987.

(11)

Vantaggi nell’utilizzo dei Web Services:

Client Multipiattaforma No Problemi con Firewall

Bassa Complessità del Protocollo

Vantaggi nell’utilizzo del nuovo .NET Framework:

Visual Studio .NET

Sicurezza di Windows (IIS)

Chiaro ed Efficiente sistema di Accesso ai Dati ADO.NET Svantaggi:

Multipiattaforma Parziale (MONO?)

Sicurezza sul Canale

(12)

1. Un Web Service scritto in C# che effettua l’integrazione 2. Un Client ASP.NET che interroga il servizio

3. Un Servizio Windows che aggiorna a tempi stabiliti 4. Un Client Win32 che interroga il servizio

5. Due Client utilizzati per il Debug

• Prestazioni

• Sovraccarico Rete (Overhead DataSet)

figura

Updating...

Riferimenti

Updating...

Argomenti correlati :