Optor - Simulazione di modelli di consistenza per file replicati su sistemi Grid

Nella Griglia il caso d’uso più generale a cui possiamo pensare è quello in cui l’applica- zione utente immette un job per eseguire alcune operazioni su alcuni dati. Questo lavoro deve essere svolto dalla Griglia nel modo più veloce possibile; per far questo, uno dei pun- ti chiave è l’impiego di una buona strategia di replicazione e di accesso ai dati. Più i dati sono “vicini” al job, più velocemente il job eseguirà le sue operazioni. Le fasi di ottimizzazione sono quelle che richiedono una più stretta collaborazione tra i vari workgroups di EU DataGrid, in particolare tra WP1,WP2,WP3, WP5 e WP7.

Optor, cos`ı viene chiamato il Replica Optimisation Service sviluppato dal WP2 Optimi-

sation Group, svolge due importanti compiti nella fase di ottimizzazione:

determina il CE pi`u conveniente, dal punto di vista dell’accesso ai dati, su cui

eseguire un job

localizza le best replicas di ogni lfn che il job usa per svolgere le proprie operazioni.

Due importanti assunti sono stati fatti nella fase di progetto di Optor:

un job, in esecuzione in un preciso CE, ha un unico close SE associato, ovvero un

SE che fornisce performance migliori per quanto riguarda l’accesso ai propri dati

il job in esecuzione non scrive dati sui file, `e ammessa solo la lettura.

Dal punto di vista architetturale Optor si presenta come un modulo interno al Replica Manager (Reptor). Tramite Reptor si possono chiamare delle funzioni di ottimizzazione implementate in Optor. Queste funzioni svolgono le loro attivit`a in tre diversi momenti:

scheduling, pre-execution e run-time. L’ambiente di EU DataGrid `e molto dinamico: con-

dizioni di traffico nella rete, disponibilit`a di siti e di risorse possono variare nel tempo. Per questo, le optimization functions, pur essendo simili, possono restituire risultati differenti proprio in relazione al diverso momento in cui entrano in azione.

5.5.1 Replica Optimization Functions

Vediamo brevemente le funzioni messe a disposizione da Optor. Per informazioni pi`u dettagliate si rimanda a [37].

56 CAPITOLO 5. DATA MANAGEMENT IN EDG WP2

Tabella 5.1: Tabella restituita dalla funzione getAccessCosts()

CE1 CE2 ... CEn

lfn1 _{best pfn1,1} _{best pfn2,1 ... best pfnn,1} lfn2 _{best pfn1,2} _{best pfn2,2 ... best pfnn,2}

... ... ... ... ...

lfnm _{best pfn1,m best pfn2,m ... best pfnn,m}

getAccessCosts(): questa funzione viene chiamata prima che il job vada in esecu-

zione. Dato un vettore di n possibili CE’s su cui svolgere il job e uno di m possibili lfn che il job deve accedere, questa funzione, per ogni CE, calcola i tempi di accesso a tutte le repliche di ogni lfn indicato, e restituisce una matrice del tipo mostrato nella tabella 5.1

in cui ogni casella indica la replica del relativo lfn il cui tempo di accesso è il mi- nimo tra tutte le repliche di quel lfn, per quel particolare CE. Si assume che solo le repliche già esistenti vengano prese in considerazione per il calcolo. I risultati forniti riflettono una situazione, dal punto di vista del carico di rete e delle disponibilità delle repliche, che può essere temporanea e quindi sono soggetti a variazioni.

getBestFile(): questa funzione viene chiamata dal job in esecuzione su un preciso

CE. Dato un vettore di n lfn a cui il job deve accedere, ne viene restituito uno contenente, per ogni lfn, il migliore pfn disponibile. Viene inoltre deciso se alcuni file devono essere replicati verso il close SE o verso qualunque altro SE. Questi risultati sono indipendenti da quelli restituiti dalla funzione precedente, e possono essere diversi, per i motivi gi`a detti.

initFilePrefetch(): la chiamata alla funzione precedente pu`o innescare alcuni mec-

canismi di replica, e quindi può bloccare l’esecuzione del job per qualche tempo. La funzione che stiamo esaminando è la versione non bloccante della precedente. Questa esegue più o meno le stesse funzioni, ma registra il suo stato ed i suoi risultati in un catalogo di meta-dati, che verranno in seguito reperiti ed utilizzati dal job. In pratica questa funzione può essere chiamata dopo che il job sia stato schedulato, ma prima che esso vada in esecuzione (pre-execution time), per avvan- taggiarsi nel fare alcune operazioni di replica. Dati di ingresso e di uscita sono i medesimi della funzione precedente. Associata a questa funzione c’é ne è un’altra,

cancelFilePrefetch(), che si occupa di cancellare e ripulire lo stato di una chiamata

5.5. OPTOR 57 Altre funzioni come getSECosts() e getNetworkCosts() vengono usate internamente a Optor, ma sono oggetto di lavoro di altri workgroups, rispettivamente WP5 e WP7. In [37] si possono inoltre trovare alcuni esempi che possono chiarire il procedere del mec- canismo di ottimizzazione, attraverso alcuni sequence diagram che coinvolgono Reptor, il Resource Broker ed altri attori.

Capitolo 6

Simulazioni di strategie di replicazione

dinamica con OptorSim

In questo capitolo vedremo come è possibile simulare il funzionamento di una Griglia. Più precisamente cercheremo di capire come eseguire una simulazione per studiare gli algoritmi di replicazione dinamica e come questi possono essere valutati e confrontati proprio in base ai risultati forniti dalla simulazione. Nel prossimo capitolo invece vedremo le funzionalità aggiunte al simulatore per rendere possibile lo studio degli algoritmi di consistenza.

Nel documento Simulazione di modelli di consistenza per file replicati su sistemi Grid (pagine 63-67)