• Non ci sono risultati.

EGEE Industry Day on Challenges in Bio-Informatics

N/A
N/A
Protected

Academic year: 2021

Condividi "EGEE Industry Day on Challenges in Bio-Informatics"

Copied!
3
0
0

Testo completo

(1)

M.MARCHISIO SUPERCALCOLO 48-50

48 BOLLETTINO DEL CILEA N.105FEBBRAIO 2007

EGEE Industry Day on Challenges in

Bio-Informatics

Mario Marchisio

CILEA, Segrate

Abstract

La quinta edizione dell’ “EGEE Industry Day on Challenges in Bio-Informatics” (Espoo, nov. 2006) ha permesso di fare il punto della situazione sui recenti risultati ottenuti, in campo bioinformatico, utilizzando i middleware LCG e gLite, mettendo in luce traguardi raggiunti e problemi ancora da risolvere e indicando occasioni di cooperazione tra centri di ricerca e aziende impegnate nell’information technology.

The fifth edition of the “EGEE Industry Day on Challenges in Bio-Informatics” (Espoo, nov. 2006) has given the opportunity to the EGEE-community members to summarise the results obtained so far in bioinformatics , to discuss about open problems and to find out possible ways of cooperation with private partners.

Keywords: EGEE, Grid, gLite, middleware, bioinformatica.

Il progetto EGEE

Il progetto EGEE (Enablig Grid for e-Science)[1] ha visto la luce nell’aprile del 2004, prendendo le mosse dalle ricerche svolte al CERN di Ginevra nel campo della fisica sub-nucleare. Al fine di ottimizzare l’analisi della miriade di dati prodotti dagli esperimenti di col-lisione tra particelle, è stato sviluppato un nuo-vo middleware, denominato LCG, che trae van-taggio dalla tecnologia del Globus-Toolkit, di produzione americana.

EGEE, che è ora entrato nella sua seconda fase, può vantare trentadue partner sparsi su novantuno nazioni e si propone di promuovere e sviluppare il nuovo middleware gLite, nato dalle ceneri di LCG, sia all’interno della comunità scientifica che nel mondo industriale.

Nel corso del “V EGEE Industry Day” – te-nutosi il 24 novembre 2006 presso i locali del “CSC: the Finnish IT Centre for Science” di E-spoo, alle porte di Helsinki, ed organizzato in collaborazione con Metaware S.P.A. – si è di-scusso sulle possibilità di diffondere gLite nell’ambito di realtà industriali operanti, in par-ticolare, in campo biomedico, in seguito ai nu-merosi progetti afferenti a EGEE che hanno prodotto risultati degni di nota per una delle discipline attualmente di maggior interesse: la bioinformatica.

Fig. 1 – Il logo del progetto EGEE

EGEE e bioinformatica

Storicamente si è incominciato a parlare di bioinformatica circa venti anni fa, quando si è dovuto per la prima volta ricorrere al computer per l’analisi di sequenze amminoacidiche e nu-cleotidiche. Il rapido sviluppo delle capacità di calcolo dei moderni supercomputer, unito al se-quenziamento di diversi genomi e di migliaia di proteine, ha portato allo sviluppo di programmi via via più raffinati per lo studio in silico di pro-cessi biologici come il protein folding o il do-cking molecolare, quest’ultimo alla base di ogni sperimentazione nella progettazione di farmaci.

All'interno di EGEE, il progetto WISDOM [2] ha come obiettivo la scoperta di farmaci efficaci contro malattie come la malaria per cui, pur essendo molto diffuse, non si dispone ancora di una cura efficace. Trainato dai ricercatori

(2)

fran-M.MARCHISIO SUPERCALCOLO 48-50

BOLLETTINO DEL CILEA N.105FEBBRAIO 2007 49

cesi del CNRS e di Healthgrid [3], WISDOM ha permesso di simulare il docking di oltre un mi-lione di componenti su proteine del parassita responsabile dell’infezione malarica, portando alla selezione di cinquemila possibili farmaci, oggi allo studio da parte dei biologi. La strut-tura Grid si è avvalsa di 3200 processori, che hanno erogato, in poche settimane, circa ot-tant’anni di tempo CPU.

Il progetto WISDOM è, inoltre, un esempio emblematico di collaborazione tra università e industria, avendo beneficiato di oltre tremila licenze gratuite fornite dalla ditta BioSolveIT per l’utilizzo del programma FileX[4], più per-formante di Autodock, prodotto open source tra-dizionalmente usato nel settore.

Accanto alla progettazione di farmaci, il Grid è sempre più visto come uno strumento essen-ziale per fronteggiare una vasta gamma di pro-blemi bioinformatici: studio di network biologici nella ricerca sul cancro e sul diabete; tratta-mento di immagini nella diagnostica del tumore alla mammella (è il caso di MAMMOGRID+ [5], che presto passerà al middleware gLite); gene-mapping ed epidemiologia; filogenetica; analisi di molecole di cDNA; allineamento multiplo di sequenze; studio della superficie e delle funzio-nalità di proteine. Molte di queste tematiche sono trattate all’interno del progetto europeo BioinfoGrid [6] al quale partecipa anche il CI-LEA fornendo risorse di calcolo e storage.

Nuovi portali, modelli vecchi

Nonostante i risultati incoraggianti e il pro-gressivo aumento di attenzione nei riguardi del-la materia, all’interno deldel-la comunità bioin-formatica appare ancora troppo netta la separa-zione tra sviluppatori e utenti grid, ovverosia, più in generale, tra informatici e biologi. I mid-dleware finora proposti (fra i quali anche gLite) non possono certo dirsi user-friendly e risultano sostanzialmente incomprensibili ai non addetti ai lavori.

La necessità di rendere il Grid facilmente usufruibile dagli utenti ha imposto, allora, lo sviluppo di semplici servizi web, tramite i quali lanciare job sulla griglia. Il centro di supercal-colo ungherese SZTAKI ha prodotto un’eccel-lente soluzione con lo strumento P-GRADE che, integrato con il pacchetto GEMLCA, permette sia di costruire interfacce grafiche che di riunire job presenti su macchine diverse all’interno di workflow più o meno complessi.

NICE s.r.l. ha, dal canto suo, messo in com-mercio prodotti altrettanto versatili quali Ge-nius (a uso esclusivo del Grid) ed Enginframe

[8], che da diversi mesi viene utilizzato al CILEA per la realizzazione del portale connesso al pro-getto europeo LITBIO [9] e del servizio run your job via web [10].

Altre interessanti soluzioni presentate du-rante il meeting di Espoo sono: PyBioS [11], un programma per lo studio di processi cellulari, messo a punto presso il Max Planck Institute, che dispone di una semplice e completa inter-faccia grafica per l’utente e Medicel Integrator ed Explorer [12], in produzione presso il CSC di Espoo, che permette di trattare in maniera in-tuiva sistemi biologici estremamente complessi, riuscendo a maneggiare dati codificati in ma-niera molto diversa tra loro.

L’assenza di uno schema di valenza generale nella classificazione dei dati è infatti uno dei problemi principali per i bioinformatici, così co-me appare un ostacolo al raggiungico-mento di mi-gliori risultati la tendenza a rifugiarsi troppo nelle risorse di calcolo, tralasciando l’effettiva bontà dell’algoritmo applicato: si sente la man-canza di nuovi modelli fisico-matematici e trop-po spesso si ricorre a teorie vecchie. La stessa dinamica molecolare, infatti, è fondata sulla fisi-ca classifisi-ca quando, a quegli ordini di grandezza, gli effetti quantistici sono tutt’altro che trascu-rabili.

EGEE e industria

Come illustrato in precedenza nel caso del progetto WISDOM, un connubio tra comunità EGEE e industria non può che portare vantaggi ad ambo le parti: i centri di ricerca possono, in-fatti, usufruire di software molto ben struttura-to, sia per le simulazioni di processi biologici che per la realizzazione di interfacce web benefi-ciando, inoltre, dell’assistenza da parte degli stessi sviluppatori dell’azienda produttrice; le imprese, d’altra parte, hanno la possibilità di rendere i loro prodotti visibili in tutto il mondo, una volta installati all’interno della griglia E-GEE-gLite.

La bioinformatica è solo il più recente dei settori che fanno da collegamento tra industria ed EGEE, basti pensare ai progetti EGEODE [13], supportato dalla Compagnie Générale de Geophysique, e OpenPlat, finanziato dall’azienda francese CS-SI, che hanno portato a risultati apprezzabili utilizzando gLite nel campo geofi-sico e delle materie plastiche, rispettivamente.

Appare, quindi, di primaria importanza far conoscere il più possibile alle imprese le poten-zialità di EGEE e sensibilizzare le università e i centri di ricerca sulle problematiche affrontate in campo industriale: opera di interscambio e

(3)

M.MARCHISIO SUPERCALCOLO 48-50

50 BOLLETTINO DEL CILEA N.105FEBBRAIO 2007

comunicazione da tempo intrapresa da EGEE, con l’ausilio di aziende come la già citata Me-taware.

Bibliografia

[1] URL: http://www.eu-egee.org [2] URL: http://wisdom.eu-egee.fr [3] URL: http://www.healthgrid.org [4] URL: http://www.biosolveit.de/FlexX [5] URL: http://www.mammogrid.com [6] URL: http://www.bioinfogrid.eu [7] URL: http://www.lpds.sztaki.hu/pgrade [8] URL: http://www.nice-italy.com [9] URL: http://www.litbio.org

[10] M. Marchisio e P. Ramieri, “Servizi di calcolo via web al CILEA: integrazione nel portale del Supercalcolo e aspetti bioinformatici”, Bollettino del CILEA, n. 103, ottobre 2006.

[11] URL: http://pybios.molgen.mpg.de

[12] URL: http://www.medicel.com

Riferimenti

Documenti correlati

The technically minded might focus on inher- ent characteristics, asking such questions as: “How many columns are there per database table?” or “How many probability calculations

The University contribution is explored through the analysis of scientific publications of University members during the last 20 years. Publication data have been extracted from

Anche in futuro, il Consiglio di fondazione continuerà a impegnarsi sistemati- camente per la Swisscanto Supra Fondazione collettiva e in particolare per gli interessi delle

Ideale per una vasta gamma di materiali...

Le proposte di volontariato della Fondazione Don Gnocchi sono rivolte a persone che, in base alla propria disponibilità e inclinazione, possono essere inserite nelle diverse

EGEE prefers that VOs us- ing the grid infrastructure register with the project; registration allows the project to bet- ter understand the needs of the VO, its appli- cations, and

Job Management This is an area where a great deal of work on interoperability is needed as there are as many Grid interfaces to com- pute resources as batch systems.. A number

The project mainly aims to build up a large grid infrastructure in Sicily, for both research and industrial appliacations, using the grid paradigm.. The PI2S2 project is one of the