110
E
PIGENOMICA: IL SECONDO ORDINE
DI CODICE DELLA VITA
Il completamento del progetto genoma umano ha dato un impulso fondamentale verso la comprensione dei processi biologici che regolano la vita e le basi molecolari di molte patologie. Tuttavia la recente scoperta che gli elementi portanti dell’informazione genetica comprendono, oltre al DNA, numerosi altri componenti strutturali dei cromosomi ha condotto alla cosidetta “rivoluzione epigenetica”. Esiste, accanto al DNA, un secondo ordine di codice della vita che va sotto il nome di “codice epigenetico”, termine con cui si indica l’insieme delle possibili modifiche degli istoni1e dei fenomeni di metilazione del DNA2. In altre parole, tale codice può specificamente
alterare le modalità di espressione dei geni, modificando le istruzioni del codice genetico. Esso risulta essere alla base della diversità tra gli organismi di una stessa specie che, pur essendo definiti da uno stesso genoma, pre-sentano profili fenotipici ben distinti. Le alterazioni del programma epigenetico risultano essere direttamente im-plicate in numerose patologie come diabete, malattie degenerative neuromuscolari, infezioni virali e cancro [1], nonché nei meccanismi di regolazione dei ritmi circadiani e di adattamento all’ambiente. Contrariamente a quanto avviene per il DNA, tutte le modificazioni dell’epigenoma sono reversibili e regolate da funzioni enzimatiche e quindi bersagli potenziali di nuovi farmaci.
Offerta
Il Progetto Bandiera “Epigen” del Consiglio Nazionale delle Ricerche (CNR) si prefigge di comprendere quali siano le basi epigenetiche che regolano la vita, lo sviluppo e le patologie degli organismi sia animali che vegetali. I dati ne-cessari per lo studio dei fenomeni epigenetici attraverso tecnologie omiche sono costosi e di elevata complessità, motivo per cui è stato necessario creare una rete di centri bioinformatici e di servizi di analisi che fanno capo per l’in-frastruttura IT al CASPUR. È già in fase di sviluppo un portale a cui potranno accedere tutti i gruppi nazionali del progetto. L’obiettivo del Consorzio è la realizzazione di un’infrastruttura bioinformatica a servizio delle attività del progetto e lo sviluppo di una core facility computazionale per l’analisi bioinformatica dei dati high-throughput [2].
Collaborazioni
Il progetto “Epigen” del CNR vede coinvolto, su scala nazionale, un grande numero di partner per far fronte alla complessità del problema biologico. Il progetto è stato suddiviso in diversi sottoprogetti focalizzati su specifiche tematiche e distribuiti tra i molti partner coinvolti. Numerose sono le università aderenti (Università di Roma la Sapienza, Ferrara, Firenze, Milano, Modena e Reggio Emilia, Napoli, Padova, Pavia, Siena, Torino, Udine e
l’Uni-Fig. 1 Modello implementativo per l’ac-cesso alle risorse di calcolo.
ANNU
AL REPOR
T
111 Gruppo HPC Chimica Computazionale e Bioinformatica Tiziana Castrignanò [email protected] Mattia D’Antonio [email protected] Paolo D’Onorio De Meo [email protected]Daniele Paoletti [email protected] Nico Sanna [email protected]
Fig. 2 Portale del Progetto Bandiera CNR Epigen.
Bibliografia essenziale
[1] Baylin, S.B., Jones, P.A. (2011). A decade of exploring the cancer epigenome – biological and tran-slational implications. Nat Rev Cancer 11(10), 726-34.
[2] Harris, A., Wang, T., Coarfa, C., et al. (2010). Comparison of sequencing-based methods to profile DNA methylation and identification of monoallelic epigenetic modifications. Nat Biotechnol. 28(10), 1097–1105.
versità Vita-Salute San Raffaele di Milano) e gli istituti di ricerca partecipanti (la Fondazione Telethon, l’Istituto Telethon Dulbecco, il Consiglio per la Ricerca e la Sperimentazione in Agri-coltura di Roma, l’Istituto di Genomica Applicata di Udine, l’Istituto Europeo di Oncologia di Milano, la Fondazione Centro San Raffaele del Monte Tabor di Milano, la Fondazione Istituto Nazionale di Genetica Molecolare-INGM, la Fondazione Santa Lucia di Roma).
Risultati
Il CASPUR fornisce la maggior parte delle applicazioni attuali ed emergenti per l’analisi dei dati provenienti dalle piattaforme di sequenziamento di nuova generazione (NGS), quali strumenti software bioinformatici e database per l’epigenomica. L’esperienza accumulata nell’ottimizzazione delle pipelines per analisi di tipo ChiPseq, RNAseq, exome sequencing e re-sequencing, permet-terà ai ricercatori di rispondere prontamente alle esigenze di studio del progetto.
Come accennato, per lo stesso progetto, è in corso lo sviluppo di un portale che consentirà di coordinare gli sforzi congiunti dei numerosi partner. Inoltre, per far fronte alle ingenti ri-chieste di calcolo e storage provenienti dai gruppi sperimentali, sarà necessario sia risolvere problematiche di immagazzinamento dei dati derivanti dalle attività specifiche di bioinfor-matica che sviluppare software ad alte prestazioni per l’analisi dei dati NGS. Sarà quindi importante l’integrazione, l’automazione e l’ottimizzazione delle procedure e delle pipelines di analsi con l’infrastruttura hardware e software del CASPUR.
Note
1 Gli istoni sono proteine il cui ruolo è quello di organizzare il DNA, compattandolo, affinché possa
essere conservato nel nucleo della cellula. Essi inoltre modificano l’accessibilità del DNA e quindi la possibilità che venga trascritto. Le modifiche degli istoni determinano una maggiore o minore accessibilità di un gene e ne regolano quindi la sua espressione.
2 Con l’espressione “metilazione del DNA” si intende l’aggiunta di un gruppo metile (-CH3) a una