CASPUR 2011
108L
A FACILITY “TELETHON”: UN PASSO IN AVANTI
PER DIAGNOSI SEMPRE PIÙ RAPIDE ED ACCURATE
La nascita delle nuove piattaforme di sequenziamento del DNA, note come Next Generation Sequencing (NGS), ha rappresentato un punto di svolta nella ricerca biomedica: grazie a queste nuove piattaforme, i ri-cercatori hanno oggi l’opportunità di studiare, con metodi high-throughput, un vasto insieme di sistemi bio-logici. La quantità di dati prodotti da ogni esperimento NGS è tale da richiedere un ambiente di analisi appositamente progettato e pipeline dedicate.L’impiego della tecnologia NGS consente, per esempio, di elaborare, in tempi rapidi e con costi contenuti, informazioni sulle interazioni DNA-proteina. I ricercatori possono individuare mutazioni e fattori di regola-zione correlati a specifiche malattie, offrendo al paziente una diagnosi accurata ed una terapia mirata, anche mediante la progettazione di farmaci personalizzati.
Offerta
Per rispondere alle esigenze della Facility di calcolo NGS, all’interno del Consorzio è stata progettata e rea-lizzata un’infrastruttura hardware che permette l’ese-cuzione ad alte prestazioni delle pipeline implementate. Le principali entità coinvolte nel processo di analisi e vi-sualizzazione dei dati sono tre: il cluster di calcolo per l’esecuzione delle pipeline, un sistema di database ed un server WEB per la visualizzazione dei risultati.
Queste entità sono strettamente integrate tra loro tramite un’interazione tra il cluster di calcolo ed il si-stema di database attraverso una connessione infini-band e grazie ad un’area di storage comune.
I tempi di analisi vengono ridotti dalla
manipola-zione diretta dei dati contenuti nei database ad alte prestazioni. L’area di storage comune consente la visualiz-zazione dei risultati senza richiedere un massiccio trasferimento dei dati.
Collaborazioni
La piattaforma NGS è finanziata con fondi TELETHON – nell’ambito di un progetto coordinato dal Professor Graziano Pesole, dell’Università di Bari e del Consiglio Nazionale delle Ricerche – ed è offerta a tutti i ricercatori della comunità biomedica.
Con il CNR e le Università di Bari e di Milano il CASPUR lavora allo sviluppo di applicazioni web e di database per l’analisi dei dati di ChIP-Seq, trascrittomica e RNA editing.
Chip-Seq: Il CASPUR collabora con l’Istituto Nazionale dei Tumori del Regina Elena di Roma su diversi progetti di ricerca basati sull’analisi di dati di sequenziamento ottenuti dalla piattaforma Illumina.
Trascrittomica: I dati di predizione contenuti in ASPicDB sono stati utilizzati per costruire una banca dati di rife-rimento utilizzata nel corso della pipeline di analisi dei trascrittomi. La mappatura delle short reads di RNAseq sulle informazioni contenute in ASPicDB consente di classificare il trascrittoma analizzato in funzione delle pos-sibili varianti di splicing.
HPC
ANNU
AL REPOR
T
109 Gruppo di Chimica Computazionale e Bioinformatica Tiziana Castrignanò [email protected] Mattia D’Antonio [email protected] Paolo D’Onorio [email protected] Nico Sanna [email protected]Risultati
L’infrastruttura ad alte prestazioni implementata presso il CASPUR permette l’esecuzione di pipeline ottimizzate per rispondere alle diverse esigenze della comunità scientifica quali ad esempio: il risequenziamento genomico, il sequenziamento genomico de novo, l’identi-ficazione delle interazioni DNA-proteine e RNA-proteine, l’analisi del trascrittoma, l’identifi-cazione e quantifil’identifi-cazione di miRNA e altri ncRNA, l’analisi epigenetica, l’identifil’identifi-cazione di SNPs e l’analisi metagenomica.
Bibliografia essenziale
Horner, D.S., Pavesi, G., Castrignanò, T., D’Onorio De Meo, P., Liuni, S., Sammeth, M., Picardi E., Pesole G. (2009). Bioinformatics approaches for genomics and post genomics applications of next-gen-eration sequencing. Brief Bioinform. October 27.
Castrignano, T., D’Antonio, M., Anselmo, A., Carrabino, D., D’Onorio De Meo, A., D’Erchia, A.M., Licciulli, F., Mangiulli, M., Mignone, F., Pavesi, G., Picardi, E., Riva, A., Rizzi, R., Bonizzoni, P., Pesole, G. (2008). ASPicDB: a database resource for alternative splicing analysis. Bioinformatics. May 15; 24(10), 1300-1304. Epub April 3.
Picardi, E., D’Antonio, M., Carrabino, D., Castrignanò, T., Pesole, G. (2011). ExpEdit: a web server to ex-plore human RNA editing in RNA-Seq experiments. Accepted on Bioinformatics.
RNA-editing: ExpEdit è una pipeline di analisi di eventi di RNA editing, un fenomeno mole-colare post-trascrizionale operato tramite modifiche selettive della sequenza dei trascritti pri-mari e responsabile di un incremento della diversità proteica. Le recenti tecnologie di sequenziamento massivo permettono di analizzare ad ampio spettro il fenomeno dell’RNA editing studiando interi trascrittomi.
Fig. 2Ambiente computazionale per l’analisi dei dati NGS. Raw and shortreads data
CASPUR Matrix & Jazz clusters