1. INTRODUZIONE
2.6 RNA–SEQUENCING
Di recente, lo sviluppo di nuove metodologie di sequenziamento del DNA ha fornito un nuovo strumento per la mappatura e la quantificazione del trascrittoma. Un innovativo metodo, denominato RNA-Sequencing (RNA-Seq) mostra chiari vantaggi rispetto agli approcci esistenti, ed è previsto che rivoluzioni in breve tempo la metodologia di analisi dei trascrittomi degli eucarioti. Questa innovativa metodologia ha la capacità di fornire una “fotografia istantanea” della presenza e della quantità di RNA di una cellula in un determinato istante (Chu & Corey, 2012).
La metodologia RNA-Sequencing (RNA-Seq) utilizza le piattaforme di sequenziamento Next Generation Sequencing (NGS) per quantificare l’abbondanza delle molecole di RNA (trascritti) e quindi per ottenere una misura del livello di espressione dei geni corrispondenti, in un campione biologico. Idealmente, la pipeline di un esperimento RNA-Seq dovrebbe
90
prevedere la sola estrazione dell’RNA dalla cellula di interesse e il suo diretto sequenziamento, senza manipolazioni che possano introdurre artefatti. In realtà, gli esperimenti di RNA-sequencing basati sui sequenziatori di seconda generazione prevedono un protocollo che include diverse fasi di manipolazione. Per prima cosa, l’RNA estratto dalla cellula viene frammentato in sequenze di dimensione inferiore, compresa tra i 200 e i 500 bp, per ottenere frammenti di dimensione compatibile con i sequenziatori in uso. Il processo di frammentazione è realizzato tramite idrolisi o nebulizzazione. Ottenuti i frammenti di RNA, questi vengono retrotrascritti in DNA. La retrotrascrizione (o trascrizione inversa) è il processo di sintesi di un filamento di DNA complementare a partire da un RNA. Nel processo di retrotrascrizione, dopo l’annealing di un primer al filamento di RNA, l’enzima trascrittasi inversa sintetizza un filamento di DNA complementare all’RNA stampo. Terminata la sintesi, si ottiene una molecola ibrida (un filamento di DNA e uno di RNA) di cui viene degradato parzialmente il filamento di RNA. I frammenti rimanenti di RNA servono allora da primer per sintetizzare il secondo filamento, producendo una molecola di DNA a doppio filamento, detta DNA complementare (cDNA). La retrotrascrizione dell’RNA in cDNA è resa necessaria dal fatto che i sequenziatori oggi disponibili sono in grado di sequenziale DNA e non direttamente RNA. Nei protocolli di RNA-seq oggi in uso, la retrotrascrizione viene effettuata dopo la frammentazione e non viceversa poiché in questo modo il bias (l’errore) introdotto è minore e il coverage (recupero) del trascritto risulta più uniforme. Le molecole di cDNA vengono quindi amplificate, aumentando il numero di copie di ciascun frammento, e fornite in input ai sequenziatori. Il sequenziatore ad oggi più utilizzato per applicazioni RNA-‐seq è il Genome Analizer di Illumina. Il sequenziatore "legge" i frammenti in input, identificando l’ordine in cui le
91
basi nucleotidiche si susseguono. Le sequenze lette dai sequenziatori sono dette “read”. Le read NGS sono molto corte e presenti in numero elevato (si parla di milioni di read per singola run dello strumento). In un esperimento RNA-Seq, le read rappresentano i dati grezzi dai quali ricavare l’informazione sul livello di espressione dei geni del campione. Più numerose sono le copie di un trascritto in un campione, più probabilità avrà quel trascritto di essere sequenziato e di generare read. Per quantificare il numero di read riferite a ciascun gene, le read di ogni campione sono mappate su un genoma o un trascrittoma di riferimento. La fase di allineamento delle read sul riferimento presenta un aspetto critico: idealmente si vorrebbe trovare l’unica posizione del genoma in cui il riferimento sia identico alla read. In realtà il riferimento non sarà mai una rappresentazione perfettamente identica del campione biologico, a causa di errori di sequenziamento e/o di imperfetta similarità tra le sequenze del campione d’interesse e quelle del riferimento. Lo scopo dell’allineamento diventa quindi l’identificazione della posizione del genoma in cui ogni read ottiene il miglior match con il riferimento. Una volta determinate le posizioni delle read sul riferimento, è possibile contare il numero di read allineata su un gene (o trascritto o esone). Il totale delle read allineate su un gene è detto appunto “count”e può essere inteso come una misura del livello di espressione del gene stesso (Fig. 18). I count sono i dati finali di un esperimento di RNA-seq per la quantificazione del trascrittoma e sono memorizzati in matrici in cui le righe rappresentano i diversi geni e le colonne i diversi campioni sequenziali.
92
Fig. 18 Rappresentazione grafica di un count. Le read (indicate con le barrette arancioni) vengono allineate
sul gene di riferimeno. Il numero di read mappate è detto count. Nella rappresentazione grafica, il count del gene A è 27, cioè il numero di barrette arancioni associate al gene A.
Per la loro stessa definizione, dal punto di vista statistico i count rappresentano una somma di eventi aleatori indipendenti. Possono quindi essere descritti da una variabile aleatoria che segue una determinata distribuzione statistica.
93
BIBLIOGRAFIA
Abersold R. & Mann M. (2003). Mass spectrometry-based proteomics, Nature, 422, 198-207.
Allen R.C., Savaris C.A. & Maurer H.G. (1984).Gel Electrophoresis and Isoelectric Focusing of Proteins, De Gruyter, Berlin.
Amster J. (1996). Fourier Transform Mass Spectromtry, Journal of Mass Spectrometry, 31, 1325-1337.
Angel T.E., Aryal U.K., Hengel S.M., Baker E.S., Kelly R.T., Robinson E.W. & Smith R.D. (2012). Mass spectrometry-based proteomics: existing capabilities and future directions, Chem. Soc. Rev., 41, 3912-3928.
Capelo J., Carreira R., Diniz M., Fernandes L., Galesio M., Lodeiro C., Santos H.M., & Vale G. (2009). Overview on modern approaches to speed up protein identification workflows relying on enzymatic cleavage and mass spectrometry based techniques, Analytica Chimica Acta, 650, 151-159. 2. Tecniche sperimentali
Chhabra N. Electrophoresis-a brief review, pubblicato il 6 Novembre 2011 su www.namrata.co.
Choe L.H. & Lee K.H. (2000). A comparision of three commercially available isoelectric focusing units for proteome analysis: The multiphor, the IPGphor and the protean IEF cell, Electrophoresis, 21, 993-1000.
Chu Y. & Corey D.R. (2012). RNA sequencing: platform selection, experimental design, and data interpretation, Nucleic Acid Ther., 22, 271-274.
Comisarow M.B. & Marshall A.G. (1974). Frequency-sweep fourier transform ion cyclotron resonance spectroscopy, Chemical Physics Letters, 26, 489-490.
Creaser C.S. & Ratcliffe L. (2006). Atmospheric Pressure Matrix-Assisted Laser Desorption/Ionization Mass Spectrometry: A Review, Current Analytical Chemistry, 2, 9-15.
94
DeHoffmann E., Charette J. & Stroobant V. (2007). Mass Spectrometry principles and applications, John Wiley & Sons, Chichester.
Emmett M.R. & Caprioli R.M. (1994). Micro-electrospray mass spectrometry: Ultra.high-sensitivity analysis of peptides and proteins, J. Am. Soc. Mass Spectrom., 5, 605-613. Erickson B. (2000). Atmospheric pressure MALDI, Anal. Chem., 72, 186A-186A.
Fenn J.B., Mann M., Meng C.K., Wong S.F. & Whitehouse C.M. (1990). Electrospray ionization-principles and practice, Mass Spectrom. Rev., 9, 37-70.
Giometti C. S., Gemmell M.A., Tollaksen S.L. & Taylor J. (1991).Quantitation of human leukocyte proteins after silver staining: a study with two-dimensional electrophoresis, Electrophoresis, 12, 536-543.
Hesse M., Meier H. & Zeeh B. (2010). Metodi spettroscopici in Chimica Organica, II ed.,
Edises, Napoli.
Hustoft H.K., Malerod H., Wilson S.R., Reubsaet L., Lundanes E. & Greibrokk T. (2012). A critical review of Trypsin digestion for LC-MS based proteomics, Integrative proteomics, H.C. Leung, 73-92.
Laiko V.V., Moyer S.C. & Cotter R.J. (2000).Atmospheric Pressure MALDI/Ion Trap Mass Spectrometry, Anal. Chem., 72, 5239-5243.
Lopez-Ferrer D., Canas B., Vazquez J., Lodeiro C., Capelo J., Rial-Otero R. & Moura I. (2006). Sample treatment for protein identification by mass spectrometry based techniques, TrAC Trends in Analytical Chemistry, 25, 996-1005.
Macri J., McGee B., Thomas J.N., Du P., Stevenson T.I., Kilby G. W. & Rapundalo S.T. (2000). Cardiac sarcoplasmic reticulum and sarcolemmal proteins separated by two-dimensional electrophoresis: surfactant effects on membrane solubilization, Electrophoresis, 21, 1685-1693.
Marshall A.G. & Grosshans P.B. (1991). Fourier transform ion cyclotron resonance mass spectrometry: the teenage years, Anal. Chem., 63, 215-229.
Marshall A.G., Hendrickson C.L. & Jackson G.S. (1998). Fourier transform ion cyclotron resonance mass spectrometry: a primer, Mass Spectrom. Rev., 17, 1-35.
95
Molloy M.P. (2000). Two-dimensional electrophoresis of membrane proteins using immobilizer pH gradients, Anal. Biochem., 280, 1-10.
Moyer S.C., & Cotter R.J. (2002). Atmospheric Pressure MALDI, Anal. Chem.,74, 468A-476A.
O'Farrell P.H. (1975). High resolution two-dimensional electrophoresis of proteins, J.
Biol.Chem., 250, 4007-4021.
Rabilloud T. (1990). Mechanisms of protein silver staining in polyacrylamide gels: a 10-year synthesis, Electrophoresis, 11, 785-794.
Rabilloud T. (1999). Solubilization of proteins in 2-D electrophoresis, Methods Mol.
Biol.,112, 9-91.
Rabilloud T., Strub J.M., Luche S., van Dorsselaer A. & Lunardi J. (2001). A comparison between Sypro Ruby and ruthenium II tris (bathophenanthroline disulfonate) as fluorescent stains for protein detection in gels, Proteomics, 1, 699-704.
Rabilloud T., Strub J.M., Luche S., Van Dorsselaer A. & J. Lunardi. (2001).A comparison between Sypro Ruby and ruthenium II tris (bathophenanthroline disulfonate) as fluorescent stains for protein detection in gels, Proteomics, 1, 699-704
Raffaelli A. Che cos’è la spettrometria di massa, traduzione da “What is mass spectrometry, ASMS (American Society for Mass Spectrometry).
Richert S., Luche S., Chevallet M., Van Dorsselaer A., Leize-Wagner E., & Rabilloud T. (2004). About the mechanism of interference of silver staining with peptide mass spectrometry, Proteomics, 4, 909-916.
Righetti P.G. (1990). Recent developments in electrophoretic methods, J. Chromatogr., 516, 3-22.
Russell C.A. & Roberts G.K. (2005). Chemical history: reviews of the recent literature, Royal Society of Chemistry, Cambridge.
Schmidt A., Karas M. & Dulcks T. (2003). Effect of Different Solution Flow Rates on Analyte Ion Signals in Nano- ESI MS, or: When Does ESI Turn into Nano- ESI?, J. Am. Soc. Mass Spectrom., 14, 492-500.
96
Shevchenko A., Wilm M., Vorm O., & Mann M. (1996). Mass spectrometric sequencing of proteins silver-stained polyacrylamide gels, Anal. Chem., 68, 850-858.
Skoog D.A., Holler F.J. & Crouch S.R. (2009). Chimica analitica strumentale, II ed., Edises, Napoli.
Switzar L., Giera M. & Niessen W.M.A. (2013). Protein Digestion: An Overview of the Available Techniques and Recent Developments, J. Proteome Res., 12, 1067-1077.
Tang L. & Kebarle P. (1993). Dependence of Ion Intensity in Electrospray Mass Spectrometry on the Concentration of the Analytes in the Electrosprayed Solution, Anal. Chem., 65, 3654-3668.
Trauger S.A., Siuzdak W.W. & G. Siuzdak (2002). Peptide and protein analysis with mass spectrometry, Spectroscopy, 16, 15-28.
Westermeier R. (2006). Sensitive, Quantitative, and Fast Modifications for Coomassie Blue Staining of Plyacrylamide Gels, Proteomics, 6, 61-64.
Wilm M.S. & Mann M. (1994). Electrospray and Taylor-Cone Theory, Dole’s Beam of Macromolecules at Last?, Int. J. Mass Spectrom. Ion Processes, 136, 167–180. 2. Tecniche sperimentali
Wineland D.J. (1984). Trapped Ions, Laser Cooling, and Better Clocks, Science, 226, 395-400.
Winkler C., Denker K., Wortelkamp S., & Sickmann A. (2007). Silver-and Coomassie-staining protocols: Detection limits and compatibility with ESI MS, Electrophoresis, 28, 2095-2099.
Yamashita M. & Fenn J.B. (1984). “Electrospray Ion Source. Another Variation on the Free-Jet Theme”, J. Chem. Phys., 88, 4451–4459.
Yan J.X., Harry R.A., Spibey C. & Dunn M.J. (2000). Postelectrophoretic staining of proteins separated by two-dimensional gel electrophoresis using SYPRO dyes, Electrophoresis, 21, 3657-3665.
Yan J.X., Wait R. , Berkelman T., Harry R.A., Westbrook J.A., Wheeler C.H. & M.J. Dun. (2000), A modified silver staining protocol for visualization of proteins compatible with
97
matrix-assisted laser desorption/ionization and electrospray ionization-mass spectrometry, Electrophoresis, 21, 3666-3672.
98