UNIVERSITA’ DEGLI STUDI DI PISA
FACOLTA’ DI AGRARIA
Corso di Laurea in Scienze e Tecnologie Agrarie
Tesi di laurea:
Sequenze ripetute nel genoma di girasole:
trasposoni e LINE (Long Interspersed Elements)
Relatore: Prof. Andrea Cavallini
Correlatore: Dott.ssa Laura Pistelli
Candidato: Andrea Donati
Indice
Riassunto...pag. 5 Introduzione...pag. 6
1. La struttura del genoma eucariotico...pag. 6 1.1. Gli elementi trasponib...pag. 5 1.1.1. La classificazione degli elementi trasponibili...pag. 8 1.1.2. Gli elementi di classe I...pag. 9 1.1.3. Elementi di classe II: i trasposoni a DNA...pag. 14
2. La regolazione della trasposizione...pag. 18 2.1 La metilazione del DNA...pag. 18 2.2 L’RNA interference...pag. 18 2.3 Attivazionedella trascrizione dovuta a stress biotici e abiotici...pag. 20 2.4 Regolazione self ed il modello a “bambole russe”...pag. 20
3. Il girasole come sistema modello per lo studio della composizione del genoma...pag. 22
3.1. Le Asteraceae...pag. 23 3.2. Il girasole...pag. 24 3.3. Il frutto...pag. 25 3.4. Origine del girasole...pag. 26 3.5. La libreria di DNA...pag. 27
Scopo della tesi...pag. 28
Materiali e metodi...pag. 29
5.1. Il materiale vegetale...pag. 29 5.2. Analisi di sequenze...pag. 29 5.3. Analisi del DNA genomico...pag. 30 5.3.1. Isolamento del DNA genomico...pag. 30 5.3.2. Purificazione del DNA con RNAsi...pag. 31 5.3.3. Quantizzazione del DNA estratto...pag. 32
5.3.4. Amplificazione mediante PCR delle sequenze ripetute da
analizzare...pag. 34 5.5. Slot Blot...pag 36 5.5.1. Trasferimento del DNA su membrana...pag. 36 5.5.2. Ibridazione con sonde marcate...pag. 37 5.5.3. Lavaggi delle membrane...pag. 37 5.5.4. Rivelazione del segnale di ibridazione (Detection)...pag. 38 5.6. Analisi dell’RNA...pag. 40 5.6.1. Isolamento di RNA dai tessuti...pag. 40 5.6.2. Rimozione del DNA...pag. 41 5.7. Valutazione dell’espressione mediante RT-PCR...pag. 42 5.7.1. Retrotrascrizione dell’RNA...pag. 42 5.7.2. Amplificazione del cDNA...pag. 43
Risultati e discussione...pag. 45 6.1. Analisi delle sequenze...pag. 45 6.2. Il trasposone HAG003H10...pag. 46 6.3. Il trasposone HAG003I05...pag. 52 6.4. Il LINE HAG004M10...pag. 57 6.5. Numero di copie delle sequenze studiate nel genoma di girasole e di altre
specie del genere Helianthus...pag. 61 6.6. Espressione delle sequenze studiate...pag. 63
Conclusioni...pag. 67 Bibliografia...pag. 69 Ringraziamenti...pag. 84
Portami tu la pianta che conduce dove sorgono bionde trasparenze e vapora la vita quale essenza; portami il girasole impazzito di luce.
Riassunto
La conoscenza della composizione della componente ripetitiva del genoma ha una duplice importanza sia dal punto di vista teorico che applicativo, per migliorare le strategie nella mappatura del genoma e al fine di scoprire nuovi markers molecolari. Inoltre, una conoscenza accurata del genoma è indispensabile per iniziare un processo di sequenziamento rivolto sia alle ESTs (Expressed Sequence Tags) che alle regioni genomiche.
Presso la Sezione di Genetica del Dipartimento di Biologia delle Piante Agrarie da molti anni si studia la composizione del genoma delle piante, con particolare riferimento al girasole.
Questa tesi di laurea si inquadra in questa linea di ricerca, prendendo in esame alcune famiglie di DNA ripetitivo che di solito nelle piante sono poco rappresentate e che risultano quindi poco studiate; in particolar modo mi sono soffermato su due tipologie di elementi trasponibili: i trasposoni e i LINEs.
I trasposoni sono elementi trasponibili di classe II e si spostano nel genoma attraverso un intermedio a DNA secondo un modello conservativo “cut & paste” (“taglia e incolla”) grazie all’attività dell’enzima trasposasi da essi codificato, che riconosce univocamente brevi sequenze TIR (Terminal Inverted Repeats).
I cosiddetti LINEs (Long INterspersed Elements), invece, sono elementi di classe I, che si spostano mediante retrotrascrizione di un intermedio di RNA utilizzando enzimi codificati dall’elemento; sono ritenuti il più antico gruppo di retrotrasposoni.
Nel corso della tesi sono state identificate, analizzando una library di piccoli inserti di DNA genomico di girasole, tre sequenze, corrispondenti a due trasposoni e ad un LINE. Queste sequenze sono state analizzate in riferimento a sequenze similari di altre specie vegetali ed è stato valutato il numero di copie in girasole ed in altre specie del genere Helianthus. É stata studiata, infine, l’espressione di queste sequenze mediante RT-PCR: sia i trasposoni che il LINE sono risultate espresse costitutivamente, sia in tessuti adulti (foglie) che in tessuti embrionali.
INTRODUZIONE
1. LA STRUTTURA DEL GENOMA EUCARIOTICO
Ogni organismo vivente possiede un genoma contenente le informazioni biologiche necessarie alla costruzione ed al mantenimento dell’organismo stesso. Il genoma rappresenta l’intero contenuto di DNA della cellula che, nelle piante, oltre al DNA nucleare e mitocondriale, comprende anche quello dei cloroplasti.
Tutti i genomi eucariotici nucleari sono divisi in molecole lineari di DNA detti cromosomi. All’interno di ciascun cromosoma si trovano unità discrete di DNA soggette a trascrizione, dette geni. Bisogna tuttavia notare come in molte specie, soprattutto appartenenti al regno vegetale, la maggior parte del genoma non sia costituito non da DNA genico, ma da DNA apparentemente non codificante e altamente o mediamente ripetuto.
Nonostante le strutture fisiche di base di tutti i genomi nucleari eucariotici siano simili, la dimensione del genoma presenta un alto grado di variabilità. La correlazione tra complessità dell’organismo e dimensioni del genoma non ha un andamento lineare: tale mancanza di una precisa correlazione tra queste due variabili viene definita come ‘paradosso del valore C’ (Thomas 1971) e proprio sequenze non alleliche di DNA ripetitivo strettamente correlate sono responsabili di questo fenomeno.
Studi sulle cinetiche di riassociazione hanno portato alla suddivisione del genoma di un eucariote in tre grandi classi di sequenze:
• DNA in singola copia o in numero molto basso di copie;
• DNA mediamente ripetuto (sequenze ripetute 102-104 volte entro il genoma); • DNA altamente ripetuto (sequenze ripetute 104-106 volte entro il genoma).
A loro volta, le sequenze di DNA ripetuto possono avere due differenti tipi di organizzazione:
- DNA ripetuto in tandem, costituito da blocchi di sequenze che si ripetono una dietro l’altra (Singer 1982) e che generalmente sono localizzate a livello dei telomeri
(Vershinin et al. 1995; Ohmido et al. 1997) od in prossimità del centromero (Thompson et al. 1996).
Il DNA altamente ripetuto in tandem può a sua volta essere diviso in due classi che si differenziano per le dimensioni sia della singola unità ripetuta, sia del blocco formato dalle stesse unità ripetute. Il DNA ripetuto in tandem sembra non essere trascritto e costituisce la maggior parte delle regioni eterocromatiche del genoma. Sono sequenze ripetute in tandem i minisatelliti, unità di 9-100 bp ripetute a formare blocchi lunghi fino ad alcune Kbp, con localizzazione prevalentemente subtelomerica; e i microsatelliti, unità molto piccole di 1-4 bp che spesso costituiscono blocchi inferiori a 150 bp, generalmente distribuiti su tutto il genoma.
- DNA ripetitivo non raggruppato o intersperso: famiglie di DNA costituite da sequenze probabilmente di origine virale integratesi nel genoma ospite (Boeke e Corces 1989; Doolittle et al. 1989; Bennetzen 1993). Tali sequenze sono assai eterogenee nella forma e nella struttura, e comune è soltanto la loro capacità di spostarsi all’interno del genoma. Questi elementi mobili vengono comunemente definiti ‘elementi trasponibili’.
1.1
GLI ELEMENTI TRASPONIBILI
Gli elementi trasponibili sono porzioni di DNA presenti in tutti i genomi, in grado di cambiare la loro posizione all’interno del genoma e/o aumentare il loro numero di copie, indipendentemente dalla moltiplicazione cellulare. Gli elementi trasponibili sono dunque elementi mobili endogeni, con un’ampia varietà strutturale e in grado di muoversi attraverso molteplici meccanismi di trasposizione. Le conseguenze delle modifiche genomiche attuate dai suddetti elementi possono essere notevoli all’interno di una specie, poiché la loro attività (taglio, trasposizione, inserzione, rottura cromosomica, amplificazione, ricombinazione) può seriamente alterare la struttura dei vari geni.
Per tali ragioni, la comprensione del genoma e della sua evoluzione non può prescindere dallo studio degli elementi mobili e dalla regolazione della loro attività.
Dopo essere stati scoperti per la prima volta nel genoma di piante di Zea mays (Mc Clintock 1946), gli elementi trasponibili sono stati individuati nel tempo in tutti gli eucarioti e sono stati oggetto di studio in numerose piante. In alcune piante, infatti, gli elementi trasponibili rappresentano una porzione preponderante del genoma nucleare, con percentuali anche superiori al 50% (es. in molte triticacee come Hordeum è stata riscontrata una percentuale dell’85 %; SanMiguel e Bennetzen 1998). Esistono molte
categorie di elementi trasponibili, tutte presenti nelle piante, e verranno descritte nei prossimi paragrafi.
Gli elementi trasponibili sono stati definiti DNA “egoista” o “parassita” (Orgel e Crick 1980) per la loro capacità di “colonizzare” il genoma, aumentando il loro numero di copie, utilizzando gli strumenti metabolici dell’ospite; gli organismi superiori hanno di contro evoluto dei sistemi di regolazione e controllo (es. metilazione del DNA) che mirano a limitarne l’espansione.
Recentemente il ruolo degli elementi trasponibili è stato notevolmente rivalutato, poiché si ipotizza possano aver contribuito al rimodellamento del genoma e alla formazione di nuovi geni. Oggi si tende anche a definire gli elementi trasponibili come partners “simbiontici” dell’ospite, la cui attività ha conseguenze neutre, favorevoli o dannose nei confronti del genoma ospite; per tali ragioni gli elementi trasponibili sono stati anche definiti i “Dr. Jekyll e Mr. Hyde” del genoma (Kemken e Windhofer 2001).
1.1.1 La classificazione degli elementi trasponibili
Gli elementi trasponibili possono essere autonomi o non autonomi: quelli autonomi possiedono sequenze codificanti per i prodotti necessari alla trasposizione, dette ORF (Open Reading Frames).
Gli elementi trasponibili non autonomi derivano probabilmente da elementi autonomi che a causa di una delezione nei segmenti interni hanno perso l’abilità di trasporsi pur contenendo sequenze cis per la trasposizione. Per svolgere la trasposizione gli elementi non autonomi si avvalgono degli enzimi codificati in trans da elementi autonomi e per tali motivi sono stati anche definiti “parassiti di parassiti” (Sabot et al. 2006). I trasposoni si suddividono in due classi specifiche, a seconda del tipo di intermedio utilizzato nella trasposizione: Classe I e Classe II.
1.1.2. Elementi di classe I
Gli elementi trasponibili appartenenti alla classe I utilizzano un intermedio a RNA durante la trasposizione. L’RNA intermedio processato durante la trasposizione è retrotrascritto in DNA grazie ad una trascrittasi inversa.
I retrotrasposoni
I retrotrasposoni vengono suddivisi in due grandi gruppi a seconda della presenza o meno di lunghe sequenze che fiancheggiano ad entrambe le estremità l’elemento stesso, dette LTR (Long Terminal Repeats). A loro volta, i retrotrasposoni con LTR, a seconda della disposizione genica, si suddividono in due categorie principali, dette Ty1-copia e Ty3-gypsy. L’organizzazione strutturale di questo gruppo di elementi autonomi parte dallo stretto legame con le proprie sequenze ripetute terminali; nel dominio interno, tra le LTR, ci sono i siti primari entro cui avviene la retrotrascrizione: rispettivamente PBS e PPT. Il dominio interno contiene anche delle sequenze codificanti le proteine necessarie per la retrotrascrizione. Di solito, i geni codificanti le proteine Gag ed Env (spesso assente) costituiscono ORF distinti dal gene Pol, altre volte formano un unico ORF.
I domini individuabili nella parte codificante sono: GAG, codificante le proteine del capside; AP, per una aspartico-proteasi; RT-RNaseH, codificante una proteina con duplice funzione di trascrittasi inversa (RT) e di ribonucleasi (RNaseH); IN, per una integrasi.
L’ordine e l’omologia di sequenza della parte codificante definiscono le maggiori classi in cui sono suddivisi i retrotrasposoni (Xiong e Eickbush, 1990). Le principali classi sono, come dicevamo, i gypsy e i copia, i quali differiscono per la posizione del gene dell’integrasi rispetto a quello dell’RT-RNaseH. Inoltre nelle piante, la maggior parte dei gypsy (figura 1) (Vicient et al., 2001a) e dei copia (figura 2) (Laten et al., 2005) contiene un terzo ORF che codifica per un polipeptide forse una reminiscenza retrovirale, che codificherebbe proteine dell’involucro (“envelope”) virale e che potrebbe consentire la trasmissione dell’elemento da cellula a cellula.
Fig. 2 – La struttura del retrotrasposone Ty3-gypsy
Il “ciclo vitale” dei retrotrasposoni
Un retrotransposone integrato nel DNA genomico viene trascritto e l’mRNA processato e tradotto utilizzando gli enzimi e le strutture della cellula ospite. Nel citoplasma i trascritti maturi vengono tradotti generalmente come due “open reading frames” corrispondenti alle proteine Gag e Pol.
Per quanto riguarda gli elementi non autonomi, essi sono parzialmente o completamente privi diORF quindi non sono in grado di replicarsi autonomamente, ma, se trascritti, possono utilizzare proteine Gag e Pol eterologhe, cioè prodotte da altri elementi. La retrotrascrizione richiede il riconoscimento da parte di una trascrittasi inversa (omologa od eterologa) che, utilizzando inneschi omologhi al PBS e al PPT, retro trascrive l’RNA a cDNA a doppio filamento. Il successivo inserimento dell’elemento nel nucleo e poi nel genoma avviene grazie a un’integrasi, che riconosce le LTR dell’elemento.
I LINEs
Altri retrotrasposoni sono i cosiddetti LINEs (Long INterspersed Elements), privi di LTR. Sono ritenuti il più antico gruppo di retrotrasposoni; nei mammiferi sono molto diffusi (nel genoma umano, per esempio, si arriva a 850.000 LINEs, che costituiscono ben il 21% dell’intero genoma). I retrotrasposoni con LTR si sarebbero originati dopo, in seguito all’acquisizione delle LTR da parte dell’elemento ancestrale. Essendo privi di LTR, i LINEs hanno un meccanismo di replicazione leggermente differente.
I LINEs (figura 4) sono tipicamente composti da due ORF, ORF1 e ORF2, entrambi codificanti le proteine indispensabili per il meccanismo di retrotrasposizione (Feng et al., 1996; Moran et al., 1996). La proteina ORF1 ha la caratteristica di legarsi agli acidi nucleici e si lega specificatamente al suo stesso RNA (Hohjoh and Singer, 1996; Kolosha and Martin, 1997) inoltre, la ORF1 può formare con altre copie di sé stessa una struttura multipla (Hohjoh e Singer, 1996; Martin et al., 2003). Questa caratteristica è simile a quella delle proteine dei geni gag dei retrovirus, il che suggerisce che l’ORF1 formi un intermedio ribonucleoproteico (RNP) con l’RNA del LINE.
Fig. 4 – La struttura di un LINE
Per quanto riguarda il meccanismo di trasposizione, i LINEs utilizzano lo stesso sistema di tutti i retrotrasposoni, del tipo “copy and paste” (copia e incolla), in cui l’ RNA trascritto dell’ elemento viene retrotrascritto ed integrato in un altro sito del genoma. In questo sistema agisce la proteina ORF2, che consta di un dominio per un’ endonucleasi (EN) e di un dominio per la retrotrascrittasi (RT). Anche la proteina ORF1 potrebbe avere un ruolo nella trasposizione, ma questa funzione è ancora oggetto di studio e di dibattito.
Durante la retrotrasposizione, le proteine codificate sono trasferite sull’mRNA maturo del LINE e formano con questo il complesso intermedio ribonucleoproteico. Il complesso RNP si muove fino a un sito bersaglio su un cromosoma dell’ospite; a questo punto si attiva l’ endonucleasi che taglia il DNA dell’ospite.
Adesso la RT può agire retrotrascrivendo l’mRNA del LINE in DNA; il primer utilizzato corrisponde alla sequenza in 3′ generata dal taglio (Luan et al., 1993; Cost et al., 2002). Questa reazione è chiamata “target-primed-reverse transcription” (TPRT). L’RNAsi elimina lo stampo di mRNA.
Dopo la TPRT, la sequenza di DNA neoformata viene integrata nel genoma dell’ospite; il meccanismo d’integrazione non è ancora stato definito con precisione, ma dovrebbe intervenire l’integrasi prodotta dal LINE.
I LINE sono classificati in più di 10 famiglie (detti “clade”) basandosi sull’analisi filogenetica dei domini RT dei LINE (Malik et al., 1999).
I LINE possono essere inoltre suddivisi in due gruppi, quelli cosiddetti “severi” e quelli “rilassati”. La differenza sta nel riconoscimento da parte del complesso enzimatico del LINE della coda in 3′ (Okada et al., 1997). Il complesso enzimatico del tipo “severo” riconosce solo e soltanto la propria estremità di mRNA in 3’.
Nel tipo “rilassato”, invece, durante la retro trasposizione, il complesso enzimatico è aspecifico, può legarsi anche ad elementi eterologhi (Moran et al., 1996; Kajikawa and Okada, 2002). Dati sperimentali sul baco da seta (Osanai et al., 2004; Luan ed Eickbush, 1995) indicano che molte famiglie di LINE sono del tipo “severo”. Nell’uomo, l’unico esempio noto di tipo “rilassato” è la famiglia L1 (Moran et al., 1996).
I SINEs
I SINEs (Short INterspersed Elements) sono piccoli retrotrasposoni che non esprimono alcuna funzione di trasposizione attiva. Sono caratterizzati da un promotore per la polimerasi III al 5' e la coda al 3' (figura 5) mostra una significativa omologia con quella dei LINEs presenti nello stesso genoma (Feschotte et al, 2002). Tutti i SINEs noti derivano dai prodotti dell’RNA polimerasi III che sembrano aver evoluto la capacità di replicarsi ed essere integrati per mezzo delle proteine espresse dai LINEs. A questo proposito i SINEs sono simili agli pseudogeni, le molecole di mRNA prive di introni che sono occasionalmente retrotrascritte ed inserite nel genoma eucariotico.
In effetti, le similitudini nelle dimensioni del DNA fiancheggiante, la presenza di code di poli-A integrate e la proporzionalità diretta con la frequenza dei LINEs e degli pseudogeni suggeriscono che i SINEs possono usare le funzioni
specificate dai LINEs (Kumar e Bennetzen, 1999), incorporando il loro RNA nelle particelle citoplasmatiche dei LINEs (Grandbastien, 1999)
Fig. 5 – La struttura di un SINE
Contrariamente a quanto accade negli animali però, dove i SINEs sono relativamente frequenti, nelle piante la loro presenza sembra essere ben poco rilevante (Bennetzen, 1993; Grandbastien, 1992).
I TRIMs
I TRIMs (Terminal repeat Retrotrasposons In Miniature) sono un nuovo gruppo di retrotrasposoni recentemente individuato (Witte 2001). I TRIMs presentano corte sequenze di circa 500 bp e regioni LTR chiamate TDR (Terminal Direct Repeats) e senza i geni propri dei retrotrasposoni completi.
La prova che un tempo i TRIM fossero elementi mobili con un genoma autonomo è suggerita dal fatto che possono trasporsi, se, una volta trascritti, trovano disponibili nel citoplasma gli enzimi adeguati.
I LARDs
I LARD (LArge Retrotrasposons Derivatives) sono stati individuati per la prima volta in orzo (Kalendar et al., 2003); hanno la particolarità di non presentare ORF ma possiedono ampie regioni LTR (di circa 4,5 kb). Come gli altri elementi non autonomi, hanno bisogno di proteine eterologhe per trasporsi.
Gli elementi “Morgane”
Gli elementi Morgane sono simili a retrotrasposoni con LTR, ma presentano una estesa delezione dei domini centrali con rimozione del gene Gag; inoltre, il gene Pol si presenta altamente degenerato nella sequenza (Sabot et al., 2006).
Fig. 6 – La struttura degli elementi TRIM, LARD e Morgane a confronto con un elemento autonomo.
1.1.3. Elementi di classe II: i trasposoni a DNA
Gli elementi trasponibili di classe II traspongono attraverso un intermedio a DNA secondo un modello conservativo “cut & paste” (“taglia e incolla”). La sequenza di DNA dell’elemento mobile si muove da un sito “donatore” ad un altro locus genomico, definito sito “accettore”; questo è possibile grazie all’attività dell’enzima trasposasi capace di riconoscere univocamente brevi sequenze TIR (Terminal Inverted Repeats) .
L’enzima è codificato dall’elemento stesso (Figura 6). Come per gli elementi di classe I si definiscono ‘elementi autonomi’ soltanto quegli elementi che contengono la sequenza codificante per la trasposasi completa; gli ‘elementi non autonomi’ la contengono solo in parte o riarrangiata. Sia le TIRs che la presenza di motivi conservati all’interno del gene per la trasposasi giocano un ruolo assai importante per classificare i trasposoni di classe II in sette differenti superfamiglie (Robertson 2002).
Fig. 7 - Struttura degli elementi di classe II.
Figura 8 - Modello di trasposizione "cut & paste" degli elementi di classe II.
Un tipico elemento mobile autonomo della Classe II è costituito da due TIRs (Terminal Inverted Repeats), lunghe da 11 bp a qualche centinaio di nucleotidi (nella classe Mutator) e da ORF interni codificanti una specifica trasposasi (Figura 7). Gli elementi non autonomi che difettano per la trasposasi possono mobilizzarsi in trans solamente se possiedono TIRs riconoscibili e non difettose. Questi elementi difettivi si originano probabilmente da una riparazione incompleta del doppio filamento dopo il taglio effettuato da elementi autonomi (Plasterk, 1991).
Alla classe II appartengono 7 superfamiglie di trasposoni: gli elementi Ac/Ds,
Spm/dspm, CACTA, il sistema Mutator (MuDR) del mais, gli elementi Tam del genoma
Oltre a questi, recentemente sono stati scoperti gli elementi FoldBack, che presentano un meccanismo di trasposizione ancora non del tutto chiaro (è stato proposto un modello di trasposizione con un intermedio a RNA) ed è stato ipotizzato possano essere lunghi MITE derivati da varie tipologie di elementi di classe II.
Gli elementi Mutator–like (MULE) sono elementi mobili in grado di catturare sequenze geniche tramite un meccanismo ancora da dimostrare e sono stati scoperti nel genoma di Zea mays (Talbert e Chandler, 1988) e Arabidopsis thaliana (Yu et al., 2000) e sono caratterizzati dall’avere lunghe TIR. Nel genoma di Oryza sativa questi elementi sono presenti in grande quantità e contengono spesso al loro interno frammenti genici: questi complessi di sequenze vengono definiti “Pack-MULE” (Jiang et al., 2004).
Recentemente sono stati scoperti elementi della classe II con un meccanismo di trasposizione “rolling-circle” simile a quello di alcuni elementi batterici (Kapitonov e Jurka, 2001). Appartengono a questa classe anche i MITE (Miniature Inverted-repeat
Transposable Element), elementi di piccole dimensioni (di solito intorno a 500 bp), non
autonomi; sono presenti in elevato numero di copie e sono caratterizzati dalla preferenza d’inserzione all’interno di regioni eucromatiche, in siti bersaglio specifici (Casacuberta et al., 1998). Sono stati identificati in mais e in altre specie (Bureau e Wessler, 1992, 1994a, 1994b; Pozueta-Romero et al., 1996).
I MITEs sono abbondanti in genomi animali, per esempio in Caenorhabditis
elegans (Oosumi et al., 1995a, 1995b; Surzycki e Belknap, 2000), nella zanzara (Tu,
1997, 2001; Feschotte e Mouchès, 2000), nei pesci (Izsvák et al., 1999) e nell’uomo (Morgan, 1995; Smith e Riggs, 1996).
I trasposoni sono in genere molto lunghi (da 8 kb a 23 kb, Chopra et al. 1999) ma il loro numero di copie all’interno del genoma è generalmente basso rispetto a quello dei retrotrasposoni (Capy et al., 1998). Questa situazione è dovuta al fatto che l’incremento del numero di copie dei trasposoni può avvenire solamente se la trasposizione avviene in fase S (sintesi del DNA) del ciclo cellulare, e se il sito accettore è localizzato a valle della forca di replicazione. Durante la fase S, la riparazione del doppio filamento “tagliato” nel sito donatore viene realizzata dalla ricombinazione omologa dei cromatidi fratelli appena sintetizzati. Il trasposone duplica così le sue copie (Figura 9)
Figura 9 - Modello di trasposizione degli elementi di classe II durante la replicazione del DNA nella fase S del ciclo cellulare. La rottura causata dalla trasposizione è riparata da una ricombinazione omologa con il
2. LA REGOLAZIONE DELLA TRASPOSIZIONE
L’espressione dei trasposoni e la frequenza della loro trasposizione nei genomi delle piante e degli altri organismi eucariotici sono regolate da una serie di meccanismi di controllo, evolutisi per minimizzare il possibile effetto deleterio del loro spostamento e della loro moltiplicazione nel genoma dell’ospite.
2.1 La metilazione del DNA
Uno dei più importanti meccanismi di regolazione/repressione da parte del genoma ospite nei confronti degli elementi trasponibili è dato dalla metilazione del DNA. La metilazione del DNA è associata generalmente alla formazione di cromatina condensata (eterocromatina), in cui l’attività di trascrizione è repressa. E’ stato osservato in Arabidopsis che decrementi o azzeramenti dei livelli di metilazione delle sequenze dei trasposoni portano a riattivazione di elementi mobili (Okamoto e Hirochika, 2001).
Ad esempio, elementi Ac/Ds metilati non sono trascritti e non potendo produrre la Ac-trasposasi risultano inabili alla trasposizione (Ros e Kunze, 2001).
Nelle piante, le analisi sul DNA ripetitivo hanno dimostrato che, di solito, sono le citosine ad essere metilate nelle sequenze 5’—CG—3’ e 5’—CNG—3’. DNA metilato è stato localizzato sia a fianco di determinati geni, sia nei pressi di retrotrasposoni. Non è chiaro se sia la metilazione stessa ad inattivare il retrotrasposone coinvolto, o sia la metilazione costituisca solo un effetto secondario (finalizzato al mantenimento) dell’inattivazione, causata principalmente da un cambio di struttura della cromatina. Non è ancora del tutto chiaro come i trasposoni siano riconosciuti e metilati in modo da mantenerli in uno stato silente. In alcuni casi l’inattivazione epigenetica di un elemento mobile è legata all’inserzione in siti localizzati all’interno o vicino a blocchi di DNA già eterocromatico
2.2. L’RNA interference
Recentemente è stato dimostrato un nuovo meccanismo di silenziamento genico, mediato da RNA a doppio filamento. In diversi organismi è stato osservato che l’RNA a doppio filamento (dsRNA) è in grado di indurre silenziamento genico
sequenza-specifico. Nelle piante in cui si osserva il fenomeno dell’RNAi, si trovano piccole sequenze di RNA chiamate “small interfering RNAs” (siRNA). Si è scoperto che a generare questi siRNA è un enzima ribonucleasico della superfamiglia delle RNAsi III, chiamato Dicer.
Il modello funzionale dell’RNAi consta di due fasi fondamentali: quella di “iniziazione” e quella “effettrice”. In sistemi sperimentali, si è osservato che, nella fase iniziale, i dsRNA immessi nella cellula (in maniera diretta, attraverso transgenosi o virus) vengono “digeriti” in corte molecole di dsRNA chiamate siRNA (small interfering
RNAs), lunghe da 21 a 23 pb. Gli siRNA vengono prodotti dall’enzima Dicer, il quale
taglia i dsRNA attraverso una reazione ATP-dipendente. Successive rielaborazioni degradano i siRNA a duplex di 19-21 bp con un prolungamento di due nucleotidi al 3’.
Nella fase effettrice, i duplex siRNA si legano ad un complesso nucleasico e formano quello che viene chiamato “RNA-induced silencing complex” (RISC). Dopo tale legame, i siRNA vanno incontro ad una denaturazione a singolo filamento (reazione ATP-dipendente), necessaria per l’attivazione del complesso RISC. Inoltre, è necessaria una fosforilazione al 5’ del siRNA duplex perché esso possa incorporarsi nel RISC (Nykanen et al., 2001); questa modificazione viene svolta da una chinasi endogena (Schwarz et al., 2002). Il complesso così attivato, usando come stampo il singolo filamento incorporato, va a tagliare filamenti di mRNA complementari allo stesso. Il taglio avviene a circa 12 nucleotidi dal 3’ del siRNA antisenso. Analisi biochimiche (Hutvagner et al., 2002) indicano che l’RNAsi presente nel complesso RISC è diversa da Dicer. Questo processo ha generato un interesse enorme nella comunità scientifica; è importante notare che la RNAi può spiegare l’esistenza e il significato funzionale di molte sequenze sconosciute accumulate nei database biologici (Sugimoto et al., 2004).
Figura 10 - Esemplificazione schematica del meccanismo dell’RNAi mediato da siRNA
2.3 Attivazionedella trascrizione dovuta a stress biotici e abiotici
Molti trasposoni vengono attivati e trascritti in seguito a vari stress di tipo abiotico, attraverso effettori come il metil-jasmonato e l’acido salicilico (Kumar e Bennetzen, 1999). Analogamente, alcuni stress di tipo biotico come l’inoculazione di estratti fungali di Trichoderma viridae, di patogeni virali, batterici e micotici aumentano il livello di trascrizione dei trasposoni.
2.4 Regolazione self ed il modello a “bambole russe”
Le cellule della pianta ospite (e a volte i trasposoni stessi) hanno evoluto particolari meccanismi finalizzati a minimizzare il possibile effetto negativo degli elementi trasponibili. Alcuni retrotrasposoni possono inattivare altri elementi mobili inserendosi nella loro struttura (come succede nei cereali nelle regioni intergeniche), con un meccanismo di controllo detto “self”, cioè una auto-regolazione della loro popolazione nel genoma. I retrotrasposoni si innestano spesso l’uno dentro l’altro come “bambole russe” (Suoniemi et al., 1996; Chantret et al., 2004; Jiang e Wessler, 2001), in
modo che solamente l’ultimo elemento innestato presenta una struttura intatta e può essere attivo (figura 11).
Figura 11 - Il modello a “bambole russe” ipotizzato per il meccanismo self di controllo dei retrotrasposoni.
Avviene dunque una sorta di competizione per le risorse del genoma ospite, e l’ospite stesso trae beneficio da queste interazioni, quando non causano mutazioni; si attiva in definitiva una selezione naturale che premia gli elementi con maggiore specificità d’inserzione. La stretta interazione DNA ospite/parassita porta il parassita a mitigare i propri effetti per non diminuire considerevolmente il vantaggio genetico, la “fitness” dell’ospite; dal canto suo l’ospite sviluppa processi difensivi/minimizzanti in grado di contrastare il parassita, per esempio attraverso la metilazione del DNA o la RNAi.
3.
IL GIRASOLE COME SISTEMA MODELLO PER LO
STUDIO DELLA COMPOSIZIONE DEL GENOMA
Molti interrogativi rimangono irrisolti sulla distribuzione delle sequenze ripetitive e sulla generale organizzazione del genoma vegetale in altre specie, per esempio nella famiglia delle Asteraceae, che è molto estesa e diversificata ed include anche numerose specie economicamente importanti come il girasole.
3.1 Le Asteraceae
L’ordine delle Asterales, con circa 1000 generi e 19000 specie, diffuse sotto tutte le latitudini, rappresenta uno dei gruppi più ricchi di forme delle Angiospermae. Si tratta di un gruppo assai eterogeneo per quello che riguarda la morfologia del sistema vegetativo, in considerazione del fatto che questa famiglia ha rappresentanti in quasi tutti i tipi di ambienti; si va, infatti, da piante con habitus erbaceo o legnoso solo alla base, nella regione mediterranea, a specie con struttura decisamente arborescente o succulenta, nelle zone tropicali; d'altro canto tutto l'ordine delle Asterales appare estremamente omogeneo nella morfologia dell'infiorescenza che è sempre rappresentata dal capolino, struttura altamente differenziata con funzione vessillare, formata da un ricettacolo basale sul quale si inseriscono i fiori, circondata da foglie involucrali sterili dette squame. La caratteristica principale delle Asteraceae risiede nei capolini con soli fiori tubulosi o con fiori tubulosi al centro (disco) e ligulati alla periferia (raggi); questi ultimi sono generalmente unisessuali o sterili. L'impollinazione è di norma entomogama e ciò spiega la presenza del capolino. Infatti, anche la visita di un solo pronubo garantisce alla pianta la fecondazione di tutti i fiori che compongono l'infiorescenza.
Le Asteraceae sono una famiglia di grande importanza dal punto di vista economico. Essa include, infatti, alcune piante coltivate a scopo alimentare o ornamentale. Tra le prime si ricordano soprattutto il carciofo (Cynara scolymus), di cui si utilizzano soprattutto le brattee involucrali e il ricettacolo, e il girasole (Helianthus
annuus), coltivato per i semi oleaginosi. Tra le specie ornamentali vi sono varie specie di Senecio, Aster, Zinnia, Dahlia, Ageratum, Chrysanthemum, Argyranthemum, Gerbera, Tagetes, Calendula, ecc., da cui sono originate per selezione artificiale numerose cultivar.
Tra le specie officinali si citano Achillea millefolium, Artemisia vulgaris,
locale. Nella regione mediterranea le Asteraceae sono numerosissime e si rinvengono praticamente in ogni tipo di ambiente, dai boschi (Doronicum orientale), alle praterie steppiche (Carlina corymbosa), alla vegetazione altomontana (Anthemis aetnensis), alle zone salmastre litoranee (Inula crithmoides), agli ambienti antropogeni (Conyza
bonariensis).
3.2 Il girasole
Fig. 12 - Il girasole
Il girasole (Helianthus annuus) è una pianta di origine americana: Perù secondo alcuni studiosi, Messico secondo altri. E' stata introdotta in Europa nei primi decenni del ‘500 (soprattutto come pianta ornamentale), assumendo tuttavia una certa importanza come pianta oleifera soltanto nel ‘700. Dalla seconda metà dell' 800 ha avuto una notevole diffusione specialmente in Russia. Oggi è largamente coltivata a livello mondiale, tanto che attualmente si trova al secondo posto, dopo la soia, tra le piante produttrici di olio. In Italia è presente soprattutto nell'Italia centrale. Le attuali varietà selezionate danno acheni contenenti anche più del 45% di olio. Le forme coltivate si suddividono in due gruppi: uno idoneo per la produzione di semi e per foraggio, comprendente piante monocefaloiche e con acheni grandi, e uno per la produzione di fiori ornamentali, caratterizzato da piante ramificate e policefale.
Il girasole è una pianta erbacea annuale, caratterizzata da un notevole sviluppo dei suoi organi, sia per quanto riguarda la lunghezza dello stelo che la larghezza dell’infiorescenza. Il fusto si presenta eretto, tendenzialmente cilindrico, robusto, rugoso, ispido e ripieno all’interno di midollo. Le specie da olio hanno in genere un’altezza compresa tra 0,6 e 2,2 metri. Il fusto è eretto solo a maturazione e si piega nella parte terminale per il peso della calatide.
Le foglie (presenti in numero variabile tra 12 e 40) sono alterne, grandi, semplici, lungamente picciolate, cordate od ovate, acute, dentate.
L’infiorescenza terminale del girasole si presenta come capolino ed è detta “calatide”. L’infiorescenza è costituita da un ricettacolo discoidale piatto circondato da una doppia o plurima serie di brattee. I fiori si suddividono in due gruppi: i fiori periferici sterili, forniti di un vistoso petalo giallo e i fiori interni fertili. L'ovario (organo riproduttore femminile) si allunga in uno stilo che si suddivide in due stimmi. Gli stami (organi riproduttori maschili) sono 5 ed hanno le antere fuse in una sorta di tubo che racchiude lo stilo. La sistemazione dei fiori (detti “flosculi”) all'interno del disco avviene secondo la sezione aurea, ottenendo uno schema a spirali in cui il numero di spirali orarie e di quelle antiorarie sono successivi numeri di Fibonacci. Di solito ci sono 34 spirali in un senso e 55 nell'altro; in girasoli molto grandi si possono trovare 89 spirali in un senso e 144 nell'altro (Figura 13)
Fig. 13 - Le spirali orarie e antiorarie sono successivi numeri di Fibonacci.
Nelle varietà coltivate le calatidi hanno un diametro di 15-50 cm e sono formate da 700-3.000 fiori (nelle varietà da olio). L’impollinazione è entomofila.
3.3. Il frutto
Il frutto del girasole è un achenio (frutto secco indeiscente) di forma allungata, costituito da un pericarpo duro e fibroso aderente al seme, di colore variabile dal bianco al nero, molto spesso grigio scuro, con striature più o meno chiare a seconda della varietà (figura 14).
L’apparato radicale è fascicolato e molto sviluppato, soprattutto nei primi 40 cm di terreno. Il contenuto medio di materia grassa nei semi è del 48 % s.s., con punte che possono raggiungere il 55 % s.s.
Fig. 14: Acheni di girasole
La raccolta viene fatta quando gli acheni, il cui contenuto in acqua è inferiore al 10%, si staccano facilmente dalla calatide; ciò avviene circa 15-20 giorni dopo la maturazione. La maturazione completa viene raggiunta quando la calatide e le foglie si presentano secche e gli steli sono di color bruno. In Italia il girasole viene raccolto dalla metà di agosto (nelle zone più calde) alla metà di settembre, utilizzando le mietitrebbiatrici da frumento adattate o con testata da mais dotata di spartitore per ogni fila. L’olio di girasole è solitamente meno salutare per l'apparato cardiocircolatorio rispetto a quello d'oliva. A tutt'oggi sono però disponibili varietà ad alto tenore di acido oleico che non si discostano troppo dalla composizione dell'olio di oliva. Dai semi di girasole si può estrarre anche olio per motori, usato per produrre biodiesel.
I residui della spremitura sono impiegati come mangime per il bestiame. I semi di girasole vengono anche venduti come snack (tostati). Sono impiegati inoltre come mangime per uccelli e roditori. Infine, il girasole è largamente impiegato come pianta ornamentale.
Recentemente sono state selezionate alcune varietà di girasole con il capolino rivolto verso il basso. Queste varietà sono meno ricercate dai giardinieri come piante ornamentali, ma preferite dai coltivatori in quanto riducono il danno provocato da uccelli e da alcune malattie delle piante. Esistono anche varietà transgeniche di girasole, più resistenti ad alcune malattie. I girasoli producono del lattice, oggetto di esperimenti volti a utilizzarli come fonti alternative di gomma ipoallergenica.
3.4. Origine del girasole
Il girasole appartiene al genere Helianthus, originatosi tra i 4.75 ed i 22.7 milioni di anni fa, secondo quanto stimato dall’analisi del cpDNA (Schilling, 1997). Nella loro classificazione, basata sull’analisi morfologica e della inter-incrociabilità, (Heiser et al. 1969) hanno individuato 67 specie, annuali o perenni, di cui 50 native del Nord America e 17 del Sud America.
Basandosi sulla sua distribuzione geografica, il genere Helianthus dovrebbe essersi originato in Messico, con successiva migrazione in Nord America (Schilling et al., 1998). L’origine del girasole coltivato è da ricercarsi nelle regioni orientali del Nord America (Harter et al., 2004). Diverse specie di Helianthus sono note avere origine da ibridazioni interspecifiche (Rieseberg, 1995). Schilling ed Heiser (1981) e Rogers et al. (1982) hanno escluso dal genere Helianthus le specie sudamericane e suddiviso il genere in quattro sezioni: la sezione Annui (comprendente solo le specie annuali e diploidi), la sezione Agrestes (comprendente solo H. agrestis), la sezione Ciliares divisa in due serie
Ciliares e Pumili (comprendenti 6 specie perenni) e la sezione Atrorubentes divisa in 5
serie, Angustifolii, Atrorubentes, Divaricati, Gigantei, e Microcephali, comprendenti ben 30 specie perenni e una annuale (H. porteri).
Nell’ultima decade, gli studi di biologia molecolare ha chiarito molto le relazioni interne tra le varie specie del genere Helianthus. L’analisi RFLP del DNA cloroplastico ha evidenziato quattro sezioni. La prima include H. agrestis, la seconda include H. porteri; una terza sezione, chiamata Helianthus, include tutte le altre annuali mentre la quarta include tutte le perenni (Schilling, 1997).
Queste ultime due sezioni, probabilmente, avranno bisogno di una successiva valutazione perchè la loro differenziazione è relativamente recente (Schilling, 2001).
Gli studi sistematici e filogenetici basati sullo spaziatore ribosomale trascritto dividono la sezione Helianthus in tre gruppi, di cui uno include H. annuus, il secondo H.
petiolaris, H. neglectus e H. niveus e il terzo H. praecox e H. debilis (Schilling et al.,
1998).
3.5. La libreria di DNA
La conoscenza della composizione della componente ripetitiva del genoma ha una duplice importanza sia dal punto di vista teorico che applicativo, per migliorare le strategie nella mappatura del genoma e al fine di scoprire nuovi markers molecolari. Inoltre, una conoscenza accurata del genoma è indispensabile per iniziare un processo di sequenziamento rivolto sia alle ESTs (Expressed Sequence Tags) che alle regioni genomiche.
Presso la Sezione di Genetica del Dipartimento di Biologia delle Piante Agrarie da molti anni si studia la composizione del genoma delle piante, con particolare riferimento al girasole.
Questa tesi di laurea si inquadra in questa linea di ricerca, prendendo in esame alcune famiglie di DNA ripetitivo che di solito nelle piante sono poco rappresentate e che risultano quindi poco studiate; in particolar modo mi sono soffermato su due tipologie di elementi trasponibili: i trasposoni e i LINEs.
I trasposoni sono elementi trasponibili di classe II e si spostano nel genoma attraverso un intermedio a DNA secondo un modello conservativo “cut & paste” (“taglia e incolla”) grazie all’attività dell’enzima trasposasi da essi codificato, che riconosce univocamente brevi sequenze TIR (Terminal Inverted Repeats).
I cosiddetti LINEs (Long INterspersed Elements), invece, sono elementi di classe I, che si spostano mediante retrotrascrizione di un intermedio di RNA utilizzando enzimi codificati dall’elemento; sono ritenuti il più antico gruppo di retrotrasposoni.
Nel corso della tesi sono state identificate, analizzando una library di piccoli inserti di DNA genomico di girasole, tre sequenze, corrispondenti a due trasposoni e ad un LINE. Queste sequenze sono state analizzate in riferimento a sequenze similari di altre specie vegetali ed è stato valutato il numero di copie in girasole ed in altre specie del genere Helianthus. Si è infine studiata l’espressione di queste sequenze mediante RT-PCR: sia i trasposoni che il LINE sono risultate espresse costitutivamente, sia in tessuti adulti (foglie) che in tessuti embrionali.
SCOPO DELLA TESI
La conoscenza della composizione del genoma, specialmente della componente ripetitiva, ha una duplice importanza sia dal punto di vista teorico che applicativo, per migliorare le strategie nella mappatura del genoma e al fine di scoprire nuovi markers molecolari. In ogni caso una conoscenza accurata del genoma è indispensabile per iniziare un processo di sequenziamento rivolto sia alle ESTs (Expressed Sequence Tags) che alle regioni genomiche.
Le piante superiori presentano notevoli differenze nella composizione del genoma rispetto agli animali. Se in entrambi i casi le sequenze ripetute rappresentano una porzione significativa del genoma, che è tanto maggiore quanto più il genoma è grande, le famiglie di sequenze ripetute sono comunque diversamente rappresentate. Nelle piante, sono frequenti soprattutto i retrotrasposoni con LTR (gypsy, copia, LARD e altri) e in alcuni casi i MITE (Wicker et al., 2007).
Negli animali i retrotrasposoni più frequenti sono quelli senza LTR, cioè i LINE e i SINE. Tuttavia, membri di ciascuna famiglia di sequenze ripetute sono stati riscontrati in tutte le specie, sia animali che vegetali, anche se con frequenze diverse. La frequenza con cui compaiono le diverse famiglie di DNA ripetuto può perfino caratterizzare la specie: per esempio, il recente sequenziamento del genoma della vite ha evidenziato come, a differenza di altre piante, i retrotrasposoni di tipo copia siano più rappresentati di quelli di tipo gypsy; e che una classe di retrotrasposoni, i pararetrovirus, rappresentano una porzione significativa del genoma (Gregor, 2004).
Parlando di specie vegetali, sono state riscontrate differenze nella componente ripetitiva dei genomi vegetali finora sequenziati: Arabidopsis, riso, pioppo e vite (The Arabidopsis Genome Initiative, 2000; Goff et al., 2002; Tuskan et al., 2006; The French-Italian Public Consortium For Grape Genome Characterization, 2007) ma si tratta di genomi abbastanza piccoli. Qualche dato è reperibile per genomi medio grandi come quello del mais, del frumento e del cotone (Meyers et al., 2001; Hawkins et al., 2006; Vitte e Bennetzen, 2006), che mostrano le differenze dell’evoluzione di questi genomi.
Presso la Sezione di Genetica del Dipartimento di Biologia delle Piante Agrarie da molti anni si studia la composizione del genoma delle piante, con particolare riguardo al girasole. Questa tesi di laurea si inquadra in questa linea di ricerca, prendendo in esame alcune famiglie di DNA ripetuto che di solito nelle piante sono poco rappresentative e che risultano quindi poco studiate
MATERIALI E METODI
5.1 Il materiale vegetale
Le analisi sono state condotte su DNA isolato da foglie prelevate da piante di Helianthus annuus, linea pura HCM del Dipartimento di Biologia delle Piante Agrarie, e di Helianthus argophyllus, H. debilis, H. petiolaris, H. ciliaris, H. pumilus, H.
atrorubens, H. giganteus, H. simulans, H. tuberosus (tutti provenienti dal
NCRPIS-USDA, USA). Gli RNA sono stati isolati da foglie ed embrioni (a 28 giorni dall’impollinazione) della linea HCM di H. annuus.
5.2 Analisi di sequenze.
Le sequenze in esame sono state sottoposte ad analisi bioinformatica mediante comparazione BLASTN e BLASTX contro il database di sequenze nucleotidiche e proteiche della GenBank (http://www.ncbi.nlm.nih.gov/blast/Blast.cgi). Un valore di E di almeno 10-5 nel BLAST è stato considerato significativo per la classificazione delle sequenze.
Multiallineamenti delle sequenze in esame sono stati realizzati utilizzando il software CLUSTALW (http://align.genome.jp/).
Le relazioni fra le diverse sequenze nucleotidiche appartenenti ai tre tipi studiati sono state valutate con il metodo del Neighbour-Joining (NJ), che usa l’algoritmo di distanza di Kimura, utilizzando il pacchetto software PHYLIP (versione 3.572) (Felsenstein, 1989). Sono state preparate 100 versioni del multiallineamento reale delle sequenze, con il programma SEQBOOT; successivamente, sono stati generati alberi filogenetici usando i programmi DNADIST e NEIGHBOR, usando le opzioni standard.
Un albero di consenso è stato ottenuto per ciascun tipo di sequenza utilizzando il programma CONSENSE. La visualizzazione degli alberi filogenetici è stata ottenuta con il programma TreeView.
Sono stati utilizzati utilizzati anche i programmi: “espasy” (http://www.expasy.ch/tools/dna.html) per la traduzione dei nucleotidi e “reverse
complement” (http://www.bioinformatics.org/sms/rev_comp.html) per le sequenze ribaltate.
5.3. Analisi del DNA genomico
5.3.1 Isolamento del DNA genomico
Il DNA è stato estratto da piccole quantità di tessuto vegetale utilizzando il metodo di Doyle & Doyle (1987).
Il materiale vegetale è stato triturato in un mortaio sterile, precedentemente refrigerato con azoto liquido, fino ad ottenere una polvere finissima.
Si è aggiunto il tampone di estrazione, scaldato a 60 °C, nella misura di circa 3 ml per grammo di tessuto vegetale; il materiale è stato posto in bagno caldo a 60 °C per 20-30 minuti in una eppendorf. Finita l'incubazione in bagno caldo si è operata una estrazione con un uguale volume di cloroformio/alcool-isoamilico (24:1), agitando la
eppendorf fino ad ottenere un’unica fase, dopodiché i campioni sono stati centrifugati per
15 minuti a 9.000 rpm ed a 4 °C in rotore Kontron A8.24. La fase acquosa è stata recuperata con una pipetta Pasteur sterile e trasferita in un’altra eppendorf.
Gli acidi nucleici sono stati fatti precipitare aggiungendo 2/3 di volume di isopropanolo freddo (-20 °C) per 30-60 minuti a temperatura ambiente, e quindi centrifugati a 8000 rpm per 15 minuti a 4 °C. Il pellet risultante è stato lavato con etanolo al 70 %.
Si è provveduto poi ad eliminare l’etanolo, ad asciugare bene il pellet, ed a solubilizzarlo in un minimo volume di TE pH 8.
Soluzioni utilizzate: Tampone di estrazione CTAB 3 % NaCl 20mM pH8 Tris-HCl 100mM pH 8 CTAB 3 % (p/v) 2-Mercaptoetanolo 0.2 % (p/v) Cloroformio/alcool-isoamilico (24:1 v/v)
Il 2-mercaptoetanolo viene aggiunto al momento dell'estrazione.
Si satura con un volume di Tris-HCl 100 mM pH 8.
TE pH 8 Tris-HCl 10 mM pH 8
Na2EDTA 1 mM pH 8.
5.3.2. Purificazione del DNA con RNAsi
Ai campioni è stata aggiunta RNAsi nella misura di 100 µg per ml, dopodichè sono stati messi a 37 °C in leggera agitazione per circa 60 minuti. Successivamente è stata effettuata una estrazione con un ugual volume di cloroformio-alcool isoamilico (24:1 v/v). I campioni sono stati centrifugati a 7.000 rpm per 15 minuti a 4 °C.
Al termine è stata recuperata la fase acquosa alla quale sono stati aggiunti 1/10 di volume di NaCl saturo e 2 volumi di etanolo assoluto freddo (-20 °C); il tutto è stato miscelato delicatamente per inversione e lasciato a precipitare per almeno 2 ore a – 20 °C. Successivamente si è provveduto a centrifugare il campione a 7.000 rpm per 20 minuti a 4 °C. Il pellet di DNA è stato lavato con etanolo al 70 % e solubilizzato in un minimo volume di acqua sterile.
Soluzioni utilizzate:
RNAsi A (10 mg/ml) 10 mg sciolti in 1 ml di 10 mM Tris-HCl, pH 7,5 e
15 mM NaCl, si bolle per 5 minuti e si lascia raffreddare a temperatura ambiente. Si conserva a –20 °C.
5.3.3. Quantizzazione del DNA estratto
I campioni ottenuti sono stati valutati, sia dal punto di vista della qualità che dal punto di vista della concentrazione, tramite elettroforesi su gel di agarosio colorato con Bromuro di Etidio.
E’ stato preparato un gel sciogliendo polvere di agarosio in acqua distillata (1% p/v); alla miscela è stato poi aggiunto TAE alla concentrazione finale di 1x e Bromuro di Etidio alla concentrazione finale di 1 µg/ml.
Nelle tasche del gel sono stati caricati 2 µl di ogni DNA estratto, ad ognuno dei quali sono stati aggiunti 2 µl del tampone di caricamento.
Assieme ai DNA estratti sono state caricate quantità scalari di DNA marker λ a concentrazione nota.
La corsa è stata effettuata a 50 volts per circa 15 minuti, sufficienti per far entrare appena i DNA in esame nel gel di agarosio.
Alla fine della corsa il gel è stato visualizzato su un transilluminatore a raggi UV (302 nm) ed è stata comparata l’intensità delle bande date dai campioni con quella dei marker a concentrazione nota: in base a tale paragone, abbiamo potuto stabilire la concentrazione dei campioni.
I DNA estratti sono stati infine diluiti con acqua sterile in modo da ottenere per tutti i campioni concentrazioni finali simili.
Soluzioni utilizzate: TAE 10x Tampone di caricamento Tris-acetato Na2EDTA pH 8 Saccarosio Na2EDTA pH 8 Orange G 0,4 M 0,01 M 60 % massa/vol 25 mM 0,1 %massa/vol
5.3.4. Amplificazione mediante PCR delle sequenze ripetute da analizzare
La tecnica della PCR è stata utilizzata per amplificare sequenze di DNA appartenenti alle diverse sequenze ripetute in esame.
I primer utilizzati sono stati progettati utilizzando il programma OLIGO.
Primer del trasposone HAG003H10R
3H10F1: 5’- ATG-CTA-GGT-AGT-TTA-GAT-TGT-ATG- 3’ 3H10R1: 5’- ATG-CTC-GCT-CGA-CGT-CTT-T- 3’
Primer del trasposone HAG003I05F
3I053I05F1: 5’ -ATG-TGG-TGT-GTG-CTT-CAA-GTA-A- 3’ 3I05R1: 5’ -TGA-AGA-ACA-AGC-ACA-AAT-TCA-AA- 3’
Primer del LINE HAG00 HAG004M10F
4M10F1: 5’-AAT-GCG-AGG-CTA-GAG-GAA-TGG-AG- 3’ 4M10R1: 5’ -ATC-CAC-CCC-AAC-ATT-CTC-ATC-TC- 3’
La reazione di PCR è consistita in 35 cicli preceduti da una fase di denaturazione del DNA a 94°C della durata di 4 minuti, e seguiti da una fase di 7 minuti a 72°C. Ogni ciclo, a sua volta, era costituito da tre passaggi: denaturazione del DNA a 94°C per 30 secondi, appaiamento dei primer a 55°C per 30 secondi, polimerizzazione del DNA a 72°C per 30 secondi.
Mix di reazione:
Volumi (µl)
DNA genomico (100 ng/µl) 1.0
Taq polimerasi Mg free Buffer (10x) 2.5
MgCl2 (25 mM) 1.5
Mix nucleotidica (ogni dNTP
concentrato 2.5 mM) 2.0
Primer forward (100 µM) 0.5
Primer reverse (100 µM) 0.5
Taq polimerasi (Promega, 5U/µl) 0.25
H2O sterile 16.75
TOTALE 25 µl
5.3.4. Marcatura non radiattiva del DNA: preparazione delle sonde
Le sonde a DNA, necessarie per determinare il numero di copie di sequenze appartenenti a retrotrasposoni sul genoma di Helianthus Anuus, sono state ottenute mediante PCR adoperando come primers due oligonucleotidi universali complementari a specifiche sequenze del vettore pGEM-T-easy Vector System (Promega):
Primer Reverse: Sp6 5’-TAATACGACTCACTATAGGG-3’
Primer Forward: T7 5’-ATTCTATAGTGTCACCTAAAT-3’
Come stampo è stato utilizzato 5 ng di DNA plasmidico ottenuto da un clone positivo salvato a –80°C purificato mediante mini-preparzione con “High Pure Plasmid Isolation Kit” della Roche (vedi: Clonaggio dei prodotti PCR).
Miscela di reazione per amplificazione PCR:
REAGENTI Volumi (µl)
DNA plasmidico trasformato (5 ng) 1 .0
Taq polimerasi Mg free Buffer (10x) 2.50
MgCl2 (25 mM) 2.50
Mix nucleotidica con uridina marcata con digossigenina (Roche)
2.50
Primer Sp6 (1 µg/µl) 0.25
Primer T7 (1 µg/µl) 0.25
Taq polimerasi (Promega, 5U/µl) 0.25
H2O distillata sterile 16.75
25.00 µl
Nota: La miscela di deossi-nucleotidi contenente uridina marcata è così composta (per 25 µl): 5 µl
ATP(10mM), 5 µl CTP(10mM), 5 µl GTP(10mM), 4,75 µl TTP (10mM) 2.5 µl UTP-DIG (Roche) (1mM), 2.75 µl H2O.
Ogni reazione di PCR consisteva di 30 cicli preceduti da una fase di denaturazione del DNA a 94°C della durata di 4 minuti, seguiti alla fine da una fase di 7 minuti a 72°C.
Ogni ciclo, a sua volta, è stato composto da tre passaggi fondamentali: un primo passaggio di denaturazione della doppia elica a 94°C della durata di 30 secondi; un secondo di appaiamento degli oligonucleotidi a 55°C per 30 secondi; ed infine un terzo di polimerizzazione del DNA della durata di 1 minuto e 30 secondi a 72°C.
Al termine della reazione, i campioni sono stati valutati tramite elettroforesi su gel di agarosio servendosi di markers a DNA per la stima sia del peso molecolare dell’amplificato ottenuto, sia della sua concentrazione.
5.5. Slot Blot
E’ la tecnica che abbiamo utilizzato per valutare il numero di copie di ogni famiglia di retrotrasposoni nel genoma di Heliantus Annuus.
Previa costruzione delle sonde a DNA (vedi paragrafo precedente), la tecnica dello Slot Blot consta di quattro passaggi fondamentali:
Trasferimento su membrana del DNA genomico di olivo e dei prodotti di PCR non marcata corrispondenti alle sequenze da valutare;
• Ibridazione del DNA gnomico e di ciascun prodotto di PCR con le rispettive sonde specifiche marcate;
• Lavaggio della membrana al fine di togliere l’eccesso di sonda; • Rivelazione del segnale di ibridazione (Detection).
5.5.1 Trasferimento del DNA su membrana
E’ stata preparata una serie di diluizioni scalari di DNA genomico di
Heliantus Annuus e di prodotti di PCR (non marcata) corrispondenti alle sequenze da
valutare.
Ad ognuna di queste diluizioni è stato aggiunto un uguale volume di NaOH 0.8 M, dopodichè i campioni sono stati incubati a 37°C per 15 minuti al fine di denaturare il DNA.
Successivamente, ognuna di queste soluzioni è stata caricata su una membrana di nylon (Roche) carica positivamente precedentemente inumidita con SSC 2x. Per questa operazione sono stati necessari un apparecchio Biodot (BioRad) ed una pompa a vuoto, usata per accelerare il trasferimento stesso. Per il DNA genomico soni stati caricati 2000, 1000, 500,250, 125, 62, 31, 15 ng; per ciascuna sequenza sono stati caricati 20, 10, 5, 2.5, 1.25, 0.62, 0.31, 0.15 ng di prodotto di PCR.
5.5.2 Ibridazione con sonde marcate
Le membrane sono state poste in tubi TECHNE e incubate con un adeguato volume di soluzione di pre-ibridazione (20ml per 100cm2) in ibridizzatore TECHNE Hybridiser HB-1D a 65°C per 2 ore. Prima dell’ibridazione, 70 ng di sonda marcata sono stati denaturati a 100°C per 15 minuti e trasferiti in ghiaccio, la soluzione di ibridazione (7-10 ml) si ottiene diluendo la sonda nella soluzione di preibridazione.
Le soluzioni di ibridazione contenenti le sonde marcate possono essere recuperate, conservate a -20°C e riutilizzate previa bollitura per 10 minuti. Rimossa la soluzione di preibridazione la membrana è stata incubata nella soluzione di ibridazione per circa 12 ore a 65°C.
Soluzioni utilizzate:
Soluzione di preibridazione
SSC
Sodio Dodecil Solfato (SDS)
N-Laurilsarcosinato (SLS) Blocking reagent (Roche)
5x 0,02% 0,1% 1 %
5.5.3. Lavaggi delle membrane
Una volta finita l’ibridazione, le membrane sono sottoposte a quattro lavaggi con diverso potere stringente al fine di eliminare l’eccesso di sonda.
Queste le condizioni dei lavaggi:
1) SSC 2.0x + 0.1% SDS 15 minuti a T° ambiente 2) SSC 2.0x + 0.1% SDS 15 minuti a T° ambiente 3) SSC 1.0x + 0.1% SDS 30 minuti a 65°C 4) SSC 0,3x + 0.1% SDS 30 minuti a 65°C
5.5.4 Rivelazione del segnale di ibridazione (Detection)
La detection con chemioluminescenza è stata effettuata utilizzando il “Dig
Luminescent Detection Kit” (Roche). La membrana è stata lavata con Buffer 1 per 1
minuto e tenuta in lenta agitazione in Buffer 2 per 30 minuti. Successivamente, la membrana è stata incubata per 30 minuti in agitazione con l’anticorpo legato alla fosfatasi alcalina, diluito 1:10000 in Buffer 2.
Sono stati effettuati due lavaggi di 15 minuti in Buffer 1 addizionato con tween 20 allo 0.3% e quindi equilibrata la membrana in Buffer 3 per 1 minuto.
In camera oscura la membrana, adagiata su una pellicola trasparente, è stata cosparsa di una soluzione di Lumigen CSPD diluito 1:100 in Buffer 3 (circa 0.5 ml per membrana di 100 cm2). Dopo essere stata sigillata in busta trasparente, avvolta in stagnola per proteggere il Lumigen dalla luce, la membrana è stata incubata per 5 minuti a temperatura ambiente ed in seguito per 15 minuti a 37°C. Infine la membrana è stata messa a contatto con una lastra autoradiografica (Amersham MP). L’esposizione si è prolungata per 15 minuti.
Al termine dell’esposizione, la lastra è stata sviluppata e fissata con le soluzioni Kodak seguendo le istruzioni fornite dalla ditta.
Soluzioni utilizzate: Blocking stock solution Blocking reagent (Roche) 10 % (w/v)
Sciogliere il Blocking reagent in Buffer 1 a 60°C. Autoclavare e conservare a -20°C.
Buffer 1 NaCl
Acido maleico
0,15 M 0,1 M
Portare a pH 7,5 con NaOH ed autoclavare.
Buffer 2 Blocking stock solution diluita 1:10 in Buffer 1. Autoclavare.
Buffer 3 Tris-HCl
NaCl
100mM pH 9,5 100 mM
Sono state preparate diluzioni seriali di DNA genomico delle diverse specie da 50 a 25,600 genomi (da 50*3,3pg a 25.600*3,3pg). I prodotti di PCR corrispondenti alle tre sequenze in analisi sono stati solubilizzati in acqua sterile distillata con NaOH ad una concentrazione finale di 0,4 M in una serie di diluizioni partendo da 7.35.106 a 3.76.109 copie e trasferite sulle stesse membrane.
I Dot blot così ottenuti sono stati ibridati con le sonde precedentemente marcate con digossigenina; la concentrazione della sonda era 10 ng/ml di soluzione di ibridazione.
Dopo un’incubazione di una notte a 65°C, le membrane sono state lavate in tampone SSC ad alta stringenza, secondo la metodica descritta da Santini et al. (2002). Il rilevamento della digossigenina è stato realizzato mediante un saggio ELISA con l’utilizzo della fosfatasi alcalina, seguendo il protocollo della Roche. L’intensità della colorazione (e quindi dell’ibridazione) è stata quantificata su fotografie digitali delle membrane utilizzando il software Quantity-One (BioRad).
La stima del numero di copie per pg di DNA è stata realizzata comparando l’ibridazione della sonda con il DNA genomico con quella con la stessa sequenza caricata sulla membrana (Santini et al., 2002).
Per il calcolo del numero di copie di ciascuna sequenza analizzata, per prima cosa sono stati confrontati tra loro i segnali di ibridazione procurati dalla sonda sul DNA genomico e sul prodotto di PCR (identico alla sonda ma ottenuto con una mix di nucleotidi non marcata). Segnali uguali corrispondono ad un medesimo numero di copie della sequenza caricato sulla membrana.
Sapendo che 1 pg di prod. PCR = 0,965*109
pb, e conoscendo la lunghezza
e la quantità in ng dei prodotti di PCR caricati sulla membrana, si può risalire all’esatto numero di copie caricato in ciascun pozzetto dell’apparato di Slot Blot:
Ad es. 625 pg (0,62 ng) * 0,965*109 pb = 603.1*109 bp numero totale di pb
caricate nel pozzetto di 62 ng.
603.1 109 bp / 587 bp = 1,027*109 copie caricate nel pozzetto corrispondente a 0,62 ng di una sequenza lunga 587 pb presa come esempio.
Se ad esempio il segnale di ibridazione rilevato sul prodotto di PCR corrispondente a 0,62 ng fosse identico a quello trovato nel pozzetto in cui sono stati
caricati 125 ng di DNA genomico, sapendo che il contenuto 1 C del DNA corrisponde a
2,2 pg, calcolando il numero di genomi caricati in quel pozzetto, si può risalire al numero
di copie della sequenza per genoma:
125 *103 pg (125 ng)/ 2,2 pg = 56818 genomi
Quindi 1,027*109 copie / 56818 genomi= 1,8*104 copie per genoma della sequenza di 587 pb presa come esempio.
5.6. Analisi dell’RNA
5.6.1. Isolamento di RNA dai tessuti
L’RNA totale è stato isolato da foglie ed embrioni di girasole.
Soluzioni necessarie per l’isolamento:
o soluzione MES/EDTA 5x: 1,95g di MES e 3,72g di EDTA in 90ml di acqua DEPC (pH
o finale = 7.0, volume finale = 100ml) o fenolo (tris saturato)
o cloroformio/IAA (24:1) o etanolo al 100%
o etanolo al 70%
o acido acetico 1M: acqua e acido acetico glaciale in proporzioni 943:57; o si tratta poi con acqua DEPC
o buffer di estrazione: guanidina-HCl 8M, MES 20mM, EDTA 20mM, 2-mercaptoeta-nolo 50 mM fenolo/cloroformio-IAA (per sciacquare il mortaio e recuperare)
Il materiale vegetale è stato posto in mortai sterili refrigerati in precedenza con l’ausilio di azoto liquido, e pestato fino ad ottenere una polvere finissima. Il tampone di estrazione, dopo il riscaldamento a 60°C, è stato aggiunto nella misura di 3 ml per grammo di tessuto vegetale ed il materiale è stato posto in bagno caldo (60°C) per 20 minuti. L’isolamento dell’RNA è stato operato aggiungendo un pari volume di
fenolo/cloroformio-alcool isoamilico (24:1 v/v) ed agitando per mescolare le due fasi; i campioni sono stati poi centrifugati per 15 minuti a 9.000 rpm e 4°C in rotore Kontron A8.24. Dopo il recupero della fase acquosa, agli acidi nucleici sono stati aggiunti 0,2 volumi di acido acetico 1M e 0,7 volumi di etanolo al 70%. L’RNA è stato fatto precipitare a -80°C per 60 minuti. Le provette sono poi state centrifugate per 30 minuti a 9.000 rpm, a 4°C, ed il pellet ottenuto è stato lavato con etanolo al 70% e acetato di sodio 3M. Al termine dei lavaggi il pellet è stato nuovamente sospeso in acqua DEPC (in un bagno a 65°C).
Volumi stabiliti delle soluzioni contenenti l’RNA estratto dai tessuti sono stati caricati su un gel denaturante per RNA e sottoposti a corsa elettroforetica per una verifica della qualità.
Preparazione di un gel denaturante per RNA: -1% di Agarosio;
- MOPS 1x ( da 10x ), che è il tampone di corsa; - 6% finale di Formaldeide ( da soluzione al 37% ); - H2O DEPC fino al volume finale.
L’agarosio (0.35g) posto in una beuta insieme all’acqua è stato scaldato. Alla miscela sono stati aggiunti Formaldeide (concentrazione finale 6%) e MOPS (concentrazione finale 1x) e il tutto è stato agitato. Il volume del gel era di 35 ml. Il gel è stato colorato con Bromuro di Etidio e visualizzato su un trans illuminatore UV come descritto precedentemente. La qualità dell’RNA estratto è stata valutata in base alla visualizzazione di due bande distinte di RNA ribosomale, nella proporzione attesa.
La concentrazione dell’RNA è stata stimata allo spettrofotometro. La lettura dell’assorbanza dei diversi campioni è stata effettuata a 258nm e 320nm.
5.6.2. Rimozione del DNA
Poiché le soluzioni di RNA, dopo l’isolamento, contengono tracce di DNA è stato necessario effettuare un trattamento con DNAsi (DNAsi I Roche) per rimuovere il DNA.
Miscela di reazione:
Stampo variabile in base alla concentrazione dei campioni Buffer 5µl
RNAsi inibitore 0.5µl DNAsi 5µl H2O DEPC fino a volume
I campioni (50 µl) sono stati incubati per 20 minuti in un bagno termostatato a 37°C. In seguito il volume è stato portato a 100µl con H2O DEPC ed è stata eseguita l’estrazione con 1 volume di fenolo/cloroformio. Le soluzioni nelle provette sono state centrifugate a 13.000 rpm a 4°C per 35 minuti ed il sovranatante è stato recuperato. Sono stati aggiunti 2.5 volumi di etanolo assoluto ed 0.1 volumi di acetato di sodio. L’acido nucleico è stato fatto precipitare per 60 minuti. Centrifugati e sottoposti a successivo lavaggio, i pellet sono stati infine solubilizzati. È stato prelevato 1µl di soluzione da ogni campione (diluito in 100µl di H2O DEPC) per la lettura della concentrazione allo spettrofotometro.
5.7. Valutazione dell’espressione mediante RT-PCR
5.7.1. Retrotrascrizione dell’RNA.
Gli RNA messaggeri sono stati retrotrascritti in vitro a cDNA, utilizzando come innesco un primer oligo-dT.
Miscela di reazione:
Stampo 3 µl Primer oligo-dT 50 µM 1 µl Mix dNTP 10 µM 1 µl H2O DEPC fino a volume Buffer 5x 4 µl DTT 0.1M 1 µl Enzima retrotrascrittasi 1 µl