• Non ci sono risultati.

3 APPROCCIO METODOLOGICO

3.2 Progettazione dei promotori

In questo capitolo verrà descritto il metodo con cui sono state analizzate le sequenze di 14 promotori seme-specifici, verranno chiariti i criteri di scelta dei promotori naturali e il metodo di combinazione di questi ultimi in sequenze ibride sintetiche. Verranno poi chiarite le motivazioni che hanno portato alla scelta di dare la precedenza, nella sperimentazione in

vivo, ad alcuni candidati rispetto ad altri.

3.2.1 Metodo di analisi delle sequenze dei promotori delle proteine di riserva del seme di riso (PRSR)

Per la costruzione di promotori sintetici, la ricerca è stata focalizzata sugli elementi cis-regolatori di promotori endosperma-specifici. A tal fine sono stati esaminati i principali promotori delle PRSR. Questa classe di promotori è nota per indurre una massiva espressione nell’endosperma e nello strato aleuronico, ma non negli altri tessuti compreso l’embrione. Sono stati scelti 14 promotori su cui eseguire un’analisi di sequenza per determinare presenza e disposizione di specifici elementi regolatori e per mettere in relazione questi ultimi con il livello e il profilo spazio-temporale di espressione.

Le principali PRSR sono le prolamine, le gluteline e le globuline. Le prolamine di riso sono una famiglia di proteine composta da 4 unità, dove ogni polipeptide è codificato da un gene dotato di un proprio promotore. Questi promotori sono identificati come 10 kDa, PG5 13 kDa, NRP 33 13 kDa e 16 kDa dal peso dei polipeptidi di cui inducono l’espressione. Sono note due prolamina da 13kDa codificate da due diversi geni, appunto PG5 e NRP 33. I due promotori sono stati studiati in due diversi lavori. Quindi è stato ritenuto opportuno prenderli in esame tutti e due.

Sono stati inclusi nell’analisi 9 promotori appartenenti alle 3 sottofamiglie di glutelina (A, B e C). Il promotore della subunità da 26kDa della alfa globulina è stato esaminato con particolare attenzione per l’alta espressione che induce rispetto alle ridotte dimensioni.

47

Tabella 2. Promotori analizzati, abbreviazioni utilizzate in questa tesi di dottorato, numeri di accessione e riferimento bibliografico da cui sono state tratte informazioni

Promotore Abb. Accessione Riferimento bibliografico

Prolamina 10kDa Prol10 AY427572 Qu e Takaiwa, 2004 Prolamina 13kDa, PG5 PG5 AY427573 Qu e Takaiwa, 2004 Prolamina 13kDa, NRP33 NRP33 AD63901 Sha et al., 1996 Prolamina 16kDa Prol16 AY427574 Qu e Takaiwa, 2004 Glutelina A1 GluA1 EU264102 Qu et al., 2008 Glutelina A2 GluA2 EU264103 Qu et al., 2008 Glutelina A3 GluA3 EU264104 Qu et al., 2008 Glutelina B1 GluB1 AY427569 Qu e Takaiwa, 2004 Glutelina B2 GluB2 AY427570 Qu e Takaiwa, 2004 Glutelina B3 GluB3 EU264105 Qu et al., 2008 Glutelina B4 GluB4 AY427571 Qu e Takaiwa, 2004 Glutelina B5 GluB5 EU264106 Qu et al., 2008

Glutelina C GluC EU264107 Qu et al., 2008

Globulina 26kDa Glb AY427575 Qu e Takaiwa, 2004

Su questi 14 promotori è stata condotta un’analisi di sequenza con l’obiettivo di individuare gli elementi cis-regolatori che conferiscono specificità e che regolano la velocità di trascrizione.

Gli elementi regolatori sono stati annotati sulle sequenze utilizzando il

software di gestione di sequenza BioEdit (§4.1). Le sequenze con le

annotazioni sono state salvate come file in formato *.gb. Nel capitolo 5.1, alcuni grafici a barre riassumono i risultati dell’analisi sotto forma di mappa fisica lineare.

In un primo momento, era stato previsto di ottenere un risultato idoneo solo con l’ausilio delle specifiche banche dati disponibili in rete. Poiché questo approccio non è apparso sufficiente, è stato applicato un metodo di analisi più approfondito che verrà descritto di seguito in questo capitolo.

3.2.2 Analisi basata sull’interrogazione delle banche dati

Nella parte iniziale di questo dottorato sono state utilizzate tre banche dati relative ai promotori vegetali: PLACE, TRANSFACT e PlantCARE (§4.1).

48 PLACE restituisce un gran numero di possibili elementi cis-regolatori, per la maggior parte poco o per nulla correlati con la reale funzione del promotore. L’analisi svolta dal programma sulla banca dati lascia all’utente il compito di distinguere le informazioni utili dal rumore di fondo. Oltre a ciò la banca dati non è più aggiornata dal 2007.

TRANSFACT e PlantCARE forniscono un risultato molto più semplice da consultare. Entrambi però non sono particolarmente adatti per studiare i promotori endosperma-specifici. Le informazioni che forniscono sono ottenibili anche da una superficiale ricerca bibliografica. In conclusione non è stato possibile procedere nel lavoro limitandosi al solo uso di questi strumenti.

3.2.3 Sviluppo di un metodo basato sui dati reperiti in letteratura

Vista l’impossibilità di analizzare in maniera soddisfacente le sequenze dei promotori basandosi solo su strumenti informatici, si è proceduto a un lavoro d’integrazione delle informazioni pubblicate negli articoli che trattano l’argomento specifico. Diversi algoritmi sono disponibili per l'individuazione di motivi cis-regolatori (§1.3.1), ma in genere essi sono concepiti per lavorare su un intero genoma e non su un ridotto numero di promotori. Poiché 14 promotori rappresentano un campione troppo esiguo per l’applicazione fruttuosa degli algoritmi statistici citati in introduzione, si è preferito effettuare la ricerca manualmente, tenendo in considerazione i principi base che regolano il funzionamento degli strumenti di analisi di sequenza automatici.

In questo paragrafo viene descritto il metodo seguito per l’analisi delle 14 sequenze. Questo metodo, messo a punto nella fase iniziale del dottorato, ha portato all’individuazione delle possibili sequenze consenso dei quattro principali elementi cis-regolatori implicati nell’espressione in endosperma di riso. Le sequenze consenso individuate sono state classificate secondo il grado di probabilità che esse svolgano un’effettiva funzione in vivo. Per stilare una lista dei possibili consensi sono stati principalmente osservati i risultati di alcuni esperimenti pubblicati nel corso della caratterizzazione della sequenza costituita dai 197 nucleotidi a monte

49 del sito di inizio trascrizione del promotore della glutelina B1, [-197;-1] (Wu et al., 1998; Washida et al., 1999; Wu et al., 2000). Inoltre, sono state determinanti le osservazioni dei risultati degli esperimenti di methilation

interference condotti sul promotore della prolamina 13kDa NRP33  [-300;-1] e sul promotore della globulina 26kDa [-190;-1]. Questi esperimenti sono stati condotti al fine di caratterizzare la specificità di legame di due fattori di trascrizione espressi nel seme di riso (Yamamoto et al., 2006). Il quadro è stato completato ricercando in letteratura qualsiasi informazione che permettesse di desumere le sequenze consenso legate da fattori trans-agenti caratteristici delle prime fasi della maturazione del seme di riso. In questo modo è stato creato una sorta di “dizionario” in modo analogo a quello che avviene negli algoritmi per l'individuazione automatica dei consensi. L’identificazione dei motivi costituenti elementi regolatori si è basata su 3 criteri. Nel dettaglio, sono state accettate come sequenze consenso:

1. Motivi che causano una perdita di attività del promotore qualora mutati o deleti.

2. Motivi che vengono legati da particolari fattori di trascrizione in esperimenti di protezione dalla metilazione.

3. Motivi che inseriti in un promotore lo rendono suscettibile all’attivazione di particolari fattori di trascrizione.

Tabella 3. Sequenze consenso identificate in base ai dati reperiti in letteratura. Il codice di ambiguità è: R=A/G, Y=C/G, K=G/T, S=G/C, M=A/C, W=A/T, B=G/C/T, V=A/G/C, D=A/G/T, H=A/C/T, N=A/G/C/T

GCN4 Prol-Box AACA ACGT

GluB1

TGAGTCA TGCAAAG

AGGAAAG YAACAAAC GTACGTGC

NRP33

TGACTCA

CATAAAG