• Non ci sono risultati.

5. RISULTATI Uno screening della libreria di DNA genomico di

N/A
N/A
Protected

Academic year: 2021

Condividi "5. RISULTATI Uno screening della libreria di DNA genomico di"

Copied!
37
0
0

Testo completo

(1)

5. RISULTATI

Uno screening della libreria di DNA genomico di H.annuus è stato effettuato mediante ibridazione su filtro utilizzando una sonda costruita sull’intero cDNA di HaL1L. Cloni risultati positivi all’ibridazione sono stati verificati, tramite PCR, con diverse coppie di primer disegnati sul cDNA di HaL1L e su sequenze EST (Expressed Sequenze Target) identificate, mediante ricerca in banca dati, come contenenti il dominio conservato delle HAP3 di tipo LEC (in Materiali e Metodi). I pattern di amplificazione indicano un certo grado di eterogeneità degli inserti (Tab. 5.1), che è confermata anche dai pattern di restrizione (dato non mostrato). Southern-blot preliminari avevano indicato che componenti la famiglia della sub-unità B del fattore di trascrizione NF-Y sono probabilmente meno numerosi in H. annuus che in A. thaliana, in accordo con il piccolo numero di sequenze disponibili nelle banche dati di EST. In A. thaliana, viceversa, sono state individuate almeno dodici sequenze genomiche che codificano per altrettanti peptidi. Solo il sequenziamento dei BAC selezionati chiarirà tuttavia definitivamente il tipo di inserto. Al momento, dato il costo elevato del servizio, un unico BAC è stato inviato alla ditta Eurofins MWG Operon (Germania) per il sequenziamento. La sequenza nucleotidica ottenuta, di circa 139.000 bp, è stata analizzata sottoponendola ad una serie di programmi disponibili in rete per la identificazione delle caratteristiche relative (Fig.5.1).

Per altri BAC è nostra intenzione preparare librerie shot-gun che, in associazione con la tecnica del genome walking ci permetteranno di sequenziarli in tutto o in parte.

(2)

Cloni

SONDA1R

SONDA1F

SONDA2R

SONDA2F

TCR

TCF

AGIR

AGIF

DHOR

DHOF

QUER

QUEF

bp

1007 266

371

212

170

235

1 37F22

+ +

-

-

- -

2 32C23

+ +

-

-

- -

3 20B24

+

-

-

-

-

-

4 85F22

- -

+

- - -

5 95M24

+ +

-

-

- -

6

78I18

- -

-

-

+

-

7

60I19

- -

-

-

-

+

8 135I01

+ +

-

-

+

-

9 233K20

+ +

-

-

- -

10 212E17

+ +

-

-

+

-

11 228F1

+ +

-

+

- -

12 188K4

+ +

-

-

- -

13 324C11

+

-

-

+ +

-

14 424P21

+ +

-

+ +

-

15 468G10

+ +

-

+

- -

16 471L4

+ +

-

-

- -

17 433K22

- -

-

-

+

-

18 479J16

+ +

-

-

+

-

19 519E21

+ +

-

-

+

-

20 507F21

+ +

-

+ +

-

Tab.5.1: Screening dei cloni effettuato mediante PCR.

I segnali + e – indicano la presenza o meno dell’amplificato ottenuto con la coppia di oligonucleotidi indicata nella prima riga della tabella. Nella colonna in verde: le sigle dei cloni. Il clone 135I01 è stato scelto per il sequenziamento.

La sequenza del BAC ha confermato la sequenza del frammento già ottenuta con la tecnica della 5’ 3’RAGE. La regione di 645 pb codificante il peptide è interrotta da un introne di 864 pb che rispetta la regola GT/AG nei siti di splicing e che è posizionato dopo il nucleotide +102, quando la numerazione dei nucleotidi della sequenza genomica inizia con il putativo sito di inizio della trascrizione (TSS). L’allineamento, ottenuto con il programma ClustalW, della sequenza genomica di H. annuus con la corrispondente regione del cromosoma V di Arabidopsis thaliana, evidenzia, inoltre, che la sequenza ottenuta per l’H. annuus comprende una porzione dei geni a monte e a valle del gene HaL1L e risulta conservata tra specie diverse la posizione relativa dei geni

(3)

collocati nella regione esaminata. Analisi effettuate con i programmi Fasta e Blast mostrano infatti che HaL1L è preceduto da una sequenza omologa a quella di un fattore di trascrizione legante il DNA, presente al 5’ dell’AtL1L di Arabidopsis thaliana (codice di accesso: At5G47660.1), mentre al 3’ del gene in entrambe le specie è posizionata una RNA binding/tRNA metiltransferasi, contenente un dominio tRNA (guanina-9-)-metiltransferasi (codice di accesso per A. thaliana: AT5G47680.1). Per quanto riguarda invece le lunghezze delle regioni intergeniche solo il gene a valle è posizionato ad una distanza paragonabile: 353 pb in H. annuus e 354 pb in A. thaliana; viceversa in H. annuus il gene a monte di L1L è ad una distanza maggiore, 1601 pb, che in A. thaliana, 424 pb. La lunghezza delle regioni intergeniche sono calcolate in riferimento ai codoni di inizio e fine delle regioni codificanti i relativi peptidi, non essendo note per A. thaliana le lunghezze dei rispettivi trascritti (Fig. 5.2).

(4)

ATG CA -1/+1 esone 1 TAA+1712 esone 2 introne +1554 +966 +103 +45

Clone 135I01 139.000 bp

99 Fig.5.1: Schema della mappa fisica del BAC 135I01.

Frammento contenente:

Retrotrasposone (da BLAST- NCBI) simile a fattore di trascrizione legante il DNA di A. thaliana: At5G47660.1 HaL1L simile a RNA (guanina-9-) metiltransferasi di A. thaliana: AT5G47680.1

(5)

CGACGGCCCGGGCT -2418 GGTAAAATGAACGTGCGTAATTACCTGTTGTACGTGATGTACGTTAAGTCGTAATGTACAATTCTACGTGATATTAAAATTACCGATATCCCACCGCGAT -2318 GGCCTATATCTCAAATATCGGTCCTTGACCGATAACCAATTTTTTACCCACATTAACCAATTTTTTATCACATTAACTAATTCGTTTTTTCTTTCTTTTC -2218 AGCCCTTCTTCATCTGAGGAAACCGGCAAATTGCAAGAACCAGTCGAGGAGTCCGTAAACAAGAAAAAGAGGAAGAGAAAATCAAGGAGGAAGATGGAGT -2118 TGTTTGTCGAAAGCATGATGAGAACAGTAATCCAAAAACAGGAAGAAATGCATAAACAGTTGATCGAGATGTTGGAACAGAAAGAAAAAGAAAGCATCAT -2018 GCGCGAACAAGCATGGAAGAAACAAGAGATCGCTAGAGCAAAGAGGGACGAACACGCTAGAAAACAACACATATCGCAAAGCCTCGCTCTCATTTCTTTC -1918 ATCAAAAACACATTGGGCCAAGAGATCCAAATCCCAGATTCTCTCGACATACAAGTTGATAATCAGAATCATCAAAGTCAAGAAAAGTCAACGTATGATG -1818 ATATAGAAATGCATAACGTTGACGAATATGAGACGGACACGAATACCAAAAGATGGCCGAAATCTGAAGTGCAAGCGCTTATAACAGTTAGAGTTGCTCT -1718 GAATCAGAAGTTTAACGGGAAGATACCGAAAGCGTCTATTTGGGACGAAGTTGCTGCTGGTTTATCCAGTATGGGTTATAACCGGACCCCGAAAAAGTGC -1618 AAAGAGAAATGGGAAAACATCAACAAGTATTACAGAAGAACGATGGAGAAAGGGAAAGGATAGTAAATCATGCGCGTATTTCAGTGAGTTGGAAATGTTG -1518 CATAAAACCGGCTTTATCTCGTCAACTTCGCATGATGAAGATCACAGCATCAAGGTTGTTTCGTCAAATTCTCATGACGAGGATCAAAGCATTAAGGTTG -1418 TTTCATCAAACTCTCATGATGAGGGTCAAAACATGAAGGTTATTTCATCGGACTCTCTTGATGAGGATCAAAGCATGAAGGTTATGTCATCAAACTCTCT -1318 TGATGAGGATCAAAGGATCAAGGTCTTGCACTAGAATTCAAATATTGAGACGGGTTTGCGATTATGTTCTTATGACTGTATCAAATTTTGTCCAAGTGTA -1218 GACTTGATGAACTTATTTTGTTGTATCGTTGTCATAGAAGTAGAAGAAATGTTGTTCAATTTGAAATCTCATGGCAGATTTCCTTTAGTTTTAATAGACT -1118 TTTGACTTTGTGAAATTAAATGCTCAAAACACCATAACGTAATGGTAAAGTTATAGTTTTTCAACTGACCCACTTCTTTATGTCTCTTGCTATTCTGTTT -1018 GGCATTAAAAAATCCAATGTCCATCAACTTAATTTTGATATACATTTGTCTTTGGACATGTTTAAGATACATGTAGATATAAAATTATTTTTCAAAATGT -918 CAAGTTGCCTCTTAAATAGTTAAAATGGACAACCCTTAATTAAAATGACACTCTGCGAAAAACGTTGACACATGAAATCCCACATTAACAACATCGTCTG -818 TATGCCTATGATTATAGGCTAGTGACATCTTGGGGGTGAGATAAGACTTTTGGACCACTAGGTCCTGGGTTCAAATGGGTTTTTCCCAGATTTATTGAGT -718 TTCCTCCTGAATTAGTGTATAGCCGTTATAGCCTAGTGGAGATGGATATGATCGGGTGGTTCCGCTGGTGGCACGATGATACTCCAGTGGTCCGTCAGTG -618 ATCCTAACTTGCCGTTCAAAAAGAACATCGTCTGTATATATAGCCTCTGCACATGTAACAGTTGCGCCACTAACCAATGGTTGTCGTTGACACGTTTGAT -518 ACGCGATATTAAAAAATGAGTTGAGAGATTATTTTACACAAATCAAGGAAATATGTGATAATTTTTAATGGTATAATTAACCTTGTCTTAAAATGGATTT -418 TCATTATTATGAAATAATTTAGACATTCTTGTGATATATGCATCATCCAAGGTCCTAAAGACATTTTCTTAATAAAAACAAAGATTAAATCATAAAAAAA -318 ACATTAAATTATGATTAAATCTGCCAACTAACTATTGATTGGATTAAGAAATATAGAACGACACAGGAGGAGGCATGGACCATGTAGATCCAAAAGTCAT -218 AAATCAAAGTAATTAAAGTGCATGCATTAGTCAAAGAGGGTGGTGGTCAAATCAAATGCACCTTAACCAAAAACACTCAATGCTAACCAACTTTGGTAGC -118

TCCGGCGAATACCCGGTTCTTGTTCACTGAGCCACCATGCCACGTGTCCTCACCACCCCACCGGCCCACCACCATCAGCAGCAGCTCCTTATATTATCTC -18

CTCCTCACTTTGTTTTCAATTTCTAGAGAGAGACAATTCCCTCCCTTAGAGAGAGAAACATATGGAACGTGGAGGAGGTTTCCATGGCTACCACAGGCTC +83

(6)

CTGCATCTGCATTGGCCTTTTTATTCTTCATCTGCAATATCATGTTTTCTTGCTATGTTTTTCTTTTATATATATATATATGTGTGTGTATATATATAAT +283 ATAGATACATATATATACACATCGGTGAACGAAAGGGGTCAAGAGGGTTTGCTGATCGCTGACCACTAGGCGTCTTCGTTATTCTAAGAAGTTCTGGTTC +383 CGCCACTGGATGTATACCATACACGTACGTATAGTTATTATGTTTGGTGTTGGAACAAGATCAAGAAATTTTTTTTTTACATTTTTAAAAGATTCTTTAA +483 TTTTTACTGTTTTGAGGATTCATAACTACTTTTACAGGCAATCTTCTGACACATAGACTCAGGCTAAGCTATTATTGATTGTTTTTAAGGTATCTTATGT +583 TGATTTGTAAGCAGTTTTAACTTGAAACAACAAGATTTCTTGGAGTTTTAAGTGTGATTGATTGTATACAACAATGGTGGTCTGTTTGATCTGATTTAGG +683 TTGTTGAATCTGAGTGAGATGTGTTAGTGACAGTGTGTGTTCGAATGTGTGTGGAAGGAGGACAAATATTGTAGAACAAGTGGCATGCATGCAAGAATAT +783 TACTCTCTTGTTTTGTCCCCACGAATCTGTCATTTTTGCACACTTCACTGGTTTTTGTTTTCACCATTTAACTTTCTTTTTTTAATTATTACTACAATGA +883 ATATATGTATATATGATGTCATTAATATGATGTTATATATTCTTTTTAGTTTTATAATTTTTTTTTTATTTTTTTGATCTTAGGGATGCAACAGCCGGAT +983 ATGAAGCAGAAGCAACCAGACACAACCAACACCACATCTACAGAAGACAATGAGTGCATTGTTAGAGAGCAAGACCGCTTTATGCCGATAGCAAACGTGA +1083 TCAGGGTCATGCGAAAGATCTTGCCACCTCACGCGAAGATCTCTGACGACGCAAAAGAAACGATCCAAGAATGTGTTTCCGAGTACATTAGTTTTGTGAC +1183 AGGTGAAGCGAATGACCGTTGCCAACGCGAGCAGAGAAAGACTATCACAGCTGAAGATGTGTTGTGGGCTATGAGCAAACTCGGGTTTGATGACTATATC +1283 GAACCGTTGACTGTGTATCTTCATCGCTACAGGGAGTTTGATGGGGGTGAGCGTGGGTCGATAAGGGGTGAGCCGCTTGTCAAGAGGGCTGCGGCTACTG +1383 CTGACCCTGGTCCGTTTGGTATGGGTCCGTTTGTGCCTGGTTCTCACATGGGTCATCATAATGGGTTCTTTGGTCCTGCTAGCATTGCTGGTTTCTTTAA +1483 GGACCCGTCGAGTGCGGCTGGCCAGTCTGGGCCTGCTGGTTTCGAGCCGTATGCTCAGTGTAAAGACTAACTGGTTTCGATTTTCGAGCCGTGTGTTGGT +1583 TGGTTTGTTTTTTTTTCTTGTTTGTTTGTCTTCTTGGTCTTGGAGCAACAAATTACATTGGGTCAAACTTTGGCAAGGCATGTAAAAACTGACACTCTCC +1683

ATCTACTGGTAGTAATCTGCTTTTCTTCCTAACTTTTATTTTATGAATTTGGAGTGTTTAAGATTTAACAGTTCCGTTATTATTAGTATTTTTTTAACAT +1783

TTAAAAATATCAATTAATGATTAAAAATGTTTAAATAATATTTTCCTAACATTTAACCCGGTATTATTGGTGTTTTTTGAAACGATGCTTGCTTTCTCTT +1883 CCAAAATTTGTGCCATCGCCCTAGCCTGGATTTGTCGAGAAAGACAAAATGAATGGCTAGTTACTAACCTACTCGACGCGGGAAGGGATTTACAACGTCT +1983 CTGATCTGAAGAACTACAGCTTTTTGTATTCAATATCCGATAAAAATGCTCAAGAAATCATGATTAGTCCT +2054

Fig. 5.2: Intera sequenza del gene HaL1L di H. annuus. La sequenza codificante (in nero) è interrota da un introne di 864 bp (siti di splicing GT / AG). ATG codone di inizio, TAA codone di stop. TTATAT promotore di tipo TATA a -29 bp dal sito di inizio della trascrizione (TSS) individuabile nel dimero CA. TCAATTT indica l’Initiator motif dove il nucleotide A costituisce il TSS. ATTGG elemento tipico del promotore presente nell’orientamento revertito (CCAAT) a -280 bp dall’inizio della trascrizione. Zone ricche in CG, evidenziate in celeste, posizionate rispettivamente da -153 a -55 e da -730 a -530. GCAACAAATT e GTAAAAACT segnali di poliadenilazione nucleare posizionati rispettivamente a -85 e a -48 dall’ultimo nucleotide presente sul 3’UTR dell’mRNA CTA identificato nella C. Dallo stesso nucleotide, a +23 è posizionato AGTGTTTA segnale di terminazione della trascrizione. GTTTGTTTTTT segnale di poliadenilazione citoplasmatica definita CPE (Cytoplasmic Polyadenylation Element), posizionata a –127 bp dal sito di taglio del trascritto, che avviene in corrispondenza del dinucleotide TA. In grigio sono evidenziate le sequenze geniche a monte e a valle dell’HaL1L. Il 3’ e il 5’ UTR sono evidenziati in giallo.

(7)

5.1 Analisi della regione 5’ del gene HaL1L

I programmi TSSP e CpGfinder, disponibili al sito Softberry (http://www.softberry.com), hanno permesso di individuare elementi caratterizzanti il promotore nelle piante (Fig.5.3). Esso è risultato essere di tipo TATA per la presenza a -29 pb dal codone di inizio della trascrizione della sequenza TTATA.

Sono riconoscibili due residui di citosina immediatamente adiacenti al 5’ del TATA box ed il motivo Y-Patch (CTCCTC) presente in posizione -20 in H. annuus. Inoltre, il putativo sito di inizio della trascrizione (TSS) è individuabile nel dimero CA. In questa regione è riconoscibile anche l’Initiator motif: TCAATTT, dove il nucleotide A costituisce il TSS, che rispetta perfettamente la regola: YYANWYY (Y=C/T; R = A/G; W=A/T; N = qualsiasi base). Questo motivo è presente in alcuni promotori di mammiferi ed è funzionale anche nelle piante (Carey M and Smale ST

2001, Nakamura et al. 2002). In Arabidopsis thaliana meno del 10% dei

promotori possiede questo motivo, nel 77% dei promotori viene solo rispettata la YR rule dove il sito di inizio, sottolineato, può essere un nucleotide A o G (R) preceduto da un nucleotide C o T. La numerazione della sequenza di DNA ottenuta inizia da questo dimero (-1/+1), dove il residuo di adenina rappresenta il primo nucleotide trascritto. Altri elementi tipici del promotore sono riconoscibili nella sequenza CCAAT, che è presente nell’orientamento revertito a partire dal nucleotide -280, e nelle due zone ricche in CG posizionate rispettivamente da -730 a -530 e da -153 a -55.

(8)

AGATT...GTCGT GTTTGTTTT +1586/+1596 esone 1 esone 2 +1736/+1743 +1628/+1637 GCAACAAATT

+1665/+1673 +1554 +1903 GTAAAAACT

introne

AACCA………CCAC

-154/-56

Isola 2 CG

Isola 1 CG

CA -1/+1 -1554 -731 -542 +6 +966 +1712 +45 AGTGTTTA +103 TAA ATG 103 Fig. 5.3: Promotore prossimale.

Isola 1 e isola 2 CG: regioni ricche in CG; CA: TSS;

ATG: codone inizio della traduzione; TAA: codone di stop della traduzione; In blu regione corrispondente al mRNA;

(9)

5.2 Cis-acting sequence

In aggiunta all’analisi della regione del promotore prossimale descritta sopra, è stata eseguita una ricerca dei possibili siti di legame per trans-acting factor (Fig. 5.4). A tale proposito le sequenze intergeniche a monte e a valle del gene, oltre alla sequenza dell’introne, sono state confrontate con diversi database presenti in rete. In particolare il software MatInspector (Cartharius et al., 2005), che utilizza il database: matrici per fattori di trascrizione delle piante, permette di visualizzare graficamente le sequenze di interesse. I grafici ottenuti (Tab. 5.2, Tab. 5.3, Tab. 5.4) sono stati rielaborati tenendo conto delle caratteristiche intrinseche del gene, evidenziando particolari fattori di trascrizione associabili.

(10)

P$CAAT P$BLR P$BLR P$BLR

Promotore prossimale

-1554 +44 P$WUS P$WUS

P$WUS Fig. 5.4: Motivi per i fattori di

trascrizione.

Promotore prossimale:

P$BLR: Arabidopsis homeobox protein

P$CAAT; CCAAT binding factors P$WUS: Arabidopsis homeobox protein

Introne:

P$SUCROSE: Sucrose box

P$SEBF: Auxin response element P$ABF1: ABA response elements P$ARE: Auxin response element P$ABF1: ABA response elements Regione 3':

P$AGL3: MADS box proteins P$BZR1: Brassinosteroid (BR) response element 100 bp P$ABF1 P$BLR P$ARE

Introne

+103 +966 P$WUS P$SEBF P$SUCROSE P$SUCROSE 100 bp P$BZR1 P$WUS P$AGL3

Regione 3’

+1554 +1903

P$CAAT P$SUCROSE P$WUS P$CAAT

P$BLR

(11)

Tab. 5.2: Matrice per fattori di trascrizione nella regione al 5’ del gene HaL1L.

Permette di visualizzare le sequenze di interesse. La matrice indica la sequenza di legame per il fattore di trascrizione. Il valore ci indica il grado di conservazione di ciascuna posizione all’interno della matrice, va da 0 a un max di 100. L’anchor è la posizione al centro della matrice. Il core è la regione più conservata della matrice. Alla matrice di similarità viene assegnato il valore 1 quando c’è perfetta corrispondenza con la matrice.

Posizione Matrice Informazioni sulla famiglia

da a anchor Filamento

Matrice di similarità

Sequenza (in rosso: valore ci >60; in maiuscolo:

sequenza “core”)

P$ATSR1.01 Calmodulin binding / CGCG box binding proteins

-1548 -1532 -1540 (+) 0.933 atgCGCGtatttcagtg

P$CARE.01 MYB-like proteins -1538 -1522 -1530 (+) 0.950 ttcagtgAGTTggaaat

P$GATA.01 Plant I-Box sites -1511 -1495 -1503 (-) 0.940 gacgaGATAaagccggt

P$DOF3.01 DNA binding with one

finger (DOF) -1511 -1495 -1503 (-) 0.994 gacgagatAAAGccggt

P$GAP.01 GAP-Box (light

response elements) -1487 -1473 -1480 (+) 0.929 catgATGAagatcac

P$WRKY.01 W Box family -1462 -1446 -1454 (-) 0.925 agaatTTGAcgaaacaa

P$TGA1.01 Plant G-box/C-box

bZIP proteins

-1449 -1429 -1439 (+) 0.902 ttctcaTGACgaggatcaaag

P$WUS.01 Arabidopsis homeobox

protein -1429 -1419 -1424 (-) 1.000 aacctTAATgc

P$WRKY.01 W Box family -1400 -1384 -1392 (-) 0.943 atgttTTGAccctcatc

P$O2.01 Opaque-2 like

transcriptional

(12)

activators

P$NCS1.01 Nodulin consensus

sequence 1

-1307 -1297 -1302 (+) 0.897 cAAAGgatcaa

P$AS1_AS2_II.01 AS1/AS2 repressor complex

-1282 -1274 -1278 (-) 0.894 tatTTGAat

P$ID1.01 ID domain factors -1234 -1222 -1228 (+) 0.967 aattTTGTccaag

P$TEIL.01 Ethylen insensitive 3

like factors -1211 -1203 -1207 (+) 0.926 aTGAActta

P$BLR.01 Arabidopsis homeobox

protein -1209 -1199 -1204 (+) 0.924 gaaCTTAtttt

P$CCA1.01 Circadian control

factors

-1144 -1130 -1137 (-) 0.857 ctaaaggaAATCtgc

P$DOF1.01 DNA binding with one

finger (DOF)

-1140 -1124 -1132 (-) 0.983 ttaaaactAAAGgaaat

P$WRKY.01 W Box family -1121 -1105 -1113 (+) 0.958 gacttTTGActttgtga

P$ATML1.02 L1 box, motif for L1 layer-specific

expression

-1109 -1093 -1101 (-) 0.831 gagCATTtaatttcaca

P$SBF1.01 GT-box elements -1109 -1093 -1101 (+) 0.884 tgtgaaaTTAAatgctc

P$HDG9.01 L1 box, motif for L1 layer-specific

expression

-1107 -1091 -1099 (+) 0.945 tgaaatTAAAtgctcaa

P$CARICH.01 CA-rich motif -1097 -1079 -1088 (+) 0.803 tgctcaaAACAccataacg

P$GT3A.01 GT-box elements -1079 -1063 -1071 (-) 0.840 tataacTTTAccattac

P$ATMYB77.01 MYB-like proteins -1061 -1045 -1053 (-) 0.874 gtgggtCAGTtgaaaaa

(13)

elements

P$HSE.01 Heat shock factors -1045 -1031 -1038 (-) 0.879 agagacataaAGAAg

P$NCS2.01 Nodulin consensus

sequence 2

-1040 -1026 -1033 (+) 0.854 ttatgtCTCTtgcta

P$PDF2.01 L1 box, motif for L1 layer-specific

expression

-1020 -1004 -1012 (-) 0.855 gattttTTAAtgccaaa

P$SBF1.01 GT-box elements -1020 -1004 -1012 (+) 0.909 tttggcaTTAAaaaatc

P$WUS.01 Arabidopsis homeobox

protein -1016 -1006 -1011 (-) 1.000 tttttTAATgc

P$CAAT.01 CCAAT binding

factors

-1006 -998 -1002 (+) 0.991 atCCAAtgt

P$BLR.01 Arabidopsis homeobox

protein

-993 -983 -988 (+) 0.925 caaCTTAattt

P$ICE.01 Myc-like basic

helix-loop-helix binding factors

-981 -963 -973 (+) 0.977 gatatACATttgtctttgg

P$ID1.01 ID domain factors -976 -964 -970 (+) 0.943 acatTTGTctttg

P$O2_GCN4.01 Opaque-2 like

transcriptional activators

-968 -952 -960 (+) 0.847 ctttggACATgtttaag

P$TEIL.01 Ethylen insensitive 3 like factors

-954 -946 -950 (-) 0.981 aTGTAtctt

P$RAP22.01 Light responsive element motif, not modulated by different

(14)

light qualities

P$SUCROSE.01 Sucrose box -938 -920 -929 (+) 0.848 taAAATtatttttcaaaat

P$BLR.01 Arabidopsis homeobox

protei

-937 -927 -932 (+) 0.998 aaaATTAtttt

P$ATHB1.01 Arabidopsis homeobox

protein

-937 -927 -932 (-) 0.901 aaaATAAtttt

P$NCS2.01 Nodulin consensus

sequence 2 -915 -901 -908 (+) 0.867 agttgcCTCTtaaat

P$SBF1.01 GT-box elements -905 -889 -897 (+) 0.913 taaatagTTAAaatgga

P$SBF1.01 GT-box elements -885 -869 -877 (+) 0.878 cccttaaTTAAaatgac

P$MYCRS.01 Myc-like basic helix-loop-helix binding factors

-856 -838 -847 (-) 0.936 ggatttcATGTgtcaacgt

P$ABRE.01 ABA response

elements

-854 -838 -846 (-) 0.820 ggatttcATGTgtcaac

P$USE.01 Upstream sequence

element of U-snRNA genes

-844 -828 -836 (+) 0.807 gaaatcCCACattaaca

P$GT1.01 GT-box elements -839 -823 -831 (-) 0.908 gatgttGTTAatgtggg

P$WUS.01 Arabidopsis homeobox

protein

-836 -826 -831 (-) 1.000 gttgtTAATgt

P$HAHB4.01 Arabidopsis homeobox

protein

-813 -803 -808 (+) 0.925 cctatgATTAt

P$GATA.01 Plant I-Box sites -783 -767 -775 (+) 0.968 ggtgaGATAagactttt

P$CCA1.01 Circadian control

(15)

P$GAMYB.01 MYB-like proteins -701 -685 -693 (+) 0.922 gtatagccGTTAtagcc

P$MSA.01 M-phase-specific

activator elements

-700 -686 -693 (-) 0.931 gctatAACGgctata

P$HVMCB1.01 MYB proteins with single DNA binding repeat

-681 -665 -673 (-) 0.946 gatcatATCCatctcca

P$LFY.01 LFY binding site -636 -624 -630 (+) 0.939 cTCCAgtggtccg

P$HBP1B.01 Plant G-box/C-box

bZIP proteins

-634 -614 -624 (+) 0.853 ccagtggtCCGTcagtgatcc

P$PALBOXA.01 Conserved box A in PAL and 4CL gene promoters

-613 -595 -604 (+) 0.841 taacttgCCGTtcaaaaaa

P$MSA.01 M-phase-specific

activator elements

-611 -597 -604 (-) 0.893 ttttgAACGgcaagt

O$PTATA.01 Plant TATA binding

protein factor

-588 -574 -581 (-) 0.893 gctaTATAtacagac

O$PTATA.02 Plant TATA binding

protein factor -587 -573 -580 (+) 0.936 tctgTATAtatagcc

O$PTATA.02 Plant TATA binding

protein factor -586 -572 -579 (-) 0.969 aggcTATAtatacag

P$GT3A.01 GT-box elements -569 -553 -561 (-) 0.902 gcaactGTTAcatgtgc

P$AS1_AS2_I.01 MYB-like proteins -567 -551 -559 (-) 1.000 gcgcaaCTGTtacatgt

P$ATMYB77.01 MYB-like proteins -565 -549 -557 (+) 0.890 atgtaaCAGTtgcgcca

P$LFY.01 LFY binding site -548 -536 -542 (-) 0.976 aACCAttggttag

P$LFY.01 LFY binding site -546 -534 -540 (+) 0.988 aACCAatggttgt

(16)

factors

P$ID1.01 ID domain factor -541 -529 -535 (+) 0.925 atggTTGTcgttg

P$GBF1.01 Plant G-box/C-box

bZIP proteins

-535 -515 -525 (-) 0.956 cgtatcaaACGTgtcaacgac

P$MYCRS.01 Myc-like basic helix-loop-helix binding factors

-534 -516 -525 (-) 0.946 gtatcaaACGTgtcaacga

P$AS1_AS2_II.01 AS1/AS2 repressor

complex

-534 -526 -530 (+) 0.932 tcgTTGAca

P$ABRE.01 ABA response

elements

-533 -517 -525 (+) 0.828 cgttgacACGTttgata

P$ABRE.01 ABA response

elements -532 -516 -524 (-) 0.931 tatCGCGtatcaaacgt

P$ATSR1.01 Calmodulin binding / CGCG box binding proteins

-526 -510 -518 (-) 0.897 tatCGCGtatcaaacgt

P$SBF1.01 GT-box elements -516 -500 -508 (+) 0.903 cgcgataTTAAaaaatg

P$CCA1.01 Circadian control

factors

-494 -480 -487 (-) 0.852 tgtaaaatAATCtct

P$BLR.01 Arabidopsis homeobox

protein

-493 -483 -488 (+) 0.902 gagATTAtttt

P$HMG_IY.01 High mobility group

factors

-492 -478 -485 (+) 0.891 agatTATTttacaca

P$AS1_AS2_II.01 AS1/AS2 repressor

complex

-477 -469 -473 (-) 0.906 tccTTGAtt

(17)

protein

P$S1F.01 GT-box elements -454 -438 -446 (+) 0.892 tttaATGGtataattaa

P$HAHB4.01 Arabidopsis homeobox

protein

-448 -438 -443 (+) 0.914 ggtataATTAa

P$GT1.01 GT-box elements -447 -431 -439 (-) 0.867 gacaagGTTAattatac

P$IBOX.01 Plant I-Box sites -442 -426 -434 (-) 0.833 tttaaGACAaggttaat

P$AGL3.01 MADS box proteins -437 -417 -427 (-) 0.852 aaaatCCATtttaagacaagg

P$GAP.01 GAP-Box (light

response elements -424 -410 -417 (-) 0.893 aataATGAaaatcca

P$HAHB4.01 Arabidopsis homeobox

protein

-418 -408 -413 (+) 0.923 ttcattATTAt

P$HMG_IY.01 High mobility group

factors

-412 -398 -405 (-) 0.951 aaatTATTtcataat

P$STK.01 Storekeeper motif -408 -394 -401 (-) 0.891 gtcTAAAttatttca

P$BLR.01 Arabidopsis homeobox

protei -407 -397 -402 (-) 0.998 taaATTAtttc

P$ATHB1.01 Arabidopsis homeobox

protein -407 -397 -402 (+) 0.901 gaaATAAttta

P$ATML1.01 L1 box, motif for L1 layer-specific

expression

-389 -373 -381 (+) 0.834 ttgtgaTATAtgcatca

P$DOF1.01 DNA binding with one

finger (DOF)

-369 -353 -361 (+) 0.985 aaggtcctAAAGacatt

P$SEF4.01 Soybean embryo factor

4

-348 -338 -343 (-) 0.998 tgTTTTtatta

(18)

protein

P$SUCROSE.01 Sucrose box -333 -315 -324 (+) 0.834 ttAAATcataaaaaaaaca

P$ATML1.02 L1 box, motif for L1 layer-specific

expression

-319 -303 -311 (+) 0.833 aaaCATTaaattatgat

P$WUS.01 Arabidopsis homeobox

protein

-317 -307 -312 (-) 1.000 taattTAATgt

P$SBF1.01 GT-box elements -310 -294 -302 (+) 0.910 attatgaTTAAatctgc

P$HAHB4.01 Arabidopsis homeobox

protein -310 -300 -305 (+) 0.907 attatgATTAa

P$HDG9.01 L1 box, motif for L1 layer-specific

expression

-308 -292 -300 (+) 0.828 tatgatTAAAtctgcca

P$WUS.01 Arabidopsis homeobox

protein -306 -296 -301 (-) 0.963 agattTAATca

P$MYBPH3.02 MYB-like proteins -298 -282 -290 (-) 0.929 aatagtTAGTtggcaga

P$CAAT.01 CCAAT binding

factors

-282 -274 -278 (-) 0.993 atCCAAtca

P$WUS.01 Arabidopsis homeobox

protein

-277 -267 -272 (-) 0.963 tttctTAATcc

P$RAP22.01 Light responsive

element motif, not modulated by different light qualities

-237 -227 -232 (-) 0.909 ggATCTacatg

P$AGP1.01 Plant GATA-type zinc

finger protein

(19)

P$SUCROSE.01 Sucrose box -219 -201 -210 (+) 0.921 atAAATcaaagtaattaaa

P$SP8BF.01 Sweet potato

DNA-binding factor with two WRKY-domains

-217 -205 -211 (-) 0.877 atTACTttgattt

P$RY.01 Legumin Box family -212 -186 -199 (-) 0.917 gactaatgCATGcactttaattactt

t

P$SBF1.01 GT-box elements -212 -196 -204 (+) 0.905 aaagtaaTTAAagtgca

P$DOF1.01 DNA binding with one

finger (DOF)

-211 -195 -203 (+) 0.985 aagtaattAAAGtgcat

P$RY.01 Legumin Box family -205 -179 -192 (+) 0.940 ttaaagtgCATGcattagtcaaaga

gg

P$WRKY.01 W Box family -195 -179 -187 (-) 0.982 cctctTTGActaatgca

P$AS1_AS2_II.01 AS1/AS2 repressor

complex

-189 -181 -185 (-) 0.932 tctTTGAct

P$WRKY.01 W Box family -179 -163 -171 (-) 0.949 ttgatTTGAccaccacc

P$TEIL.01 Ethylen insensitive 3

like factors -162 -154 -158 (+) 0.974 aTGCAcctt

P$GT1.01 GT-box elements -161 -145 -153 (-) 0.878 tttttgGTTAaggtgca

P$GAMYB.01 MYB-like proteins -139 -123 -131 (-) 0.945 caaagttgGTTAgcatt

P$AGL1.01 MADS box proteins -137 -117 -127 (-) 0.864 agcTACCaaagttggttagca

P$AGL2.01 MADS box proteins -136 -116 -126 (+) 0.834 ctttgGTAGctccgg

P$MYBC1.01 MYB IIG-type binding

sites -127 -113 -120 (+) 0.929 ctttgGTAGctccgg

P$EMBP1.01 Plant G-box/C-box

bZIP proteins -85 -65 -75 (-) 1.000 gtgaggacACGTggcatggtg

(20)

bZIP proteins

P$OSIRO2.01 Myc-like basic helix-loop-helix binding factors

-84 -66 -75 (-) 0.978 tgaggaCACGtggcatggt

P$CE3.01 Coupling element 3

sequence -84 -66 -75 (-) 0.839 tgaggaCACGtggcatggt

P$PIF3.01 Myc-like basic helix-loop-helix binding factors

-83 -65 -74 (+) 0.911 ccatgcCACGtgtcctcac

P$CE3.01 Coupling element 3

sequence -83 -65 -74 (+) 0.842 ccatgcCACGtgtcctcac

P$RITA1.01 Opaque-2 like

transcriptional activators

-83 -67 -75 (-) 0.977 gaggacACGTggcatgg

P$ABRE.01 ABA response

elements -83 -67 -75 (+) 0.954 ccatgccACGTgtcctc

P$RITA1.01 Opaque-2 like

transcriptional activators

-82 -66 -74 (+) 0.960 catgccACGTgtcctca

P$ABF1.01 ABA response

elements -82 -66 -74 (-) 1.000 tgaggACACgtggcatg

P$DPBF.01 Dc3 promoter binding factors -80 -70 -75 (-) 0.920 gACACgtggca P$DPBF.01 Dc3 promoter binding factors -79 -69 -74 (+) 0.948 gCCACgtgtcc

(21)

sites

P$ABI4.01 Coupling element 1

binding factors

-63 -51 -57 (+) 0.905 acccCACCggccc

P$ATTCP20.01 DNA-binding proteins

with the plant specific TCP-domain

-58 -46 -52 (+) 0.946 accgGCCCaccac

P$GATA.01 Plant I-Box sites -31 -15 -23 (-) 0.940 gaggaGATAatataagg

P$BPC.01 GAGA elements +3 +30 +15 (+) 1.000 ttctagAGAGagacaattccctccc

P$BPC.01 GAGA elements +5 +29 +17 (+) 1.000 ctagagAGAGacaattccctccctt

P$NCS2.01 Nodulin consensus

sequence 2

(22)

Tab. 5.3: Matrice per fattori di trascrizione nella regione al 3’del gene HaL1L.

Permette di visualizzare le sequenze di interesse. La matrice indica la sequenza di legame per il fattore di trascrizione. Il valore ci indica il grado di conservazione di ciascuna posizione all’interno della matrice, va da 0 a un max di 100. L’anchor è la posizione al centro della matrice. Il core è la regione più conservata della matrice. Alla matrice di similarità viene assegnato il valore 1 quando c’è perfetta corrispondenza con la matrice.

Posizione Matrice Informazioni sulla famiglia

da a anchor Filamento Matrice di similarità

Sequenza (in rosso: valore ci >60; in maiuscolo: sequenza “core”) P$BZR1.01 Brassinosteroid (BR) response element +1568 +1584 +1576 (+) 0.954 cgagcCGTGtgttggtt

P$P_ACT.01 MYB IIG-type binding sites +1577 +1591 +1584 (+) 0.974 tgttGGTTggtttgt

P$IDI.01 ID domain factors +1605 +1617 +1611 (+) 0.926 ttgtTTGTcttct

P$RAV5.01 5'-part of bipartite RAV1 binding site

+1627 +1637 +1632 (+) 0.962 agcAACAaatt

P$WRKY.01 W Box family +1638 +1654 +1646 (-) 0.955 aaagtTTGAcccaatgt

P$CAAT.01 CCAAT binding factors +1638 +1646 +1642 (-) 0.977 acCCAAtgt

P$O2_GCN4.01 Opaque-2 like transcriptional activators

+1656 +1672 +1664 (-) 0.834 gtttttACATgccttgc

P$ATMYB77.01 MYB-like proteins +1664 +1680 +1672 (-) 0.870 gagtgtCAGTttttaca

O$DINR.01 Core promoter initiator

elements +1667 +1677 +1672 (-) 0.952 tgTCAGttttt

P$DOF3.01 DNA binding with one finger (DOF)

(23)

P$SUCROSE.01 Sucrose box +1716 +1734 +1725 (-) 0.830 caAATTcataaaataaaag P$HMG_IY.01 High mobility group factors +1716 +1730 +1723 (+) 0.915 ctttTATTttatgaa

P$SBF1.01 GT-box elements +1734 +1750 +1742 (+) 0.872 ggagtgtTTAAgattta

P$AS1_AS2_I.01 MYB-like proteins +1744 +1760 +1752 (-) 1.000 acggaaCTGTtaaatct

P$GAMYB.01 MYB-like proteins +1751 +1767 +1759 (+) 0.927 acagttccGTTAttatt

P$MSA.01 M-phase-specific activator

elements +1752 +1766 +1759 (-) 0.818 ataatAACGgaactg

P$HAHB4.01 Arabidopsis homeobox

protein +1759 +1769 +1764 (+) 0.923 gttattATTAg

P$SBF1.01 GT-box elements +1771 +1787 +1779 (-) 0.890 ttaaatgTTAAaaaaat

P$PDF2.01 L1 box, motif for L1 layer-specific expression

+1776 +1792 +1784 (-) 0.857 tattttTAAAtgttaaa

P$WUS.01 Arabidopsis homeobox

protein +1793 +1803 +1798 (+) 1.000 tcaatTAATga

P$SBF1.01 GT-box elements +1797 +1813 +1805 (+) 0.929 ttaatgaTTAAaaatgt

P$HAHB4.01 Arabidopsis homeobox protein

+1797 +1807 +1802 (-) 0.981 ttaatcATTAa

P$HAHB4.01 Arabidopsis homeobox protein

+1797 +1807 +1802 (+) 0.948 ttaatgATTAa

P$WUS.01 Arabidopsis homeobox

protein

+1801 +1811 +1806 (-) 0.963 attttTAATca

P$NCS1.01 Nodulin consensus sequence

1 +1807 +1817 +1812 (+) 0.853 aAAATgtttaa

P$BLR.01 Arabidopsis homeobox

protein +1815 +1825 +1820 (-) 0.929 aatATTAttta

(24)

1

P$PDF2.01 L1 box, motif for L1 layer-specific expression

+1828 +1844 +1836 (-) 0.885 ccgggtTAAAtgttagg

P$CAAT.01 CCAAT binding factors +1847 +1855 +1851 (-) 0.981 caCCAAtaa

(25)

Tab. 5.4: Matrice per fattori di trascrizione nella regione intronica del gene HaL1L.

Permette di visualizzare le sequenze di interesse. La matrice indica la sequenza di legame per il fattore di trascrizione. Il valore ci indica il grado di conservazione di ciascuna posizione all’interno della matrice, va da 0 a un max di 100. L’anchor è la posizione al centro della matrice. Il core è la regione più conservata della matrice. Alla matrice di similarità viene assegnato il valore 1 quando c’è perfetta corrispondenza con la matrice.

Posizione Matrice Informazioni sulla famiglia

da a anchor Filamento

Matrice di similarità

Sequenza (in rosso: valore ci >60; in maiuscolo: sequenza

“core”)

P$ZMMRP1.01 MYB proteins with single DNA binding repeat

+132 +148 +140 (-) 0.807 ttatataTATAtatgaa

P$ZMMRP1.01 MYB proteins with single

DNA binding repeat +135 +151 +143 (+) 0.807 atatataTATAtaatgt

P$GAAA.01 Pollen-specific regulatory elements

+143 +159 +151 (-) 0.882 ttaaaGAAAcattatat

P$NCS2.01 Nodulin consensus sequence 2

+146 +160 +153 (+) 0.818 taatgtTTCTttaac

P$DOF1.01 DNA binding with one finger (DOF)

+149 +165 +157 (-) 0.982 ataaagttAAAGaaaca

P$MYBST1.01 MYB proteins with single DNA binding repeat

+160 +176 +168 (-) 0.901 ttaactATCCcataaag

P$MYBPH3.02 MYB-like proteins +164 +180 +172 (+) 0.808 atgggaTAGTtaacctc

P$GAP.01 GAP-Box (light response

elements)

+204 +218 +211 (-) 0.965 gcagATGAagaataa

P$ZMMRP1.01 MYB proteins with single DNA binding repeat

(26)

P$ZMMRP1.01 MYB proteins with single DNA binding repeat

+248 +264 +256 (-) 0.807 atatataTATAtataaa

P$ZMMRP1.01 MYB proteins with single

DNA binding repeat +249 +265 +257 (+) 0.807 ttatataTATAtatatg

P$ZMMRP1.01 MYB proteins with single

DNA binding repeat +251 +267 +259 (+) 0.807 atatataTATAtatgtg

P$ZMMRP1.01 MYB proteins with single DNA binding repeat

+255 +271 +263 (+) 0.801 atatataTATGtgtgtg

P$ZMMRP1.01 MYB proteins with single DNA binding repeat

+275 +291 +283 (-) 0.865 gtatctaTATTatatat

P$ZMMRP1.01 MYB proteins with single DNA binding repeat

+281 +297 +289 (-) 0.851 atatatgTATCtatatt

P$RAP22.01 Light responsive element motif, not modulated by different light qualities

+281 +291 +286 (-) 0.898 gtATCTatatt

P$ZMMRP1.01 MYB proteins with single DNA binding repeat

+285 +301 +293 (-) 0.819 gtatataTATGtatcta

P$TEIL.01 Ethylen insensitive 3 like factors

+285 +293 +289 (-) 0.981 aTGTAtcta

P$HOCT.01 Octamer motif of Histone H3, H4 promoters

+330 +346 +338 (-) 0.823 gtcagcgATCAgcaaac

P$GAMYB.01 MYB-like proteins +353 +369 +361 (+) 0.912 gcgtcttcGTTAttcta

O$XCPE1.01 Activator-, mediator- and TBP-dependent core

promoter element for RNA polymerase II transcription

(27)

from TATA-less promoters P$ALFIN1.01 Salt/drought responsive

elements

+380 +394 +387 (-) 0.936 atccaGTGGcggaac

P$OSMYBS.01 MYB proteins with single DNA binding repeat

+388 +404 +396 (-) 0.857 tatggTATAcatccagt

P$GBF1.01 Plant G-box/C-box bZIP

proteins

+397 +417 +407 (-) 0.950 ctatacgtACGTgtatggtat

P$GT1.01 GT-box elements +411 +427 +419 (+) 0.856 cgtataGTTAttatgtt

P$CARICH.01 CA-rich motif +423 +441 +432 (-) 0.905 ttgttccAACAccaaacat

P$CCA1.01 Circadian control factors +447 +461 +454 (-) 0.869 aaaaaaaaAATTtct

P$ATML1.01 L1 box, motif for L1

layer-specific expression +458 +474 +466 (-) 0.831 cttttaAAAAtgtaaaa

P$NCS1.01 Nodulin consensus sequence

1 +469 +479 +474 (+) 0.947 tAAAAgattct

P$CCA1.01 Circadian control factors +471 +485 +478 (-) 0.872 aattaaagAATCttt

P$DOF1.01 DNA binding with one finger (DOF)

+473 +489 +481 (-) 0.994 taaaaattAAAGaatct

P$HSE.01 Heat shock factors +475 +489 +482 (-) 0.840 taaaaattaaAGAAt

P$MYBPH3.01 MYB-like proteins +482 +498 +490 (-) 0.801 tcaaaacaGTAAaaatt

P$AGL15.01 MADS box proteins +484 +504 +494 (-) 0.828 gaaTCCTcaaaacagtaaaaa

P$WER.01 MYB-like proteins +484 +500 +492 (+) 0.879 tttttactGTTTtgagg

P$SP8BF.01 Sweet potato DNA-binding factor with two WRKY-domains

+486 +498 +492 (+) 0.905 ttTACTgttttga

P$NTMYBAS1.01 MYB-like proteins +501 +517 +509 (-) 0.963 taaaagtaGTTAtgaat

(28)

P$SP8BF.01 Sweet potato DNA-binding factor with two WRKY-domains

+508 +520 +514 (+) 0.910 acTACTtttacag

P$ATHB1.01 Arabidopsis homeobox

protein

+551 +561 +556 (+) 0.907 gctATTAttga

P$RAV1-5.01 5'-part of bipartite RAV1 binding site

+577 +587 +582 (-) 0.961 atcAACAtaag

P$CBNAC.02 Calcium regulated

NAC-factors +579 +599 +589 (-) 0.869 aactGCTTacaaatcaacata

P$LFY.01 LFY binding site +650 +662 +656 (-) 0.931 cACCAttgttgta

P$PALBOXP.01 MYB IIG-type binding sites +658 +672 +665 (+) 0.859 tgGTGGtctgtttga

P$SUCROSE.01 Sucrose box +664 +682 +673 (-) 0.820 ctAAATcagatcaaacaga

P$AS1_AS2_II.01 AS1/AS2 repressor complex +684 +692 +688 (+) 0.920 ttgTTGAat

P$SEBF.01 Auxin response element +706 +718 +712 (-) 0.982 cacTGTCactaac

P$ID1.01 ID domain factors +740 +752 +746 (-) 0.952 atatTTGTcctcc

P$ABF1.01 ABA response elements +754 +770 +762 (+) 0.838 gtagaACAAgtggcatg

P$RY.01 Legumin Box family +756 +782 +769 (-) 0.969 tattcttgCATGcatgccacttgttct

P$RY.01 Legumin Box family +759 +785 +772 (+) 0.956 acaagtggCATGcatgcaagaatatta

P$RY.01 Legumin Box family +763 +789 +776 (+) 0.928 gtggcatgCATGcaagaatattactct

MYB proteins with single DNA binding repeat

+776 +792 +784 (+) 0.831 aagaATATtactctctt

P$BLR.01 Arabidopsis homeobox

protein

+779 +789 +784 (+) 0.907 aatATTActct

P$ID1.01 ID domain factors +792 +804 +798 (+) 0.970 tgttTTGTcccca

P$ARE.01 Auxin response element +794 +806 +800 (+) 0.942 tttTGTCcccacg

(29)

P$BZR1.02 Brassinosteroid (BR) response element

+795 +811 +803 (-) 0.836 agattCGTGgggacaaa

P$ARR10.01 Myb-related DNA binding

proteins (Golden2, ARR, Psr) +803 +811 +807 (-) 0.990 AGATtcgtg

O$DINR.01 Core promoter initiator

elements +811 +821 +816 (+) 0.944 tgTCATttttg

P$SEF4.01 Soybean embryo factor 4 +833 +843 +838 (+) 0.985 ggTTTTtgttt

P$SBF1.01 GT-box elements +859 +875 +867 (-) 0.914 gtaataaTTAAaaaaag

P$HAHB4.01 Arabidopsis homeobox

protein +865 +875 +870 (-) 0.958 gtaataATTAa

P$ATHB1.01 Arabidopsis homeobox

protein

+865 +875 +870 (+) 0.989 ttaATTAttac

P$ATML1.01 L1 box, motif for L1 layer-specific expression

+879 +895 +887 (+) 0.842 aatgaaTATAtgtatat

P$SBF1.01 GT-box elements +898 +914 +906 (+) 0.916 gatgtcaTTAAtatgat

P$WUS.01 Arabidopsis homeobox

protein +902 +912 +907 (-) 1.000 catatTAATga

P$SUCROSE.01 Sucrose box +927 +945 +936 (-) 0.866 aaAAATtataaaactaaaa

P$SURE.01 Sugar response elements, SURE and SURE-like sequences in plant promoters

+942 +954 +948 (-) 1.000 aaataAAAAaaaa

P$HMG_IY.02 High mobility group factors +946 +960 +953 (+) 1.000 ttttTATTtttttga

(30)

5.3 Analisi della regione al 3’ del gene HaL1L

La ricerca dei segnali di poliadenilazione nucleare eseguita al sito http://genes.mit.edu/genomescan.html ha visualizzato due motivi GCAACAAATT e GTAAAAACT posizionati rispettivamente a –85 e –48 pb relativamente all’ultimo nucleotide presente sul 3’UTR dell’mRNA, a +23 dallo stesso nucleotide è invece posizionabile il segnale di terminazione della trascrizione con la sequenza AGTGTTTA. In particolare la sequenza GCAACAAATT è necessaria nel processo di taglio del trascritto, prima dell’attacco della coda poliA, che avviene in corrispondenza del dinucleotide TA evidenziato in Fig. 5.2. Infine a –127 dal sito di taglio è riconoscibile la sequenza GTTTGTTTTTT, definita CPE (Cytoplasmic Polyadenylation Element ), che rappresenta un segnale di poliadenilazione citoplasmatica.

5.4 Espressione del gene HaL1L in Helianthus annuus

L’espressione del gene HaL1L è stata valutata mediante RT-PCR semiquantitativa in embrioni zigotici di girasole poiché, in letteratura, il ruolo del gene L1L, isolato per la prima in Arabidopsis thaliana, è stato associato all’embriogenesi. L’analisi è stata condotta in embrioni zigotici a quattro diversi stadi di sviluppo: 5, 10, 21 e 28 giorni dalla impollinazione del fiore del disco (GDI). I risultati ottenuti, riportati in Figura 5.5a, evidenziano che l’espressione del gene è presente in tutti gli stadi di sviluppo considerati, sebbene a livelli diversi. L’analisi statistica ha evidenziato che l’accumulo di trascritti, molto elevato negli embrioni di 5 e 10 giorni, decresce in maniera consistente negli stadi di sviluppo più avanzati (Fig. 5.5b). Il livello significativamente più elevato di espressione del gene HaL1L è stato rilevato negli embrioni zigotici allo stadio di sviluppo di 5 giorni dalla fecondazione mentre non si riscontra una differenza significativa tra gli embrioni di 21 e 28 giorni (Fig. 5.5b).

(31)

In ovuli non fecondati si osserva un leggero accumulo di trascritti di HaL1L, mentre nessun segnale è evidente in tessuti ovarici di fiori del disco prelevati prima della fecondazione (Fig. 5.5c).

L’analisi è stata successivamente condotta in organi e tessuti al di fuori della sfera riproduttiva. In particolare, l’RNA utilizzato per condurre l’RT-PCR, è stato estratto dai seguenti organi: foglie cotiledonari di H. annuus di 10 giorni, foglie giovani (2 cm di lunghezza), foglie espanse (15 cm di lunghezza), fusto di piante allo stadio di bottone fiorale (regioni internodali dal 5°all’ 8° nodo), radici di piante allo stadio di bottone fiorale.

Sulla base di quanto accertato negli embrioni zigotici è stato deciso di condurre una serie di analisi di RT-PCR semiquantitativa utilizzando 26 cicli che non evidenziano accumulo di trascritti di HaL1L in nessuno degli organi analizzati (Fig. 5.5d). Solo aumentando a 45 il numero dei cicli è possibile evidenziare una debole trascrizione del gene nelle foglie cotiledonari (dato non mostrato).

(32)

Embrioni zigotici (GDI)

0 20 40 60 80 100 5 g 10 g 21 g 28 g

Embrioni zigotici (GDI)

Livello dei trascritti di

HaL1L (%)

b

a b c

a

5 g 10 g 21 g 28 g

β-actina (243 bp) HaL1L (175 bp) c

c

O OV

β-actina (243 bp)

26 cicli

30 cicli

HaL1L (175 bp)

d

EZ C FG FM FU R

β-actina (243 bp) HaL1L (175 bp) Fig. 5.5: RT-PCR semiquantitativa.

Livello di espressione di HaL1L stimato mediante RT-PCR semiquantitativa. (a) Amplificazione dei trascritti HaL1L e β-actina condotta usando 5 µg di RNA totale estratto da embrioni zigotici a stadi diversi di sviluppo (giorni dall’impollinazione: GDI). Il livello di espressione del trascritto HaL1L , normalizzato rispetto al trascritto della β-actina (b) è stimato misurando la fluorescenza dei prodotti di PCR separati in gel di agarosio (2%) colorato con etidio bromuro (a). I valori in (b) seguiti dalla stessa lettera non sono significativamente differenti (P= 0,05) in accordo al test di Tukey. (c). Amplificazione dei trascritti HaL1L e β-actina condotta usando 5 µg di RNA totale estratto da ovuli non fecondati (O) e tessuti ovarici di fiori del disco (OV). (d) Amplificazione dei trascritti HaL1L e β-actina condotta usando 5 µg di RNA totale estratto da embrioni zigotici immaturi (10

(33)

GDI) (controllo positivo), cotiledoni (C), foglie giovani (FG), foglie completamente espanse (FM), internodi di fusto (FU), radici (R).

5.5 Sequenza nucleotidica del fattore WUS in H. annus

Con l’impiego delle tecniche 5’3’ RACE e RAGE è stato possibile ricavare la sequenza del putativo WUSCHEL di girasole.

La difficoltà maggiore incontrata nella fase iniziale, volta ad ottenere la sequenza del cDNA, è consistita nell’individuare materiale idoneo che esprimesse l’mRNA per questo gene che si manifesta in tempi e settori cellulari molto ristretti. Per le amplificazioni su RNA retrotrascritti sono stati utilizzate coppie di primer disegnati sulle sequenze nucleotidiche di specie vegetali diverse che mostrano conservazione quasi esclusivamente nella regione del dominio che identifica l’intera famiglia delle proteine WOX. In A. thaliana, unica specie vegetale dove sia stata caratterizzata, la famiglia è costituita da 14 peptidi che condividono un dominio molto conservato, mentre le differenze maggiori, nella sequenza e nella lunghezza, si osservano nella porzione al 3’, dove il motivo aminoacidico TLPL risulta essere specifico per il peptide WUS (Fig 5.6).

(34)

HaWUS METQQQQADIQDFGNKN----SNTYACRQ---SST--- 28 AtWUS MEPPQHQHHHHQADQESGNNNNNKSGSGGYTCRQTST--- 37 1 MWTMGYNEGGADSFNGG---RKLRPLIPRLTSCPTAAVNTN--- 38 2 MENEVNAG---TA---SSS--- 13 3 MSPVAST--- 7 4 MKVHEFSNGFSSSWDQHDSTSSLSLSCKRLRPLAPKLSGSPPSPPSSS--- 48 5 MS---FSVKGRSLR--- 11 6 MGYISN---NNLINYLPLSTTQPPLLLTHC--- 27 7 MSSRGFNIKARGLC--- 14 8 MSSSNKNWPSMFKSKP---C- 17 9 MASSNRHWPSMFKSKP ---H- 17 10 ME-QESLNGRYGS---RVMTDEQMETLRKQIAIYAVLCDQL--- 37 11 MD-QEQTPHSPTRH--- 13 12 MN-QEGASHSPS--- 11 13 MMEWDNQLQPNNHHSSNLQGIDVNGGSGAGGGMYVKVMTDEQYETLRKQIAIYGTICERL 60 14 MVKKKKEKEKSKEIEEMDREIQNGAYSG---RVMTEEQMEILRKQIAVYAVICDQL- 53 * HaWUS ---RWTPTSDQIRILKELYYNN 47 AtWUS ---RWTPTTEQIKILKELYYNN 56 1 S---DHRFNMAVVTMTAEQNKRELMMLNSEPQHPPVMVS-SRWNPTPDQLRVLEELYR-Q 93 2 ---RWNPTKDQITLLENLYK-E 31 3 ---RWCPTPEQLMILEEMYR-S 25 4 SGVTSATFDLKNFIRPDQTGPTKFEHKRDPPHQLETHPGGTRWNPTQEQIGILEMLYK-G 107 5 ---GNNNGG--TGTKCGRWNPTVEQLKILTDLFR-A 41 6 DINGNDHHQLITASSG---EHDIDERKNNIPAAATLRWNPTPEQITTLEELYR-S 78 7 ---NNNNGGGGTGAKCGRWNPTVEQVKLLTDLFK-A 46 8 NNNHHHQHEIDTPSYMHYSNCNLSSSFSS----DRIPDPKPRWNPKPEQIRILESIFN-S 72 9 P--HQWQHDINSP--LLPSASHRSSPFSSGCEVERSPEPKPRWNPKPEQIRILEAIFN-S 72 10 VFLHNSLSSVPLLSSGMNPMRGEYFDPMVASSSAHGMSTRPRWTPTTTQLQILENIYK-E 96 11 ---SRSPPSSASGSTSAEPVRSRWSPKPEQILILESIFH-S 50 12 ---STSTEPVRARWSPKPEQILILESIFN-S 38 13 VEMHKTLTAQQDLAGGR--MGGLYADPMMSSLG-HKMTARQRWTPTPVQLQILERIFD-Q 116 14 VLLHNSLSSYHPLSSGVRPMVGGYFDPMGASSSSHRISTRHRWTPTSTQLQILESIYD-E 112 ** *. *: * :: HaWUS GIRSPTADQIQRIAAQLRQYGKIEGKNVFYWFQNHKARERQKKRFTPTAPPPPS--- 101 AtWUS AIRSPTADQIQKITARLRQFGKIEGKNVFYWFQNHKARERQKKRFNGTNMTTPSSSPNSV 116 1 GTRTPSADHIQQITAQLRRYGKIEGKNVFYWFQNHKARERQKRRRQMETGHEETVLSTTS 153 2 GIRTPSADQIQQITGRLRAYGHIEGKNVFYWFQNHKARQRQKQKQERMAY--- 81 3 GIRTPNAVQIQQITAHLAFYGRIEGKNVFYWFQNHKARDRQKLRKK--- 71 4 GMRTPNAQQIEHITLQLGKYGKIEGKNVFYWFQNHKARERQKQKR--- 152 5 GLRTPTTDQIQKISTELSFYGKIESKNVFYWFQNHKARERQKRRKIS--- 88 6 GTRTPTTEQIQQIASKLRKYGRIEGKNVFYWFQNHKARERLKRRRR--- 124 7 GLRTPSTDQIQKISMELSFYGKIESKNVFYWFQNHKARERQKCRKIST--- 94 8 GTINPPREEIQRIRIRLQEYGQIGDANVFYWFQNRKSRAKHKLRVHHKSPKMSKKDKTVI 132 9 GMVNPPREEIRRIRAQLQEYGQVGDANVFYWFQNRKSRSKHKLRLLHNHSKHSLPQTQPQ 132 10 GSGTPNPRRIKEITMELSEHGQIMEKNVYHWFQNRRARSKRKQP--- 140 11 GMVNPPKEETVRIRKMLEKFGAVGDANVFYWFQNRRSRSRRRQRQLQAAAAAAAA--- 105 12 GTVNPPKDETVRIRKMLEKFGAVGDANVFYWFQNRRSRSRRRHRQLLAATTAAAT--- 93 13 GTGTPSKQKIKDITEELSQHGQIAEQNVYNWFQNRRARSKRKQHGGG--- 163 14 GSGTPNRRRIREIATELSEHGQITETNVYNWFQNRRARSKRKQP--- 156 . .* . * * .* : **: ****:::* : : HaWUS --HFSDHIN--HHLPNAAPMQIPSHHHHYHHQEPPHVYAHP--- 138 AtWUS MMAANDHYHPLLHHHHGVPMQRPANSVNVKLNQDHHLYHH--- 156 1 LVSNHGFDKKDPPGYKVEQAKNWICSVGCDTQPEKPSRDYHLEEPANIRVEHNARCGGDE 213 2 ---FNRLLHKTSRFFYPPPCSNVGCVSPYYLQQASDHHMN--- 118 3 ---LAKQLHQQQHQLQLQLQQIKPKPISSMISQPVNKNIID--- 109 4 ---NNLISLSCQSSFTTTG--- 168 5 --- 6 ---EGGAIIKPHKDVKDSSSG--- 142 7 --- 8 P---STDADHCFGFVNQETGLYPVQNNELVVTEPAGFLFPVHND- 173 9 PQPQPSASSSSSSSSSSSKSTKPRKSKNKNNTNLSLGGSQMMGMFPPEPA-FLFPVSTVG 191 10 --- 11 ---TTNTCDQTMMVSNSLPHHSGS--- 126 12 ---SIGAEDHQHMTAMSMHQYPCSNN--- 116 13 --- 14 --- HaWUS ---HKLYTTHHIGVGSSSQGVMGVGCGYGSVAMEKSFRKCSISPPGESKATG--- 187 AtWUS ---NKPYPSFNNGNLNHASSGTECGVVNASNGYMSSHVYGSMEQDCSMNYNN--- 205 1 RRSFLGINTTWQMMQLPPSFYSSSHHHHQRNLILSPTVSSNMSNSNNAVSAS--- 265 2 ---QHGSVYTNDLLHRNNVMIPSGGYEKRTVTQHQKQLSDIRTT--- 159 3 ---HHNPYHHHHHNHHHNHHRPYDHMSFDCCSHPSPMCLPHQGTGVGEAPSK--- 158 4 ---VFNPSVTMKTRTSSSLDIMREPMVE--- 193 5 ---IDFDHHHHQPSTRDVFEISEED--- 110 6 ---GHRVDQTKLCPSFPHTNRPQPQHELDPASYNKDNNANNEDHG-TT--- 186 7 ---VKFDHRQDT---DLSKP--- 108 8 ---PSAAQSAFGFGDFVV---PVVTEEGMAFSTVNNG-VNLETN--- 210 9 --GFEGITVSSQLGFLSGDMIEQQKPAPTCTGLLLSEIMNGSVSYGTHHQQHLSEKEVEE 249 10 ---PTTTITSSQADDAAVTTTEERGRCGDD--- 167 11 ---DLGFGGCS-TSSNYLFASSSSS---YGGGCDNQ--- 155 12 ---EIDLGFGSCSNLSANYFLNGSSSSQIPSFFLGLSSSSGGCEN--- 158 13 ---SSGNNNGESEVETEVEALNEKRVVRPESLLGLPDGNS--- 200 14 ---QTTTANG-QADDVAVTT-EERRSCGD--- 180

(35)

HaWUS ---GIGRNIGSRSRISVDSCSFFDTIKPKTYEMFENR 221 AtWUS ---VGGGWANMDHHYSSAPYNFFDRAKPLFGLEGHQE 239 1 ---KDTVTVSPVFLRTREATNTETCHRNGDDNKDQEQ 299 2 ---AATRMPISPSSLRFDRFALRDHCYAGEDI 188 3 VMNEYYCTKSGAEEILMQKSITGPNSSYGRDWMMMMDMGPRPSYPSSSSSPISCCN---- 214 4 ---KEELVEENEYKRTCRSWGFENLEIENRRNKNSST 227 5 ---CQEEEKVIETLQLFPVNSFEDSNSKVDKMRA 141 6 ---EESDQRASEVGKYATWRNLVTWSITQQPEEINID 220 7 ---RRDNVRRHQLPA 120 8 ---ENFDKIPAINLYGGDGNGGGNCFPPLTVPLTINQSQEKRDVGLS 254 9 MRMKMLQQPQTQICYATTNHQIASYNNNNNNNNIMLHIPPTTSTATTITTSHSLATVPST 309 10 ---SGGFES---YEHILFPSPDLG--- 185 11 ---SNSGMENLLTMSGQMSYHEATHHHYQNHSSNVTSILCPSDQNS--- 198 12 ---NNGMENLFKMYGHESDHN---HQQQHHSSNAASVLNPSDQNS--- 197 13 ---NNNGLGTTTATTTAPRPEDLCFQSPEISSDLHLL 234 14 ---SGGLES---YEHILFPSPDLG--- 198 HaWUS DQDEEQGEPSTEIETLPLFPIHDGNHHDFFGMRTANLPLEQGTGGYYTGGSWYRSDERAS 281 AtWUS EEECGGDAYLEHRRTLPLFPMHGEDH---INGGSGAIWKYG-QSEVRPCAS 286 1 HEDCSNGELDHQEQTLELFPLRKEGF---CSDGEKDKNISG-IHCFYE 343 2 ---NVNSSGRKTLPLFPLQPLNASNADGMGSSSFALGSDSPVDCSSDGAGREQPFID 242 3 ---MMMSSPKIPLKTLELFPISS--- 234 4 MATTFNKIIDN--VTLELFPLHPEGR--- 251 5 RGNNQYREYIRETTTTSFSPYSSCGA---EMEHPPPLDLRLSFL---- 182 6 ENVNGEEEETRDNRTLNLFPVREYQE---KTGRLIEKTKACNYCYYYE 265 7 KG--- 122 8 GGEDVGDNVYPVRMTVFINEMPIEVVSGLFNVKAAFGNDAVLINSFGQPILTDEFGVTYQ 314 9 S--DQLQVQADARIRVFINEMELEVSSGPFNVRDAFGEEVVLINSAGQPIVTDEYGVALH 367 10 ---IEHLLNRDKFID--- 197 11 ----NFHY-QQGAITVFINGVPTEVTRGGIDMKATFGEDLVLVHSSGVPLPTDEFGFLMH 253 12 ----NSQYEQEGFMTVFINGVPMEVTKGAIDMKTMFGDDSVLLHSSGLPLPTDEFGFLMH 253 13 DVLSNPRDEHLVGKMGLAESYNLYDH---VEDYGMSG--- 268 14 ---IEHLLSIGKFME--- 210 HaWUS LEFCPNSYGYYH--- 293 AtWUS LELRLN--- 292 1 FLPLKN--- 349 2 FFSGGSTSTRFDSNGNGL 266 3 INSKQDSTKL--- 244 4 --- 5 --- 6 FMPLKN--- 271 7 --- 8 PLQNGAIYYLI--- 325 9 PLQHGASYYLI--- 378 10 --- 11 SLQHGEAYFLVPRQT--- 268 12 SLQHGQTYFLVPRQT--- 268 13 --- 14 ---

Fig.5.6: Allineamento delle sequenze amminoacidiche dei geni WUSCHEL e

WOX.

HaWUS: WUSCHEL di H. annuus; AtWUS: WUSCHEL di A. thaliana

WOX : geni della famiglia WOX di A. thaliana

1: WOX1 AY251394, 2: WOX2 AAP37131.1, 3: WOX3 AT2G28610.1, 4: WOX4 AY251396, 5: WOX5 AT3G11260.1, 6: WOX6 AT2G01500.1, 7: WOX7 NM_120659, 8: WOX8 AT5G45980.1, 9: WOX9 AT2G33880.1, 10: WOX10 AT1G20710, 11: WOX11 AY251402, 12: WOX12 AY251403, 13: WOX13 AT4G35550.1, 14: WOX14 AT1G20700.1

In verde è evidenziato il dominio. In rosa il motivo amminoacidico TLPLFP conservato in HaWUS, AtWUS e nel WOX2; in giallo è evidenziato il motivo presente anche negli altri WOX ma con delle delezioni.

(36)

La sequenza del cDNA, ottenuto con la 5’3’RACE, è stata confermata e allungata nella regione al 5’ con la 5’RAGE, eseguita sul DNA genomico (Fig. 5.7). Il programma TSSP disponibile al sito Softberry (http://www.softberry.com), ha permesso di individuare elementi caratterizzanti il promotore nelle piante. Il putativo TSS , il nucleotide A, è stato identificato nell’ambito della sequenza AAACAAAA. Dando la numerazione -1/+1 al di-nucleotide CA, lo stesso programma identifica una sequenza di tipo TATA-box a partire dal nucleotide -13: CCTTTTTAAAAA, tipicamente preceduta da due residui cisteinici. Tuttavia, nella regione a monte del gene HaWUS, disponibile al momento, non sono così ben riconoscibili le caratteristiche tipiche della regione del promotore come per il gene HaL1L. Sarà necessario allungare ulteriormente la sequenza al 5’ del gene per completare la ricerca di motivi identificativi il promotore prossimale, ma anche di motivi che possano suggerire l’interazione con fattori che facciano supporre una implicazione nella regolazione della trascrizione.

CCTTTTCTTTTTGATCAACATGTAGTAGAGAAAAGAAAAAATAGTATTATTTTCTTTTCACCTTTTTCTT TTTATATAGATGAAAGGAGCGGCATGTGTTTGTTTTGTATATGATTGGTTTCCTATGCGCGGCCTTTTTA AAAACAAAAAAAAAAACCCCCCCCCCCCCCAGCTGTTTTGTAATTAGGGTTTTGTTTCAACCCGTTACTG TTGTTTGTTTGGTGAAGAACACCATGGAAACTCAACAACAACAAGCAGATATTCAAGATTTTGGGAACAA AAACAGTAACACCTATGCATGCAGGCAAAGCAGTACTAGGTGGACACCCACAAGTGATCAGATCAGAATA CTGAAAGAGCTCTACTACAACAATGGAATCAGATCACCAACTGCTGATCAGATTCAGAGAATCGCTGCTC AACTCAGACAGTACGGCAAGATTGAAGGCAAGAACGTGTTTTATTGGTTTCAGAACCATAAAGCTCGTGA ACGCCAGAAGAAACGGTTCACTCCTACTGCTCCTCCACCACCGTCTCACTTCTCCGATCATATTAACCAC CATCTTCCCAACGCTGCCCCCATGCAGATTCCATCTCACCACCACCACTACCACCATCAAGAACCACCAC ATGTCTATGCTCACCCTCACAAACTCTACACCACTCATCACATTGGGGTTGGTTCTTCTTCACAAGGAGT GATGGGTGTAGGGTGTGGCTATGGATCTGTTGCTATGGAGAAGAGTTTCAGGAAGTGTTCAATATCACCA CCGGGAGAGAGTAAGGCCACAGGAGGAATTGGCCGGAATATCGGTTCAAGATCACGGATAAGTGTCGATT CGTGTTCCTTCTTCGACACAATTAAGCCAAAGACATATGAGATGTTTGAGAATCGTGATCAAGATGAAGA ACAAGGAGAGCCTTCAACTGAGATCGAAACACTTCCATTATTCCCGATTCACGACGGCAACCATCATGAT TTCTTCGGCATGAGGACGGCAAATCTGCCATTGGAGCAAGGCACTGGAGGTTACTACACTGGAGGAAGCT GGTACCGGTCTGATGAGAGGGCTTCTCTTGAGTTCTGTCCCAACTCTTATGGTTATTACCACTAATGATC ATTTTATGTATTCATATCAATAATTATGTAATTAATTAGGTACTTGGTATTTATGATGATCTAACTATTC ACGATGCCCGCCCTCGCTCTCCCCG

Fig. 5.7: Sequenza del gene WUSCHEL (WUS) in Helianthus annuus.

In verde è evidenziata la sequenza ottenuta con la 5’ RAGE. In giallo è evidenziato il 3’ UTR. In rosso è evidenziato il doppio codone di stop:TAATGA. Il software TSSP individua elementi tipici del promotore. Il putativo TSS, il nucleotide A, è stato identificato nell’ambito della sequenza AAACAAAAA. Dando la numerazione -1/+1 al di-nucleotide CA in posizione -13 è presente una sequenza di tipo TATA-box

(37)

La sequenza aminoacidica dedotta dalla sequenza nucleotidica ottenuta in girasole, allineata con le sequenze codificanti lo stesso gene in specie vegetali diverse e con i componenti la famiglia dei peptidi WOX in A.thaliana, permette facilmente di individuare nel peptide il dominio conservato della famiglia, ma anche di identificarlo come omologo di WUS con il quale condivide la massima percentuale di identità e di similarità aminoacidica: rispettivamente 39% e 25%. In HaWUS è inoltre presente il motivo 36TLPL40, tipico di WUS nell’ambito delle proteine WOX in A. thaliana (Fig 5.8).

HaWUS MET-QQQ----QADIQDFGNKN----SNTYACRQSSTRWTPTSDQIRILKELYYNNGIRS 51 Atwus MEPPQHQHHHHQADQESGNNNNNKSGSGGYTCRQTSTRWTPTTEQIKILKELYYNNAIRS 60 ** * * *** :. .*:* *. *:***:*******::**:*********.*** HaWUS PTADQIQRIAAQLRQYGKIEGKNVFYWFQNHKARERQKKRFTPTAPPPPS---HF 103 Atwus PTADQIQKITARLRQFGKIEGKNVFYWFQNHKARERQKKRFNGTNMTTPSSSPNSVMMAA 120 *******:*:*:***:*************************. * ..** HaWUS SDHIN--HHLPNAAPMQIPSHHHHYHHQEPPHVYAHPHKLYTTHHIGVGSSSQGVMGVGC 161 Atwus NDHYHPLLHHHHGVPMQRPANSVNVKLNQDHHLYHH-NKPYPSFNNGNLNHASSGTECGV 179 .** : * :..*** *:: : : :: *:* * :* *.:.: * . :.. * HaWUS GYGSVAMEKSFRKCSISPPGESKATGGIGRNIGSRSRISVDSCSFFDTIKPKTYEMFENR 221 Atwus VNASNGYMSSHVYGSMEQDCSMNYNNVGGGWANMDHHYSSAPYNFFDRAKPLFGLEGHQE 239 .* . .*. *:. . : .. * . : * . .*** ** .:. HaWUS DQDEEQGEPSTEIETLPLFPIHDGNHHDFFGMRTANLPLEQGTGGYYTGGSWYRSDERAS 281 Atwus EEECGGDAYLEHRRTLPLFPMHGEDH---INGGSGAIWKYG-QSEVRPCAS 286 ::: . . .******:*. :* :: *:*. :. * . ** HaWUS LEFCPNSYGYYH 293 Atwus LELRLN--- 292 **: *

Fig. 5.8: allineamento di sequenza tra HaWUS e AtWUS.

Nella figura * indica gli aa identici (percentuale di identità: 39%) mentre : indica gli aa simili per proprietà chimico-fisiche (percentuale di similarità 25%).

Figura

Tab. 5.2: Matrice per fattori di trascrizione nella regione al 5’ del gene HaL1L.
Tab. 5.3: Matrice per fattori di trascrizione nella regione al 3’del gene HaL1L.
Tab. 5.4: Matrice per fattori di trascrizione nella regione intronica del gene HaL1L.

Riferimenti

Documenti correlati

Entonces, he repartido el comentario de esta manera: tras una primera, breve introducción al autor y a su obra, el segundo capítulo es una perspectiva general sobre lo que es

Questo elaborato intende fornire una prospettiva della maniera in cui lo sciismo, una delle correnti principali e più antiche m, ha r c pito a imi ato i

Available Open Access on Cadmus, European University Institute Research Repository.... Sharing straigthforwardly this risk aversion interpretation of overbids implicitly

Ainsi, le grand nom bre de participants invités à siéger au sein du Comité de Suivi franco-espagnol instauré par les conseils m unicipaux ne doit pas cacher la

This study aims to find out any relationship between online peer feedback and learner autonomy, if there is any, in English as a foreign language (EFL) writing

A questo punto la macchina scompare in un istante e in alcuni casi compare direttamente nel momento previsto, senza che chi viaggi percepisca nulla, come in Ritorno al

corrispondenza di sette sezioni poste a diversa apertura ed in ognuno di questi piani sono state prese immagini dei campi istantanei di viscosità effettiva e