Espressione ed utilizzo della
informazione genetica
Prof.ssa Flavia Frabetti Aa 2010-11
L’informazione genetica, contenuta nel DNA, ha lo scopo di:
1) mantenere lo stato vitale (strutture e funzioni)
2) realizzare l’adattamento (risposta ad un cambiamento)
3) determinare il differenziamento (specializzazione di strutture e funzioni)
L’informazione genetica ereditata determina il manifestarsi di specifici caratteri inducendo la sintesi di certe proteine:
le proteine sono l’anello di congiunzione tra informazione e la realizzazione/effettuazione di strutture ed attività.
ESPRESSIONE DELLA INFORMAZIONE BIOLOGICA non solo le strutture, ma anche l’architettura e la distribuzione spaziale di queste, nonché i cambiamenti temporali
dal progetto
alla
costruzione proteina
DNA
Cosa studiamo?
Trascrizione e Traduzione Codice genetico
Meccanismi di CONTROLLO della espressione genica Dove è scritta l’informazione genica:
DNA
Cromatina / cromosomi Nucleo eucariotico
Come è organizzata l’informazione genica:
Genoma
Geni - come concetto
- “struttura del gene eucariota tipo”
Come si esprime l’informazione genica:
nucleo
DNA istoni
cromosoma telomero centromero
telomero
Dove è scritta la informazione?
proteine acide
Come è organizzata l’informazione?
Una enorme quantità di informazione dentro ad ogni singola cellula:
il GENOMA
Aprendo ogni libro si trovano brani così scritti:
…..ATCCGAGCTTTACGTACGGTTACCGGATCGAGCATACT……
- il complesso dell'informazione genetica di una cellula
- la massa totale del DNA cellulare
- il patrimonio ereditario dell'organismo a cui appartiene
Anche la definizione di genoma è complessa!
Il genoma è:
COMPLESSITA’ DEL GENOMA
Servono informazioni proporzionali alla complessità dell’organismo ?
Proporzionalità da batteri a vermi Poi non viene mantenuta
PARADOSSO DELLA NON PROPORZIONALITA’
TRA COMPLESSITA’ GENOMA E COMPLESSITA’ ORGANISMO
Paradosso del valore “C”
DIMENSIONI in bp (contenuto in DNA)
NUMERO DEI GENI
Media: 61.710 Minimo: 27.462 Massimo: 153.478
Drosophila M.
16.321
C. Elegans 21.210
Arabidobsis T.
26.000
STIMA: 22.000
(analisi computer) Homo sapiens
Organizzazione generale del genoma umano
Corredo aploide 3.200.000.000 bp ovvero 3,2 Gbp (Cr. 1 279.000.000 bp, Cr. 21 45.000.000 bp )
Genoma mitocondriale 16.569 bp
Peso (genoma diploide) 7 pg Lunghezza (genoma diploide) 2 m Il genoma umano è distribuito in cromosomi:
22 tipi di AUTOSOMI
2 tipi di ETEROCROMOSOMI (X e Y)
ORGANIZZAZIONE DEL GENOMA UMANO
NUCLEARE MITOCONDRIALE
0,5 %
~ 40% GENI CODIFICANTI
PROTEINE E GENI PER ncRNA
~ 60%
DNA EXTRAGENICO
ORGANIZZAZIONE DEL GENOMA UMANO
NUCLEARE MITOCONDRIALE
0,5 %
1,7 % DEL GENOMA 5,3% mRNA MATURO
(ESONI) 1/3 GENI CODIFICANTI
PROTEINE
56% CODIFICANTE (CDS) 0,96 % DEL GENOMA
30 30 Mb Mb
DNA RNA proteine
replicazione o duplicazione
trascrizione della informazione
traduzione della informazione
Reintrepetazione
del dogma della biologia molecolare alla luce delle nuove conoscenze sul genoma
Geni
per RNA non tradotti o non- coding RNA (ncRNA, RNA noncodificanti proteine), nei mammiferi rappresentano da 1/2 a 3/4 di tutti i trascritti
Ai geni che codificano proteine si affiancano geni che specificano per RNA non codificanti utili alla regolazione della espressione genica.
Stime odierne:
Geni umani codificanti per proteine sono un numero di 20.000-25.000
La maggior parte del genoma dei mammiferi è trascritta
Human 58% 98%
Mouse 55% 98%
Fruitfly 60% 71%
Worm 59% 56%
Yeast 70% 0.6%
Known or predicted transcribed
Noncoding percent of transcription
7Mb 100Mb 130Mb 2.6Gb 2.9Gb
Il 98% dell’output trascrizionale nei mammiferi è rappresentato da RNA che non verrà tradotto in aa
Geni:
definizione/concetto
struttura
regolazione
La complessità del genoma si riflette sulla espressione dell’informazione genica e sulla definizione stessa di gene
I geni sono le
unità responsabili delle caratteristicheereditarie
Il gene è
una regione di DNA trascritta che contiene istruzioni per la sintesi di una proteina, di un
RNA o ignota
FUNZIONI
DEI GENI
METABOLISMO 22%
INFORMAZIONE GENETICA 25%
STRUTTURA 21%
SEGNALI 12%
FUNZIONI TESSUTO-SPECIFICHE 20%
GENI PER RNA NON TRADOTTI
(rRNA 85%, tRNA 10%, RNA non-codificanti) Il gene è una delle tante istruzioni contenute in ogni cellula
2) Geni con limitazioni spazio-temporali nella espressione:
Espressione inducibile Stadio del differenziamento Stadio dello sviluppo Stadio del ciclo cellulare
TEMPO
Distribuzione intracellulare Singole cellule (specificità di cellula es. Ab)
Specificità per tessuto, tipo cellulare
Espressione diversa in diversi organi e tessuti
SPAZIO Ci possono essere:
1) Geni essenziali o geni housekeeping
Geni che devono essere espressi praticamente in tutti i tipi cellulari poiché codificano prodotti utili al funzionamento generale delle cellule, per es. alla sintesi proteica o alla produzione di energia
Promotore
Gene strutturale regione trascritta
Gene eucariota - la struttura nasconde complessità
I geni eucarioti hanno
una struttura discontinua 1977
Ibrido molecolare DNA-mRNA
Il gene ha una natura discontinua:
esoni tratti del gene indicati con E introni tratti del gene indicati con I
GENE - Struttura del gene eucariota tipo
E 1 I 1 E 2 I 2 E 3
+1
Tratto di DNA che viene trascritto o TRASCRITTO PRIMARIO
DNA
+1
E 1 E 2 E 3
TRASCRITTO PRIMARIO o pre-mRNA
Esone 1 Esone 2 Esone 3
AUG UGA
Proteina NH2 COOH
I 1 I 2
ESONI (in giallo), intervallate da lunghi INTRONI (in grigio)
mRNA AUG UGA
Dimensione media geni
57.000 bp (57 kb) istoni 100-400 bp (0,1-0,4 kb) distrofina 2.220.000 bp (2,22 Mb)
ESONI
Numero medio 11
(minimo)-(massimo) 1 - 363 Dimensione media 280 bp INTRONI
Dimensione media ca. 6.000 bp
mRNA maturo (in media) Dimensione 3.000 basi Sequenza codificante 1.600 basi (56%) Proteina 540 AA
Nella realtà gli INTRONI sono molto più lunghi degli esoni
TTAGCACTACCGTATTTGCGCATTACCAGATTAGAGAA TTAGCACTACCGTATTTGCGCATTACCAGATTAGAGAA ATGCTAGTCGATCTATCGATCGGCTATTCGCAAAGCTG ATGCTAGTCGATCTATCGATCGGCTATTCGCAAAGCTG CGCGACTGCGATGCGCTAGCATGCGATTCGCGATCGCC CGCGACTGCGATGCGCTAGCATGCGATTCGCGATCGCC GAGCGCTCGCGAGCGCGCTAGCGGAATACTATATAGC GAGCGCTCGCGAGCGCGCTAGCGGAATACTATATAGC GCGGATCAGTCTAGATCTATGAGATCGATAGCGATCTA GCGGATCAGTCTAGATCTATGAGATCGATAGCGATCTA GAGATAGGATCGAGATCGAGGCGAGATCATATGAGCG GAGATAGGATCGAGATCGAGGCGAGATCATATGAGCG CGGCTATTTAGGCTTAGAGGATTCGGAGATTCGGAGCT CGGCTATTTAGGCTTAGAGGATTCGGAGATTCGGAGCT TAGGATTACAGAGAGCTTCTTAGGCGCTCCCGGTATCG TAGGATTACAGAGAGCTTCTTAGGCGCTCCCGGTATCG CTCCCATCCCATATTAAAATCTATCGATCGAGCTCTCCA CTCCCATCCCATATTAAAATCTATCGATCGAGCTCTCCA ATGCGATCGATAGGACTAGTAGCTAGCTAGCTGAGCA ATGCGATCGATAGGACTAGTAGCTAGCTAGCTGAGCA TGATAGGCTCGATGAGCATGAGATGCATGTACGACTG TGATAGGCTCGATGAGCATGAGATGCATGTACGACTG CATAGGCATGACTGATCGACTGCATCATGACGCATGAC CATAGGCATGACTGATCGACTGCATCATGACGCATGAC TGCATGCATGACTGCATATGACGGACTCGCATTAGCAC TGCATGCATGACTGCATATGACGGACTCGCATTAGCAC TACCGTATTTGCGCATTACCAGATTAGAGAAATGCTAG TACCGTATTTGCGCATTACCAGATTAGAGAAATGCTAG TCGATCTATCGATCGGCTATTCGCAAAGCTGCGCGACT TCGATCTATCGATCGGCTATTCGCAAAGCTGCGCGACT GCGATGCGCTAGCATGCGATTCGCGATCGCCGAGCGC GCGATGCGCTAGCATGCGATTCGCGATCGCCGAGCGC TCGCGAGCGCGCTAGCGGAATACTATATAGCGCGGAT TCGCGAGCGCGCTAGCGGAATACTATATAGCGCGGAT CAGTCTAGATCTATGAGATCGATAGCGATCTAGAGATA CAGTCTAGATCTATGAGATCGATAGCGATCTAGAGATA GGATCGAGATCGAGGCGAGATCATATGAGCGCGGCTA GGATCGAGATCGAGGCGAGATCATATGAGCGCGGCTA TTTAGGCTTAGAGGATTCGGAGATTCGGAGCTTAGGAT TTTAGGCTTAGAGGATTCGGAGATTCGGAGCTTAGGAT TACAGAGAGCTTCTTAGGCGCTCCCGGTATCGCTCCCA TACAGAGAGCTTCTTAGGCGCTCCCGGTATCGCTCCCA TCCCATATTAAAATCTATCGATCGAGCTCTCCAATGCG TCCCATATTAAAATCTATCGATCGAGCTCTCCAATGCG ATCGATAGGACTAGTAGCTAGCTAGCTGAGCATGATA ATCGATAGGACTAGTAGCTAGCTAGCTGAGCATGATA GGCTCGATGAGCATGAGATGCATGTACGACTGCATAG GGCTCGATGAGCATGAGATGCATGTACGACTGCATAG GCATGACTGATCGACTGCATCATGACGCATGACTGCAT GCATGACTGATCGACTGCATCATGACGCATGACTGCAT GCATGACTGCATATGACGGACTCGCATTAGCACTACCG GCATGACTGCATATGACGGACTCGCATTAGCACTACCG TATTTGCGCATTACCAGATTAGAGAAATGCTAGTCGAT TATTTGCGCATTACCAGATTAGAGAAATGCTAGTCGAT CTATCGATCGGCTATTCGCAAAGCTGCGCGACTGCGAT CTATCGATCGGCTATTCGCAAAGCTGCGCGACTGCGAT GCGCTAGCATGCGATTCGCGATCGCCGAGCGCTCGCG GCGCTAGCATGCGATTCGCGATCGCCGAGCGCTCGCG AGCGCGCTAGCGGAATACTATATAGCGCGGATCAGTC AGCGCGCTAGCGGAATACTATATAGCGCGGATCAGTC TAGATCTATGAGATCGATAGCGATCTAGAGATAGGATC TAGATCTATGAGATCGATAGCGATCTAGAGATAGGATC GAGATCGAGGCGAGATCATATGAGCGCGGCTATTTAG GAGATCGAGGCGAGATCATATGAGCGCGGCTATTTAG GCTTAGAGGATTCGGAGATTCGGAGCTTAGGATTACA GCTTAGAGGATTCGGAGATTCGGAGCTTAGGATTACA GAGAGCTTCTTAGGCGCTCCCGGTATCGCTCCCATCCC GAGAGCTTCTTAGGCGCTCCCGGTATCGCTCCCATCCC ATATTAAAATCTATCGATCGAGCTCTCCAATGCGATCG ATATTAAAATCTATCGATCGAGCTCTCCAATGCGATCG ATAGGACTAGTAGCTAGCTAGCTGAGCATGATAGGCT ATAGGACTAGTAGCTAGCTAGCTGAGCATGATAGGCT CGATGAGCATGAGATGCATGTACGACTGCATAGGCAT CGATGAGCATGAGATGCATGTACGACTGCATAGGCAT GACTGATCGACTGCATCATGACGCATGACTGCATGCAT GACTGATCGACTGCATCATGACGCATGACTGCATGCAT GACTGCATATGACGGACTCGCA
GACTGCATATGACGGACTCGCA
TTAGCACTACCGTATTTGCGCATTACCAGATTAGAGAA TTAGCACTACCGTATTTGCGCATTACCAGATTAGAGAA ATGCTAGTCGATCTATCGATCGGCTATTCGCAAAGCTG ATGCTAGTCGATCTATCGATCGGCTATTCGCAAAGCTG CGCGACTGCGATGCGCTAGCATGCGATTCGCGATCGCC CGCGACTGCGATGCGCTAGCATGCGATTCGCGATCGCC GAGCGCTCGCGAGCGCGCTAGCGGAATACTATATAGC GAGCGCTCGCGAGCGCGCTAGCGGAATACTATATAGC GCGGATCAGTCTAGATCTATGAGATCGATAGCGATCTA GCGGATCAGTCTAGATCTATGAGATCGATAGCGATCTA GAGATAGGATCGAGATCGAGGCGAGATCATATGAGCG GAGATAGGATCGAGATCGAGGCGAGATCATATGAGCG CGGCTATTTAGGCTTAGAGGATTCGGAGATTCGGAGCT CGGCTATTTAGGCTTAGAGGATTCGGAGATTCGGAGCT TAGGATTACAGAGAGCTTCTTAGGCGCTCCCGGTATCG TAGGATTACAGAGAGCTTCTTAGGCGCTCCCGGTATCG CTCCCATCCCATATTAAAATCTATCGATCGAGCTCTCCA CTCCCATCCCATATTAAAATCTATCGATCGAGCTCTCCA ATGCGATCGATAGGACTAGTAGCTAGCTAGCTGAGCA ATGCGATCGATAGGACTAGTAGCTAGCTAGCTGAGCA TGATAGGCTCGATGAGCATGAGATGCATGTACGACTG TGATAGGCTCGATGAGCATGAGATGCATGTACGACTG CATAGGCATGACTGATCGACTGCATCATGACGCATGAC CATAGGCATGACTGATCGACTGCATCATGACGCATGAC TGCATGCATGACTGCATATGACGGACTCGCATTAGCAC TGCATGCATGACTGCATATGACGGACTCGCATTAGCAC TACCGTATTTGCGCATTACCAGATTAGAGAAATGCTAG TACCGTATTTGCGCATTACCAGATTAGAGAAATGCTAG TCGATCTATCGATCGGCTATTCGCAAAGCTGCGCGACT TCGATCTATCGATCGGCTATTCGCAAAGCTGCGCGACT GCGATGCGCTAGCATGCGATTCGCGATCGCCGAGCGC GCGATGCGCTAGCATGCGATTCGCGATCGCCGAGCGC TCGCGAGCGCGCTAGCGGAATACTATATAGCGCGGAT TCGCGAGCGCGCTAGCGGAATACTATATAGCGCGGAT CAGTCTAGATCTATGAGATCGATAGCGATCTAGAGATA CAGTCTAGATCTATGAGATCGATAGCGATCTAGAGATA GGATCGAGATCGAGGCGAGATCATATGAGCGCGGCTA GGATCGAGATCGAGGCGAGATCATATGAGCGCGGCTA TTTAGGCTTAGAGGATTCGGAGATTCGGAGCTTAGGAT TTTAGGCTTAGAGGATTCGGAGATTCGGAGCTTAGGAT TACAGAGAGCTTCTTAGGCGCTCCCGGTATCGCTCCCA TACAGAGAGCTTCTTAGGCGCTCCCGGTATCGCTCCCA TCCCATATTAAAATCTATCGATCGAGCTCTCCAATGCG TCCCATATTAAAATCTATCGATCGAGCTCTCCAATGCG ATCGATAGGACTAGTAGCTAGCTAGCTGAGCATGATA ATCGATAGGACTAGTAGCTAGCTAGCTGAGCATGATA GGCTCGATGAGCATGAGATGCATGTACGACTGCATAG GGCTCGATGAGCATGAGATGCATGTACGACTGCATAG GCATGACTGATCGACTGCATCATGACGCATGACTGCAT GCATGACTGATCGACTGCATCATGACGCATGACTGCAT GCATGACTGCATATGACGGACTCGCATTAGCACTACCG GCATGACTGCATATGACGGACTCGCATTAGCACTACCG TATTTGCGCATTACCAGATTAGAGAAATGCTAGTCGAT TATTTGCGCATTACCAGATTAGAGAAATGCTAGTCGAT CTATCGATCGGCTATTCGCAAAGCTGCGCGACTGCGAT CTATCGATCGGCTATTCGCAAAGCTGCGCGACTGCGAT GCGCTAGCATGCGATTCGCGATCGCCGAGCGCTCGCG GCGCTAGCATGCGATTCGCGATCGCCGAGCGCTCGCG AGCGCGCTAGCGGAATACTATATAGCGCGGATCAGTC AGCGCGCTAGCGGAATACTATATAGCGCGGATCAGTC TAGATCTATGAGATCGATAGCGATCTAGAGATAGGAT TAGATCTATGAGATCGATAGCGATCTAGAGATAGGAT CGAGATCGAGGCGAGATCATATGAGCGCGGCTATTTA CGAGATCGAGGCGAGATCATATGAGCGCGGCTATTTA GGCTTAGAGGATTCGGAGATTCGGAGCTTAGGATTAC GGCTTAGAGGATTCGGAGATTCGGAGCTTAGGATTAC AGAGAGCTTCTTAGGCGCTCCCGGTATCGCTCCCATCC AGAGAGCTTCTTAGGCGCTCCCGGTATCGCTCCCATCC CATATTAAAATCTATCGATCGAGCTCTCCAATGCGATC CATATTAAAATCTATCGATCGAGCTCTCCAATGCGATC GATAGGACTAGTAGCTAGCTAGCTGAGCATGATAGGC GATAGGACTAGTAGCTAGCTAGCTGAGCATGATAGGC TCGATGAGCATGAGATGCATGTACGACTGCATAGGCA TCGATGAGCATGAGATGCATGTACGACTGCATAGGCA TGACTGATCGACTGCATCATGACGCATGACTGCATGCA TGACTGATCGACTGCATCATGACGCATGACTGCATGCA TGACTGCATATGACGGACTCGCA
TGACTGCATATGACGGACTCGCA
Nel “libro”
DNA ,
le pagine sono scritte in
codice/i
GENE
TTAGCACTACCGTATTTGCGCATTACCAGATTAGAGAA TTAGCACTACCGTATTTGCGCATTACCAGATTAGAGAA ATGCTAGTCGATCTATCGATCGGCTATTCGCAAAGCTG ATGCTAGTCGATCTATCGATCGGCTATTCGCAAAGCTG CGCGACTGCGATGCGCTAGCATGCGATTCGCGATCGCC CGCGACTGCGATGCGCTAGCATGCGATTCGCGATCGCC GAGCGCTCGCGAGCGCGCTAGCGGAATACTATATAGC GAGCGCTCGCGAGCGCGCTAGCGGAATACTATATAGC GCGGATCAGTCTAGATCTATGAGATCGATAGCGATCTA GCGGATCAGTCTAGATCTATGAGATCGATAGCGATCTA GAGATAGGATCGAGATCGAGGCGAGATCATATGAGCG GAGATAGGATCGAGATCGAGGCGAGATCATATGAGCG CGGCTATTTAGGCTTAGAGGATTCGGAGATTCGGAGCT CGGCTATTTAGGCTTAGAGGATTCGGAGATTCGGAGCT TAGGATTACAGAGAGCTTCTTAGGCGCTCCCGGTATCG TAGGATTACAGAGAGCTTCTTAGGCGCTCCCGGTATCG CTCCCATCCCATATTAAAATCTATCGATCGAGCTCTCCA CTCCCATCCCATATTAAAATCTATCGATCGAGCTCTCCA ATGCGATCGATAGGACTAGTAGCTAGCTAGCTGAGCA ATGCGATCGATAGGACTAGTAGCTAGCTAGCTGAGCA TGATAGGCTCGATGAGCATGAGATGCATGTACGACTG TGATAGGCTCGATGAGCATGAGATGCATGTACGACTG CATAGGCATGACTGATCGACTGCATCATGACGCATGAC CATAGGCATGACTGATCGACTGCATCATGACGCATGAC TGCATGCATGACTGCATATGACGGACTCGCATTAGCAC TGCATGCATGACTGCATATGACGGACTCGCATTAGCAC TACCGTATTTGCGCATTACCAGATTAGAGAAATGCTAG TACCGTATTTGCGCATTACCAGATTAGAGAAATGCTAG TCGATCTATCGATCGGCTATTCGCAAAGCTGCGCGACT TCGATCTATCGATCGGCTATTCGCAAAGCTGCGCGACT GCGATGCGCTAGCATGCGATTCGCGATCGCCGAGCGC GCGATGCGCTAGCATGCGATTCGCGATCGCCGAGCGC TCGCGAGCGCGCTAGCGGAATACTATATAGCGCGGAT TCGCGAGCGCGCTAGCGGAATACTATATAGCGCGGAT CAGTCTAGATCTATGAGATCGATAGCGATCTAGAGATA CAGTCTAGATCTATGAGATCGATAGCGATCTAGAGATA GGATCGAGATCGAGGCGAGATCATATGAGCGCGGCTA GGATCGAGATCGAGGCGAGATCATATGAGCGCGGCTA TTTAGGCTTAGAGGATTCGGAGATTCGGAGCTTAGGAT TTTAGGCTTAGAGGATTCGGAGATTCGGAGCTTAGGAT TACAGAGAGCTTCTTAGGCGCTCCCGGTATCGCTCCCA TACAGAGAGCTTCTTAGGCGCTCCCGGTATCGCTCCCA TCCCATATTAAAATCTATCGATCGAGCTCTCCAATGCG TCCCATATTAAAATCTATCGATCGAGCTCTCCAATGCG ATCGATAGGACTAGTAGCTAGCTAGCTGAGCATGATA ATCGATAGGACTAGTAGCTAGCTAGCTGAGCATGATA GGCTCGATGAGCATGAGATGCATGTACGACTGCATAG GGCTCGATGAGCATGAGATGCATGTACGACTGCATAG GCATGACTGATCGACTGCATCATGACGCATGACTGCAT GCATGACTGATCGACTGCATCATGACGCATGACTGCAT GCATGACTGCATATGACGGACTCGCATTAGCACTACCG GCATGACTGCATATGACGGACTCGCATTAGCACTACCG TATTTGCGCATTACCAGATTAGAGAAATGCTAGTCGAT TATTTGCGCATTACCAGATTAGAGAAATGCTAGTCGAT CTATCGATCGGCTATTCGCAAAGCTGCGCGACTGCGAT CTATCGATCGGCTATTCGCAAAGCTGCGCGACTGCGAT GCGCTAGCATGCGATTCGCGATCGCCGAGCGCTCGCG GCGCTAGCATGCGATTCGCGATCGCCGAGCGCTCGCG AGCGCGCTAGCGGAATACTATATAGCGCGGATCAGTC AGCGCGCTAGCGGAATACTATATAGCGCGGATCAGTC TAGATCTATGAGATCGATAGCGATCTAGAGATAGGATC TAGATCTATGAGATCGATAGCGATCTAGAGATAGGATC GAGATCGAGGCGAGATCATATGAGCGCGGCTATTTAG GAGATCGAGGCGAGATCATATGAGCGCGGCTATTTAG GCTTAGAGGATTCGGAGATTCGGAGCTTAGGATTACA GCTTAGAGGATTCGGAGATTCGGAGCTTAGGATTACA GAGAGCTTCTTAGGCGCTCCCGGTATCGCTCCCATCCC GAGAGCTTCTTAGGCGCTCCCGGTATCGCTCCCATCCC ATATTAAAATCTATCGATCGAGCTCTCCAATGCGATCG ATATTAAAATCTATCGATCGAGCTCTCCAATGCGATCG ATAGGACTAGTAGCTAGCTAGCTGAGCATGATAGGCT ATAGGACTAGTAGCTAGCTAGCTGAGCATGATAGGCT CGATGAGCATGAGATGCATGTACGACTGCATAGGCAT CGATGAGCATGAGATGCATGTACGACTGCATAGGCAT GACTGATCGACTGCATCATGACGCATGACTGCATGCAT GACTGATCGACTGCATCATGACGCATGACTGCATGCAT GACTGCATATGACGGACTCGCA
GACTGCATATGACGGACTCGCA
TTAGCACTACCGTATTTGCGCATTACCAGATTAGAGAA TTAGCACTACCGTATTTGCGCATTACCAGATTAGAGAA ATGCTAGTCGATCTATCGATCGGCTATTCGCAAAGCTG ATGCTAGTCGATCTATCGATCGGCTATTCGCAAAGCTG CGCGACTGCGATGCGCTAGCATGCGATTCGCGATCGCC CGCGACTGCGATGCGCTAGCATGCGATTCGCGATCGCC GAGCGCTCGCGAGCGCGCTAGCGGAATACTATATAGC GAGCGCTCGCGAGCGCGCTAGCGGAATACTATATAGC GCGGATCAGTCTAGATCTATGAGATCGATAGCGATCTA GCGGATCAGTCTAGATCTATGAGATCGATAGCGATCTA GAGATAGGATCGAGATCGAGGCGAGATCATATGAGCG GAGATAGGATCGAGATCGAGGCGAGATCATATGAGCG CGGCTATTTAGGCTTAGAGGATTCGGAGATTCGGAGCT CGGCTATTTAGGCTTAGAGGATTCGGAGATTCGGAGCT TAGGATTACAGAGAGCTTCTTAGGCGCTCCCGGTATCG TAGGATTACAGAGAGCTTCTTAGGCGCTCCCGGTATCG CTCCCATCCCATATTAAAATCTATCGATCGAGCTCTCCA CTCCCATCCCATATTAAAATCTATCGATCGAGCTCTCCA ATGCGATCGATAGGACTAGTAGCTAGCTAGCTGAGCA ATGCGATCGATAGGACTAGTAGCTAGCTAGCTGAGCA TGATAGGCTCGATGAGCATGAGATGCATGTACGACTG TGATAGGCTCGATGAGCATGAGATGCATGTACGACTG CATAGGCATGACTGATCGACTGCATCATGACGCATGAC CATAGGCATGACTGATCGACTGCATCATGACGCATGAC TGCATGCATGACTGCATATGACGGACTCGCATTAGCAC TGCATGCATGACTGCATATGACGGACTCGCATTAGCAC TACCGTATTTGCGCATTACCAGATTAGAGAAATGCTAG TACCGTATTTGCGCATTACCAGATTAGAGAAATGCTAG TCGATCTATCGATCGGCTATTCGCAAAGCTGCGCGACT TCGATCTATCGATCGGCTATTCGCAAAGCTGCGCGACT GCGATGCGCTAGCATGCGATTCGCGATCGCCGAGCGC GCGATGCGCTAGCATGCGATTCGCGATCGCCGAGCGC TCGCGAGCGCGCTAGCGGAATACTATATAGCGCGGAT TCGCGAGCGCGCTAGCGGAATACTATATAGCGCGGAT CAGTCTAGATCTATGAGATCGATAGCGATCTAGAGATA CAGTCTAGATCTATGAGATCGATAGCGATCTAGAGATA GGATCGAGATCGAGGCGAGATCATATGAGCGCGGCTA GGATCGAGATCGAGGCGAGATCATATGAGCGCGGCTA TTTAGGCTTAGAGGATTCGGAGATTCGGAGCTTAGGAT TTTAGGCTTAGAGGATTCGGAGATTCGGAGCTTAGGAT TACAGAGAGCTTCTTAGGCGCTCCCGGTATCGCTCCCA TACAGAGAGCTTCTTAGGCGCTCCCGGTATCGCTCCCA TCCCATATTAAAATCTATCGATCGAGCTCTCCAATGCG TCCCATATTAAAATCTATCGATCGAGCTCTCCAATGCG ATCGATAGGACTAGTAGCTAGCTAGCTGAGCATGATA ATCGATAGGACTAGTAGCTAGCTAGCTGAGCATGATA GGCTCGATGAGCATGAGATGCATGTACGACTGCATAG GGCTCGATGAGCATGAGATGCATGTACGACTGCATAG GCATGACTGATCGACTGCATCATGACGCATGACTGCAT GCATGACTGATCGACTGCATCATGACGCATGACTGCAT GCATGACTGCATATGACGGACTCGCATTAGCACTACCG GCATGACTGCATATGACGGACTCGCATTAGCACTACCG TATTTGCGCATTACCAGATTAGAGAAATGCTAGTCGAT TATTTGCGCATTACCAGATTAGAGAAATGCTAGTCGAT CTATCGATCGGCTATTCGCAAAGCTGCGCGACTGCGAT CTATCGATCGGCTATTCGCAAAGCTGCGCGACTGCGAT GCGCTAGCATGCGATTCGCGATCGCCGAGCGCTCGCG GCGCTAGCATGCGATTCGCGATCGCCGAGCGCTCGCG AGCGCGCTAGCGGAATACTATATAGCGCGGATCAGTC AGCGCGCTAGCGGAATACTATATAGCGCGGATCAGTC TAGATCTATGAGATCGATAGCGATCTAGAGATAGGAT TAGATCTATGAGATCGATAGCGATCTAGAGATAGGAT CGAGATCGAGGCGAGATCATATGAGCGCGGCTATTTA CGAGATCGAGGCGAGATCATATGAGCGCGGCTATTTA GGCTTAGAGGATTCGGAGATTCGGAGCTTAGGATTAC GGCTTAGAGGATTCGGAGATTCGGAGCTTAGGATTAC AGAGAGCTTCTTAGGCGCTCCCGGTATCGCTCCCATCC AGAGAGCTTCTTAGGCGCTCCCGGTATCGCTCCCATCC CATATTAAAATCTATCGATCGAGCTCTCCAATGCGATC CATATTAAAATCTATCGATCGAGCTCTCCAATGCGATC GATAGGACTAGTAGCTAGCTAGCTGAGCATGATAGGC GATAGGACTAGTAGCTAGCTAGCTGAGCATGATAGGC TCGATGAGCATGAGATGCATGTACGACTGCATAGGCA TCGATGAGCATGAGATGCATGTACGACTGCATAGGCA TGACTGATCGACTGCATCATGACGCATGACTGCATGCA TGACTGATCGACTGCATCATGACGCATGACTGCATGCA TGACTGCATATGACGGACTCGCA
TGACTGCATATGACGGACTCGCA
GENE
1 ccctgtggag ccacacccta gggttggcca atctactccc aggagcaggg agggcaggag 61 ccagggctgg gcataaaagt cagggcagag ccatctattg cttacatttg cttctgacac 121 aactgtgttc actagcaacc tcaaacagac accATGgtgc acctgactcc tgaggagaag 181 tctgccgtta ctgccctgtg gggcaaggtg aacgtggatg aagttggtgg tgaggccctg 241 ggcaggttgg tatcaaggtt acaagacagg tttaaggaga ccaatagaaa ctgggcatgt 301 ggagacagag aagactcttg ggtttctgat aggcactgac tctctctgcc tattggtcta 361 ttttcccacc cttaggctgc tggtggtcta cccttggacc cagaggttct ttgagtcctt 421 tggggatctg tccactcctg atgctgttat gggcaaccct aaggtgaagg ctcatggcaa 481 gaaagtgctc ggtgccttta gtgatggcct ggctcacctg gacaacctca agggcacctt 541 tgccacactg agtgagctgc actgtgacaa gctgcacgtg gatcctgaga acttcagggt 601 gagtctatgg gacccttgat gttttctttc cccttctttt ctatggttaa gttcatgtca 661 taggaagggg agaagtaaca gggtacagtt tagaatggga aacagacgaa tgattgcatc 721 agtgtggaag tctcaggatc gttttagttt cttttatttg ctgttcataa caattgtttt 781 cttttgttta attcttgctt tctttttttt tcttctccgc aatttttact attatactta 841 atgccttaac attgtgtata acaaaaggaa atatctctga gatacattaa gtaacttaaa 901 aaaaaacttt acacagtctg cctagtacat tactatttgg aatatatgtg tgcttatttg 961 catattcata atctccctac tttattttct tttattttta attgatacat aatcattata 1021 catatttatg ggttaaagtg taatgtttta atatgtgtac acatattgac caaatcaggg 1081 taattttgca tttgtaattt taaaaaatgc tttcttcttt taatatactt ttttgtttat 1141 cttatttcta atactttccc taatctcttt ctttcagggc aataatgata caatgtatca 1201 tgcctctttg caccattcta aagaataaca gtgataattt ctgggttaag gcaatagcaa 1261 tatttctgca tataaatatt tctgcatata aattgtaact gatgtaagag gtttcatatt 1321 gctaatagca gctacaatcc agctaccatt ctgcttttat tttatggttg ggataaggct 1381 ggattattct gagtccaagc taggcccttt tgctaatcat gttcatacct cttatcttcc 1441 tcccacagct cctgggcaac gtgctggtct gtgtgctggc ccatcacttt ggcaaagaat 1501 tcaccccacc agtgcaggct gcctatcaga aagtggtggc tggtgtggct aatgccctgg 1561 cccacaagta tcacTAAgct cgctttcttg ctgtccaatt tctattaaag gttcctttgt 1621 tccctaagtc caactactaa actgggggat attatgaagg gccttgagca tctggattct 1681 gcctaataaa aaacatttat tttcattgca atgatgtatt taaattattt ctgaatattt 1741 tactaaaaag ggaatgtggg aggtcagtgc atttaaaaca taaagaaatg atgagctgtt 1801 caaaccttgg gaaaatacac tatatcttaa actccatgaa agaaggtgag gctgcaacca 1861 gctaatgcac attggcaaca gcccctgatg cctatgcctt attcatccct cagaaaagga 1921 ttcttgtaga ggcttgattt gcaggttaaa gttttgctat gctgtatttt acattactta 1981 ttgttttagc tgtcctcatg aatgtctttt cactacccat ttgcttatcc tgcatctctc 2041 tcagccttga ct
Gene della beta-globina (Homo sapiens)
da 1 a 2052 nucleotidi Sequenza GenBank n. NM_000518
DNA a filamento doppio (l’altro si ricava per complementarità)
Cromosoma 12
acatttg cttctgacac aactgtgttc actagcaacc tcaaacagac accATGgtgc acctgactcc tgaggagaag tctgccgtta ctgccctgtg gggcaaggtg aacgtggatg aagttggtgg tgaggccctg ggcaggctgc tggtggtcta cccttggacc cagaggttct ttgagtcctt tggggatctg tccactcctg atgctgttat gggcaaccct aaggtgaagg ctcatggcaa gaaagtgctc ggtgccttta gtgatggcct ggctcacctg gacaacctca agggcacctt tgccacactg agtgagctgc actgtgacaa gctgcacgtg gatcctgaga ctcctgggca acgtgctggt ctgtgtgctg gcccatcact ttggcaaaga attcacccca ccagtgcagg ctgcctatca gaaagtggtg gctggtgtgg ctaatgccct ggcccacaag tatcacTAAg ctcgctttct tgctgtccaa tttctattaa aggttccttt gttccctaag tccaactact aaactggggg atattatgaa gggccttgag catctggatt ctgcctaata aaaaacattt at
mRNA maturo per la beta-globina
proteina beta-globina, catena beta della emoglobina e mioglobina
GENE
SEQUENZE TRASCRIVIBILI
SEQUENZE REGOLATRICI
PROMOTORE INTENSIFICATORI SILENZIATORI
Gene e sua funzione: Cosa fa accendere il gene?
UNITA’ DI TRASCRIZIONE
Tratto di DNA che codifica per una molecola di RNA e delle sequenze necessarie per la sua trascrizione
A “sfumare l’oggetto” gene e renderlo più un “CONCETTO” sta la parte regolatrice del gene
Gene networks - un gene può esprimere le proprie
informazioni solo nel contesto dell’intero genoma
della cellula
Promot 3 Promot 4 Promot 2
gene1 gene2 gene3 gene4
Promot 1
FATTORI DI TRASCRIZIONE
-
+DNA
RNA
proteine
Come si esprime l’informazione?
Per i geni classici vedremo:
I meccanismi di Trascrizione e Traduzione Cosa è il Codice genetico
I principali meccanismi di CONTROLLO della espressione genica
Criteri:
tempestività economia
ovvero sintetizzare le proteine giuste al momento giusto e nella giusta quantità
DNA RNA proteine
replicazione o duplicazione
trascrizione della informazione
traduzione della informazione
"DNA makes RNA, RNA makes protein, and proteins make us."
Francis Crick
1. Trascrizione
Sintesi delle proteine
2. Traduzione tRNA rRNA
mRNA
TRASCRIZIONE (eucarioti)
“assemblaggio catalizzato”
Nella trascrizione l’informazione genetica contenuta nel DNA viene trascritta in una sequenza di RNA in base al principio della complementarietà delle basi
1- riconoscimento del gene da esprimere
2- individuazione di inizio e termine del gene specifico 3- trascrizione nella giusta quantità del gene
4- alto grado di fedeltà, cioè accuratezza è un processo controllato, regolato
poiché le necessità sono:
La trascrizione genera diversi tipi di RNA:
rRNA o RNA ribosomiale
tRNA o RNA transfer o RNA di trasporto
mRNA o RNA messaggero
HnRNA o RNA eterogeneo nucleare o pre-RNA
snRNA o piccoli RNA non codificanti
gene
proteina in crescita
aa legato al tRNA
ribosomi
Il processo è realizzato da enzimi chiamati RNA polimerasi DNA-dipendenti
Negli eucarioti:
RNA polimerasi I RNA polimerasi II RNA polimerasi III
rRNA : 28 S, 18 S, 5.8 S precursori degli mRNA, ncRNA, diversi snRNA tRNA e rRNA 5 S e alcuni snRNA
l’enzima si lega ad una sequenza sul DNA detta promotore
Promotore
RNA polimerasi
Direzione della trascrizione TRASCRIZIONE
PROMOTORE
TRASCRIZIONE:
fasi
RNA polimerasi
iniziazione
allungamento
terminazione
RNA polimerasi
ORIENTAMENTO DELLE UNITA’
5'
5'
3'
3'
5' 3'
filamento CODING o SENSO
filamento STAMPO o TEMPLATE o ANTI SENSO
RNA POLIMERASI
VELOCITA’
ca. 40 nucleotidi al secondo
Es. gene distrofina lungo ca. 2.200.000 bp???
Quante ore per trascriverlo?
17 ore!
filamento non-senso serve da stampo
filamento senso basi
Entrambi i filamenti del DNA possono costituire stampo per la sintesi dell’RNA, in funzione del gene, saranno sempre letti in direzione 3'- 5', poiché la crescita del filamento di RNA di neosintesi è in direzione 5'-3'
5' 3'
5' Complementarietà delle basi
Meccanismo della trascrizione:
sintesi di RNA sulla base di uno stampo di DNA Enzima: RNA polimerasi
Trascrizione:
lo stampo di DNA è letto da 3' a 5', l’RNA è sintetizzato da 5' a 3'
1° nucleotide 2° nucleotide
5' 3'
3' 5'
1° nucleotide
Uscita del pirofosfato Formazione legame fosfodiesterico 5'
Codice = sistema di segnali, o segni, o simboli, che, per convenzione, è destinato a rappresentare una informazione tra la fonte dei segnali e il punto di destinazione.
Es. comunicare in codice/ c. linguistico, formato da suoni/ c.grafico, c.fiscale, c. a barre, c.morse, ecc.
Definizioni
Codice genetico
sequenza di codoni contenenti le informazioni genetiche del gene e determinanti la sequenza degli aa che origina la proteina in base alla lettura dei codoni stessi
CODICE GENETICO o
Codice di traduzione (1964)
codice genetico anni ‘60 Codice genetico è un codice a triplette di nucleotidi, detti codoni
I codoni specificano per gli aa. In totale 43=64 codoni.
Caratteristiche del codice genetico
• il codice è ridondante
• il codice non è ambiguo
• il codice non ha punteggiatura ovvero interruzioni
• il codice è letto senza sovrapposizioni
• per interpretarlo è fondamentale la cornice di lettura o quadro di lettura (reading frame)
• il codice è universale (ad eccezione di quello dei mitocondri)
Trp Phe Gly
ACCAAACCG UGGUUUGGC
DNA
mRNA proteina Cornice di
lettura
TRADUZIONE TRASCRIZIONE
TRADUZIONE
“assemblaggio codificato”
Nella traduzione l’informazione genetica contenuta nella sequenza di codoni lungo l’mRNA viene decodificata o tradotta in una sequenza di aa costituenti la proteina, uniti in una sequenza precisa determinata dalla sequenza dei codoni
Protagonisti principali di questo processo:
mRNA tRNA ribosomi
porta nel citoplasma il messaggio genetico sotto forma di una specifica sequenza di codoni
sono gli interpreti del linguaggio
facilitano l’appaiamento specifico tra gli anticodoni del tRNA e i codoni dell’mRNA
Ribosomi (60% rRNA con azione catalizzante+proteine)
1. Hanno un sito di legame per l’mRNA.
2. Un sito P (peptidil-tRNA) che ospita il tRNA che porta la catena aminoacidica in allungamento.
3. Un sito A (aminoacil-tRNA) che ospita il tRNA a cui è legato il successivo aa da aggiungere.
4. Un sito E di uscita del tRNA scarico di aa.
mRNA
subunità maggiore subunità
minore
anticodone
sito di attacco per gli aa (sempre CCA) legami H tra basi complementari
tRNA
Attacco
dell’aa specifico in 3'OH del tRNA
L’enzima riconosce l’anticodone e lega l’aa opportuno
L’aminoacil-tRNAha un aa “attivato”
Aminoacil-tRNA sintetasi
tRNA = adattatore aminoacido
CODONE tripletta di nucleotidi
codificante per 1 aa
Riconoscimento codone-anticodone
ANTICODONE
U G A
Inizio sintesi proteica
Allungamento sintesi proteica
Terminazione sintesi proteica
Met
5’ 3’
mRNA
AUG
Met
3’
Ser
5’
mRNA
Met-Ser Pro Met-Ser-Pro-Thr
5’
mRNA
Met-Ser-Pro-Thr-...-...-...-
UGA
STOP!
3’
NH3 COO-
Per individuare il sito di INIZIO della TRADUZIONE: Sequenza consenso di M.Kozak: R--AUGG, R sta per una purina A o G
Destino proteico:
l’mRNA può essere tradotto
da ribosomi liberi o ribosomi legati al RER
nucleo
mitocondri cloroplasti
citoplasma
vescicole
secretorie lisosomi m.p.
RIBOSOMI LIBERI
RIBOSOMI SUL RETICOLO
ENDOPLASMATICO
Le proteine ed i loro segnali di smistamento
Proteina non ripiegata Proteina ripiegata
zona segnale sequenza segnale
Ad ogni segnale deve corrispondere un recettore proteico complementare
REGOLAZIONE ESPRESSIONE GENICA
eucarioti
Controllo o regolazione
della espressione genica negli EUCARIOTI Scopo:
differenziamento cellulare, ovvero espressione coordinata nel tempo
di geni diversi in cellule diverse.
Geni costitutivi cioè trascritti e tradotti in tutte le cellule Geni specifici attivati selettivamente da meccanismi di
regolazione genica
L’espressione genica è modulabile anche da segnali esterni che possono “accendere” o “spegnere” geni specifici.
Livelli di controllo sulla
espressione genica 1.pre-trascrizionale o
cromatinico 2. trascrizionale 3. post-trascrizionale
4. traduzionale
5. post-traduzionale
controllo sull’attività della proteina trascritto primario
di RNA (HnRNA)
mRNA
proteina DNA
proteina attiva o inattiva
- già nell’organizzazione della cromatina (eucromatina/eterocromatina) - in alcuni casi il silenziamento può essere invertito e i geni venire attivati attraverso processi che rendono la cromatina meno compatta
modificazioni strutturali della cromatina operate da COMPLESSI PROTEICI di rimodellamento ed enzimi
che modificano gli istoni:
modulazione della espressione genica
DNA
nel nucleo
Livello di controllo pre-trascrizionale o cromatinico (sul DNA) gene scelto
1
- sul suo riconoscimento ed aggancio al promotore - sulla sua efficienza nel trascrivere
regolazione su quale gene trascrivere e su quanto pre-RNA produrre
DNA
pre-mRNA o HnRNAnel nucleo
Livello di controllo trascrizionale (da DNA a pre m-RNA):
il controllo si esercita sulla attività della RNA polimerasi.
2
PROMOTORE natura modulare
Sequenza nel DNA di almeno 40 nucleotidi, con affinità più o meno elevata per la RNA polimerasi, di solito posta a monte del gene.
Hanno:
siti di riconoscimento (es. TATA box) sito di legame stabile
sito di inizio della trascrizione
siti di regolazione (simili a intensificatori e/o silenziatori)
GENE
SEQUENZE REGOLATRICI
SEQUENZE TRASCRIVIBILI
PROMOTORE INTENSIFICATORI SILENZIATORI
Gene: Cosa fa accendere il gene?
Il PROMOTORE
Sequenza data dalla combinazioni di corti elementi solitamente collocati nella regione immediatamente a monte del gene, spesso entro 200 bp dal sito di inizio della trascrizione.
I PROMOTORI HANNO NATURA MODULARE!
Risposta: NECESSITA’ DI SEQUENZE SEGNALE
Enhancer ovvero intensificatori = aumentano la capacità di iniziare la trascrizione, intensificano la trascrizione
Sequenze tessuto-specifiche= in grado di attivare/inattivare trascrizione in rapporto alla trasduzione di segnali recepiti dall’esterno
Silenziatori = spengono o reprimono la trascrizione
La trascrizione ovvero la attività della RNA polimerasi sarà dovuta ad un bilancio complessivo tra fattori che
la favoriscono o la inibiscono.
SITI DI REGOLAZIONE, anche a grande distanza!
Si tratta di corte SEQUENZE di DNA
SEQUENZE di DNA riconosciute da
specifiche proteine dette FATTORI DI TRASCRIZIONE
“Dialogo”
tra sequenze regolatrici di DNA e proteine
FATTORI GENERALI o BASALI
di trascrizione
PROTEINE REGOLATRICI SPECIFICHE
Nella regolazione della trascrizione, ad attivare o reprimere la RNA polimerasi, intervengono
proteine di 2 tipi:
RNA polimerasi II
Inizio della trascrizione FATTORI GENERALI
di trascrizione
promotore
Questi fattori sono richiesti per l’inizio della trascrizione e sono simili per tutti i geni trascritti dalla RNApolimerasi II
TATA box TFIID TFIIB
DNA gene X
promotore
TATA box
TFIID TFIIB
DNA gene X
RNA polimerasi II
Sequenze regolatrici
PROTEINE REGOLATRICI SPECIFICHE
trascritto di RNA
Le proteine specifiche si possono legare a sequenze specifiche, anche lontane sia a valle che a monte del gene.
Il ripiegamento del DNA le porta poi vicine al promotore per influenzare la polimerasi.
Integrazione al PROMOTORE di:
- RNA pol
- fattori generali di trascrizione - serie multiple di proteine regolatrici
EFFETTO COMBINATORIO
Un singolo promotore può essere regolato da molte sequenze regolatrici sparse lungo il DNA e riconosciute da più proteine regolatrici
proteine regolatrici
+ + - +
sinergia trascrizionale Come agiscono i fattori di trascrizione o proteine regolatrici?
EFFETTO DI COORDINAZIONE
Una singola proteina regolatrice/fattore di trascrizione può regolare e quindi coordinare l’espressione genica di parecchi geni diversi
proteina regolatrice
Gene networks - un gene può esprimere le proprie
informazioni solo nel contesto dell’intero genoma
della cellula
Promot 3 Promot 4 Promot 2
gene1 gene2 gene3 gene4
Promot 1
FATTORI DI TRASCRIZIONE
-
+DNA
RNA
proteine
pre-mRNA o HnRNA mRNA (maturo) nel nucleo
Livello di controllo post-trascrizionale (da pre m-RNA a mRNA):
-controllo sulla elaborazione dell’mRNA,
la maturazione comporta 3 tipi fondamentali di modificazioni chimiche del trascritto primario a ottenere mRNA maturo - controllo del trasporto dell’mRNA al citoplasma e sulla sua stabilità nel citoplasma (importante il 3’UTR)
3 4
Eventi post-trascrizionali:
dal preRNA all’mRNA 1- aggiunta del CAP (m7G)
aggiunta in 5’ di una 7metil-guanosina:
preserva il trascritto dalla degradazione ed è segnale di aggancio per il ribosoma
3- splicing
processo di taglia e cuci per eliminare gli introni
2- poli-adenilazione in 3’OH
aggiunta di una coda di poliA (200-250):
aiuta il passaggo al citoplasma, influenza la stabilità dell’mRNA
DNA TATA
PROMOTORE
+1 -25
E 1 E 2 E 3
Trascritto Primario o pre-mRNA
Esone 1 Esone 2 Esone 3
AUG UGA
I 1 I 2
Da pre-mRNA a mRNA maturo!!!
mRNA CAP AUG UGA
5’
aaaaaaaaa 3’
SPLICING= TAGLIA E CUCI degli introni/esoni
Spliceosoma = complesso ribonucleoproteico
150 proteine, 5 RNA snRNA (50-200 nucleotidi): U1, U2, U4, U5, U6 Dimensioni simili ad un ribosoma
snRNA
small nuclear RNA
Proteine
snRNPs
SPLICING ALTERNATIVO: lo splicing mostra una notevole flessibilità
1 2
1 2
1 2 1 Aggiunta di un esone 2
Aggiunta di un tratto intronico
Esclusione a vicenda di esoni
Sito di splicing interno
Splicing alternativo
può produrre forme diverse di mRNA e dunque di una proteina dallo stesso gene
Calcitonina= ormone che riduce la concentrazione del Ca2+nel plasma prodotto dalla tiroide
CGRP= peptide correlato alla calicitonina, potente vasodilatatore che può intervenire nella trasmissione del dolore su sistema nervoso periferico e centrale
Variazioni
al modello standard di gene:
un gene un mRNA una proteina
Un singolo gene è un genoma in miniatura
un LOCUS più prodotti genici alternativi
L’mRNA al termine della maturazione presenta:
- Regione non tradotta in 5´, 5´ UTR o leader - Regione codificante, CDS (coding sequence) - Regione non tradotta in 3´, 3´ UTR o trailer
N C
PROTEINA
TRADUZIONE
CAP AAAAA
5’UTR 3’UTR
5’ 3’
SEQUENZA CODIFICANTE AUG
mRNA MATURO
CDS UAAUGA UAG STOP DOPO MATURAZIONE
Funzione delle regioni dell'mRNA
5´UTR Efficienza della traduzione CDS Traduzione (1%)
3´UTR Stabilità (velocità di degradazione;
concetto di emivita da pochi minuti a 20-30 ore)
mRNA (maturo) 5
proteina nel citoplasma
5. Livello di controllo traduzionale (da m-RNA a proteina):
Operato da fattori proteici che possono influire sull’inizio della traduzione e quindi modularla, legandosi alla regione 5´UTR e magari “mascherandola” al ribosoma
6. Livello di controllo post-traduzionale (sulla proteina):
- controllo sulla modificazione delle proteine sintetizzate -controllo del ripiegamento (aiutato da proteine chaperon) e trasporto nella cellula al sito di funzione
6
proteina attiva
Livello di controllo post-traduzionale (sulla proteina):
modificazione delle proteine sintetizzate che risultano essenziali perché la proteina possa funzionare
Fosforilazione in TIROSINA TREONINA SERINA
Il nuovo “dogma”
ncRNA
microRNA A modulare la espressione genica delle proteine cellulari intervengono anche i geni non codificanti proteine o ncRNA (non coding RNA)
Ipotesi
ncRNA non sono semplice “rumore trascrizionale”, ma
più probabilmente svolgono
un ruolo regolatorio e sonocoinvolti in numerosi processi cellulari e biologici, in
particolare durante lo sviluppo e il differenziamento
Gruppo eteogeneo per dimensioni e funzione:
difficile classificazione
Caratterizzati spesso da una alta densità di codoni di STOP e quindi dalla assenza di ORF (cornici di lettura aperte) estese
Grande importanza per il ruolo da protagonisti nella REGOLAZIONE GENICA
Possono formarsi dalle zone introniche di geni coding o da vere e proprie unità geniche
Sempre di più nei database internazionali
ncRNA - generalità
La loro trascrizione ed elaborazione è sottoposta a controllo
ncRNA - meccanismi
Silenziamento genico post-trascrizionale: stabilità mRNA Attraverso meccanismi di “Interferenza da RNA”
Cambiamenti nei livelli di espressione degli ncRNA sono associati con forme diverse di cancro e patologie neurodegenerative
Modulazione della trascrizione (interazioni a triplice elica)
Dinamica della struttura della cromatina (regolatori epigenetici)
Regolazione espressione genica
ncRNAs
2- small RNAsnoRNA
alcuni non noti
~20-300 nt
~300->10.000 nt
~18-25 nt
3-Medium e large RNAs
1- microRNA siRNA
Studi funzionali Nuovi ncRNAs
funzionali
F.F. Costa
“Non-coding RNAs: lost in translation?”
Gene 386 (2007) 1-10
ncRNAs
alcuni non noti3-Medium e large RNAs
~18-25 nt - silenziamento genico post- trascrizionale (interferenza da RNA)
~300 - >10000 nt - inattivazione X - regolazione trascrizionale
~20- 300 nt
- modificazioni in RNA - regolazione trascrizionale - ruolo strutturale
2- small RNA snoRNA,
1- microRNA siRNA
miRNA micro-RNA
Regolazione post-trascrizionale sequenza-specifica dell’espressione genica; associata a differenziamento e
sviluppo embrionaleDa precursori più lunghi (70nt) ripiegati a forcina
Come si formano?
Questa sorta di trascritti primari sono tagliati da un complesso enzimatico “Dicer”
I miRNA (20-22nt) sono così trasportati al proprio bersaglio molecolare dal complesso proteico RISC
miRNA+
RISC
miRNA micro-RNA: meccanismi di azione
Regolazione post-trascrizionale:
1. Degradazione mRNA
2. Blocco della traduzione
12 Quasi perfetta
complementarietà al bersaglio (20-22 basi)
Brevi tratti di complementarietà al bersaglio (6-8 basi)
dsRNA
miRNA
Curiosità e spunti:
• la maggioranza di quelli specificamente espressi in
cellule staminali embrionali umane sono down-regolatidurante il proseguo dello sviluppo embrionale
• molti specificamente implicati nello sviluppo del cervello come dimostrato in diversi lavori sul modello murino
• altri legati a sviluppo di cancro: agirebbero come
oncogeni od onco-soppressori (es. miR-21, let-7, miR-122a)
Andrew Fire, 47 anni Stanford California
Craig Mello, 46 anni Massachusetts Medical School
Premio Nobel per la medicina 2006
Nature, feb. 1998
“Potent and specific genetic interference by double- stranded RNA (dsRNA)
in Caenorhabditis elegans”
Cosa si intende per RNA interference (RNAi)
Sistema di silenziamento genico basato su RNA
RNAi è un processo mediante il quale RNA a doppio filamento (double strand RNA o dsRNA) silenzia, in modo sequenza-specifico, l’espressione di geni omologhi per sequenza attraverso l’appaiamento con l’mRNA bersaglio, seguito dalla sua degradazione; quindi:
silenziamento post-trascrizionale.
E’ un meccanismo conservato a livello evolutivo di degradazione specifica di mRNA bersaglio che avviene in 2 stadi:
1°stadio-iniziale. I dsRNAs sono processati da un enzima dimerico, DICER (RNasiIII). Si generano i siRNAs.
2°stadio-effettore. siRNAs o small interfering RNA (< 22nt), vengono incorporati in un secondo complesso enzimatico (endonucleasico), RISC (complesso di silenziamento indotto da RNA) che degrada uno dei due
filamenti e usa l’altro per riconoscere, in base all’appaiamento delle basi, il substrato da degradare attraverso l’azione in base alla complementarietà delle basi.
dsRNA
siRNA
Modello degli stadi dell’RNAi: i siRNAs
RNAsi ATP-dip.
+ RISC (elicasi ATP-dip.) DICER
Riconoscimento dell’mRNA bersaglio
siRNA
AAAA
HnRNA
proteina X DNA
ncRNA AAAA
Fattore di trascrizione proteina nucleare
mRNA +/- _
Tutte le molecole di RNA trascritte a partire da un
genoma ANCHE GLI ncRNAs
Tutte le proteine codificate dal genoma ANCHE QUELLE A LOCALIZZAZIONE NUCLEARE Trascrittoma
Proteoma
INTERATTOMA COMPLESSO fondamentale nella regolazione
della espressione genica
Immagine mentale della attivazione dei geni lungo il DNA- i geni lungo il DNA sono come “luci di Natale” lungo la matassa dei fili: si accendono e si spengono ad intermittenza e con una intensità che va da MASSIMA luminosità a MINIMA luminosità e può essere modulata cioè regolata sia nella qualità che nelle quantità.