ENZIMI DI RESTRIZIONE
Reazione
ligasica di
frammenti di
restrizione
Fig 4.20 separation of poly-A
mRNA
mRNA Purification
1. Total RNA Purification
2. PolyA+ RNA purification using oligo(dT)
mRNA
primed mRNA
mRNA/cDNA hybrid
AAAAAn
AAAAAn TTTTT
AAAAAn TTTTT
Anneal oligo dT primer
Reverse Transcriptase and dNTPs
Gubler Hoffman cDNA Synthesis - 1
mRNA/cDNA hybrid
nicked RNA
AAAAAn TTTTT
AAAAA TTTTT RNase H
Gubler Hoffman cDNA Synthesis - 2
AAAAAn TTTTT DNA Pol I
nicked RNA used as primers by Pol
2nd strand cDNA in pieces
ds cDNA AAAAATTTTT
cDNA Library
Clone into vector E. coli DNA
Ligase
Gubler Hoffman cDNA Synthesis - 3
AAAAA TTTTT
cDNA synthesis
TTTTTTTTT
First strand
Nick translation
cDNA library
Vettori e clonaggio
Vettori
Plasmidi Fagi
Cosmidi
YAC
Vettori e clonaggio
Plasmide
Molecola circolare di DNA a doppio filamento, normalmente presente
nella cellula batterica, in grado di replicarsi autonomamente
dal cromosoma.
VETTORI DI CLONAGGIO
Vettori e clonaggio
Replicazione di un plasmide
INSERIMENTO DI UN TRATTO DI DNA ESOGENO IN UN VETTORE DI CLONAGGIO
CLONAGGIO:
-TRASFORMAZIONE -SELEZIONE
-CRESCITA COLONIE
IDENTIFICAZIONE DELLA COLONIA
BATTERICA DI INTERESSE
Bromo-chloro-indoyl--galactopyranosidase or X-Gal (Clear)
Bromo-chloro-indoyl (Deep blue insoluble) +
galactose
-galactosidase
Inserting chromosomal DNA into a vector
GAATTC CTTAAG
GAATTC CTTAAG GAATTC
CTTAAG
GAATTC CTTAAG GAATTC
CTTAAG Vector
Chromosome
Cut with EcoRI and add DNA ligase
Recombinant vector
Ampicillin resistant; -galactosidase negative (White on X-Gal)
LacZ gene codes for -galactosidase Ampicillin resistance gene
Bacteria from ligation plated on ampicillin and X-Gal
Contains wild type plasmd
Contains
recombinant plasmd
Vettori e clonaggio
Vettori e clonaggio
Lunghezza massima del
DNA clonabile in un plasmide:
circa 20 Kb
Vettori e clonaggio
I virus sono piccoli parassiti non in grado di replicarsi.
Dopo aver infettato una
cellula-ospite utilizzano i suoi sistemi di replicazione e sintesi
delle proteine per riprodursi
Vettori e clonaggio
I batteriofagi (o fagi) sono virus
che infettano i batteri.
Vettori e clonaggio
Ciclo litico del fago T4
Vettori e clonaggio
Il fago più utilizzato in biologia
molecolare è il fago
Vettori e clonaggio
Ciclo litico e
lisogenico
del fago
Vettori e clonaggio
Assemblaggio
di un fago
Vettori e clonaggio
Mappa del genoma del fago
Vettori e clonaggio
Clonaggio di frammenti di DNA nel
fago
Vettori e clonaggio
Formazione di cloni fagici
Vettori e clonaggio
L’infezione dei batteri con il fago è circa 10
3volte più efficiente
della trasformazione
con un plasmide
Vettori e clonaggio
Lunghezza del DNA clonabile in un fago:
20-25 Kb
Vettori e clonaggio
Un cosmide è un plasmide contenente la sequenza COS
dal fago
Vettori e clonaggio
Vettori e clonaggio
Clonaggio di frammenti di DNA in un
cosmide
Vettori e clonaggio
Lunghezza del DNA
clonabile in un cosmide:
circa 45 Kb
EcoR I
Genomic Library
Infect cells
AAAAAA AAAAAA
AAAAAA AAAAAA
AAAAAA
AAAAAA
AAAAAA AAAAAA
AAAAAA
AAAAAA AAAAAA
AAAAAA
AAAAAA
AAAAAA AAAAAA
AAAAAA AAAAAA
AAAAAA
cDNA synthesis
Infect cells
cDNA library
• Preparing the insert
– Partial digestion preferred
Genomic Library Construction
Ligation to vector
Genomic library cDNA library
Genomic DNA mRNA
Source
Species or strains Species or strains Tissues
Developmental stages
Variation
12k -- 20k 0.2k -- 6k
Insert size
Equal Correlate with
expression level
Representation
Only one Expression vs. non
expression
Type
DNA DNA or antibody or
protein
Probe
Gene structure
Infer protein identity
Encoded protein
Infer protein identity
Purpose
Screening a eukaryotic gene library
• Homologous gene from other organism
– Mammalian genes are very similar
– Thus if trying to get human gene screen with the equivalent gene from another organism
– Oligonucleotide based on protein sequence or known sequence of homologous gene
– Purify protein and determine sequence
– Build a nucleotide sequence which codes for protein sequence
Amino acid sequence
Met-Asn-Lys-Trp-Glu-Met
ATG AAT AAA TGG GAA ATG ATG AAT AAA TGG GAG ATG ATG AAT AAG TGG GAA ATG ATG AAT AAG TGG GAG ATG ATG AAC AAA TGG GAA ATG ATG AAC AAA TGG GAG ATG ATG AAC AAG TGG GAA ATG ATG AAC AAG TGG GAG ATG
Met = ATG; Asn = AAT or AAC; Lys = AAA or AAG;
Trp = TGG; Glu = GAA or GAG
How many probes must we make?
CLONAGGI MULTIPLI
VETTORI DI ESPRESSIONE
PROTEINE DI FUSIONE
PRODUZIONE DI LIBRERIE
Screening the Library
ATTAGCGCCTTTACGCA
………TAATCGCGGAAATGCGT…………
Screening with DNA probe
• Probe is identified cloned
– From other organism – Same organism
• Looking for variants
• Chromosome walk
Chromosome walk
Expression vector
cDNA library
Clone cDNAs
Screen for gene of interest based on activity or antibodies
Genome Projects
• Whole genome sequencing
• Fragment and clone
• Sequence ALL clones!
• Computer assembles
Genome Projects
Bee Cat
Chicken Cow
Dog Fruit fly Human
Malaria parasite Microbial Genomes Mosquito
Mouse Nematode Pig
Plant Genomes Central Rat
Retroviruses Sea urchin Tribolium Sheep Zebrafish
• Multiple organisms provide suitable systems for experimentation
– Zebrafish-development – Rat-physiology
– Dog- genetic disease – Fruit fly- behavior
• Some of practical significance
– Mosquito/Malaria parasite
Il metodo Sanger
(o metodo a terminazione di catena)
1) Il sequenziamento a terminazione di catena coinvolge la sintesi di nuovi filamenti di DNA, complementari ad uno stampo a singolo filamento
Per la sintesi del DNA si utilizzano DNA polimerasi caratterizzate da
•Elevata processività
•Bassa attività esonucleasica 5’-3’
•Bassa attività esonucleasica 3’-5’
(es. Klenow, Sequenasi)
ori Ap
BamHI Promotore/operatore
Terminatore Shine-Dalgarno
Evoluzione dei vettori d’espressione
lacI
oriC TAG
M13
Denaturazione del vettore Utilizzo di un fago helper
Per M13 e produzione della Forma a singolo filamento
(1) Produzione dello stampo a filamento singolo
Utilizzo della PCR
Utilizzo di fagemidi
Il metodo Sanger
(o metodo a terminazione di catena)
2) un innesco specifico (primer)
3) La marcatura con un dNTP* marcato, di solito con 35S
Nel sequenziamento a terminazione di catena la reazione oltre ad 1) Uno stampo a singola elica
ha bisogno di:
5’-A T C T T T T A G A GT A C C
3’-T A G A A A A T C T C A T G G A C T C T C T A C T A T C T A C A T G T A -5’
PRIMER DNA Polimerasi
5’-A T C T T T T A G A GT A C C T G AG*AGAT GA T AG*A
3’-T A G A A A A T C T C A T G G A C T C T C T A C T A T C T A C A T G T A -5’
DNA Polimerasi PRIMER
(2,3) Sintesi del filamento marcato
Il metodo Sanger
(o metodo a terminazione di catena)
Nel sequenziamento a terminazione di catena la reazione oltre ad 1) Uno stampo a singola elica
2) un innesco specifico (primer)
3) La marcatura con un dNTP* marcato, di solito con 35S ha bisogno di:
4) una miscela di ddNTP, uno per ogni reazione di sequenza
La sintesi del filamento compementare, tuttavia non prosegue indefinitivamente, perché la miscela di reazione contiene, in quattro
distinte reazioni piccole quantità di specifici dideossinucleotidi
trifosfati, ddATP, ddTTP, ddCTP e ddGTP, che bloccano l’allungamento perché posseggono un solo atomo di idrogeno al posto del gruppo -OH in 3’
Terminazione della catena
ddCTP
ddCTP
ddCTP
ddCTP
ddCTP
ddCTP
5’-A T C T T T T A G A GT A C C T G AG*AGAT GA T AG*A
3’-T A G A A A A T C T C A T G G A C T C T C T A C T A T C T A C A T G T A -5’
DNA Polimerasi PRIMER
+ ddNTP ( per es. ddCTP)
5’-A T C T T T T A G A GT A C C T G AG*AGAT GA T AG*AT G T AddC
3’-T A G A A A A T C T C A T G G A C T C T C T A C T A T C T A C A T G T A -5’
STOP
Il risultato è una serie di frammenti interrotti ciascuno in corrispondenza di ogni dCTP
DNA stampo a singola elica
3’-GGCTAAC
3’-GGCTAAC
5’ 3’
Ibridazione con Il primer
+
[35S]dATP+dCTP,dGTP,dTT (dNTP) +Sequenasi
ddATP, dNTP ddCTP, dNTP ddGTP, dNTP ddTTP, dNTP
-CCG ddA -ddC
-C ddC -CC ddG
-CCGATT ddG -CCGA ddT -CCGAT ddT
Sequenza: 5’-CCGATTG A C G T
-CCGATT ddG -CCGAT ddT -CCGA ddT -CCG ddA -CC ddG -C ddC -ddC
G T
T A GC C
Schema di sequenziamento a terminazione di catena
Direzione di lettura
Nuovi metodi di sequenziamento
Il sequenziamento a ciclo termico ( PCR asimettrica)
Il sequenziamento automatizzato con marcatori fluorescenti
Il sequenziamento a ciclo termico ( PCR asimettrica)
Vengono effettuate 4 rezioni di PCR, ognuna contiene un solo primer e uno dei 4 dideossi nucleotidi trifosfati. Si generano le consuete famiglie di filamenti a catena terminata che vengono risolti per elettroforesi su gel di poliacrilammide
DNA stampo
ddATP PCR con un solo primer
ddA
ddA
ddA
ddA
ddA
Il sequenziamento automatizzato con marcatori fluorescenti
Coniugando a ciascun ddNTP un diverso marcatore fluorescente, è possibile effettuare le quattro reazioni di sequenziamento in un unico tubo da saggio
e caricare il tutto in solo pozzetto di gel
ddA
ddC ddT
ddG
Le emissioni fluorescenti vengono captate da un rilevatore e le informazioni vengono integrate e trasformate in picchi di colore diverso, con aree proporzionali all’intensità di emissione.
Fluorescent DNA Sequencing
A G T A C T G G G A T C
Gel
Electrophoresis
Detection of Fluorescently Tagged DNA
DNA Fragments Separated by Electrophoresis
Output to Computer
Scanning Laser Excites
Fluorescent Dyes Optical
Detection System
Fluorescent DNA Sequencing
Data
Fluorescent DNA Sequence Trace
Size of gene library
N = ln(1-P) ln (1-A/B)
N = Number of clones
P = 95 % probability of finding gene A = Average size of DNA fragments B = Total size of genome
E. coli has genome of 4,800,000 nucleotides Average size of insert is 10,000 nucleotides Number of clones for 95 % probability is 1700
Size of gene library
• If genome is large e.g. human genome (3 x 109) then number of clones to make library becomes unrealistic (1058000) if using a
plasmid vector (accepts only 10 kb as larger DNA can’t be transformed)
• Therefore need to use vectors that can accept larger pieces of DNA
– I.e. if each vector contains a large piece of DNA you don’t need so many clones to make a gene library
What vectors for what libraries?
VectorInsertsizeWhat librariesPlasmid<10 kbBacteriaLambda phage18-25 kbYeastCosmid34-45 kbIntermediateeukaryotesYAC etc0.1 – 1 MbHigher Eukaryotes
Human library requires 14000 YAC clones
Human library requires >1,000,000 plasmid clones
Vettori e clonaggio
YAC=yeast artificial chromosome
Vettori e clonaggio
Dimostrazione sperimentale degli elementi funzionali di
un cromosoma
Vettori e clonaggio
Vettore YAC:
sequenze ARS
CEN
TEL
Vettori e clonaggio
Vettori e clonaggio
Lunghezza del DNA clonabile in uno YAC:
fino a 1000 Kb
Vettori e clonaggio
Approximate Maximum Length of DNA That Can Be Cloned in Vectors
Vector Type Cloned DNA (kb)
Plasmid λ phage Cosmid P1 phage
BAC (bacterial artificial chromosome) YAC (yeast artificial chromosome)
20 25 45 100 300 1000
Whole Genome Shotgun Whole Genome Shotgun
• Celera Genomics
Fragment and sequence entire genome
Each fragment is sequenced completely and then these pieces are aligned to one another by a computer, based on overlapping
sequence between fragments.
Overview of Facts Asserted
• 2.91 billion base pairs (bp)
• 1.1% exons, 24% introns, 75% intergenic DNA
• 2.1 million single nucleotide polymorphisms (SNP’s)
• less than 1% of all SNP’s reflected changes in proteins
Structure of the genome
http://genome.ucsc.edu
http://www.ncbi.nlm.nih.gov