cromosoma X: le anomalie cromosomiche a livello dei cromosomi sessuali, e in particolare del
cromosoma 2: sono state osservate diverse delezioni della porzione distale del braccio lungo del
4. Il cromosoma 2: studio di associazione su larga scala e individuazione di CNVs 1 Genotyping su larga scala di SNPs tramite il sistema Illumina
Sulla base di tutti questi presupposti e sull’osservazione che lo screening di mutazione nei migliori geni candidati non ha portato all’identificazione di nessuna variante chiaramente implicata nell’eziologia dell’autismo, il gruppo di ricerca con cui ho svolto il lavoro di dottorato ha intrapreso un approccio più sistematico. Tale approccio consiste nel genotyping di SNPs ad alta densità all’interno della regione cromosomica 2q, allo scopo di effettuare studi di LD
mapping e identificare per via indiretta le varianti di rischio per l’autismo. Questo approccio è
stato reso possibile dalla recente disponibilità di risorse pubbliche quali il l’International
Haplotype Mapping Consortium (HapMap), che sta caratterizzando i pattern più comuni di
varianti di sequenza presenti nel genoma umano, e dalle nuove tecnologie che permettono una tipizzazione rapida ed efficiente di SNPs su larga scala.
Sfruttando la grande quantità di dati relativi all’analisi di SNPs è possibile mappare a livello genomico, su larga scala e a basso costo, la nuova fonte di variabilità rappresentata dalle CNVs. Dopo un’estesa analisi statistica per valutare la strategia migliore in termini di numero di campioni di DNA e di SNPs da analizzare, data l’ampiezza dei picchi di linkage (~ 40 Mb), per ottimizzare la selezione degli SNPs, è stata effettuata un’approfondita analisi bioinformatica utilizzando i dati disponibili in HapMap per valutare il profilo di LD e la struttura a blocchi di aplotipi nella regione di interesse
Abbiamo selezionato 1500 haplotype tagging SNPs (htSNPs) relativi ai blocchi in corrispondenza di tutti i geni noti e delle loro regioni regolatorie, riducendo così il carico di
genotyping necessario, pur caratterizzando la maggior parte della varibilità genetica nell’80% di
tutte le regioni geniche. Questi SNPs sono quindi stati tipizzati in un campione di 576 individui costituito da 126 famiglie con autismo (individui affetti con i loro genitori scelti fra le famiglie
multiplex che contribuivano maggiormente al picco di linkage sul cromosoma 2q) e 192 individui
di controllo. Il sistema utilizzato per la tipizzazione degli SNPs è stato la tecnologia Illumina (GoldenGate® assay).
Da questo esperimento sono stati ottenuti circa 850.000 genotipi, i quali sono stati utilizzati per effettuare un’analisi di associazione con il fenotipo autistico, utilizzando sia approcci di tipo caso-controllo, sia il test di disequilibrio della trasmissione (TDT). Ciò ha permesso di individuare alcuni aplotipi nell’ambito di due diversi geni, con una significativa evidenza di
geni: NOSTRIN (Nitric Oxide Synthase Trafficker) e ZNF533. E’ attualmente in corso una replicazione dell’esperimento in un campione di individui indipendente.
Tuttavia, nell’ambito del suddetto esperimento Illumina, l’obiettivo del mio lavoro ha riguardato un diverso aspetto dell’analisi dei genotipi prodotti: l’individuazione di Copy-Number Variants (CNVs) o varianti strutturali (cap7, §7.3). Cio’ si basa sull’osservazione che la presenza di una delezione in un individuo fa si che il risultato di genotyping di uno SNP emizigotico (in quanto ricade all’interno della delezione) venga interpretato erroneamente come omozigotico. Sulla base di tale osservazione, se lo SNP in questione è polimorfico e i genitori sono informativi per tale SNP, una delezione trasmessa da un genitore al figlio si evidenzia in risultati di genotyping dello SNP che, apparentemente, violano le leggi di Mendel.
4.2 Tecnologia Illumina: tecnologia array-based per il genotyping di SNPs su larga scala
Il sistema Illumina (BeadArrayTM) si basa su array di fibre ottiche. In una piastra sono disposti 96
arrays organizzati in una matrice 8x12. Ogni arrays è composto da circa 50.000 fibre ottiche, su
ognuna delle quali è inciso un piccolo pozzetto che alloggia una bead di 3 micron, alla quale sono attaccate moltissimi probes con la stessa sequenza nucleotidica. Ogni arrays contiene più di 1500 diverse sonde oligonucleotidiche, ognuna delle quali è presente in circa 30 copie, rendendo quindi il risultato di genotyping più affidabile perché basato su delle repliche. Questa tecnologia permette quindi di analizzare 96 campioni per più di 1500 SNPs contemporaneamente.
Il saggio Illumina (GoldenGateTM genotyping assay) (Figura 18) consente di discriminare le
varianti di SNPs direttamente sul DNA genomico piuttosto che su prodotti di PCR, per questo motivo non possono essere introdotti errori causati dal processo di amplificazione. Il DNA genomico viene attivato coniugandolo ad un supporto solido (particelle sferiche paramagnetiche). Seguono un passaggio per l’ibridazione degli oligonucleotidi disegnati per il saggio di specifici SNPs di interesse e diversi lavaggi per eliminare gli oligonucleotidi che non si sono legati.
Figura 18: Schema del saggio Illumina (GoldenGateTM genotyping assay).
Per ogni SNP da analizzare vengono disegnati due oligonucleotidi allele specifici (ASOs: Allele-
Specific Oligonucleotides) e un oligonucleotide locus specifico (LSO: Locus Specific Oligonucleotides) circa 20 bp a valle dell’oligonucleotide allele specifico. Ogni ASO termina al
3’ con una base che si ibridizza (in modo allele specifico) al DNA genomico in corrispondenza dello SNP, mentre al 5’ contiene una regione complementare ad un primer universale per la PCR (P1 o P2 coniugati ad una cianina: Cy3 o Cy5 a seconda dell’allele). Il LSO, invece, è costituito da tre regioni: al 5’ c’è una sequenza locus-specifica per lo SNP, nella porzione centrale una sequenza indirizzo complementare ad una delle 1500 sonde contenute in un array della piattaforma, e al 3’ una sequenza complementare ad un primer universale (P3). Si utilizza quindi una polimerasi in grado di effettuare l’estensione di un oligonucleotide che si ibridizza perfettamente al 3’ con il target e priva di attività esonucleasica e di displacement di sequenze a valle. In questo modo viene riempito il gap fra ogni ASO e LSO generando un substrato allele specifico per la reazione di PCR. Si introducono i tre primer universali (P1, P2, P3) e si effettua
negli arrays tramite la sequenza indirizzo. Come precedentemente spiegato, ad ognuno dei 1500 SNPs è assegnata una sequenza indirizzo contenuta nel LSO complementare ad una sola sonda presente nell’array. I rilevatori di fluorescenza utilizzati da Illumina scansionano infine la piastra contenente 96 arrays contemporaneamente a due diverse lunghezze d’onda adatte alla Cy3 e alla Cy5. Nel caso di un campione omozigote per un dato SNP, il rilevatore osserva un solo tipo di fluorescenza (o quella dipendente dal primer P1 coniugato alla Cy3 o dal primer P2 coniugato alla Cy5), invece in presenza di un campione eterozigote verranno rilevate entrambi i tipi di fluorescenza. Quindi il rapporto dei segnali relativi alle due diverse fluorescenze identifica il genotipo come AA, AB, o BB (Figura 19).
Figura 19: Rappresentazione grafica dei risultati forniti dal sistema Illumina per il genotyping di uno SNP (nell’esempio rs1560871). I tre cluster sono formati dai segnali di fluorescenza ottenuti per individui omozigoti AA (rosso), eterozigoti AB (viola), omozigoti BB (blu).
0 0.20 0.40 0.60 0.80 1
Normalized Theta Genotype calls for rs1560871
0 0.20 0.40 0.60 0.80 1 1.20 N or m al iz ed R 36 182 256 AA AB BB