• Non ci sono risultati.

Sviluppo di saggi funzionali in lievito saccharomyces cerevisiae per caratterizzare varianti missenso di geni associati a tumori

N/A
N/A
Protected

Academic year: 2021

Condividi "Sviluppo di saggi funzionali in lievito saccharomyces cerevisiae per caratterizzare varianti missenso di geni associati a tumori"

Copied!
83
0
0

Testo completo

(1)

1

UNIVERSITÀ DI PISA

Dipartimento di Biologia

Corso di Laurea Magistrale in Biotecnologie Molecolari

Sviluppo di saggi funzionali in lievito Saccharomyces

cerevisiae per caratterizzare varianti missenso di geni

associati a tumori

Relatore: Candidata:

Alvaro Galli Giulia Bertocci

(2)

2

INDICE

Riassunto...………...…………5

Abstract………....…...……7

CAPITOLO 1: Introduzione………...9

1.1Strumenti predittivi per classificare le varianti missenso associate a tumore…...9

1.2 Il lievito Saccharomyces cerevisiae come organismo modello………...13

1.3 “Umanizzazione” del lievito………...…...………...13

1.4 Saggi funzionali...17

1.4.1 Considerazioni tecniche e pratiche per allestire un saggio funzionale...20

1.4.2 Validazione dei saggi funzionali...21

1.5 Il sistema di riparazione dei mismatch (MMR)...21

1.5.1 Mismatch repair e cancro...21

1.5.2 Il gene MSH6...23

1.6 BRCA1 nella riparazione del DNA...25

1.6.1 Il gene BRCA1...25

1.6.2 Riparazione del DNA...26

CAPITOLO 2: Scopo della tesi...28

CAPITOLO 3: Materiali e Metodi...30

3.1 Ceppi di lievito Saccharomyces cerevisiae...30

3.2 Vettori plasmidici...32

3.3 Clonaggio di MSH6 nel vettore pGEM®T easy...33

3.3.1 PCR per amplificare il gene MSH6...33

3.3.2 Corsa su gel...34

3.3.3 Purificazione del prodotto di PCR...34

(3)

3

3.3.5 Ligation...35

3.3.6 Trasformazione batterica...36

3.3.7 Digestione di controllo...36

3.4 Mutagenesi sito-specifica...37

3.4.1 Caratteristiche dei primer...38

3.4.2 PCR per amplificare il plasmide...40

3.4.3 Digestione del plasmide parentale...40

3.4.4 Trasformazione dei batteri competenti...41

3.5 Terreni di coltura...41

3.6 Trasformazione batterica con DNA plasmidico...43

3.7 Estrazione del DNA plasmidico dai batteri...43

3.8 Estrazione del DNA genomico dal lievito...44

3.9 Trasformazione di S. cerevisiae con DNA plasmidico...45

3.10 Gene Targeting...47

3.11 Western Blot...47

3.11.1 Estrazione delle proteine...48

3.11.2 Corsa su gel e trasferimento su membrana...48

3.11.3 Ibridazione con anticorpo...49

3.11.4 Sviluppo della membrana...49

3.12 Saggio di ricombinazione omologa e di reversione genica...49

CAPITOLO 4: Risultati...52

4.1 Costruzione del ceppo RSY6msh6::pCORE...52

4.2 Effetto dell’interruzione di MSH6 in RSY6 e della variante...55

4.3 Selezione delle varianti di MSH6 da caratterizzare...57

4.4 Costruzione dei plasmidi con le varianti missenso di MSH6...58

4.5 Gene Targeting per inserire il gene MSH6 mutato...59

4.6 Effetto dell’espressione della variante K177S di MSH6 in RSY6...60

(4)

4

4.8 Espressione di BRCA1 nel ceppo RS112...63

4.9 Effetto dell’espressione di BRCA1 sulla ricombinazione del ceppo RS112...64

CAPITOLO 5: Discussione...67

CAPITOLO 6: Conclusione...74

(5)

5

RIASSUNTO

La rapida evoluzione delle tecnologie di sequenziamento ha permesso l’identificazione di varianti geniche rare e comuni presenti nel genoma umano. Ciò impone la necessità di classificare le numerose varianti di significato funzionale incerto (VUS) e distinguere gli alleli ad alto rischio da quelli senza rischio per determinare il loro impatto sulla salute. Tradizionalmente, le varianti della linea germinale appena scoperte e sospette di essere patogenetiche sono sottoposte a test applicabili a tutti i geni come analisi di segregazione, storia familiare, frequenza nella popolazione, perdita di eterozigosi e test gene-specifici. Lo sviluppo di strumenti di predizione computazionali è stato il centro di un’intensa ricerca, ma si è rivelato insufficiente e non totalmente affidabile. La valutazione diretta usando saggi funzionali può aiutare nella classificazione delle varianti ed è uno strumento utile alla conferma delle predizioni computazionali. Inoltre, i saggi funzionali sviluppati in sistemi genetici semplici possono aiutare ad accelerare la valutazione funzionale delle nuove varianti individuate come associate al cancro.

L’uomo e il lievito Saccharomyces cerevisiae condividono migliaia di geni sebbene stiano divergendo da bilioni di anni. L’umanizzazione del lievito può essere utile per decifrare le conseguenze funzionali di varianti genetiche umane trovate nel cancro e per dare informazioni riguardo la patogenicità delle varianti missenso. L’umanizzazione del lievito può essere fatta con diversi approcci a seconda del gene che si vuol studiare. In particolare, per i geni umani che hanno un omologo in lievito si può introdurre una sostituzione simile a quella del gene umano nel gene di lievito. Per i geni che non hanno un omologo si esprime la proteina eterologa nella sua forma wild type o mutata. In questo lavoro di tesi il primo approccio è stato utilizzato per caratterizzare mutazioni del gene

MSH6 che è associato al tumore colorettale ereditario non poliposico. Il secondo

approccio è stato utilizzato per il gene BRCA1 che è associato a tumore familiare al seno e ovario. Lo scopo finale di questo studio è quello di potenziare l’uso del lievito come sistema modello per caratterizzare mutazioni associate a tumore. I geni presi in considerazione nel nostro studio codificano per proteine coinvolte nei meccanismi di riparazione del DNA; questi pathway si trovano nell’organismo modello S. cerevisiae

(6)

6

rendendolo adatto per mettere a punto saggi funzionali che consentiranno di discriminare le varianti patogenetiche da quelle neutre.

Al fine di costruire il sistema per caratterizzare le mutazioni nel gene MSH6 abbiamo creato il ceppo RSY6msh6::pCORE, in cui il gene è interrotto dall’inserimento di una cassetta CORE e, quindi, non è più funzionale. Il ceppo creato presenta un fenotipo mutatore, misurato come incremento della frequenza di reversione genica nel gene

ilv1-92 e arg4-3. Per ottenere le varianti del gene MSH6 è stato dapprima costruito un vettore

contenente il gene wild type e poi mutato mediante mutagenesi sito-specifica. Quindi, i ceppi di lievito contenenti mutazioni corrispondenti alle varianti missenso MSH6 saranno costruiti tramite gene targeting. Le varianti MSH6 saranno valutate nel nostro sistema modello come neutre o patogenetiche in base alla loro capacità di ristabilire il fenotipo selvatico.

Il gene BRCA1 non ha l’omologo in lievito, per cui l’espressione viene mediata attraverso un vettore plasmidico tramite crescita in terreno contenente l’induttore specifico che in questo caso è il galattosio. Studi effettuati dal gruppo dove ho svolto la tesi, hanno dimostrato che, in lievito, l’espressione di varianti missenso di BRCA1 associate a tumore causano un aumento della ricombinazione e della reversione. Prima di determinare l’effetto di BRCA1 nel ceppo diploide RS112, abbiamo determinato il livello di espressione della proteina wild type o mutata in tutti i ceppi utilizzati. I risultati del Western blot mostrano l’espressione della proteina nel ceppo di lievito: questo è un risultato importante per validare il saggio funzionale.

In questo lavoro, sono stati costruiti una serie di vettori per esprimere in lievito varianti missenso, patogeniche o neutre, sempre mediante mutagenesi sito specifica. I plasmidi sono stati trasformati nel ceppo diploide RS112 che permette di determinare eventi di ricombinazione, intracromosomica e intercromosomica.

I risultati ottenuti confermano che nel nostro sistema genetico alcune varianti patogenetiche di BRCA1, in particolare quelle che si trovano sui domini BRCT al C-terminale, aumentano la ricombinazione.

Questo studio dimostra ancora che il sistema modello utilizzato può essere uno strumento valido per un pre-screening di varianti di significato clinico incerto.

(7)

7

ABSTRACT

The rapid evolution of sequencing technologies allowed the identification of rare and common genetic variants present in the human genome. This requires the need to classify the many different functional significance uncertain (VUS) and distinguish alleles at high risk than those without risk to determine their impact on health. Traditionally, the variants of newly discovered disease-causing germ line are tested and suspected to be applicable to all genes as segregation analysis, family history, frequency in the population, loss of heterozygosity and gene-specific tests. The development of computational prediction tools has been the focus of intense research, but turned out to be insufficient and not totally reliable. Direct evaluation using functional assays can help in the classification of variations and is a useful tool to confirm computational predictions. In addition, functional assays developed in simple genetic systems can help speed up the functional evaluation of new variants identified as cancer-associated.

The man and the Yeast Saccharomyces cerevisiae share thousands of genes although they are diverging from billions of years. The humanization of the yeast can be helpful in deciphering the functional consequences of human genetic variants found in cancer and to give information about the pathogenicity of missense variants. The humanization of the yeast can be made with different approaches depending on the gene that does study. In particular, for the human genes that have a homologue in yeast we can introduce a replacement like that of human gene in yeast. For the genes that do not have a homologous, the heterologous protein is expressed in its wild type or mutated form. In this thesis work the first approach was used to characterize mutations of the MSH6 gene that is associated with non-polyposis hereditary colorectal cancer. The second approach was used for the BRCA1 gene that is associated with familial breast and ovarian cancer. The final aim of this study is to enhance the use of yeast as a model system to characterize mutations associated with cancer. The genes taken into consideration in our study encode proteins involved in DNA repair mechanisms; these pathways are found in the S. cerevisiae model organism making it suitable for developing functional assays that will allow to discriminate pathogenetic variants from neutral ones.

(8)

8

In order to build the system to characterize the mutations in the MSH6 gene we created the RSY6msh6::pCORE strain, in which the gene is interrupted by the insertion of a CORE cassette ad, therefore, is no longer functional. The created strain presents a mutator phenotype, measured as an increase in the frequency of gene reversion in the ilv1-92 and arg4-3 gene. To obtain the variants of the MSH6 gene, a vector containing the wild type gene was first constructed and then mutated by site-specific mutagenesis. Thus, yeast strains containing mutations corresponding to MSH6 missense variants will be constructed by gene targeting. The MSH6 variants will be evaluated in our model system as neutral or pathogenic based on their ability to restore the wild phenotype.

The BRCA1 gene does not have the homologue in yeast, so the expression is mediated through a plasmid vector by growth in soil containing the specific inducer that in this case is galactose. Studies carried out by the group where I carried out the thesis, have shown that, in yeast, the expression of tumor-associated BRCA1 missense variants cause an increase in recombination and reversion. Before determining the effect of BRCA1 in the RS112 diploid strain, we determined the level of wild type or mutated protein expression in all the strains used. Western blot results show protein expression in the yeast strain: this is an important result to validate the functional assay.

In this work, a series of vectors were constructed to express missense, pathogenic or neutral variants in yeast, again using specific site mutagenesis. The plasmids were transformed into the RS112 diploid strain that allows to determine recombination, intrachromosomal and intercromosomal events.

The results obtained confirm that in our genetic system some pathogenic variants of BRCA1, in particular those found on the BRCT domains at the C-terminal, increase the recombination.

This study further demonstrates that the model system used may be a valid tool for a pre-screening of variants of uncertain clinical significance.

(9)

9

CAPITOLO 1: Introduzione

1.1 Strumenti predittivi per classificare le varianti missenso associate a

tumore

Molte iniziative della medicina personalizzata si basano sull’identificazione dei target molecolari che possono essere utilizzati per identificare gli individui ad alto rischio di tumore e, quindi, per informare i pazienti dei trattamenti terapeutici più promettenti. Le iniziative si focalizzano sull’individuazione delle alterazioni del DNA, connesse al rischio di tumore e all’iniziazione e progressione del cancro nei tessuti, e stanno fornendo una prova allettante che l’obiettivo della medicina personalizzata potrà essere raggiunto nel prossimo futuro (Wood et al. 2016).

Le varianti missenso che differiscono dalla proteina wild type per un solo amminoacido, rappresentano una porzione significativa delle varianti identificate nei test genetici clinici. Inoltre, in assenza di un’evidenza funzionale o clinica forte, l’American College of Medical Genetics (ACMG) raccomanda di classificarle come varianti di significato incerto (VUS). Le VUS potrebbero essere classificate per avere una migliore informazione riguardo la cura dei pazienti. Per provvedere alla classificazione sono stati sviluppati numerosi algoritmi in silico che tentano di predire l’impatto funzionale delle varianti missenso associate a tumore attraverso l’analisi di conservazione della sequenza amminoacidica (Kerr et al. 2017).

Data l’importanza di un’accurata classificazione delle varianti per determinare il percorso preventivo o curativo a cui i pazienti dovranno sottoporsi, l’ACMG ha pubblicato le linee guida per l’interpretazione delle varianti che spesso richiedono linee multiple di evidenza (Richards et al. 2015). Le varianti missenso risultano in sostituzioni amminoacidiche delle proteine, che possono influenzare la struttura e/o la funzione proteica, in casi rari, lo splicing. I criteri comuni, quali l’analisi di co-segregazione e la frequenza nella popolazione, spesso non sono a disposizione per le varianti rare, quindi gli strumenti di predizione in silico sono frequentemente usati per valutare la patogenicità delle varianti missenso associate a tumore (Pesaran et al. 2016; Thompson et al. 2014).

(10)

10

Al fine di standardizzare l’interpretazione e la presentazione dei risultati derivanti dai test genetici, le organizzazioni come l’ACMG, l’Associazione per le patologie molecolari (AMP) e l’Agenzia Internazionale per la Ricerca e il Cancro (IARC) hanno proposto dei criteri per l’interpretazione delle varianti missenso di geni associati a tumore (Richards et al. 2015; Tavtigian et al. 2008). Questi criteri si avvalgono di linee multiple di evidenza per categorizzare le varianti secondo un algoritmo con 5 livelli di classificazione usando termini come variante patogenetica (Pathogenic, P), probabilmente patogenetica (Variant Likely Pathogenic, VLP), variante di significato sconosciuto (Variant of Unknown Significance, VUS), variante probabilmente neutra (Variant Likely Benign, VLB) e neutra (Benign, B) ad indicare la probabilità di associazione con la malattia (Tabella 1).

Tabella 1: Classi di patogenicità delle varianti geniche secondo la classificazione IARC.

Il consorzio ENIGMA (Evidence based Network for the Interpretazione of Germline Mutant Alleles) ha dimostrato il potere dell’approccio collaborativo per la valutazione delle varianti associate a tumore e ha fatto un grande passo nella riclassificazione delle VUS nei geni coinvolti nel tumore al seno e all’ovario. Per merito dei database ad accesso libero, come ClinVar e Leiden Open Variant Database (LOVD), è stato possibile standardizzare l’interpretazione delle varianti tra laboratori che avevano osservato una discrepanza nelle classificazioni. Le collaborazioni tra i vari laboratori hanno permesso di rivalutare le varianti VUS come varianti probabilmente patogenetiche o come varianti probabilmente benigne o benigne; però nonostante questa collaborazione alcune varianti sono molto rare e non vi sono dati sufficienti per classificare le VUS (Pesaran et al. 2016). Il laboratorio Ambry Genetics, come descritto nel lavoro di Pesaran e collaboratori (Pesaran et al. 2016), ha sviluppato e formalizzato un approccio integrativo per la valutazione delle varianti, che include un algoritmo di classificazione a 5 classi simile a

Classificazione IARC

Classe 1 Non patogenetica

Classe 2 Probabilmente non patogenetica

Classe 3 Incerta

Classe 4 Probabilmente patogenetica

(11)

11

quello presentato da ACMG e IARC. L’algoritmo dell’Ambry Genetics incorpora linee di evidenza multipla con lo scopo di valutare sia l’impatto della variante sulla struttura proteica sia la patogenicità della variante in relazione al fenotipo; quando queste linee di evidenza sono combinate permettono la classificazione come probabilmente benigna, benigna, probabilmente patogenetica o patogenetica. Quando, invece, l’evidenza è limitata la variante resta classificata come VUS. Il fenotipo osservato nei portatori della variante, la co-segregazione della variante con la malattia e la co-presenza con altre varianti patogenetiche riflettono la patogenicità della variante. Alcune di queste evidenze sono ottenibili dai database, come ad esempio i dati della frequenza allelica nel Consorzio Aggregazione Esoma (ExAC) o i dati pubblicati in letteratura (Lek et al. 2016). Comunemente, la letteratura contiene i dati per le varianti comuni, mentre i dati per le varianti rare sono scarsi. L’affidamento sull’evidenza basandosi sulla letteratura per stabilire l’impatto delle varianti sull’espressione genica e sulla funzione proteica presenta numerose limitazioni, le quali includono pregiudizi sulle pubblicazioni, difficoltà nell’ottenere informazioni aggiuntive circa i risultati e i protocolli, e la mancante evidenza pubblicata per una specifica alterazione (Lek et al. 2016). Una soluzione a queste limitazioni è sviluppare dei saggi con alta sensibilità e specificità (>99%) e fornire evidenze molecolari imparziali per elucidare l’impatto funzionale di una VUS. Un esempio di saggio convincente e validato è quello sviluppato da Guidugli e colleghi in cui vengono caratterizzate varianti missenso localizzate nel gene BRCA2 che è associato al tumore al seno all’ovaio (Guidugli et al. 2013). Per validare questo saggio funzionale, in cui si misura l’efficienza di riparazione delle rotture a doppio filamento nel DNA mediante ricombinazione omologa (HDR) di queste varianti, è stata determinata la sensibilità (corretta identificazione delle varianti patogenetiche) e la specificità (corretta identificazione delle varianti non patogenetiche) per una valutazione più completa dell’associazione delle varianti BRCA2 a tumore (Guidugli et al. 2013).

Per fornire una valutazione esauriente dell’uso clinico degli strumenti in silico, nel lavoro di Kerr et al. (2017) è stata valutata la capacità predittiva di numerosi strumenti in silico in un’ampia coorte di individui che si sono sottoposti a test genetici. È stato compilato un set di varianti in BRCA1, BRCA2, MLH1 e MSH2 classificate nel suo laboratorio che, successivamente, è stato comparato con le classificazioni ottenute dai seguenti strumenti in silico: Align-GVGD, CONDEL, Grantham Analysis, MAPP-MMR, PolyPhen-2 e

(12)

12

SIFT. Tutti questi algoritmi evidenziano una marcata divergenza in accuratezza (tasso delle predizioni complessivamente corrette sul numero totale di predizioni), specificità (corretta identificazione delle varianti non patogenetiche; tasso dei veri negativi) e sensibilità (corretta identificazione delle varianti patogenetiche; tasso dei veri positivi). L’algoritmo Align-GVGD, considerando i risultati complessivi della classificazione in silico, mostra l’accuratezza più alta (90.8%) e la minor divergenza tra specificità (91.7%) e sensibilità (84.1%). Gli altri algoritmi presentano tassi di accuratezza e specificità che riflettono l’alta frequenza di falsi positivi per questi strumenti in silico. Il coefficiente di correlazione Matthews, per il quale un valore di 1 indica completa concordanza con le classificazioni di laboratorio, mostra il più alto grado di correlazione per Align-GVGD (0.65), poi per MAPP-MMR (0.59). I restanti strumenti predittivi mostrano una correlazione inferiore con le classificazioni sperimentali.

Tutti gli algoritmi di questo studio generano un alto tasso di errore (alta frequenza di falsi positivi e baso coefficiente di correlazione) in confronto alle classificazioni di riferimento. Questi risultati sono coerenti con gli studi precedenti che hanno riportato un alto tasso di errore nelle classificazioni in silico (Flanagan et al. 2010, Gnad et al. 2013). Sulla base delle analisi fatte sopra si può affermare che sebbene i metodi computazionali abbiano iniziato a trovare approvazione come strumenti diagnostici (Richards et al. 2015), essi hanno un potere predittivo limitato (Mathe et al. 2006; Chan et al. 2007; Cline and Karchin 2011; Thusberg et al. 2011; Castellana and Mazza 2013; Frousios et al. 2013; Gnad et al. 2013). Pertanto i test di complementazione negli organismi modello umanizzati sono un’alternativa promettente (Laurent et al. 2016). In questo lavoro di tesi, abbiamo costruito dei nuovi ceppi di lievito Saccharomyces cerevisiae per mettere a punto un nuovo saggio funzionale per caratterizzare varianti missenso del gene MSH6 che è coinvolto nel tumore al colon (Miyaki et al. 1997). Inoltre, abbiamo validato un saggio per caratterizzare varianti missenso localizzate nel gene di suscettibilità genetica al tumore al seno, BRCA1 (Ford et al. 1998).

(13)

13

1.2 Il lievito Saccharomyces cerevisiae come organismo modello

L’ultimo antenato comune all’uomo e al lievito è stato stimato che sia vissuto approssimativamente un bilione di anni fa, ma nonostante questo condividiamo ancora una sostanziale porzione del materiale genetico. Il genoma umano contiene all’incirca 20000 geni, mentre il genoma di lievito ne comprende circa 6000. La comparazione a coppie dei geni tra le due specie ha rivelato circa 2100 gruppi di ortologhi, che rappresentano 2300 geni di lievito e 3900 geni umani (Laurent et al. 2016).

La condivisione tra uomo e lievito di molti geni, i quali svolgono ruoli cellulari importanti in entrambi gli organismi, e il fatto che la loro perturbazione determini condizioni patologiche negli esseri umani (Laurent et al 2016), unita ai vantaggi pratici offerti dal microrganismo, quali: piccola dimensione del genoma, crescita rapida, unicellularità e facile manipolazione, ha convinto i ricercatori ad adottare il lievito Saccharomyces

cerevisiae come organismo modello ampiamente utilizzato per la manipolazione del

materiale genetico (Botstein et al. 2011).

I metodi per comprendere le conseguenze delle mutazioni umane usando il lievito risiedono in tre categorie: analisi sistematiche di dosaggio genico; creazione delle varianti umane negli ortologhi del lievito; complementazione interspecie ed espressione eterologa (Dunham and Fowler 2013).

1.3 “Umanizzazione” del lievito

L’uomo e il lievito S. cerevisiae condividono migliaia di geni codificanti per proteine sebbene la loro divergenza sia iniziata da bilioni di anni (Douzery et al. 2004). L’omologia tra uomo e lievito e la trattabilità del lievito hanno indotto i ricercatori ad espandere la sua utilità come modello per la biologia umana, dall’espressione eterologa delle proteine umane alla modificazione del genoma di lievito per “umanizzare” specifici amminoacidi, proteine o anche interi pathway (Laurent et al. 2016).

(14)

14

Figura 1: I 5 gradi di umanizzazione del lievito. Il lievito ha dimostrato la sua utilità per

lo studio diretto della biologia umana in una varietà di forme, qui sono illustrati i casi in cui è stato impiegato il lievito: per capire i processi umani (0), per l’espressione eterologa dei geni umani (1), per sostituire specifici amminoacidi (2), geni (3) e pathway (4).

I livelli di umanizzazione realizzabili sono i seguenti (Figura 1):

 Livello 0: studio del lievito come strumento per capire la biologia umana.

Alcune funzioni dei geni coinvolti in processi cellulari conservati nell’evoluzione, come ad esempio la replicazione del DNA e la riparazione del DNA, sono state scoperte usando il lievito come organismo modello (Williamson et al. 1965).

 Livello 1: espressione eterologa di proteine umane.

Un esempio riguarda l’espressione della proteina umana BRCA1, la cui mutazione inattivante a livello germinale predispone al cancro al seno e all’ovaio. BRCA1 non ha l’omologo in lievito, tuttavia l’espressione eterologa di BRCA1 umana in S. cerevisiae induce l’inibizione della crescita. Questa osservazione ha permesso di sviluppare un saggio funzionale chiamato “Yeast small colony assay” che si è rivelato molto utile al fine di caratterizzare a livello funzionale i vari polimorfismi della proteina BRCA1 (Humphrey et al. 1997, Caligo et al 2009)

Altri studi hanno scelto di esprimere geni umani che sono associati con malattie, come ad esempio cancro e disturbi neurologici. Uno di questi casi coinvolge la famiglia proteica

(15)

15

delle Poli ADP-ribosio polimerasi (PARP), studiata come target terapeutico per il cancro al seno e all’ovario (Telli et al. 2011). Il lievito non possiede l’omologo di PARP, così il tentativo di utilizzare il lievito come una piattaforma per scoprire gli inibitori di PARP necessitava l’espressione eterologa della proteina umana. L’espressione di PARP1 e PARP2 comporta l’inibizione della crescita del lievito. I composti di piccole molecole che consentono di recuperare la crescita potrebbero essere candidati come inibitori di PARP: lo screening di 16 000 piccole molecole organiche ha permesso di scoprire due composti che effettivamente fanno recuperare la crescita del lievito esprimente PARP (Perkins et al. 2001).

 Livello 2: umanizzazione di posizioni specifiche all’interno del gene nativo del lievito.

Sulla base dell’allineamento delle sequenze amminoacidiche di proteine ortologhe in lievito e uomo, è stato pensato di mutagenizzare le proteine native del lievito per renderle uguali a quelle umane. In particolare, residui amminoacidici altamente conservati nell’evoluzione risultano importanti per la funzione di determinate proteine e spesso sono coinvolti in patologie umane (Miller and Kumar 2001). Se una mutazione in uno specifico residuo è associata ad una specifica malattia umana, la mutagenesi del gene di lievito al fine di renderlo identico a quello umano associato alla malattia potrebbe rivelare un effetto sulla proteina e a livello fenotipico sull’intero organismo.

A questa categoria appartengono alcuni studi condotti sulla proteina MSH2, capace di riconoscere le basi del DNA appaiate scorrettamente. MSH2 è un gene altamente conservato e le mutazioni sul gene MSH2 umano risultano essere implicate nel cancro (Gammie et al. 2007). Gammie e collaboratori hanno studiato 54 mutazioni in MSH2 associate alla patologia ingegnerizzando il gene nella stessa posizione nel gene di lievito ed hanno scoperto che più della metà mostrano forti difetti nei saggi funzionali che valutano il mismatch repair (MMR).

 Livello 3: umanizzazione di un intero gene.

Il passo successivo a quello di umanizzare uno specifico amminoacido è sostituire un intero gene di lievito con la controparte umana. Alcuni esempi di geni di lievito sostituiti con geni umani sono la POL-γ (Qian et al. 2015), la telomerasi (Wong et al. 2013) e la cistationina β sintasi (Kruger and Cox 1994).

(16)

16

La possibilità di umanizzare le proteine umane una ad una con successo apre la porta all’opportunità di umanizzare interi pathway o complessi proteici. Questo metodo riduce il problema che la sostituzione di un singolo gene non sia capace di catturare l’intero contesto funzionale della proteina; inoltre, dovrebbe consentire di studiare i fenotipi più complessi che coinvolgono diversi membri di una via o interazioni epistatiche tra più geni. Naturalmente l’umanizzazione sarà ben riuscita quando la sostituzione dei geni di lievito con la controparte umana garantirà la vitalità della cellula e i pathway originari di lievito saranno sufficientemente disattivati. Questo approccio è stato sfruttato per umanizzare in lievito il pathway di glicosilazione delle proteine (Wildt et al. 2005).

Le applicazioni maggiormente motivate per l’umanizzazione del lievito sono la scoperta dei geni coinvolti nelle malattie e, di conseguenza, lo sviluppo dei farmaci. L’umanizzazione del lievito può aiutare a decifrare le conseguenze funzionali delle variazioni genetiche umane trovate in numerose malattie (Aggarwal and Brosh 2012; Hamza et al. 2015; Laurent et al 2016).

Una considerevole porzione dei geni conservati tra lievito e uomo compie le stesse funzioni in entrambi gli organismi; sulla base di questa misura una proteina codificata da un gene umano può sostituire quella del lievito (Kachroo et al. 2015). Comunque, basandosi sull’allineamento tra le sequenze amminoacidiche delle proteine ortologhe umane e di lievito, i ricercatori hanno optato per mutare le proteine native del lievito in modo che corrispondano alla sequenza proteica umana nella posizione d’interesse. Nel laboratorio di genetica e genomica funzionale dell’Istituto di Fisiologia Clinica del CNR di Pisa è stato sviluppato il web tool CRIMEtoYHU (CTY) per aiutare i ricercatori nella valutazione dell’impatto funzionale delle varianti missenso associate al cancro (Mercatanti et al 2017). Per umanizzare posizioni specifiche nei geni di lievito, geni umani e di lievito devono avere un’omologia funzionale. Se una mutazione in uno specifico residuo è associata con un particolare fenotipo negli umani, una sostituzione simile nel lievito potrebbe rivelare il suo effetto al livello dell’organismo. CTY trova i geni omologhi del lievito, identifica le varianti corrispondenti e determina la trasferibilità delle varianti umane al lievito assegnandogli un punteggio di affidabilità (Reliability Score, RS), che si basa sulla localizzazione proteica e sulla conservazione funzionale tra lievito e uomo. Il punteggio RS è assegnato da un algoritmo che calcola dati funzionali,

(17)

17

tipo di mutazione, chimica della sostituzione amminoacidica e il grado di trasferibilità dalla proteina umana a quella di lievito. Il web tool analizza le mutazioni di nuova identificazione o recupera le mutazioni riportate nel database COSMIC. Le mutazioni che mostrano un RS positivo sono altamente trasferibili al lievito e, quindi, il saggio funzionale su tali varianti sarà più affidabile (Mercatanti et al 2017).

Gli esempi classici di umanizzazione di specifiche posizioni nei geni nativi del lievito, per studiare l’impatto funzionale delle varianti missenso associate al cancro, sono quei lavori guida svolti per capire il ruolo dei geni umani del mismatch repair nel cancro al colon (Strand et al. 1993, Shimodaira et al. 1998, Gammie et al. 2008).

Nel mio lavoro di tesi, abbiamo costruito dei ceppi di lievito umanizzati di livello 2 per il gene MSH6 e di livello 1 per quanto riguarda le varianti missenso di BRCA1.

1.4 Saggi funzionali

I saggi funzionali sono sistemi sperimentali che permettono di capire se una proteina è funzionante (wild type) o difettiva (mutata).

Stabilire la perdita di funzione di una proteina quando si è verificato un evento di mutazione che crea un frame-shift o uno stop è più facile rispetto a dover distinguere tra polimorfismi e mutazioni missenso che riguardano il cambiamento di un singolo amminoacido. Con l’accelerazione delle tecnologie di sequenziamento molte varianti geniche sono state scoperte da pazienti sani e malati; quindi, stabilire quali varianti sono la causa del fenotipo tumorale è diventato limitante, soprattutto per l’abbondanza di varianti rare che rendono ancora più difficile la classificazione (Tennessen et al. 2012). La ragione dell’inabilità a classificare le varianti di significato incerto (VUS) deriva dalla mancanza di informazioni genetiche per determinare l’associazione con il cancro. La maggior parte delle VUS sono mutazioni missenso e l’impatto di queste alterazioni generalmente non può essere dedotto, ma deve essere verificato sperimentalmente (Carvalho et al. 2007). L’avvento delle nuove tecnologie, sequenziamento high-throughput, proteomica e metodi computazionali, hanno incrementato il potere degli approcci basati sul lievito per determinare le conseguenze delle variazioni genetiche umane (Dunham et al. 2013).

(18)

18

I saggi funzionali rappresentano esperimenti nei quali una serie di VUS sono state sistematicamente analizzate e comparate a ben definiti controlli positivi e negativi per determinare la loro influenza sulla funzionalità della proteina, generando informazioni aggiuntive che possono essere integrate con i dati genetici ed epidemiologici a disposizione (Easton et al. 2007). Come controllo negativo viene utilizzata generalmente la forma wild type della proteina o varianti classificate come non patogenetiche, mentre come controllo positivo viene utilizzata una variante patogenetica già classificata. Esistono numerosi saggi funzionali sviluppati nel lievito, la maggior parte dei quali sono stati progettati per caratterizzare le varianti missenso dei geni coinvolti nei processi di riparazione dei danni al DNA, perché quando questi geni sono mutati possono provocare l’insorgenza di tumori negli individui portatori di tali mutazioni.

Alcuni saggi funzionali sono stati sviluppati per studiare l’effetto delle mutazioni nei geni

MLH1 e MSH2 del mismatch repair (MMR), poichè mutazioni missenso ereditarie sono

state frequentemente individuate nei pazienti affetti da cancro colorettale ereditario non-poliposico (Liu et al. 1996).

L’espressione ectopica delle proteine MMR umane in lievito può essere saggiata per il loro effetto mutatore attraverso l’analisi di mutazioni al locus CAN, al fine di ristabilire resistenza alla canavanina, o di mutazioni nei geni che codificano per elementi essenziali in modo da ristabilire la prototrofia. L’efficacia del lievito come sistema modello per investigare le conseguenze funzionali delle mutazioni nei geni MMR che potrebbero essere patogenetiche, a parziale perdita di funzione o polimorfismi silenti è stata dimostrata mediante l’analisi delle varianti umane di MLH1 e MSH2 in uno screen eseguito in S. cerevisiae (Ellison et al. 2001). Il saggio misura l’instabilità di un microsatellite, rappresentato da un tratto in cui si ripete la coppia nucleotidica GT per 16 volte, per valutare le varianti trovate nella popolazione umana. Le mutazioni missenso sono state introdotte in corrispondenza del residuo omologo nei geni del lievito. Inoltre gli autori hanno costruito un gene MLH1 ibrido uomo-lievito per valutare le sostituzioni amminoacidiche dei residui che non sono conservati tra le due specie. I risultati ottenuti dal saggio funzionale nel lievito e i dati clinici disponibili mostrano una buona correlazione.

Un altro sistema che è stato sviluppato per valutare la patogenicità delle varianti di MLH1 è quello nel quale i geni MLH1 e PMS2 di lievito sono stati sostituiti dagli ortologhi umani

(19)

19

mediante ricombinazione omologa (Vogelsang et al. 2009). I ceppi di lievito risultanti dalla sostituzione genica mostrano un tasso di mutazione equivalente al ceppo wild type. Questo sistema è l’unico nel quale una singola copia del gene MMR è stata introdotta in ciascuna cellula sotto il controllo del promotore di lievito, fornendo uniformità all’analisi genetica.

Altri esempi di saggi funzionali creati in lievito hanno ampliato la conoscenza di tre geni soppressori dei tumori: BRCA1, BRCA2 e p53.

Humphrey insieme ai colleghi osservò che l’espressione di BRCA1 in S. cerevisiae inibisce la crescita cellulare e l’effetto è localizzato nel motivo BRCT al C-terminale, una sequenza conservata trovata in molte proteine responsive al danno al DNA (Humphrey et al. 1997). La soppressione della crescita diminuisce in presenza di mutazioni missenso associate a malattia all’interno del dominio C-terminale di BRCA1. Sulla base di questa osservazione è stato sviluppato un saggio funzionale, noto come “Small colony phenotype assay”, per caratterizzare le varianti missenso di BRCA1 che si trovano al C-terminale. Più tardi, è stato generato un saggio di ricombinazione omologa il quale mostra che le mutazioni missenso di BRCA1 associate a tumore, al di fuori del dominio conservato BRCT possono incrementare la ricombinazione omologa (Caligo et al. 2009).

Il saggio di ricombinazione allestito nel lievito per caratterizzare le (VUS) di BRCA2 prevede l’espressione della proteina full-length umana nel ceppo diploide RS112 di S.

cerevisiae, il quale contiene due substrati per misurare la ricombinazione omologa (HR)

intracromosomica e intercromosomica (Spugnesi et al. 2013). L’espressione della proteina wild type incrementa la frequenza di ricombinazione intra e intercromosomica. È stata valutata l’influenza dell’espressione di tre varianti neutre di BRCA2 e di una variante patogenetica nota sulla ricombinazione omologa del lievito, ed è stato osservato che le varianti neutre induco un incremento significativo della ricombinazione omologa, mentre quella patogenetica no. Questi risultati suggeriscono che le VUS che incrementano la ricombinazione omologa nel saggio di lievito non sono patogenetiche perché conferiscono lo stesso fenotipo di BRCA2 wt; dall’altro lato, le varianti che non incrementano la HR possono considerarsi associate al rischio di manifestare il cancro. p53 gioca un ruolo importante nel danno al DNA e nella risposta allo stress replicativo attivando il checkpoint di controllo nelle cellule di mammifero. La perdita di funzione di p53 si ripercuote sull’instabilità genomica, una caratteristica della carcinogenesi. Come

(20)

20

fattore di trascrizione, p53 si lega ad una sequenza consenso nel promotore del gene target e partecipa alla trans-attivazione. La maggior parte delle mutazioni di p53 sono sostituzioni di un singolo amminoacido e il loro effetto molecolare sulla funzione di trans-attivazione è molto interessante. È stato sviluppato un saggio funzionale nel quale p53 umana viene espressa costitutivamente nel ceppo di lievito che contiene un gene reporter regolato da p53 (Inga et al. 1997). Le mutazioni tumorali di p53 analizzate sono risultate essere difettive nella trans-attivazione nei saggi basati sul lievito.

1.4.1 Considerazioni tecniche e pratiche per allestire un saggio funzionale

Prima di allestire qualsiasi saggio funzionale devono essere fatte una serie di considerazioni (Millot et al. 2012):

 Usare appropriati controlli in ciascun esperimento. Una variante neutra (o polimorfismo) come controllo negativo e una patogenetica accertata come controllo positivo.

 I replicati di ciascun campione dovrebbero essere inclusi in ogni esperimento indipendente e ogni esperimento indipendente dovrebbe essere ripetuto almeno due volte.

 Quei saggi che fanno affidamento sull’espressione ectopica delle proteine potrebbero avere differenti livelli di espressione e stabilità. Perciò è importante valutare il livello di espressione, mediante Western blot o PCR-real time, per differenziare se la perdita della funzione fenotipica è dovuta ad un effetto diretto sulla funzione o alla ridotta stabilità della variante proteica.

 Quando realizziamo esperimenti di “trasfezione” in transiente, i plasmidi dovrebbero essere preparati e saggiati ogni singola volta per controllare la variabilità causata da differenze nella qualità del DNA.

 Per evitare confusione, i reports dovrebbero usare un vocabolario controllato. La letteratura corrente usa numerosi termini per descrivere la stessa entità. I risultati dei saggi funzionali dovrebbero essere classificati come varianti con un “impatto funzionale” o varianti “senza impatto funzionale”. Il fenotipo intermedio dovrebbe essere contato come “impatto intermedio” (Lindor et al. 2012).

(21)

21

 I risultati dei saggi dovrebbero essere quantificati e un valore soglia di attività che separa le varianti patogenetiche da quelle neutre dovrebbe essere stabilito. I saggi quantitativi sono da prediligere per discriminare tra le varianti che inattivano totalmente o solo parzialmente la funzionalità proteica.

1.4.2 Validazione dei saggi funzionali

La validità biologica dovrebbe essere valutata a due livelli. Primo, determinare in che misura il saggio si basa su una funzione naturale della proteina, ma anche determinare come questa particolare funzione contribuisce a ridurre la formazione del tumore, nel caso di geni soppressori dei tumori (Millot et al. 2012).

Un saggio funzionale deve essere validato mediante valutazione della specificità e sensibilità, affinché i risultati che ne derivano siano interpretati o incorporati in un modello multifattoriale (Millot et al. 2012). La sensibilità è la proporzione delle varianti patogenetiche vere, correttamente identificate. Un test con bassa sensibilità identificherà un ampio numero di falsi negativi (varianti patogenetiche classificate come non patogenetiche). La specificità è la porzione di varianti non patogenetiche vere, correttamente identificate. Un saggio con bassa specificità identificherà un grande numero di falsi positivi (varianti non patogenetiche classificate come patogenetiche).

1.5 Il sistema di riparazione dei mismatch (MMR)

1.5.1 Mismatch repair e cancro

Il mismatch repair (MMR) è un sistema post-replicativo di riparazione del DNA che corregge gli errori introdotti dalla DNA polimerasi durante la replicazione del genoma; gli errori includono basi appaiate scorrettamente e loop causati ad inserzioni/delezioni (IDL) che possono insorgere in seguito alla scorretta replicazione di sequenze ripetitive, dette anche microsatelliti (Li 2008).

Le proteine del sistema di riparazione dei mismatch sono conservate dai procarioti agli umani. Escherichia coli usa gli omodimeri di MutS e MutL, mentre il lievito e gli umani

(22)

22

utilizzano ortologhi multipli di MutS e MutL. Le proteine di riparazione dei mismatch agiscono insieme come complessi in combinazioni differenti, ogni complesso svolge la sua attività contro un tipo specifico di mismatch (Aldred et al. 2007).

Il pathway di riparazione dei mismatch inizia dal riconoscimento di un mismatch o di un IDL da parte o dell’eterodimero MutSα, formato dalle proteine MSH2 e MSH6, o dell’eterodimero MutSβ, costituito dalle proteine MSH2 e MSH3. Il primo complesso è responsabile del riconoscimento di basi inserite in modo scorretto e di piccoli IDL, mentre il secondo riconosce gli IDL ridondanti.

MutSα contiene due siti con attività ATPasica che sono essenziali per il MMR (Groothuizen et al. 2016). Il legame del mismatch e dell’ATP inducono un cambiamento conformazionale in MutSα, in modo che si formi una pinza che può muoversi lungo il DNA (Lee et al. 2014). Questo stato di MutSα permette la sua interazione con MutLα (Friedhoff et al. 2016), un eterodimero formato da MLH1 e PMS2. La proteina PCNA, la quale viene caricata sul DNA dal fattore di replicazione C (RFC), è una componente dell’apparato di replicazione che attiva MutLα ad incidere il filamento nascente in maniera ATP-dipendente (Kadyrov et al. 2007). Questi nick possono essere usati per rimuovere gli errori di replicazione mediante l’azione dell’esonucleasi EXO1, la quale digerisce il filamento contenente gli errori. Allo stesso tempo la proteina RPA stabilizza il ssDNA, impedendo la formazione di strutture secondarie, che si è formato dopo l’attività di EXO1. Dopo la digestione, il filamento viene ri-sintetizzato dalle DNA polimerasi Polδ o Polε e infine il nick viene riparato dalla Ligasi I (Kunkel and Erie 2005) (Figura 2).

(23)

23

Figura 2: Pathway del mismatch repair negli eucarioti. Il complesso MutSα riconosce il

mismatch e lega l’ATP, questi due fenomeni inducono un cambiamento conformazionale in MutSα che permette il legame con MutLα. La proteina PCNA attiva MutLα che incide il filamento neosintetizzato; interviene EXO1 che digerisce il filamento contenente gli errori a partire dai nick introdotti da MutLα. RPA stabilizza il ssDNA, Polδ o Polε ri-sintetizzano il filamento e, infine, la Ligasi I ripara il nick.

La sindrome di Lynch (detta anche cancro colorettale ereditario non poliposico, HNPCC) è una sindrome ereditaria autosomica dominante causata da mutazioni in eterozigosi in uno dei maggiori geni del DNA mismatch repair (MMR): MSH2. MLH1, MSH6 e PMS2 (Li 2008). A seguito di un’ulteriore mutazione dell’allele sano, gli individui perdono la capacità di riparare il DNA e, di conseguenza, aumenta la probabilità di acquisire ulteriori mutazioni a carico di geni che possono contribuire alla formazione di neoplasie. Il 30-40% delle mutazioni riscontrate nei pazienti affetti dalla sindrome di Lynch sono attribuibili a mutazioni missenso (de La Chapelle 2004) e le conseguenze funzionali di molte di queste varianti di significato incerto (VUS) non è chiaro.

1.5.2 Il gene MSH6

Il complesso eucariotico MutSα è il prodotto evolutivo della duplicazione genica e divergenza dell’omodimero MutS. Questo processo è risultato in due proteine distinte (MSH2 e MSH6) richieste per l’iniziazione del MMR per quanto riguarda funzioni addizionali che non sono richieste per il sistema batterico MMR (Mahalingam 2017). Il gene MSH6 è localizzato sul cromosoma 2 e codifica per una proteina che fa parte del sistema di riparazione dei mismatch (Mahalingam 2017).

(24)

24

Come schematizzato in figura 3, la proteina MSH6 ha un dominio N-terminale, noto come “Disordered Domain”, e cinque domini conservati comparabili a MutS di E. coli. Le proteine del complesso MutSα dimerizzano tramite i domini 1-5 come un’immagine speculare asimmetrica con ogni dominio sovrapposto. Il Dominio 1 è quello di legame al mismatch, il Dominio 2 rappresenta il connettore tra il dominio di legame al DNA e il Dominio 3. Il Dominio 3 si chiude in due aree distinte che insieme formano una leva sul Dominio 5. Il Dominio 4, la regione clamp, permette il contatto con DNA non specifico, mentre il Dominio 5 conferisce il legame dell’adenosina e l’idrolisi dell’ATP (Warren et al. 2007).

Figura 3: Domini proteici di MSH6. Sono raffigurati 5 domini, ciascuno con un’attività

specifica, e anche un sesto dominio disordinato.

Il Dominio 1 contiene residui conservati che contattano il DNA a doppia elica. MSH6 è altamente specifico per legarsi ad una coppia nucleotidica mal appaiata: il motivo Phe-X-Glu conferisce alla proteina l’affinità per legare il mismatch. L’anello aromatico contenuto nella fenilalanina riconosce la distorsione stereo-chimica indotta nel DNA. MutSα attivo richiede la dimerizzazione del dominio ATPasico di MSH2 e MSH6. Il legame dell’ATP e l’idrolisi giocano un ruolo regolatorio chiave, non ancora chiaro, durante il MMR, probabilmente inducono cambiamenti conformazionali nel complesso di riconoscimento dsDNA- MutSα, i quali permettono mobilità e ricerca della base mal incorporata. Lo scambio dell’ADP con l’ATP conduce le proteine alla stabilizzazione transiente al sito mismatch (Antony et al. 2003).

Forme mutate del gene MSH6 sono state associate al cancro colorettale ereditario non-poliposico (HNPCC) o sindrome di Lynch (Miyaki et al. 1997). Queste mutazioni causano la produzione di una forma ridotta e non funzionale della proteina e quindi di conseguenza determinano un accumulo di danni al DNA non riparati attraverso il pathway del mismatch repair e quindi all’insorgenza della patologia (Miyaki et al. 1997).

(25)

25

Difetti in questo gene sembrano essere associati anche all’insorgenza del cancro al seno, nello specifico è stata studiata la sequenza di questo gene in soggetti con cancro ereditario al seno e al colon (HBCC), in soggetti con tumore al seno non-HBCC ed in soggetti di controllo sani. Da questo studio è risultato evidente la maggior presenza di varianti molto rare di MSH6 nei due gruppi di soggetti con la patologia rispetto a quello di controllo, suggerendo che varianti mutate rare di MSH6 possono predisporre all’insorgenza del cancro (Wasielewski et al. 2010).

In questo lavoro, abbiamo costruito un nuovo sistema sperimentale per determinare l’impatto funzionale di varianti missenso di MSH6 sfruttando l’alta omologia tra gene umano e di lievito.

1.6 BRCA1 nella riparazione del DNA

1.6.1 Il gene BRCA1

Il gene BRCA1 è situato sul cromosoma 17 e codifica per una proteina di 1863 amminoacidi chiamata “BReast CAncer type 1 susceptibility protein” (Figura 4).

Figura 4: Domini funzionali e interattori della proteina BRCA1 wild-type.

I primi 150 amminoacidi della proteina formano una regione conservata evolutivamente, ovvero un RING domain. Questo dominio è essenziale affinchè BRCA1 possa dimerizzare con BARD1, questo stabilizza BRCA1 e permette l’interazione con

(26)

26

l’ubiquitina E3 ligasi. Grazie a questo legame l’ubiquitina E3 ligasi può svolgere la sua funzione ubiquitinando le proteine ed indirizzandole verso il pathway della degradazione (Roy et al. 2012).

Circa la metà della sequenza proteica è codificata dall’esone 11; questa regione viene fosforilata dalla proteina ATM (Ataxia talengiectasia mutated) chinasi e dalla CHK2 (Checkpoint kinase 2). Questa fosforilazione induce la trascrizione di CDK (cyclin dependent kinase) che può svolgere la sua funzione di attivatore del checkpoint della fase G1/S del ciclo cellulare (Siciliano et al. 1997).

Dopo la regione codificata dall’esone 11, troviamo un dominio coiled-coil (CCD) necessario per l’interazione con PalB2 (Partner and localizer of BRCA2). PalB2 è richiesto per il processo di ricombinazione omologa di BRCA2 e di BRCA1, infatti sembra essere implicato nel reclutamento di RAD51 a livello dei siti danneggiati. Mutazioni in questa regioni sono state riscontrate in tumori al pancreas, prostata, seno ed ovaie (Erkko et al. 2007).

La parte terminale della proteina è caratterizzata dalle ripetizioni BRCT (BRca1 gene Carboxy Terminal domain); questi motivi riconoscono dei residui di fosfoserina su diretti partners di BRCA1 (es. CtIP) e sono richiesti per la localizzazione del complesso a livello dei siti danneggiati del DNA. Il legame con CtIP sembra essere essenziale affinchè BRCA1 possa interagire con il complesso MRN (MRE11/RAD50/NBS1) implicato nel riconoscimento delle rotture a doppio filamento del DNA (Wang et al. 2012).

1.6.2 Riparazione del DNA

La funzione più conosciuta di BRCA1 è il suo ruolo nella riparazione del DNA. Alcune varianti missenso con rilevanza clinica sono risultate non funzionali nei saggi di riparazione delle rotture del DNA a doppio filamento (DSB repair). Queste osservazioni suggeriscono un collegamento tra l’efficienza del DSB repair mediato da BRCA1 e la sua attività di soppressore tumorale (Paul et al. 2014). A seconda dei diversi tipi di danno al DNA, la cellula utilizza meccanismi di riparazione diversi: Homologous Recombination (HR), Non-Homologous End-Joining (NHEJ), Nucleotide Excision Repair (NER), Base Excision Repair (BER) e MisMatch Repair (MMR) (Wu et al. 2010).

(27)

27

È ampiamente riportato in letteratura che BRCA1 partecipa attivamente al meccanismo molecolare della HR. In seguito ad una rottura a doppio filamento del DNA, la fosforilazione dell’istone H2AX da parte di ATM e ATR permette la localizzazione di BRCA1 a livello del danno. Nella ricombinazione omologa, BRCA1 recluta il complesso MRN (MRE11/RAD50/NBS1), che effettua la “end-resection” dell’estremità della rottura convertendole in DNA a singolo filamento (ssDNA) (Greenberg et al. 2006). L’ssDNA viene ricoperto dalle RPA facilitando il legame della ricombinasi RAD51, che catalizza l’invasione del cromatidio fratello da parte del DNA a singolo filamento; la funzione di RAD51 è favorita dalla presenza di BRCA2, che viene reclutata a livello del danno da BRCA1 tramite il legame alla proteina PALB2; utilizzando il cromatidio fratello come stampo, il DNA viene riparato tramite HR (Xia et al. 2006). Come detto in precedenza, la disponibilità di saggi funzionali statisticamente validati con lo scopo di caratterizzare nuove varianti missenso localizzate in questo gene è molto importante dal punto di vista genetico-clinico. In questo lavoro abbiamo cercato di dare un contributo per una completa “validazione” del saggio di ricombinazione di lievito (Caligo et al. 2009; Lodovichi et al. 2016)

(28)

28

CAPITOLO 2: Scopo della tesi

Il mio lavoro di tesi ha come scopo finale quello di dimostrare che il lievito

Saccharomyces cerevisiae può dare un contributo per caratterizzare le varianti missenso

di geni associati ai tumori. Questo organismo offre numerosi vantaggi, quali tempo di generazione breve, ridotte dimensioni e facilità di manipolazione. L’elevata efficienza e semplicità di trasformazione di questo organismo unicellulare permettono l’espressione e lo studio di proteine esogene. Inoltre, nonostante l’uomo e il lievito siano organismi molto distanti evolutivamente condividono migliaia di geni ortologhi che ammontano a più di un terzo del genoma umano. La conservazione genetica con l’uomo, unita ai vantaggi pratici offerti da S. cerevisiae, ha permesso di espandere il suo utilizzo come modello per la biologia umana, sia grazie all’espressione di proteine eterologhe umane, sia grazie alla possibilità di modificare le cellule di lievito umanizzando specifici amminoacidi.

In questo lavoro di tesi, abbiamo sfruttato l’umanizzazione del lievito per determinare le conseguenze funzionali delle varianti genetiche umane trovate nel cancro e, quindi, per fornire indicazioni della patogenicità delle varianti missenso.

Lo scopo di questa è tesi è quello di creare dei sistemi modello per caratterizzare le varianti missenso nei geni MSH6 e BRCA1, il primo associato al cancro colorettale ereditario non poliposico e il secondo associato al cancro al seno e all’ovaio. Per quanto riguarda il gene MSH6 che ha un omologo nel lievito è possibile introdurre una sostituzione simile a quella del gene umano nel gene di lievito, mentre per quel che riguarda il gene BRCA1, il quale non ha omologo in lievito, si esprime la proteina eterologa wild type o mutata mediante un plasmide.

Dalla letteratura e da studi precedenti sappiamo che l’espressione di varianti patogenetiche del gene MSH2, coinvolto come MSH6 nel processo di riparazione dei mismatch del DNA, determina un aumento della frequenza di mutazione del lievito, effetto non riscontrato con le varianti neutre (Gammie et al. 2007). Nel laboratorio dove ho svolto la tesi è stato progettato un sistema per allestire il saggio funzionale al fine di caratterizzare le varianti di MSH6, dato che fino ad ora non era stato realizzato.

Inoltre, nel mio lavoro di tesi abbiamo anche contribuito alla validazione del saggio di ricombinazione di lievito già in uso nel laboratorio per caratterizzare le varianti missenso

(29)

29

di BRCA1, coinvolto nel pathway di riparazione dei DSB. Dalla letteratura e dagli studi eseguiti nel nostro laboratorio siamo a conoscenza che l’espressione di varianti patogenetiche di BRCA1 determina un aumento della frequenza di ricombinazione nel lievito. Di conseguenza, una volta validato il saggio funzionale permetterà di classificare le varianti missenso che inducono ricombinazione, rispetto alla forma wild type del gene, come patogeneitiche e quindi a rischio di tumore nei pazienti che portano tali varianti.

(30)

30

CAPITOLO 3: Materiali e Metodi

3.1 Ceppi di lievito Saccharomyces cerevisiae

In questo lavoro di tesi abbiamo utilizzato i seguenti ceppi di lievito:

 Il ceppo aploide RSY6 (MATa RAD ura3-52, leu2-3,-112, trp5-27, arg4-3,

ade2-40, ilv1-92, HIS3::pRS6);

 Il ceppo diploide RS112 (MATa/MATα; ura3-52/ura3-52, leu2-3,112/leu2-Δ98,

trp5-27/TRP5, ade2-40/ade2-101, ilv1-92/ilv1-92, arg4-3/ARG4, HIS3::pRS6/ his3- Δ200, LYS2/ lys2-801).

Il ceppo aploide RSY6 è stato costruito da Robert Schiestl (University of California, Los Angeles [UCLA], CA) tramite integrazione del plasmide pRS6. Questo plasmide contiene una parte interna del gene HIS3 ed il marcatore LEU2. L’integrazione del plasmide per ricombinazione omologa nel genoma del lievito determina l’interruzione del gene HIS3 e l’integrazione del gene LEU2, per cui il ceppo non è in grado di crescere in terreno privo di istidina, ma lo è in terreno privo di leucina (Schiestl et al. 1988, Schiestl et al. 1989, Galli and Schiestl 1995).

In seguito all’integrazione il ceppo presenta due alleli his3, uno con la delezione all’estremità 3’ e l’altro con la delezione all’estremità 5’, che condividono 400 pb di omologia. Questi due alleli sono separati dal marker LEU2 e dalla sequenza di DNA plasmidico. Un evento di ricombinazione intracromosomica conduce al ripristino della condizione originaria del gene HIS3 e alla perdita di LEU2. Il ceppo è stato utilizzato per determinare la frequenza di ricombinazione intracromosomica (Schiestl et al. 1988, Schiestl et al. 1989, Galli and Schiestl 1995).

(31)

31

Figura 5: L’interruzione del gene HIS3 mediante integrazione del gene LEU2 determina

la formazione del substrato di ricombinazione intracromosomica. L’evento di ricombinazione tra gli alleli his3 deleti riporta il gene HIS3 allo stato wild type e determina la perdita del gene LEU2.

Un’altra caratteristica di questo ceppo è la presenza dei marcatori di selezione ilv1-92 e

arg4-3, i quali impediscono al ceppo di crescere, rispettivamente, in assenza di isoleucina

e arginina nel terreno. Questi fenotipi possono essere sfruttati per studiare la reversione genica, ovvero quell’evento di mutazione genica in ilv1-92 o in arg4-3 che fa revertire il fenotipo da mutante a selvatico, consentendo al lievito di crescere in terreno privo di isoleucina o arginina.

Il ceppo diploide RS112 è stato costruito a partire dal ceppo aploide RSY6 e di conseguenza porta lo stesso substrato di ricombinazione intracromosomica. Inoltre, questo ceppo contiene due alleli ade2-40 e ade2-101, situati su due cromosomi omologhi che consentono la misurazione della frequenza di ricombinazione intercromosomica.

Figura 6: L’evento di ricombinazione tra gli alleli ade2-40 e ade2-101 determina il

(32)

32

3.2 Vettori plasmidici

I plasmidi sono frammenti di DNA circolare a doppio filamento presenti, naturalmente, nei batteri. Molti di essi hanno un sistema di replicazione autonomo e la loro funzione principale in biologia molecolare è quella di fungere da vettori, ovvero vengono trasformati all’interno delle cellule, in questo caso di lievito, in modo da trasferire frammenti di DNA non presenti naturalmente o mutagenizzati all’interno di queste cellule.

Per mutagenizzare il gene MSH6 è stato costruito un vettore derivante dal pGEM®-T Easy (Figura 7).

Il plasmide pGEM®-T Easy è costituito da 3015 pb e contiene:

 I promotori T7 e SP6, sono promotori che vengono utilizzati per la trascrizione;  Sito multiplo di clonaggio dove sono presenti i siti di taglio per gli enzimi riportati

nella figura;

 Origine di replicazione del fago f1;

 Gene che conferisce ai batteri la resistenza per l’ampicillina;  Origine di replicazione del pUC;

Figura 7: Rappresentazione schematica del plasmide pGEM®-T Easy

Nel nostro studio abbiamo inserito il gene MSH6wt del lievito S. cerevisiae così da ottenere il plasmide pGEM®-T Easy-MSH6.

(33)

33

Il gene BRCA1 wilde type o mutato si trova all’interno del plasmide centromerico YCp50 (Figura 8) con il promotore inducibile da galattosio GAL1. Questo plasmide ha come marker di selezione il gene URA3, che codifica per un enzima essenziale per la biosintesi dell’uracile, assente nei nostri ceppi. Inoltre, esso possiede la resistenza all’ampicillina come marker di selezione per la trasformazione batterica. Il plasmide YCpGAL::BRCA1wt è stato fornito da Craig Bennett (Duke University, Durham NC, USA). Il plasmide pYES, che possiede gli stessi marker di selezione del plasmide YCp50, è stato utilizzato come controllo negativo in tutti gli esperimenti.

Figura 8: Rappresentazione schematica del plasmide YCp50.

3.3 Clonaggio di MSH6 nel vettore pGEM

®

T easy

Il vettore pGEM®T easy è stato utilizzato per fare la mutagenesi di MSH6. Il gene MSH6 è stato clonato dal genoma del ceppo RSY6 al plasmide mediante amplificazione per PCR.

3.3.1 PCR per amplificare il gene MSH6

La PCR per amplificare il gene MSH6 è stata eseguita tramite dei primer che possiedono una regione di omologia con l’estremità del gene stesso e una regione di omologia con la

(34)

34

sequenza fiancheggiante il gene. Inoltre, questi primer possiedono all’estremità 5’ la sequenza di riconoscimento per l’enzima BamHI.

Mix PCR:

- 10 µl di 2X Phusion Flash High-Fidelity PCR Master Mix (Thermo Scientific) - 1 µl di Primer MSH6_915up (10 pmol/µl)

- 1 µl di Primer MSH6_4864low (10pmol/µl) - 2 µl (100 ng) di DNA genomico RSY6 - 6 µl di H2O sterile

Protocollo PCR:

Temperatura Tempo Cicli

98°C 10 secondi 1 98°C 1 secondo 30 58°C 5 secondi 72°C 1 minuto 72°C 1 minuto 1 4°C Infinito

Tabella 2: Nella tabella sono riportate le condizioni della reazione di PCR con relativa

temperatura, tempo e numero di cicli.

3.3.2 Corsa su gel

Il prodotto di PCR è stato caricato su gel di agarosio 1% e fatto correre impostando la velocità di 80 volt per verificare che il frammento amplificato fosse quello giusto (3972 pb).

3.3.3 Purificazione del prodotto di PCR

Il prodotto di PCR è stato purificato seguendo il protocollo del kit GenEluteTM PCR Clean-Up (Sigma-Aldrich):

 Inserire una GenElute plasmid mini spin column all’interno di un tubo fornito dal kit. Aggiungere 500 µl di Column Preparation Solution in ogni colonnina e centrifugare a 12000 xg per 30 secondi. Scartare l’eluato.

(35)

35

 Aggiungere 5 volumi di Binding Solution a 1 volume di reazione della PCR e mescolare. Trasferire la soluzione nella colonnina e centrifugarla a 16000 xg per 1 minuto. Scartare l’eluato e rimettere la colonnina nel tubo.

 Aggiungere 500 µl di Wash Solution alla colonnina e centrifugare a 16000 xg per 1 minuto. Scartare l’eluato e tenere la colonnina nel tubo.

 Centrifugare la colonnina a 16000 xg per 2 minuti, senza aggiungere nessuna soluzione addizionale, per rimuovere l’etanolo in eccesso. Scartare l’eluato e inserire la colonnina all’interno di una eppendorf da 1.5 ml.

 Aggiungere 50 µl di Elution Solution al centro di ogni colonnina ed incubare a temperatura ambiente per 1 minuto.

 Per eluire il DNA centrifugare la colonnina a 16000 xg per 1 minuto. La PCR è presente nell’eluato e sarà pronta per l’utilizzo o la conservazione a -20°C.

3.3.4 Adenilazione del prodotto di PCR

Il prodotto di PCR che abbiamo ottenuto presenta le estremità blunt, perciò è stato necessario eseguire l’adenilazione per aggiungere una sequenza poliA ad ogni estremità che poi si è ibridata con le estremità poliT del vettore linearizzato. La miscela di adenilazione che è stata preparata è la seguente:

- 6 µl di PCR

- 2 µl di Buffer Taq 5X - 1 µl di dATP

- 1 µl di GoTaq G2

La miscela è stata incubata a 70°C per 30 minuti.

3.3.5 Ligation

Per permettere all’inserto di legarsi al backbone pGEM®T easy è stata preparata la

seguente miscela di reazione della ligation: - 5 µl di Ligation Buffer (2X)

- 1 µl di T4 DNA Ligasi - 3 µl di inserto poliadenilato

(36)

36

- 1 µl di vettore.

La miscela di reazione è stata messa ad incubare per un’ora a temperatura ambiente.

3.3.6 Trasformazione batterica

Abbiamo trasformato i batteri con il prodotto della ligation e li abbiamo seminati in piastre con ampicillina, 5bromo-4-cloro-3-indolil-D-galattoside (X-gal) e isopropil- β-D- galattosidasi (IPTG). I batteri trasformati con il plasmide crescono su una piastra che contiene l’ampicillina, poiché il plasmide conferisce ai batteri la resistenza per l’ampicillina. Il plasmide pGEM®T easy è un vettore che possiede il multiple-cloning site

(MCS) all’interno della sequenza del gene LacZ, il multiple-cloning site non altera il gene che in questo plasmide è attivo. Qualunque inserto nel MCS distrugge l’attività del gene

LacZ, cosa importante per distinguere il plasmide con inserto dal plasmide senza inserto.

Per fare questa distinzione si sfrutta la selezione bianco/blu che si basa sull’attività dell’enzima β-galattosidasi. E. coli sintetizza β-galattosidasi quando ha bisogno di produrre energia metabolizzando il lattosio. Per la selezione bianco/blu si induce la funzione dell’operone lattosio e quindi della β-galattosidasi con composti sintetici:

- IPTG, induttore dell’operone lac;

- X-gal, un substrato che simula il lattosio;

in presenza di X-gal la β-galattosidasi lo trasforma in un derivato che all’aria si ossida e diventa blu. Le colonie con attività β-galattosidasica sono blu, quelle senza attività, poiché hanno incorporato l’inserto, sono bianche.

3.3.7 Digestione di controllo

Per verificare che il clonaggio fosse avvenuto con successo è stata fatta una digestione di controllo con l’enzima SacI-HF (New England BioLabs®) sui plasmidi estratti dalle

(37)

37

Digerito (µl) Non digerito (µl)

pGEM®T easy-MSH6 2 2

SacI-HF 0,5 0

Buffer Cutsmart (10X) 1 1

H2O 6,5 7

Totale 10 10

Tabella 3: Nella prima colonna sono riportati i componenti della miscela di reazione con

relative concentrazioni. Nella seconda e terza colonna sono riportati i volumi (µl) di ciascun componente della miscela con gli enzimi di restrizione e della miscela di controllo.

La miscela di reazione è stata messa in incubazione a 37°C per un’ora. Successivamente i prodotti di digestione sono stati caricati su gel di agarosio 1% e separati per elettroforesi. Il vettore pGEM®T easy-MSH6 ottenuto dal clonaggio è stato poi trasformato nelle cellule competenti per permetterne l’amplificazione seguendo il protocollo della trasformazione batterica descritto nel paragrafo 2.4. Infine, per controllare che il clonaggio fosse avvenuto correttamente il vettore è stato inviato a sequenziare presso l’Eurofins Genomic.

3.4 Mutagenesi sito-specifica

La mutagenesi sito-specifica in vitro è una tecnica per eseguire modificazioni del vettore. Il kit QuickChange II Site-Directed Mutagenesis permette di effettuare mutazioni sito-specifiche in qualsiasi plasmide a doppio filamento. La procedura rapida (3 step) genera mutanti con un’efficienza più alta dell’80% in una singola reazione. Per target più difficoltosi è stato impiegato il kit QuickChange II XL Site-Directed Mutagenesis. Il kit QuickChange II Site-Directed Mutagenesis è usato per fare mutazioni puntiformi, rimpiazzare amminoacidi e fare delezioni o inserzioni di singoli o multipli amminoacidi adiacenti. La procedura di base utilizza un vettore dsDNA con un inserto di interesse e due primer, entrambi contenenti la mutazione desiderata. I primer, ognuno complementare a filamenti opposti del vettore, sono estesi attraverso cicli di temperatura dalla DNA polimerasi e la loro estensione genera un plasmide mutato. Successivamente, il prodotto viene trattato con l’enzima di restrizione DpnI. L’endonucleasi DpnI

Riferimenti

Documenti correlati

Organizzazione strutturale del gene codificante per la proteina zinc finger ZNF224.. nologie Industriali-Modulo Processi Ortologhi e paraloghi della proteina zinc finger

Results: FTIR analyses on Saccharomyces cerevisiae cells under lactic acid stress at low pH revealed some still unchar- acterized traits: (1) a direct correlation between lactic

cerevisiae have a partially redundant function, indeed the single deletion of DMA1 or DMA2 has no phenotype while the simultaneous deletion of the two genes causes slight

Poiché nel corso della pratica osservativa presso la scuola elementare di Chiasso ho potuto notare che la competenza emotivo-affettiva ha un ruolo preponderante

However, controlling for two important difficulties, related to cost and flexibility of childcare arrangements, we can notice that relying only (or largely)

La prima fornisce un quadro generale delle attività di animazione condotte nelle biblioteche per ragazzi in Francia, dalle funzioni generali pre- viste nel Manifesto IFLA/Unesco per

We propose a general method for solving exactly the static field equations of Einstein and Einstein-Maxwell gravity minimally coupled to a scalar field. Our method starts from an

Thus, this study aimed to understand how a new winery can be colonized by yeasts with several objectives: (i) identify wild Saccharomyces cerevisiae strains present in the