Uomo e lievito condividono migliaia di geni e l’umanizzazione del lievito può essere utile per decifrare le conseguenze funzionali delle varianti genetiche riscontrate nel cancro e per dare informazioni della patogenicità di queste varianti.
Per umanizzare il lievito possono essere sfruttati svariati approcci, in questo lavoro di tesi ne abbiamo utilizzati due: il primo approccio, che si applica quando il gene umano in studio ha un omologo nel lievito, è quello di introdurre una sostituzione amminoacidica simile a quella umana nel gene di lievito; mentre il secondo approccio, che prevede l’espressione eterologa della proteina, viene impiegato nel caso in cui il gene umano non abbia l’omologo nel lievito (Laurent et al. 2016).
Questi due approcci sono stati utilizzati con l’obiettivo finale di utilizzare l’organismo modello S. cerevisiae per mettere a punto dei saggi funzionali con il fine di caratterizzare le varianti missenso di geni associati al cancro.
Con l’avvento delle nuove tecnologie di sequenziamento il numero di varianti di significato incerto (VUS) che sono state individuate è aumentato considerevolmente, in particolare le varianti rare rendono la classificazione ancora più difficile (Tennessen et al. 2012). Dato il potere predittivo limitato dei metodi computazionali (Thusberg et al. 2011), l’impatto delle VUS deve essere analizzato sperimentalmente (Carvalho et al. 2007). Un metodo alternativo per incrementare la classificazione delle VUS è lo sviluppo di saggi funzionali; quest’ultimi non valutano direttamente la comparsa di tumori, ma modificazioni strutturali e funzionali della proteina d’interesse per fornire un’evidenza indiretta sulla patogenicità delle varianti (Goldgar et al. 2008). Il lievito Saccharomyces
cerevisiae per le sue caratteristiche, quali la condivisione di molti geni con l’uomo e la
semplicità come sistema genetico, aiuta ad accelerare la valutazione funzionale delle varianti associate al cancro identificate de novo (Andersen et al. 2012; Millot et al. 2012; Guidugli et al. 2014).
Il gruppo di ricerca dove ho svolto la tesi ha creato un web tool, chiamato CRIMEtoYHU (CTY; http://crimetoyhu.ifc.cnr.it/) (Mercatanti et al 2017), che può aiutare i ricercatori nell’allestimento di facili e veloci saggi funzionali in S. cerevisiae per la valutazione dell’impatto funzionale delle varianti missenso associate al cancro. Quando una variante missenso nuova viene identificata nel cancro, l’obiettivo dello strumento bioinformatico
68
CTY è trasferire nel genoma del lievito la variante scoperta prendendo in considerazione i punti seguenti: la presenza del gene ortologo, la funzionalità e la conservazione del dominio proteico in cui si trova la mutazione. CTY trova i geni omologhi nel lievito e identifica le varianti corrispondenti allineando le sequenze umane con quelle del lievito e comparando i domini proteici. Questo strumento determina la trasferibilità delle varianti umane al genoma di lievito assegnandogli un punteggio di affidabilità (Reliability score, RS) che può essere predittivo per la validità del saggio funzionale: più alto è il valore di RS, più alta sarà la probabilità che abbiano un ruolo nella funzionalità della proteina omologa.
Nell’uomo e nel lievito è stata osservata una conservazione evolutiva dei meccanismi di riparazione dei mismatch che ha persuaso i ricercatori a creare dei saggi in lievito per svolgere l’analisi funzionale delle VUS (Ou te al. 2007), dato che mutazioni in eterozigosi della linea germinale in uno dei geni del mismatch repair causano la sindrome ereditaria autosomica dominante di Lynch (Li 2008).
I primi lavori sullo sviluppo di saggi funzionali basati sui fenotipi mutatori di ceppi knockout di lievito riguardano i geni hPMS2, hMLH1 e hMSH2 (Strand et al. 1993). Successivamente, sono stati sviluppati dei saggi funzionali per analizzare le VUS di
MLH1 (Wanat et al. 2007) e MSH2 (Gammie et al. 2007), ingegnerizzando le mutazioni
trovate nei tumori alle posizioni corrispondenti nei geni del lievito e testando la loro funzione.
Il primo rapporto di associazione di una mutazione ereditaria in MSH6 con il cancro colorettale fu fatta nel 1996 in uno studio di 5 giapponesi con HNPCC familiare (Miyaki et al. 2007) e dal 2007 al 2012 sono stati descritti alcuni casi di mutazioni germinali in
MSH6 all’interno di famiglie affette dalla sindrome di Muir-Torre (Ponti et al. 2005). Ad
oggi numerose mutazioni missenso di MSH6 continuano ad emergere e ancora non è stato sviluppato alcun saggio per caratterizzare queste varianti.
Nel mio lavoro di tesi è stata intrapresa la volontà di creare un sistema modello nel lievito per classificare le varianti missenso individuate nei tumori. Dal momento che il lievito possiede l’ortologo del gene MSH6 umano, abbiamo deciso di studiare le varianti associate al cancro riportandole nella posizione corrispondente all’interno del gene di lievito. Innanzitutto, per sviluppare questo saggio funzionale è stato costruito un ceppo aploide che porta il gene MSH6 interrotto mediante integrazione della cassetta CORE per
69
reprimere l’espressione della proteina. Il ceppo RSY6msh6::pCORE che abbiamo ottenuto è stato confrontato con il ceppo di partenza RSY6wt per verificare se vi è una differenza fenotipica tra i due, andando a valutare la frequenza di reversione genica degli alleli ilv1-92 e arg4-3. Abbiamo osservato che sia la frequenza di reversione dell’allele
ilv1-92 sia quella dell’allele arg4-3 risultano significativamente superiori (p<0.01) nel
ceppo deleto per MSH6 rispetto alle frequenze del ceppo wild type. Questo risultato è giustificabile dal fatto che il ceppo che non esprime la proteina MSH6 risulta difettivo nel meccanismo di riparazione dei mismatch, determinando una frequenza di mutazione maggiore rispetto al ceppo RSY6wt che esprime tutte le proteine del macchinario di riparazione. Il fenotipo mutatore osservato nel ceppo RSY6msh6::pCORE è fondamentale per verificare se le varianti espresse nel ceppo sono in grado di restaurare il fenotipo wild type (quelle non patogenetiche) oppure no (quelle patogenetiche) e, quindi, mettere a punto il saggio funzionale per la classificazione delle VUS di MSH6. Le varianti sono state introdotte nel gene di lievito mediante mutagenesi sito specifica utilizzando come templato il plasmide pGEM®-T Easy-MSH6 recante il gene wild type.
Sono stati ottenuti quattro mutanti (R138S, K177S, D486Y e G1142C) di cui uno, MSH6-
K177S, è stato trasformato nel ceppo RSY6msh6::pCORE ed è stato sostituito tramite
gene targeting al gene MSH6 interrotto. È stato eseguito il saggio funzionale sul ceppo RSY6 che esprime la variante K177S ed abbiamo osservato che questa variante induce un debole ma statisticamente significativo aumento della reversione genica nell’allele
ilv1-92, mentre mostra il ripristino del fenotipo wild type per quanto riguarda la
reversione genica nell’allele arg4-3. Poiché, la variante analizzata è classificata come neutra ci si aspetta che il suo fenotipo sia simile alla wild type; il fatto che la frequenza di reversione genica nell’allele ilv1-92 sia statisticamente diversa da quella wild type non ha un significato biologicamente rilevante, poiché è stato proposto come cut-off un incremento, rispetto al wild type, di almeno due volte della frequenza di reversione affinchè l’evento possa essere considerato biologicamente rilevante (Galli and Schiestl 1996)
Le altre varianti (R138S, D486Y, G1142C) che sono state introdotte nel plasmide pGEM®-T Easy-MSH6 verranno trasformate nel ceppo RSY6msh6::pCORE, al fine di sostituire il gene msh6::pCORE con i mutanti ottenuti. Dopodichè, si procederà con l’esecuzione del saggio funzionale, valutando le frequenze di reversione degli alleli ilv1-
70
92 e arg4-3, per verificare se tali varianti risultano patogenetiche, cioè aumentano la
frequenza di reversione, oppure no. Questo è il primo passo che è stato fatto nell’intenzione di validare un saggio funzionale in lievito per la classificazione delle VUS di MSH6.
Il gene BRCA1, localizzato sul cromosoma 17q21, codifica per una proteina che esegue la sua funzione in un’ampia gamma di funzioni cellulari come: la riparazione del DNA, il controllo del ciclo cellulare, il rimodellamento della cromatina, il mantenimento dell’instabilità genomica, la regolazione della trascrizione, la regolazione del centrosoma e l’apoptosi (Narod and Foulkes 2004). Comunque, il ruolo chiave è la riparazione del DNA, dove esso funziona come coordinatore di attività multiple richieste per il mantenimento dell’integrità genomica. In particolare, BRCA1 svolge la sua attività nel pathway della ricombinazione omologa.
BRCA1 è una proteina soppressore dei tumori e le mutazioni che danneggiano la sua capacità di riparare il DNA sono collegate a varie condizioni patogenetiche, in particolare il cancro al seno e all’ovaio (Ford et al. 1998).
Il gene BRCA1 è altamente polimorfico con più di 1800 varianti rare riportate nei vari database come: Breast Cancer Information Core (BIC), ClinVar e Leiden Open Variation Database (LOVD). Molte di queste mutazioni inattivano la proteina e incrementano il rischio del cancro; comunque, molte varianti di significato incerto sono mutazioni missenso per le quali non è chiaro il rischio che comportano di sviluppare il cancro. Per questa ragione c’è la necessità di classificare queste varianti e dare indicazione circa la loro patogenicità, integrando le informazioni con i dati genetici già disponibili.
S. cerevisiae conserva gli stessi pathway di riparazione presenti nei mammiferi, anche il
processo di ricombinazione omologa e i geni omologhi di quasi tutte le proteine coinvolte in questo pathway. Questa caratteristica fa di questo organismo un eccellente sistema modello per analizzare le varianti di BRCA1, anche se manca il suo omologo nel lievito. Nel nostro gruppo di ricerca il lievito è stato utilizzato per studiare l’instabilità genomica indotta da BRCA1 ed è stato dimostrato che l’espressione delle varianti missenso associate al cancro incrementa la ricombinazione omologa spontanea, perché sebbene nel lievito non vi sia una controparte di BRCA1, la sua espressione eterologa interagisce con il sistema di riparazione del DNA di lievito (Caligo et al 2009, Lodovichi et al 2016,
71
Scully et al. 1999). Più precisamente, i risultati pubblicati precedentemente hanno dimostrato che nel ceppo diploide RS112 di S. cerevisiae l’espressione delle varianti calssificate come patogenetiche (classe 5) induce un aumento statisticamente significativo della ricombinazione intracromosomica e intercromosomica (Caligo et al. 2009).
Partendo da questi dati, in questo lavoro il ceppo diploide RS112 è stato utilizzato per valutare l’effetto di BRCA1wt e di alcune varianti sulla ricombinazione omologa. In particolare, nel mio lavoro ho analizzato 7 varianti che ho riportato nella tabella 11.
Variante IARC L22S 5 T37K 5 K45Q 1 T1720A 1 G1738R 5 P1776H 2 G1788V 5
Tabella 11: A sinistra sono riportate le varianti di BRCA1 analizzate nel mio lavoro e a
destra la corrispondente classificazione secondo IARC. In rosso sono evidenziate le varianti patogenetiche, in azzurro quelle neutre.
I dati ottenuti sulla frequenza di ricombinazione intracromosomica sono riportati nella figura 16A, in cui possiamo osservare che l’aumento significativo della frequenza è riscontrato nelle varianti patogenetiche L22S, T37K, G1738R e G1788V e nella variante neutra P1776H. La positività della mutazione P1776H può essere giustificata come falso positivo del nostro sistema modello.
Per quanto riguarda i dati ottenuti nella frequenza di ricombinazione intercromosomica e riportati nella figura 16B, si può osservare un aumento significativo della frequenza nelle varianti patogenetiche L22S, T37K e G1788V e anche qui nella variante non patogenetica P1776H. La variante P1776H risulta anche in questo caso un falso positivo nel nostro sistema. Mentre la variante G1738R, classificata come patogenetica secondo IARC, non ha mostrato un effetto statisticamente differente rispetto al ceppo che non esprime BRCA1, quindi si considera in questo caso come un falso negativo.
72
Le varianti analizzate mediante il saggio, in riferimento alla classificazione IARC, sono valutate come: vere positive (TP), quelle che sono classificate come patogenetiche e risultano tali anche nel saggio; vere negative (TN), le varianti che risultano neutre sia nella classificazione che nel saggio; false positive (FP), quelle che sono classificate come neutre e mostrano un fenotipo mutatore nel saggio; e, infine, false negative (FN), quelle che determinano un fenotipo uguale al wild type nonostante siano classificate come patogene. Affinchè i risultati ottenuti dal saggio funzionale possano essere interpretati correttamente è necessario validare il saggio funzionale valutando l’accuratezza, la precisione, la specificità e la sensibilità, usando come riferimento una classificazione già accertata (in questo caso IARC) delle varianti utilizzate per fare la validazione del saggio. L’accuratezza misura il successo della predizione delle varianti ed è definita come il rapporto tra la somma veri positivi-veri negativi e il numero totale di varianti considerate. La precisione è definita come il rapporto tra i veri positivi e la somma veri positivi-falsi positivi. La specificità misura l’abilità di identificare le varianti neutre vere e si calcola rapporto tra i veri negativi e la somma dei falsi positivi e dei veri negativi. Infine, la sensibilità che misura l’abilità di individuare le varianti patogenetiche vere è definita come il rapporto tra i veri positivi e la somma falsi negativi-veri positivi.
Variante IARC C61G 5 N132K 1 Y179C 1 F486L 1 N550H 1 S1512I 1 A1708E 5 I1766S 5 M1775R 5
Tabella 12: A sinistra sono riportate le varianti di BRCA1 analizzate nel lavoro Caligo
et al. 2009 e a destra la corrispondente classificazione IARC. In rosso sono evidenziate le varianti patogenetiche, in azzurro quelle neutre.
73
Per validare il saggio funzionale, oltre alle varianti analizzate nel mio lavoro, sono state prese in considerazione anche le varianti analizzate nel lavoro Caligo et al. 2009 e che sono riportate nella tabella 12. In totale le varianti analizzate sono 16, di cui 8 patogenetiche e 8 neutre secondo la classificazione IARC.
Analizzando i risultati complessivi di tutte le varianti studiate si osserva che, per quanto riguarda la ricombinazione intracromosomica, il saggio funzionale ha una sensibilità uguale a 1.00 e un’accuratezza pari a 0.81. Più basse risultano la precisione (0.73) e la specificità (0.625). Considerando la ricombinazione intercromosomica, il saggio rivela per tutti e quattro i parametri un valore uguale a 0.75.
74