RIASSUNTO
Le HMGA (High Mobility Group A) sono proteine coinvolte in numerose attività cellulari e principalmente agiscono nel nucleo come rimodellatori della cromatina. Il loro studio è di significativa importanza in biologia cellulare, dato un loro coinvolgimento in eventi dello sviluppo embrionale, ed in processi neoplastici.
Le HMGA sono caratterizzate da dominii proteici altamente conservati, capaci di legare zone di DNA ricche in sequenze AT, denominati AT-hook; si distinguono sequenze HMGA tipiche (con 3-4 AT-hook) da sequenze atipiche (con molti AT-hook). Nei vertebrati esistono due proteine HMGA, HMGA1 e HMGA2, che differiscono tra di loro, principalmente per la porzione N-terminale della proteina e per la coda acida C-terminale, mentre i gruppi AT-hook risultano molto conservati.
Abbiamo realizzato una ricerca delle sequenze HMGA presenti in banche dati. Le HMGA2 sono probabilmente presenti in tutti i vertebrati, mentre sequenze HMGA1 sono state trovate in tutti i vertebrati con eccezione degli anfibi e dei ciclostomi. Negli invertebrati ci sono sequenze HMGA la cui classificazione non è chiara. Alcune, come le HMGA di Branchiostoma floridae e Saccoglossus kowalevskii, presentano l'amminoacido W (Triptofano) dopo il terzo AT-hook, caratteristica tipica delle HMGA2; altre non sono chiaramente ascrivibili a HMGA1 o HMGA2, pur essendo chiaramente delle HMGA, data la presenza di evidenti domini AT-hook e di una coda terminale acida.
Nel corso del mio internato di tesi mi sono occupato di collezionare sequenze proteiche e sequenze di DNA codificante per proteine HMGA di vertebrati e di invertebrati, attraverso ricerche nelle banche dati, allo scopo di effettuare un'analisi filogenetico-molecolare che dia indicazione sull'evoluzione di queste sequenze.
Le sequenze sono state scaricate dalle banche dati e selezionate; successivamente le sequenze proteiche sono state allineate con algoritmo MUSCLE e sono state quindi adattate manualmente per massimizzare l'allineamento. E' stato così possibile individuare alcuni caratteristici residui amminoacidici o motivi peptidici che, anche sulla base di dati in letteratura, possono essere proposti come diagnostici per le HMGA1 e HMGA2.
L’analisi filogenetica delle sequenze è stata inizialmente concentrata sulle HMGA2, dato che nel nostro laboratorio è in corso uno studio funzionale del gene corrispondente di Xenopus laevis.
Sono stati quindi creati alberi filogenetici in Maximum Likelihood (ML) con il programma Tree-PUZZLE 5.2, sia dall'allineamento proteico, che da quello nucleotidico, dopo un’analisi preventiva per il modello di sostituizione ottimale. L'analisi è proseguita con l'utilizzo del programma MrBayes 3.2 per creare alberi con Inferenza Bayesiana (BI). Il mio studio si è concentrato in un primo tempo sulle sequenze proteiche e successivamente abbiamo considerato quelle nucleotidiche, allo scopo di completare e caratterizzare al meglio l’analisi filogenetica.
I miei risultati hanno mostrato una correlazione filogenetica tra le HMGA1 e HMGA2 dei vertebrati, ed hanno evidenziato la posizione basale sia delle sequenze HMGA degli echinodermi, che delle sequenze HMGA2 degli emicordati. Tali risultati, sommati alle ricerche effettuate nelle banche dati, mi hanno spinto a formulare un modello filogenetico delle proteine HMGA, nel quale le proteine HMGA2 hanno una posizione chiave nella direzione evolutiva che va da HMGA ad HMGA1. Si ritene, infatti, che le HMGA2 risultino più basali rispetto alle HMGA1 e che queste ultime siano comparse solo nei vertebrati, anche se per limitazioni delle sequenze disponibili nelle banche dati, non ci è attualmente possibile individuare con precisione in quali vertebrati siano comparse per prima sequenze geniche di tipo HMGA1.