Inside Analysis #01 Adenylate Cyclase Brain Phylogenetic Tree
© Bioinformatics @ Cusmibio 2009
Lorenzo Gatti
1
DESCRIZIONE ANALISI L’analisi vuole determinare un’ipotesi evolutiva attraverso l’allineamento di sequenze di geni omologhi provenienti dalla stessa specie. I geni considerati codificano per l’Adenilato ciclasi (brain), un enzima della classe delle liasi che catalizza la seguente reazione: ATP = AMP 3',5'-ciclico + pirofosfato Questo enzima fa parte di una via di trasduzione del segnale (via dell'adenilato ciclasi), che consente di produrre effetti fisiologici in seguito al legame di un messaggero con la cellula. RICERCA DEI CODICI Per risalire a tutti i geni da includere nell’analisi è stato utilizzato un gene-browser in grado di restituire tutte le informazioni legate ad una determinata entry: ADCY http://www.genenames.org/cgi-bin/hgnc_search.pl I risultati della query hanno evidenziato la presenza di 10 geni che codificano per AC.
CODICI E TRASCRITTI La prima fase di verifica dei codici dei trascritti è stata svolta attraverso il gene-browser http://genomes.ucsc.edu. A partire della sequenza amminoacidica determinata dalla sequenza dell’mRNA del gene ADCY1 si sono cercati i geni omologhi nella specie H.Sapiens effettuando un BLAT della sequenza della proteina sull’intero genoma umano. I risultati sono stati i medesimi di quelli proposti dal gene-browser http://www.genenames.org. Human Human Human Human Human Human Human Human Human Human
ADCY1 ADCY2 ADCY3 ADCY4 ADCY5 ADCY6 ADCY7 ADCY8 ADCY9 ADCY10
AC1 AC2 AC3 AC4 AC5 AC6 AC7 AC8 AC9 AC10
NM_021116 NM_020546 NM_004036 NM_139247 NM_183357 NM_015270 NM_020983 (Due isoforme) NM_001114 NM_001115 NM_001116 NM_018417
PIC#01 - Query results from http://www.genenames.org
2
ALLINEAMENTI Per effettuare gli allineamenti delle strutture dei geni individuati dalla ricerca è stato utilizzato lo strumento “Exalign”. L’algoritmo che è alla base di Exalign è in grado di individuare allineando due sequenze omologhe la presenza di esoni divisi da uno o più introni. Per costruire un albero filogenetico al fine di proporre una teoria evoluzionistica di come si sono sviluppati i 10 trascritti è stato necessario allineare le sequenze le une contro le altre per evidenziare somiglianze o differenze strutturali. ADCY1 (NM_021116) VS. ADCY2 (NM_020546)
A livello dell’esone no. 9 del trascritto NM_021116 è possibile evidenziare nel trascritto NM_020546 la presenza di due introni che separano gli esoni no. 10, 11, 12.
PIC#01 - Text output from Exalign ADCY1 vs ADCY2
PIC#02 - Graphic output from Exalign ADCY1 vs ADCY2
Dalla rappresentazione grafica è possibile individuare la posizione dei due introni che separano l’esone da 195pb nella sequenza NM_020546 - ADCY2. NM_021116 NM_020546
195 44
81
70
ADCY1 (NM_021116) VS. ADCY3 (NM_004036)/ADCY4 (NM_139247)/ADCY7 (NM_001114)/ADCY8 (NM_001115)
Gli allineamenti tra la sequenza del trascritto NM_021116 - ADCY1 e quelle dei trascritti ADCY3/4/7/8 non portano alcuna informazione aggiuntiva all’analisi. Exalign non mostra alcuna presenza di esoni divisi da introni. Si può tuttavia notare come siano più conservati gli esoni posti all’inizio e alla fine della sequenza e non siano conservati quelli in posizione intermedia. Si può ipotizzare che i domini funzionali conservati caratterizzino la proteina codificata, mentre la parte variabile differisca a seconda dell’ambiente (tessuto) in cui la proteina è presente.
3
PIC#03 -
Text output from Exalign ADCY1 Vs. ADCY 3
PIC#04 -
Graphic output from Exalign ADCY1 Vs. ADCY 3
PIC#04 -
Text output from Exalign ADCY1 Vs. ADCY 4
PIC#05 -
Graphic output from Exalign ADCY1 Vs. ADCY 4
PIC#06 -
Text output from Exalign ADCY1 Vs. ADCY 7
PIC#07 -
Graphic output from Exalign ADCY1 Vs. ADCY 7
PIC#08 -
Text output from Exalign ADCY1 Vs. ADCY 8
PIC#09 -
4
Graphic output from Exalign ADCY1 Vs. ADCY 8
ADCY1 (NM_021116) VS. ADCY5 (NM_183357)
L’allineamento contro la sequenza del trascritto NM_183357 è significativa per la presenza di due introni posizionati in due esoni contigui lungo la sequenza di NM_021116. Essi dividono gli esoni no. 15-16 e 17-18 nel trascritto ADCY1.
PIC#07 -
Text output from Exalign ADCY1 Vs. ADCY 5
PIC#10 -
Graphic output from Exalign ADCY1 Vs. ADCY 5
Dalla rappresentazione grafica è possibile individuare la posizione dei due introni che separano gli esoni da 264pb e 214pb ca. nella sequenza NM_021116 ADCY1.
NM_183357 NM_021116
264 117
214 ca. 147
99
115
ADCY5 (NM_183357) VS. ADCY6 (NM_015270)
L’allineamento tra la sequenza del trascritto NM_183357 e la sequenza del trascritto NM_015270 non mostra particolari differenze. È possibile pertanto ipotizzare che i due geni derivino da una duplicazione l’uno dell’altro.
PIC#11 -
Text output from Exalign ADCY5 Vs. ADCY 6
5
ADCY2 (NM_020546) VS. ADCY4 (NM_139247)/ADCY7 (NM_001114)
Gli allineamenti delle sequenze dei trascritti mostrano un’alta similarità e conservazione di quasi la totalità dei domini funzionali (esoni). Per rendere più semplice l’analisi si è preferito escludere i trascritti ADCY4 e ADCY7 a favore del trascritto ADCY2.
ADCY9 (NM_001116) VS. ADCY10 (NM_018417
L’analisi dei trascritti NM_00116 e NM_018417 non fornisce alcun dato significativo. L’allineamento è solo parziale e non rispecchia il trend degli allineamenti effettuati con i trascritti precedenti: è possibile escluderli da ogni altra considerazione.
RISULTATI DEGLI ALLINEAMENTI
A fronte dei risultati ottenuti dai vari allineamenti strutturali è possibile escludere da ulteriori considerazioni i trascritti NM_004036, NM_139247, NM_015270 e NM_020983, NM_001114, NM_001115, NM_001116, NM_018417. I risultati che non è possibile rigettare sono dati dagli allineamenti tra i trascritti NM_021116 vs. NM_183357, NM_021116 vs. 020546 e NM_020546 vs. 183357. Da questi allineamenti è possibile prevedere un allineamento multiplo sommativo dei risultati significativi ottenuti.
1 1 1
1 2 introni
ACDY1 1 introne
1 introne
1 1 1
ACDY2
1 1 1 1
ACDY5
Si individuano due regioni in cui sono avvenute delle modificazioni dovute all’evoluzione. La prima regione è stata rilevata attraverso l’allineamento tra il trascritto ADCY1 e il trascritto ADCY2 mentre la seconda è stata rilevata attraverso l’allineamento tra il trascritto ADCY1 e ADCY5. Nel trascritto ADCY2 tuttavia è possibile notare come la struttura nella regione 2 sia simile alla struttura nella regione 2 del trascritto ADCY1. Questo potrebbe segnalare la presenza di due introni conservati dall’evoluzione anche nella regione 2 del trascritto ADCY2, tuttavia Exalign non li rileva a causa della scarca percentuale di basi allineate. Non è possibile determinare un’ipotesi evoluzionistica più probabile limitatamente ai confronti considerati. Sarà necessario proseguire l’analisi spostando l’attenzione anche sui geni paraloghi ai trascritti NM_021116, NM_020546, NM_183357.
6
ALLINEAMENTO CON TRASCRITTI PARALOGHI
L’allineamento contro sequenze di trascritti paraloghi è stato effettuato prendendo in considerazione le specie per le quali era disponibile un codice di trascritto REFSEQ. Per ogni trascritto di H.Sapiens è stato individuato un trascritto paralogo in M.Musculus e R. Norvegicus. Gene
|
H.Sapiens
|
M. Musculus
|
R.Norvegicus
ADCY1
|
NM_021116
|
NM_009622
|
NM_001107239
ADCY2
|
NM_020546
|
NM_153534
|
NM_031007
ADCY5
|
NM_183357
|
NM_001012765
|
NM_022600
Dopo aver effettuato gli allineamenti contro i trascritti paraloghi i risultati restituiscono un’evidente uguaglianza tra le varie sequenze come nello schema sotto riportato.
ADCY1
|
NM_021116
≈
NM_009622
≈
NM_001107239
ADCY2
|
NM_020546
≈
NM_153534
≈
NM_031007
ADCY5
|
NM_183357
≈
NM_001012765
≈
NM_022600 [“≈” = simile a]
Tutte le considerazioni che sono state descritte per i confronti contro i trascritti ortologhi valgono in modo simile anche per i trascritti paraloghi. Nel caso sopra descritto il trascritto NM_009622 - ADCY1 in M.Musculus presenta due introni che separano gli esoni 15-16 e 17-18 in corrispondenza degli esoni 17 e 18 del trascritto ADCY5, mentre il trascritto NM_153534 - ADCY2 in M.Musculus presenta due introni che separano gli esoni 10-11-12 in corrispondenza dell’esone no. 9 del trascritto ADCY1. Le medesime analisi valgono anche per tutti i trascritti provenienti da R.Norvegicus. In conformità a quanto evidenziato dagli allineamenti con sequenze paraloghe è ora possibile proporre un’ipotesi circa come si sia evoluto il gene che codifica per la proteina integrale di membrana adenilato ciclasi.
Ancestor 0
H.Sapiens
ADCY1 - 2 introni ADCY2 - 2 introni ADCY5 - 0 introni
Ancestor 1
M.Musculus
ADCY1 - 2 introni ADCY2 - 2 introni ADCY5 - 0 introni
ADCY1 - 2 introni
R.Norvegicus ADCY2 - 2 introni ADCY5 - 0 introni
7
L’evoluzione del gene ADCY si è sviluppata in due momenti separati: il primo è stato determinato dalla duplicazione di un gene ADCY antenato, il secondo è descritto completamente dall’acquisizione degli introni che ora sono riscontrabili nei trascritti ADCY1 e ADCY2. Tutti i trascritti duplicati che non presentano introni derivano da una delle due copie del gene ADCY che non aveva acquisito gli introni. Le duplicazioni successive alla prima divisione del gene antenato sono avvenute a valle dell’acquisizione degli introni. È possibile affermare che non siano avvenuti eventi di intron-loss a causa dell’evidente assenza di introni nei trascritti duplicati esclusi dall’analisi a partire degli allineamenti tra trascritti omologhi.