Nel decennio successivo al 1953, dopo che Watson e Crick ebbero scoperto la struttura a doppia elica del DNA, altri ricercatori concorsero, tra il 1962 e il 1966, a decifrare il cosiddetto “codice genetico”, grazie al quale una sequenza di nucleotidi di un gene viene tradotta nella sequenza di amminoacidi di una proteina. Molto probabilmente, anche la prossimità temporale tra la scoperta dell'esistenza di tale codice e l'elaborazione teorica della nozione di informazione, a opera di Shannon e Weaver (1949), concorse a suggerire l'accostamento con l'informazione biologica. Più precisamente, vennero cercate correlazioni e analogie in ordine alla misura del contenuto di informazione delle sequenze (normali e mutanti per una o più variazioni) e alla misura dell' "entropia di informazione". Questo perché la teoria di Shannon considera solo la componente statistica dell'informazione, senza riferimento al suo contenuto, dunque al significato, che è invece estremamente importante per i sistemi viventi, dato che è il significato del messaggio a determinare l'azione dell'informazione erogata. Approcci successivi verso la fine degli anni Sessanta, venuti dal grande matematico russo Andrei Nikolaevich Kolmogorov, noto per la nozione di “complessità Kolmogorov”, nel campo della teoria delle probabilità, e da Gregory Chaitin, l'inventore della teoria algoritmica dell'informazione, contribuirono a considerare la struttura complessa delle sequenze. Ma neanche la nozione di complessità algoritmica della struttura è bastata per rendere conto della "significatività" dell'informazione. Gli studiosi se ne sono resi conto quando, nel 1975, analizzando il corredo genetico dello scimpanzé, si sono accorti che che era uguale a quello dell'uomo quasi al 99%, e che, dunque, sono sufficienti pochi geni, ma altamente significativi, a determinare rilevanti differenze biologiche. La “distanza genetica” tra le due specie, stimata su circa cinquanta geni strutturali, è risultata essere addirittura inferiore a quella tra specie sorelle (“sibling species”) del moscerino "Drosophila", che sono per definizione morfologicamente indistinguibili. È peraltro noto che tali piccole differenze di sequenza, capaci però di generare differenze organizzative tra le due specie, vanno quasi certamente ricondotte a cambiamenti prodotti da pochi geni regolatori. POST-GENOMICA Secondo Piero Carninci, ricercatore italiano trasferitosi da anni in Giappone presso uno dei templi della ricerca sul genoma, il Riken Genome Science Laboratory di Tsukuba, «la
sequenza del genoma, in sé, non può dirci molto: è solo un primo passo, sebbene importantissimo». Nuda e cruda, la sequenza somiglia molto al bizzarro progetto dell'architetto: i geni significanti (le informazioni rilevanti, i tratti di DNA in cui è scritto come fare le proteine) costituiscono meno del 2% dell'intero genoma e sono dispersi qua e là in una marea di sequenze diverse, molte delle quali apparentemente prive di alcuna funzione (il cosiddetto “DNA spazzatura” o "junk DNA"), e per di più possono essere spezzettati in più frammenti intercalati da sequenze senza senso. «Anche solo individuare i geni nella marea di sequenze incomprensibili non è affatto facile, tant'è che il loro stesso numero è tuttora incerto», continua Carninci, «ancor più arduo, poi, è capire a che serve il gene individuato, ovvero qual è la funzione della sua proteina». Il gene, in sé, non è che l'istruzione per fabbricare una o più proteine. Sono queste ultime che nell'organismo svolgono ogni sorta di attività, dal trasporto dell'ossigeno alla digestione; è il loro modo di funzionare che va sviscerato se si vuole comprendere come funziona il corpo umano, ricavare nuove medicine o chiarire cosa ci rende diversi da una scimmia. Lo studio sistematico dell'insieme delle proteine prodotte dall'organismo - il cosiddetto “proteoma” - è la nuova frontiera della ricerca nell'era post-genomica. «Senza dubbio, dalle indagini sulle proteine verranno le risposte più accurate, ma prima di vederne i frutti occorreranno ancora molti anni e grossi investimenti». Le proteine assumono strutture tridimensionali contorte e mutevoli, interagiscono l'una con l'altra in molteplici modi e sono ben più numerose dei geni, dato che da uno stesso gene possono derivare decine o talvolta centinaia di proteine diverse; studiarle, dunque, è molto più difficile che decifrare la semplice, lineare sequenza del DNA. E nel frattempo? Una soluzione viene da studi, come quelli di Carninci, che prendono di mira i prodotti intermedi tra il DNA e le proteine. Ogni volta che la cellula legge un gene, per prima cosa fabbrica un prodotto intermedio (detto “RNA messaggero”), che poi viene letto a sua volta per produrre la proteina; questi intermediari, a differenza del genoma, contengono la sola sequenza del gene, senza altre sequenze estranee, e vengono prodotti solo nel momento in cui il gene in questione viene letto per produrre la proteina. Carninci, in anni di ricerca, ha messo a punto le tecniche per isolare con precisione inedita gli RNA messaggeri presenti nelle cellule, e le ha impiegate per individuare e raccogliere tutti (o quasi) quelli prodotti dal più classico animale da esperimento: il topo. Ha ottenuto così una raccolta pressoché completa dei geni del topo. Dai geni isolati in questo modo si possono trarre innumerevoli informazioni. Per esempio, si può studiare in quali circostanze ciascun gene viene letto, per individuare quelli che si attivano in malattie come il cancro, e che quindi possono avere un ruolo nella malattia; si possono analizzare l'insieme di tutti i geni accesi nella cellula in un determinato momento, per ricavare indizi sulle loro funzioni; si possono inoltre condurre studi su come interagiscono tra loro le relative proteine (cosa che con il genoma non è possibile) e identificare proteine sconosciute che interagiscono con quelle già note.
Si tratta di informazioni preziose, perché, se due proteine interagiscono, evidentemente partecipano allo stesso processo. «Con le nostre tecniche riusciamo a esaminare 100 mila interazioni al giorno», dice Carninci. Il segreto della vita, dunque, secondo Carninci, non è leggibile nelle mere sequenze genetiche, ma in una complessa rete di relazioni non-lineari. L'UOMO-SCIMMIA Nel dicembre del 2003 è stata resa pubblica la sequenza dello scimpanzé ("Pan troglodytes"), assemblata da un team di ricercatori guidati da Eric Lander al Massachusetts Institute of Technology (MIT) e all'Università di Harvard e da Richard K. Wilson alla Scuola di Medicina dell'Università di Washington di St. Louis. Gli scienziati hanno depositato i dati iniziali, basati su una quadruplice copertura del genoma dello scimpanzé, nel database pubblico GenBank. Gli scimpanzé sono gli animali più simili agli esseri umani, ma tutto sommato non condividiamo con loro tutto il DNA che si pensava in passato. Lo ha dimostrato una ricerca pubblicata su Nature nel maggio del 2004 da Asao Fujiyama e Todd Taylor del Riken Genomic Sciences Center, in Giappone. Il nostro genoma e quello dei primati è uguale circa al 98.5% e dunque le differenze morfologiche e cognitive tra le due specie si pensa siano aggrappate solo a quel restante 1,5%, che si ritiene confinato a livello del "junk DNA" (DNA spazzatura). Fujiyama e Taylor hanno esaminato il cromosoma 22 di tre esemplari di scimpanzé e lo hanno confrontato con l'equivalente umano, il cromosoma 21: sebbene il genoma dello scimpanzè fosse già stato sequenziato, non si era ancora raggiunto un livello di accuratezza tale da permettere un confronto diretto come quello effettuato dai due ricercatori; dalla loro analisi è emerso che esistono delle differenze sostanziali a livello delle sequenze genetiche codificanti. Se si considera tutto il DNA, la differenza tra uomini e scimpanzé è dell'ordine dell'1,44%. Se invece si vanno a guardare la regioni codificanti del genoma, la differenza sale fino al 17%. Questo significherebbe, in parole povere, che i geni sono tra loro quasi identici, mentre le proteine che vengono codificate sono molto diverse, per via delle differenze nelle porzioni di gene da cui vengono trascritte. Una scoperta che dimostra ulteriormente come anche sottili modifiche nel codice genetico possono essere estremamente significative per il fenotipo che ne risulta. MISTERI GENETICI Una nuova ricerca, pubblicata da un team di biochimici sul numero di giugno del Journal of Molecular Biology, ha provato a fornire una spiegazione del perché umani e primati sono così relativamente simili in fatto di corredo genetico, e così radicalmente diversi biologicamente e soprattutto intellettualmente.
Anche secondo il professore di biochimica Achilles Dugaiczyk, la chiave di tutto è nel DNA spazzatura: sezioni di DNA apparentemente senza una precisa funzione, soggette a improvvise mutazioni o “riarrangiamenti genomici” che possono generare nuove proteine o alterare la regolazione di determinati geni, oppure possono portare a sviluppi cancerosi o altri difetti genetici. Il team, composto tra gli altri da Rosaleen Gibbons, Lars J. Dugaiczyk, Thomas Girke, Brian Duistermars e Rita Zielinski, ha identificato più di 2.200 porzioni di “junk DNA” umano, assente negli scimpanzé e in altri primati. “L'esplosiva espansione del DNA spazzatura e le risultanti ristrutturazioni del nostro codice genetico potrebbero costituire proprio la nostra peculiarità genetica”, dice Dugaiczyk. Usando una metafora, si potrebbe dire che umani e scimpanzé marciano al ritmo dello stesso tamburo, solo che quello degli umani suona molto più veloce. Inoltre, l'analisi chimica delle sequenze di DNA spazzatura umano ha mostrato che sono scritte nella chimica dei cromosomi, e che dunque non si tratta affatto di processi casuali. (Pubblicato su Ecplanet, 10-09-2004) Pubblicato il genoma dello scimpanzé 15 dicembre 2003 Distinguishing Humans from Great Apes with AluYb8 Repeats 04 maggio 2004 Comparative analysis of chimpanzee and human Y chromosomes unveils complex evolutionary pathway 01 gennaio 2006
Kolmogorov complexity - Wikipedia Proteomics - Wikipedia PSEUDO-GENETICA IL GENOMA MANCANTE THE PROTEIN GRID METAGENOMICA REGOLAZIONE GENETICA METAGENOMICA EVOLUZIONE SISTEMICA EVOLUZIONE SISTEMICA 2 EVOLUZIONE SISTEMICA 3
NATURA VS. CULTURA