Le GENOTECHE cDNA
Poiché utilizzano come materiale genetico di partenza l’RNAm:
-Contengono solo DNA genico
-Sono rappresentative dell’espressione genica Fasi della preparazione della genoteca: di un dato tipo cellulare a) Purificazione dell’RNAm
b) Sintesi del primo filamento di cDNA usando come stampo l’RNAm
c) Sintesi del secondo filamento
d) Adattamento del cDNA per la
La purificazione dell’RNAm da un estratto di RNA totale
Si sfrutta la coda di poliA tipica dell’RNAm
La presenza del sale favorisce l’interazione fra sequenze omologhe NaCl 100mM Tris 10 mM EDTA 1 mM
La bassa forza ionica del tampone fa staccare l’RNAm
What about Green ham and bacon?
La sintesi del primo filamento di cDNA
Un enzima davvero complesso: la TRASCRITTASI INVERSA
Ha attività DNA-polimerasica e RNAsica
La trascrittasi inversa polimerizza il DNA usando come stampo l’RNAm. Procede a salti, degradando via via l’RNAm già copiato e generando in 5’ ed in 3’ le LTR necessarie per la sintesi del nuovo genoma retrovirale ad RNA.
PBS: sito di legame del primer R: regione a ripetizione diretta U5: regione unica in 5’ U3: regione unica in 3’
QuickTime™ and a Cinepak decompressor are needed to see this picture.
In vitro la trascrittasi inversa può effettuare solo la sintesi del primo filamento
Le metodiche di sintesi del primo filamento variano in base al tipo di innesco:
primer di oligo-dT
cccaaa
random priming gtccaa
5’
cctgca ggacgt
DNA ligasi
La retrotrascrizione inizia a partire dalla coda di poli-A
ttcgta aagcat
tatggc ataccg
AAAAAA 3’
Sintesi del secondo filamento del cDNA Metodo del self-priming
Metodo dell’RNAsi H
5’ 3’ ansa a forcina
La DNA polimerasi I di E.coli ha, Sia attività polimerasica, sia esonucleasica Il DNA in 3’ tende a ripiegarsi su se stesso, formando legami tra basi che sono omologhe
Si adattano i cDNA per la successiva fase di clonaggio
Trattamento con METILASI per mascherare i siti EcoRI Trattamento con DNA ligasi per aggiungere i linkers
Il metodo del primer adattatore TRASFERASI TERMINALE: La TRASFERASI TERMINALE è una DNA polimerasi atipica: non necessita di DNA stampo. Polimerizza una codina omopolimerica in 3’ se si fornisce un solo tipo di dNTP
DNA polimerasi
Metilasi
DNA ligasi
Sia che si parta da DNA genomico, che da cDNA, la procedura per lo screening è la stessa
Il DNA dal fago λ, per poter ibridare con la sonda, deve essere denaturato
Caratteristiche della sonda:
-generalmente è un oligonucleotide di sintesi chimica, che non presenta il -P in 5’ -deve essere almeno un 20mero per dare univocità di riconoscimento (una sequenza di 20 basi ricorre circa ogni 420 basi (≈1012). Dimensione del genoma umano 3x109) -deve essere marcata
La POLINUCLEOTIDE CINASI aggiunge un -P in posizione 5’
Da dove si ricavano le informazioni per disegnare una sonda? Si può partire dalla seuenza aminoacidica di un frammento di una proteina, tenendo presente che il codice genetico è degenerato
1) Metodo delle SONDE DEGENERATE
or SM
Corrispondono a 48 diverse sonde
2) Metodo delle sonde uniche basate sulle Tag di Sequenze Espresse (EST)
INTERNET
EST database
EST database: è una collezione di sequenze parziali di cDNA, cioè di porzioni (tag) relativamente corte di DNA genomico che vengono espresse in forma di RNAm
I ricercatori possono disporre di software in rete che possono confrontare la sequenza aminoacidica determinata con le EST disponibili, al fine di trovarne una che possa codificare la proteina. Si costruisce quindi una SONDA ESATTA
Una sonda lunga (anche se a bassa omologia) può essere ottenuta da una specie affine. Si usa una metodica di marcatura a più alta efficienza
-Si usa il frammento KLENOW della DNA-polimerasi I di E.coli (non ha attività esonucleasica) -Si usa il random priming in presenza Di dNTP marcati -I frammenti di sonda sono uniformemente Marcati (più alta attività specifica
Una volta individuato il clone (placca di lisi, E,coli, ecc) che contiene il DNA ricercato, si procede a sequenziarlo
Il metodo dei DIDEOSSINUCLEOTIDI (metodo di Sanger)
INGREDIENTI: il DNA da sequenziare a singolo filamento (es.NaOH) Un primer marcato che ibrida a monte del DNA da sequenziare
MCS
4 provette, in ciascuna delle quali si mette un diverso dideossinucleotide La
SEQUENASE (DNA-polimerasi del fago T4 modificata): -ALTA PROCESSIVITA’
-ASSENZA DI ATTIVITA’ ESONUCLEASICA
QuickTime™ and a Animation decompressor are needed to see this picture.
Molto spesso il frammento di DNA da clonare è troppo lungo per la processività della Sequenase: si procede con il PRIMER WALKING
Che cosa determina la scelta di una library genomica o a cDNA?
Library a cDNA -Il gene deve essere espresso in una cellula batterica -Il gene è particolarmente espresso in un determinato tipo cellulare o tessuto -Nella forma nativa, il gene cercato è troppo grande per entrare efficientemente in un Vettore di espressione
Library genomiche -Si vuole studiare il DNA non codificante (es. sequenze regolatrici, marcatori polimorfici) -Si vuole sequenziare un intero genoma
IL PROGETTO GENOMA UMANO Nature 431, 931 945 (21 October 2004); doi:10.1038/nature03001 Finishing the euchromatic sequence of the human genome INTERNATIONAL HUMAN GENOME SEQUENCING CONSORTIUM A list of authors and their affiliations appears in the Supplementary Information Correspondence and requests for materials should be addressed to F .S. Collins (
[email protected]), E. S. Lander (
[email protected]), J. Rogers (
[email protected]) or R. H. Waterston (
[email protected]). The sequence described here has been deposited in public databases, with the 24 human chromosomes having accession numbers NC000001 to NC000024. The sequence of the human genome encodes the genetic instructions for human physiology, as well as rich information about human evolution. In 2001, the International Human Genome Sequencing Consortium reported a draft sequence of the euchromatic portion of the human genome. Since then, the international collaboration has worked to convert this draft into a genome sequence with high accuracy and nearly complete coverage. Here, we report the result of this finishing process. The current genome sequence (Build 35) contains 2.85 billion nucleotides interrupted by only 341 gaps. It covers 99% of the euchromatic genome and is accurate to an error rate of 1 event per 100,000 bases. Many of the remaining euchromatic gaps are associated with segmental duplications and will require focused work with new methods. The near complete sequence, the first for a vertebrate, greatly improves the precision of biological analyses of the human genome including studies of gene number, birth and death. Notably, the human genome seems to encode only 20,000–25,000 proteincoding genes. The genome sequence reported here should serve as a firm foundation for biomedical research in the decades ahead.
LA MAPPA FISICA DEL GENOMA Si usano vettori ad inserti lunghi (es. Library in YAC)
Per prima cosa, si determinano i CONTIG, cioè set di cloni che si sovrappongono parzialmente. Via via che l’assemblaggio va avanti, i contig diventano equivalenti ad un unico cromosoma
Il processo è agevolato se, invece di digerire tutto il DNA genomico, si digerisce il DNA di uno specifico tipo di cromosoma, separato mediante FACS
Fluoroforo 1: AT Fluoroforo 2: GC
Come si assemblano i contig? DETERMINAZIONE DELL’ORDINE ATTRAVERSO Sequence-Tagged Sites (STS) E EST STS: corta sequenza di DNA UNICA che viene ottenuta da inserti clonati più lunghi (es: genoteca in fago λ). Come si stabilisce se la sequenza è unica in tutto il DNA (o in un intero cromosoma?)
Si disegnano coppie di primers per PCR in grado di amplificare ciascuna TAG
La presenza di un amplificato indica che nel clone da YAC è presente la TAG
Se uno stesso amplificato compare in due diversi cloni da YAC vuol dire che si sovrappongono e si costituisce il contig
IL SEQUENZIAMENTO AUTOMATIZZATO DEL DNA
La tecnica della PCR, unitamente alle recenti acquisizioni sulla sequenza del genoma umano, consente di clonare direttamente un gene specifico, senza bisogno di costruire delle genoteche
-Devono essere note le sequenze che fiancheggiano la regione da clonare -La regione da clonare non deve essere troppo lunga -E’ applicabile soprattutto al DNA che viene trascritto in RNAm