Introducción La Bioinformática es un campo de la ciencia en el cual confluyen varias disciplinas tales como: biología, computación y tecnología de la información. Al comienzo de la "revolución genómica", el concepto de bioinformática se refería sólo a la creación y mantenimiento de base de datos donde se almacena información biológica, tales como secuencias de nucleótidos y aminoácidos. El desarrollo de este tipo de base de datos no solamente significaba el diseño de la misma sino también el desarrollo de interfaces complejas donde los investigadores pudieran acceder a los datos existentes y suministrar o revisar dichos datos. En este informe se detallan algunas las formas de uso de la bioinformática, para actividades tales como la traducción de una secuencia de nucleótidos, así como la identificación del organismo al que corresponde cada secuencia.
Objetivos: • •
Aprender a utilizar las bases de datos como un media de apoyo a la hora de trabajar con secuencias nucleotídicas. Diferenciar los distintos tipos de programas bioinformáticos, así como también saber la función de cada uno de estos.
Resultados: Identificación de bioinformáticos.
una
secuencia
nucleotídica
desconocida
mediante
programas
La secuencia utilizada en fue: >secuencia3 GGTGTGATGGAAGATACAAAACAACATGAGGAGATGGAGAATGATAAGCTATGTTTGAAGGAGGACACAA ATCTATTTGAGGAGATGATGGAGTCGGCAAAAGATAGGATGATCCGTTCAGTGGAGGAACTCTTAGGAGG AGAATTCCCTTATCTTGGATCTTACGAAAACATCCACACTTGGCTCAGTGGCGTTCTTACTAGCTACATC ACATGTATCGACGAAATTGGTGACGGTGCCTATAAACGTCGGGTCGAGCCACAGCTTCAAGACCTCATTT CTAAGGCAAAGGTAGCTTTGGCTCTTTTTATCTCCATTTCGCCGAGAGACAACACCGAACTTAACTCGGT GGTTCCCAATAGCCCGTCTTGGTTATCTCATGTTGACAAGAAAGATCTATATCTCAATGCTGAGGCTCTA AAAAAGATTGCCGATGTTGTGGTCGCGAAAGATGGGACCGGAAAGTACAACACAGTGAATGCGGCCATTG CAGCAGCACCTCAACACAGCCACAAGAGATTCATCATCTATATAAAGACAGGCATTTATGATGAAATCGT CGCCATTGAGAATACGAAACCCAATTTAACTCTTATAGGTGATGGTCAAGATTCAACCATCATCACGGGC AATTTAAGCGCTAGCAATGTTAGAAGAACGTTCTACACTGCAACTTTTGCTTCTAATGGTAAAGGATTCA TCGGAGTAGACATGTGCTTCCGAAACACGGTCGGGCCGGCAAAAGGACCAGCTGTTGCCCTCCGTGTGAG TGGTGATATGTCCGTCATTTACAGATGTCGTGTCGAGGGATATCAGGATGCCTTGTATCCTCACATAGAC CGCCAGTTTTATAGGGAGTGCTTTATTACCGGTACTGTAGATTTCATTTGTGGAAACGCAGCGGCGGTAT TTCAATTCTGCCAGATTGTAGCAAGACAGCCTAATATGGGGCAAAGCAATTTCATAACCGCTCAATCACG CGAGACTAAGGACGACAAATCGGGCTTCTCAATTCAAAACTGCAACATCACAGCAAGTTCGGATCTAGAT ACAGCAACCGTAAAAACGTATCTTGGAAGGCCTTGGAGGATATTTTCAACAGTCGCGGTTCTGCAGTCTT TCATCGGTGATTTAGTTGATCCCGCAGGCTGGACTCCTTGGGAAGGAGAAACTGGTCTGTCAACTCTCCA
Los programas que fueron utilizados para identificar la secuencia nucleotídica fueron los siguientes: • • • •
Blast: Compara la secuencia con una base de datos de secuencias. Blastx: Compara la secuencia con una base de datos de proteínas. Translate: Traduce la secuencia a proteínas. Blastp: Compara la secuencia de aminoácidos con una base de datos de proteínas.
Al utilizar el Programa Translate, se obtuvo la siguiente secuencia aminoacídica: >secuencia3(frame 5’ a 3’) GVMEDTKQHEEMENDKLCLKEDTNLFEEMMESAKDRMIRSVEELLGGEFPYLGSYENIHT WLSGVLTSYITCIDEIGDGAYKRRVEPQLQDLISKAKVALALFISISPRDNTELNSVVPN SPSWLSHVDKKDLYLNAEALKKIADVVVAKDGTGKYNTVNAAIAAAPQHSHKRFIIYIKT GIYDEIVAIENTKPNLTLIGDGQDSTIITGNLSASNVRRTFYTATFASNGKGFIGVDMCF RNTVGPAKGPAVALRVSGDMSVIYRCRVEGYQDALYPHIDRQFYRECFITGTVDFICGNA AAVFQFCQIVARQPNMGQSNFITAQSRETKDDKSGFSIQNCNITASSDLDTATVKTYLGR PWRIFSTVAVLQSFIGDLVDPAGWTPWEGETGLSTL
Con los resultados obtenidos, la secuencia corresponde a al organismo Arabidopsis Thaliana. Esto se pudo comprobar con los resultados de los 3 programas Blast, ya que los 3 dieron como resultado el mismo organismo.. Además también se pudo identificar la proteína que codifica esta secuencia, dentro de las posibles alternativas de proteínas son: • Pectinesterasa. • Pectinmethylesterasa Ambas alternativas presentaron un porcentaje de identificación del 100%. Según los resultados, se pudo inferir que el porcentaje de la proteína completa que se tiene es: Si se procede a utilizar el programa Blast como el Blastx, se obtendrá un porcentaje de cobertura de la secuencia, respecto de la base de datos es del 75%. Al comparar todos los resultados obtenidos, se procedió a buscar el resultado con el mejor porcentaje de acierto, una vez identificado, el resultado adecuado, tanto en el Blast como el Blastx, se procedió a obtener el porcentaje de cobertura de la secuencia mediante una simple ecuación: L: Longitud de la secuencia en la base de datos. l: longitud de la secuencia poseída. L l
100 ; reemplazando los valores: L= 1575, l: 1229 x
x = (1229*100)/ 1575 => x= 75,4% Si se utiliza el Blastp, se procede a buscar el resultado con el mayor porcentaje de acierto. Según los resultados la proteína deducida es la Pectinesterasa, con un porcentaje de 75% de la proteína completa.
Identificación: Número de Acceso: NM_116631.4 Organismo Perteneciente: Arabidopsis Thaliana. Función: Catalizar la hidrólisis de grupos metilester encontrados en la cadena peptídica Condiciones en las que se obtuvo: Procesos en los que participa:
Análisis Utilizando el programa protparam con la secuencia nucleotídica: P. I: 5.04 Masa Molecular: 97873.3 g/mol Utilizando la secuencia aminoacídica: P. I: 5.23 Masa molecular 43801.5 g/mol Localización subcelular: • • • •
0.450 en el citoplasma. 0.100 en el espacio mitocondrial. 0.100 en el lisosoma. (lumen) 0.091 en el peroxisoma.
Según estos datos, se puede inferir que la localización subcelular es el citoplasma. Número de regiones transmembrana: Utilizando el programa DAS se obtuvo las posibles regiones transmembrana: Inicio 62 65 97 99 294 302 366 369
Fin 71 67 106 103 297 304 376 371
Tamaño 10 3 10 5 4 3 11 3
~ ~ ~ ~ ~ ~ ~ ~ ~
Cutoff 1.7 2.2 1.7 2.2 1.7 1.7 1.7 2.2
Comparación de secuencias Para esta parte se utilizaron, además las secuencias 1 y 2, traducidas a secuencias aminoacídicas. >secuencia1 RRRNSGKWVCEVREPNKKTRIWLGTFQTAEMAARAHDVAALALRGRSACLNFADSAWRLR IPESTCAKDIQKAAAEAALAFQDEMCDATTDHGFDMEETLVEAIYTAEQSENAFYMHDEA MFEMPSLLANMAEGMLLPLPSVQWNHNHEVDGDDDDVSLWSY>secuencia2 PNLSHTKSKEEQWLPLCSLPLLWLPLRLRPLWSLLSTDLSPPLPSQPPARLTTTLLPSQA TAEELTACRCGLRLERRSLRLSLTFLTLPIPNWLRKLTTLSATSGFLVLNSTRICVP-AR -LTRIL-WTVLDNVEASLVRLHRLRSSVEGSGRVQEGVPQCLH-DHRIRQHPSSPVHQFH CLQATKLHRLISLCFCVNLKTLSPIFDFIPCFSAFFFFLGF-FPDLTFVFRFA
Utilizando el programa ClustalW2 se obtuvo el siguiente resultado: secuencia3 secuencia1 secuencia2 :
GVMEDTKQHEEMENDKLCLKEDTNLFEEMMESAKDRMIRSVEELLGGEFPYLGSYENIHT 60 -----------------------------------------------------RRRNSGK 7 ------------------------------------------------PNLSHTKSKEEQ 12
secuencia3 secuencia1 secuencia2 *:
WLSGVLTSYITCIDEIGDGAYKRRVEPQLQDLISKAKVALALFISISPRDNTELNSVVPN 120 WVCEVRE----------------------------------------PNKKTRI------ 21 WLPLCSLP-----------------------------------LLWLPLRLRPL------ 31 * :
secuencia3 secuencia1 secuencia2 * .
SPSWLSHVDKKDLYLNAEALKKIADVVVAKDGTGKYNTVNAAIAAAPQHSHKRFIIYIKT 180 ---WLGTFQTAEMAARAHDVAALA---------------LRGRSACLNFADSAWRLRIPE 63 ---WSLLSTDLSPPLPSQPPARLT------------TTLLPSQATAEELTACRCGLRLER 76 :. :: . ::. : : : :
secuencia3 secuencia1 secuencia2 . : .
GIYDEIVAIENTKPNLTLIGDGQDSTIITGNLSASNVRRTFYTATFASNGKGFIGVDMCF 240 STCAKDIQKAAAEAALAFQDEMCDATTDHGFDMEETLVEAIYTAEQSEN----------- 112 -RSLRLSLTFLTLPIPNWLRKLTTLSATSGFLVLNSTRICVP-AR-LTRIL--------- 124 . : * .. . * .
secuencia3 secuencia1 secuencia2 :. : : :
RNTVGPAKGPAVALRVSGDMSVIYRCRVEGYQDALYPHIDRQFYRECFITGTVDFICGNA 300 ---------------------------------AFYMHDEAMFEMPSLLA---------- 129 --------------------------------WTVLDNVEASLVRLHRLRSSVE------ 146 :
secuencia3 secuencia1 secuencia2 .: :.
AAVFQFCQIVARQPNMGQSNFITAQSRETKDDKSGFSIQNCNITASSDLDTATVKTYLGR 360 --------------NMAEGMLLPLPS----------VQWNHNHEVDGDDDDVSLWSY--- 162 -----------GSGRVQEGVPQCLH-DHRIRQHPSSPVHQFHCLQATKLHRLISLCFCVN 194 : : . . :
secuencia3 secuencia1 secuencia2
PWRIFSTVAVLQSFIGDLVDPAGWTPWEGETGLSTL- 396 -------------------------------------LKTLSPIFDFIPCFSAFFFFLGF--FPDLTFVFRFA 228
Los aminoácidos mas conservados en las 3 secuencias son: • • •
W P A
Discusión La pectinesterasa parte en la célula vegetal siendo solo pectina la cual ocupa un 35% del peso de la pared primaria de la célula en sí. La pectina es un HGA con una ariable cantidad de metilester en el carbono 6, estas pectinas son secretadas a la pared celular estando altamente metilesterificadas, donde luego la pectin-metilesterasa la degrada luego esto provoca una desmetilesterificacion la cual hace que el pH y la carga de la pared celular cambie permitiendo que se unan poliurinidos en la estructura del gel de la pared, incrementando su firmeza (1). Se ha visto que la pectinmetilesterasa proviene del gen llamado QRT1 (2) en las arabidopsis talhiana esto se comprobó al ver que el gen QRT es importante a la hora de la separación del polen dentro de un desarrollo normal en una flor, por lo que esta enzima no solo sirve para dar firmeza a la pared celular, sino que también se utiliza para separar el polen para así poder continuar con su ciclo vital normal. Sin embargo este gen no solo codifica para esta enzima sino que también para algunos tejidos de la planta, así como de células guardianas y néctares florales. También se ha observado que la PME no solo ayuda a regular la rigidez de la pared celular, sino que esta rigidez puede ser selectiva, es decir, puede hacer mas rígida cierta parte de la pared celular, esto provoca que la planta pueda crecer hacia arriba y de una forma “tubular”, ya que estas enzimas actúan de forma que desarrollan una pared más rígida en las zonas laterales de las células(3), mientras que en las formas apicales son mas expandibles y flexibles, lo que ayuda al crecimiento geotrópico negativo de la planta. Gracias a la metodología informática utilizada y los programas correctamente utilizados se puede decir que los datos son certeros a la hora de una comparación de resultados, ya que estos coinciden cerradamente con lo encontrado, lo que corresponde a una proteína existente en una especie vegetal y de mucha importancia para esta. Sin embargo estos modelos informáticos arrojan mucha información, por lo cual se centro en la pauta entregada para resumir lo más posible estos datos y sacar lo más relevante de cada caso para hacer un informe conciso y preciso sobre la proteína encontrada gracias a estos programas. En conclusión se puede decir que la bioinformática es una herramienta útil para los biólogos que necesitan de una información rápida y certera para realizar estudios de forma mas rápida y expedita, todo esto gracias a la colaboración de la comunidad científica que esa dispuesta a compartir los resultados ya encontrados por ellos, para así compartirlos con el investigador y para que este pueda hacer una comparación precisa de sus investigaciones con los datos ya publicados y así no perder el tiempo, en si por ejemplo, su investigación ya habría sido hecha, o incluso refutada, gracias a una nueva investigación. Entonces se puede decir que la bioinformática no es solo una herramienta para ordenar, encontrar, y disponer de datos ya estudiados, sino que también es posible utilizarla para analizar estos datos, realizar una investigación, comprobar que es correcta y viable, y finalmente publicarla para compartirla con la comunidad científica y así agregarse a la base de datos para que una próxima investigación tenga como base estos resultados.
Referencias Digital (páginas Web) • • • • • papers
http://pubs.acs.org/doi/pdf/10.1021/jf60173a020 http://blast.ncbi.nlm.nih.gov/Blast.cgi http://ca.expasy.org/cgi-bin/protparam http://www.sbc.su.se/~miklos/DAS/tmdas.cgi http://pubs.acs.org/doi/pdf/10.1021/jf60173a020 1. Overexpression of Pectin Methylesterase Inhibitors in Arabidopsis Restricts Fungal Infection by Botrytis cinérea (Plant Physiol. Vol. 143, 2007), Vincenzo Lionetti2, Alessandro Raiola2, Laura Camardella, Alfonso Giovane, Nicolai Obel, Markus Pauly, Francesco Favaron, Felice Cervone, and Daniela Bellincampi 2. Separation of Arabidopsis Pollen Tetrads Is Regulated by QUARTET1, a Pectin Methylesterase Gene (Plant Physiology, November 2006, Vol. 142, pp. 1004–1013, www.plantphysiol.org _ 2006 American Society of Plant Biologists), Kirk E. Francis, Sandy Y. Lam, and Gregory P. Copenhaver 3. Elaborate spatial patterning of cell-wall PME and PMEI at thepollen tube tip involves PMEI endocytosis, and reflects thedistribution of esterified and deesterified pectins.( Journal compilation ª 2007 Blackwell Publishing Ltd, The Plant Journal, (2008), 53, 133–143), Nina Ro¨ ckel†, Sebastian Wolf†, Benedikt Kost‡, Thomas Rausch and Steffen Greiner
Universidad Andrés Bello Facultad de Ecología y Recursos Naturales Laboratorio de Bioquímica
Bioinformática Determinación de una secuencia nucleotídica Docente: Nelson Caro Integrantes: Ernesto Langhaus Alonso Pino Carrera: Ingeniería En Biotecnología Curso: Bio267 Sección: 5