MANUAL DE SWISS PROT UN POCO DE HISTORIA El swiss-prot es una base de datos de secuencias de proteína anotada, iniciada en 1986 y mantenida por el grupo de Amos Bairoch primero en el departamento de bioquímica médica de la universidad de Ginebra y ahora en el instituto suizo de la bioinformática (SIB) y de la biblioteca de datos de EMBL (ahora dependencia de EMBL - el instituto europeo de la bioinformática (EBI). La base de datos de la proteína del swiss-Prot consiste en entradas de la secuencia. Las entradas de la secuencia se componen de diversos tipos de línea, cada uno con su propio formato. Para la estandardización el Swiss-Prot propone un formato que sigue de cerca la base de datos de la secuencia de nucleótido de EMBL. El swiss-prot se distingue por cuatro características básicas: •
La anotación: proporciona información puntual sobre información de la referencia bibliografìca y de los datos taxonómicos, se referencia datos como las funciones de la proteína, semejanzas, las enfermedades que ocasionan su deficiencia, conflictos de la secuencia y variantes.
•
Redundancia mínima: Muchas bases de datos, tienen para cada proteína datos por separado, de diversos autores; el swiss-prot asocia todos los datos para evitar conflictos y si estos existen lo informa en la tabla de características de la proteína.
•
Integración con otras bases de datos: El swiss-prot provee a los usuarios de bases de datos bio moleculares un grado de integración entre los tres tipos de bases de datos de secuencia-relacionadas (secuencias del ácido nucléico, secuencias de la proteína y estructuras terciarias de la proteína) así como con colecciones de datos especializadas, el swiis-prot remite a mas de cincuenta bases de datos Las referencias recíprocas se proporcionan bajo la forma de indicadores relacionados con la información a las entradas del swiis-Prot .
•
La documentación: El swiis – prot distribuye una gran cantidad de información en diferentes formatos, (Fasta, Blast, etc.) mucha de las cuales han estado en la base de datos por mucho tiempo. TrEMBL es la sección computadora-anotada de la base de conocimiento de UniProt. Contiene traducciones de todas las regiones de la codificación en las bases de datos del nucleótido de la proteína ordenada y extraída de DDBJ/EMBL/GenBank, bases de datos externas. Al ingresar datos en el TrEMBL se comparan con los existentes en DDBJ/EMBL/GenBank y se generan los reportes para saber si los datos existen y generar la respectiva referencia.
Para entender la funcionalidad del Swiss-prot realizaremos un ejercicio de búsqueda de datos para la enfermedad del Herpes; para ello ingresamos al Web site de swiss-prot http://www.expasy.org
Nos aparece una ventana como la mostrada en la figura; en la opción Search escogemos una base de datos para el ejemplo Swiss-prot/TrEMBL, digitamos la información de la búsqueda y luego GO.
1
2 Como resultado de la búsqueda nos ofrece los siguientes datos:
1. para esta consulta nos ofrece 16470 secuencias de proteínas halladas o con asociación al herpes (numeral 1), además nos ofrece la posibilidad de depurar los resultados cambiando el tipo de formato o mediante la combinación de operadores, estos cambios los podemos realizar en la parte inferior de la pagina, ingresando el nombre del archivo o generando una lista para salvar los resultados los cuales se almacenaran por una semana en un archivo temporal. 2. Seleccionamos un resultado que deseemos consultar, para lo cual en este ejemplo damos click en ATI2_EHV1B (numeral 2). Mostrándonos la siguiente ventana:
1
2
En la cual tenemos acceso a toda la información (numeral 1) como nombre de la proteína, organismo en el que se hospeda, referencias taxonómicas, nombre del gen, sinónimos, proteínas existentes. En cuanto a las referencias (numeral 2) nos enlaza con otras bases de datos que ofrecen información sobre la proteína en este caso pubmed. En la siguiente ventana observamos otras caracteristicas importantes como son las referencias cruzadas mediante las cuales podemos relacionar la proteína consultada con otras bases de datos como EMBL y las identificaciones de referencia para ubicarlo en dichas bases de datos (numeral 1)
1
Información de los aminoácidos:
En la parte final de la búsqueda tenemos una característica muy importante como es la información de la secuencia de la proteína donde se ilustra el tamaño de la secuencia y se re ilustra en grupos de a 10 aminoácidos, para este caso 747. En el final de la ventana tenemos acceso a varias herramientas que pueden ser útiles para trabajar con la secuencia de la proteína. Referencias bibliograficas: www.expasy.org/cgi-bin/sprot-search-de?herpes http://www.expasy.org/sprot/userman.html
Realizado y traducido por: LUIS ENRIQUE HERRERA MORALES Estudiante Ing. de sistemas IV. cod. 200741013 HUGO CHAPARRO Estudiante Ing. de sistemas III. cod. 200742004