Análisis de residuos catalíticos en sitios activos de enzimas Presentamos un análisis de los residuos directamente involucrados en la catálisis en 178 sitios activos de enzimas. Los criterios específicos se derivaron para definir un residuo catalítico y se utilizaron para crear un conjunto de datos de residuos catalíticos, que luego se analizaron en términos de propiedades que incluyen la estructura secundaria, la accesibilidad del disolvente, la flexibilidad, la conservación, la estructura y función del cuaternario. Los resultados indican el predominio de un pequeño conjunto de residuos de aminoácidos en la catálisis y dan una imagen de un entorno de sitio activo general. Se espera que esta información proporcione una mejor comprensión de los mecanismos moleculares implicados en la catálisis y una base heurística para predecir residuos catalíticos en enzimas de función desconocida. INTRODUCCION Las enzimas son probablemente las moléculas biológicas más estudiadas. Constituyen el conjunto de herramientas de la naturaleza para fabricar y descomponer las moléculas requeridas por las células en el curso del crecimiento, reparación, mantenimiento y muerte. Prácticamente todos los procesos biológicos requieren una enzima en algún momento. Las enzimas son capaces de realizar transformaciones complejas en solución acuosa, a temperaturas biológicas y pH, de manera estéreo específica y región específica, una hazaña que rara vez se logra el mejor de los químicos orgánicos.1 Quizás el mecanismo catalítico enzimático más conocido sea el de las serina proteasas, que contienen una Ser-HisAsptriad.2,3 Esta tríada ha evolucionado más de una vez en diferentes pliegues estructurales.4 Conocimiento y Una mejor comprensión de las propiedades de los sitios activos de enzimas y sus variados mecanismos catalíticos es vital para el diseño de nuevas proteínas y para predecir la función de las proteínas desde la estructura. Los estudios cristalográficos y de RMN de enzimas han arrojado luz sobre la relación entre la estructura tridimensional de una enzima y la reacción química que realiza. Sin embargo, solo a partir de una estructura es una tarea difícil extrapolar un mecanismo catalítico. Se puede utilizar información bioquímica detallada sobre la enzima para diseñar análogos de estado de transición o sustrato, que luego pueden unirse a la enzima para la determinación de la estructura. Estos pueden revelar las ubicaciones de los sitios de unión e identificar residuos, que probablemente participen en la reacción química. A partir de esto, se puede proponer un mecanismo catalítico y se puede confirmar mediante otra información, por ejemplo, mutagénesis dirigida al sitio, análisis cinéticos y mediante extrapolación de homólogos. Este análisis se concentra en los residuos de aminoácidos directamente involucrados en la catálisis enzimática, como lo revelan los estudios estructurales. Se basa en el trabajo de Zvelebil & Sternberg, 5 quien en 1988 realizó un análisis comparativo de residuos catalíticos en solo 17 enzimas. Desde que se publicó este trabajo, el número de estructuras enzimáticas en el PDB6 se ha multiplicado por cuarenta †, y las técnicas para dilucidar los mecanismos catalíticos enzimáticos han mejorado.
Por lo tanto, es apropiado reexaminar los residuos de aminoácidos involucrados en la catálisis, así como sus propiedades y funciones, en una escala más amplia. Un problema importante es la complejidad de los datos y la dificultad de extraer la información relevante de la literatura. Además, la necesidad de agrupar proteínas en familias relacionadas para generar "buenos" datos imparciales no es trivial. Se examinan las siguientes propiedades de los residuos catalíticos: distribución de frecuencia del tipo de residuo, función, entorno de la estructura secundaria, accesibilidad del disolvente, flexibilidad, conservación, enlaces de hidrógeno y estructura cuaternaria. Se espera que estos datos mejoren nuestra comprensión de los principios genéricos de la catálisis. Proporcionan una anotación de secuencia basada en la estructura, que puede ayudar a identificar posibles residuos catalíticos de la estructura, y un banco de pruebas para desarrollar herramientas para predecir el mecanismo a partir de la estructura. Estas herramientas son la base para predecir la función de las estructuras producidas por iniciativas de genómica estructural. Criterios y análisis de residuos catalíticos Colección de datos Un Atlas de sitios de proteínas de sitios funcionales, incluidos los sitios activos de enzimas definidas en la literatura, se encuentra actualmente en construcción (C.T.P. & J.M.T., resultados no publicados). A partir del sistema de EC, 7 para cada número de EC (ver leyenda de la Figura 3), se examinaron las enzimas con estructuras en el PDB y, cuando fue posible, se asignaron residuos de sitios activos. Se debe tener en cuenta que estos no son simplemente el contenido de los registros del SITIO de los archivos PDB, sino que contienen información extraída manualmente de la literatura primaria. Para generar un homólogo no homólogo. Con el fin de generar un conjunto de datos no homólogos, se examinó la clasificación de CATH8,9 de cada enzima, y se eliminaron todos los duplicados en el nivel "H" de CATH (definidos por la estructura y las comparaciones de secuencias que tienen un ancestro común). Una complejidad aquí es que CATH clasifica los dominios de proteínas, mientras que este análisis se concentra en enzimas completas, que pueden tener uno o más dominios. Los dominios con números de CATH idénticos se retienen en el conjunto de datos
si forman parte de la misma enzima (es decir, una repetición en tándem) o si un dominio idéntico se comparte entre dos proteínas de múltiples dominios con funciones diferentes. De esta lista, se tomó un conjunto de 178 para formar el conjunto de datos para nuestro trabajo. Cada enzima tiene una estructura cristalina de rayos X (las resoluciones varían entre 1.5 A ̊ y 3.2 A )̊ en el PDB (excepto en dos casos que son estructuras derivadas de RMN; ID de PDB: 1mek y 1adn), un sitio activo bien definido y un mecanismo de acción propuesto en la literatura, generalmente corroborado por mutagénesis dirigida y otros datos. La información recopilada para la enzima carboxipeptidasa D10 se muestra en la Tabla 1 y la Figura 1 como ejemplo. La literatura primaria utilizada para recopilar este conjunto de datos y las asignaciones de residuos se puede encontrar en el sitio web ‡. Definición de residuos catalíticos.
Los residuos catalíticos no están definidos consistentemente en la literatura, por lo tanto, se siguieron las siguientes reglas para clasificar los residuos de sitios activos como catalíticos. 1. Participación directa en el mecanismo catalítico, p. Ej. Como un nucleófilo. 2. Ejercer un efecto sobre otro residuo o molécula de agua que esté directamente involucrado en el mecanismo catalítico que ayuda a la catálisis (por ejemplo, por acción electrostática o ácido-base). 3. Estabilización de un intermedio de estado de transición propuesto.
4. Ejercer un efecto sobre un sustrato o cofactor que ayude a la catálisis, p. polarizando un enlace que se va a romper. Incluye efectos estéricos y electrostáticos. Los residuos que se unen al sustrato, cofactor o metal no están incluidos, a menos que también realicen una de las funciones enumeradas anteriormente. Análisis de residuos La accesibilidad a los disolventes se calculó utilizando NACCESS, tomando la molécula biológica como se define en la literatura o PQS, 11 en presencia y ausencia de ligandos (ya sea el sustrato verdadero o un análogo de sustrato). Las hendiduras enzimáticas se derivaron utilizando SURFNET.12 Los factores de temperatura (factores B) se tomaron del archivo PDB para cada átomo en un residuo y luego se promediaron sobre el resto del residuo. Para excluir las variaciones entre proteínas, los factores B para cada proteína se normalizaron luego sobre toda la proteína, dando un factor B entre 0 y 1 para cada residuo. Se eliminaron los modelos de RMN para esta parte del análisis. Las secuencias homólogas de la base de datos no redundantes (NRDB, una base de datos de secuencias de proteínas mantenidas por NCBI)
se identificaron para cada enzima utilizando el programa de búsqueda de perfil iterativo PSIBLAST, 13 que permitió un máximo de 20 iteraciones para alcanzar la convergencia. El umbral de evaluación para la inclusión de nuevas secuencias se estableció de forma conservadora en 10240, con el fin de minimizar la desviación del perfil, pero maximizar la detección de homólogos remotos.
El perfil se usó como alineación múltiple para evaluar la conservación de residuos catalíticos, utilizando el método de Valdar y Thornton.14 Este método utiliza similitudes de residuos de aminoácidos inferidas de una matriz de datos de mutación tipo Dayhoff15 para evaluar la diversidad de residuos de aminoácidos en una línea dada posición. En esta parte del análisis, solo se incluyeron aquellas enzimas cuya alineación tuvo una puntuación de diversidad de puntaje (DOPS) superior a 90.
El DOPS es una medida del número de permutaciones distintas de las puntuaciones de residuos, según la entropía de Shannon.16 Cuanto mayor es la DOPS, más diversa es la alineación, lo que proporciona una puntuación de conservación más discriminatoria. El
enlace catalítico del residuo catalítico se investigó utilizando HBPlus.17 El ambiente de la estructura secundaria de los residuos catalíticos se analizó utilizando PROMOTIF.18 Función de residuos Existen muchas complicaciones al asignar la función de un residuo catalítico, debido a la naturaleza de múltiples etapas de las reacciones químicas. Un residuo puede desempeñar más de un papel y puede involucrarse en diferentes pasos de la reacción. Inevitablemente, los mecanismos catalíticos solo se pueden modelar adecuadamente mediante métodos mecánicos cuánticos, y los diagramas de "flechas curvas" son solo una representación esquemática. Los términos estándar de la química orgánica para el papel que desempeña un residuo en un mecanismo catalítico pueden ser ocasionalmente ambivalentes, por ejemplo, el papel de histidina en el primer paso del mecanismo de la serina proteasa y en el mecanismo de la adenilosuccinato liasa, químicamente hablando, los mismos residuos realizan la extracción de protones (ver Figura 2). Sin embargo, el efecto en la adenilosuccinato liasa está en el sustrato mismo, mientras que en las serina proteasas, el efecto está en otra proteína. Residuo directamente involucrado en la reacción. En la clasificación propuesta en este documento, el residuo de histidina en la serina proteasa se describe como cebado de otro residuo en el primer paso, mientras que en la adenilo-succinato liasa, el residuo de histidina se describe como una base. Además, algunos residuos lograrán la misma función (por ejemplo, reducir el pKa de otro residuo catalítico) por diferentes medios (por ejemplo, mediante una acción directa ácido-base, o aumentando la carga efectiva en la localidad), por lo que es más significativo agrupar estos juntos La resistencia catalizadora identificada por lo tanto, las cuotas se han agrupado en las clasificaciones que se muestran en la Tabla 2. Algunos residuos pueden realizar más de una función en un paso de reacción particular, pero la clasificación más funcionalmente informativa se elige como la clasificación principal. Por ejemplo, si durante el curso de una reacción, un residuo actúa como una base y desprotona un sustrato, y luego el sustrato continúa realizando un ataque nucleofílico sobre otro sustrato, entonces se elige la clasificación "sustrato activo" en lugar de "ácido - base".
Los grupos pueden clasificarse ampliamente en dos clases: primaria y secundaria. Los grupos primarios, ácido / base, nucleófilo y estabilizador del estado de transición, están a la vanguardia de la reacción química que realiza la enzima. Los residuos que activan el sustrato, el agua, el cofactor o el cebado de otro residuo se pueden considerar como residuos catalíticos secundarios, importantes para "configurar" la reacción.
Resultados Descripción del conjunto de datos Hay 178 enzimas en el conjunto de datos, y 615 Residuos catalíticos, dando a cada enzima un promedio de 3,5 residuos catalíticos. Una descripción funcional del conjunto de datos viene dado por la rueda EC (ver Figura 3 (a)). La rueda EC es una representación visual de Todos los números de EC cubiertos por el conjunto de datos. Cada anillo en el gráfico circular concéntrico representa un nivel de la clasificación EC. La clasificación primaria (1er dígito) está representada por colores y el círculo más interno. La rueda EC para todas las enzimas. que han sido clasificados por la Comisión de Enzimas (CE) 7 se muestra en la Figura 3 (b) para comparación. Los dos conjuntos de datos tienen proporciones proporcionales similares
para cada clasificación de EC, aunque hay ligeramente menos hidrolasas (EC 3. –. – .–, 28% del conjunto de datos comparado con el 34% en general) y un poco más de liasas (EC 4. – .– .–, 16% del conjunto de datos comparado con el 11% en general) en nuestro conjunto de datos. Esto muestra que El conjunto de datos es una representación razonable de todos Funciones enzimáticas conocidas. La rueda de CATH (Figura 3 (c)) proporciona una descripción estructural del conjunto de datos, con la rueda de CATH para todas las proteínas en el PDB como una comparación (Figura 3 (d)). Un total de 262 de los 303 dominios de proteínas (86%) en el conjunto de datos se clasifica por completo en la base de datos CATH.
De estos, aproximadamente 2/3 de las enzimas en el conjunto de datos caen en la clase a / b de proteínas, con aproximadamente 1/6 en las clases principalmente a y b. Hay un pequeño número de enzimas con pocas estructuras secundarias. El predominio de las estructuras a / b es diferente de la distribución en todo el AP. Las clases principalmente a y principalmente b están subrepresentadas cuando se comparan con todas las proteínas en la PDB. Se ha sugerido previamente19 que la subrepresentación de una clase principalmente se debe al hecho de que, en las hélices, el potencial de enlaces de hidrógeno del grupo polar de la cadena principal se satisface completamente y estos grupos no están disponibles para las interacciones catalíticas. Se cree que los bordes de las hojas b son más accesibles para las interacciones con el sustrato y la maquinaria catalítica. El predominio de los pliegues a / b se debe en gran medida a la presencia del dominio de unión a nucleótidos en muchas enzimas, y se ha observado en análisis anteriores de pliegue / función19,20.
Distribución de frecuencias La Figura 4 muestra la distribución de frecuencia observada de los diferentes tipos de residuos catalíticos, en comparación con la de todos los residuos en el conjunto de datos. La tabla 3 los agrupa en tipos de residuos catalíticos. De estos, el 65% de los residuos catalíticos son proporcionados por el grupo cargado de residuos (H, R, K, E, D), mientras que el 27% de los residuos catalíticos provienen del grupo polar de residuos (Q, T, S, N, C, Y, W) y solo el 8% son proporcionados por el grupo de residuos hidrófobos. Esto es lo esperado: la catálisis involucra el movimiento de protones y electrones. y estabilización de carga, que necesita fuerzas electrostáticas proporcionadas por residuos cargados y / o polares. No hay correlación entre el porcentaje de abundancia en el conjunto de datos y la contribución a la catálisis.
La histidina constituye el 18% de todos los residuos catalíticos en las proteínas, aunque tiene un bajo porcentaje de abundancia general (2,7%). La histidina es particularmente adecuada para llevar a cabo pasos de reacción catalítica, ya que puede estar cargado o ser neutro a pH fisiológico y puede desempeñar el papel de nucleófilo, ácido, base o participar en la estabilización del estado de transición de una reacción.
Los residuos de aspartato y glutamato constituyen el 15% y el 11% de los residuos catalíticos, respectivamente. Su abundancia natural es casi idéntica (5.7% y 5.9%, respectivamente). Podría ser que aspartato el residuo está ligeramente favorecido sobre el resto de glutamato porque tiene una cadena lateral más corta por un grupo metileno, lo que hace que la cadena lateral sea menos flexible, por lo que podría mantenerse en su lugar, ayudando a la catálisis. La arginina y la lisina constituyen el 11% y el 9% de los residuos catalíticos, respectivamente. La arginina ocurre con más frecuencia a pesar de su menor abundancia natural en el conjunto de datos (4.9% para la arginina y 5.8% para la lisina). Esta preferencia puede deberse a los tres grupos de nitrógeno en la cadena lateral, todos los cuales pueden realizar interacciones electrostáticas, Reducido con solo uno en la cadena lateral de lisina. Además, dado que la cadena lateral de la arginina puede generar más interacciones electrostáticas, se puede colocar con mayor precisión para facilitar la catálisis. La cadena lateral de arginina también tiene una buena geometría para estabilizar un par de átomos de oxígeno en un grupo fosfato, un resto biológico común. La cisteína constituye el 5,6% de los residuos catalíticos, mientras que su abundancia natural es solo del 1,2%. Los puentes disulfuro identificados por PROMOTIF18 se agruparon por separado, por lo que solo la cisteína "libre" Los residuos se cuentan en el grupo de cisteína. En la catálisis están implicados cuatro residuos de cisteína formadores de puentes disulfuro, que se encuentran en la glutiltiona reductasa y en la proteína disulfuro isomerasa. Formación y escisión de un puente disulfuro. entre los dos residuos en glutatión reductasa forma parte del ciclo catalítico. Desestabilización del puente disulfuro en disulfuro de proteínas Se cree que la isomerasa es parte de la fuerza impulsora de la catálisis en esta enzima. La alta proporción de residuos catalíticos de cisteína destaca la importancia del grupo tiol en la catálisis. Su grupo 2SH se desprotona fácilmente a 2S2 ya que tiene un valor pKa de 9. De hecho, si se observa la propensión catalítica (o "catalítica") de cada depósito (la proporción de residuos catalíticos / proporción de todos los residuos para cada tipo de residuo, ver la Figura 5), la cisteína tiene la segunda catatricidad más alta detrás de la histidina. Estos dos residuos tienen los valores de pKa más cercanos al pH biológico de todas las cadenas laterales de residuos de aminoácidos, y esto puede explicar su alta catalítica. Las reacciones ácido-base son muy importantes en la catálisis enzimática: cuanto más fácil sea desprotonar y reprotonar un residuo, más rápido podrá realizar su función catalítica y mayor será el recambio de la enzima. Sin embargo, es bien sabido que los valores de pKa de cualquier residuo de aminoácido se pueden alterar del valor de la solución estándar cuando se entierran dentro de un entorno de proteína.23 Esta característica es a menudo importante en catálisis.
La Figura 5 muestra las propensiones catalíticas de los 20 residuos de aminoácidos. Los residuos de histidina y cisteína son los más propensos, seguidos del resto de los residuos cargados. El glutamato se mueve hacia abajo en el orden debido a su mayor abundancia en comparación con la arginina. Los residuos cargados son seguidos por los residuos polares. El triptófano es el noveno de los 20 residuos, una posición inusualmente alta. Se encuentra que la cadena lateral de triptófano es catalítica en solo nueve situaciones, sin embargo, su propensión aumenta por su Muy baja abundancia natural. Después de los residuos polares vienen el resto de los residuos hidrófobos y aromáticos, como se esperaba. Estos resultados son sorprendentemente similares a la distribución encontrada por Zvelebil y Sternberg5, cuyo conjunto de datos incluyó solo 17 enzimas y 36 residuos catalíticos. Las diferencias menores entre sus resultados y estos probablemente se deben a la diferencia en el tamaño de los conjuntos de datos respectivos. Interacciones de cadena lateral y cadena principal Es útil distinguir entre interacciones de cadena lateral y cadena principal, ya que para las interacciones de cadena principal la identidad del residuo a menudo es irrelevante. Para las interacciones de la cadena principal, solo están involucrados los grupos N – H y C=O, y cualquiera de los 19 residuos de aminoácidos (es decir, todos, excepto la línea) puede proporcionar esto. La Figura 6 muestra las propensiones catalíticas de los 20 residuos por cadena principal. La cadena lateral es utilizada por el 92% de los residuos catalíticos, mientras que la de la cadena principal es del 8%. De los que usan la cadena principal, el 82% usa el grupo N – H y el 18% usa el grupo C=O. Los grupos de la cadena principal a menudo estabilizan los intermedios del estado de transición, p. Gly30 en fosfolipasa A2. La glicina constituye, con mucho, la proporción más alta de residuos catalíticos que utilizan la cadena principal (44%). Se ve a menudo, como en la fosfolipasa A2, estabilizando los orificios de oxianión. La glicina es ideal para este rol debido al pequeño tamaño de su cadena lateral, que puede encajar fácilmente en cualquier espacio en la arquitectura del sitio activo. Sus grupos N – H y C=O son más accesibles que los de los residuos de aminoácidos más voluminosos, que a menudo están ocluidos por la cadena lateral o sus posiciones en la estructura secundaria.
Se ha sugerido previamente que los residuos de glicina proporcionan Flexibilidad necesaria para que los sitios de enzimas activas cambien de conformación. Para los residuos hidrófobos (M, F, L, I, G, A, P, V), el 81% de las interacciones involucran la cadena principal, con algunas excepciones notables (ver Tabla 4). Cuando las cadenas laterales de residuos hidrófobos se clasifican como catalíticas, su función a menudo es proporcionar un entorno neutro para aumentar el poder catalítico relativo de los restos cargados en la misma región, o ejercer una presión estérica sobre sustratos que disminuyen la energía del estado de transición de una reacción.
Estructura secundaria La Tabla 3 muestra la distribución de la estructura secundaria de los residuos catalíticos en comparación con todos los residuos en el conjunto de datos. La mayoría (50%) se produce en las regiones de la bobina (es decir, no en hélice o lámina), considerablemente más de lo esperado por casualidad. Se encuentran con frecuencias similares en a-hélices y hojas b (28% y 22%, respectivamente). Esto difiere de la distribución de todos los residuos, que tiene una proporción mucho mayor de residuos en un estado helicoidal. Un alto porcentaje de residuos de la cadena B se encuentran en una cadena del borde o al final de la cadena y, por lo tanto, están disponibles para interacciones catalíticas con Sustratos. Por otro lado, una fracción más grande de residuos es "interna" a la hélice, es decir, no en los extremos de la hélice, por lo que hay menos disponibles para interacciones
catalíticas. De hecho, el sitio activo de toda la familia de enzimas del barril TIM se encuentra en el extremo C-terminal de un barril b, con valores catalíticos al final de una hoja b o en los bucles que conectan las hojas b. Estos resultados difieren significativamente de los de Zvelebil y Sternberg, 5 que encontraron poca diferencia entre el entorno de la estructura secundaria de los residuos catalíticos y todos los residuos en su conjunto de datos. Este trabajo probablemente proporciona una mejor representación de la distribución debido al aumento en el tamaño del conjunto de datos.
Accesibilidad solvente La Figura 7 muestra la accesibilidad relativa al disolvente de los residuos catalíticos en comparación con los residuos polares y todos los residuos en el conjunto de datos, calculados en ausencia de ligandos. El 89% de los residuos catalíticos tienen una accesibilidad relativa a los disolventes (% RSA) en comparación con los residuos totalmente expuestos de menos del 30%. Encontramos aproximadamente el 50% de todos los residuos catalíticos en el rango de 0-10%, y aproximadamente el 25% en el rango de 10-20%. El 5% de todos los residuos catalíticos tienen 0% de RSA y están totalmente enterrados. Uno podría esperar encontrar todos los residuos catalíticos completamente expuestos en la superficie de la proteína, pero los resultados muestran que este no es el caso. La mayoría de los residuos catalíticos tienen exposiciones muy pequeñas al solvente. El factor principal podría ser la necesidad de un posicionamiento correcto y Restricción de la movilidad de residuos catalíticos.
Considerando la topografía de la superficie, encontramos que la mayoría de los residuos catalíticos se producen en una hendidura grande (ver Tabla 5). En 160
enzimas (90%), más de la mitad de los residuos catalíticos se encuentran en una de las diez hendiduras más grandes. De estas enzimas, casi todas tienen más de la mitad de sus residuos catalíticos en una de las tres hendiduras más grandes (151). El ambiente hendido disminuirá la respuesta dieléctrica efectiva en La región, que aumentará la estabilización de los estados de transición polar por los residuos cargados vecinos o iones metálicos. La unión del ligando sirve aún más para excluir el disolvente (Figura 8). De las estructuras en el conjunto de datos, 85 contienen sustratos unidos y / o análogos de sustratos y / o inhibidores (es decir, no siempre el ligando relacionado). La Figura 8 muestra la accesibilidad al disolvente de los residuos catalíticos en estas enzimas con y sin el ligando presente. Tras la unión del ligando, el porcentaje de residuos con 0 a 5% de accesibilidad relativa al disolvente aumenta del 27% al 72%.
Sin embargo, no podemos tener en cuenta ningún cambio en el dominio. Movimiento que se produce en la unión del sustrato. Solo podemos examinar la accesibilidad a los solventes de una estructura rígida con y sin el ligando presente. Las apoenzimas pueden tener residuos catalíticos expuestos que están enterrados debido al movimiento del dominio en el sustrato Unión.
Flexibilidad de residuos Los factores B en las estructuras cristalinas se utilizaron como medida de la flexibilidad del residuo. La Figura 9 muestra los factores de temperatura absolutos de los residuos catalíticos y todos los residuos en el conjunto de datos. Los residuos catalíticos tienden a tener factores B más bajos que todos los residuos, sugiriendo que deben mantenerse más rígidamente en su lugar que el residuo promedio. Residuos catalíticos en enzimas sin ningún ligando o cofactor Los presentes (182 residuos) son similares a los de todos los residuos catalíticos, pero tienen factores B
ligeramente más altos, lo que sugiere que los residuos catalíticos se vuelven un poco más "fijos" solo cuando el sustrato o El cofactor está atado. Las gráficas de factor B para tipos de residuos individuales se pueden ver en la Figura 10. Los residuos de arginina catalítica, lisina, aspartato y glutamato tienen factores B mucho más bajos que en promedio. La arginina podría tener uno o dos grupos de nitrógeno atados mientras los otros realizan la función catalítica. La lisina, que normalmente tiene una cadena lateral muy flexible, tiene que estar atada para la catálisis. Para los residuos de glutamato y aspartato, uno de los átomos de oxígeno de la El grupo ácido carboxílico se puede atar mientras que el otro realiza su función catalítica. La distribución de factores B para la histidina catalítica y Los residuos de cisteína son más similares a todos los residuos de histidina y cisteína. Esto podría deberse a que la mayor proporción de estos residuos son catalíticos.
Conservación Ciento diez enzimas en el conjunto de datos produjeron alineaciones de secuencias que eran adecuadamente diversas para un análisis de conservación significativo.
La conservación de residuos catalíticos en comparación con todos los residuos se muestra en la Figura 11 (a). Los residuos catalíticos son claramente más conservados que el residuo promedio. La Figura 11 (b) muestra la conservación de los residuos dentro de las esferas de 4 A, 8A y 12 A ̊ radio alrededor del centro de gravedad de los residuos catalíticos, y también la conservación de las cuotas ^ 4, 8 y 12 secuencia de posiciones lejos de cada residuo catalítico. La conservación de los residuos disminuye constantemente a medida que aumenta la distancia de los residuos catalíticos. Esto resalta las fuertes presiones de selección en los residuos catalíticos en comparación con otros residuos en la vecindad del sitio activo, lo que será importante para el reconocimiento del sustrato.
La catálisis eficiente depende del posicionamiento exquisito de los átomos críticos, que a menudo solo se puede lograr mediante el uso de residuos específicos de aminoácidos (por ejemplo, aspartato en lugar de glutamato). Adicionalmente, residuos estructuralmente próximos a residuos catalíticos están más conservados que los que están cerca en la secuencia de residuos de aminoácidos. Una advertencia es que los sitios activos de enzimas no son necesariamente esféricos, y la esfera también puede recoger algunos residuos del núcleo enterrado que se conservan porque son esenciales para mantener la integridad estructural de la proteína.
Enlaces de hidrógeno La tabla 6 muestra los enlaces de hidrógeno hechos por todos los residuos catalíticos. Los enlaces de hidrógeno a las moléculas de agua se excluyeron de esta parte del análisis, aunque estos a menudo son componentes críticos de la catálisis. De los 598 residuos catalíticos considerados, la mayoría (93%) entra en al menos una interacción de enlace de hidrógeno, ya sea como donante o aceptor. Esto demuestra que los residuos catalíticos tienen una libertad conformacional limitada. El 84% de los recursos hacen al menos un enlace de hidrógeno a través de su grupo N – H o C=O, mientras que el 75% de los residuos forman al menos un enlace de hidrógeno a través de un átomo de cadena lateral. Esto sugiere que generalmente la conformación del residuo está fuertemente atada tanto para la cadena principal como para la cadena lateral.
De los residuos que forman enlaces de hidrógeno a través de los grupos N-H o C=O, casi todos (97%) enlaces de hidrógeno a otro residuo en la proteína, y una muy pequeña proporción (8%) enlace de hidrógeno a un ligando. La mayoría de estos enlaces de hidrógeno probablemente serán necesarios para mantener la posición de los residuos catalíticos. De los residuos que forman enlaces de hidrógeno a través de átomos de cadena lateral, casi todos (94%) enlaces de hidrógeno con otros residuos de aminoácidos en la proteína. Una proporción relativamente pequeña forma un enlace de hidrógeno con un ligando (19%). En cuanto a los residuos individuales, una proporción significativamente mayor de los residuos de aminoácidos cargados positivamente, lisina y arginina, enlace de hidrógeno a un ligando (38% y 51%, respectivamente) en comparación con los residuos de aspartato y glutamato de aminoácidos cargados negativamente (13% y 12%). %, respectivamente). Esto es posiblemente debido al hecho de que muchos metabolitos están cargados negativamente. Que muchos metabolitos tienen carga negativa. Fosforilado Los compuestos como la glucosa son un mecanismo por el cual se pueden retener dentro de la célula. Todos los residuos que participan en la catálisis a través de sus grupos de cadena principal forman enlaces de hidrógeno con la proteína (94%) o con el ligando (41%). De nuevo, estos residuos tienen conformaciones ancladas. Solamente El 21% forma enlaces de hidrógeno de cadena lateral, lo que refleja en parte el alto porcentaje de residuos de glicina, pero también la no participación de la cadena lateral en la catálisis.
Estructura cuaternaria / uso de dominio Casi todas las enzimas en nuestro conjunto de datos (159) tienen su sitio activo contenido dentro de una sola subunidad, con solo 19 de 178 enzimas (11%) que tienen residuos catalíticos en más de una subunidad de la enzima, es decir, el sitio activo se encuentra en la interfaz de dos subunidades. De estas 19 enzimas, 17 tienen residuos catalíticos divididos entre dos subunidades, mientras que solo dos tienen residuos catalíticos divididos entre tres subunidades.
Además, 108 de 178 enzimas (60%) tienen más de un dominio. De estos, 35 tienen residuos catalíticos divididos en más de un dominio. Sin embargo, como este análisis trata con residuos catalíticos y no con residuos que solo se unen al sustrato o ligando, este número probablemente sea una subestimación de las enzimas cuyo sitio activo se encuentra en una interfaz entre dominios y / o subunidades.
Funciones La Tabla 7 muestra la función del residuo catalítico como se define en la clasificación descrita anteriormente. De 615 residuos catalíticos, partes aproximadamente iguales participan en la estabilización de un estado intermedio de estado de transición propuesto, que afecta al agua / cofactor / otro residuo y actúa como un ácido / base (31%, 29% y 28%, respectivamente). Aproximadamente el 10% de los residuos activa el sustrato de alguna manera, mientras que el 7% de los residuos forma un intermediario covalente con el sustrato a través del ataque nucleofílico. Un número muy pequeño actúa como radicales o son Modificado para realizar su función. Poco más de la mitad de las enzimas en este conjunto de datos tienen al menos un residuo que estabiliza un estado de transición propuesto. El número real de residuos que realizan esta función en cada enzima puede variar de uno a seis. Típicamente
las enzimas tendrán 1–3 residuos actuando de esta manera. Solo tres enzimas usan seis residuos estabilizadores del estado de transición: pentaleneno sintetasa, 2haloácido deshalogenasa y adenilato quinasa. La pentaleneno sintetasa tiene que estabilizar un intermediario de carbocation cargado positivamente, así como un grupo saliente de pirofosfato cargado negativamente. El mecanismo de la 2haloácido deshalogenasa implica una etapa de hidrólisis del éster que produce un oxianión cargado negativamente Agujero, así como una cuna estabilizadora de haluro para el ion haluro saliente. El adenilato quinasa utiliza principalmente residuos cargados positivamente para estabilizar el estado de transición de la coordenada penta cargada negativamente que se produce durante la transferencia del grupo fosfato. Aproximadamente, la mitad de las enzimas en este conjunto de datos tendrán al menos un residuo que actúa como un ácido o base, mientras que el número real de residuos que realizan esta función varía de uno a siete. Solo una enzima usa siete residuos, esto es la aconitasa, que usa tres pares de iones diferentes para transferir protones al hidróxido para su eliminación como agua, así como una base para extraer un protón del sustrato. Las enzimas típicas usarán 1–2 ácido / base residuos. Casi el 60% de las enzimas en este conjunto de datos usa al menos un residuo para activar un agua, un cofactor u otro residuo. Por lo general, las enzimas usarán de 1 a 3 residuos de esta manera, pero hay excepciones que usan de cinco a seis residuos de esta manera. La fosfatasa ácida de alto peso molecular utiliza cuatro valores para alterar el pKa del nucleófilo involucrado en la reacción y un residuo para activar una molécula de agua para atacar el intermedio enzima-sustrato. El glutatión reductasa usa seis residuos, cuatro de los cuales están involucrados en facilitar la transferencia de hidruro de NADPH a FAD. Los otros dos son responsables de activar el nucleófilo de la cisteína. Un poco más del 20% de las enzimas tienen un residuo que activa el sustrato de alguna manera. El número de residuos que desempeñan este papel en cada enzima puede variar de uno a seis. Normalmente, 1–2 residuos realizarán este rol. Sin embargo, dihidrofolatoreductasa usa seis residuos de esta manera para poner tensión electrotrostática y estérica sobre el sustrato para que ocurra la reacción. Un cuarto de las enzimas en este conjunto de datos usa un nucleófilo, pero en cada una de estas enzimas solo hay un residuo nucleófilo. Una muy pequeña proporción de enzimas en este conjunto de datos emplean formación de radicales o modificación de residuos por catálisis. Por lo general, 1 o 2 residuos en cada una de estas enzimas desempeñan ese papel. Hay roles típicos para uno o dos residuos, por ejemplo, los nucleófilos son generalmente cisteína, serina y ocasionalmente aspartato (pero,
sorprendentemente, casi nunca los residuos correspondientes son la treonina y el glutamato; esto podría deberse a un aumento de volumen, ya que estos residuos tienen un carbono adicional en su cadena lateral, o posiblemente una mayor flexibilidad de la cadena lateral). El papel principal de la arginina es estabilizar el estado de transición, mientras que los residuos cargados negativamente aspartato y glutamato son típicamente ácidos / bases. El papel principal de la histidina es también como un ácido / base, que realiza más a menudo de lo esperado en promedio. La función más común para el grupo de residuos hidrófobos (G, F, L, M, A, I, P, V) es la estabilización de un estado de transición propuesto intermedio, generalmente pero no siempre a través de los grupos de la cadena principal.
Discusión Advertencias La clasificación de los residuos catalíticos que se presenta aquí depende de la extracción manual de información de la literatura primaria. La selección de residuos utilizada es, por lo tanto, tan completa como la literatura de la que se extrajo. Por ejemplo, si no se han identificado residuos estabilizadores del orificio de oxianión en una enzima que utiliza claramente un mecanismo similar a la serina proteasa, no se incluyeron en el análisis. La información en la literatura es, a su vez, dependiente de la exactitud y confiabilidad de los datos estructurales depositados en el PDB, y estudios de mutagénesis a partir de los cuales se deducen residuos y mecanismos catalíticos. No todos los conjuntos de datos se han clasificado completamente en CATH, y aunque se han hecho todos los esfuerzos para garantizar que el conjunto de datos no sea redundante, a medida que esos dominios parcialmente clasificados se clasifican completamente, pueden salir a la luz homologías no detectadas previamente. El análisis de la conservación de residuos catalíticos solo se pudo realizar en aquellas familias de enzimas cuyas secuencias, cuando PSI-BLAST, produjeron una alineación adecuadamente diversa (60% del conjunto de datos).
Conclusiones Este trabajo representa un análisis estructural y funcional de los residuos catalíticos enzimáticos a través de un conjunto de datos de 178 enzimas, elegidos usando los criterios estrictos descritos aquí. Los tipos de residuos catalíticos son limitados, con solo seis tipos de residuos (H, C, E, D, R, K) que representan el 70% de todos los residuos catalíticos. Sorprendentemente, el residuo de serina, generalmente considerado como un ejemplo típico de un tipo de residuo catalítico, no se incluye en este conjunto. Los residuos catalíticos tienen una exposición muy limitada al solvente (según lo define la accesibilidad relativa) a pesar de su polaridad. Se colocan
de manera muy precisa y se mantienen en su lugar, como lo demuestran sus bajos factores B y sus enlaces de hidrógeno. Casi todos los residuos catalíticos están unidos por enlaces de hidrógeno a través de grupos principales, y tres cuartos también a través de Grupos de cadenas laterales. Algunos de estos enlaces de hidrógeno serán importantes para mantener la integridad estructural del sitio activo, otros serán importantes en configuración de la reacción que realiza la enzima. A pesar de su aparente rigidez, los residuos catalíticos se encuentran a menudo en un entorno de bobina, y la gran mayoría se encuentra en una hendidura. Los residuos catalíticos están altamente conservados, al igual que su ambiente local de tres dimensiones. El entorno tridimensional local está más conservado que otros residuos cercanos en secuencia. La función de residuo catalítico más común es estabilizar un estado intermedio de transición propuesto. Las funciones primarias de residuos catalíticos (ácido / base, nucleófilos y estabilización del estado de transición) representan el 65% de todas las funciones de residuos catalíticos. Normalmente, el número de residuos que realizan una función en una la enzima varía de uno a tres, pero hay algunas enzimas que usan hasta seis o siete residuos para funciones como el estado de transición Estabilización, ácido / base, activación del sustrato y activación del agua, cofactor u otro residuo. Esto podría deberse en parte a la variación en el número de pasos involucrados en un mecanismo catalítico, pero también podría deberse a la variación en el número de residuos citados por los autores que tienen un papel funcional. Los residuos catalíticos son los más comúnmente encontrados confinado a una subunidad o dentro de un solo dominio. Sin embargo, el hecho de que casi un tercio de las enzimas en nuestro conjunto de datos tenga sus residuos catalíticos divididos en varias subunidades y / o dominios tiene implicaciones interesantes para la evolución de la enzima. Si se considera que la unidad básica de la estructura de la proteína es el dominio, ¿cómo evolucionó un sitio activo con residuos catalíticos divididos en dos o más dominios y subunidades? Una hipótesis es que la enzima primitiva tenía su maquinaria catalítica en un dominio, y catalizó el primer paso de una reacción. cación Los pasos posteriores pueden haber involucrado un proceso, que puede haber ocurrido naturalmente con el tiempo (por ejemplo, hidrólisis). Entonces, por casualidad, la enzima puede haber evolucionado otro dominio con residuos que estaban bien ubicados para acelerar estos procesos, o estabilizar intermedios, de modo que la enzima tuviera un recambio optimizado y una ventaja selectiva. Otra posible explicación es que ocurrió la evolución convergente de dos elementos funcionales diferentes en dos dominios distintos para formar una enzima con una función adaptada. Estos resultados proporcionarán una base heurística para predecir residuos catalíticos en enzimas de función desconocida y, con suerte, facilitarán una mejor comprensión de los mecanismos enzimáticos.