Ingeniería de Proteínas y Evolución Dirigida

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 8

Álvarez Fernández G, Bustos Jaimes I, Castañeda Patlán

C, Guevara Fonseca J, Romero Álvarez I, Vázquez Meza


H. (eds). Mensaje Bioquímico, Vol. XXXIV, 2010, 135-
141. Depto de Bioquímica, Fac de Medicina, Universidad
Nacional Autónoma de México. Cd Universitaria, México,
DF, MÉXICO. (http://bq.unam.mx/mensajebioquimico)
(ISSN-0188-137X)

INGENIERÍA DE PROTEÍNAS Y EVOLUCIÓN DIRIGIDA


Lorenzo Segovia1 y Mariana Peimbert2
1
Departamento de Ingeniería Celular y Biocatálisis, Instituto de Biotecnología, UNAM
2
Departamento de Ciencias Naturales, UAM-C
[email protected]

Resumen
La ingeniería de proteínas depende de información a priori, tanto a nivel estructural como
evolutivo. Sin estos parámetros es imposible diseñar cambios que permitan entender la relación
estructura función de una proteína. Para obviar esta limitación ha surgido una nueva técnica,
llamada evolución dirigida, la cual permite obtener un gran número de variantes las cuales son
subsecuentemente evaluadas ya sea por selección in vivo o por tamizaje in vitro. Esta técnica
imita a la evolución molecular ya que genera una gran cantidad de proteínas modificadas con
variabilidad genética enorme, las cuales son sometidas a selección a través de ciclos sucesivos
de mutación donde la propiedad que se busca es seleccionada hasta encontrar una proteína con
una mejor función en un periodo de tiempo relativamente corto.

Palabras clave: Ingeniería de proteínas, evolución molecular, evolución dirigida, PCR


mutagénico.

135
MENSAJE BIOQUÍMICO, Vol. XXXIV (2010)

Abstract

Protein engineering is dependent on the previous knowledge of both protein structure and
evolutionary history. Without these it is impossible to design changes that allow us to understand
structure and function relationships in proteins. To obviate this need a new technique has been
proposed, called directed evolution, that allows for the generation of genetic variability which is
latter selected for desired traits either in vivo or through in vitro screening procedures. This
technique imitates molecular evolution in the sense that it generates a great amount of genetic
variability, which is submitted to selection, also several incremental mutation and selection cycles
can be performed with concomitant increases in the desired property in a short time span.

Keywords: Protein engineering, molecular evolution, directed evolution, error-prone PCR.

Evolución molecular

La variabilidad genética es el motor de la evolución. La selección natural determina el


número de sobrevivientes de una población al seleccionar aquellas propiedades que les
confieren una mayor capacidad de adaptación. A nivel molecular, han surgido una enorme
cantidad de genes homólogos (i.e. que tiene un ancestro común) a través del proceso de
generación de variabilidad, los cuales codifican para proteínas adaptadas a los medios más
diversos y condiciones por demás extremas manteniendo la misma actividad catalítica. A través
de duplicaciones génicas dentro de un mismo genoma, han surgido genes nuevos los cuales han
acumulado mutaciones al grado de codificar proteínas estables con actividades distintas. Se
piensa que este último fenómeno ha sido clave en la aparición de las numerosas actividades
catalíticas existentes [1,2]. Existen varios mecanismos genéticos adicionales que permiten la
aparición de nuevas formas de proteínas. En particular, la recombinación génica produce nuevas
variantes que poseen propiedades provenientes de ambos donadores o incluso propiedades
totalmente nuevas.

Estructura tridimensional de proteínas

En los últimos 40 años se empezó a caracterizar la estructura tridimensional de las


proteínas, es decir, la descripción de la posición en el espacio de cada uno de los átomos que
componen a una proteína. Esta labor tan compleja es el fruto del desarrollo y adaptación de
técnicas, especialmente de cristalografía de rayos X, durante varias décadas. La solución de la
primera estructura de proteína tomó a Max Perutz más de 20 años. Hoy en día la solución de
una estructura nueva puede ocurrir en unos cuantos meses o incluso días, pero sigue
constituyendo un logro extraordinario dentro de la genómica estructural. En los últimos años se
ha logrado, asimismo, incorporar la técnica de Resonancia Magnética Nuclear (NMR) al arsenal
de herramientas para la determinación de estructuras proteicas. Como producto de estos
esfuerzos, ahora conocemos varios miles de estructuras tridimensionales independientes, con
las que podemos realizar estudios comparativos y derivar nociones generales sobre la
arquitectura de las moléculas y de su funcionamiento a un nivel atómico [3]. De esta manera,
estas estructuras permiten entender cuál es la participación de cada uno de los aminoácidos en
la catálisis de una enzima [4].

136
Segovia y Peimbert

Ingeniería de proteínas

La evolución molecular y la estructura tridimensional de las moléculas son conocimientos


necesarios para realizar un trabajo de ingeniería de proteínas. Por una parte tenemos la
información de la variabilidad de cada residuo y por el otro la posición tridimensional y la
interacción con otros residuos en el espacio [1,4]. El ingeniero de proteínas diseña mutaciones
en los sitios donde cree que pueden tener un efecto sobre una función (la actividad catalítica) y
utiliza la información evolutiva para seleccionar el tipo de cambio que desea. Esto es un diálogo
que se establece interrogando la relación que guardan secuencia, estructura y función. La
ingeniería de proteínas depende del conocimiento a priori de una gran cantidad de información
estructural y evolutiva que no siempre está disponible. Además todavía no podemos hacer
predicciones razonablemente precisas sobre los efectos que tendrán mutaciones específicas en
las proteínas a nivel teórico. Una manera de poder lidiar con estas limitaciones ha sido
introduciendo mayor diversidad (mutaciones) en una o más posiciones, y utilizar técnicas más
simples para determinar rápidamente cuáles mutaciones generan proteínas con características
útiles o interesantes.

Así, en los últimos veinte años, se ha avanzando en lo que podemos definir


esquemáticamente como los dos enfoques para el estudio de proteínas con DNA recombinante:
la ingeniería de proteínas, y la evolución experimental o evolución dirigida. Todo ello,
naturalmente, acompañado de estudios teóricos que ayudan a enmarcar la naturaleza y la
dimensión del fenómeno. Hoy en día, como se mencionó anteriormente, se conocen sólo
algunos miles de estructuras de proteínas cuando se tiene registradas millones de secuencias
distintas de proteínas. Aunque existen técnicas cada vez más poderosas que permiten suponer
cuál es la estructura tridimensional correcta a partir sólo de la secuencia de aminoácidos, existen
un sin fin de secuencias proteicas de las cuales no se tiene una idea clara de cuál pueda ser su
estructura, ya sea por limitaciones experimentales o por falta de capacidad y de tiempo para
determinarlas.

Evolución dirigida

Una de las lecciones de la Evolución es que la solución está en los números y en el azar.
Utilizando técnicas de generación de variantes al azar, como por ejemplo con reacciones de
PCR donde se induce la aparición de mutaciones al cambiar las condiciones de reacción, se
pueden obtener librerías de variantes las cuales pueden ser tamizadas o retadas para la
aparición de la propiedad deseada (figura 1) [5,7].

Este principio de introducción de variabilidad acoplado a selección es, conceptualmente,


bastante sencillo. Desde el punto de vista práctico, sin embargo, existen limitaciones que han
evitado que se despliegue de manera significativa su tremendo potencial. Estas limitaciones se
presentan tanto en la generación de diversidad, como en los métodos de búsqueda y selección.
Hoy en día se han generado tanto técnicas que producen mutaciones puntuales como técnicas
que generan recombinaciones entre diferentes genes parentales o que presentan ambas
características [5-7]. Asimismo se han propuesto protocolos para la generación de variabilidad al
azar pero sólo en ciertas posiciones determinadas de antemano, de manera que se obtenga un
mayor número de mutantes potencialmente interesantes [8].

Este enfoque, pese a sólo ser una caricatura de la evolución natural, permite además
hacer evolución experimental en el laboratorio que nos permite analizar los porqués y cómos de
la historia natural de una familia de proteínas [9,10].

137
MENSAJE BIOQUÍMICO, Vol. XXXIV (2010)

Figura 1. Esquema de la evolución dirigida. Una secuencia puede ser sometida a


amplificación por PCR mutagénico o recombinativo. Los productos de estas reacciones
son clonados en vectores de expresión y transformados en una cepa bacteriana
apropiada, ya sea para selección o expresión. Las clonas son seleccionadas in vivo o por
tamizaje in vitro. Las clonas ganadoras son sometidas a ciclos sucesivos de evolución
dirigida hasta obtener el incremento deseado en la función buscada [5,6].

Evolución molecular experimental

La teoría de Evolución es precisamente eso, una teoría. Es una explicación a posteriori,


ya que sólo es un edificio conceptual que pretende explicar las observaciones hechas en la
naturaleza. Las numerosas inferencias producidas por los análisis evolutivos deben ser puestas
a prueba con un enfoque experimental que permita evaluar si son correctas. En ese sentido, se
han generado dos grandes líneas de investigación, una basada en la reconstrucción filogenética
de la historia evolutiva de algún gen particular, y la otra en la realización de experimentos
tendientes a reproducir algún paso evolutivo. Cabe resaltar que las principales limitaciones de
cualquier enfoque evolutivo experimental son primero el tiempo, ya que la evolución natural
transcurre a través de millones o miles de millones de años; y segundo, el tamaño de las
poblaciones, las cuales son en la naturaleza de órdenes de magnitud mayores.

Las secuencias ancestrales

Uno de los mitos de la evolución actual ha sido que las enzimas ancestrales deben de
ser poco eficientes, ya que suponemos que eran menos específicas catalíticamente. Sin
embargo, esta idea es producto de una serie de prejuicios en que imaginamos a las enzimas
ancestrales como a un troglodita molecular que arrastra sus nudillos. Para poner a prueba esta
idea, el grupo del Dr. Benner de la Universidad de Florida determinó la secuencia más probable

138
Segovia y Peimbert

del ancestro de las ribonucleasas del rumen de la vaca y construyó un gen sintético que la
codificaba. Cada una de las formas actuales tiene especificidades distintas para RNA de cadena
doble o sencilla y actividades óptimas a diferentes pH [11]. Una de las hipótesis del Dr. Benner
era que el producto del gen ancestral tendría una procesividad igual de mala en cualquier
condición. Sin embargo, la rebonucleasa ancestral mostró ser extremadamente activa contra
ambos sustratos y en las condiciones de pH más diversas. Contrariamente a lo que se pensaba,
este grupo demostró que la evolución no producía enzimas más eficientes y adaptadas a
distintos medios a partir de un ancestro general y poco procesivo, sino que genera formas
especializadas a partir de un ancestro general, pero que son extremadamente eficientes al
perder las características de amplio espectro [11].

Una derivación interesante de este tipo de trabajo ha sido el estudio de las propiedades
de una secuencia consenso en una familia de proteínas [9,12]. En este contexto, consenso se
entiende como una secuencia de aminoácidos que en cada posición tiene el residuo más común
en un alineamiento múltiple. Se ha mostrado en la literatura reciente que estas proteínas
consenso tienen propiedades extremadamente interesantes, como son una mayor estabilidad y,
en algunos casos, mayor amplitud en el espectro de sustratos que pueden utilizar [9,12]. Ésta es
un área en plena expansión que permite explicar por qué mutaciones aparentemente deletéreas,
ya que disminuyen la estabilidad de una proteína, son seleccionadas y mantenidas en la
población.

Aplicación de la evolución molecular

Una de las ventajas de la evolución dirigida es que en principio no se necesita ninguna


información a priori de la molécula. Sólo basta tener el gen con el que se piensa iniciar el
proceso y no es necesario tener información de su estructura. En particular, una propiedad como
la estabilidad no está determinada por cambios fácilmente predecibles, sino que es difusa a
través de la estructura y, por lo tanto, no se requiere conocerla. No obstante, como se detallará
más adelante, a veces será conveniente limitar la generación de mutaciones en algunos
residuos particulares, los cuales podrían estar involucrados en la propiedad que se busca
cambiar, como cuando está claramente localizada en el sitio activo de una enzima [8]. En este
caso, se deberá contar con la mayor información posible. El primer paso es conocer la secuencia
del mayor número de ortólogos (genes homólogos que cumplen el mismo papel en especies
distintas) posible para determinar la variabilidad de distintas zonas de las secuencias. Este tipo
de información nos permite identificar las zonas de menor variabilidad, las cuales están
frecuentemente asociadas al sitio activo o a zonas regulatorias. La manera más fácil es buscar
en bancos de secuencias utilizando técnicas bioinformáticas. Posteriormente, se construyen
alineamientos múltiples que muestran las zonas equivalentes en cada secuencia. Este enfoque
permite, en algunos casos, identificar secuencias homólogas de estructura tridimensional
conocida. Se pueden construir modelos relativamente precisos de la estructura tridimensional de
la enzima problema utilizando como molde una estructura homóloga. Esta información, a su vez,
permite dirigir la mutagénesis con mayor precisión y, por ende, eficiencia. En algunos casos
donde no existen homólogos de estructura conocida, también se puede identificar la estructura
de una proteína utilizando técnicas de hilvanado (threading en Inglés) para construir modelos
estructurales [13,14].

Generación de diversidad

Una proteína de E. coli tiene en promedio 319 aminoácidos. Existen 6,061 variantes de
mutaciones sencillas, 18 millones de variantes dobles, 36 mil millones de variantes con tres
319
cambios, y 19 variantes con cambios en todas las posiciones. Este último número es mayor al
número de partículas atómicas en el universo. Como se puede ver, sólo es posible analizar un
número extremadamente restringido de variantes en un experimento. Los mejores bancos de
139
MENSAJE BIOQUÍMICO, Vol. XXXIV (2010)

8
variantes que se pueden obtener habitualmente en un laboratorio tienen cerca de 10 variantes,
lo cual indica que sólo se podrían analizar todas las variantes con tres o menos cambios por
experimento [5]. Por otra parte, la comparación de secuencias indica que existen numerosos
casos de enzimas homólogas que tienen sólo 25% de identidad y sin embargo sus actividades
catalíticas son indistinguibles. En este sentido, la exploración de variantes en el laboratorio
podría ser extremadamente limitada en comparación con la realizada por la evolución natural.

Además, se ha observado que con las técnicas de mutagénesis puntuales empleadas


sólo se pueden obtener un promedio de cinco residuos distintos por posición. Para tratar de
remediar estas carencias se han seguido distintos enfoques más o menos exitosos. Por ejemplo,
se ha concentrado la mutagénesis a las zonas que en las que se piensa que deben estar los
residuos determinantes para obtener el resultado deseado. Se han generado estrategias de
combinación de bancos de variantes concentrados en distintas zonas de la proteína [8,15]. Sin
embargo, las técnicas basadas en la generación de mutaciones puntuales tienen limitaciones
importantes, por lo que se hace necesario desarrollar nuevas técnicas.

Métodos de selección y búsqueda

Los mejores métodos de obtención son aquellos que se basan en la selección directa de
las variantes deseadas, ya sea por complementación de mutantes carentes de esta actividad o
por conferir resistencia a algún antibiótico, entre otras. Sin embargo, estos casos son los menos,
ya que algunas de las actividades o propiedades deseadas no pueden ser seleccionadas in vivo
[16]. Por ejemplo, es prácticamente imposible si se busca una actividad enzimática que funcione
a más de 100°C y a un pH de 1, ya que son condiciones que muy rara vez se encuentran en la
naturaleza. En estos casos es necesario ensayar individualmente las propiedades bioquímicas
de cada una de las variantes, para lo cual se usa sistemas de tamizaje de alta densidad
robotizados (High Throughput Screening). En los mejores casos, estos sistemas pueden analizar
unas pocas decenas de miles de clonas, cuando en un sistema de selección directa se pueden
analizar millones de clonas. Existen también casos en los que las actividades deben ser medidas
con sistemas de cromatografía de gases o de HPLC, que limitan aún más el número de clonas
analizables [17]. Para tratar de evadir estas limitaciones, algunos grupos han utilizado sistemas
donde miden la catálisis de algún análogo. Desafortunadamente, han observado que con
frecuencia obtienen enzimas que han sido seleccionadas para mejorar sólo en las propiedades
necesarias con el análogo, no con el sustrato de interés, por lo que es un enfoque que hay que
utilizar con mucha cautela [17].

Referencias

1. Anantharaman, V., Aravind, L., and Koonin, E.V. (2003) Curr. Opin. Chem. Biol. 7, 12-20
2. Lang, D., Thoma, R., Henn-Sax, M., Sterner, R., and Wilmanns, M. (2000) Science 289,
1546-1550
3. Hennig, M., Sterner, R., Kirschner, K. and Jansonius, J.N. (1997) Biochemistry 36, 6009-
6016
4. Tuchscherer, G., Scheibler, L., Dumy, P. and Mutter, M. (1998) Biopolymers 47, 63-73
5. Stemmer, W.P. (1994) Proc. Natl. Acad. Sci. U.S.A. 91, 10747-10751
6. Zhao, H., Giver, L., Shao, Z., Affholter, J.A. and Arnold, F.H. (1998) Nat. Biotechnol. 16, 258-
261
7. Stemmer, W.P. (1994) Nature 370, 389-391
8. Peimbert, M. and Segovia, L. (2003) Protein Eng. 16, 27-35.
9. Joerger, A.C., Mayer, S. and Fersht, A.R. (2003) Proc. Natl. Acad. Sci. U.S.A. 100, 5694-
5699
10. Jurgens, C., Strom, A., Wegener, D., Hettwer, S., Wilmanns, M. and Sterner, R. (2000) Proc.
Natl. Acad. Sci. U.S.A. 97, 9925-9930
140
Segovia y Peimbert

11. Stewart, C.B. (1995) Nature 374, 12-13


12. Lehmann, M., Kostrewa, D., Wyss, M., Brugger, R., D'Arcy, A., Pasamontes, L., and van
Loon A.P. (2000) Protein Eng. 13, 49-57
13. Bennett-Lovsey, R.M., Herbert, A.D., Sternberg, M.J. and Kelley, L.A. (2008) Proteins 70,
611-625
14. Kelley, L.A. and Sternberg, M.J. (2009) Nat. Protoc. 4, 363-371
15. Saab-Rincon, G., Juárez, V.R., Osuna, J., Sánchez, F. and Soberón, X. (2001) Protein Eng.
14, 149-155
16. Umbarila, L.R. (2000) Desarrollo de un sistema de selección para la actividad de aldolasa.
Tesis Facultad de Química, UNAM. Cuernavaca.
17. Moore, J.C. and Arnold, F.H. (1996) Nat. Biotechnol. 14, 458-467

Semblanza del Dr. Lorenzo Patrick Segovia Forcella


Cursó la Licenciatura, la Maestría y el
Doctorado en Investigación Biomédica Básica
en la UNAM. Obtuvo el grado de Doctor en 1990
con Mención Honorífica y fue contratado como
Investigador Asociado en el Centro de
Investigación sobre Fijación de Nitrógeno de la
UNAM. Posteriormente realizó de 1992 a 1994
un entrenamiento posdoctoral en el laboratorio
de Estructura y Función de Proteínas del
Instituto Nacional del Ojo (NEI) de los Institutos
Nacionales de Salud de los EEUU (NIH) con
una beca Fogarty. Se reincorporó en 1994 al
Instituto de Biotecnología de la UNAM en la
categoría de Investigador Asociado. Desde
2006 es Investigador Titular B del departamento de Ingeniería Celular y Biocatálisis. Tiene el
nivel de PRIDE D y es miembro del SNI con la categoría II. El grupo del Dr. Segovia trabaja en el
estudio de la evolución y manipulación de la relación estructura-función de enzimas utilizando
tanto un enfoque experimental como bioinformático. Entre sus aportaciones destaca una de las
primeras migraciones catalíticas donde su grupo logró reproducir experimentalmente la aparición
evolutiva de una actividad enzimática. Asimismo ha trabajado sobre la evolución del metabolismo
utilizando herramientas bioinformáticas novedosas basadas en la teoría de redes. El Dr. Segovia
es autor de 28 trabajos de investigación originales los cuales han sido citados más de 1400
veces. Asimismo ha publicado dos artículos de divulgación en revistas de muy alto impacto. Ha
publicado 14 capítulos en libros tanto de divulgación como de investigación. Ha sido invitado a
presentar en numerosos congresos internacionales y ha participado como organizador en cuatro
Congresos Internacionales. Prestó además dos asesorías técnicas a la compañía Diversa Inc. ,
San Diego, EEUU en 2001 y 2003. El Dr. Segovia es miembro de la Protein Society de los EEUU
y de la Academia de Ciencias de Morelos. Es Consejero Investigador por el Instituto de
Biotecnología ante el Consejo Universitario y el Consejo Técnico de la Investigación Científica de
la UNAM.

141
MENSAJE BIOQUÍMICO, Vol. XXXIV (2010)

142

También podría gustarte