8 3 0 0 0
8 6 6 5 5 3
Nueva Nueva Genética
1 1 4 8 7 7 9
6,50 EURO
o i r
ADN 4 Topoisomerasas de ADN de tipo II Joaquim Roca
14 Microsatélites de ADN E. Richard Moxon y Christopher Wills
20 Micromatrices de ADN Stephen H. Friend y Roland B. Stoughton
a m u S
ARN 28 MicroARN César Llave
36 Interferencia de ARN Nelson C. Lau y David P. Bartel
EPIGENETICA 44 El genoma oculto W. Wayt Gibbs
51 El nacimiento de la epigenética W. Wayt Gibbs
58 La evolución codificada
Stephen J. Freeland y Laurence D. Hurst
66 Importancia del contexto en la genética H. Frederik Nijhout
GENOMA HUMANO 74 Los comienzos de la industria
del genoma humano Kathryn Brown
79 La fiebre bioinformática Ken Howard
84 El cromosoma de la masculinidad Karin Jegalian y Bruce T. Lahn
90 Genética e historia de las poblaciones
del norte de Africa y la península Ibérica E. Bosch, F. Calafell, S. Plaza, A. Pérez-Lezaun, D. Comas, J. Bertranpetit
ADN
)
N D A e d a n e d a c
( A IM H S A R A N O M O T );
o d n fo (
A C O R M I U Q A O J
Topoisomerasas de ADN de tipo II Mediante cortes momentáneos en las cadenas del ADN las topoisomerasas de tipo II modulan la torsión de la molécula y eliminan los anudamientos que se generan en la doble hélice durante los procesos de actividad genética Joaquim Roca
C
uando en los años cincuenta se descubrió la estructura del ADN, el soporte de la información genética pasó a ser un objeto tangible. La complementariedad entre las bases nucleotídicas de las cadenas que forman la doble hélice de ADN y la elucidación del código genético escrito en la secuencia de dichas bases establecieron los fundamentos de la biología moderna. Desde entonces, se ha trabajado sin descanso en los mecanismos moleculares implicados en la replicación, transcripción, recombinación y reparación del ADN. Queda por averiguar la modulación de esos procesos y su integración con otras funciones de la vida celular. En este ámbito, uno de los aspectos de mayor repercusión biológica lo ofrece la estructura del ADN: su organización espacial y su topología. La doble hélice de ADN tiene un diámetro de 2 nanómetros (dos milmillonésimas partes de un metro), pero su longitud puede abarcar varios centímetros si se trata de una molécula con millones de bases nucleotídic as. Tal disparidad entre diámetro y longitud del ADN nos adelanta ya cuán condensado se halla en el interior celular, donde forma los cromosomas. En cada cromosoma, la longitud del ADN se comprime diez mil veces, lo que equivale a recoger en nuestro puño un finísimo hilo de un kilómetro de largo.
La condensación del ADN está determinada mediante precisos mecanismos moleculares. La doble hélice se retuerce sobre sí misma una y otra vez dibujando hélices y tejiendo fibras cada vez más complejas. De un modo paralelo se agrupan, entre sí, segmentos de ADN distantes varios miles de pares de bases para formar grandes asas o lazos. 4
Zarcillos
Además de mantenerse unidas por el apareamiento de las bases nucleotídicas, las dos cadenas de la doble hélice de ADN se enroscan en zarcillos muy cerrados. Cada cadena gira en sentido dextrógiro alrededor de la otra con un paso de hélice cercano a 3,4 nanómetros, lo que implica 10,5 pares de bases en cada giro aproximadamente. El grado de enzarcillamiento se expresa mediante el número de enlace, un parámetro topológico
cuyo valor aumenta una unidad cada vez que una cadena completa un giro alrededor de la otra. Así, por cada mil pares de bases el número de enlace entre las cadenas del ADN adquiere un valor cercano a cien. La enorme longitud del ADN, junto al intenso enroscamiento de las cadenas de la doble hélice, genera constantes problemas topológicos dentro del minúsculo espacio celular. Así, durante su replicación, las dos cadenas de ADN de cada cromosoma deben
A C O R M I U Q A O J
1. LA EXISTENCIA DE MOLECULAS DE ADN circulares se conoce por microscopía electrónica desde los años sesenta. Curiosamente, se observa que muchas de esas moléculas se encuentran retorcidas sobre sí mismas ( izquierda ). Adoptaban una estructura similar a la de un tubo de goma cuando, antes de unir sus extremos, hacemos girar varias veces uno de ellos. Hoy sabemos que este exceso de torsión o superenrollamiento ocurre en todas las moléculas de ADN en el interior de las células. Ello es debido a que el número de enlace entre ambas cadenas de la doble hélice presenta en promedio un déficit del 5 %. Las topoisomerasas son capaces de eliminar esa torsión mediante cortes momentáneos en segmentos del ADN, entre los cuales provocan el paso de otros segmentos. La repetición de este proceso permite recuperar el valor normal del número de enlaces y el ADN queda más relajado ( derecha ).
TEMAS 38
a
A C O R M I U Q A O J
b
a OH
G T
OH
b
T
O O-P=O O–
G
OH-3'
3'-HO
O– O=P-O O
c
+ ATP
G O O=P-O O– 3'-HO
OH-3' O– O=P-O O
desenlazarse del todo, para condensarse de nuevo en cromosomas independientes; lo que requiere reducir a cero el número de enlace entre las cadenas de ADN en el cromosoma original. De no ser así, al terminar la replicación, las nuevas moléculas de ADN persistirían enzarcillada s o encadenadas entre sí. N UEVA GENÉTICA
2. LAS TOPOISOMERASAS DE TIPO II son enzimas homodiméricas. Transportan una doble hélice de ADN, o segmento T (en rojo ), a través de un corte transitorio en otra doble hélice de ADN, o segmento G ( en verde ). Para cortar ambas cadenas del ADN, la topoisomerasa ataca dos enlaces internucleotídicos separados por cuatro pares de bases ( A ). La escisión consiste en una transesterificación reversible; en el curso de la misma se forma un intermediario covalente entre el fosfato del extremo 5’ del ADN y un aminoácido tirosina en cada mitad de la enzima. En presencia de ATP, la topoisomerasa transporta otro segmento de ADN a través del segmento escindido. Si el segmento G y el segmento T residen en moléculas de ADN distintas, la topoisomerasa enc adenará o desencadenará dichas moléculas de ADN (B,a ). Si ambos segmentos se hallan en la misma molécula de ADN, la topoisomerasa producirá cambios en el grado de superenrollamiento ( b ) o de anudamiento (c ) de dicha molécula.
Superenrollamiento
En los años sesenta del siglo pasado se produjo un descubrimiento sorprendente en la topología del ADN. Se hallaron moléculas de ADN circulares. Retorcidas sobre sí mismas de una manera singular, recuerdan la figura de un tubo de goma cuando, al unir sus extremos, hacemos girar
varias veces uno de ellos. En el caso del ADN, este superenrollamiento es consecuencia de la torsión generada por un exceso, o por un defecto, del valor del número de enlace entre ambas cadenas de la doble hélice. Sabemos hoy que la torsión constituye un fenómeno ubicuo en el ADN intracelular, que presenta en pro5
A C O R M I U Q A O J
Y
ATP
DIMERO
400
TOPO II
1200
C
N
(Top2)
TOPO IV
N
C
(ParE)
Girasa
N
C
(GyrB)
3. CARACTER UBICUO DE LAS TOPOISOMERASAS de tipo II. Las encontramos en células eucariotas, procariotas y en numerosos virus. Cada mitad de la enzima consta de una o más subunidades, codificadas por genes independientes. En los eucariotas, las topoisomerasas de tipo II, o TOPOII, forman dímeros de una proteína de 170 kilodalton (unos 1400 aminoácidos) codificada por el gen Top2. En bacterias, las topoisomerasas de tipo II constituyen tetrámeros, integrados por dos pares de subunidades proteicas. Por ejemplo, en E. coli la TOPO IV es codificada por los genes ParE y
medio un déficit del 5 % en el valor de su número de enlace. En moléculas de ADN circulares, esta torsión no puede disiparse mientras no se produzcan cortes en las cadenas que permitan a sus extremos rotar libremente. En moléculas lineales de ADN de gran longitud, la torsión queda confinada a dominios discretos entre las estructuras que las mantienen condensadas. Los cambios de torsión y superenrollamiento generados en la doble hélice determinan la conformación local del ADN a lo largo del cromosoma; influyen de un modo notable en la transcripci ón y recombinación del genoma. La célula debe disponer de mecanismos para eliminar los encadenamientos y anudamientos generados en el ADN, así como para modificar el número de enlace de la doble hélice y modular, por ende, su grado de torsión y superenrollamiento. Tales mecanismos tendrían que operar cortando las cadenas del ADN para que las atravesaran otras cadenas, con la consiguiente restauración de la continuidad de las cadenas escindidas. Topoisomerasas
Si bien se esperaba que en ese delicado proceso modificador participaran varias actividades enzimáticas, 6
(ParC)
(GyrA)
ParC, y la girasa por los genes GyrB y GyrA. La estrecha homología en su secuencia de aminoácidos (zonas rectangulares ) nos revela que todas las topoisomerasas de tipo II guardan parentesco evolutivo y poseen estructuras muy similares. El dominio responsable de la unión e hidrólisis del ATP (en rojo ) ocupa la región amino terminal (N) de la enzima, mientras que el dominio principal de dimerización se halla cerca de la región carboxiterminal (C ). En la figura se indica la posición de la tirosina (Y) involucrada en el c orte y sellado del ADN.
en el transcurso de los años setenta se descubrió que las hoy denominadas topoisomerasas se bastaban para alterar la topología del ADN ( véase “Topoisomerasas de ADN”, por James C. Wang, en INVESTIGACIÓN Y CIENCIA , septiembre 1982). Dos rasgos distintivos caracterizan a esas enzimas. En primer lugar, pueden cortar y empalmar repetidamente los enlaces fosfodiéster que unen los nucleótidos constituyentes de las cadenas de ADN. En segundo lugar, permiten que otras cadenas de ADN pasen entre los dos cabos momentáneamente escindidos. Para evitar que los cabos del ADN escindido vayan a la deriva, las topoisomerasas los sujetan con firmeza, mientras otras cadenas de ADN los atraviesan. En el desempeño de esa tarea, las topoisomerasas utilizan la energía del enlace internucleotídic o escindido para unirse covalentemente al cabo 3’ o 5’ del ADN. Cuando empalman nuevamente el ADN, revierte esa unión covalente: restablecen el enlace internucleotídico inicial. La comparación de las propiedades catalíticas y de la secuencia de aminoácidos lleva a una clasificación de las topoisomerasas en tres tipos o grupos evolutivos distintos: topoisomerasas de tipo IA, topois omerasas d e tipo IB y topois omerasas d e tipo II.
Las topoisomerasas de tipo IA cortan y empalman cadenas aisladas de ADN; forman el intermediario covalente con el cabo 5’ del segmento escindido. Las de tipo IB cortan y empalman una de las cadenas en una doble hélice de ADN; establecen el intermediario covalente con el cabo 3’ de la cadena escindida. Por último, las topoisom erasas de tipo I I cortan y empalman ambas cadenas de una doble hélice simultáneamente, formando intermediarios covalentes con los cabos 5’. A diferencia de las dos primeras, las topoisomerasas de tipo II son enzimas homodi méricas, es decir, se constituyen con dos mitades idénticas; requieren ATP para su funcionamiento. Enzimas fascinantes
Resulta sorprendente que unas simples proteínas puedan cortar momentáneamente el ADN y sostener los extremos escindidos mientras transportan otro segmento de ADN a través de ellos. A este respecto, las topoisomerasas de tipo II provocan auténtica fascinación; téngase presente que, al cortar las dos cadenas de la doble hélice, ponen en continuo aprieto la integridad del genoma. Interesado por el mecanismo de acción de la s topoisomeras as de tipo II, me incorporé, en 1988, al laboratorio TEMAS 38
de James Wang en la Universidad de Harvard. Desde finales de los años setenta se conocía la actividad de estas enzimas. En varios tipos de células y bacterias se detectó una actividad enzimática, que en presencia de ATP y magnesio, era capaz de encadenar o anudar moléculas de ADN circulares , así como de alterar el número de enlace de la doble hélice de dos en dos unidades. Cuando se suspendía dicha actividad mediante detergentes o cambios bruscos de pH, se producían cortes irreversibles en ambas cadenas del ADN. No cabía duda de que las enzimas en cuestión
sas producen un encadenamiento o desencadenamiento entre tales moléculas. Si ambos segmentos, G y T, pertenecen a la misma molécula de ADN, las topoisomerasas alteran el número de enlace en dos unidades, en cada ciclo de transporte; de lo que resulta un cambio del grado de superenrollamiento o de anudamiento del ADN. Estas modificaciones topológicas condicionan el volumen, forma y rigidez de las moléculas de ADN; son, pues, fácilmente detectables en el laboratorio mediante técnicas de sedimentación o electroforéticas.
somerasas de tipo II guardaban un parentesco evolutivo y debían, por tanto, compartir los mismos rasgos estructural es y funcionales. Las topoisomerasas de tipo II son enzimas homodiméricas de un tamaño cercan o a 350 kilodalt on. Según el organismo, cada mitad de la enzima constará de una o más subunidades codificadas por genes independientes. Así, en levaduras, la mosca de la fruta o células humanas, es decir, en los eucariotas, las topoisomerasas de tipo II son dímeros de una proteí na de unos 170 kilodalt on (unos 1400 aminoácidos aproximada-
constituían un tipo de topoisomerasas que transportaban una doble hélice de ADN a través de un corte transitorio en otra doble hélice de ADN.
el transcurso de los años ochenta,En varios laboratorios purificaron topoisomerasas de tipo II procedentes de virus, procariotas y organismos eucariotas. En todos los casos, se manifestaba una estrecha semejanza en sus propiedades bioquímicas. Cuando se identificaron los genes codificantes de estas proteínas, la homología en su secuencia de aminoácidos reveló que todas las topoi-
mente). bacterias, las topoisomerasasEn de tipo II constituyen tetrámeros formados por dos pares iguales de subunidades proteicas, dos de 80 kilodalton y dos de 90 kilodalton. Por fin, en los virus bacterianos, esas enzimas son hexámeros integrados por tres pares de subunidades. El análisis de los cortes producidos en el ADN por las topoisomerasas de tipo II permitió d escubrir que
Segmento G, segmento T
Si la doble hélice cortada, o segmento G (de “gate” o puerta), y la doble hélice transportada, o segmento T, residen en moléculas de ADN distinta s, tal es topoisomera-
ATP
AMPPNP
NH2 N
O O O | | | O - P - O - P - O - P - O - CH | | | O O O H
C
2
O
N
C
N
NH2 N
N
O O O HC | | | O - P - N - P - O - P - O - CH 2 N | | | | O O H O O
HC CH
C C
C N
N CH
H OH
Hidrolizable
C
OH
A
No hidrolizable
B
OH
OH
C
AMPPNP
A C O R IM U Q A O J
4. LA UTILIZACION DE MOLECULAS ANALOGAS AL ATP resultó decisiva para entender el papel de este cofactor energético en el mecanismo de acción de las topoisomerasas de tipo II. Una de ellas es el AMPPNP, un imido derivado del ATP que no puede hidrolizarse. La unión del AMPPNP a las topoisomerasas de tipo II provoca un cambio de conformación: la enzima se convierte en unanillo proteico al-
N UEVA GENÉTICA
rededor del ADN. En moléculas de ADN circulares, la topoisomerasa queda así permanentemente anclada en la doble hélice, aunque puede deslizarse con libertad a lo largo de la mismaA(). Si el ADN es lineal, la topoisomerasa puede disociarse, o engarzarse de nuevo, a través de sus extremos B ( ). Sólo el ADN ubicado en el interior del anillo se halla expuesto a ser cortado por la topoisomerasaC ). (
7
A C O R M I U Q A O J
AMPPNP
G
T
a
b
e
d
c
5. CUANDO UNA TOPOISOMERASA DE TIPO II entra en interacción con un par de círculos encadenados a( ), la unión del AMPPNP provoca un episodio de transporte de ADNb(), que terminará por soltar los círculos (c ). Al final del proceso, el círculo utilizado como segmento G (en verde) permanece esposado por la topoisomerasa; el círculo utilizado como segmento T en ( rojo) queda libre fuera del
éstas se unían covalentemente al fosfato del cabo 5’ en cada cadena de la doble hélice mediante una tirosina. En el caso de la topoisomerasa de tipo II de la levadura Saccharomyces cerevisiae el aminoácido ocupa la posición 783. En nuestras investigaciones nos servíamos de esa enzima particular por razones prácticas: podíamos purificarla, entera o fragmentada, en gran cantidad y permitía la manipulación genética de su secuencia de aminoácidos. Iniciamos nuestros experimentos abordando uno de los aspectos funcionales más intrigantes de las topoisomerasas de tipo II: su utilización del ATP. La región responsable de la unión e hidrólisis de ATP se encuentra en los primeros 300 aminoácidos de la proteína. En ausencia de ATP o en enzimas con mutaciones en el sitio de unión para este cofactor energético, no cataliza el transporte del segmento T, si bien la topoisomerasa mantiene su capacidad para cortar y empalmar las cadenas del segmento G. Esti mamos qu e las topois omerasas de tipo II consumen dos moléculas de ATP en cada operación de transporte de un segmento de ADN, 8
anillo proteico (d ). Dado que el segmento G permanece unido a la enzima a lo largo del proceso, el segmento T debe ser capturado, transportado y expulsado del interior del anillo proteico por el lado opuesto al que ha entrado. Mediante la creación en el laboratorio de un enlace disulfuro en la compuerta de salida, puede bloquearse selectivamente la expulsión del segmento Te().
lo que sugiere que cada mitad de la enzima une e hidroliza una molécula de ATP. Función del ATP
Resultó interesante advertir que el consumo de ATP no dependía de que el transporte de ADN conllevara un aumento o una pérdida de energía libre en el estado topológico del ADN. La mayoría de las topoisomerasas de tipo II tienden siempre a simplificar la topología del ADN, llegando a alcanzar valores de equilibrio incluso por debajo de los impuestos por la fluctuación térmica; es decir, minimizan el superenrollamiento, desanudan y desencadenan con gran eficiencia las moléculas de ADN. La única excepción a este respecto la encontramos en la girasa de ADN. Como comentaré más adelante, la girasa es una topoisomerasa de tipo II especializada en reducir el número de enlace de la doble hélice; por tanto, sólo relaja el superenrollamiento positivo y genera superenrollamient o negativo en el ADN. El consumo de ATP de la girasa no deja de ser, sin embargo, similar al de otras topoisomerasas de tipo II.
Para estudiar la función del ATP en el proceso de transporte, fue clave la utilización de moléculas análogas al ATP que no pueden hidrolizarse o bien lo hacen con suma parsimonia. Ahora bien, cuando estos análogos se unen a la topoisomerasa, en vez del ATP, permiten a cada enzima realizar un solo ciclo de transporte de ADN. Basta, pues, la mera unión del ATP para desencadenar el transporte del segmento T. Además, la energía liberada por la hidrólisis del ATP debe utilizarse para regenerar la capacidad que tiene la topoisomerasa de iniciar un nuevo ciclo de transporte. En 1986, Neil Osheroff observó que la adición de AMPPNP, un análogo no hidrolizable del ATP, incrementaba enormemente la fuerza de unión entre las topoisomerasas de tipo II y moléculas circulares de ADN. Esta unión era resistente a altas concentraciones de sal, pero no se trataba de un enlace covalente, puesto que podía disolverse mediante la aplicación de detergentes. Paralelamente, en nuestro laboratorio, Janet Lindsley observó que el AMPPNP modificaba la sensibilidad de estas enzimas a determinaTEMAS 38
das proteasas. Cuando posteriormente realicé experimentos similares, comprobé que la unión del ATP o sus análogos a las topoisomerasas de tipo II producía un cambio en su conformación, de modo que la enzima se convertía en un toro o anillo proteico alrededor del ADN. A partir de aquí, sólo la hidrólisis del ATP permitía a la enzima recuperar su conformación inicial. Cuando el anillo estaba cerrado, podía deslizarse con libertad a lo largo del ADN, pero sólo se disociaba a través de sus extremos; por ello, en moléculas de ADN circulares la topoiso-
tanto, el diámetro interno del anillo debería ser inferior a ocho nanómetros, un tamaño insuficiente para franquear el paso a una doble hélice de ADN doblada sobre sí misma. Como únicamente el ADN ubicado en el interior del anillo era susceptible de ser cortado por la topoisomerasa, el centro de corte y sellado del ADN debía encontrarse en el perímetro interior de la enzima. ¿Qué relación hay entre los cambios estructurales, provocados por la unión e hidrólisis del ATP, con el proceso
se uniese primero al segmento T y, luego, al segmento G. En esta configuración, la topoisomerasa expulsaría al segmento T, a través del corte transitorio generado en el segmento G. Otra pos ibilidad sería que la en zima se uniera primero al segmento G y a continu ación al seg mento T, con lo que el proceso de transporte tendría que ir desde el exterior hacia el interior de la topoisomerasa. En este caso, la enzima se disociaría del segmento G en cada ciclo de transporte, para permitir la salida del segmento T de su interior, a no ser que el segmento T escapase del interior
merasa esposadaquedaba a la doblepermanentement hélice. Si el ani-e llo se formaba sin ADN en su interior, podía entonces enhebrar en él una molécula de ADN lineal y, luego, crear un círculo empalmando sus extremos. Sólo una molécula de ADN lineal podía enhebrarse a través del anillo; por
de transporte del ADN? Antes responder a la pregunta, había quede resolver otra cuestión: de qué modo una topoisomerasa de tipo II podía manipular los segmentos G y T durante el proceso de transporte. Se me presentaban varias opciones. Una posibilidad era que la enzima
de la topoisomerasa por un sitio distinto del que había entrado. Había pues tres mecanismos posibles: transporte del interior al exterior, transporte desde el exterior hacia el interior con una sola puerta de entrada y salida, o bien con puerta de entrada y salida distintas.
Proceso de transporte
A C O R M I U Q A O J
6. RECOMPOSICION DE LA ESTRUCTURA ATOMICA de las topoisomerasas de tipo II a partir de dos fragmentos de estructura conocida. El primer fragmento en ( rojo), de 43 kilodalton, comprende los primeros 398 aminoácidos de la subunidad B de la girasa de E. coli. El segundo fragmento (en amarillo y azul), de 92 kilodalton, abarca los aminoácidos 410 a 1202 de la TOPO II de la levadura S. cerevisiae. El fragmento de 43 kilodalton es el dominio que dimeriza modulado por la unión e hidrólisis del ATP, mientras que el fragmento de 92 kilo-
N UEVA GENÉTICA
dalton posee los dominios responsables delcorte y sellado del ADN; muestra éste en la parte inferior de su estructura la principal región de dimerización de la topoisomerasa. El panel de la izquierda ofrece la representación atómica completa; el de la derecha,el plegamiento de las cadenas de aminoácidos. Se distingue la posición en el interior de las tirosinas en ( rojo) involucradas en el corte y sellado del ADN, así como la ubicación del ATPen ( verde) que estabiliza la dimerización del dominio amino terminal de la enzima.
9
7. CONOCIDA LA ESTRUCTURA ATOMICA de la principal región de dimerización de la topoisomerasa, fue posible crear mediante ingeniería genética un enlace disulfuro en esa zona. Para ello se sustituyó el aminoácido lisina de la posición 1127 y el aminoácido asparagina de la posición 1043 por cisteínas. La formación de un enlace covalente entre los átomos de azufre de las cisteínas, así creadas entre ambos lados del dímero, bloqueaba la salida del segmento T del ADN. Este enlace covalente podía eliminarse mediante oxido-reducción y en este caso el segmento T era capaz de salir del interior de la topoisomerasa. Este experimento demostraba inequívocamente que el segmento T del ADN cruzaba totalmente las dos mitades de la topoisomerasa durante cada ciclo de reacción.
A C O R M I U Q A O J
Para descubrir cuál de los modelos era correcto, analicé la interacción entre la topoisomerasa y mezclas de ADN circulares de distinto tamaño. Al añadir AMPPNP para provocar un ciclo de transporte en cada enzima, algunos de los círculos de ADN inicialmente unidos a la topoisomerasa se encadenaban en un segundo grupo de círculos. Observé que los segmentos G y T habían de estar presentes antes de que se produjera el cambio conformacional de la topoisomerasa, ya que los círculos añadidos posteriormente al AMPPNP nunca se agregaban a la cadena. Con estos experimentos se concluía que el segmento G era el primero en unirse en el interior de la topoisomerasa y no el segmento T. Asimismo, se sug ería que la con formación en anillo generada por la 10
unión del análogo de ATP servía para capturar el segmento T, llevándolo desde el exterior hacia el interior de la enzima, en donde era transportado a través del segmento G. Si realizaba esos experimentos con una topoisomerasa incapacitada para transportar ADN, debido a una mutación en las tirosinas del centro de corte, la enzima seguía uniendo al segmento G en su interior, pero el segmento T no quedaba capturado al cerrarse el anillo. De lo que se desprendía que el proceso de captura y el de transporte se hallarían estrechamente acoplados. ¿Qué ocurre una vez que el segmento T ha cruzado el segmento G? Para averiguarlo construí moléculas de ADN circulares encadenadas por pares y uní una topoisomerasa a cada
pareja de círculos. La adición de AMPPNP pr ovocaba entonces un evento de transporte en cada topoisomerasa, que resultaba en la liberación de su pareja de círculos. Observé que, una vez desencadenados, el círculo utilizado como segmento T siempre aparecía libre fuera del toro proteico; en cambio, el círculo utilizado como segmento G permanecía esposado por la topoisomerasa. De ello se infería que, e n cuanto el segmento T era capturado y transportado, se expulsaba de inmediato del anillo proteico. Dado que el segmento G seguía unido a la topoisomerasa durante todo el proceso, el segmento T debería forzosamente salir de la enzima por el lado opuesto por el que había entrado. Llegué así a la conclusión de que las topoisomerasas de tipo II funcionaban mediante un mecanismo de dos compuertas: una de entrada y otra de salida. El mecanismo de apertura y cierre de la compuerta de entrada estaría modulado por el uso de ATP. Por su parte, la compuerta de salida actuaría a modo de válvula de escape. Una vez la topoisomerasa se unier a a un segmento G, el enlace del ATP provocaría el cierre de la compuerta de entrada, lo que permitiría capturar el segmento T. El s egmento T viajarí a entonces entre las dos mitades de la enzima, cruzando en su trayecto el corte transitorio en el segmento G. Terminaría expulsado por el lado opuesto, a través de la fugaz apertura de la compuerta de salida. Pese a su demostración experimental, el modelo de dos compuertas fue recibido con cierto escepticismo. Niega este mecanismo que exista ningún contacto permanente entre las dos mitades de la topoisomerasa, tesis que parecía muy arriesgada, habida cuenta de que, cuando la topoisomerasa corta el ADN, cada mitad de la TEMAS 38
enzima tiene que sujetar uno de los cabos del ADN escindido. No obstante, la validez de nuestro modelo se confirmó en cuanto se conoció la estructura tridimensional de las topoisomerasas de tipo II. Estructura tridimensio nal de la enzima
En 1991, Anthony Wigley, de la Universidad de Leicester, cristalizó y representó la estructura tridimensional de los primeros 398 aminoácidos del extremo amino terminal de la subunidad B de la girasa de la enterobacteria Esch erichia coli . En fragm ento 43 kiloda lton, queeste se conserva en de todas las topoisomerasas de tipo II, se encuentra la región responsable de la unión e hidrólisis del ATP. Los intentos iniciales de obtener la cristalización exclusiva del fragmento en cuestión fracasaron. Pero no tardó en demostrarse que, si se añadía AMPPNP, el fragmento formaba un dímero tenaz, que cristalizaba con facilidad. La estructura del dímero revela que los tres fosfatos del AMPPNP (o ATP en su caso) coordinan la posición de varios aminoácidos involucrados en la dimerización del fragmento. Esta estructura sugería que la unión y la hidrólisis de ATP modulaba la dimerización y separación entre los extremos amino terminal de la enzima; lo que, en el marco de nuestro modelo, debería constituir la compuerta de entrada de la topoisomerasa. En 1994, James Berger y Stephen Harrison, en nuestro departamento de Harvard, cristalizaron y obtuvieron la estructura de un fragmento notable, que comprendía los aminoácidos 410 a 1202 de la topoisomerasa tipo II de S. cerevisiae . La estructura de este fragm ento de 92 kilodalton aportó valiosa información: contenía las tirosinas en posición 783 que intervenían en el corte y sellado del segmento G; incluía la región principal de dimerización de la topoisomerasa, que, de acuerdo con nuestro modelo de dos compuertas, debería ser cruzada en algún momento por el segmento T; por último, este fragmento complementaba al dominio amino terminal resuelto anteriormente, de modo que una estructura compuesta por ambos fragmentos poseía toda la capacidad funcional de una topoisomerasa de tipo II. El fragmento de 92 kilodalton cristalizó en la forma de un d ímero toroidal de 12 12 5,5 nanómetros, cuyo hueco interior tenía un diámetro medio de 5 nanómetros. Cada protómero con×
×
N UEVA GENÉTICA
tacta su pareja por arriba a través de la región amino terminal y, con mayor amplitud, a través de la región carboxi terminal por abajo, lugar que corresponde a la principal región de dimerización de la topoisomerasa. En la región amino terminal se perfila una hendidura rica en cargas positivas, que cruza el dímero transversalmente y en cuyo interior protruyen las tirosinas involucradas en el corte y sellado del ADN. De todo ello se desprendía que el segmento G se acomoda a lo largo de dicha hendidura. Sin embargo, la distancia entre las tirosinas era aquí superior a la necesaria
Posteriormente, se obtuvieron cristales de este fragmento, en los que las tirosinas aparecían a la distancia esperada para realizar el corte del segmento G, lo que conlleva una importante reducción del diámetro de la cavidad central. La aproximación y separación de las tirosinas se explican por la flexibilidad de la principal región de dimerización de la topoisomerasa.
para la topoisomerasa pudiera cortarque ambas cadenas de una doble hélice simultáneamente. Por ello, se concluyó que este fragmento había cristalizado en la conformación correspondiente al momento en que la topoisomerasa ha cortado y separado los cabos del segmento G.
conectar el extremo carboxi terminal del dominio de 43 kilodalton c on el extremo amino terminal del fragmento de 92 kilodalton, ali neando los ejes de simetría de ambos dímeros. La estructura resultante concordaba con la que habíamos anticipado por medios bioquímicos. Permitía, ade-
Un primer modelo físico
Podíamos ya esbozar un primer modelo físico de una topoisomerasa II con capacidad funcional. Bastaba con
A C O R IM U Q A O J
ATP
ADP + P a
d
b
c
8. EL CONJUNTO DE INFORMACION ESTRUCTURAL Y FUNCIONAL permite esbozar un modelo de una topoisomerasa tipo II activo. Cuando la topoisomera sa interacciona con el ADN, acomoda primero en su rojo interior segmento ( verde ) y queda a la espera de de los la aparición del segmento T (en ) (A ).alLa unión delGen ATP provoca la dimerización dominios amino terminales en ( púrpura); el cierre de esta compuerta captura al segmento T hacia el interior de la enzima B( ). En su trayecto, el segmento T se abre paso a través del corte producido en el segmento G y alcanza la cavidad central de la topoisomerasa. Al sellarse de nuevo el segmento G, se estrecha el diámetro de la cavidad central; el segmento T se ve entonces forzado a salir de la misma cruzando la principal región de dimerización de la enzima (C ). Una vez la compuerta de salida ha vuelto a cerrarseD(), la hidrólisis del ATP permite a la topoisomerasa adquirir su configuración inicial para empezar un nuevo ciclo de transporte de ADN.
11
A C O R M I U Q A O J
9. LA GIRASA es una topoisomerasa de tipo II. Una vez se une al segmento G, dobla el ADN en sentido dextrógiro; con ello se apropia del segmento T que debe transportarse. Esa es la causa de que la girasa utilice siempre segmentos G y segmentos T ubicados en la misma molécula de ADN y transporte unos a través de otros en el mismo sentido. De ese modo, la enzima sólo puede eliminar la superhelicidad positiva (+) y generar selectivamente superhelicidad negativa (–) en el ADN. Al margen de su especialización, la girasa funciona y consume el ATP igual que cualquier otra topoisomerasa de tipo II.
su camino al segmento G. Alcanzada la posición, el segmento T sólo salía del interior del anillo proteico cuando revertían los enlaces covalentes que impedían la fugaz apertura de la principal región de dimerización. Girasa de ADN
(+)
más, modelar a la perfección el mecanismo de dos compuertas. En efecto, antes de unirse al ADN, la topoisomerasa tendría una conformación abierta en forma de “v”, con la principal región de dimerización ubicada en el vértice y sito cada uno de los dominios de unión del ATP en la punta de las aristas. Al interaccionar con el ADN, la topoisomerasa acomoda primero en su interior al segmento G; queda a la espera de que un segmento T se aprox ime a la co mpuerta de entrada. La unión de ATP provoca el cierre de esta compuerta, lo que resulta en la captura del segmento T. En su trayecto desde el exterior hacia el interior de la enzima, el segmento T se abre paso a través del corte producido en el segmento G y alcanza la cavidad central de la topoisomerasa. Al sellarse de nuevo el segmento G, se reduce el espacio en la cavidad central y el segmento T es forzado a salir de la misma, encontrando su única puerta de salida en la principal región de dimerización de la enzima. Terminado este proceso, la hidrólisis del ATP provoca la rea12
(-)
pertura de la compuerta de entrada y permite a la enzima iniciar un nuevo ciclo de transporte. Apoyados en la información estructural, diseñamos un experimento que demostraba que el segmento T salía del interior de la enzima por el lado opuesto al que había entrado, tras cruzar la interfase entre las dos mitades de la topoisomerasa. Sustituimos algunos de los aminoácidos de la región principal de dimerización por cisteínas, con el fin de que pudieran formarse enlaces covalentes entre átomos de azufre entre ambos lados del dímero. Dado que la formación de estos enlaces puede modularse mediante oxido-reducción, podíamos controlar la apertura o el cierre permanente de la supuesta puerta de salida del segmento T. Cuando utilicé esta topoisomera sa para desengarzar parejas de anillos de ADN, observé que, una vez aprehendido y transportado, el segmento T se sitúa en la cavidad central de la topoisomerasa. Eso significa que ha entrado por arriba y cruzado en
Si bien las topoisomerasas de tipo II son un alarde de nanomecánica, algunas encierran un grado particular de complejidad. Sucede con la girasa de ADN, una topoisomerasa de tipo II ubicua en las bacterias. La girasa sólo puede reducir el número de enlace del ADN; gracias a ello, elimina de forma selectiva superhelicidad positiva y genera superhelicidad negativa en el ADN. Para cumplir esa función, emplea siempre segmentos G y segmentos T contiguos en la misma molécula de ADN; y siempre transporta unos a través de otros en el mismo sentido. La base estructural de semejante preferencia radica en el modo de interacción entre la girasa y el ADN. Una vez unida al segmento G, la topoisomerasa dobla el ADN en sentido dextrógiro, con lo que se proporciona a sí misma el segmento T que debe ser capturado. A partir de aquí, la girasa opera como todas las topoisomerasas de tipo II. Apl ica cio ne s
El avance en los estudios estructurales y funcionales u operativos de las topoisomerasas de tipo II repercute en varios ámbitos. En el campo de la enzimología, estas proteínas representan una de las máquinas moleculares más refinadas y sobresalientes. En cuanto a sus implicaciones biológicas, conocemos mejor cómo se eliminan los encadenamientos y anudamientos entre cromosomas, así como la modulación de la superhelicidad del ADN intracelular. Por último, incide en el avance de la farmacología clínica. Numerosos TEMAS 38
A C O R M I U Q A O J
H H3 C
O
NHSO2 CH3
O O
COOH
O HO
H3 C
HO
N
N
O H
H3 CO
O
NH O
C2 H5
O
Acido nadilíxico (Quinolona)
O Etoposido (Epipodofilotoxina)
N SA m-AM noacridina) (Ami
OCH3
H3 CO OH CH3 CH3 CH3 O
O
O
OH
O
O
OH
O
O
CH3 H2 N-C-O
CH3
OH
N-C H O
CH3 CH3
Novobiocina (Coumarina)
HN O
NCH
CHN
CH3
NH O
ICRF-193 (Bisdioxopiperacina)
10. NUMEROSOS COMPUESTOS de interés farmacológico alteran la aminoacridinas y epipodofilotoxinas, alteran el sellado del ADN; se actividad de las topoisomerasas de tipo II. En su operación emplean prescriben por su eficacia en la terapia antitumoral. Las coumarimecanismos diversos. La mayoría de tales medicinas atentan con- nas (grupo en el que se integran la novobiocina, coumericina y clotra el proceso de corte y sellado del segmento G; inducen, en parti- robiocina) impiden la unión del ATP a las topoisomerasas de tipo II. cular, que las topoisomerasas de tipo II produzcan roturas en el ADN. Hay, por último, compuestos que bloquean los movimientos de la toPertenecen a ese grupo las quinolonas (ácido nadilíxico, norfloxa- poisomerasa durante el transporte de ADN. Las bisdioxopiperacicina y ciprofloxacina), que desarrollan una potente actividad anti- nas, por ejemplo, impiden la reapertura de la compuerta de entrada biótica. Otros fármacos de estructura química muy distinta, como las de las topoisomerasas de tipo II.
antibióticos y drogas antitumorales ejercen sus efectos porque alteran de modo específico la actividad de las topoisomerasas de tipo II. La explicación es sencilla. Tales enzimas constituyen un auténtico “talón de Aquiles” para la viabilidad celular. Su mal funcionamiento genera el caos en la topología del ADN y roturas irreversibles en el genoma, lo que aboca en la muerte celular. Las células que se caracterizan por una alta tasa de proliferación (por ejemplo, las tumorales o las bacterias) poseen una elevada actividad topoisomerásica y son, por tanto, las más susceptibles a drogas que afectan a estas enzimas. Hoy conocemos múltiples compuestos que, mediante distintos mecanismos, alteran la actividad de las topoisomerasas de tipo II. La mayoría de estas drogas inciden de una forma selectiva en el proceso de corte N UEVA GENÉTICA
y sellado del segmento G; inducen que la topoisomerasa produzca roturas irreparables en el ADN. Dentro de este grupo cabe destacar a las quinolonas y sus derivados, utilizadas como potentes antibióticos, y a las drogas de eficaz actividad antitumoral, como son el m-AMSA y el etoposido. Otros compuestos impiden la unión del ATP a la enzima; tal ocurre con el ácido nadilíxico y sus análogos. Por último, hay diversidad de moléculas de elevada toxicidad para la célula que bloquean los movimientos que hacen las topoisomerasas de tipo II durante el transporte de ADN. El uso reiterado de esa batería de fármacos genera, sin embargo, la aparición de mutaciones que convierten a las células en resistentes a la acción de los mismos. Sólo el avance en los estudios estructurales y bioquímicos de estas enzimas nos permite seguir en esta carrera y diseñar nuevos com-
puestos con potencial terapéutico. Entretanto, como auténticos magos del universo molecular, las topoisomerasas de tipo II siguen manteniendo al ADN intracelular en paz y orden. BIBLIOGRAFIA COMPLEMENTARIA THE CAPTUREOF A DNA DOUBLE HELIX BY AN ATP-DEPENDENT PROTEIN CLAMP: A KEY STEPIN DNA TRANSPORT BY TYPE II DNA TOPOISOMERASES. Joaquim Roca y James C. Wang, en Cell, vol. 71, págs. 833-840; 1992. BY A TYPE II DNA TODNA TRANSPORT POISOMERASE: EVIDENCE IN FAVOUR OF A TWO-GATE MECHANISM. Joaquim Roca y James C. Wang, en Cell, vol. 77, págs. 609-616; 1994. THE MECHANISM OF DNA TOPOISOMERASES. Joaquim Roca, en Trends in Biochemical Sciences , vol. 20, págs. 133-168; 1995.
13
A
T
Microsatélites de ADN Las secuencias repetitivas de ADN desempeñan un papel destacado en la adaptación de las bacterias a los ambientes donde medran. ¿Cumplen una función similar en organismos superiores?
A
C
G
T
A A T A
E. Richard Moxon y Christopher Wills T
C
E
l código genético humano está constituido por unos 3000 millones de bases de ADN. Sólo de un 10 a un 15 por ciento de esas bases forman parte de los genes, los planos maestros que la célula utiliza para construir sus proteínas. A otras secuencias de pares de bases les competen —en el hombre y otros muchos organismos— funciones muy importantes; por ejemplo, promover la activación o inactivación de los genes y mantener unidos los cromosomas. Queda una buena parte del ADN sin manifiesta misión obvia. Algunos la llaman “chatarra”. En ese “ADN chatarra” hay secuencias de características singulares, agrupadas bajo la denominación común de ADN satélite. Lo forman, en efecto, secuencias repetitivas de las cuatro bases del ADN —adenina (A ), citosina (C ), guanina (G ) y timina (T )—, en diversa combinación y repetidas en una suerte de tartamudeo. Los microsatélites, que contienen las repeticiones más cortas, encierran un interés muy superior al que cabría deducir de su tamaño; realizan funciones múltiples y sorprendentes. Se hace cada vez más patente que la naturaleza repetitiva del ADN microsatélite le capacita para crecer o disminuir en longitud y que estos cambios pueden acarrear consecuencias buenas o malas para los organismos portadores. En determinadas bacterias patógenas las secuencias repetitivas promueven la aparición de propiedades nuevas que capacitan a esos microorganismos para sobrevivir ante cambios del entorno potencialmente letales. Es probable que algunos microsatélites ejerzan efectos importantes en el hombre, pues hay en el genoma humano —el conjunto del ADN de cada una de nuestras células— unos 100.000. Hasta la fecha, la única misión asignada a los micro14
T
A
T
A
C T
G
C
A
T
T
A
A
A
A
G
T
A
T T
C
A IM H S A R A N O M O T
satélites del hombre es negativa; causan diversas enfermedades neurológicas. Sin embargo, podrían ser restos supervivientes de procesos evolutivos que desembocaron en la conformación de nuestra especie. Mientras unos indagan los motivos de la cuantiosa presencia de ADN repetitivo en el hombre, otros se apoyan en los microsatélites para el diagnóstico de enfermedades neurológicas y para la detección de personas en riesgo de padecerlas. Se está comprobando que los microsatélites cambian de longitud en fases precoces de ciertos cánceres, lo que les convierte en valiosos marcadores para el diagnóstico precoz de tales patologías. Y puesto que la longitud de
EL MICROSATELITE (región resaltada ) ilustrado consta de una secuencia de unidades de ADN o bases —CAAT (citosina-adenina-adenina-timina)— que se repite cinco veces. Cada secuencia de CAAT se empareja con su complementaria GTTA (guanina-timina-timina-adenina) en la hebra opuesta de la escalera de ADN. Las secuencias repetitivas, o motivos, pueden contener en los microsatélites hasta seis bases, y cada secuencia puede aparecer en múltiples copias.
TEMAS 38
T
los microsatélites varía de una persona a otra, en ellos comienzan a apoyarse la identificación de criminales y la determinación de la paternidad. A este procedimiento se le denomina “identificación dactilar por ADN” (“fingerprinting”). En los años sesenta se conoció el primer ADN satélite. Se descubrió que, cuando se centrifugaba ADN en determinadas condiciones, el ácido nucleico se disponía en dos o más capas: una banda o estrato principal , que contenía los genes, y bandas secundarias, o bandas satélites. Las bandas satélites constaban de secuen-
genes Opa . (Les viene el nombre de la “opacidad” que presentan las colonias bacterianas que sintetizan proteínas Opa.) Merced a las proteínas Opa, la bacteria se adhiere e invade a las células epiteliales —las que tapizan el tracto respiratorio— y los fagocitos, células del sistema inmunitario. Cada gen Opa contiene un microsatélite compuesto por múltiples copias de un motivo de cinco bases, CTCTT . El enorme potencial de variación que arrastran las repeticiones de los microsatélites obedece a su proclividad a equivocarse en la replicación
En el caso de los genes Opa , la deleción de una secuencia CTCTT conduce a la producción de una proteína recortada. No podrá ya adherirse a la célula hospedadora; en consecuencia, la bacteria portadora de la proteína acortada queda incapacitada para penetrar en las células. Pero el deslizamiento subsecuente abre la posibilidad de recuperar la zona repetitiva, permitiendo, por tanto, al genOpa producir de nuevo una proteína funcional. Conocido por variación de fase, este cambio reversible se da en muchas bacterias causantes de enfermedades. Con los cambios alternativos que
cias muy Alec largas ADNencontró repetitivo. En 1985 J. de Jeffreys otras regiones más cortas de ADN repetitivo; tales minisatélites —así los llamó— eran zonas repetidas de 15 o más bases. (El grupo de Jeffreys determinó que el número de repeticiones en un minisatélite difería de un individuo a otro, y en ello basó su diseño de la técnica de la identificación por ADN.) A finales de los ochenta, James L. Weber y Paula L. May, por un lado, y Michael Litt y Jeffrey A. Lutty, por otro, aislaron satélites constituidos por zonas repetitivas de ADN menores incluso. Los denominaron microsatélites . Se han mostrado muy eficaces para la identificación de las personas por ADN. Se admite que el ADN microsatélite está constituido por secuencias de hasta unos seis pares de bases, iterados y unidos en secuencia continua. Debe su interés especial en los procesos evolutivos a una altísima tasa de mutación: la probabilidad de que un microsatélite adquiera o pierda, de una generación a la siguiente, una de las regiones repetidas multiplica 10.000 veces la probabilidad de que tal ocurra en el gen responsable de la anemia falciforme, en el que la mutación de una base da lugar a la enfermedad. Y si es raro que esa mutación singular de la anemia falciforme revierta el gen a su estado inocuo, no puede predicarse lo mismo de los microsatélites, que vuelven sin problema a sus longitudes previas, incluso a las pocas generaciones.
del ADN; cometen un error frecuente: el desajuste por deslizamiento entre secuencias complementarias. Antes de que una célula —bacteriana o de otro tipo— se divida, ha de duplicarse su ADN. En este proceso complicado, cada molécula de ADN es una doble hélice en escalera de caracol, cuyos peldaños corresponden a los pares de bases. El código genético se escribe con las bases de un lado de la escalera; las del otro lado son complementarias ( A siempre se empareja con T , y C con G). Durante la replicación del ADN, la escalera se parte por la mitad de cada peldaño; se separan los pares de bases al alejarse ambas cadenas helicoidales. Las ADN polimerasas copian cada una de las hebras. Mientras se va construyendo la nueva hebra, ésta se empareja con la que le sirve de molde. Pueden darse errores de replicación por corrimiento cuando la hebra vieja, el molde o la hebra que se está formando se deslizan y establecen un emparejamiento inadecuado con la zona repetitiva de la otra hebra. Este deslizamiento es la causa de que la ADN polimerasa añada o elimine una o más copias de las zonas repetitivas de la nueva hebra de ADN. La frecuencia de este mecanismo de deslizamiento alcanza valores altos en N. gonor rho eae . En cada tanda de división bacteriana, de cada 100 o 1000 células hijas habrá una que porte una mutación que modifica el número de repeticiones de CTCTT . Esta modificación puede ejercer efectos drásticos sobre los genes Opa , porque la información genética se interpreta en “palabras” de tres bases, los codones. Las proteínas son ristras de aminoácidos y cada codón determina qué aminoácido ha de incorporarse en la cadena proteica. Como la secuencia repetitiva no está constituida por tres bases, un aumento o una disminución del número de estas secuencias desplaza el significado de los codones subsiguientes.
llevan a la conexión Opa de una y desconexión dea los genes generación otra, N. gono rrh oeae incrementa sus posibilidades de supervivencia. Hay momentos en que al microorganismo le conviene adherirse a la célula hospedadora y penetrar en ella. Tal acontece cuando la bacteria se propaga y llega a un nuevo huésped. En otras ocasiones le resulta a ésta más ventajoso no interaccionar con la célula huésped; en particular si se trata de fagocitos, que destruyen las bacterias tras atraparlas en su interior. Las implicaciones del emparejamiento incorrecto por deslizamiento y su relación con la capacidad para modificar las moléculas de superficie se han estudiado in extenso a propósito de la bacteria Hemophilus influenzae . Las células del tipo b de esta ba cteria pueden provocar una meningitis infecciosa que afecta al cerebro y puede resultar letal. Hasta la introducción de la vacuna a finales de los ochenta, uno de cada 750 infantes menores de cinco años contraía la meningitis por H. influenz ae . La membrana externa del H. influe nzae está festoneada con moléculas de lípidos y azúcares unidas entre sí para formar un lipopolisacárido (LPS). Una parte del LPS, el colínH. fosfato, facilita la adhesión de influenzae a las células de la mucosa de la nariz y de la garganta, d onde la bacteria se instala sin producir síntomas. Al menos tres de los genes requeridos para la síntesis del LPS contienen microsatélites construidos a partir de la secuencia de cuatro bases CAAT . Igual que sucede con los genes Opa de Neiss eria gon orrh oeae , los cambios aquí en el número de repeticiones de CAAT pueden hacer que el H. influenz ae sintetice LPS dotado de colín-fosfato o sin él.
Opa
En 1986 el grupo de Thomas F. Meyer sacaba a la luz la función de los microsatélites en las bacterias patógenas. El equipo de Meyer investigaba Neisseria gonor rh oeae , la bacteria causante de la gonorrea, una enfermedad de transmisión sexual. N. gonorrhoeae , unicelular, posee una familia de hasta 12 proteínas de la membrana externa determinadas por N UEVA GENÉTICA
Ada pta ció n al ent orn o
Jeffrey N. Weiser ha demostrado que las cepas de H. influenzae que tienen colín-fosfato (ChoP) en sus moléculas 15
mente en el tracto respiratorio, pues se adhieren a las células huésped sin la fuerza de las cepas ChoP+. Ahora bien, si el huésped contrae una infección vírica y se produce una inflamación de la mucosa nasal, se refuerza la exposición de las bacterias a las proteínas defensivas del sistema inmunitario del huésped. En ese caso, las variantes ChoP– tendrían ventaja para repeler el ataque. Una vez que la infección vírica remite, las mutantes ChoP+ generadas por ulteriores emparejamientos defectuosos del ADN microsatélite tornarán a predominar. Este tipo de genes que se activan o inactivan sin problemas se de cobijan bajo la denominación común genes de contingencia; capacitan, por lo menos a unas cuantas bacterias de una determinada población, para adaptarse a los avatares o riesgos de un nuevo escenario. Entre los rasgos codificados por los genes de contingencia no podemos omitir los que gobiernan el reconocimiento inmunitario, la motilidad general, el movimiento hacia las señales químicas (quimiotaxis), la unión a las células huésped y su ulterior invasión, la adquisición de nutrientes y la sensibilidad a los antibióticos. Los genes de contingencia, que representan una fracción muy pequeña del ADN de una bacteria, le confieren una gran flexibilidad en su funcionamiento. Si sólo 10 de los 2000 genes de una bacteria típica son genes de contingencia, por ejemplo, la bacteria podría dar lugar a 2 10, es decir 1024, combinaciones diferentes de genes “activos” o “inactivos”. Esta diversidad asegura que al menos una bacteria de la población pueda sobrevivir al ataque inmunitario del huésped o a la acción de otras defensas, para replicarse luego y fundar una nueva colonia. La inducción de la enfermedad —que se torna en su contra al destruir el huésped que le permite vivir— podría ser parte del precio que las bacterias pagan por disfrutar de esa capacidad de generar tantas variantes. Una de las variantes puede aventurarse allende su nicho ecológico habitual en el tracto respiratorio o el intestino y desencadenar una infección potencialmente letal en otra región del organismo. Habida cuenta de que tal sucede sólo en contadas ocasiones, las ventajas que los genes de contingencia aportan a la pervivencia de una especie bacteriana superan los inconvenientes de destruir algunos huéspedes. Los microsatélites de estas bacterias son auténticas adaptaciones evolutivas. Es poco probable que secuencias N UEVA GENÉTICA
En busca de papá Chimpancé
S
e ha recurrido a microsatélites de ADN para identificar criminales a través del análisis de las huellas nucleotídicas. Se emplean también esas secuencias para conocer la vida sexual de los animales, en el marco de programas conservacionistas de especies en peligro de extinción. La huella de ADN, peculiar de cada individuo, revela que la longitud de las secuencias nucleotídicas de los microsatélite s difiere en cada persona. Se obtienen esas huellas mediante enzimas especiales, que permiten fabricar millones de copias exactas de varios microsatélites de un individuo. Luego, en un gel se separan las copias en razón del tamaño. Se configura así un patrón de bandas, similar al código de barras. Pascal Gagneux, David S. Woodruff y Christophe Boesch han empleado microsatélites de ADN como trazadores para sondear los hábitos de apareamiento de un grupo de chimpancés del bosque Taï de Costa de Marfil. Han recogido pelos de los nidos que cada animal se construye en la copa de los árboles, donde se refugian para dormir. De las raíces de estos pelos se ha extraído ADN y determinado sus huellas características. Al comparar las huellas de los microsatélites de ADN de hembras y machos adultos con los de 13 crías,
trada incluso por grupos reducidos de chimpancés. La diversidad refuerza la resistencia frente a enfermedades y favorece, sin duda, la pervivencia. Es probable que la conservación de la variedad sea esencial para la supervivencia de las poblaciones de chimpancés en libertad. Por des-
Gagneux, y Boesch han observado Woodruff que siete crías no habían sido engendradas por machos pertenecientes al grupo. Aunque los investigadores nunca vieron esos encuentros furtivos entre las hembras y machos de bosques vecinos. Estas aventuras nocturnas podrían explicar la diversidad genética mos-
gracia, a medida que estas poblaciones se fragmentan y las distancias que las separan son mayores, la capacidad de las hembras para encontrarse con machos de otros grupos e introducir nuevos genes en sus grupos queda drásticamente recortada. —E.R.M. y C.W.
IS N N E D . J L E G I N
LAS HEMBRAS DE CHIMPANCE, como ésta que aparece aquí con su cría, hacen frecuentes escapadas furtivas para aparearse con machos pertenecientes a otros grupos, según se deduce de estudios con huellas de ADN de microsatélites.
repetitivas tan singulares surgieran al azar; aparecerían, y se han conservado, porque capacitan a las poblaciones bacterianas para una pronta adaptación a los cambios del entorno.
en su interior. De este 10 por ciento, casi todos pertenecen a los tripletes repetidos, que tienden a extenderse o a contraerse en tríos de bases. Igual que al añadir el artículo “las” o al suprimir el artículo “los” de una frase En los organismos superiores no se pierde por lo común el sentido, Pese a su interés, diríase que los genes de modo similar estas repeticiones de contingencia se circunscriben a las pueden iterarse o perderse sin perbacterias. En los eucariotas, nosotros turbar el mensaje del gen. Por tener mismos, cuyas células contienen un la misma longitud que un codón, núcleo, los microsatélites cumplen podrían dar lugar a la inserción o deleotras misiones. Ninguno de los microción de unos cuantos aminoácidos repesatélites eucariotas identificados hasta tidos sin que se alterase la secuencia la fecha ha logrado, que se sepa, liar de todos los demás de la ristra. el ADN para que determine proteínas ¿Qué funciones desempeñan, pues, no funcionales. Se sitúan fuera de los los microsatélites en los organismos genes, salvo un 10 por ciento que cae superiores? Se sospecha que algunos 17
Detección del cáncer
E
l ADN microsatélite puede convertirse muy pronto en un poderoso condicionante de nuestra vida. Con su ayuda podrá afinarse en la detección precoz del cáncer. Las pruebas capaces de descubrir mutaciones en genes cuya alteración predispone al cáncer, pensemos en el p5 3 y el ra s , se emplean ya para detectar hasta una célula maligna en medio de 10.000 normales. Pero las mutaciones en estos genes ni se dan en todos los tipos de cáncer, ni en todos los cánceres de un mismo tipo. Los microsatélites ofrecen una nueva posibilidad para la detección precoz del cáncer. En efecto, la tasa de expansión o de contracción de microsatélites en las células se dispara en ciertas formas tumorales. Estos cambios repentinos ponen en jaqu e mucho s micro saté lites dife rentes, fenómeno que puede detectarse con bastante facilidad. Con dicho enfoque se descubre ahora una célula cancerosa entre 500 normales. Fue Manuel Perucho quien descubrió en 1993 los cambios operados en los microsatélites de células cancerosas en el marco de una investigación de un tipo de cáncer de colon, hereditario, que no se acompaña de la formación de pólipos. Perucho observó que muchos de los microsatélites de las células cancerosas
La prueba se completó cuando Richard C. Boland y otros insertaron un cromosoma humano portador de un gen normal reparador de ADN en células cancerosas cultivadas. Observaron que el gen insertado corregía la tendencia a mutar que presentaban los microsatéli tes de células cancerosas. Mas, por muy sorprendentes que parezcan estos hallazgos, la inestabilidad de los microsatélites puede constituir un síntoma, no la causa del cáncer. Aunque los ratones en que se ha eliminado el gen que codifica una de las principales proteínas reparadoras de emparejamientos incorrectos de ADN viven poco y adquieren diversos tipos de cáncer, ninguna de las células malignas muestra niveles elevados de mutaciones en los microsatélites. Según parece, este tipo de alteraciones forma parte de los cambios genéticos que se suceden en cascada a lo largo del genoma celular, una vez incoado el proceso de carcinogénesis; ello significa que podría tratarse de productos secundarios del proceso carcinogenéti co y no de agentes que intervinieran en su desarrollo. Ahora bien, esas asociaciones se dan con suficiente frecuencia. Y los clínicos empiezan a servirse de la inestabilidad de los microsatélites como un nuevo y poderosos instrumento
eran más largos o más del cortos que los deolas células normales mismo paciente. No tardó en demostrarse que uno de los defectos causantes de estas alteraciones se encontraba en un gen determinante de una enzima cuya función era corregir la longitud de los microsatélites que se extienden o menguan durante la replicación del ADN. La pérdida de este gen funcional habría de conducir a un aumento de la probabilidad de que los errores quedaran sin corregir.
para precoz del cáncer de colonlaydetección de vejiga. Las pruebas clínicas se han visto coronadas por el éxito, lo que explica la voluntad de llev ar su aplicación a otros tipos de cánce r. De momento, ninguna de esas pruebas ha salido todavía de los muros de los laboratorios. A medida que los clínicos adquieran experiencia con estos patrones, podrá diagnosticarse el cáncer antes y contar con datos más fiables del tipo de cáncer en razón del patrón de microsatélite. —E.R.M. y C.W.
al menos tienen su cometido. Los eucariotas poseen más microsatélites que las bacterias y muchos de ellos suelen estar alojados cerca o dentro mismo de genes implicados en vías reguladoras de procesos fundamentales. Sin embargo, hasta el momento sólo disponemos de pistas dispersas acerca de su posible tarea. Los contados efectos cuya pista se ha podido seguir y atribuir a microsatélites eucariotas son, por lo general, nocivos. Así la enfermedad de 18
Huntington, una afección neurodegenerativa grave caracterizada por la aparición tardía de demencia y pérdida progresiva del control motor. Esta patología se dispara con la intervención de un gen defectuoso que codifica una proteína de gran tamaño, la huntingtina, de función desconocida. El gen normal contiene un microsatélite largo, constituido por repeticiones de tripletes, que añade una ristra de glutaminas cerca del extremo inicial de la proteína.
E C R U O S E C N IE C S / S E T IA C O S S A O T O H P O I B
PULMON NORMAL
T C
MICROSATELITE
G
A
G
C A
T
A
T
A
T A
T
C A
A G C
T C G A
T C C C
T
T
T
G
C T
G
C
G
A
A A
A
G
C A
C
T
G A
C
T
G A
G
C A
T G
A G G G
T T
C
MATERNO
A G C
T C G A
T C
T
A A A
T
T
A G
T
T
PATERNO
GEL
PATERNO
MATERNO
PRUEBA para la detección del cáncer, que descubre los cambios de longitud de microsatélites; por ejemplo, los formados por repeticiones de la secuencia CA. Las células pulmonares normales (izquierda) contienen regiones repetitivas de dos longitudes diferentes —una heredada de la madre y otra del
El número de glutaminas del extremo inicial de la huntingtina varía de 10 a 30. Pero las personas con Huntington portan un microsatélite que codifica una ristra de glutaminas excesivamente larga, de hasta 36 unidades o más. Basta la herencia de una copia del gen defectivo —la paterna o la materna— para dictaminar la enfermedad. Se ignora en virtud de qué mecanismo esa ristra de glutaminas repetidas insta la patogénesis. TEMAS 38
Micromatrices de ADN Con unas ingeniosas plantillas de ADN, la ciencia se está adentrando en las raíces moleculares de la salud y la enfermedad, al tiempo que acelera el paso en el descubrimiento de nuevos fármacos y en el desarrollo de terapias personalizadas Stephen H. Friend y Roland B. Stoughton
L
a mayoría de los pacientes que sufren linfoma difuso de células grandes tipo B responde bien a la terapia estándar. Pero, en más de la mitad de los casos, el cáncer no tarda en reaparecer con violencia letal. Los médicos venían atribuyendo el hundimiento rápido de unos y la resistencia de otros a diferentes formas del tumor causadas por anomalías moleculares distintas. Pero hasta hace dos años la ciencia carecía de medios para detectar qué pacientes sufrían la forma más virulenta y debían, por tanto, recibir un tratamiento más enérgico y arriesgado. El problema lo resolvió una herramienta poderosa, la micromatriz de ADN (“DNA microarray”). Recurriendo a la misma, investigadores del norteamericano Instituto Nacional de la Salud, la Universidad de Stanford y otros centros pudieron distinguir entre supervivientes a corto y a largo plazo. Basábanse para ello en las diferencias observadas en el patrón general de actividad que mostraban cientos de genes de sus células malignas en el momento del diagnóstico. Aquel logro debería llevar a una prueba discriminante, capaz de identificar a los pacientes expuestos a un riesgo mayor. Las micromatrices de ADN existen en el comercio desde 1996. Constituyen hoy uno de los pilares de la investigación farmacológic a. Más de 20 compañía s se dedican a su d istribución o a la venta de los progra mas informáticos asociados. Gracias a esas plantillas asistimos a una revolución en el modo en que se estudia el funcionamiento molecular, normal y patológico, de las células. En ellas se confía para obtener diagnósticos más rápidos y exactos de muchas enfermedades, así como para facilitar la personalización de los tratamientos clínicos, lo que implica elegir los fármacos más eficaces y con menores efectos secundarios en cada paciente. 20
CUANDO SE ANALIZAN muestras de tejido con matrices de ADN, aparecen tramas de puntos. Los médicos podrían basarse en las diferencias individuales entre estas tramas para ajustar sus tratamientos a las necesidades de cada paciente.
Punteados de identificación
Aunque hay varias clases de micromatrices, todas se ordenan a descubrir la composición del material genético en una muestra de tejido. Todas las variedades constan de una serie de moléculas de ADN unicatenario (sondas), dispuestas en una rejilla a menudo no mayor que la huella del pulgar. Las plantillas en cuestión se fundan en una propiedad muy útil del ADN: el emparejamiento complementario de sus bases.
De ADN están formados los más de 30.000 genes de la célula humana, las secuencias codificadoras de la composición de las proteínas. El ADN consta de cuatro bloques de construcción, reconocidos por la primera letra de sus bases químicas: A, C, G y T. En una cadena de ADN la base A sólo se emparejará con una T (la complementaria de A) de otra cadena; la C hará lo propio con G. Por tanto, si una molécula de ADN de una muestra de tejido se une a una sonda que tiene la secuencia ATCGGC, deduciremos que la muestra presenta la secuencia comple-
Las reacciones de emparejamie nto complementario de las bases han resultado cruciales para la ejecución de numerosas pruebas biológicas durante años. Pero lo asombroso de nuestro caso es que las micromatrices de ADN pueden rastrear decenas de miles de estas reacciones a la vez en una sola tarjeta. ¿En virtud de qué? Porque cada una de las sondas —trátese de un gen o de una secuencia de código más corta— se dispone en un lugar determinado de la rejilla, parecida a un tablero de ajedrez, y porque las moléculas de ADN o de ARN que se vierten sobre la planti-
mentaria: TAGCCG. El otro ácido nucleico fundamental, el ARN, sigue también esta estricta norma de emparejamiento de bases cuando se une al ADN; podemos, pues, deducir también la secuencia de una cadena de ARN que se empareja con ADN en una micromatriz.
lla portan un marcador fluorescente u otra etiqueta que puede detectarse con un escáner. Una vez leída la micromatriz por el escáner, los datos se convierten en una impresión con un código de colores.
E T N A L A G IS N N E D
21
Así funcionan las matrices
P
ara determinar si un fármaco potencial supondrá un daño colateral del hígado, el investigador podría seguir los pasos descritos más abajo. La pregunta planteada sería de este tenor: ¿Provoca el fármaco en cues-
tión la activación de genes (determinantes de las proteínas) de las células hepáticas en un sentido lesivo para el hígado? Una respuesta afirmativa sería señal de problemas.
N IG S E D N A M D I E N H C S D E R A J
MICROMATRIZ
A G G A C G T
SEGMENTO DE MATRIZ
PUNTO QUE CONTIENE COPIAS DE UNA MOLECULA DE ADN
1
Se parte de una micromatriz que contenga ADN de cadena sencilla, representativo de miles de genes diferentes; cada uno se asigna a un punto diferente de la plantilla de 2,5 8 cm o menos. Cada punto alojará miles
BASES DE ADN
PARTE DE UNA CADENA DE ADN
o millones copias de la cadena dede ADN.
ARNm FARMACO
PROTEINA
GENES INACTIVOS GEN ACTIVO
ARNm
CELULA SIN TRATAR
ADNc
CELULA TRATADA ADNm
2
Se toman dos muestras de células hepáticas. Se aplica el fármaco a una muestra. Luego, de cada muestra, se recuperan las moléculas de ARN mensajero, que representan las copias móviles de los genes y los moldes para la síntesis celular de proteínas. PAR DE BASES COMPLEMENTARIAS
ADNc
3
El ARNm se transcribe en ADN complementario (ADNc), más estable. Se agregan marcadores fluorescentes, verdes a los ADNc derivados de células sin tratar y rojos a los procedentes de células tratadas. Los ADNc marcados se aplican a
ADNc DE CELULAS SIN TRATAR
T C C T G C A
la matriz.
Cuando el ADNc de una muestra encuentra su secuencia de bases complementaria en la plantilla, se une a ella. Tal unión evidencia que el gen representado por el ADN de la plantilla se halla activo, vale decir, expresado en la muestra.
A G G A C G T
MATRIZ DE ADN C C C G G A T
G G G C C T A
C G G C
4
ADNc DE CELULAS SIN TRATAR
GEN QUE HA DISMINUIDO NOTABLEMENTE SU ACTIVIDAD EN CELULAS TRATADAS
5
GEN QUE ESTABA IGUALMENTE ACTIVO EN CELULAS TRATADAS Y SIN TRATAR
ESCANER
LECTURA
Se deposita la matriz o plantilla en el escáner. El ordenador calcula la relación de verde a rojo en cada punto (para cuantificar los cambios en la actividad genética inducidos por el fármaco) y genera una salida impresa en color. PERFILES HIPOTETICOS DE ACTIVIDAD GENETICA EN CELULAS TRATADAS CON DIVERSOS COMPUESTOS
6
Se determina si ha habido genes que responden intensamente al fármaco en el sentido de promover o reflejar la lesión hepática. Puede también compararse el esquema general de expresión génica de los genes que han respondido de un modo intenso con los esquemas producidos cuando esos genes reaccionan a toxinas hepáticas conocidas ( derecha ). Una estrecha similaridad indicaría que nos hallamos ante un candidato tóxico. Cada cuadro del diagrama representa la respuesta de un gen a la sustancia.
22
C G G C
EJEMPLOS DE REACCIONES
GEN QUE HA INCREMENTADO NOTABLEMENTE SU ACTIVIDAD EN CELULAS TRATADAS
GEN QUE ESTABA INACTIVO EN AMBOS GRUPOS
T A T A T A T A A T A T A T A T G C G C
GENES SUBSTANCIAS INOCUAS NUEVO CANDIDATO A FARMACO TOXINAS HEPATICAS CONOCIDAS
TEMAS 38
En el dominio de la investigación las micromatrices de ADN se aplican a dos usos muy distintos. Las aplicaciones genotípicas comparan el ADN de una microplantilla con el ADN de una muestra de tejido para determinar qué genes hay en la muestra o para descifrar el orden de las letras de código en cadenas de ADN sin secuenciar. Además de ese uso explorador de la presencia de genes en una muestra, importa otro, el de detectar la expresión, o nivel de actividad, de tales genes. Se dice que un gen se expresa cuando se transcribe en un ARN mensajero (ARNm) y se traduce
enfermedades para detectar SNP individuales y predecir la probabilidad de que el sujeto en cuestión padezca Alzheimer, diabetes o un tipo de cáncer. Las personas proclives podrían someterse a un control estricto, recibir un tratamiento preventivo o pasar antes por el quirófano. Queda, empero, abierta la duda de hasta qué punto estas pruebas serán aceptadas por el público; ese conocimiento podría alimentar la ansiedad del interesado y facilitar su posible discriminación por aseguradoras o patronos. De esos inconvenientes queda exenta otra información valiosa que pro-
copias de proteína sintetizará también. Por consiguiente, la cuantía de diversos ARNm apreciados en una muestra revelará, indirectamente, los tipos y cantidades de proteínas presentes. Compete a las proteínas controlar y llevar a cabo la mayoría de las funciones de nuestras células y tejidos. Se hallan en fase de desarrollo las micromatrices que miden directamente los niveles de proteína, aunque su construcción aparece rodeada de dificultades. Con el uso del genoma como sensor para determinar cambios de actividad en genes de la célula, se obten-
en una proteína.son Laslos moléculas de ARN mensajero transcriptos móviles de los genes y sirven de molde para la síntesis de proteínas.
porcionan las micromatrices de SNP. Las variantes de genes influyen en la reacción del cuerpo a las medicinas que tomamos, lo que a su vez influye en la eficacia de los fármacos y en la intensidad de sus efectos secundarios. Las plantillas que pongan de relieve nuestras peculiares sensibilidades genéticas ayudarían a los clínicos a elegir las medicinas que convinieran más a cada paciente. Las micromatrices de SNP que revelan las mutaciones genéticas que incrementan la virulencia de los tumores permitirían que los anatomo-patólogos determinaran la malignidad escondida de un tumor en apariencia benigno. Ambos tipos de microplantillas se están investigando ya con fines hospitalarios.
drán detalladas del estado“instantáneas” de alteración de las funciones celulares provocado por fármacos o enfermedades. A veces, resulta más útil conocer el esquema general de actividad de los genes en una muestra que saber qué genes concretos se activan en respuesta ante un estímulo. En esos casos, como veremos, el esquema sirve de “firma” taquigráfica que refleja el estado molecular de una muestra bajo unas condiciones particulares. Los perfiles de expresión han demostrado su utilidad única en muchos frentes. Los biólogos celulares los usan porque, si sabemos qué proteínas predominan después de exponer un tejido a diferentes condiciones, podemos inferir el modo en que el tejido compensa las agresiones y qué es lo que deja de funcionar cuando se desarrolla una enfermedad. Se recurre también a las plantillas de expresión génica para descubrir las funciones de genes identificados a través de la secuenciación del ADN nuclear. Hay otras técnicas que no utilizan micromatrices para mostrar las funciones de esos genes recientemente descubiertos (o, dicho con exactitud mayor, de las proteínas por ellos cifra-
A la caz a de gen es
Se recurre al enfoque genotípico para comparar los genes de organismos diferentes (por ejemplo, para buscar claves sobre la historia de la evolución de los organismos) y para cotejar los genes de los tumores con los de tejidos normales (en busca de sutiles diferencias de composición o número de genes). Algún día, las comparaciones de genes mediante micromatrices de ADN podrán mostrar su valor en clínica. Sin ir más lejos, una micromatriz bien pergeñada podría establecer la causa exacta de la infección en un paciente cuyos síntomas, parecidos a los de un resfriado (dolor de cabeza, fiebre alta y dificultad para respirar), no denuncian un responsable claro. Podría componerse una superficie con ADN que represente genes que aparecen sólo en patógenos causantes de enfermedades similares; el laboratorio hospitalario podría extraer y marcar ADN de una muestra de tejido infectado (por ejemplo, de las fosas nasales del enfermo). La unión del ADN del paciente a alguna secuencia de un gen del la microplantilla nos descubriría al agente infeccioso responsable. De modo similar, las micromatrices que se están desarrollando podrían detectar si los bioterroristas han liberado cepas específicas de carbunco u otros gérmenes exóticos. Para bien o para mal, las micromatrices de ADN podrían también determinar la predisposición genética de los individuos a numerosas enfermedades. La mayoría de las diferencias genéticas que se dan entre las personas revisten la forma de polimorfismos de un solo nucleótido, o SNP, en los que aparece cambiada una letra. Se podría construir una micromatriz con variantes de genes asociadas a N UEVA GENÉTICA
Expresión génica
No acaban ahí las apasionantes aplicaciones de la técnica. Desde otra óptica particular, ha atraído también el interés de los investigadores en los últimos años. Nos referimos al estudio de perfiles de expresión génica. Para obtenerlos, se mide la cantidad de diferentes ARNm en una muestra de tejido. En general, cuantas más copias de ARNm produce una célula, más
Resumen / Mic rom atri ces Las micromatrices, o plantillas, de ADN pueden rastrear cientos de miles de
reacciones moleculares en paralelo en una rejilla parecida a un portaobjetos de microscopio. Pueden diseñarse matrices para detectar genes específicos o para medir la actividad génica en muestras de tejido. Estas propiedades están resultando de un valor
incalculable para los biólo-
gos los oncólogos y los farmacólogos. Se está investigando tambiéncelulares, en la aplicación de las microplantillas para convertirlas en instrumentos seguros y rápidos de diagnóstico y prognosis. El estudio se extiende a las plantillas de proteínas, muy prometedo ras, asi-
mismo, en diagnóstico e investigación biológica. La información básica y diagnóstica proporcionada por las matrices de ADN
y de proteína permitirá, andando el tiempo, instaurar terapias personalizadas
.
23
Predicción del desarrollo del cáncer
D
e acuerdo con las investigaciones realizadas en Rosetta Inpharmatics y el Instituto Oncológico de Amsterdam, las micromatrices habrán de ayudarnos a distinguir entre pacientes de cáncer con diferente prognosis. Se determinaron los niveles de actividad (expresión) de los genes en tumores de mama pequeños y localizados en mujeres jóvenes, controladas durante los cinco años subsiguientes a su extirpación quirúrgica. Luego, se descubrió que las afectadas presentaban diferentes perfiles de expresión, como se llaman los patrones generales de activi dad en una selección de genes tumorales. El análisis matemático reveló
PERFILES DE EXPRESION
FRACCION DE PACIENTES CON METASTASIS
l)
s e l a u d i iv d n i s e t n ie c a P
ra e n e g n ió s re p x e
0/20 (0%)
EL SINO DE LAS PACIENTES
6/21
e d s e l fir e p e d d a id r a il im s r o p s a d a p u r g (a
(29%)
100 s i s ta s
á t e
18/24 (75%)
)
80
10/13 (77%) (con respecto a los niveles de tejido mamario normal)
GEN QUE MUESTRA INCREMENTO DE ACTIVIDAD
m e60 d e r b li
0
das), pero tales métodos no siempre operan bien o con la presteza requerida. Las micromatrices de expresión génica pueden subsanar tales lagunas mediante la aplicación que se ha venido a llamar “culpable por asociación”, incluso sin ninguna pista previa sobre el papel de los genes en el organismo. El método en cuestión se funda en el hallazgo de la interrelación génica. Los genes no son islas. Si los de un tejido se activan e inactivan juntos en respuesta a un estímulo —un fármaco, una infección o una mutación inducida—, nos es dado suponer que esos genes que operan a coro intervienen en la misma vía reguladora; es decir, los genes trabajan juntos o en serie para inducir una respuesta celular. Resulta, pues, razonable pensar que las funciones de un gen del grupo, en principio desconocidas, se parecen a las de los otros genes cuya responsabilidad se ha resuelto ya. Apl ica ció n en far mac olo gía
Los investigadores en el dominio de los fármacos se benefician también de las
ventajas de ese método “culpable por asociación”, cuando buscan proteínas cuya participación en procesos biológicos implicados en enfermedades se desconocía de antemano. Una vez descubiertas esas proteínas, pueden engrosar la lista de blancos para desarrollar nuevas y mejores medicinas. Peter S. Linsley, colaborador nuestro en Rosetta Inpharmatics, se propuso identificar nuevos blancos para fármacos contra enfermedades inflamatorias, en las que el sistema inmunitario pervierte su misión y lesiona partes del cuerpo. Investigó, por tanto, qué genes de los leucocitos del sistema inmunitario aumentaban y disminuían su producción de proteínas en paralelo con el gen de la interleucina-2 (IL-2), una proteína involucrada en los procesos inflamatorios. Obtuvo la respuesta tras conseguir perfiles de expresión génica de leucocitos expuestos a diversas sustancias químicas y ejecutar después un complejo programa de ajuste de pautas para detectar un conjunto de genes que se activaban o desactivaban al
N E H C A R A S );
Mujeres con un perfil de expresión de “mala prognosis”
je ta n e20 rc o P
GEN QUE MUESTRA DISMINUCION DE ACTIVIDAD
a h c re e d (
Mujeres con un perfil de expresión de “buena prognosis”
40
Niveles de actividad de genes individuales
24
que las pacientes cuyos perfiles de expresión génica se parecían al perfil de “mala prognosis” (el esquema medio de tumores que generaban metástasis) tenían más probabilidades de sufrir una rápida recidiva que las pacientes cuyos perfiles se parecían a la signatura de “buena prognosis” (el modelo típico de tumores que no se propagaron). Si estos resultados se confirman en otras investigaciones, los médicos podrán algún día detectar a los pacientes que necesitan el tratamiento más agresivo, basándose en la similaridad entre sus perfiles de expresión y un perfil de buena o mala prognosis normalizado.
0
50
100
150
200
Tiempo (meses)
tiempo que se activaba el gen IL-2. En ese conjunto de genes había uno cuya función no se había determinado todavía por otros medios. Más o menos al mismo tiempo, otros investigadores del Instituto Pasteur de París confirmaron, por su lado, con un método diferente, que este gen intervenía en el metabolismo del IL-2. Los hallazgos combinados sugieren que la proteína codificada por el gen en cuestión podría convertirse en óptimo blanco para los antiinflamatorios. En los departamentos de investigación de los laboratorios farmacéuticos se utilizan los perfiles de expresión génica de una manera distinta: para detectar (y eliminar) fármacos que ejercerían efectos secundarios inaceptables. Quienes estudian si un determinado compuesto podría dañar el corazón pueden compilar un compendio de perfiles de expresión génica para células cardíacas expuestas a fármacos ya existentes o a sustancias químicas. Si tratan células cardíacas con el fármaco ensayado, pueden esperar que el ordenador compare la firma TEMAS 38
a rd e i u q z i( S IC T A M R A H P IN A T T E S O R I, A D E U Y G N O H
Matrices de proteínas: Una nueva opción N. Leigh Anderson y Gunars
Valkirs
L
as plantillas de proteínas se asemejan a las de ADN, con la salvedad de que portan polipéptidos en vez de moléculas nucleotídicas en su superficie; pueden medir los niveles de proteínas en los tejidos. De hecho, realizan el trabajo de un modo más directo y, según algunos resultados, con mayor precisión. Las micromatrices de proteínas presentan una característica exclusiva: su capacidad de revelar cuáles, de entre las miles de proteínas de un tejido, interaccionan entre sí. Esa gavilla de propiedades que rodean a las plantillas de proteínas las hacen muy atractivas para los biólogos. Y de i nterés general resulta la posibilidad de que estos dispositivos aumenten espectacularmente el número de enfermedades que
para la comercialización (al principio para uso de investigadores) se basan en los anticuerpos; cada una de estas moléculas del sistema inmunitario reconoce una proteína y se une a ella o, más exactamente, a un segmento determinado de la misma. Algunas de estas plantillas de anticuerpos funcionan por el método del emparedado: las proteínas reconocidas por una matriz quedan atrapadas entre dos anticuerpos diferentes, uno que sujeta la proteína y otro que hinca un marcador fluorescente en la molécula cautiva. Para que las matrices de anticuerpo desarrollen todo su potencial en el dominio de la investigación y del diagnóstico, habrá que vencer al menos dos graves inconvenientes. Uno
los médicos podrán diagnosticar sin demora en sus consultas. Su utilidad diagnóstica reside en parte en que estas microplantillas, a diferencia de las de ADN, pueden extraer información del plasma sanguíneo, muy fácil de obtener. La mayoría de las enfermedades, desde las infecciosas hasta las complicaciones cardíacas o renales, dejan huellas identificables en la sangre, en forma de proteínas segregadas o perdidas. Más aún, en una sola prueba, las matrices podrían medir muchas, si no todas las proteínas indicadoras de problemas médicos. Considérese, por comparación, que las pruebas diagnósticas habituales sólo pueden detectar una o unas pocas proteínas específicas de enfermedade s. El diseño de plantillas de proteínas se parece al de las de ADN. Cientos o miles de diferentes proteínas se disponen (en millones de copias) en puntos específicos de una rejilla sobre una placa del grosor de una galleta. La unión de proteínas de una muestra de sangre a una plantilla revela la naturaleza y la cantidad de proteínas de la muestra. Los tipos de proteínas que pueden disponerse sobre la matriz o plantilla dependen de las cuestiones que se quiera abordar. Pero las matrices cuyo desarrollo se halla casi listo
es la necesidad de técnicas que produzcan en masa anticuerpos muy diferentes a la vez, no sólo unos cuantos (los necesarios para unirse a un blanco, y, de ese modo, revelar incluso pequeñas cantidades en una muestra). Este problema se halla en vías de solución. El segundo obstáculo es más fundamental. La ciencia médica hasta ahora sólo ha descubierto unas docenas de los miles de proteínas capaces de señalar la presencia o el progreso de una enfermedad. Hasta que los fabricantes de matrices sepan qué proteínas tienen que identificar, sólo podrán buscar un número limitado de marcadores de enfermedades en una muestra de tejido. Se ha multiplicado la búsqueda de nuevas proteínas específicas de enfermedades. Cuando converjan los avances en manufactura de anticuerpos y el descubrimiento de proteínas, estaremos ante una segunda generación de matrices de proteínas que bien podrían transformar la investigación médica y la práctica clínica.
N. Leigh Anderson y Gunars Valkirs colaboran en la investigación de matrices de proteínas.
UNA PLANTILLA DE PROTEINA EN ACCION
L
os médicos podrían recurrir a la “prueba del emparedado”para identificar el agente infeccioso responsable de la enfermedad de un paciente. ¿Es un virus normal de la gripe o se trata de una cepa nueva letal? ¿Podría ser el
culpable el bacilo de la tuberculosis, el carbunco, la viruela o los microorganismos de la fiebre Q diseminados por bioterroristas? A través de los pasos siguientes se nos ofrece la respuesta. ANTICUERPO MARCADO
PROTEINAS EN SANGRE
ANTICUERPO PARA UNA PROTEINA DEL CARBUNCO
ANTICUERPOS CON MARCADOR FLUORESCENTE
ANTICUERPO PARA UNA PROTEINA DE VIRUELA
ANTICUERPO PARA UNA PROTEINA DE LA GRIPE
PROTEINA DE LA SANGRE ANTICUERPO DEL CARBUNCO PUNTO QUE INDICA ANTICUERQUE EL PACIENTE POS NO LIGADOS TIENE CARBUNCO
LECTURA
ESCANER
MATRIZ DE ANTICUERPO
1
Se aplica la muestra de sangre extraída de un paciente a una plantilla o matriz, que consta de anticuerpos asignados a cuadrados específicos de una rejilla. Cada cuadrado incluye múltiples copias de un anticuerpo capaz de unirse a una proteína específica procedente de un solo organismo; representa, pues, un agente infeccioso concreto.
2
Se aplican anticuerpos marcados con fluorescencia capaces de unirse a un segundo lugar de las proteínas reconocibles por los anticuerpos de la matriz. Si una proteína de la sangre se ha unido a la matriz o plantilla, uno de los anticuerpos fluorescentes se unirá a esa proteína, englobándola en un emparedado de anticuerpos.
3
Se introduce la matriz en un escáner para determinar qué microorganismo está presente en el cuerpo del paciente. En este caso, se muestra que el culpable es una cepa de carbunco.
N G I S E D N A M ID E N H C S D E R A J
resultante con el compendio de perfiles. Una firma que se corresponda con la producida por sustancias que se sabe que dañan a las células cardíacas haría saltar la alarma. Un compendio de perfiles de expresión génica puede también ayudar a explicar por qué un fármaco produce determinados efectos secundarios. Apremia hoy saber por qué los inhibidores de la proteasa, que están salvando la vida de los infectados con el VIH (el virus del sida), pueden producir altos niveles de colesterol y triglicéridos en sangre, provocar extrañas distribuciones de la grasa corporal e inducir
tituirá un fruto valioso de los perfiles moleculares obtenidos con las plantillas de ADN. Pero muchos médicos confían en resultados incluso mejores: sueñan con herramientas rápidas de diagnóstico que dividirían a los pacientes con síntomas similares en grupos distintos; cada grupo recibiría un tratamiento diferente y apropiado. Igual que quedó demostrado en el caso del linfoma, al que nos referíamos al principio de este artículo, los oncólogos necesitan imperiosamente un procedimiento para identificar a los pacientes que requieran, desde el principio, un tratamiento radical.
ayudar a distinguir subgrupos de pacientes asmáticos, diabéticos u obesos que demandan una terapia específica. Hablamos de aplicaciones en las que se está trabajando ya. Antes de que las micromatrices desarrollen todo su potencial en investigación y diagnóstico, deberemos allanar algunos obstáculos. Las plantillas, los escáneres y otros accesorios siguen siendo caros. Podemos suponer que los costes bajarán con el tiempo. Ahora bien, aunque bajen los precios, las técnicas pueden ser inaplicables, cuando menos al principio, para las consultas de los médicos o los la-
resistencia a la insulina. de que el hígado influye enConscientes la síntesis y degradación de los lípidos (el grupo que incluye el colesterol y los triglicéridos) y las lipoproteínas, nuestro grupo de Rosetta, en colaboración con Roger G. Ulrich y su equipo en Abbott Laboratories, decidimos comprobar si un inhibidor de la proteasa —ritonavir— inducía algunos de estos efectos secundarios interesando al hígado. Mediante una microplantilla que representaba unos 25.000 genes de rata obtuvimos perfiles de expresión génica de tejido hepático de rata expuesto a diversos compuestos con toxicidad potencial para el hígado. Agrupamos luego los compuestos en razón de la similarida d de sus firmas de expresión sobre unos 2400 genes que respondían intensamente a estas substancias. A continuación, administramos ritonavir a hígados de rata y comparamos los perfiles de expresión génica resultantes con los que habíamos conseguido antes. Descubrimos que el ritonavir activaba genes que normalmente permanecían silentes en respuesta a un agente, bien conocido, que rebaja los niveles de lípidos. El ritonavir frena también la síntesis de proteínas que acostumbran ensamblarse en proteosomas, unas estructuras que degradan proteínas que han perdido su utilidad, entre ellas las lipoproteínas. De tales descubrimientos se desprendía que el ritonavir incrementaba los niveles de lípidos en el hígado —y por consiguiente en sangre— en parte elevando la síntesis hepática de lípidos e inhibiendo la degradación de lipoproteínas. Una investigación más detenida de la interacción entre el ritonavir y las vías metabólicas de lipoproteínas y de proteosomas habrá de proporcionarnos claves para reducir sus efectos secundarios.
investigación grupo deLa Rosetta, junto condeelnuestro Instituto Oncológico de Amsterdam, sobre el cáncer de mama pone de relieve la forma en que podemos servirnos de las matrices de expresión génica. En este caso, buscábamos una prueba para determinar qué jóvenes pacientes con cáncer precoz de mama (sin metástasis en los ganglios linfáticos) necesitaban, y cuáles no, un tratamiento sistémico con quimioterapia para evitar la extensión del tumor después de la cirugía. Aunque las normas en uso recomiendan un tratamiento sistémico para el 90 % de estas mujeres, muchas de ellas probablemente evitarían metástasis incluso sin ese tratamiento. Desgraciadamente, los métodos estándar no detectan a las mujeres con mayor riesgo. Empezamos por generar perfiles de expresión génica para tumores en cerca de 100 mujeres de menos de 55 años de edad cuyo curso clínico posquirúrgico se había seguido durante más de cinco años. Al principio trabajamos con una micromatriz que representaba 25.000 genes humanos. Descubrimos, por fin, que cierta firma producida po r unos 70 genes in dicaba claramente que no tardarían en aparecer metástasis. Además, la pauta opuesta revelaba un pronóstico esperanzador. Resulta evidente que algunos tumores están programados para producir metástasis antes de alcanzar el tamaño de un guisante, mientras que otras masas mayores no están programadas para propagarse. Nuestros resultados tendrán que ser confirmados por otros antes de que los perfiles de expresión génica se conviertan en una rutina en el tratamiento del cáncer de mama. De aquí a dos años, es probable que muchos hospitales empiecen a ensayar los perfiles de expresión génica en su orientación diagnóstica, no sólo para el cáncer de mama, sino también para otros tipos. Hay enfermedades que necesitan mejores herramientas de diagnóstico. Los perfiles de expresión génica podrían
boratorios Escasean dicos y los normales. técnicos que poseanlos losméconocimientos o el instrumental para preparar correctamente las muestras de tejido a utilizar con matrices. Lo que es más, para diagnosticar, pongamos por caso, una enfermedad del hígado por los cambios de expresión génica en células hepáticas, un médico tendría que obtener tejido de ese órgano. Y éste no es fácilmente accesible.
Aju ste de t rat ami en tos
Disponer de un arsenal de fármacos con menos efectos secundarios cons26
Tales problemas, hoy graves, se resolverán con un grano de ingenio. A veces, los tejidos más accesibles pueden funcionar como aceptables sustitutos de los inaccesibles. Además, en algunos casos, no tendrán que usarse las micromatrices; podrían aportar la información necesaria para idear nuevas pruebas diagnósticas, que pueden revestir otras formas.
Conforme mejore nuestra comprensión de las células y del organismo entero, los médicos podrán diagnosticar con mayor precisión, indicar terapias más depuradas (incluidas probablemente las genéticas) y ajustar sus tratamientos a las características genéticas y al estado fisiológico real de cada paciente. Hacia el año 2020, las organizacion es sanitarias podrían conservar, en sus ordenadores, modelos del estado molecular de sus afiliados, simulaciones virtuales que podrían actualizarse constantemente con datos de micromatrices u otros a partir de sus visitas al médico y con nueva información científica sobre biología celular. BIBLIOGRAFIA COMPLEMENTARIA GENOMICS , GENE EXPRESSION AND DNA A RRAYS . David Lockhart y Elizabeth Winzeler en Nature, vol. 405, págs. 827836; 15 de junio, 2000. E XPERIMENTAL A NNOTATION OF THE H UMAN G ENOME USING M ICROARRAY TECHNOLOGY. D. D. Shoemaker et al. en Nature, vol. 409, págs. 922-927; 15 de febrero, 2001.
TEMAS 38
ARN
W O L S IN W E S E R E T
MicroARN El descubrimiento de unas moléculas de ARN diminutas en las células eucariotas ha modificado de raíz nuestro conocimiento sobre los mecanismos de regulación de la expresión génica César Llave
principio de loselaños noventa del siglo pasado, estudio genético del nemátodo Caenorhabditis elegans revelaba la existencia de unas moléculas de ácido ribonucleico (ARN) diminutas y peculiares. Se las denominó pequeños ARN transitorios, pues se hallaban asociados con el control temporal del desarrollo larvario. La investigación ulterior descubrió que esos pequeños ARN eran, en ver-
A
S U R I V E D IA M O N O X A T E D L A N IO C A N R E T IN E IT M O C :
E T N E U F ; E V A L L R A S E C
dad, reguladores de la la expresión de ciertos genes. Inhibían traducción de sus ARN mensajeros en momentos clave del desarrollo. (El ARNm porta la información necesaria para la síntesis de proteína.) Desde entonces, y fruto del interés creciente hacia el conocimiento de tales moléculas, se han identificado numerosos ARN de pequeño tamaño con capacidad de modular la expresión génica en orga-
nismos muy dispares: protozoos, hongos, plantas y animales. Los pequeños ARN transitorios, o temporales, forman parte de un grupo numeroso y heterogéneo de ácidos ribonucleicos que no codifican proteínas. Se trata de los microARN. Aunque comenzamos a conocer sus funciones, queda mucho por averiguar en torno a su misión reguladora de genes y sus mecanismos de operación. Poco antes de que se descubrieran los microARN, se dio con un proceso de inesperado alcance: la interferencia por ARN. De este mecanismo de silenciamiento génico subsiguiente a la transcripción se encarga un segundo tipo de moléculas de ARN, los pequeños ARN interferentes. ARN in ter fer ent e
El silenciamiento por ARN constituye un proceso altamente específico de degradación del ácido ribonucleico. Se desarrolla después de la transcripción génica. Afecta, pues, a la viabilidad de los ARN producidos por los genes. Para poner en marcha ese mecanismo degradativo de desactivación génica se requiere la presencia en el citoplasma de moléculas de ARN bicatenario con una secuencia de nucleótidos idéntica a la de los genes diana. Los ARN bicatenarios son reconocidos por una RNasa de tipo III, específica de ARN de doble cadena. Esta enzima los procesa para dar lugar a pequeños dúplices de ARN, de 21 a 26 nucleótidos de longitud. De entre estos diminutos ARN interferentes , los menores (21 a 23 nucleótidos) se integran en un complejo ribonucleoproteico (RISC), donde actúan a modo de guías para el reconocimiento de los ARN diana. Fruto de la interacción entre este complejo y el ARN men1. FOTOGRAFIA AL MICROSCOPIO electrónico de partículas víricas del virus del mosaico dorado de la judía ( Begomovirus germiniviridae).
28
TEMAS 38
E V A L L R A S E C
Partícula vírica ARN vírico
Intermediario replicativo (ARN-dc)
(1)
RNasaIII
Procesamiento del ARN-dc
ARN polimerasa vírica
(2) 3'
ARN vírico
21-22 nts
5' RNasa III / piARN
RISC/piARN
(3) 23-26 nts
(4) Degradación de ARN vírico
2. MODELO DE SILENCIAMIENTO GENICO en las plantas, inducido por un virus. Una vez en el citoplasma celular, las partículas víricas se desensamblan y liberan su ARN genómico. El virus utiliza sus propias ARN polimerasas para replicarse en la célula infectada; se vale para ello de intermediarios de ARN de doble cadena (ARN-dc)1 ).( Estos inductores de silenciamiento se reconocen y procesan por una
sajero homólogo se produce la degradación y desactivación de este último. Además, los pequeños ARN interferentes pueden unirse por sí mismos con los ARN diana; operan entonces como iniciadores en una reacción de polimerización catalizada por una ARN polimerasa dependiente de ARN. Utilizando de molde el ARN diana, se genera un ARN bicatenario, que es reconocido de nuevo por la RNasaIII y degradado (“digerido”) en pequeños ARN int erf erent es. En numer osos experimentos se ha confirmado que basta la sola expresión “artificial” de moléculas inductoras (ARN bicatenario) en tejidos vegetales o en cultivos celulares para disparar la respuesta de silenciamiento, incluso en ausencia de posibles genes diana. Los pequeños ARN interferentes de mayor tamaño (24 a 26 nucleótidos) no participan en la degradación de los ARN mensajeros. Antes bien, se desplazan a otras células del organismo, donde inician una nueva respuesta de silenciamien to génico. N UEVA GENÉTICA
3'
5' Señal de silenciamiento
Producción de piARN
RNasaIII, para srcinar pequeños ARN interferentes (piARN)2( ). Los piARN de menor tamaño se asocian con un complejo enzimático (RISC) para el reconocimiento y posterior degradación del ARN homólogo vírico (3 ). Los piARN de mayor tamaño se hallan asociados con la señal sistémica, que lleva la respuesta de silenciamiento a otras partes de la planta 4( ).
Silenciamiento génico en eucariotas
Pero, ¿qué funciones cumple el silenciamiento génico subsiguiente a la transcripción en los organismos eucariotas? Se ha comprobado que tal represión constituye un mecanismo de defensa contra ácidos nucleicos exógenos (transposones, por ejemplo) y, en el caso de las plantas, contra los virus. Cerca del 90 % de los virus vegetales poseen genomas de ARN de cadena sencilla, que se multiplican en la célula infectada a través de ARN bicatenarios muy estables. Estos virus replicativos son inductores muy potentes que disparan el mecanismo de interferencia por ARN y permiten que la célula infectada degrade el ARN vírico, para así superar la infección. El grupo de David C. Baulcombe, del Laboratorio Sainsbury en Norwich, Inglaterra, detectó pequeños ARN interferentes correspondientes a secuencias de varios virus vegetales (así, el virus X de la patata o el virus del cascabeleo del
tabaco) en plantas infectadas. Demostró que los virus eran reconocidos como objetivo a abatir por la maquinaria celular de silenciami ento. El grupo de Baulcombe demostró también que la infección de plantas transgénicas conducí a a la represión del transgén; se trataba de plantas que expresaban constitutivamente el gen de la proteína de fluorescencia verde (GFP) infectadas con un virus quimera que portaba este mismo gen marcador integrado en su genoma. Si la expresión del genoma vírico está regulada post-transc ripcionalment e por un mecanismo de silenciamiento, también lo estará la expresión de cualquier secuencia homóloga a la vírica; en este caso, GFP formaba parte de la secuencia vírica en el virus quimera. Pequeños ARN endógenos
La producción y acumulación de pequeños ARN interferentes constituye, pues, un paso clave en la ruta de silenciamien to génico. Su síntesis se 29
E V A L L R A S E C
3. MICROFOTOGRAFIA de partículas víricas del virus “y” de la patata Potyvirus ( potyviridae).
loci dentro de los cinco cromosomas de la planta. Su longitud es de 21 a 25 nucleótidos, similar a los pequeños ARN interferentes srcinados en respuesta a un fenómeno de silenciamiento inducido por un ARN bicatenario. Estos pequeños ARN presentan homología perfecta de secuencia con genes codificadores de proteínas, transposones o genes estructural es, aunque la mayoría son homólogos con regiones intergénicas del genoma. Funciones de los pequeños ARN end óge nos
produce en repuesta a un inductor exógeno de silenciamiento, sea la forma replicativa de un virus o sea cualquier otro ARN con estructura bicatenaria. Pero de la misma manera que la maquinaria celular está preparada para regular la expresión de genes foráneos por mediación de pequeños ARN interferentes, los organismos eucariotas han desarrollado diversas estrategias, algunas de ellas basadas en la codificación y síntesis de pequeños ARN, para el control de la expresión de sus propios genes. En diversos laboratorios se ha venido aplicando, casi simultáneamente, una misma estrategia para la multiplicación (“amplificación”) , clonación y secuenciación de pequeños ARN endógenos en protozoos, plantas, nemátodos, moscas y mamíferos. La disponibilidad del genoma completo del nemátodo C. elegans , de Dr os op hi la me la no ga st er y de la 30
planta Arabido psis thaliana ha facilitado la caracterización de estas diminutas moléculas de ARN endógenas. En particular, nos ha permitido acotar el srcen de cada pequeño ARN en el genoma de estos organismos, identificar entre ellos microARN, pequeños ARN interferentes, así como otras muchas moléculas de diminutos ARN cuya estructur a, biogénesis y función nos son todavía desconocidas. Además, el estudio de todos estos ARN nos ha permitido descubrir genes potencialmente regulados por un fenómeno de silenciamien to génico posttranscripcional e identificar posibles genes sujetos a una regulación mediada por microARN. En el caso de Arabido psis se han definido más de 200 secuencias únicas de pequeños ARN. Algunas de estas secuencias presentan homología con una sola región del genoma, mientras que otras se alojan en múltiples
Cerca del 20 % de los pequeños ARN descritos en plantas presentan homología perfecta con secuencias genómicas dentro de regiones codificadoras de proteínas, pertenezcan a genes o a transposones. Basados en ese fenómeno peculiar de los vegetales, cabe sospechar que esta clase de pequeños ARN pudiera ser el resultado del silenciamien to de ARN endógenos. En el caso de los transposones, existen pruebas que ponen de manifiesto la capacidad de las plantas para limitar su expresión por medio del silenciamiento génico. De hecho, la naturaleza altamente repetitiva de los transposones, unida a la alta probabilidad de que se integren en el genoma y srcinen por ende transcritos con el potencial de formar estructuras bicatenarias, facilita que sean dianas de silenciamiento posttranscripcional. Habida cuenta del número estimado de transposones en el genoma de Arab id opsi s , el porcentaje de pequeños ARN localizados en transposones es sustancialmente mayor que el de alojados en genes codificadores de proteínas. De ello se desprende que tales moléculas intervienen de una manera decisiva en el control de la expresión de estos elementos móviles. De forma análoga, la expresión de genes codificadores de proteínas podría estar modulada por una estrategia reguladora similar. Algunos de los genes que portan secuencias homólogas con pequeños ARN producen preARN mensajeros cuya configuración en dúplex estable podría ser reconocida por la RNasaIII específica de doble cadena para su procesamiento en pequeños ARN interferentes. En otros casos, los ARN mensajeros diana podrían servir de molde para la síntesis de un ARN bicatenario en una reacción catalizada por una TEMAS 38
ARN polimerasa dependiente de ADN; éste, lo mismo que el anterior, sufriría una fragmentación, por parte de la maquinaria celular de silenciamiento, en pequeños ARN interferentes que contribuirían a la degradación de secuencias homólogas o estrechamente emparentadas. En conclusión, puesto que la expresión de transposones y algunos genes codificadores de proteínas parece estar regulada por un proceso de silenciamiento génico, cabe pensar que una porción de los pequeños ARN existentes en el citoplasma celular forman parte de una población más extensa deplanta pequeños ARN rentes. La puede, así, interferecurrir a esta herramienta molecular, no sólo para defenderse ante los virus, sino también para controlar la expresión de sus propios genes.
Transgénica GFP
A R R E T A L G IN , H IC W R O N , Y R U B S N I A S IO R O T A R O B A L , E B M O C L U A B . C ID V A D
Virus quimera PVX-GFP 166K
25K
12K
8K
GFP
CP
: E T N E U F
0
13
; E V A L L R A S E C
20
Días post-infección
4. LOS VIRUS SON INDUCTORES y diana de la respuesta de silenciamiento génico. Por expresión del transgén, las plantas con la proteína GFP emiten fluorescencia verde bajo iluminación ultravioleta (día 0). Tras la infección con el virus quimera PVX-GFP la hoja se torna roja (coloración de la clorofila bajo luz ultravioleta) debido a la desactivación por silenciamiento génico del transgén GFP (días 13 y 20). PVX es el virus X de la patata.
Regiones intergénicas
Aproximadamente el 90 % de los pequeños ARN encontrados en Arabidopsis thaliana y en otros organismos se corresponde con regiones intergénicas. Se sabe que tales zonas desempeñan un papel crucial en la producción de microARN implicados en la regulación de genes endógenos del organismo. Esto es así porque algunos de estos microARN homólogos con regiones intergénicas son al mismo tiempo complementarios con la secuencia de ARN mensajeros de genes endógenos de la planta. Como resultado de dicha complementariedad, los microARN se emparejan con sus ARN mensajeros diana e interfieren con su expresión. Las regiones intergénicas no son, en absoluto, meros espaciadores en el curso de la secuencia genómica. Para ser más exactos, algunas de las hasta hoy consideradas regiones intergénicas constituyen, en realidad, genes codificadores de precursores para la síntesis de microARN. En efecto, las regiones intergénicas que srcinan estos microARN se corresponden con secuencias dotadas de capacidad suficiente para formar precursores de ARN con estructura secundaria estable. Estos precursores de doble cadena son los sustratos sobre los que actúa una RNasaIII, similar a la enzima que da srcen a los pequeños ARN interferentes, para generar microARN endógenos. Regulación de los microARN
Parece demostrado que la acumulación de estos microARN se regula durante el desarrollo del organismo. En el caso de los microARN descritos N UEVA GENÉTICA
en C.elegans, su producción tiene lugar a lo largo de las distintas fases del desarrollo del gusano. Tampoco en las plantas encontramos una síntesis aleatoria de microARN, sino que, en su mayoría, los microARN presentan patrones de acumulación específicos para un tejido determinado. Debe resaltarse también el alto grado de persistencia, a lo largo de la evolución biológica, de la producción de estos microARN. Algunos de los identificados en nemátodos son exactamente iguales que los encontrados en mamíferos; algunos de los
microARN encontrados en A. thaliana se hallan también presentes en Nico tiana bent hami ana y en Oryza sativa . MicroARN: biosíntesis y expresión
Algunos microARN descritos en plantas y animales presentan características idéntica s, en cuanto a su biosíntesis y expresión, a las de los pequeños ARN transitorios de C. elegans . De hecho, estos últimos pueden englobarse bajo la denominación común de microARN.
N R A s
o ñ e u q e P
Arabidopsis thaliana
s i s p o id b a r A n
e
. U .U E E , N O G E R
1 110 100 90 80 70 60 50 40 30 20 10
O E D L A T A T S E D A ID S R E V I N
U , N O T G IN R R A C . C S E M A J
: E T N E U F
1
2
3
; E V A L L
4
R A S E C
1 - Genes codificadores 2 - Transposones 3 - Genes estructurales 4 - Regiones intergénicas 5. DISTRIBUCION Y LOCALIZACION de pequeños ARN en el genoma de Arabidopsis thaliana . En el eje de ordenadas de la gráfica se muestran el número de loci de la planta homólogos con pequeños ARN.
31
Desde el punto de vista estructural, los microARN son similares a los pequeños ARN interferentes. Presentan, sin embargo, ciertas peculiaridades distintivas. Todos los microARN tienen un tamaño próximo a los 21 nucleótidos y se expresan durante el desarrollo del organismo. Se originan a partir de precursores de ARN con estructura a modo de horquilla estable, que contienen la secuencia del microARN en uno de sus brazos; su producción depende de una enzima RNasaIII específica de ARN de doble cadena pero distinta de la que srcina los pequeños ARN interferent es.
plantas, para los que no se han encontrado genes diana con homología de secuencia completa, funcionen como pequeños ARN transitorios; se emparejarían parcialmente con los ARN mensajeros diana y bloquearían su traducción. En el caso de las plantas se han identificado, mediante análisis informático, algunos genes que presentan homología parcial con microARN; podrían, pues, estar regulados potencialmente por un mecanismo de este tipo. Aparentemente, existen diferencias sustanciales entre los ARN mensajeros regulados por pequeños ARN
los genes diana y afecten a otros procesos distintos de la traducción: la maduración del ARN mensajero o la localización y estabilidad del ARN. En este sentido, algunos microARN animales se emparejan con dominios, de aproximadamente 8 nucleótidos, situados en regiones 3’ no codificadoras de los ARN mensajeros. Dichos dominios están implicados en la represión post-transcripcional de la expresión de genes diana; se encargan, sobre todo, de la estabilidad del mensajero y de la eficacia traduccional. Recientemente, el grupo de James C. Carrington, de la Universidad esta-
Si abien todos los microARN responden unos criterios establecidos de expresión y biogénesis, divergen en su función respectiva, en muchos casos todavía desconocida. Se va avanzando, pese a todo. Los pequeños ARN transitorios codificados por los genes lin-4 o let-7 se hallan implicados en el desarrollo temporal del nemátodo C. elegans e inhiben la traducción de los ARN mensajeros dianas; interaccionan mediante emparejamiento parcial de bases con su región 3’ no codificadora. De esta manera, el reconocimiento del mensajero diana por parte del microARN no depende de una complementariedad de secuencia absoluta entre ambos, sino que ocurre incluso en presencia de varios errores. Es posible que algunos de los microARN identificados en animales y
transitorios y los ARN mensajeros supuestamente modulados por otros microARN. En primer lugar, la secuencia complementaria entre el ARN mensajero de la planta y el microARN se encuentra mayoritariamente en el interior de la región codificadora de la proteína; en la región 3’ no codificadora del ARN mensajero se ubica la de los pequeños ARN transitorios lin-4 y let-7 en nemátodos. En segundo lugar, la región complementaria entre el ARN mensajero de la planta y el microARN es única, mientras que son múltiples las secuencias complementarias dentro la región 3’ no codificadora de los mensajeros regulados por pequeños ARN transitori os. Otra posibilidad es que los microARN animales y vegetales interaccionen con los ARN mensajeros de
tal de Oregón, que algunos microARN de demostró plantas están capacitados para dirigir el procesamiento específico de ARN mensajeros diana y hacerlo de forma similar al modo en que los pequeños ARN interferentes fragmentan los ARN. Estos microARN se srcinan, a partir de regiones intergénicas del genoma de la planta, por medio de transcritos precursores de ARN con estructura secundaria estable. La expresión de tales microARN se regula durante el desarrollo de A. thaliana y, también, de N. bent hamiana y O. sativa ; donde igualmente se generan a partir de regiones intergénicas dotadas de capacidad para formar transcritos con estructuras secundarias firmes. Los microARN presentan homología de secuencia total o parcial con los ARN mensajeros codificadores de factores de transcripción asociados a procesos de desarrollo y crecimient o en plantas. Entre ellos se encuentran los codificados por los genes SCARECROW , relacionados con el control de la división radial en células de la raíz y la señalización hormonal y luminosa, por CUP-SHAPED-COTYLED ONS 2 , implicado en la formación del meristemo apical de la raíz, por genes de respuesta a auxinas y por genes vinculados al desarrollo floral, o por genes PHAB ULOSA y PH AVOLU TA , que regulan la iniciación del meristemo y el desarrollo foliar. En este proceso, el ARN precursor o pre-microARN (con estructura secundaria) es reconocido por una RNasaIII; la enzima lo corta específicamente para producir el microARN correspondiente. Este se integra en un complejo ribonucleoproteico (RISC) a modo de señal de especificidad, ya que determina el reconocimiento de los ARN mensajeros diana complementarios. Fruto de la interacción entre el RISC y el ARN mensajero se p roduce el corte de la molécula de mensajero
Gen X
Gen Y
IGR
ADN genómico
(1) Precursor de microARN Núcleo Citoplasma
(2) Precursor de microARN con estructura secundaria estable
(3) RNasa III E V A L L R A S E C
RNasa III MicroARN (21-25 nucleótidos)
6. PRODUCCION DE microARN a partir de regiones intergénicas del gen oma. La región intergénica (IGR), situada entre los genes X e Y, se transcribe independientemente y genera un transcrito precursor de microARN ( 1 ). Este se procesa para dar lugar a un precur2 ). La estructura bicatenaria del sor definitivo con estructura secundaria estable ( precursor es reconocida por una RNasaIII, enzima que lo digiere y libera la secuencia del microARN (3 ).
32
TEMAS 38
en la región de emparejamiento entre ambos. Aunque estos microARN parecen actuar de forma similar a como lo hacen los pequeños ARN interferentes, existe una diferencia notable en su biogénesis. Los pequeños ARN interferentes resultan del procesamiento de una molécula inductora de ARN bicatenario y, por tanto, se inscriben en una población numerosa de moléculas que se sintetizan a instancias de un fenómeno de silenciamiento. En otras palabras, cada molécula de ARN de doble cadena se procesa para dar lugar a multitud de pequeños ARN interferentes. Los microARN, por elycontrario, identidad propia se srcinanposeen independiente y específicamente a partir de una región intergénica del genoma de la planta; por eso, el procesamiento de cada ARN bicatenario precursor da lugar a un único tipo de microARN.
(1)
RNasaIII
N UEVA GENÉTICA
Caenorhabditis elegans
microARN lin-4
(2)
Lin-14 ARNm diana
3'
UTR An
3'
(3)
5'
Inhibición de la traducción 3'
UTR An
Incidencia en el desarrollo vegetal
Pero, ¿cuáles son las implicaciones del procesamiento, por microARN, de estos genes sobre el desarrollo de la planta? La mayoría de los genes diana cuya expresión se halla regulada por microARN se corresponde con factores de transcripción. Algunas de tales proteínas intervienen en el control del desarrollo de los meristemos. Este hecho sugiere que las rutas metabólicas dependientes de microARN pudieran estar implicadas en el control de la expresión génica durante el desarrollo de los organismos eucariotas. Veamos un ejemplo ilustrativo de conexión entre ambos procesos: las mutaciones de A. thaliana en los genes caf , que codifica la RNasaIII, y hen1 , de función desconocida. Las plantas mutantes presentan importantes defectos en el desarrollo; además, su maquinaria celular es incapaz de producir microARN. En consecuencia, todos los procesos reguladores que dependen de microARN se verán afectados en las plantas mutantes. Los genes PHA BUL OSA y PHA VOLUTA ofrecen también un interés particular. Se caracterizan por presentar homología casi perfecta con microARN. Según parece, las plantas portadoras de mutaciones puntuales en la región del ARN mensajero de estos genes, que es complementaria con el microARN correspondiente, muestran considerables alteraciones fenotípicas. Estos ejemplos mencionados ponen de manifiesto que la actividad reguladora de los microARN es esencial para la correcta formación, dife-
E V A L L R A S E C
ARN precursor de microARN lin-4
3'
5'
7. INHIBICION DE LA TRADUCCION de ARN mensajeros (ARNm) por pequeños ARN transitorios en el nemátodo Caenorhabditis elegans. El microARN lin-4 (o pequeño ARN transitorio lin-4) se srcina a partir de un precursor de ARN con estructura secundaria estable por mediación de una RNasaIII ( 1). El microARN interacciona a través de un emparejamiento parcial de bases con la región 3’ no codificadora (UTR) del ARN mensajero diana (2); bloquea su traducción (3).
renciación y desarrollo de los tejidos de la planta. MicroARN y de fen sa a nti vír ica
Los virus, parásitos obligados, necesitan utilizar los factores, procesos y estructuras del huésped para su propia multiplicación y consiguiente invasión sistémica. Estos factores, procesos y estructuras forman la base de las interaccion es de compatibilidad entre el virus y el huésped que posibilitan el arraigo de la infección. En el marco de interacciones virushuésped, el segundo puede desplegar mecanismos moleculares que, como el silenciamiento génico, le permite bloquear algunas de las etapas del ciclo vírico y oponerse a la infección. Los virus de plantas, y al menos algún virus animal, han evolucionado bajo esta presión selectiva y han cifrado proteínas supresoras de la respuesta de silenciamiento génico, con la merma consiguiente de su eficacia protectora. Se descubrió, hace poco, que algunas de estas proteínas supresoras de srcen vírico se interponían en la actividad reguladora de los microARN.
En determinadas plantas, las proteínas supresoras de silenciamiento inhiben el procesamiento, mediado por microARN, de algunos ARN mensajeros que codifican factores de transcripción. Tal labor obstructora se refleja en defectos del desarrollo de la planta: repercute en el crecimiento y la morfología. Con otras palabras, estas proteínas de srcen vírico modulan la expresión de genes propios de la planta al entorpecer procesos básicos de su metabolismo celular. Es posible que los virus, a través de sus proteínas supresoras, aprovechen esa obstrucción de la regulación génica mediada por microARN para activar o desactivar genes del huésped y así crear las condiciones favorables para la prosecución de su ciclo biológico. Cabe también que las plantas sinteticen microARN de una manera espontánea, constitutivam ente o en respuesta ante la infección vírica; en ambos casos, con la facultad de reconocer secuencias víricas y promover su desactivación. De modo general, la expresión de proteínas supresoras durante la infección vírica inhibiría no sólo la regulación programada de 33
genes de la planta, sino también cualquier alteración que los microARN ocasionaran en secuencias del virus. Algunos de estos hipotéticos microARN complementarios con secuencias víricas podrían ejercer funciones similares a los microARN que regulan la expresión de los genes endógenos de la planta. No sólo instarían el procesamiento de los ARN víricos, sino que se dejarían sentir en su traducción, estabilidad y localización celular. MicroARN y te rap ia g éni ca
Al grupo de Thomas Tuschl, del Instituto Max Planck de Química Biofísica, debemos la demostración de que la transfección de pequeños ARN interferentes en cultivos de células de humanos y otros mamíferos impedía la expresión de genes endógenos homólogos. El hallazgo afianzó el estudio funcional de genes en células de mamíferos y abrió las puertas a su eventual uso con fines terapéuticos. Hoy, la expresión artificial de pequeños ARN en cultivos celulares se ha convertido en un método eficaz y específico para silenciar genes homó-
tivos celulares produce inmunidad frente a la infección vírica: inducen la destrucción de los ARN víricos. En el caso particular del virus del sida, la investigación in vitro reveló que el ARN vírico del complejo formado tras la entrada del virus en la célula (donde se forma un ADN vírico intermediario a partir del ARN vírico) se degrada rápidamente; la integración del ADN provírico en el genoma del huésped se bloquea en células inoculadas con pequeños ARN dirigidos contra diversas regiones del genoma vírico. Además de utilizar directamente los virus como secuencias diana, otras
A diferencia de lo observado en las plantas, los microARN identificados en organismos animales no presentan un alto grado de homología con los correspondientes genes diana. Más bien se emparejan mediante complementariedad parcial de bases resultando en la supresión de la síntesis de proteína; sin embargo, los ensayos in vitro confirman que las células animales poseen la maquinaria bioquímica necesaria para realizar eficazmente el procesamiento de ARN mensajeros por microARN, siempre y cuando el grado de homología de secuencia entre ambos sea alto. La mayor parte de los genes regulados negativamente por microARN en los animales están implicados en procesos de diferenciación celular y apoptosis, organogénesis y desarrollo temporal.
logos. Denominada, su srcen, silenciamiento génicoenmediado por ARN interferente, esta técnica innovadora se fundamenta en la desactivación dirigida de genes de interés por mediación de pequeños ARN sintetizados in vitro . Los ARN así sintetizados operan de modo idéntico a como lo hacen los pequeños ARN interferentes o alguno de los microARN descritos en plantas: reconocen los ARN mensajeros mediante complementariedad de secuencia y guían su degradación. Hasta la fecha, los pequeños ARN interferentes se han empleado con éxito para inhibir la replicación in vitro de diversos virus patógenos (poliovirus, virus VIH y virus de la hepatitis C). En numerosos estudios se ha comprobado que la transfección de estas pequeñas moléculas en cul-
estrategias alternativas empleanla estos pequeños ARN para silenciar expresión de otros ARN mensajeros celulares que cifran proteínas cruciales del ciclo vírico. Encontramos un ejemplo ilustrativo de ello en el control de la infección por VIH en células de mamíferos mediante el silenciamiento del ARN mensajero celular que codifica el factor CD4; esta proteína constituye el principal receptor de VIH en células humanas. La transfección de células T con pequeños ARN interferentes provocó la disminución de la expresión de CD4 en la superficie de la mayoría de las células; en consecuencia, cayó sustancialmente la tasa de infección por VIH. Se han cosech ado res ultados similares si tomaba por diana el receptor CCR5, un correceptor necesario para la entrada de VIH en la célula. Otro ejemplo prometedor del potencial de la aplicación de ARN interferente en terapéutica nos lo ofrece la protección contra la “hepatitis fulminante”, enfermedad que se manifiesta en forma de fallo hepático severo. Los ensayos realizados en ratones han demostrado que el tratamiento con microARN contra receptor Fas situado en la superficie celular bloquea el desarrollo de la enfermedad y mejora la recuperación, aun cuando tales moléculas se apliquen después de la inducción de la enfermedad. El receptor Fas es un mediador de la muerte celular en el hígado, se produzca ésta por apoptosis o por necrosis. La reducción de la expresión de Fas en etapas precoces de la hepatitis podría prevenir su progresión hacia un estado más virulento de la enfermedad. Una de las aplicaciones de la técnica de interferencia por ARN que mayores expectativas levanta es el empleo de pequeños ARN en terapia génica contra el cáncer en humanos. Algunos estudios se han centrado en la inhibición de la expresión de la telomerasa, enzima que se manifiesta
(1)
Precursor de microARN
IGR/microARN
(2)
5' 3'
3'
5' microARN
RNasaIII
(3) Gen diana
ARNm diana 3'
5'
An
3'
RISC/ MicroARN
(4) E V A L L R A S E C
5' ARNm
5'
3
3' ARNm
n
' 5' A 8. MODELO DE PROCESAMIENTO DE ARN mensajeros mediado por microARN. El gen codificador del microARN alojado en la región intergénica (IGR/microARN) se transcribe y da srcen a un precursor de microARN con estructura secundaria estable ( 1 ). Una RNasaIII específica de ARN bicatenario reconoce y degrada al precursor (2 ). El microARN así generado se integra en un complejo enzimático (RISC), donde actúa como guía para la identificación de los ARN mensajeros (ARNm) diana ( 3 ). El complejo RISC-microARN provoca el procesamiento del ARNm para dar lugar a dos nuevas especies de ARN: 5’ ARNm y 3’ ARNm (4 ).
34
TEMAS 38
. U .U E E , N O G E R O E D O D A T S E L E D D A D I S R E V I N U , N O T G IN R R A C . C S E M A J :
E T N E U F
; E V A L R A S E C
PLANTA INFECTADA
PLANTA SANA
PLANTA SANA
PLANTA INFECTADA
en la mayoría de las células malignas pero no en las células normales. Estos trabajos confirman la capacidad de bloquear la producción de telomerasa en líneas celulares cancerígenas (carcinomas y sarcomas) en las que se habían introducido ARN interferente. Sin embargo, la aplicación de esta nueva técnica de interferencia por ARN debe antes solucionar algunos problemas claves que limitan su uso con fines clínicos en humanos. El principal reto reside en la necesidad de desarrollar sistemas eficaces que permitan introducir directamente estos pequeños ARN en el tejido de interés. La mayoría de los métodos empleados resultan ineficientes o inadecuados. Algunos, como la transfección hidrodinámica, permiten aplicar estas moléculas en los órganos del ratón, si bien su puesta en práctica para uso clínico en humanos es inviable. Otro problema que guarda estrecha relación con la aplicación de los pequeños ARN interferent es estriba en su estabilidad dentro del citoplasma celular. Estos microARN se hallan sujetos a degradación por enziN UEVA GENÉTICA
PLANTA TRANSGENICA
PLANTA SANA
PLANTA TRANSGENICA
9. SINTOMATOLOGIA INDUCIDA por un virus en plantas de Arabidopsis thaliana. Las proteínas supresoras de silenciamiento génico producidas durante la infección vírica se interponen en el metabolismo celular al alterar la expresión de genes de las plantas. Las plantas transgénicas que expresan constitutivamente proteínas supresoras muestran una sintomatología idéntica a la observada durante la infección por virus.
mas celulares, por cuya razón el efecto silenciador sobre los ARN mensajeros desaparece al cabo de unas pocas generaciones. Para solventar el problema, algunos grupos están trabajando en el diseño de vectores víricos capaces de expresar microARN de forma estable y en cualquier célula o tipo celular. Habrá que superar otra barrera: el alto grado de especific idad en el reconocimiento de los mensajeros diana por parte de los microARN. Sépase que basta un solo cambio nucleotídico en la secuencia del gen diana para desarbolar por entero la respuesta de silenciamiento. Una situación cuya importancia se hace patente al observar la enorme diversidad de ciertos virus patógenos de humanos que, como el VIH, presentan altas tasas de error en su replicación y muestran una gran variabilidad genómica entre las personas infectadas.
El estudio y conocimiento de estas pequeñas moléculas reguladoras nos han abierto las puertas a una nueva concepción en el entendimiento del control de la expresión génica. BIBLIOGRAFIA COMPLEMENTARIA GLIMPSES OFA TINY RNA WORLD. G. Ruvkun en Science, vol. 294, págs. 797-799; 2001. AN RNA MICROCOSM . D. Baulcombe en Science, vol. 297, págs. 2002-2003; 2002. RNA INTERFERENCE. G. Hannon en Nature, vol. 418, págs. 244-251; 2002. R EVEALING M ICRO -RNA S IN P LANTS . L. Jones en Trends in Plant Science , vol. 7, págs. 473-475; 2002. SIRNAS: A NEW WAVE OF RNA-B ASED THERAPEUTICS. G. Coburn y B. Cullen en Journal of Antimicrobial Chemotherapy, DOI: 10.1093/jac/dkg166; 2003.
35
Interferencia de ARN La mayoría de las células animales y vegetales contienen un sistema de silenciamiento de genes. Se valen del mismo para triturar el ARN que producen Nelson C. Lau y David P. Bartel
C
uando se observa una célula viva sobre el porta de un microscopio parece sosegada. Pero debajo de esa quietud externa se esconde una frenética actividad bioquímica. El genoma de ADN del interior de una célula vegetal o animal contiene millares de genes. Dejada a su aire, la maquinaria de transcripción de la célula expresaría de inmediato cada uno de los genes del genoma: desenrollaría la doble hélice del ADN, transcribiría cada gen en su correspondiente ARN mensajero de una hebra (ARNm) y, por último, traduciría los mensajes de ARN en sus proteínas. Ninguna célula podría trabajar con semejante alboroto. Deben las células silenciar la mayoría de sus genes, para permitir que entre en acción el subgrupo apropiado. En la mayoría de los casos, el código del ADN de un gen se transcribe en ARNm sólo si una determinada proteína se ha acoplado, en su ensamblaje, a una región reguladora especial del gen. Algunos genes, sin embargo, son tan subversivos, que nunca se les debería conceder la libertad de expresión. Si a los genes de los elementos genéticos móviles se les dejara emitir sus mensajes de ARN, podrían saltar de un punto a otro del ADN produciendo
cáncer u otras enfermedades. En la misma senda, si se permitiera a los virus expresar su mensaje sin ningún control, no tardarían en secuestrar los mecanismos celulares de síntesis de proteínas para aplicarlos a la fabricación de proteínas víricas. Las células disponen de medios preventivos y de contragolpe. Hace ya algún tiempo se identificó un sistema, la respuesta de interferón, que las células humanas despliegan cuando los genes víricos penetran en su interior. La respuesta puede impedir la expresión de casi todos los genes. El proceso recuerda la parada de las prensas por orden gubernativa. En fecha más reciente se descubrió un mecanismo de seguridad mucho más enérgico y preciso; lo poseen casi todas las células animales y vegetales. A este sistema censor se le conoce por interferencia de ARN, abreviado en iARN. Cuando se expresa un gen amenazador, la maquinaria de la iARN corre a silenciarlo: intercepta y destruye sólo el ARNm transgresor, sin perturbar los mensajes de los genes restantes. Conforme se ha ido sondeando el modo de operar del censor celular y determinando los estímulos que lo activan, ha aumentado el interés de los expertos. Pues, en línea de prin-
cipio, cabe la posibilidad de idear formas de obligar a la iARN a silenciar genes implicados en el cáncer, en las infecciones víricas y en otras patologías. De lograr materializarlo, nos hallaríamos ante un prometedor campo, inédito, para la medicación. Mientras llega ese día, los investigadores que trabajan con plantas, moscas y otros organismos experimentales han conseguido ya que la iARN suprima casi cualquiera de los genes en estudio, lo que les permite intuir la función del gen. En cuanto herramienta de investigación, la iARN ha tenido un éxito inmediato. Merced a ella, centenares de laboratorios abordan ya cuestiones que estaban lejos de su alcance hace escasos años. Aunque la mayoría de los grupos de investigación utilizan la interferencia de ARN como medio para conseguir un fin, algunos se han centrado en la propia naturaleza del fenómeno. A nosotros nos interesa el papel de la maquinaria de la iARN en el desarrollo normal de plantas, hongos y animales, sin excluir al hombre. Un silencio extraño
Las primeras pistas sobre la existenc ia de la iAR N apar ecieron catorce años atrás. Richard A. Jorgensen, hoy en la Universidad de
G N I N N E R B A N A J
36
TEMAS 38
Arizona, y Joseph Mol, de la Libre de Amsterdam, cada uno por su cuenta, insertaron en petunias de flor púrpura copias adicionales del gen de su pigmento nativo. Confiaban en que las plantas, así manipuladas, dieran flores de un violeta más intenso. Pero los pétalos de sus petunias se tiñeron de manchas blancas. Jorgensen y Mol dedujeron que las copias extra habían despertado la censura de los genes del pigmento púrpura, incluidos los genes naturales de las petunias; el fenómeno provocó la aparición de flores variegadas o albinas. A esta censura doble, sobre un gen
sistencia opuesta por las plantas a la infección. El grupo reveló que las plantas no sólo podrían inactivar genes específicos en los virus, sino que también estos agentes podrían disparar el silenciamiento de genes seleccionados. Algunas plantas de Dougherty que no lograron suprimir por sí mismas sus genes CP, se infectaron con el virus, que se replicaba sin problemas en las células vegetales. Cuando los investigadores midieron, más adelante, el ARN transcrito por los genes CP de las plantas afectadas, vieron que estos mensajes se habían desva-
razón por la cual no puede formar doble hélice con el ARN mensajero. La escena estaba preparada para el experimento decisivo. Se llevó a cabo, unos cinco años más tarde, en los laboratorios de Andrew Z. Fire, de la Institución Carnegie de Washington, y Craig C. Mello, de la facultad de medicina de la Universidad de Massachusetts. Fire y Mello sospecharon que las preparaciones anteriores de ARN con sentido y ARN antisentido que se inyectaban a los gusanos carecían de la pureza exigida; probablemente, contenían trazas de ARN bicatenario. Quizás ese ARN bicatenario
insertado y el gen nativo correspondiente, la llamamos cosupresión. Más tarde se observaría en hongos, mosca del vinagre y otros organismos. Las primeras pistas para desentrañar el misterio en torno al silenciamiento de los genes llegaron unos años después. William G. Dougherty, de la Universidad estatal de Oregón, había empezado con su grupo a investigar plantas de tabaco especiales: habían sido manipuladas genéticamente para que incluyeran en su ADN varias copias del gen CP del virus del mosaico del tabaco ( Marm or eroden s). El gen CP determina la proteína de la cubierta vírica. Cuando estas plantas se expusieron al virus, algunas permanecieron inmunes a la infección. Dougherty atribuyó la inmunidad a la cosupresión. Las plantas reaccionaban ante la expresión inicial de sus genes CP de srcen foráneo mediante la inactivación de dicha expresión y, luego, mediante el bloqueo también de la expresión del gen CP del virus invasor (que necesita la proteína de la cubierta para producir la infección). El laboratorio de Dougherty prosiguió su trabajo. Demostró que la inmunidad no requería la síntesis de la proteína de la cubierta por las plantas; debía haber algo, relacionado con el ARN transcrito desde el gen CP, que diera cuenta de la re-
necido casi por completo: la infección había provocado la inactivación de los genes CP. Mientras tanto los biólogos que experimentaban con el nemátodo Caenorhabditis elegans , un gusano diminuto y transparente, andaban desconcertados en su empeño por averiguar qué ocurría cuando usaban ARN “antisentido” para inactivar los genes que estudiaban. Propio del ARN antisentido es emparejarse con una secuencia determinada de ARNm, a la manera en que dos hebras complementarias de ADN se entrelazan para formar una hélice doble. Cada hebra de ADN o de ARN es una cadena de nucleótidos, representados por las letras A, C, G y U (este último en el ARN) o T (en el ADN). Un nucleótido de C se enlaza siempre con otro de G, y uno de A se empareja con otro de U o de T. Una hebra de ARN antisentido se une con la hebra de un ARNm complementario y crean una estructura bicatenaria, incapaz de traducirse en una proteína útil. Con el paso de los años, estos experimentos con ARN antisentido acometidos en diversos organismos alcanzaron un éxito desigual. Sin embargo, fue para todos una sorpresa que el ARN “con sentido” bloqueara la expresión del gen. El ARN con sentido tiene la misma secuencia que el ARNm diana,
alertaba a los censores, pensaron.FiPara comprobar sus sospechas, re, Mello y sus colaboradores inocularon en los nemátodos ora ARN monocatenario, ora ARN bicatenario, correspondiente al gen unc-22 . (Este gen desempeña un papel destacado en la función muscular.) Las cantidades elevadas de ARN unc-22 monocatenario, con sentido o antisentido, apenas si ejercían efecto alguno en los gusanos. Pero bastaban unas pocas moléculas del ARN unc-22 bicatenario para inducirles espasmos, en ellos y en su progenie. Se hallaban ante un signo inequívoco de que algo había comenzado a interponerse en el camino de la expresión del gen unc-22 . Fire y Mello observaron idéntico, y sorprendente, efecto silenciador en casi todos los genes que estudiaron, desde los musculares a los genes de la fertilidad y viabilidad. Denominaron a este fenómeno “interferencia de ARN” (iARN), para resaltar el papel clave del ARN bicatenario en la censura del gen correspondiente. Los estudiosos de vegetales y hongos centraron también su atención sobre el ARN bicatenario en su búsqueda del responsable del silenciamiento. Demostraron que las hebras de ARN que podían replegarse sobre sí mismas para formar largas tiras de ARN bicatenario constituían potentes
N UEVA GENÉTICA
37
A N O Z I R A E D D A ID S R E V I N U
/ N E S N E G R O J . A D R A H IC R
1. LAS PRIMERAS PISTAS sobre la existencia de censores de genes en el reino vegetal se recabaron entre las petunias púrpura. Tras insertar genes adicionales de pigmentos izquierda).), echaron flores ribeteadas de blanco o con extensas zoen plantas nas albinasnormales (centro y(derecha
inductores del silenciamiento. Otros análisis revelaron que, en la cosupresión, se requería un gen que capacita a las células para convertir ARN monocatenario en ARN bicatenario. De tal gavilla de hallazgos cabía inferir que las petunias de Jorgensen y Mol reconocían los genes extra del pigmento como insólitos (por un mecanismo que sigue siendo misterioso) y convertían su ARN mensajero en ARN bicatenario, que provocaba el silenciamiento tanto de los genes extra como de los nativos. El concepto de un ARN bicatenario inductor explica también por qué la infección vírica amordazaba los genes CP en las plantas de Dougherty. El virus del tabaco Marmor erodens había producido ARN bicatenario del genoma vírico completo a medida que iba reproduciéndose, un fenómeno que acontece con muchos virus. Las células vegetales respondían bloqueando los mensajes de ARN de todos los genes asociados con el virus,
incluidos los genes CP incorporados en el ADN de la planta. Nadie entendía que semejante sistema, enérgico y ubicuo, de regulación de la expresión génica hubiera pasado inadvertido tanto tiempo. Levantado el velo del misterio que le envolvía, genéticos y bioquímicos se han volcado ahora en el análisis de su mecanismo de acción. Corte y empalme de los mensajes genéticos
Pronto se confirmó el fenómeno de la interferencia de ARN en algas, platelmintos y mosca del vinagre; ramas dispares del árbol evolutivo. La demostración de su presencia en células humanas típicas y de otros mamíferos resultó, sin embargo, una empresa harto más compleja. Cuando una célula humana se infecta con un virus que produce ARN bicatenarios, puede entrar en un estado que podríamos llamar de “cerrojazo”: la enzima PKR bloquea
Resumen / Inte rfe ren cia d e AR N Se ha convertido en práctica rutinaria la inserción, en organismos experimentales, de genes manipulados. Se trata de una técnica conocida desde hace cierto tiempo. Más reciente, sin embargo, es el descubrimiento de un medio eficaz y apropiado para silenciar, en el mismo interior celular, un gen específico. En su mayoría, las células animales y vegetales poseen mecanismos internos que emplean formas insólitas de ARN, molécula mensajera genética, para silenciar determinados genes de un modo natural. Esta maquinaria ha evolucionado. Protege de genes hostiles a la célula y regula la actividad de los normales durante el desarrollo celular. La investigación del proceso abre el camino para la fabricación de fármacos que se apoyen en los mecanismos de interferencia de ARN para prevenir o curar ciertas patologías.
38
la traducción de todos los ARN mensajeros otra enzima,—normales la ARNasa yL,víricos— destruyeyindiscriminadamente los ARN mensajeros. Estas reacciones ante los ARN bicatenarios se integran en la respuesta al interferón; se les considera componentes de la misma porque se disparan más fácilmente después de que las células hayan estado expuestas a interferones, moléculas que las células infectadas segregan para alertar de peligro a las células vecinas. Por desgracia, cuando los investigadores introducen ARN bicatenarios artificiales (los empleados para inducir la interferencia de ARN en gusanos y moscas) en el interior de células de mamíferos maduros, la respuesta al interferón inactiva todos y cada uno de los genes de la célula. Se requería, pues, conocer mucho mejor el funcionamiento de la interferencia de ARN antes de que pudiera usarse de manera rutinaria sin hacer saltar las alarmas del interferón. Además de los investigadores pioneros, que ya hemos mencionado, Thomas Tuschl, de la Universidad Rockefeller, Philip D. Zamore, de la facultad de medicina de la Universidad de Massachusetts, Gregory Hannon, del Laboratorio Cold Spring Harbor de Nueva York, y muchos otros han contribuido a lo que hoy sabemos sobre el mecanismo de la transferencia de ARN. ¿Cómo opera la iARN? En el interior de una célula, el ARN bicatenario sale al encuentro de la enzima “Dicer” (“la tajadora”). Mediante el proceso químico de hidrólisis, Dicer trocea las cadenas largas de ARN en fragmentos, a los que se da el nombre de ARN de interferencia pequeños (ARNip). Cada ARNip consta de unos 22 nucleótidos. La enzima Dicer corta el ARN bicatenario por puntos especiales, en lugares ligeramente no coincidentes; por ello, cada ARNip resultante tiene dos nucleótidos sin emparejar en un extremo. El dúplex ARNip se TEMAS 38
desenrolla entonces; una de las cadenas del dúplex se carga en un ensamblaje de proteínas para formar el complejo silenciador inducido por ARN (CSIR). Dentro del complejo silenciador, la molécula de ARNip se acomoda de suerte tal, que las moléculas de ARN mensajero puedan encontrarse con ella. El CSIR se las verá con millares de ARNm diferentes que hay en cualquier célula en cualquier momento. Pero el ARNip del CSIR se adherirá sólo al ARN mensajero que exactamente se complemente con su propia secuencia nucleotídica. Por
en el interior de las células de mamíferos se convertía, de la noche a la mañana, en una realidad al alcance de la mano. En cuestión de horas, con los ARNip puede desactivarse casi cualquier gen de interés en un cultivo celular, incluidas las líneas celulares humanas. Y, además, el efecto persiste durante días, lo suficiente para completar un experimento.
tanto, a diferencia de la respuesta del interferón, el complejo silenciador es muy selectivo a la hora de escoger su ARNm objetivo. Cuando un ARN mensajero que encaje finalmente se haya adherido al ARNip, la enzima “Slicer” (“rebanadora”) parte en dos la cadena de ARN. El CSIR libera entonces los dos trozos de ARNm (incapacitados ahora para dirigir la síntesis de proteína) y prosigue en su labor. En sí mismo, el CSIR permanece intacto, libre para salir al encuentro de otro ARN mensajero y escindirlo. A través de esa vía, la iARN censora emplea trozos de ARN bicatenarios a modo de lista negra para identificar y silenciar los correspondientes ARN mensajeros. El equipo liderado por David C. Baulcombe, del Laboratorio Sainsbury en Norwich, detectó ARNip en vegetales. Posteriormente, el grupo de Tuschl los aisló de la mosca del vinagre y demostró su papel en la silenciación de genes, tras sintetizar ARNip artificiales y usarlos para dirigir la destrucción de ARNm dianas. Cuando lo consiguió, Tuschl se planteó si estos trocitos de ARN podrían deslizarse en las células de los mamíferos sin suprimir la red de alerta de la respuesta del interferón, que habitualmente se desentiende de los ARN bicatenarios de menos de 30 pares de nucleótidos. Introdujo ARNip sintéticos en cultivos de células de mamíferos. El experimento ratificó lo esperado. Se silenciaron los genes diana; nunca se activó la respuesta de interferón. Los éxitos de Tuschl sirvieron de acicate para muchos investigadores. Desde hacía tiempo, los genéticos habían conseguido introducir genes nuevos en las células de mamíferos, sirviéndose de vectores víricos. Pero bloquear un gen de interés para determinar su función propia podría llevar meses de trabajo en el laboratorio. Ahora, el sueño dorado de silenciar con facilidad un gen particular
Los estudiosos de gusanos vegetales se encuentran con unay ventaja añadida: en estos organismos, el efecto censor se extiende y difunde más allá del punto en que se introdujo el ARN bicatenario. En razón de ese carácter sistémico, se han aprovechado en gusanos las posibilidades que ofrece la iARN, con sólo alimentarlos de bacterias genéticamente manipuladas para que sinteticen el ARN bicatenario correspondiente al gen que se desea silenciar. Fácil de inducir y poderosa en su acción, la interferencia de ARN aviva la imaginación de los científicos. Secuenciados ya genomas enteros de diversos organismos, podemos recurrir a la interferencia de ARN para explorar, de una manera sistemática, qué sucede cuando se silencia un gen. Es lo que han realizado cuatro grupos en millares de experimentos paralelos; cada uno se encargó de inactivar, en C. elegans , un gen diferente. Se ha emprendido un estudio similar de genomas enteros de plantas; varios equipos se han aunado para acometer una investigación exhaustiva de la iARN en células de mamíferos. El potencial que encierra la interferencia de ARN no se le ha escapado a la industria farmacéutica. En algunos laboratorios se recurre a ese fenómeno para rastrear todos los genes de una clase determinada, en busca de objetivos prometedores para nuevos medicamentos. El silenciamiento sistemático de genes mediante la iARN podría permitir descubrir un gen imprescindible para el desarrollo de ciertas células cancerosas, pero menos importante para el de las células normales. Podría entonces crearse un candidato farmacológico que se interpusiera en la síntesis de la proteína de dicho gen y contrastar así la e ficacia del fármaco contra el cáncer. Los laboratorios han apostado fuerte sobre la posibilidad de que el silenciamiento de un gen por iARN se con-
N UEVA GENÉTICA
Una herramienta soñada
Si importante resulta la interferencia de ARN para los biólogos de mamíferos, mayor servicio rinde a quienes investigan en organismos inferiores.
CORTESIA DE LISA TIMMONS UNIVERSIDAD / DE KANSAS; TIMMONS ET AL. ENGENE, VOL. 263; 2001
2. LOS NEMATODOS LUMINISCENTES demostraron que la interferencia de ARN operaba en los animales, no sólo en las plantas. Cua ndo los gus ano s cuy as cél ula s expresan un gen determinante de una proteína fluorescente (izquierda ) se tratan con ARN bicatenario correspondiente al gen, desaparece la luz ( derecha ).
vierta en terapia contra el cáncer, las infecciones víricas, ciertas alteraciones genéticas dominantes y otras enfermedades que podrían controlarse al evitar que los genes implicados sinteticen las proteínas culpables de la patología. En numerosas publicaciones se apunta ya en esa dirección. Al menos seis laboratorios han conseguido, en cultivos de células humanas, detener transitoriamente la proliferación del virus VIH, el de la poliomielitis y el de la hepatitis C. Se expusieron las células a ARNip; las células interrumpieron entonces la síntesis de proteínas cruciales para la reproducción de los agentes patógenos. Más recientemente, los grupos dirigidos por Judy Lieberman, de la facultad de medicina de Harvard, y Mark A. Kay, de la facultad de medicina de la Universidad de Stanford, dieron a conocer que los ARNip inyectados en ratones, en condiciones de presiones extremadamente elevadas, frenaron hepatitis y libraron a muchos de una enfermedad hepática que hubiera acabado con su vida. A pesar de estos éxitos de laboratorio, habrán de pasar años antes de que terapias basadas en la iARN puedan aplicarse en los hospitales. El reto más difícil será posiblemente el de la administración. Aunque el efecto de iARN puede diseminarse en una planta o un gusano, tal propagación no parece que ocurra en el hombre y otros mamíferos. Añádase que los ARNip son muy voluminosos si se comparan con los fármacos al uso; no pueden tomarse como comprimidos, porque el sistema digestivo los destruiría antes de que se absorbieran. Se están ensayando diversas vías para diseminar los ARNip por distintos órganos y conducirlos a través de las membranas externas de las células. Otro método para resolver el pro39
Así funciona la censura genética EXPRESION NORMAL DE UN GEN
DESENCADENANTES DEL SILENCIAMIENTO DEL ARN a ARN bicatenario procedente de elementos genéticos móviles o genes anómalos
NUCLEO CELULAR
Dicer
ADN
La enzima Dicer corta el ARN
Cadena molde del ADN c Precursor de microARN
Par de bases complementarias
Dicer
ARNm ARNip o microARN
SUPRESION DE LA EXPRESION DE UN GEN POR iARN
Proteína
Hebra sencilla de ARNip o microARN Ribosoma
LAS CELULAS luminiscentes manifiestan la traducción correcta de un gen (que codifica la proteína “lámina”) en proteína.
blema de la administración lo aporta la terapia génica. Un gen nuevo que produzca un ARNip particular podría cargarse en el interior de un virus benigno que lo llevaría luego hasta el interior de las células que infectara. A este respecto, el grupo de Beverly Davidson, de la Universidad de Iowa, se ha valido de un adenovirus modificado para introducir genes productores de ARNip en el cerebro e hígado de ratones. Pero la terapia génica aplicada al hombre se enfrenta hoy con dificultades técnicas y normativas. Si dejamos de lado los problemas relacionados con la administración, es obvio que los nuevos planteamientos relacionados con la iARN han levantado un entusiasmo que no desper40
La célula desenrolla las hebras de ARN
taron las técnicas del ARN catalítico, ni el ARN antisentido; ambos métodos podrían usarse, en principio, con fines terapéuticos al impedir la intervención de ARN mensajero nocivos. Esa esperanza se apoya, en parte, en el reconocimiento de que la interferencia de ARN domeña la maquinaria natural de censura de genes que la evolución ha ido perfeccionando en el transcurso del tiempo. ¿Por qué tienen censores las células?
S e cree, en efecto, que el mecanismo de la censura de genes emergió hace unos mil millones de años para proteger algunos precursores de vegetales, animales y hongos contra virus y elementos genéticos móviles. Res-
ARNm
paldan esa tesis los trabajos de Ronald H. A. Plasterk, del Instituto Holandés del Cáncer, y de Hervé Vauch erer, del Institu to Nacional Francés de Investigaciones Agrarias. Demostraron que los gusanos modernos cuentan con la interferencia de ARN para defenderse contra los elementos genéticos móviles y, las plantas, contra los virus. Pero la interferencia del ARN cumple también otras funciones biológicas. Los gusanos y las malas hierbas mutantes, con la enzima Dicer alterada o en cuantía insuficiente, sufren numerosos defectos de desarrollo y no pueden reproducirse. ¿Por qué acarrea alteraciones tan profundas, en animales y plantas, una merma de la enzima Dicer? TEMAS 38
)
; W O L S N I W E S E R E T
d ARNip artificiales administrados mediante moléculas lipídicas
Complejo silenciador inducido por ARN (CSIR)
U
na célula censura la expresión de un determinado gen cuando se interpone en el camino del ARN mensajero (ARNm) transcrito a partir del gen dañino; evita con ello que los ribosomas traduzcan el ARN en proteína activa según lo habitual (panel izquierdo). De la puesta en marcha de la maquinaria de censura se encargan moléculas pequeñas de ARN bicatenario que portan sueltos los extremos. De los ARN bicatenarios, largos y producidos al autocopiarse secuencias génicas (a) o virus (b), Dicer, una enzima tajadora, trocea cortos ARNip. Los precurL sores de microARN (c ), secuencias de ARN reguladoras, resultan tamH C S bién de la acción de la mencionada enzima. Así se nos faculta para, U T S A luego, utilizando moléculas lipídicas, insertar ARNip artificiales en las M O células (d ). H T
s a fi ra g ro c i m ( R E L L E F E K C O R D A ID S R E IV N U
b ARN bicatenario de un virus replicante
Los fragmentos de ARN se separan en cadenas sueltas (panel inferior), que se combinan con proteínas para formar un complejo silenciador inducido por ARN (CSIR). El CSIR aprehende entonces el ARNm que sea complementario de la breve secuencia de ARN. Si el emparejamiento es realmente perfecto el mensaje secuestrado se trocea en fragmentos inútiles (hilera superior). Pero un emparejamiento menos cabal insta una respuesta diferente; por ejemplo, que el CSIR bloquee los movimientos ribosómicos y, con ello, suspender la traducción del mensaje en proteína (hilera inferior).
Si las dos hebras de ARN presentan un alto grado de complementariedad, se produce el corte del ARNm ARN escindido
NO SE SINTETIZA PROTEINA
Emparejamiento incorrecto del ARN
Si las dos hebras están mal emparejadas el CSIR se une al ARNm
De acuerdo con cierta hipótesis, una vez que la naturaleza adquirió un mecanismo tan eficaz para el silenciamiento de genes subversivos en virus y secuencias móviles de ADN, comenzó a pedir en préstamo las virtualidades de la iARN y aplicarlas a diversos fines. Cada célula tiene el mismo conjunto de genes; lo que distingue a una de otra son los genes que se han expresado y los que no. La mayoría de las plantas y de los animales arrancan de una célula embrionaria, que se divide y termina por dar lugar a una multitud de células de diversos tipos. Para que esto ocurra, muchos de los genes que se han expresado en las células embrionarias deben inactivarse conforme va madurando el órgano. Otros genes, hasta entonN UEVA GENÉTICA
Los ribosomas se amarran sobre el ARNm
ces inactivos, entran en funcionamiento. Cuando la maquinaria de la iARN no está ocupada en la defensa contra el ataque, interviene manifiestamente con su ayuda en el silenciamiento de genes celulares normales durante las transiciones del desarrollo, necesarias para formar tipos celulares dispares (neuronas o miocitos, por ejemplo) u órganos diferentes (cerebro y corazón). ¿Qué es entonces lo que mueve a la maquinaria de la iARN a silenciar determinados genes normales en el interior de la célula? En algunos casos, una célula puede producir ARN bicatenario, largo, con ese fin específico. A menudo, sin embargo, los estímulos disparadores son “microARN” (pequeños fragmentos de ARN se-
LA LUMINISCENCIA se desvanece en las células que han captado ARNip artificiales correspondientes al gen “lámina”.
mejantes a los ARNip, aunque distintos por su srcen). Mientras que los ARNip proceden de los mismos tipos de genes o regiones genómicas que terminan por quedar silenciados, los microARN proceden de genes cuya única misión es producir estos ARN reguladores diminutos. La molécula de ARN inicialmente transcrita de un gen de microARN —el precursor del microARN— se pliega sobre sí misma, formando una estructura similar a una horquilla. Con la intervención de la enzima Dicer, se rebana de la horquilla la sección media; la pieza resultante se comporta a la manera de un ARNip, con una salvedad importante: no censurará ningún gen que semeje al que lo ha producido, pero sí a otro distinto. 41
G A T N O C R E H P O T IS R H C E D A I S E T R O C S E N E G A IM E D N O I C A E R C E D A M E T S I S ; 2 0 0 2 , O I L U J E D 4 ; 8 1 4 . L O V ,
3. SI SE LES INYECTA ADN que contiene el gen de la luciferasa, los ratones devienen fotoemisores (izquierda). Pero ese efecto se desvanece si, por el contrario, se les inyecta ARNip correspondiente al gen ( derecha ); se evidencia así una nueva vía para extraer todo el partido posible de la iARN en mamíferos.
la maquinaria de la iARN. Se multiplican los datos indicadores de que los ARNip no sólo atrapan ARN mensajeros para su destrucción, sino que además dirigen el silenciamien to de ADN (en el caso más extremo, elimi-
E R U T A N
N E . L A T E Y E R F F A C C M . P N O T N A
Igual que sucedió con el fenómeno de la iARN en general, los biólogos tardaron en darse cuenta del potencial que encerraban los microARN para regular la expresión génica. Hasta hace poco, sólo tenían noticia de dos microARN, el lin-4 ARN y el let-7 ARN, descubiertos por los grupos de Victor Ambros, de la facultad de medicina de Dartmouth, y Gary Ruvkun, de la facultad de medicina de Harvard. En los últimos años, nosotros, Tuschl, Ambros y otros hemos descubierto centenares de genes adicionales de microARN en gusanos, plantas y hombre. Con Christopher Burge, del MIT, hemos estimado que el hombre tiene de 200 a 255 genes de microARN; ello significa casi un 1 por ciento del número total de nuestros genes. Los genes de microARN se habían escapado a la detección porque los programas informáticos diseñados para examinar montones de datos de secuencias genómicas no se habían afinado para este tipo insólito de gen, cuyo producto final es un ARN, no una proteína. Algunos microARN, en particular los de las plantas, dirigen el proceso 42
de corte y empalme de sus ARNm dianas. Lo demostraron James C. Carrington, de la Universidad estatal de Oregón, y Zamore. Nosotros y Bonnie Bartel, de la Universidad Rice, hemos comprobado que los microARN vegetales se ordenan fundamentalmente hacia genes que intervienen en el desarrollo. Al limpiar sus mensajes procedentes de ciertas células durante el desarrollo, las iARN facilitan que las células maduren en el tipo correcto y formen las estructuras pertinentes. Merece subrayarse que los ARN lin-4 y let-7 , cuya existencia se descubrió en los gusanos en razón de su papel decisivo para pautar el desarrollo, pueden emplear también una segunda táctica. Los ARNm que constituyen la diana de estos microARN, son sólo aproximadamente complementarios de los microARN; tales mensajes no son escindidos. Existe otro mecanismo que bloquea la traducción de los ARN mensajero en proteínas funcionales. A la vista de estos mecanismos diferentes de silenciamiento, los biólogos mantienen fija la atención sobre las funciones de los ARN pequeños y de
nando losdegenes del genoma). En el la mayoría los casos, sin embargo, ADN silenciado no se destruye; sencillamente, experimenta un empaquetamiento más denso para que no pueda transcribi rse. Desde unos comienzos humildes en flores blancas y gusanos contrahechos, nuestras ideas acerca de la interferencia de ARN han recorrido un largo trecho. Casi todas las facetas de la biología, biomedicina y bioingeniería comienzan a verse afectadas por las iARN, al par que la técnica del silenciamiento de genes se extiende por nuevos laboratorios y organismos experimentales. Más aún, la iARN nos plantea muchas cuestiones fascinantes . ¿En qué procesos biológicos repercuten la interferencia de ARN, los ARNip y los microARN? ¿De qué modo los mecanismos moleculares de la iARN operan en el plano atómico y en e l de enlace químico? ¿Qué enfermedades cabe atribuir a deficiencias en la iARN o a los procesos de microARN? A medida que se vayan despejando estos interrogantes, nuestras ideas sobre el fenómeno se irán asentando hasta constituir un sólido fundamento para la medicina genética.
BIBLIOGRAFIA COMPLEMENTARIA RNA I : N ATURE A BHORS A D OUBLE STRAND . György Hutvágner y Philip D. Zamore en Current Opinion in Genetics & Development , vol. 12, n. o 2, págs. 225-232; abril de 2002. GENE SILEN CING IN MAMMALS BY SMALL INTERFERING RNAs. Michael T. McManus y Philip A. Sharp en Natur e Reviews Genetics , vol. 3, págs. 737-747; octubre de 2002. MICRO RNA s: AT THE R OOT OF PLANT DEVELOPMENT ? Bonnie Bartel y David P. Bartel en Plant Physiology , vol. 132, n. o 2; págs. 709-717; junio de 2003.
TEMAS 38
W O L S IN W A S E R E T
EPIGENETICA
El genoma oculto Cuando se daban por conocidos casi todos los datos del ADN, han aparecido dos capas amplias de información en los cromosomas, en buena parte ocultas, que afectan a la herencia, el desarrollo y la enfermedad W. Wayt Gibbs
H
ace unos veinte años, los astrónomos estaban convenc idos de que la rotación de las galaxias no se podía explicar sólo a partir de las leyes de la gravedad y la posición de los cuerpos celestes. Poco a poco empezaron a admitir que el universo no estaba tan vacío como parecía, sino que debía contener algún tipo de materia obscura. Aunque se desconocían su composición química y su funcionamiento, no faltaban indicios de su existencia. La investigación de la materia oscura y, más recientemente, la energía oscura obligó a revisar teorías admitidas; incluso a sustituirlas. Al propio tiempo, sin embargo, se dio un nuevo impulso a la astrofísica y la cosmología. Un fenómeno parecido comienza ahora a producirse en la genética molecular. En 200 3 se celebró el quincuagésimo aniversario del descubrimiento de la doble hélice; el Proyecto Genoma Humano anunció también la terminación del borrador de la secuencia del ADN de Homo sapiens. Se había logrado domeñar el ADN in vitro. Eso se creía. Sin embargo, cuando se compara el genoma de especies sin parentesco próximo y se escudriña el funcionamiento de los cromosomas in vivo , se observan fenómenos inexplicables en el marco de las teorías vigentes. Las revistas y los congresos científicos han empezado a hacerse eco de nuevos datos que contradicen la idea aceptada de que los genes, segmentos de ADN que codifican proteínas, constituyen la única fuente de herencia y encierran los planos de la vida. Del mismo modo en que la materia oscura influye sobre el destino de las galaxias, el genoma oculto ejerce un control del desarrollo y de los rasgos distintivos de los orgagenoma desde nismos, contiene las bacterias mucho más hasta queelgenes hombre. codifiEl cadores de proteínas. Nos hallamos muy lejos de conocer el al cance de ese genoma oculto. Sí sabemos que existen al menos dos capas de información, amén de los genes tradicionales. Una de ellas está entrelazada con el ADN intergénico, las vastas secuencias no codificadoras que interrumpen y sepa-
ran los genes. Desechadas durante largo tiempo por irrelevantes para la síntesis de proteínas, lo cierto es que muchas de estas secciones se han conservado, en su mayor parte intactas, en el transcurso de millones de años de evolución. Cabe, pues, suponer que desempeñarán algún papel indispensable para el organismo. De hecho, un elevado número de las mismas se transcriben en variedades de ARN que realizan funciones muy diversas. Hay incluso quienes sospechan que las diferencias entre individuos de la misma especie, o incluso entre especies, se originan en las variaciones de ese ADN redundante, o “chatarra” por usar el vulgarismo al uso. Más allá de la secuencia de ADN, existe en los cromosomas otra capa de información harto más maleable. Las marcas epigenéticas, incrustadas en una mezcolanza de proteínas y metabolitos, rodean, apoyan y se unen al ADN. Operan a través de códigos crípticos y mecanismos desconocidos. A diferencia de los genes, las señales epigenéticas se asientan, se borran y se reescriben en instantes. Por tanto, mientras que las mutaciones genéticas persisten durante toda una vida, los errores epigenéticos, implicados en una lista creciente de patologías, pueden revertir mediante fármacos. Se están ensayando ya ciertos tratamientos basados en esta estrategia para pacientes de leucemia. Como afirma Carmen Sapienza, de la Universidad de Temple, aumenta el convencimiento de que lo que puede ocurrir en el genoma, termina por suceder. Sapienza comenzó a investigar los fenómenos epigenéticos cuando nadie les prestaba particular atención, por considerárseles anomalías menores. 1. LOS LUNARES DE COLOR MARRON OSCURO del iris podrían deberse a la acción del genoma oculto. Hay rasgos que no se transmiten mediante los genes, sino a través de modificaciones químicas de los cromosomas, cambios que se regulan en parte por fragmentos del ADN redundante. A diferencia de las mutaciones genéticas, estos rasgos heredables son a menudo reversibles; aparecen en unas células y no en otras. (La esfera blanca en el iris no es más que el reflejo de la luz que ilumina el ojo.)
E K P I R K
E I M A J
Los peligros del dogmatismo
Llevará años, quizá décadas, construir una teoría que explique y fundadamente la interacción entre ADN, ARN y señales epigenéticas en un sistema autorregulador. Pero resulta claramente necesario encontrar un nuevo modelo teórico que sustituya al dogma central de la biología, en el que se ha basado, desde los años cincuenta, la genética molecular y la biotecnología. A tenor del mismo, el ADN se transcribe en ARN y éste se traduce en proteínas, encargadas de la mayoría de las funciones biológicas. La informa-
proteínas forman músculos y órganos; otras constituyen enzimas, que catalizan, metabolizan o señalan. Las hay también que regulan genes al unirse a secciones específicas del ADN o del ARN. No es sorprendente, por tanto, que el dogma central de la genética molecular considere, con escasas excepciones, que una secuencia de ADN constituye un gen sólo si se traduce en una proteína. Cuando se dice que el genoma humano consta de unos 27.000 genes, se alude, por lo común, a los genes que codifican proteínas. Se trata de una cifra provisional, pues las esti-
determinen ninguna proteína y produzcan sólo ARN. El término “gen” ha recibido siempre una definición bastante borrosa. Estos genes que sólo producen ARN añaden obscuridad a su significado. Para evitar confusiones, se tiende, de un tiempo a esta parte, a evitar el vocablo gen; para referirse a cualquier segmento que se transcriba en ARN algunos prefieren la expresión “unidad de transcripción”. Durante el Congreso Internacional de Genética que tuvo lugar en julio de 2003 en Melbourne, Claes Wahlestedt, del Instituto Karolinska de
ción genética se almacena en las hebras arrolladas de ADN, concretamente en las bases químicas adenina (A), timina (T), guanina (G) y citosina (C), que se emparejan para formar los peldaños de la escalera de ADN (C con G y A con T). Un gen está constituido por una secuencia determinada de bases, de uno de los lados de la escalera, que especifica una proteína. La síntesis de proteínas, expresión de los genes, discurre en cuatro pasos. Primero, una enzima se une al cromosoma y se desliza a lo largo del gen, transcribiendo la secuencia de una hebra del ADN en una hebra sencilla de ARN. A continuación, los intrones, segmentos del ARN transcrito inicial no codificadores, se eliminan; los fragmentos restantes se empalman para formar ARN mensajero. El ARN mensajero sale entonces del núcleo y pasa al citoplasma, se encuentra con los ribosomas, que lo traducen en una cadena de aminoácidos. Por fin, cada cadena se pliega en función de las interacciones entre sus aminoácidos, formando una estructura tridimensional intrincada, característica de cada proteína. Esta estructura tridimensional les confiere una gran versatilidad. Unas
maciones oscilan 20.000 40.000. Con todo, entre confirma que yno existe una correspondencia clara entre la complejidad de una especie y su número de genes. La mosca del vinagre tiene menos genes codificadores que un nemátodo; el arroz tiene más que el hombre. En cambio, la cantidad de ADN no codificador sí parece acompasar a la complejidad del organismo. Participa de esta idea John S. Mattick, de la Universidad de Queensland en Brisbane. En los organismos superiores, hombre incluido, los genes se dividen en exones, fragmentos codificadores de proteínas, e intrones, extensos fragmentos que no codifican. En los cromosomas humanos, los exones representan menos del 2 por ciento del ADN. Por tanto, los 3000 millones de pares de bases que porta cada célula de nuestro cuerpo deben cumplir alguna otra misión. Sin embargo, los intrones y las largas secuencias de ADN intergénico se han considerado siempre material redundante, “chatarra” evolutiva. Tal visión comienza a tambalearse. Se está descubriendo un número ingente de “genes” con un cometido claramente funcional, aun cuando no
Estocolmo, hizo públicos resultados; de acuerdo con sus sus estimaciones, fundadas en el estudio exhaustivo del genoma del ratón, habría entre 70.000 y 100.000 unidades de transcripci ón, la mitad de las cuales sin función codificadora. Si anda en lo cierto, por cada secuencia de ADN que determina una proteína, habría otra que opere exclusivamente a través de formas activas de ARN; formas que no constituyen meros anteproyectos de proteínas, sino que alteran de forma directa el comportamiento celular. Lo que se predica del ratón podrá, a buen seguro, aplicarse al hombre y a otros organismos. En el Instituto Nacional estadounidense de Investigaciones sobre el Genoma Humano se han comparado extractos de genomas del hombre, vaca, perro, cerdo, rata y siete especies más. Mediante análisis por computador se han identificado 1194 segmentos que presentan, en diversas especies, variaciones sólo menores. De lo que se infiere que se trata de secuencias que contribuyen a la adaptación evolutiva de las especies. Lo más sorprendente es que sólo 244 de estos segmentos se encuentran en el interior de una secuencia nucleica codificadora de proteínas. Alrededor de dos tercios de las secuencias conservadas residen en intrones; el resto se encuentra disperso entre el ADN intergénico. No sería de extrañar que el concepto de ADN “chatarra” se convierta en un ejemplo clásico de cómo la doctrina admitida puede desvirtuar la interpretación de las observaciones. Haber ignorado la posibilidad de que estas secuencias no codificadoras transmitieran información paralela en moléculas de ARN ha constituido uno de los grandes errores sufridos por la biología molecular.
Resumen / Genes ocultos Desde hace tiempo, los genéticos han centrado su atención en la escueta
región del ADN que contiene las instrucciones para la síntesis de proteínas. El ADN restante, que, en el caso de los humanos, alcanza el 98 por ciento del total, se descartaba por redundantes . Pero el descubrimient o de muchos genes ocultos que operan a través del ARN, y no de las proteínas, ha puesto en cuestión ese punto de vista. Tales genes de sólo ARN , cortos y difíciles de identificar, desempeñan, en algu-
nos casos, funciones importantes en la salud y el desarrollo de los orga
nismos.
Intervienen también form as activas de ARN en la regulación de una capa epi-
genética de información heredable que reside en fuera de la secuencia de ADN.
46
los cromosomas, aunque
Más que un mensajero
Con la nueva perspectiva, comienzan a de scu bri rse en el AR N una TEMAS 38
) 8 5 9 1 0 E R U T A N / 8 3 0 .1 0 :1 I O D ( 3 0 0 2 E D O T S O G A E D 0 2 ;
E R U T A N
N E .
L A T E
K I N T A L A P . F R IE V A J E D O IS M R E P N O C O S E R P M I E R
2. GRANDES DIFERENCIAS en el aspecto y la salud de los organismos pueden deberse a pequeños cambios en los genes. Las plantas Arabidopsis , por ejemplo, tienen hojas en forma de cuchara (izquierda ), pero cuando, por manipulación genética, se in-
amplia gama de misiones celulares. Igual que las proteínas, algunos transcritos de ARN interaccionan con otros fragmentos de ARN, con ADN, con proteínas e incluso con moléculas pequeñas. Ahora bien, si las proteínas operan de un modo analógico, el ARN lo hace, siguiendo la metáfora, de un modo digital. Las proteínas se unen a sus moléculas diana por semejanza estructural, es decir, como la llave a su cerradura. El ARN, en cambio, se caracteriza por una secuencia específica, como los códigos postales. Así, un fragmento de ARN puede moverse sin rumbo hasta tropezar con un ADN (u otro ARN) que tenga una secuencia complementaria. Los dos brazos de la escalera unen entonces sus peldaños: las bases C emparejadas con las bases G, las T o U con las A. Los pseudogenes, copias defectuosas de genes funcionales, ofrecen un buen ejemplo de la potencia infravalorada del ARN. La investigación del ADN humano ha puesto de manifiesto la existencia de un número similar de genes y de pseudogenes. Durante decenios, los pseudogenes se habían considerado fósiles moleculares, restos de genes degradados por mutaciones y desechados en el curso de la evolución. Pero hace poco, el equipo dirigido por Shinji Hirotsune, de la Universidad de Saitama, publicó el descubrimiento del primer pseudogén funcional. Hirotsune buscaba obtener ratones transgénicos que portaran el gen sex -let hal (Sxl ) de la mosca del vinagre. La mayoría de los ratones resN UEVA GENÉTICA
terfiere en la acción de un microRNA producido por un gen de sólo ARN, las Arabidopsis mutantes desarrollaron defectos toscos (derecha ). El microARN controla los niveles de actividad de numerosos genes.
pondieron bien a la presencia de ese gen foráneo, que controla la determinación sexual y la expresión de los genes ligados al sexo. Pero en una cepa, el intruso hizo gala de su nombre: todos los ratones de la misma murieron antes de la madurez. El gen Sxl se había insertado en medio de un pseudogén y lo había alterado. Este pseudogén, makorin1-p1 , es una copia jibarizada de makorin1 , un gen antiguo que los ratones comparten con la mosca del vinagre, nemátodos y otras muchas especies. Aunque se ignora la función de makorin1 , sí se sabe que los ratones poseen grandes cantidades de pseudogenes de makorin1 y que ninguno de ellos determina proteínas. Si estos pseudogenes no codifican, cabe preguntarse por qué mueren los ratones que pierden uno de ellos. Por alguna razón, se desactiva makorin1 —y por lo que parece sólo él— cuando se bloquea makorin1-p1 . Con otras palabras, el ARN constituido a partir del pseudogén controla la expresión del gen “real”, cuya secuencia remeda, aun cuando los dos residan en cromosomas diferentes. Por tanto, ‘pseudo’ no es el prefijo que mejor describe la actividad de makorin1-p1 . Resulta todavía prematuro avanzar que muchos pseudogenes srcinan un ARN activo. Pero existe una plétora de otras fuentes dispersas por las regiones obscuras del genoma. A cada gen codificador de una proteína le corresponde una secuencia de ADN complementaria que se asienta en el otro brazo de la escalera y que habi-
tualmente no se transcribe en ARN. Se la denomina a veces copia de seguridad, porque la célula recurre a ella para reparar una lesión del gen. En algunos casos, sin embargo, esta cadena complementaria actúa por su cuenta: mientras el gen se está transcribiendo en ARN mensajero, su alter eg o produce un ARN antisentido, dotado de una secuencia complementaria. Cuando un ARN normal se encuentre con su correspondiente ARN antisentido, las dos hebras se unirán para formar una doble hebra que impide la síntesis génica de la proteína. Se sabía que bacterias y plantas podían fabricar ARN antisentido. Muchos pensaron que, de darse en los mamíferos, constituiría una rareza. Pero en abril de 2003, Galit Rotman y su grupo de la empresa CompuGen, de Tel Aviv, acabaron con tal singularidad. Tras una exhaustiva inspección de las bases de datos del genoma humano, llegaron a la conclusión de que al menos 1600 genes humanos (probablemente muchos más) tenían una cadena complementaria que producía ARN antisentido. Estos ARN en liza podrían suprimir un gen a través del bloqueo de su ARN mensajero. Rotman, sin embargo, sospecha que se sirven del mecanismo de interferencia del ARN (iARN), un sistema de seguridad que las células animales y vegetales utilizan para silenciar genes. Cuando en una célula aparece ARN de doble hebra, las enzimas lo trocean en fragmentos que reciben el nombre de 47
Progresión de la genética
D
esde que la invención de la técnica del ADN recombinante posibilitó el desarrollo de la ingeniería genética, la investigación opera “hacia atrás”. Se escoge un gen de interés, se le estudia en un cultivo celular o en un organismo, se observan los cambios provocados con su presencia y, por fin, se deduce la función del gen. Se trata de un enfoque reduccionista, clásico y potente. Pero a medida que la fracción oculta del genoma (las secuencias funcionales del ADN que se suponían redundantes) gana prota gonismo, se pone sobre el tapete un problema desconocido, a saber, que esa genética retrógrada desemboca en un túnel. De ahí el interés creciente por un nuevo enfoque de sentido contrario: progresivo. Se trata de identificar los genes, clásicos o no, con unas técnicas que miran hacia adelante. En este contexto, la compañía Phenomix, de La Jolla, ha puesto en funcionamiento una línea de producción de ratones mutantes. En cada grupo de ratones, las mutaciones aleatorias de su genoma desactivan no sólo genes que codifican proteínas, sino también otros genes ocultos que sólo producen formas activas de ARN. Photomix ha comenzado a la vez con ratones sanos y con otros con patologías análogas a las humanas diabetes, asma, artritis o enfermedad de Parkinson. Algunas mutaciones inducen o alivian los síntomas de estas alteraciones en el ratón. Se realiza entonces un barrido genético para determinar las mutaciones responsables de tales efectos. Está todavía por ver si este nuevo enfoque inspirará un diseño de fármacos más eficaz. De momento, esa genética progresiva ha sacado ya a la luz fenómenos genéticos insospechados: los pseudogenes funcionales, por ejemplo.
ARN de interfer en cia pe qu eñ os (ARNip). Las dos hebras de ARNip se desenrollan entonces y una de las cadenas se encarga de encontrar e incapacitar cualquier molécula de ARN mensaj ero qu e se un a a su secuencia. Este sistema censor protege las células contra los virus, que a menudo vacían su carga en forma de ARN de doble hebra. Además, constituye una herramienta muy útil para los investigadores ya que les permite silenciar a voluntad cualquier gen [ véase “Interferencia de ARN”, por Nelson C. Lau y David P. Bartel; I NVE STI GAC IÓN Y C IENCIA , octubre de 2003]. Sin embargo, ni los pseudogenes ni los ARN antisentido pueden explicar el perfil foliar de Arabid opsis , una mala hierba de la familia de la mostaza. Sus hojas recuerdan la forma de una cuchara. Según un artículo que Detlef Weigel y su equipo, del Instituto Max Planck de Biología del Desarrollo en Tubinga, publicaron en Nat ure en agosto de 2003, la planta debe sus elegantes curvas simétricas, en parte, a un microARN. Descubiertos hace unos años en los nemátodos, los microARN son cadenas cortas de ARN no codificador que se doblan sobre sí mismas, a la Ar ab imanera de horquillas. En dopsis , la maquinaria de la interferencia de ARN captura el microARN 48
producido por el gen JAW como si se tratara de un virus. Pero la secuencia de JAW se empareja con un grupo de genes que producen proteínas, miembros de una familia que controla la forma y el tamaño de la planta. El censor celular desactiva cada uno de ellos recortando casi por completo el ARN mensajero que transcriben. Así, el JA W , un gen diminuto que sólo produce ARN, sirve de palanca para que las células de Ara bid ops is ajusten el “volumen” de un conjunto de genes codificadores de proteína cruciales. Cuando Weigel y los suyos crearon plantas transgénicas en las que los microARN no podía n realizar su funci ón, los nuevos vegetales enfermaron y se deformaron. En pocos años, se han encontrado centenares de microARN; sólo en el hombre, más de 150. Parecen constituir una buena herramienta de control genético para los organismos. Alrededor de la mitad de los microARN del hombre también aparecen, en forma casi idéntica, en el ADN de un pe z de la familia Tetraodontidae , aun cuando las dos especies tomaron distintos caminos evolutivos hace 400 millones de años. Sigue sin comprenderse qué hacen en el hombre esos 150 microARN. Anna M. Krichevsky, de la facultad de medicina de Harvard, sospecha que podrían desempeñar un papel
importante en el desarrollo del cerebro, por lo menos. En su laboratorio se han valido de un chip de genes para identificar, en neuronas de ratón, hasta 44 clases diferentes de microARN. En septiembre de 2003, Krichevsky señaló que los niveles de nueve microARN se regulaban con suma precisión a medida que se desarrollaba el cerebro del múrido. Para Diya Banerjee, de la Universidad de Yale, nos encontramos en la antesala de una explosión de conocimientos en el nuevo dominio que se ha abierto. Ana lóg ico y di git al
Si se nos permitealaser imagen , las proteínas vendrían los percherones de la célula, en tanto que el ARN activo porta a veces la fusta. El ARN se desenvuelve con la eficacia de una proteína en operaciones de catálisis, señalización y activación. Para sorpresa de no pocos, interviene incluso en determinadas enfermedades hereditarias. Los genéticos clínicos se esforzaron a lo largo de más de nueve años en descubrir el gen de la hipoplasia de cartílago y cabello. Esta enfermedad recesiva se identificó entre los amish: uno de cada 19 lleva una copia del gen defectuoso, causante de un enanismo poco habitual. Los que sufren esta enfermedad no sólo tienen una baja estatura, sino que además corren un riesgo elevado de padecer cáncer y trastornos inmunitarios. Maaret Ridanpää, de la Universidad de Helsinki, siguió la pista de este gen hasta el cromosoma nueve, secuenció una región extensa del mismo y estudió, uno por uno, los diez genes codificadores de proteínas situados en aquella zona. Ninguno de ellos causaba la enfermedad. Por fin, en 2001, Ridanpää y sus colaboradores identific aron el responsable : un gen que sól o produc e ARN, el RMPP . El ARN transcrito a partir del RMPP se une con proteínas para formar una enzima que actúa en el interior de las mitocondrias, orgánulos generadores de energía de la célula. Basta un cambio en una sola base de este ARN para imponer la diferencia que separa una talla y salud normales de una estatura y vida cortas, si la misma mutación se hereda de ambos padres. Recientemente, se ha descubierto que estos ARN “analógicos”, que se repliegan, lo mismo que las proteínas, en formas complejas, resultan esenciales para el funcionamiento de enzimas que protegen los cromosomas y escoltan señales proteicas segregadas hacia el exterior de la membrana celular. TEMAS 38
Genes singulares
L
os genes, de acuerdo con la doctrina admitida, constituyen segmentos de ADN que codifican proteínas funcionales. Sin embargo, esas secuencias integran sólo un 2 por ciento del genoma humano. El resto corresponde a ADN que
no se dedica a ese menester, pero que dista de resultar superfluo. Están apareciendo muchos genes no codificadores que srcinan formas de ARN sorprendentemente activas; entre ellas, las silenciadoras o reguladoras de genes codificadores.
Núcleo celular
El ARN antisentido se srcina a partir de la hebra del ADN complementario situada en el lado opuesto de un gen codificador. Los ARN antisentido pueden interceptar el ARN mensajero transcrito a partir del gen (ARNm), evitando la traducción a proteína.
Gen codificador de proteína
ARNm El ARN antisentido se une al ARNm complementario y bloquea el mecanismo de síntesis proteica.
ADN complementario ARN antisentido
Los genes codificadores de proteínas contienen secuencias sin función codificadora, los intrones. Los intrones se podan del transcrito inicial de ARN; las secciones codificadoras se empalman entonces para generar un ARNm maduro. Aunque muchos intrones se degradan, algunos contienen elementos activos como los microARN, que utilizan la interferencia del ARN para controlar otros genes.
Transcrito de ARN del gen
Sección codificadora
Intrón
ARNm maduro El mecanismo de interferencia del ARN procesa el microARN...
Intrón degradado
... y lo usa para destruir selectivamente ARNm producido por genes determinados.
MicroARN
ARNm interceptado
Gen
Los riboconmutadores, una forma de ARN recientemente descubierta, actúan como conmutadores genéticos de precisión. Producidos en muchos casos a partir de ADN intergénico, se pliegan en estructura compleja. Una parte del ARN plegado se une a una molécula diana. Otra parte contiene el código para sintetizar una proteína. El riboconmutador se activa y produce la proteína sólo en presencia de su molécula diana.
N UEVA GENÉTICA
Secuencia del riboconmutador Proteína resultante ARN riboconmutador
Secuencia codificadora de proteína
Secuencia no codificadora Estado inactivo
Estado activo
Molécula diana W O L S N I W E S E R E T
49
N A G R O M H G U H
3. IDENTICOS EN TODO, MENOS EN EL NOMBRE, estos ratones de una misma camada y pertenecientes a una cepa endogámica comparten el ADN prácticamente en su totalidad. Sin embargo, su color varía del amarillo dorado al caoba. Ello se debe a las variaciones en las marcas epigenéticas del ADN intergénico. El color del pelo de estos ratones no puede deducirse de las teorías genéticas actuales.
Tal vez la forma más curiosa de este ARN descubierta hasta la fecha la constituya el riboconmutador. Fue aislado en 2003 por Ronald R. Breaker, de la Universidad de Yale. Lo mismo que otros muchos, también el equipo de Breaker se cuestionaba cómo pudieron sobrevivir, hace miles de millones de años, los primeros precursores químicos en un mundo de ARN, es decir, antes de que existieran el ADN y las proteínas. El grupo de Yale imaginaba que tales protoorganismos necesitarían los ARN para llevar a cabo misiones de sensores y conmutadores que les facultaran responder a cambios en el entorno y en su metabolismo. Para someter a prueba esta hipótesis, se aprestaron a producir moléculas de ARN con dichas capacidades. Crearon varios conmutadores sintéticos de ARN, largas moléculas de ARN que poseen al mismo tiempo un extremo codificador y otro no codificador. Cuando el ARN se pliega, el extremo codificador se vuelve sensible a una determinada molécula. El encuentro con esta diana provoca la activación del conmutador; ello comporta que el otro extremo, portador de las instrucciones para la síntesis de proteína, cambie de forma. Por consiguiente, el riboconmutador promueve la síntesis proteica, cual si se tratara de un gen normal, pero sólo tras alcanzar su molécula diana. En su búsqueda de riboconmutadores, el grupo de Breaker no tardó en hallarlos escondidos en el ADN 50
intergénico. Estos conmutadores genéticos de precisión se han extraído de especies pertenecientes a toda la escala orgánica. Probablemente, pues, estaban ya en el último antepasado común, en los albores de la evolución. En agosto de 2003, publicaron un estudio sobre una familia de riboconmutadores que regula la expresión de no menos de 26 genes de Bac illus sub tilis ; todos de suma importancia, al tratarse de genes que el microorganismo necesita para metabolizar el azufre y aminoácidos. Breaker calcula que B. sub tilis posee al menos 68 genes, ca si el 2 por cien to del conjunto total, bajo el control de riboconmutadores. En su laboratorio han comenzado ya a sintetizar moléculas híbridas analógico-digitales, aptas para la destrucción selectiva de gérmenes. La visión global
A medida que se identifican nuevos genes de ARN activo en los intrones y el ADN intergénico, tanto tiempo olvidados, se desvanece la imagen de poseer un listado completo para el hombre o cualquier otra especie superior. A diferencia de los genes productores de proteínas, cuya secuencia está limitada por señales de ‘inicio’ y ‘fin’, los genes de sólo ARN varían tanto, que los programas informáticos no consiguen detectarlos en las secuencias de ADN. Para estimular la técnica, el Instituto estadounidense de Investiga-
ciones del Genoma Humano ha invertido 36 millones de dólares en un ambicioso proyecto: la “Enciclopedi a de Elementos de ADN”. En tres años, se pretende catalogar todo tipo de proteínas y ARN sintetizados a partir de un escogido uno por ciento del genoma humano. Nadie sabe todavía qué panorama genético se nos abrirá una vez salga a la luz esa capa de información ahora oculta. El ADN redundante que antaño se desechó por ignorarse su función, podría quizá convertirse en el fundamento de la complejidad humana. Así lo avalan pseudogenes, ARN antisentido, microARN y riboconmutadores. El ARN activo, como se empieza a saber ahora, contribuye a controlar la estructura general de los cromosomas y algunas de sus modificaciones químicas cruciales; dicho de otro modo, constituye una nueva capa de información epigenética.
BIBLIOGRAFIA COMPLEMENTARIA NON-CODING RNA GENES AND THE MODERN RNA WORLD. Sean R. Eddy en Nature Reviews Genetics , vol. 2, págs. 919929; diciembre de 2001. AN EXPANDING UNIVERSE OF NONCODING RNAS. Gisela Stortz en Science, vol. 296, págs. 1260-1263; 17 de mayo de 2002. OF NTISENSE WTIDESPREAD OCCURRENCE RANSCRIPTION IN THE HUMANAGENOME. Rodrigo Yelin et al. en Nature Biotechnology, vol. 21, págs. 379-385, abril de 2003. CHALLENGING THE DOGMA : THE HIDDEN LAYER OF NON-PROTEIN-CODING RNAS IN COMPLEX ORGANISMS. John S. Mattick en BioEssays, vol. 25, págs. 930-939, octubre de 2003.
TEMAS 38
El nacimiento de la epigenética El ADN se consideraba hasta hace poco el único depósito de información genética. Pero comienza ya a entreverse, en el interior de los cromosomas, otra capa de información mucho más maleable W. Wayt Gibbs
“E
l genoma humano ensartado en un chip”, se leía en un titular de la portada del New Y ork T imes . El artículo comentaba que tres empresas biotecnológicas habían conseguido registrar en un pequeño artefacto del tamaño de una uña la actividad de todos los genes de una muestra de tejido humano. Así se cumplía uno de los objetivos del Proyecto Genoma Humano: identificar genes, es decir, fragmentos de ADN que, transcritos en ARN, se traducen en proteínas. Cuando se publicó el borrador final de la secuencia del ADN de Hom o sapiens en abril de 2003, muchos afirmaron que esa hilera de 3000 millones de bases A, T, G y C encerraba los planos de la vida, el libro de la herencia o el código fuente de las células. Pero, a decir verdad, todas esas metáforas resultan engañosas. El genoma, la información heredable que contienen los cromosomas y dirige el desarrollo de un organismo, no consiste en un texto estático que se transmite de una generación a la siguiente. Antes bien, se trata de una compleja máquina bioquímica. Opera en un espacio tridimensional y consta de distintos elementos dinámicos que interaccionan. Los genes codificadores de proteínas constituyen uno más de esos elementos. Sin embargo, pese a representar menos del dos por ciento del ADN total en cada célula humana, el dogma central de la biología molecular los ha venido considerando, en el curso de los cinco últimos decenios, los únicos depósitos de la herencia. De ahí la identificación del genoma con un plano o proyecto. Ya en los años sesenta, se había descubierto información oculta en otras dos zonas de los cromosomas. Una se encontraba escond ida en la región no codificadora del ADN. La otra perN UEVA GENÉTICA
manecía fuera de la secuencia de ADN. Pero la ingeniería genética siguió dirigiendo su mirada hacia los genes codificadores y las proteínas, pues éstas continuaban siendo las estructuras mejor conocidas. En los últimos años, se ha explorado con mayor atención las partes menos evidentes del genoma, con la esperanza de encontrar allí la explicación de fenómenos que contradicen su dogma central: enfermedades de caracterización familiar que aparecen de una manera impredecible o incluso sólo en uno de dos gemelos idénticos; genes que, sin mediar mutación, se activan o desactivan en tumores; clones que habitualmente mueren en el útero. Se ha visto que esas segunda y tercera capas de información, distintas de los genes codificadores de proteínas, intervienen en la herencia, el desarrollo y la enfermedad. La segunda capa de información oculta yace en innumerables genes de sólo ARN secuestrados dentro de hileras extensas de ADN no codificador [ véase “El genoma oculto”, por W. Wayt Gibbs en este mismo número ]. Por no determinar proteínas, ese ADN se había reputado escoria inútil de la evolución. Pero sabemos ahora que los genes no codificadores dan lugar a ARN activos, que alteran el comportamiento de los genes codificadores. El funcionamiento incorrecto de estos genes de sólo ARN acarrea graves consecuencias. El tercer componente del mecanismo genómico, de importancia presumiblemente mayor que el segundo, estriba en la capa epigenética de información almacenada en las proteínas y metabolitos que rodean y se adhieren al ADN. Tales señales epigenéticas, así se llaman, aunque no alteran la secuencia del ADN subyacente, pueden afectar gravemente la salud y las
características de un organismo. Algunas pasan incluso de padres a hijos. No se conocen los mecanismos de interacción entre los indicadores epigenéticos y los restantes componentes del genoma. Mas, por lo que se sabe de la investigación sobre mecanismos críticos, parece que el papel de la zona epigenética resulta crucial para el desarrollo, el envejecimiento y el cáncer. Se sospecha también que las “epimutaciones” contribuyen al desarrollo de la diabetes, la esquizofrenia, el trastorno bipolar y otras enfermedades complejas. La epigenética puede sugerir nuevos tratamientos contra esas patologías. Al propio tiempo que protegen su ADN contra la mutación, las células añaden o borran rutinariamente indicadores epigenéticos. En principio, los fármacos podrían conjugarse con el código epigenético para activar o desactivar los genes nocivos. Con medicinas novedosas podría revertir algunas de las alteraciones genéticas que acompañan el envejecimiento y preceden al cáncer. Anc as r obu sta s
La historia que sigue constituye una metáfora esclarecedora sobre la conjura de los tres componentes del genoma para acabar con la presentación clásica de la herencia. En 1983, en un rancho de Oklahoma nació un carnero cuyas ancas alcanzaron proporciones prodigiosamente ricas en contenido cárnico. Intuyendo los beneficios económicos de la mutación, el ranchero llamó al cordero Oro Macizo y lo conservó como semental. A los hijos de Oro Macizo, que también gozaban de nalgas robustas, los cruzaron con ovejas normales. El aspecto de la mitad de la descendencia, tanto machos como hembras, se asemejaba al paterno. Recibieron el nombre de callipyge , que en griego 51
M M M ATAG CGCG ACGAGCCAG CGC TCTAGACAGACGTAGC CGCGCG GATAGCGACGAGCCAGTC CGCG GACAGTACA M M M
IS R R A H Y D N A R
M M M ATAG CGCG GAGCCAG CGCG CTCTAGACAGACGTAGCATAT CG GATAGCGACGAGCCAGTC CGCGCG GACAGTA M M M
1. LOS GEMELOS IDENTICOS poseen idénticas secuencias de ADN. No obstante, en la mayoría de los casos en que uno de ellos adquiere una enfermedad de srcen —esquizofrenia, trastorno bipolar o diabetes infantil—, su hermano se halla exento de la misma. Aunque podrían influir los factores ambientales, la investigación comienza a descubrir rasgos importantes que se transmiten por vía epigenética, a través de los cromosomas pero fuera del ADN.
significa “traseros hermosos”. Suponiendo que se trataba de una mutación en un gen dominante, cabía esperar que la mitad de sus descendientes nacieran con las ancas rollizas. El resultado, sin embargo, fue un tanto extraño. Cuando las hembras callipy ge se cruzaron con machos normales, ni un solo cordero de cualquier sexo presentó los glúteos de la madre, aun cuando había algunos que heredaron la mutación. Parecía como si el callipyge hubiera cambiado de dominante a carácter recesivo. Se procedió luego a cruzar carneros de aspecto normal, aunque portadores de la mutación, con ovejas normales. Para sorpresa de todos, la mitad de la descendencia resultó callipyge . Así pues, el rasgo aparecía sólo cuando la mutación se heredaba del padre. Si el callipyge fuera un gen habitual, los animales que heredaran la forma mutante del padre y de la madre tendrían las ancas robustas bien aseguradas. Sin embargo, todos los corderos con dos alelos callipyge (con la misma mutación en ambas copias del cromosoma) presentaban un aspecto perfectamente normal. ¿Qué ocurría? Tras diez años de experimentos se ha dado, por fin, con la respuesta. En mayo de 2003, el equipo de Michel Georges, de la Universidad de Lieja, publicó la descripción del rasgo y la genealogía callipyge : un gen codificador de proteína, uno o más genes de sólo ARN y dos efectos epigenéticos. Súmese a esa tríada, una pequeña mutación (una base G aparece en lugar de A en medio de un erial génico, a 30.000 bases de distancia del gen conocido más cercano). La sustitución de A por G torna hiperactivos los genes callipyge, de suerte que se produce una cantidad excesiva de proteína o ARN activo en las células musculares. El exceso de proteína explica el volumen trasero, pero no el extraño patrón de herencia. Muchos ven ahí la acción de la impronta genómica en el árbol familiar. N UEVA GENÉTICA
Para la mayoría de los genes, ambos alelos, el materno y el paterno, se activan o desactivan simultáneamente. La impronta rompe ese equilibrio. En los genes afectados por la misma sólo se expresa la versión que procede del padre; se silencia el alelo materno. Así opera el gen codificador implicado en el callipyge . El cordero que recibe la mutación (G en vez de A) de la madre muestra un aspecto normal. La mutación no supera la censura selectiva que impone la impronta genómica. La misma impronta, ahora en sentido opuesto, afecta al gen (o genes)
En los primeros días después de la concepción, desaparece de los cromosomas casi toda la impronta genómica. Ignoramos por qué. Antes del ecuador de la gestación, se restablece la información epigenética. En ese proceso de reprogramación, sin embargo, se producen algunos errores. El gen humano del factor de crecimiento 2 de la insulina ( IGF 2 ), por ejemplo, suele hallarse sujeto a una impronta genómica que desactiva la copia materna. Pero en una de cada diez personas, no hay tal. Según Carmen Sapienza, de la Universidad de Temple, ese defecto se encuentra
callipyge activos se
presente 40 poresporádico ciento de los pacientesen conelcáncer de colon. Se trata sólo de una asociación, pero merece la pena tenerse en cuenta. De hecho, la pérdida de la impronta genómica del IGF2 (que se detecta mediante un test sanguíneo) constituye en la actualidad un criterio predictivo del cáncer de colon. Una impronta defectuosa resulta también un buen indicio de enfermedades genéticas menos frecuentes, como los síndromes de Prader-Willi, Angelman y BeckwithWiedemann. Este último causa deformidades faciales y conlleva un riesgo elevado de cáncer en la infancia. Para Emma Whitelaw, de la Universidad de Sidney, las variaciones epigenéticas explicarían discordancias extrañas de enfermedades entre gemelos idénticos, que se caracterizan por compartir secuencias de ADN idénticas. Ahora bien, cuando uno adquiere una enfermedad de componente genético —esquizofrenia, trastorno bipolar o diabetes infantil—, el otro gemelo normalmente no la padece. En 2002, el grupo de Rachel Weksberg, del Hospital Pediátrico de Toronto, comparó gemelos discordantes ante el síndrome
de sólo ARN. Estos ARN producen únicamente a partir del alelo en el cromosoma materno. Así, el rasgo desaparece en animales que portan dos alelos callipyge . En estos corderos con doble mutación, el gen codificador de proteína del cromosoma paterno se hiperactiva, al tiempo que los genes no codificadores del cromosoma materno también aumentan la producción de ARN activo. El exceso de ARN bloquea la señal amplificada de crecimiento y el animal resulta esbelto. La superdominancia ejercida por la interación de este par de alelos constituye una rareza. No lo es, sin embargo, el fenómeno de la impronta, al menos en las plantas con flores. Randy L. Jirtle, de la Universidad de Duke, mantiene actualizada una lista de genes humanos sujetos a la impronta genómica. A finales de 2003 alcanzaba los 75. Maxwell P. Lee, del estadounidense Instituto Nacional del Cáncer, publicó en agosto de 2003 que, de un barrido de 602 genes en siete personas, un alelo resultaba significativamente más activo que el otro en la mitad de los genes. En 170 de esos genes, las diferencias de expresión alélica se cuadruplicaba de lejos.
Resumen / Epig ené tic a La mayoría de los caracteres se transmiten a
través de los genes codificadores de proteínas. Pero existe otro código que ejerce también efectos importantes sobre la salud y el aspecto de los organismos. Se escribe con marcadores químicos y se encuentra fuera de l a secuencia de ADN.
El código epigenético podría explicar
por qué algunas enfermedades hereditarias saltan a través de generaciones o afectan sólo a uno de dos gemelos. Los errores epigenéticos no serían ajenos al cáncer.
El genoma opera como una máquina con elementos diversos y complejos
en interacción. El componente epigenético debería resultar más fácil de modificar por medios farmacológi cos de lo que ha sido la secuencia de ADN.
53
de Beckwith-Wiedemann: en todos los casos, el gemelo afectado había perdido la impronta genómica en un área crítica del cromosoma 11, no así su hermano sano. Francis Collins, director del estadounidense Instituto Nacional de Investigación sobre Genoma Humano, sostiene que la impronta constituye un factor muy importante para el cáncer, el desarrollo y los defectos de nacimiento. Pese a reconocer que se desconoce su mecanismo de operación, admite la posibilidad de que intervenga la metilación del ADN.
En general, cuanto más metilada se halla una hebra de ADN, menor es la probabilidad de que ésta se transcriba en ARN. El alelo silente de un gen sujeto a impronta, por ejemplo, se encuentra casi siempre muy metilado. Sin embargo, parece que la metilación del ADN se ocupa, sobre todo, de defender el genoma frente a los transposones, fragmentos parasitarios de ADN; la impronta vendría a ser una labor secundaria de la metilación. Nuestro ADN está lleno de parásitos. Aproximadamente el 45 por ciento de la secuencia del genoma humano consiste en genes víricos (o fragmen-
El cambio se debía a un aumento en la metilación (y reducción de la expresión) del ADN transposón del agutí. Pero, ¿qué ocurre cuando fallan tales defensas metílicas? Hace unos seis años, mediante técnicas de ingeniería genética se bloqueó una de las enzimas que añaden grupos metilos en células madre embrionarias. Con la protección metílica rebajada, se activaron muchos transposones. La tasa de mutaciones en el ADN se decuplicó. Los resultados planteaban una hipótesis sugestiva: ¿Podrían las anomalías epigenéticas acelerar, o incluso iniciar, el descontrol genético que
Metilos epigenético Simple pero poderoso, un smetilo
tos de genes) que se han a sí mismos en el genoma encopiado el transcurso de la evolución. Afortunadamente para nosotros, casi todo este ADN “egoísta” se encuentra muy metilado y, por tanto, inactivo. Jirtle acaba de demostrar el vínculo entre metilos y transposones en un experimento realizado con ratones agutí, cuyo color de la piel varía del amarillo al negro bajo el control de un elemento parasitario. Un grupo de hembras preñadas siguió una dieta normal. Alrededor del 60 por ciento de sus descendientes desarrollaron una piel amarilla. Otro grupo se alimentó con un pienso enriquecido con vitamina B 12 , ácido fólico y otras fuentes de metilo. El 60 por ciento de las crías de este segundo grupo mostró una piel de color pardo.
conduce cáncer? Al fin al y al cabo, las células tumorales presentan a menudo una distribución irregular de las marcas epigenéticas: su genoma, en general, se encuentra escasamente metilado, mientras que algunos genes muestran una metilación excesiva y evitan con ello que las células dañadas se vuelvan malignas. Para Stephen B. Baylin, de la Universidad Johns Hopkins, en los pólipos del colon (neoformaciones benignas que suelen volverse malignas), la metilación del genoma se reduce considerablemente incluso antes de que, en el camino hacia el cáncer, las mutaciones silencien genes supresores clave. Se ignora por qué se produce tal desmetilación del ADN. Ninguna enzima desmetilante se ha identificado hasta
consta de tres hidrógenos unidos a un carbono con tendencia a enlazarse a otra molécula (para metilarla). El metilo muestra una afinidad especial hacia las citosinas (C) del ADN. Existen enzimas que se dedican a tomar moléculas metiladas derivadas de nutrientes básicos, tales como el ácido fólico y la vitamina B 12 , y pegarlas a ciertas bases C del genoma. 2. LAS ANCAS ROBUSTAS distinguen a una oveja callipyge (extremo izquierda ) y un carnero callipyge (centro derecha ) de sus hermanos normales. El patrón hereditario del rasgo callipyge se debe a la interacción entre tres capas distintas de información que yacen en el genoma.
S A X E T E D A C I N C E T D A ID S R E IV N U , N O S K C A J M A S
54
TEMAS 38
Arbol familiar
H
ace veinte años nació Oro Macizo, un carnero singular que, en virtud de una mutación en el cromosoma 18, presentaba unas ancas poderosas. Oro Macizo transmitió este rasgo a la mitad de la descendencia ( líneas verdes ), de acuerdo con el patrón típico de un gen dominante. En generaciones posteriores, sin embargo, se observó que l os indi-
viduos que heredaban la mutación de la madre mostraban un aspecto normal ( líneas azules ), incluso cuando le acompañara la mutación del padre ( líneas púrpuras ). A causa de los efectos epigenéticos, los únicos corderos que desarrollan ancas robustas son los que reciben una sola copia de la mutación y ésta proceda del padre ( líneas naranjas ).
El primer mutante con ancas robustas fue Oro Macizo, que se cruzó con ovejas normales. La generación 1 desarrolló un rasgo aparentemente dominante (todos los descendientes que heredaban la mutación presentaban ancas rollizas)...
)
n ió c ra t s u il
( R E S S A R T S A I D A N ; A C I G L E B , A J IE L E D D A D I S R E IV N U , S E G
...pero sólo los carneros pasaban el rasgo a la generación 2... ...y ya en la generación 3 el patrón hereditario resultó desconcertante.
Cuando se transmite a una oveja, el rasgo salta una generación ( líneas azules ). Cuando lo transmite un carnero que porta la mutación en ambas copias del cromosoma 18, el rasgo aparece en cada uno de los descendientes (líneas naranjas ).
R O E G L E H IC M Y R E I L R A H C E L O R A C : E T N E U F
CLAVE
Carnero (izquierda) y oveja (derecha) con ancas robustas
Corderos normales no emparentados con Oro Macizo
ahora. Se sospecha que los cromosomas pobres en grupos metilo tienden a funcionar peor durante la división celular. Por tanto, constituyen un primer paso hacia la malignidad. El trabajo de Rudolph Jaenisch, del Instituto Whitehead del MIT, aportó un aval para tal hipótesis. Su grupo creó ratones transgénicos con una deficiencia congénita de una enzima metilante. En la mayoría de los ratones, al menos uno de los cromosomas pobremente metilados se hizo inestable. Las mutaciones no tardaron en acumularse; el 80 por ciento de los individuos murieron de cáncer antes del noveno mes de vida. La idea de que la carencia de metilos en el ADN desemboque en un cáncer en el hombre se mueve todavía en el terreno de la hipótesis; en cualquier caso, no existen fármacos que corrijan una baja metilación del genoma. Pero se están ensayando diversos fármacos contra el cáncer que actúan N UEVA GENÉTICA
Descendientes normales de Oro Macizo
Cruce
sobre la otra vertiente de la metilación: la que sufren en demasía ciertos genes asociados al cáncer. Hasta hace poco, muchos pensaban que, para que un tumor se asentase, era preciso que una mutación silenciara los genes oncosupresores. Sin embargo, en muchas células tumorales estos genes supresores poseen secuencias normales de ADN. Los errores de metilación, no las mutaciones, son los que dejan inoperantes a los genes. Se están ensayando, en esta dirección, varias sustancias anticancerosas que abordan el problema de la metilación excesiva. La procaína (un anestésico), el ácido valproico (un estabilizador del talante) y la decitabina (un agente empleado en quimioterapia) parecen arrancar metilos del ADN o impedir que se peguen a las células recién formadas. Jean Pierre Issa, del Centro Oncológico M. D. Anderson de la Universidad de Texas, ha sometido la decitabina a
Cromosoma 18 paterno (izquierda) y mater no (derecha)
Cromosoma mutante
ensayo en pacientes con leucemia avanzada. Lo mismo que la mayoría de las sustancias utilizadas en quimioterapia, el compuesto resulta bastante tóxico. Pero cuando el fármaco ejerce su acción, se vence la leucemia: el 99,9 por ciento de las células cancerosas desaparecen. De acuerdo con la información aportada, ocho de los 130 pacientes tratados se recuperaron y en otros 22 la medicina desmetilante dejó la enfermedad en una remisión parcial. Sabine Maier, de la empresa Epigenomics, que trabaja en asociación con la compañía Roche en el desarrollo de diagnósticos del cáncer basados en la metilación, afirma que, pese a resultar prometedores, todos estos fármacos conllevan un problema: su acción se funda en la desmetilación de todo el genoma, lo que podría acarrear efectos secundarios. Además, el efecto pudiera ser temporal, con recidiva de las marcas me55
Control epigenético del “volumen” de los genes
L
a secuencia de ADN no constituye el único código almacenado en los cromosomas. Los fenómenos epigenéticos controlan el “volumen” de los genes: amplifican o silencian su actividad. El código epigenético está constituido por un sis-
tema de moléculas unidas al ADN o a las histonas que regulan su morfología en el interior cromosómico. Entre otras funciones, los controles epigenéticos se encargan de amordazar los transposones, fragmentos parasitarios de ADN.
Fibra de cromatina ALTO
Nucleosomas BAJO
Núcleo celular
Histonas ADN expuesto que se transcribe en ARN
Proteínas represoras
2
Los cromosomas están constituidos por cromatina, una mezcla de ADN, proteínas y otras moléculas. Dentro de la cromatina, la doble hélice se enrolla alrededor de las madejas de ocho histonas para formar un rosario de nucleosomas.
Cromatina activa Cromatina silente
1
Obligadas por ciertos cambios químicos en la cromatina, partes de la misma se condensan en una masa compacta e inaccesible o bien atraen proteínas represoras. En ambos casos, los genes situados en esa zona del ADN se tornan transitoriamente inoperantes.
ALTO
Marcas químicas unidas a las colas de las histonas Enzima desacetilante
ADN Enzima metilante
ALTO
BAJO
Metilo
BAJO
Gen activo
Gen silenciado
4
Los genes también se desactivan mediante metilos que se unen directamente al ADN, por lo común en los sitios donde a una base C le sigue otra G. Ignoramos si la metilación del ADN resulta suficiente para bloquear los genes o si debe combinarse con la señalización de las histonas.
Acetilo (–COCH 3) Metilo (–CH 3)
Fosfato Ubiquitina
3
Un complejo código de histonas —escrito con marcas químicas adheridas a las colas de las histonas— gobierna también la expresión de los genes. Los marcadores acetilo amplifican los genes vecinos; las enzimas desacetilantes, en cambio, los silencian. El resto del código está aún por descifrar.
Transposón activo
Transposón bloqueado por metilos
5
Los transposones, o genes saltarines, se autoclonan y después insertan sus copias en secciones distantes del genoma. Unas veces desactivan genes, otras los hiperactivan. Una de las principales funciones de la metilación del ADN parece ser el bloqueo de los transposones, que constituyen casi la mitad del genoma humano.
Copias de ADN Cromosoma distante Transcritos de ARN
Gen desactivado Gen hiperactivo
W O L S IN W E S E R E T
56
TEMAS 38
tílicas y silenciamiento de los genes oncosupresores. Issa admite la posibilidad del carácter transitorio de las modificaciones inducidas en la expresión del gen; pero si los cambios permiten que el sistema inmunitario identifique la célula tumoral o inducen la apoptosis (muerte celular programada), entonces la célula seguiría anulada. La reemergencia de un patrón de metilación del ADN después de la acción de los fármacos desmetilantes constituye un extraño eco de la
forma de rosario que después se pliega como una madeja. Las secciones de cromatina pueden condensarse o expandirse de forma independiente. Así, ciertas zonas de ADN se ocultan eficazmente, al tiempo que otras quedan expuestas para la transcripción. Las hembras, por ejemplo, comienzan su vida con dos cromosoma s X activos. Los machos heredan sólo uno. Un embrión femenino debe embozar el X extra para evitar que sus células obtengan una dosis doble de lo que producen los genes de los cromosomas X. Para conseguirlo, dos partes de la máquina genómica conspiran
tificó recientemente elementos fronterizos que atraen enzimas acetilantes hacia las histonas para asegurar que permanezcan activas. En ocasiones, una separación física ofrece suficiente espacio para que el ADN flote libre de histonas; es ahí donde se detiene la propagación del silenciamiento. En otros lugares no existe frontera, sino un tira y afloja entre las regiones activas y silentes del cromosoma. Issa sostiene que esta pugna podría explicar por qué el riesgo de padecer cáncer crece con la edad. Tal vez las barreras que en los cromosomas sepa-
reprogramación de las de marcas de impronta poco después la concepción. ¿Qué redirige las enzimas metilantes hacia esos genes supresores de tumores o esos pocos alelos marcados para la impronta genómica? Hay que ofrecer una respuesta si queremos acometer el proceso de clonación animal. La reprogramación epigenética fracasa estrepitosamente en los clones obtenidos al sustituir, por ADN de una célula adulta, el ADN de un óvulo fecundado. La mayoría de esos clones presenta patrones anormales de metilación y de expresión génica. Aun cuando su secuencia de ADN sea correcta, el 90 por ciento de los animales muere antes del parto y la mitad de los que nacen vivos no llega a la edad adulta. Los pocos que sobreviven hasta la madurez son proclives a la obesidad y enfermedades del sistema inmunitario. Para prevenir o anular permanentemente los errores de metilación, tan habituales en clones, tumores y afecciones vinculadas a la impronta genómica, resulta necesario descifrar un código epigenético, separado del ADN. Baylin sostiene que la metilación, por sí sola, no silencia los genes; se encarga únicamente de fijar su estado silente. En cuanto a las enzimas metilantes, parece que reciben sus órdenes de alguna otra parte. Un cromosoma se suele representar por un revoltijo azaroso de ADN. Pero si lo examinamos de cerca, encontramos algo muy distinto. Se trata de un conjunto dinámico de ADN, proteínas y otras moléculas. Este ensamblaje filamentoso, la cromatina, no sólo sirve de soporte del ADN, sino que controla también el acceso al mismo. La cromatina contiene en ADN la mitad de lo que contiene en proteína, la mayoría de la cual está en forma de histonas. Las histonas constituyen la base del empaquetamiento del ADN nuclear. Los 1,8 metros de ADN se enrollan alrededor de los carretes de histonas para formar una cadena en
para desactivar la tercera Xis t produce . Un genun no codificador llamado ARN activo que recubre el cromosoma X redundante. Al propio tiempo, el cromosoma X necesario produce ARN antisentido que lo protege del Xis t . Una reacción en cadena se propaga a lo largo del cromosoma sobrante: los metilos marcan una buena parte del ADN, las histonas se desprenden de los grupos acetilo (—COCH 3) de sus colas y la cromatina se compacta en una masa inaccesible cubierta de ARN. El cromosoma X silente se entrega entonces inactivo a cada célula portadora del genoma, conforme la hembra avanza en su desarrollo. Aunque todavía no se conoce con precisión el papel de las histonas en esta historia, la investigación reciente ha demostrado que las colas proteicas que sobresalen de las histonas catalizan una gran variedad de adiciones químicas. En aquellas zonas donde los acetilos adornan las histonas, por ejemplo, la cromatina habitualmente se encuentra abierta para realizar su función; permite que la maquinaria de transcripción de la célula lea el ADN en esa parte del cromosoma. La cromatina silente, compacta, carece generalmente de acetilos en las posiciones especiales. En cambio, muestra metilos insertos en diferentes puntos de las colas de las histonas. Las histonas acogen también fosfatos y ubiquitina, un péptido. Todas estas marcas aparecen en una asombrosa variedad de localizaciones y combinaciones. Descifrar el código de las histonas no va a resultar nada fácil. A diferencia del código estático del ADN, numerosas marcas epigenéticas se hallan en flujo constante. Cuando una sección de la cromatina se condensa, el silenciamien to puede extenderse por todo el cromosoma hasta alcanzar una barrera. Xin Bi, de la Universidad de Rochester, iden-
ran las regiones muyy silenciosas condensadas, altamente metiladas de las regiones activas, accesibles y no metiladas se desintegran con el paso de los años, a medida que las células se dividen o envejecen. Con todo, las zonas más ocultas del genoma se perciben sólo en penumbra. Tras el hito que supuso la coronación del Proyecto Genoma Humano importa ahora alcanzar una descripción semejante del panorama epigenético. En octubre de 2003, Epigenomics y el Instituto Sanger del Consorcio Wellcome, emprendieron el Proyecto Epigenoma Humano: un plan de investigación de cinco años para cartografiar los sitios de metilación del ADN. Habían levantado ya el mapa de más de 100.000 marcas metílicas unidas al complejo principal de histocompatibilidad, un sector del cromosoma 6 vinculado a muchas enfermedades. La nueva concepción de la naturaleza del genoma abre nuevas vías a la ingeniería genética. Los genes codificadores de proteínas, importantes e inmutables, no constituyen la única fuente de instrucciones para las células. El ADN no codificador cumple también una función destacada, al par que las histonas, las señales químicas unidas al ADN y la forma de la cromatina.
Descifrar el código
N UEVA GENÉTICA
BIBLIOGRAFIA COMPLEMENTARIA THE EPIGENOME : MOLECULAR HIDE AND SEEK. Dirigido por Stephan Beck y Alexander Olek. Wiley, 2003. THE D OUBLE HELIX CONTROLLING . Gary, Felsenfeld y Mark Groudinein en Nature vol. 421, págs 448-453; 23 de enero de 2003. THE CALLIPYGE LOCUS: EVIDENCE FOR THE TRANS INTER ACTION OF RECIPROCALLY IMPRINTED GENES. Michel Georges, Carole Charlier y Noelle Cockett en Trends in Genetics, vol. 19, n. o 5, págs 248-252; mayo de 2003.
57
La evolución codificada Nuevos descubrimientos concernientes a las reglas que gobiernan la codificación génica de las proteínas han revelado cuán excelente es la “programación” con la que la naturaleza protege a la vida de errores catastróficos y acelera su evolución Stephen J. Freeland y Laurence D. Hurst
E
l 14 de abril de 2003 se anunció la secuenciación del genoma humano, un inventario de los 3000millones de pares de nucleótidos de ADN que encierran los planos de construcción de un ser humano. Subsiste, empero, el difícil problema de separar todos los genes funcionales de los residuos sin valor, amén de lograr un conocimiento más pleno del cómo y el cuándo de la activación génica, de q ué modo afectan sus instrucciones al comportamiento de las proteínas que cifran. No es maravilla, pues, que el director del Proyecto Genoma Humano, Francis S. Collins, dijera que la hazaña de su grupo era solamente “el fin del principio”. Collins aludía también a otro acontecimiento conmemorado esa misma semana: el principio del principio, ocurrido 50 años antes, cuando James
las tentativas de descifrar el código genético se centraron sobre todo en los aspectos matemáticos del problema. Muchas de las propuestas iniciales resultaron erróneas , a pesar de que su srcinalidad y sagaz ingenio siguen constituyendo una lectura fascinante. Hasta el extremo de que, cuando el verdadero código se descifró por fin en los años sesenta del siglo pasado, resultó punto menos que decepcionante. La versión de la naturaleza parecía menos elegante que las hipótesis de los teóricos. La muy excelente obra de programación que el código genético es en realidad, no ha quedado de manifiesto hasta hace pocos años, merced a nuevos descubrimientos. Han empezado a aclararse las razones de que la naturaleza eligiese tales reglas fundamentales, así como la causa de que
tura D. Watson de la molécula y Francismisma H. Crick dedesvelaron ADN. Fue la aquélla, estrucasimismo, una época apasionante. Se sabía que la molécula que habían conseguido visualizar encerraba nada menos que el secreto de la vida, que era la molécula que permitía a los organismos compendiarse a sí mismos en un conjunto de instrucciones de montaje, para después convertir otra vez en metabolismo vivo la información así inscrita. Los esfuerzos para desentrañar la forma en que se producía esta conversión mantuvieron embelesada a la comunidad científic a durante los años siguientes.
tres mil esas normas millones hayandepersistido años de selección a lo largonatural. de unos Estamos ya capacitados para mostrar que las reglas del código podrían acelerar la evolución, al tiempo que protegen a la vida de la comisión de errores desastrosos en la síntesis de proteínas. El estudio del código está proporcionando también claves para la resolución de algunos de los problemas que se les plantean a los laboratorios en la era posgenómica. Y al remontarnos hasta los comienzos mismos, con el propósito de comprender las reglas del código subyacente a la vida, vamos descubriendo instrumentos útiles para futuras investigaciones. Al hablar de “código” y de “descodificación” nos estamos expresando en un sentido bastante literal. Las instrucciones genéticas están almacenadas en el ADN y en el ARN, compuestos ambos, a su vez, por un ácido nucleico. Pero los organismos
Se sabía que el alfabeto del ADN constaba sólo de cuatro tipos de nucleótidos. Por consiguiente, las reglas que descodificasen la información encerrada en la doble hélice tenían que indicar a las células cuáles, de los 20 aminoácidos, debían concatenarse entre sí para formar los millares de proteínas de que se componen los varios miles de millones de distintos tipos de organismos. De hecho, la totalidad de la biosfera vive en un permanente y frenético proceso de descodificación conforme hacen eclosión los huevos, germinan las semillas, proliferan loshongos y se escinden las bacterias.
Pero en aquellos tiempos el conocimiento sobre los mecanismos celulares implicados en la traducción del mensaje del ADN era tan limitado, que
se mayor parte de hallan un tipoen desumoléculas muyconstruidos diferentes, alaspartir proteínas. Así, aunque tradicionalmente se diga que un gen consiste en una secuencia de nucleótidos que contiene la descripción de una proteína, la sentencia genética que contiene tal descripción debe traducirse antes desde un cierto sistema de símbolos hacia otro sistema cuyos símbolos son totalmente distintos.
S M L I F M I L S
SECUENCIAS DE TRES “LETRAS”, llamadas codones, del ADN y del ARN ( cuadrados rotulados ) codifican los aminoácidos con los que se edifica y mantiene la vida de la Tierra.
El descifrado del código
Cuando Watson y Crick expusieron la estructura del ADN en 1953, ellos y sus contemporáneos pudieron apreciar que los genes estaban escritos con un alfabeto que constaba de sólo cuatro “letras”, las bases nitrogenadas adenina, citosina, guanina y timina (A, C, G, T); caracterizan a cada nucleótido y forman los peldaños de la doble hélice del ADN. El alfabeto de las proteínas, en cambio, constaba de 20 aminoácidos distintos, por lo que resultaba evidente que, para especificar un aminoácido dado cualquiera, sería necesaria una “palabra” gené-
que dejaba solamente entrever un intrigante rompecabezas matemático. Y la primera solución propuesta no llegó de los biólogos, sino de George Gamow, físico que ideó la teoría de la gran explosión. Su “código diamante”, publicado en 1954, combinaba con elegancia los aspectos aritméticos de la obtención de 20 “significados” aminoacídicos a partir de un alfabeto de cuatro nucleótidos con la estructura física del propio ADN. Según Gamow, en cada vuelta de la doble hélice había un hueco de forma rómbica (el diamante de la baraja), delimitado por nucleótidos situados
a los 20 aminoácidos; las ternas de nucleótidos restantes, hasta las 64 posibles, carecían de significado. El código de Crick, en lugar de solapamientos, era un código “sin comas”: los codones sin significado les resultaban invisibles a las moléculas adaptadoras, por lo que la naturaleza no precisaba de una puntuación figurativa para designar el comienzo de un marco de lectura. El modelo “sin comas” era tan estilizado y elegante, que se ganó la aceptación casi universal. La mereció hasta que los hechos demostraron que, no obstante su rigor aparente, se trataba de una teoría errónea.
tica polinucleótida. Las combinaciones binarias (con repetición) de dos letras seleccionadas entre las cuatro bases generan solamente 16 palabras, o “codones”. Las combinaciones ternarias, en cambio, en las cuales las letras se toman de tres en tres, permiten 64 codones posibles, que son holgadamente suficientes para determinar los 20 aminoácidos. Poco más se sabía entonces sobre la traducción de los genes en proteínas. Ahora comprendemos que las secuencias génicas sí se valen de codones de tres letras para especificar aminoácidos individuales; conocemos también que se requieren varias etapas para que la secuencia de bases del gen se convierta en una secuencia de aminoácidos. En primer lugar, el gen de ADN se copia, corrige y transcribe en ARN, ácido nucleico que utiliza bases similares a las empleadas por el ADN con la salvedad de que, por timina, porta uracil o. Después, la maquinaria celular lee esta versión del gen, copiada en ARN mensajero (ARNm), a razón de tres letras cada vez, al tiempo que la molécula de ARN de transferencia (ARNt) se encarga de traer los aminoácidos especificados, para su mutuo engarce. Pero en los primeros años de la década de los cincuenta este proceso era totalmente opaco, una caja negra
en sus cuatro vértices. Esos huecos permitirían al ADN actuar a modo de una falsilla sobre la cual se alinearían los aminoácidos, determinados por las combinaciones de nucleótidos presentes en cada vuelta. En su modelo se eliminaba un vértice de cada rombo; después, los 64 codones trinucleótidos se clasificaban en grupos químicamente emparentados. El modelo consentía también que los codones significativos se traslapasen, dependiendo del “marco de lectura” o del lugar donde comenzase la lectura de la secuencia de letras a lo largo de la molécula de ADN. Semejante economía en la compresión de datos resultaba muy apreciada por los teóricos de la época. Pero no tardaron en descubrirse cadenas de aminoácidos cuya explicación no podía hallarse ni por el método de Gamow ni por ningún otro de los códigos de solapamiento. Al propio tiempo, los datos existentes parecían negar una interacción directa entre el ADN y los aminoácidos. Crick elaboró una hipótesis según la cual unas moléculas, llamadas adaptadoras, podrían servir de intermediarias; enunció, ya en 1957, una serie de reglas a las que podría atenerse el funcionamiento de dichas moléculas. En términos simples, las moléculas adaptadoras de Crick reconocían sólo 20 codones significativos, correspondientes
Experimentos realizados en los primeros años sesenta demostraron que incluso los codones presuntamente faltos de significado podían provocar en un matraz la síntesis de proteínas. Hacia 1965 se habían establecido ya in vitro los significados genuinos de la totalidad de los 64codones ternarios . No parecían existir relaciones numéricas claras. Ciertos codones eran redundantes: diversos aminoácidos podían estar especificados por dos, cuatro, e incluso seis codones diferentes. Después de tantas entusiastas especulaciones, muchos llegaron a considerar que el código real de la naturaleza era poco más que una casualidad evolutiva.
Resumen / El c ódig o de l a vid a Las instrucciones genéticas para la síntesis de
proteínas están escritas en “palabras” de tres letras, llamadas codones. Cada codón especifica uno de los 20 aminoácidos o bien una señal traductora de paro (“stop”). En otro tiempo se supuso que la disposición de estos codones y de sus significados aminoacídicos se debieron al azar, pero los descubrimientos recientes indican que ha sido la selección natural la que ha elegido y mantenido este orden.
Simulaciones computarizadas han revelado el motivo: al comparar el código
estándar con otros hipotéticamente posibles, aquél resulta extraordinariamente eficaz en la minimización de los daños causados por errores en los propios genes o en el proceso de traducción de los genes a proteínas.
60
¿Un azar fosilizado?
En efecto: ya descifrado el código, se descubrió que, de las bacterias a los humanos, los organismos empleaban las mismas reglas de codificación. Parecía como si nada hubiera cambiado en los miles de millones de años transcurridos desde que los tres dominios fundamentales de la vida — archaea , bacterias y eucariotas— divergieron a partir de un antepasado común. En consecuencia, el sencillo y persuasivo argumento de la “casualidad fosilizada”, propuesto por Crick en 1968, presidió el pensamiento científico hasta no hace mucho. “La correspondencia entre los codones y los aminoácidos fue en este punto cosa enteramente debida al azar”, escribió. Pero una vez que el código se hubo concretado en una cierta forma, resultó tan fundamental para la vida, que cualquier cambio ulterior hubiera desencadenado una catástrofe. La selección natural darwinista se funda en la premisa de que, en ocasiones, un pequeño cambio en un gen puede resultar beneficioso si ello permite a los organismos desenvolverse mejor en su ambiente. Ahora bien, la modificación de las reglas de descodificación de un organismo entrañaría la introducción simultánea de cambios en un sinfín de sitios de su dotación TEMAS 38
El código de la naturaleza
S
i se acepta que cada secuencia génica describe una proteína, resulta que las unidades básicas de tales secuencias son “palabra s” de tres letras. Ca da codón, o tríada, se traduce en uno de los 20 aminoácidos o en una señal de “paro de la traducción”. La maquinaria celular transcribe los genes del ADN a versiones en ARN —cuyos bloques nucleotídicos de construcción se representan por las letras A, C, G y U— y finalmente traduce los genes del ARN, codón tras codón, en la cadena de aminoáci dos correspondiente. A principios de los años sesenta se establecieron las definici ones exactas de la naturaleza de los aminoácidos dadas por la naturaleza ( abajo ). Pero la importancia de las regularidades del código tardó todavía varios decenios en apreciarse.
SINONIMOS Y SEMEJANZAS De los 64 posibles codones de tres letras hay varios que especifican un mismo aminoácido; ello significa que habrá formas diversas de cifrar una proteína. Tales codones sinónimos tienden a diferir en una letra, la última, por lo común, formando una pauta de bloques. Los codones correspondientes a aminoácidos de parecida afinidad por el agua también tienden a diferir en su última letra;
genética, con la alteración consiguiente de sus funciones metabólicas. Sería la diferencia entre introducir un nuevo signo tipográfico en una máquina de escribir (la mutación) y reorganizar por completo su teclado (alteración de la descodificación). Este razonamiento, tan directo y atractivo, peca de un reduccionismo simplista. Si bien la gran mayoría de los sistemas vivos utilizan el código genético estándar, se conocen por lo menos 16 variantes, repartidas por una amplia gama de linajes evolutivos, que asignan a ciertos codones significados diferentes. El sistema subyacente sigue siendo el mismo: codones de tres nucleótidos que se traducen en aminoácidos. Pero mientras que la mayoría de los organismos, al leer en el ARN el codón “CUG”, entenderían que se trataba del aminoácido leucina, no pocas especies de Candida , un hongo, traducen “CUG” por serina. Las mitocondrias, diminutos generadores de energía que encontramos en todo tipo de células, tienen su propio genoma; muchas han desarrollado también asignaciones idiosincrásicas para los codones. Por ejemplo, en el genoma mitocondrial de la levadura del pan ( Saccharom yces cerevisiae ), cuatro de los seis codones que de ordinario se traducen en leucina codifican, en cambio, a la treonina. Conforme fueron multiplicán dose los descubrimientos sobre tales variantes en el curso del decenio de los noventa, se hizo cada vez más evidenN UEVA GENÉTICA
mientras que los codones que comparten una misma primera letra suelen codificar aminoácidos que son productos o precursores unos de otros. Tales propiedades resultan decisivas para la supervivencia de los organismos; podrían incluso haber contribuid o a acelerar su evolución. Posición del segundo nucleótido UCAG UUU Fenilalanina o itd ó e l c u n
r C e im r p l e d n
ió c i s o P
A
Cisteína Cisteína STOP Triptófano
UAU UAC UAA UAG
CUU Leucina
CCU Prolina
CAU Histidina
CGU Arginina
CUC Leucina CUA Leucina CUG Leucina
CCC Prolina CCA Prolina CCG Prolina
CAC Histidina CAA Glutamina CAG Glutamina
CGC Arginina CGA Arginina CGG Arginina
AUU AUC AUA AUG
ACU ACC ACA ACG
Treonina Treonina Treonina Treonina
AAU AAC AAA AAG
Asparagina Asparagina Lisina Lisina
AGU AGC AGA AGG
Serina Serina Arginina Arginina
GCU GCC GCA GCG
Alanina Alanina Alanina Alanina
GAU Aspartato GAC Aspartato GAA Glutamato GAG Glutamato
GGU GGC GGA GGG
Glicina Glicina Glicina Glicina
Isoleucina Isoleucina Isoleucina Metionina
GUU Valina GUC Valina
G GUA Valina
GUG Valina
Todo sistema de codificación ha de habérselas con posibles errores. Pero no todos los errores comportan la misma insidia. En nuestro idioma, las vocales y las consonantes son muy diferentes, por lo que la sustitución de las “a” por “s” hsce lss frsses cssi sbsurdss. En cambio, las letras “s” y “z” tienen un zonido zimilar, azí que ezta fraze zigue ziendo comprenzible. En el caso de sistemas propensos a errores, una estrategia de codificación eficaz sería la que redujera los efectos de los fallos ocasionales, inevitables. En los organismos, los errores se producen de muchas formas. Unas veces, se modifica, por mutación, la versión srcinal en ADN de un gen. En otras ocasiones, un adaptador indebido (un ARNt) se une al transcrito ARNm de un gen y agrega erróneamente un cierto aminoácido a una proteína en formación. Pero incluso en la época en que se creía que el
Tirosina Tirosina STOP STOP
UGU UGC UGA UGG
UCA Serina UCG Serina
te que el código no está, en absoluto, “fosilizado”. Puesto que evoluciona, cabe presumir que evo luc ion ó . Por tanto, las correspondencias normales de codones y aminoácidos, refinadas y preservadas a lo largo de miles de millones de años de selección natural, no han sido una casualidad. A decir verdad, la forma e n que tal correspondencia se halla organizada realiza un excelente trabajo de minimización del impacto de accidentes. Control de daños
UCU Serina
UUA Leucina UUG Leucina
U UUC Fenilalanina UCC Serina
G IN D A E R Y C U L
código era producto del azar, se observó que parecía estar bien configurado para garantizar que los errores solitarios apenas tuvieran repercusión. Ya en 1965, Carl R. Woese, a la sazón en la Universidad de Illinois, descubrió que los codones similares (los que compartían dos de tres letras) solían especificar aminoácidos similares, por lo que un error cometido acá o allá no afectaba sustancialmente a la proteína resultante. Precisar el significado de “similares” cuando se habla de aminoácidos no constituye una tarea fácil. Los 20 aminoácidos divergen unos de otros por su forma, tamaño y carga eléctrica. Lo que observaron Woese y otros fue que los codones que comparten dos de las tres bases propenden a corresponderse con aminoácidos que se asemejan mucho en la medida en que son atraídos o repelidos por el agua. Esta propiedad (hidrofobicidad) es crucial para el funcionamiento de las proteínas. Una cadena de aminoácidos recién formada se pliega de una forma característica en función de las posiciones que ocupen los aminoácidos hidrófobos, que prefieren juntarse y apiñarse al tratar de alejarse del citoplasma celular, que es acuoso, dejando así que sean los hidrófilos los que formen la superficie de la proteína. Merece destacarse cierta peculiaridad del código genético: cuando se produce un error mononucleótido, el aminoácido realmente agregado y el que debía haber sido presentan, a menudo, 61
TAMI J. TOLPA
Protección de las proteínas El código de la naturaleza minimiza los efectos de los errores genéticos, se deban a mutaciones en los propios genes o a fallos del proceso de traducción. Una secuencia génica se traduce en una secuencia correspondiente de aminoácidos, que dicta la estructura tridimensional definitiva que adquirirá la proteína cifrada ( 1, 2 y 3 ).
Incluso en el caso de que se agregue, por error, un aminoácido indebido, la organización del código garantiza que el inserto sea, de ordinario, químicamente similar al correcto, de suerte que apenas si se resiente la proteína sintetizada. Una excepción, ilustrativa del tipo de daño que puede provocar un error en un solo nucleótido, nos la ofrece la anemia falciforme ( abajo ).
Codón
Núcleo
ARNm
ARNm
ADN
Cadena de aminoácidos
1
Cuando un gen de ADN se activa, se expres a ( izquierda extrema ), primero se transcribe en una versión en ARN, anotado casi con el mismo alfabeto de nucleótidos: adenina, citosina, guanina y uracilo. Este ARN mensajero (ARNm) porta las instrucciones genéticas desde el núcleo celular hasta el citoplasma, donde se traduce.
Citoplasma Aminoácido
2 ARNt
Los ribosomas, unos orgánulos celulares, van “leyendo” el ARNm, codón tras codón ( izquierda ). Al mismo tiempo, otra forma de ARN, el ARN de transferencia (ARNt), aprehende aminoácidos libres y se los presenta al ribosoma, donde se agregarán a la secuencia correspondiente de la cadena en formación. Cada ARNt se enlaza a un codón trinucleotídico del ARNm por un extremo y a un aminoácido por el otro.
La cadena de aminoácidos se pliega en el espacio, formando una estructura tridimensional
ARNm Ribosoma Glutamato
3
La proteína, al tiempo que se forma, se pliega sobre sí misma, adoptando una estructura tridimensional cuya morfología depende sobre todo de la afinidad de los aminoácidos por el agua. Los aminoácidos hidrofóbicos tienden a replegarse hacia el interior de la proteína, dejando que sean las partes hidrofílicas, como el glutamato, las que den frente al citoplasma a la derecha ) consta celular, que es acuoso. La molécula de hemoglobina ( de cuatro cadenas de aminoácidos: dos cadenas alfa ( en azul ) y otras dos cadenas beta ( en amarillo ).
HEMOGLOBINA NORMAL
Valina
UN ERROR CRITICO: En el gen de la hemoglobina existen varias mutaciones que permanecen “silentes” (no provocan enfermedad), pues los aminoácidos sustituidos lo fueron por otros similares. Pero si se produce el error de que un aminoácido hidrófilo se reemplace por otro hidrófobo, puede alterarse drásticamente la forma y la función de la proteína resultante. En la enfermedad de anemia falciforme, una mutación, que afecta a un solo nucleótido en el gen correspond iente a la cadena beta de la hemoglobina, cambia el codón CAG del ARNm en el codón CUG ( arriba ), con la sustitución consiguiente del aminoácido glutamato, hidrófilo, por el aminoácido valina, hidrófobo. Los correspondientes lugares hidrófobos de la superficie de la hemoglobina se ven arrastrados unos hacia otros, haciendo que las moléculas se apilen juntas (a la derecha) produciendo fibras rígidas que deforman los hematíes y les dan forma de hoz.
MOLECULAS DE HEMOGLOBINA DE LA ANEMIA FALCIFORME
pareja hidrofobicidad, por cuya razón la alteración que sufre la proteína resultante es relativamente inocua. Ahora bien, ¿cuál es el grado de eficacia del código en este respecto? En torno a esa cuestión empezó, en 1998, nuestra intervención. Nos propusimos desarrollar las observaciones de quienes nos habían precedido. El código, a prueba
Empezamos por calcular la hidrofobicida d de los 20 aminoá cidos. Los valores obtenidos nos sirvieron para estimar el error del código genético, que definimos como el valor medio de la variación deloshidrofobicidad que experimentan aminoácidos resultantes de cambiar una sola letra, de todas las formas posibles, en el conjunto de los 64 codones del código. Dicho valor representa la proclividad del código genético a los errores; por sí solo, carece, sin embargo, de mayor interés. Era necesario saber en qué puesto quedaría situado el sistema de codificación de la naturaleza al compararlo con otros códigos teóricamente posibles. Para generar esa gavilla de códigos hipotéticos, hubimos de partir de ciertos supuestos, concernientes a restricciones que verosímilmente tendrían que respetar un código que funcionase en un mundo de ADN, ARN y aminoácidos. Importa señalar que los errores de traducción del ARNm en el correspondi ente ami noácido se dan con mayor frecuencia en la tercera posición del codón. Este lugar corresponde, sencillamente, al punto en que la afinidad del enlace entre el ARNm y el ARNt es más débil; por tal motivo Crick dio a este fenómeno el nombre de “bamboleo”. Pero los codones sinónimos —aquellos que codifican el mismo aminoácido— a menudo se diferencian sólo en sus últimas letras, por lo que estas traducciones erróneas acostumbran producir, no obstante, un aminoácido correcto. A pesar de que este agrupamiento de codones sinónimos reduce de por sí el valor de error del código, la mecánica del bamboleo sugiere que la disposición resulte de una limitación bioquímica con mayor probabilidad que de una adaptación evolutiva. Así pues, por ser mejor pecar de cautos, para deducir nuestra medida nos ceñiríamos a los códigos hipotéticos que compartieran esta propiedad. Por otra parte, era imposible cuantificar la hidrofobicidad de los codones de paro (“stop”); en consecuencia, mantuvimos invariables su número y su significado en todos los códigos hipotéticos . N UEVA GENÉTICA
El código a prueba
L
os daños sufridos por las proteínas a resultas de mutaciones génicas, o de errores en la traducción o transcripción quedan minimizados cuando los errores provocan la sustitución de aminoácidos por otros de parecida afinidad por el agua (hidrofobicidad). Si se define el valor de error de un código como la variación media de hidrofobicidad de los aminoácidos provocada por todos los posibles cambios de una sola base en todos los codones de un código, tendremos que un elevado valor de error indicaría que el código es muy vulnerable a los errores, mientras que un valor bajo significaría que tal código minimiza los daños. Los autores han generado una extensa muestra aleatoria de hipotéticos códigos, y han observado que solamente 100 de entre 1 millón de esos códigos posible s mostraban un valor de e rror inferior al de l código de la naturaleza ( izquierda ). Se introdujeron después reglas, tomadas del mundo real, referentes a la forma en que mutan los genes o en que son defectuosamente traducidos: el código de la naturaleza supera a todas, derecha ). excepto a una, del millón de variantes considerado ( 21.000 o ig d ó c e d ro e m ú N
25.000
Código natural
5,19
s
15.000 9000 3000
4,0
6,4 8,8 11,2 1 3,6 Error del código
Tomadas en consideración estas limitaciones técnicas, procedimos a generar códigos hipotéticos distribuyendo aleatoriamente los 20 significados entre los 20 bloques de codo nes. Pero aun así resultaban posibles todavía unas 2,5 10 18 configuraciones (número aproximadamente igual al de segundos transcurridos desde la formación de la Tierra). Para facilitar el manejo de tal cantidad de opciones, las agrupamos en grandes muestras aleatorias. Descubrimos que en una muestra de 1 millón de códigos hipotéticos había sólo un centenar que tuvieran un valor de error menor que el correspondiente al código natural. Decidimos perfeccionar nuestro algoritmo de generación de códigos. Para que éste simulara mejor las condiciones del “mundo real”, añadimos restricciones que reflejaban ciertas pautas observadas en las mutaciones del ADN y en los errores de transcripción en ARN. En estas condiciones “del mundo real”, el valor de error del código natural parecía ser todavía inferior en varios órdenes de magnitud, superando en eficacia al millón de hipotéticas variantes, menos a una. Tan extraordinaria robustez del código genético cabe atribuirla a la selección natural. Es posible que alguna vez hubiera muchos códigos, todos con diferentes grados de proclividad a error. ×
s
o g i d ó c e d ro e m ú N
Código natural 20.000 2,63 15.000 10.000 5000 0 2,0
4,4 6,8 9,2 11,6 Error del códi go
G N I D A E R Y C U L
Los organismos cuyos códigos mostrasen mayor capacidad de soportar errores gozarían de mayores probabilidades de sobrevivir; lo ocurrido fue, sencillamente, que el código genético estándar actual venció en la lucha por la existencia. Sabemos que el código admite variantes, por lo que esta hipótesis es razonable. Las pruebas a favor de la hipótesis de que ha sido la minimización de errores la fuerza motriz evolutiva que subyace bajo la organización del código no carecen de críticos. Refinadas búsquedas informáticas pueden sin duda mejorar las elecciones de la naturaleza, aun cuando sea aceptada la premisa de que un código es “bueno” si minimiza la variación de hidrofobicidad de los aminoácidos provocada por errores genéticos. Pero la optimalidad de los códigos resultantes de predicciones informáticas es mera optimalidad con respecto a los criterios suministrados por el programador, y la mayoría de los códigos “superiores” que han sido descritos hasta la fecha, se basan en presunciones simplistas sobre los tipos de errores a que se expone un código en el mundo real. Tales presunciones no tienen en cuenta, por ejemplo, el efecto de bamboleo, lo que imposibilita que sus algoritmos perciban la ventaja de que los codones 63
El código en evolución
E
xisten al menos 16 organismos, perpuesta al codón UAG, que en el código tenecientes a un amplio abanico estándar indica paro (“stop”). de linajes evolutivos, que se desvían Es probable que el código utilizado del código estándar de la naturaleza por la vida primitiva no alcanzase a al asignar “significado aminoacídico” a especificar 20 aminoácidos. De hecho, determinados codones. Por ejemplo, los aminoácidos más complejos derimuchas especies de Acetabularia , un van de otros más sencillos por modifialga verde, traducen los codones UAG cación bioquímica. Por ejemplo, en y UAA en el aminoácido glicina, mienvarias especies de bacterias el amitras que en el código estándar tales noácido glutamina se sintetiza a parcodones son señales de paro (“stop”). tir de glutamato, mientras éste se Para los hongos Candida el codón CUG encuentra todavía engarzado a su ARN. del ARN especifica serina, cuando por Este fenómeno induce a pensar que norma determina el aminoácido leucina. ciertos aminoácidos recientes pudieLa existencia de tales variaciones pone ran haber aparecido en forma de modiACETABULARIA, un alga marina, puede alcanzar una longitud de 5 cm. Cada pedículo está de manifiesto que el código genético ficaciones de un conjunto primordial constituido por una sola célula, la mayor que ha podido evolucionar, e incluso dar más restringido y que los recién llegaconoce la ciencia. indicaciones de cómo lo hizo. dos “se apropiaron” de un subconjunto En los tres dominios de la vida, se de los ARNt y de codones asignados fabrica en ocasiones el aminoácido selenocisteína, no pera sus parientes relativamente más simples; también, cierteneciente al cupo de los 20, en respuesta al codón estántos codones parecen haber sido “capturados” por aminoácidar UGA. La selenocisteína se srcina por alteración biodos estándar en los organismos que se sabe que emplean química de la serina mientras ésta se encuentra todavía códigos variantes. Estos descubrimientos suscitan la cuesaprehendida en su ARN en el ribosoma. En dos dominios tión de cuántos códigos variantes más pueden existir en la (archaea y bacterias) existe un vigésimo segundo aminoánaturaleza y la de si el código estándar acabará ampliáncido, la pirrolisina, que es producido de igual modo, en resdose y dando cabida a muchos más aminoácidos.
sinónimos se diferencien, de modo exclusivo, en su tercera letra. Esta insuficiencia pone de manifiesto un segundo problema asociado a los códigos optimizados por la simulación teórica. La selección natural es un “diseñador ciego”: solamente puede tender a un ideal eligiendo, en cada generación, la mejor opción que haya en una población de variantes. Si se opera por esa vía una simulación de la evolución natural, encontramos que el grado de minimización de error conseguido por el código genético estándar sigue todavía siendo bastante impresionante: menos del 3 por ciento de los códigos hipotéticos pueden evolucionar por medio de la selección para llegar a igualar la robustez del código natural. Dicho de otro modo: el código “diamante” y el código “sin comas” parecieron antaño ser superiores al propio código de la naturaleza; cabría incluso generar, por medios informáticos, códigos matemáticamente más idealizados todavía. Pero la mera exhibición de la posibilidad de que existan códigos superiores, sin tener en cuenta el proceso evolutivo, resulta de dudosa relevancia para comprender la solidez de la solución alcanzada por selección natural. El código genético no sólo es un producto de la selección natural. Podría operar al modo de un algo64
. C N I , S R E H C R A E S E R O T O H P / Y R A R B I L O T O H P E C N IE C S / D L E F N E S O R IS X E L A
ritmo de exploración que busque acelerar la evolución. Las propiedades del código asociadas a la minimización de impactos, con sus bloques de codones sinónimos y de codones que especifican aminoácidos similares, no se limitan a restringir los daños. A diferencia de lo que sucede con las alteraciones de gran alcance, las micromutaciones tienen, en términos estadísticos, mayores probabilidades de resultar beneficiosas; de ese modo, al minimizar los efectos de una mutación cualquiera, el código maximiza la probabilidad de que una mutación génica conduzca a una mejora en la proteína resultante. Utilización del código
La comprensión de las fuerzas que configuraron el código y la forma en que éste, a su vez, moldea el curso de la evolución, no sólo permite admirar la pericia de la naturaleza en cuanto diseñadora de software . Ese conocimiento puede contribuir a la solución de los problemas planteados hoy en los laboratorios. Entre las prioridades en biología molecular destaca la identificación de genes. Se trata de ir cerniendo resmas de secuencias de genoma en bruto hasta descubrir las que definen auténticos genes. Pero las búsquedas en curso se limitan a usar como patrón las propiedades características de los
genes conocidos ya. Al tener en cuenta la forma en que el código genético filtra las mutaciones génicas, tales búsquedas podrían resultar potenciadas, pues permitirían reconocer genes sumamente diversificados e, incluso, inferir quizá la función de las proteínas por ellos cifradas. Cabe también la posibilidad de extraer claves sobre el plegamiento de las proteínas —dictado por la disposición de sus aminoácidos—, mediante el análisis de las propiedades de minimización de error de sus codones y el examen de la forma en que sus sustituciones podrían repercutir en el tamaño, carga, o hidrofobicidad de los aminoácidos. También los biólogos pueden aplicar los conocimientos adquiridos sobre el código estándar para “disfrazar” genes con fines de investigación. La existencia de un código que es universal, o poco menos, para todas las formas de vida ha posibilitado que se convierta en práctica común tomar un gen de interés (un oncogén, por ejemplo) e insertarlo en Escherisch ia coli , que fabricará la proteína correspondiente. Aunque no siempre se logra, porque el organismo receptor no puede expresar el gen, porque produce menos proteína de la esperada o porque sintetiza una proteína ligeramente diferente de la humana. Este problema, verdadera cruz de la investigación, resulta, en ocasioTEMAS 38
nes, de la dispar preferencia de los organismos por codones sinónimos. Pensemos, por ejemplo, en el código estándar, que contiene seis codones para el aminoácido arginina: los genes humanos tienden a preferir el uso de los codones AGA y AGG, en tanto que la bacteria E. coli sólo muy raramente se vale de AGA y a menudo lo traduce mal. El conocimiento de estas variaciones y preferencias consiente el diseño de versiones del gen humano que funcionarán fiablemente al introducirlas en otros organismos. Uno de nuestros laboratorios (el de Freeland) está desarrollando aplicaciones informáticas facilitar la conversión destinadas de las ante-a riores acotaciones teóricas al código en instrumentos aptos para la ingeniería genética, el rastreo de genes y la predicción del plegamiento de las proteínas. Junto con otros especialistas estamos investigando el camino recorrido hasta la constitución del código, es decir, de qué modo empezó el ARN a interactuar con los aminoácidos, cómo llegó su asociación a desarrollar un sistema formal de codificación, y de qué manera se fue ampliando el alfabeto de aminoácidos durante las primeras fases de la evolución. Esta metodología podría abrir caminos hacia muchas otras cuestiones pendientes: ¿A qué se debe que haya sólo 20 aminoácidos estándar, ni uno más ni uno menos? ¿Por qué se hallan ciertos aminoácidos en correspondencia con seis codones, mientras que otros lo están con uno o dos? ¿Tendrá esta organización que ver con la minimización de errores? El desciframiento del código ha demostrado ser meramente el principio para comprender su significado.
COLABORADORES DE ESTE NUMERO Asesoramiento y traducción:
Esteban Santiago: El genoma oculto, El nacimient o de la e pigenética , Microsatéli tes de ADN , Interferencia de ARN y El cromosoma de la masculinidad ; Luis Bou: La evoluci ón codificada; Felipe Cortés: Importancia del context o en la genética; Alfonso Susana: Micromatrice s de ADN ; Ana María Rubio: Los comienz os de la industria del genoma humano y La fiebre bioinformá tica.
Portada: Slim Films INVESTIGACIO N Y CIENCIA DIIRECTOR GENERAL José M. a Valderas Gallardo DIRECTORA FINANCIERA Pilar Bronchal Garfella EDICIONES Juan Pedro Campos Gómez
a Cruz Casas PRODUCCIÓNLaia M.Torres Iglesias Capón
Albert Marín Garau
SECRETARÍA Purificación Mayoral Martínez ADMINISTRACIÓN Victoria Andrés Laiglesia SUSCRIPCIONES Concepción Orenes Delgado
Olga Blanco Romero Prensa Científica, S. A. Muntaner, 339 pral. 1. 08021 Barcelona (España) Teléfono 934 143 344 Telefax 934 145 413 www.investigacionyciencia.es EDITA
SCIENTIFIC AMERICAN EDITOR IN CHIEF John Rennie EXECUTIVE EDITOR Mariette DiChristina MANAGING EDITOR Ricki L. Rusting SENIOR EDITOR Michelle Press NEWS EDITOR Philip M. Yam SPECIAL PROJECTS EDITOR Gary Stix SENIOR WRITER W. Wayt Gibbs EDITORS Mark Alpert, Steven Ashley,
Graham P. Collins, Carol Ezzell, Steve Mirsky y George Musser Richard Hunt
PRODUCTION EDITOR
GENERA L MANAGE R Michael Florek VICE PRESIDENT AND MANAGING DIRECTOR, INTERNACIONAL
Dean Sanderson PRESIDENT AND CHIEF EXECUTIVE OFFICER
Gretchen G. Teichgraeber John Sargent
CHAIRMAN
DISTRIBUCION
PUBLICIDAD
para España:
Madrid: GM Exclusivas Publicidad Menorca, 8, Bajo, Centro Izda. 28009 Madrid Tel. y Fax 914 097 046
LOGISTA, S. A.
BIBLIOGRAFIA COMPLEMENTARIA A QUANTITATIVE MEASURE OF ERROR MINIMIZATION IN THE GENETIC CODE. David Haig y Laurence D. Hurst en Journal of Molecular Evolution, vol. 33, n.º 5, págs. 412-417; noviembre de 1991. THE INVENTION OF THE GENETIC C ODE . Brian Hayes en American Scientist , vol. 86, n.º 1, págs. 8–14; enero-febrero de 1998. THE GENETIC CODE IS ONE IN A MILLION. Stephen J. Freeland y Laurence D. Hurst en Journal of Molecular Evolution, vol. 47, n.º 3, págs. 238–248; septiembre de 1998. THE CASE FOR AN ERROR-MINIMIZING GENETIC CODE . Stephen J. Freeland, Nick Keulmann y Tao Wu en Origins of Life and Evolution of the Biosphere, vol. 33, n.º 4–5; págs. 457–477; octubre de 2003.
N UEVA GENÉTICA
a
Pol. Ind. Polvoranca Trigo, 39 Edif. 2 28914 Leganés (Madrid) Teléfono 914 819 800
Cataluña: QUERALTO COMUNICACION
para los restantes países: Prensa Científica, S. A.
Julián Queraltó Sant Antoni M.a Claret, 281 4.º 3.a 08041 Barcelona Tel. y fax 933 524 532 Móvil 629 555 703
Muntaner, 339 pral. 1.a 08021 Barcelona Teléfono 934 143 344 Copyright
©
2004 Scientific American Inc., 415 Madison Av., New York N. Y. 10017.
©
Copyright
a
2004 Prensa Científica S.A. Muntaner, 339 pral. 1.
08021 Barcelona (España)
Reservados todos los derechos. Prohibida la reproducción en todo o en parte por ningún medio mecánico, fotográfico o electrónico, así como cualquier clase de copia, reproducción, registro o transmisión para uso público o privado, sin la previa autorización escrita del editor de la revista. El nombre y la marca comercial SCIENTIFIC AMERICAN, así como el logotipo correspondiente, son propiedad exclusiva de Scientific American, Inc., con cuya licencia se utilizan aquí.
ISSN: 1135-5662
Dep. legal: B. 32.350 – 1995
Imprime Rotocayfo-Quebecor, S.A. Ctra. de Caldes, km 3 - 08130 Santa Perpètua de Mogoda (Barcelona) Printed in Spain - Impreso en España
65
Importancia del contexto en la genética El entorno influye en los efectos de los genes y condiciona la herencia de los caracteres, se trate del color de una flor o de la probabilidad de desarrollar un cáncer H. Frederik Nijhout
E
n los primeros días de la genética se pensaba que cada gen codificaba la información correspondiente a un único rasgo: el color, la forma o el tamaño. Esta creencia surgió en el siglo XIX como resultado del trabajo del padre de la genética, Gregor Mendel, quien de intento o por casualidad estudió caracteres cuya variación se debía casi por completo a los cambios en un solo gen. Pudo así deducir los patrones básicos que conforman las leyes fundamentales de la genética. A medida que nuestra experiencia con la genética creció, se hizo patente, sin embargo, que la mayoría de los caracteres o fe no tipo s se heredan mediante mecanismos más complicados que los descritos por Mendel. La razón estriba en que las diferencias observadas entre los rasgos de cualquier par de individuos se deben casi siempre a diferencias en muchos genes. El efecto aislado de un solo gen se observa normalmente sólo mediante experimentos de entrecruzamiento muy controlados, o bien en aquellos casos, poco frecuentes, en que un gen se encuentra tan dañado, que su ausencia afecta al fenotipo sobremanera, enmascarando la variación de otros genes que influyen en el mismo. Cuando muchos genes contribuyen a un carácter, quizá resulte difícil discernir la contribución particular de cada uno al resultado final. Además, cuando abundan los genes que varían de un individuo a otro, el patrón hereditario de un rasgo determinado puede ser extraordinariamente complejo. De hecho, la expresión carácter complejo se refiere a los rasgos cuya herencia de generación en generación no se ajusta a las leyes de Mendel. El análisis de los mecanismos bioquímicos mediante los cuales los genes afectan al fenotipo es una de 66
las maneras que tenemos de entender la transmisión de los caracteres complejos. Más adelante, hablaré de la naturaleza general de los rasgos genéticos complejos e ilustraré con simples gráficas de qué forma las interacciones entre muchos genes controlan un carácter. Tal visualización nos proporciona una clave para una comprensión intuitiva de la herencia compleja y nos ayuda a explicar por qué el ser portador de un gen de una determinada enfermedad no siempre permite una predicción del riesgo de desarrollarla. Flores y fenotipos
Mendel observó que, cuando se cruzaba una planta de guisante de flores blancas genéticamente pura con otra de flores violetas, también pura, siempre resultaba una progenie con flores violetas. Curiosamente, cuando esas flores violetas de segunda generación se cruzaban a su vez entre sí, una cuarta parte de la progenie presentaban flores blancas y el resto eran, de nuevo, plantas con flores violetas. Esta observación se explica por el hecho de que cada individuo hereda una versión de un gen, llamada alelo, de cada progenitor; a su vez, uno de dichos alelos se transmite a cada uno de sus descendientes. Se denomina a esta composición genética el genot ipo de un individuo. En este caso, el alelo para el color violeta es dominante sobre el del color blanco, de manera que, cuando los dos alelos se encuentran, la flor es siempre violeta. Que exista la misma probabilidad de que un descendiente reciba uno u otro alelo de cada progenitor explica que dos progenitores con flores violetas puedan tener descendencia con flores blancas. Todos los caracteres estudiados por Mendel son ejemplos de fenotipos discontinuos : flores blancas o violetas,
guisantes lisos o rugosos, tallos largos o cortos. En cada caso había dos alelos por gen, y uno de ellos era completamente dominante sobre el otro. No obstante, no siempre funcionan así las cosas, ni siquiera cuando se trata de rasgos que parecen estar gobernados por un solo gen. Consideremos la herencia del color en las flores de dragón, descrita, en la aurora del siglo XX , por E rwin Baur, investigador del que hoy es el Instituto Max Planck de Mejora Vegetal. Como ocurre con las del guisante, el color de las flores del dragón depende de un simple gen con dos alelos típicos: rojo y blanco. La particularidad reside aquí en que ninguno es dominante. Cruzando una planta pura con flores rojas con una planta pura con flores blancas se obtiene progenie con flores rosas. O sea, la combinación de alelos rojo y blanco produce un resultado intermedio. Este fenómeno de dominancia incompleta puede observarse enseguida porque el color de la flor de dragón es un fenot ipo conti nuo , potencialmente con un rango continuo de tonos rosa entre el blanco y el rojo. Caracteres simples y pasos que limitan rendimien tos
Los dragones reflejan una observación común: la existencia de caracteres que varían de manera continua dentro de una población. En unos pocos casos se debe a cambios en un solo gen, pero en la inmensa mayoría de los rasgos intervienen muchos genes. El mismo color de una flor es producto de varias causas genéticas subyacentes. Los genes que controlan la biosíntesis de pigmentos en las flores son muchos. Unos codifican enzimas que transforman precursores incoloros —aminoácidos, azúcares— en TEMAS 38
T IS T N E I C S
N A C I R E M A / A N IA N O S H T I M S N IO C U T I T S N I , L A R U T A N IA R O T S I H E D L A N IO C A N O E S U M / K R A L C P I H C
varios pigmentos cromáticos. Esas rutas de biosíntesis pueden incluir más de una docena de pasos, cada uno de ellos regulado por una enzima diferente. Otros genes codifican proteínas que regulan la síntesis y la actividad enzimática; se trata de reguladores que afectan al momento y lugar donde se producen los pigmentos. Y otras proteínas controlan la estabilidad y localización subcelular de los pigmentos. Los genes que codifican estas proteínas reguladoras están, a su vez, regulados por otras proteínas, los factores de transcripción, cada uno de ellos codificado por un gen particular. Y un conjunto diferente de genes controla la producción de factores de transcripción . Esta especie de regresión interminable de regulación e interacción entre genes, por extraña que parezca, constituye la regla general, incluso para el más simple de los caracteres. ¿Cómo es posible entonces que un solo gen parezca controlar las propiedades de un carácter determinado? Puede ocurrir, de manera hasta cierto punto inmediata, si la enzima codiN UEVA GENÉTICA
1. ALGUNOS CARACTERES ofrecen una amplia gama de variación en el seno de una población, como se muestra en esta fotografía de conchas del caracol arborícola cubano Polymita picta, especie endémica del extremo oriental de la isla de Cuba. Esta variación es el producto de la acción conjunta de muchos genes; el resultado de la variación de cualquier gen está bajo la influencia de la composición genética global del individuo.
ficada por ese gen actúa en el paso que limite la velocidad de reacción, ese punto de cualquier sistema que obstruye el flujo. Imaginemos agua que fluya sucesivamente por tres embudos de diferente tamaño. ¿Qué determinará el caudal del flujo en este sistema? El embudo más estrecho ( véase la figura 2) Para aplicar la imagen a la explicación de los genotipos y fenotipos, imaginemos que cada embudo representa la acción de una enzima en una ruta metabólica. Altos niveles de actividad enzimática —que podrían reflejar una abundancia de proteína o una alta eficiencia— corresponden a embudos de boca ancha, mientras que los niveles bajos vendrían representados por las bocas estrechas. Por otra parte, podemos extender este ejemplo para explicar por qué la transmisión en la herencia del color
de la flor parece estar controlada por un solo gen, aunque se requiera un gran número de genes para la correcta síntesis del pigmento. El agua representará en este caso las moléculas precursoras que recorren pasos sucesivos de un proceso que conduce a la formación de un pigmento. Cada embudo simbolizaría el producto de un gen: cuanto más estrecha fuese la boca del embudo, menor sería la actividad de esa enzima. Si el producto (enzima) del gen rojo/blanco de Baur es el embudo más estrecho de la serie, el rendimiento total de la formación de pigmento será una función de la actividad de esa enzima. Mientras no haya otro producto génico con una actividad más baja, diremos que los cambios en tal gen controlarán la variación del color de la flor. ¿Qué ocurre si fluctúan los niveles de actividad de otros genes d e la 67
ruta? En este modelo simple, la respuesta es: nada, mientras dichos niveles no se aproximen al punto limitante del rendimiento. Si alguno de los otros pasos de la ruta se convierte en limitante del rendimiento, el paso rojo/blanco ya no determinará en exclusiva el color de la flor. En cuanto otro gen codifique una enzima deficiente que bloquee de manera eficaz la ruta (una “mutación nula”), la composición alélica rojo/blanco se volverá irrelevante para la determinación del color de la flor. Epi sta sis se denomina a este efecto, en el cual un gen altera la expresión de otro. Así, incluso tanun elemental, el efectoen deun unejemplo gen sobre carácter puede ser sensible a otros genes que participen en la ruta. Nuestra metáfora de los embudos vale también para explicar los rasgos dicotómicos de las flores del guisante de Mendel. Un genotipo binario sólo requiere que añadamos al modelo un discriminador sensible a un umbral. Podría ser un brazo que sujetase el recipiente que recoge el agua bajo los embudos; por encima de cierta cantidad de agua, el brazo cedería y el recipiente apretaría al bajar un botón que pondría en marcha la producción de pigmento violeta. Si el flujo a través del sistema se encuentra por debajo del umbral, se manifestará un genotipo; si se sobrepasa el umbral, el genotipo será otro. Mutaciones y moderadores
Un modo frecuente de estudiar la relación entre un gen y un carácter es examinar los efectos de mutaciones espontáneas o artificialmente inducidas en dicho gen. La mayoría de las mutaciones disminuyen la actividad de un producto génico; los efectos de tal mutación pueden suministrarnos pistas acerca del papel normal que desempeña el gen en la determinación de un carácter. Con el tiempo, se ha comprendido que el efecto de una mutación genética sobre un carácter no constituye una propiedad intrínseca del gen. La naturaleza del efecto depende mucho del contexto celular en que se exp rese el gen. Sean Carroll y sus colaboradores de la Universidad de Wisconsin demostraron que, en los embriones de oruga, la expresión localizada del gen distalless inducía la formación de las patas. Si el mismo gen se expresa durante una fase más avanzada, en el ala en desarrollo, induce la formación de un patrón de manchas coloreado. También ilustran la importancia del contexto los estudios acerca de 68
T S I T N IE C S N A C I R E M A / E N N U D M O T
Pasos limitantes
la ingeniería genética introduce un oncogén en un ratón, de ordinario sólo induce cáncer en unos cuantos tejidos, aun cuando el gen se exprese de manera general. Esta observación sugiere que sólo algunos tejidos proveen las condiciones requeridas para que el gen defectuoso ejerza su efecto deletéreo. La aditividad y po r qu é es un err or
Los efectos diversos de los oncogenes se atribuyen a “factores coadyuvantes”, que varían según el tejido y el individuo. Por lo normal, se desco-
2. EL CONCEPTO DE PASO LIMITANTE del rendimiento puede ilustrarse con el ejemplo de un agua que fluya a través de una serie de embudos. Dado que el agua no fluirá más deprisa de lo que pueda pasar a través del más estrecho de los embudos, este último determinará el rendimiento total del flujo en el sistema. Será el paso limitante del rendimiento.
los efectos del knoc kou t, o supresión de genes específicos, del ratón. Este método elimina la función de un producto génico. Por ejemplo, el knockout de un gen relacionado con el retinoblastoma causa anomalías severas y muerte embrionaria en una cepa de ratón, mientras que la misma mutación en otra cepa no ejerce efecto alguno: los ratones son viables y alcanzan la madurez sexual, tal como han demostrado Michael Rudnicki y sus colaboradores de la Universidad McMaster. Otros ejemplos de la importancia del contexto proceden de los estudios de la genética del cáncer. Mutaciones en genes que regulan el desarrollo normal de la célula y su división pueden trastornar tal regulación y dar lugar a esa proliferación descontrolada que conocemos como cáncer. A los correspondientes alelos mutados se los llama oncogenes. Que un oncogén en particular srcine un cáncer depende con frecuencia del fondo genético del individuo, así como de determinadas variables ambientales —una deficiencia en vitaminas, el hábito de fumar—. Cuando
nocen las identidades esos simple, factores. Según la hipótesisdemás cada factor que afecta a un carácter tiene un pequeño efecto por sí solo y la suma de esos pequeños efectos produce una influencia grande y observable en el fenotipo. Podemos llamar a esta idea la hipót esis aditiv a . Si fuese correcta, podríamos elaborar un catálogo de los efectos independientes de cada alelo de cada gen y aprovechar esa información para deducir el efecto de varias combinaciones alélicas. A la suma genética podríamos añadirle las consecuencias numéricas de los factores ambientales y obtendríamos una descripción fenotípica precisa. Si el rasgo de interés fuese una e nfermedad, digamos que el cáncer, la hipótesis aditiva nos permitiría determinar, para cada individuo, si va a sufrirla partiendo del conocimiento de los factores participantes. Pero no conocemos todos los factores que contribuyen. Por eso, sólo podemos calcular la probabilidad de una enfermedad. Estas probabilidades se obtienen del análisis estadístico de un grupo extenso de personas, algunas de las cuales sufren la enfermedad. Establecer una correlación entre la incidencia de la enfermedad y los factores que se sospecha que intervienen en su aparición predice el riesgo asociado a la presencia de cada factor. Las probabilidades no son auténticas predicciones, sino la descripción estadística de ese grupo de estudio específico. Sólo hay una predicción segura: en grupos idénticos las correlaciones y probabilidades serán más o menos iguales. Ahora bien, aun cuando pudiésemos medir todos los factores que contribuyen, lo que sabemos acerca de los mecanismos con que los genes influyen en los caracteres nos indica que la simple hipótesis aditiva debe ser errónea. Para empezar, los genes ejercen su influencia por medio de redes de interacciones proteicas comTEMAS 38
plejas e interconectadas; los efectos de cualquiera de los participantes en el sistema tomado en su conjunto no son directos, en absoluto. Lo observamos en la red reguladora génica de las primeras fases del desarrollo de la mosca de la fruta ( véase la figura 3 ). Aquí, los propios productos regulan la expresión génica, controlando hasta qué grado se producirá cualquier otra proteína, con frecuencia otro regulador. En tales entramados complejos, con ramificaciones y rutas convergentes, con retrorregulación positiva y negativa, resulta improbable que los efectos
cidad de la reacción (el flujo a través de la ruta) se convierte en una función no lineal de la actividad de cualquiera de las enzimas. Esa no linealidad resulta cada vez más pronunciada conforme se va alargando la cadena. Examinemos ahora una de las enzimas de la cadena de reacciones. Supongamos que el gen que codifica esta enzima presenta dos alelos, y que las enzimas codificadas por esos dos alelos cumplen misiones diferentes. Los individuos homocigóticos son aquellos que tienen dos copias idénticas de uno o el otro alelo; definen los lími-
La lección que debe aprenderse aquí es que la dominancia no constituye una propiedad del alelo en sí, porque, en cuanto a la enzima sola, los alelos operan de un modo simplemente aditivo. La dominancia surge del contexto; en este caso, la cadena de reacciones en la que la enzima está integrada. La dominancia resulta así una propiedad del sistema en su conjunto.
de la variación en un componente interactúen aditivamente con la diversidad de otros componentes. Quizá la razón más importante de que no haya aditividad en los efectos genéticos estribe en la relación entre diversidad genética y variaciones en los caracteres, que no es lineal. La no linealidad se debe a que el efecto de la variabilidad genética depende del contexto, y ello hace difícil de predecir el efecto de la variación simultánea en varios genes. Para entender las propiedades de los sistemas genéticos no lineales partiremos de un ejemplo sencillo: el srcen de la dominancia entre los alelos de un gen en un individuo híbrido.
tes inferior ode superior de la actividad enzimática los individuos. Los heterocigotos poseen una copia del alelo de baja actividad y una copia de la versión de alta actividad: la actividad total de la enzima en un heterocigoto se encontrará exactamente en el término medio entre las actividades de los homocigotos. Sin embargo, debido a que el flujo a través de la ruta no es una función lineal de la actividad enzimática, el flujo del heterocigoto se parecerá más al de uno de los dos homocigotos. Uno de los alelos parecerá ser dominante con respecto al otro.
vidual velocidad de una reacción encon su la conjunto, Kacser y Burns supusieron constantes las actividades de las demás enzimas de la ruta. En un sistema biológico real esto es muy improbable. A lo largo de miles de generaciones, la mayoría de las enzimas, si no todas, que participan en una cadena habrán acumulado cambios genéticos. Imaginemos por ello qué ocurriría si hay cambios genéticos en dos de las enzimas de una ruta. Puesto que ahora tenemos dos variables independientes, ya no podemos representar la reacción con una línea en una gráfica bidimensional .
Var iab ili dad en m úl tip les pasos de una ruta
En el proceso de calcular cómo se relaciona la actividad de una enzima indi-
No linealidad y dominancia
La no linealidad de un resultado significa que no depende, de manera directa, de lo que entre en el sistema. La existencia de alelos dominantes y recesivos en los guisantes de Mendel nos ofrece un ejemplo. En las flores del guisante, la existencia de un discriminador, el brazo sensible a un umbral de peso, impide que el resultado varíe continuamente según lo que entre. No ha de sorprender, pues, que la dominancia se deba, por lo común, a la existencia de procesos no lineales (umbrales) en la bioquímica y el desarrollo. En la historia de la bioquímica encontramos un caso prototípico de cómo la no linealidad produce dominancia. En 1981, Henrik Kacser y James Burns, de la Universidad de Edimburgo, describieron de qué modo la velocidad global de una serie de reacciones catalizadas por enzimas dependía de la actividad de una de las enzimas de la cadena. La velocidad del conjunto dependerá de cuántas enzimas haya en la cadena. Para un sistema de una sola enzima, la velocidad de la reacción es simplemente una función lineal de la actividad de la proteína en cuestión. Pero si la cadena consta de más de una enzima, la velo N UEVA GENÉTICA
Genes maternos
Genes gap
Genes de regla par
caudal
giant
ta illess
fushi tarazu
bicoid
hunchback
even-skipped
nanos
Krüppel
kn irps
runt
hairy
Inhibició n Activació n Inhibició n a altos niveles, Activació n a bajos niveles
Genes de polaridad de segmento engrailed
hedgehog
w
T IS T N IE C S N A C I R E
ingless
M A / E N N U D M O T
3. LOS GENES QUE CONTROLAN las primeras fases del desarrollo de la mosca de la fruta forman una red compleja; abarca circuitos de retroalimentación positiva, negativa y variable, así como una organización de múltiples niveles. La jerarquía y asignación de clase (gen materno, gap o de regla par) se basan en las propiedades funcionales de los productos génicos, determinadas por otros genes del sistema. Estas interacciones ilustran por qué las diferencias genéticas simultáneas en muchos pasos de una vía compleja pueden alterar el efecto de cualquier gen sobre el fenotipo.
69
GUISANTES LISOS
GUISANTES LISOS
alelo no es algo intrínseco, sino una propiedad emergente del sistema; en este caso, una función del lugar donde reside exactamente el individuo en la superficie fenotípica. Supongamos que no hay variación genética. Cada gen porta un solo alelo y todos los individuos de una población son homocigotos para todos los genes. Existe entonces un solo valor genético para cada gen; todos los individuos de la población ocupan el mismo punto en la superficie fenotípica. En tales circunstancias nos podríamos preguntar: si ocurre una mutación en uno de los genes, ¿qué
GUISANTES RUGOSOS
GUISANTES LISOS
GUISANTES LISOS
efecto tendrá el fenotipo? dería tanto deen la magnitud delDepenefecto de la mutación como de dónde se concentrase la población en la superficie fenotípica. Supongamos que la mutación tiene un gran efecto sobre uno de los genes, la deleción de una región inhibidora; con ello se maximiza la actividad de la enzima que codifica. Esta mutación desplaza al individuo hasta otro punto sobre la superficie, a lo largo de una línea paralela al eje que representa al gen mutado ( véase la figura 4 ). Si el individuo se encuentra en una zona de la superficie con una pendiente muy pronunciada, la mutación comportará un cambio fenotípico mucho mayor que si la pendiente fuera suave. Por tanto, el efecto de una mutación sobre un carácter depende, tal y como pasa con la dominancia de ese carácter, del punto exacto de la superficie fenotípica de que se trate. En otras palabras, el efecto no es una propiedad de la mutación propiamente dicha, sino una función del sistema en su conjunto.
GUISANTES LISOS
El paisaje fenotípico
GUISANTES LISOS Y RUGOSOS EN LA MISMA VAINA, CON PREDOMINIO DE LOS LISOS
Se convierte en una superficie en un espacio tridimensional ( véase la figura 4). La llamaremos “superficie fenotípica”, porque describe la relación del fenotipo con la variación genética. Cada punto de la superficie fenotípica representa el efecto combinado de dos variables independientes. La variable dependiente —fenotipo— equivale al flujo o caudal a través de la ruta. Dos puntos (o dos individuos) 70
pueden tener el mismo valor fenotípico pero muy diferentes genotipos. En este caso el grado de dominancia de un gen dependerá también de los alelos presentes en el otro gen variable. Si el segundo gen codifica enzimas con alta actividad, la relación no lineal entre el primer gen y el flujo de la reacción diferirá de lo que sería en presencia de baja actividad. De nuevo, pues, la dominancia de un
I T T E N A Z A N A I Z I T E D O J U IB D
Ahora ya estamos en condiciones de entender por qué las mutaciones ejercen efectos tan dispares en diferentes fondos genéticos. El fondo genético define dónde se encuentra alojado un individuo o población genética dentro de un paisaje fenotípico. La figura 4 muestra dicha superficie con dos individuos, X e Y, que portan el mismo fenotipo (la misma cota en la gráfica tridimensional) a pesar de tener alelos distintos para los genes A y B. Debido a sus posiciones relativas en la superficie, las mutaciones en el gen A acarrearán distintas consecuencias para Y (gran efecto fenotípico) que para X (efecto mínimo). Ocurriría lo contrario para una mutación del gen Y. Cabe entonces imaginar que una población de individuos con genotipo A podría acumular muchas mutaTEMAS 38
4. DOS INDIVIDUOS QUE RESIDEN EN LA MISMA LINEA DE NIVEL de la superficie fenotípica (X e Y) cuentan con idéntico fenotipo, aunque tengan valores muy diferentes para los genes A y B (a). En consecuencia, a X e Y les afectará de forma muy diferente una mutación del gen A que maximice la actividad de la proteína que codifica (b). La persona X no resultará afectada por la mutación; seguirá ocupando la misma cota. Por el contrario, Y adquirirá un fenotipo completamente diferente en virtud del cambio. La superficie fenotípica explica por qué las poblaciones tienden a apiñarse a lo largo de una cota ideal ( c). Cuando los individuos X e Y de los extremos opuestos de la población se cruzan, su progenie presenta valores intermedios de los productos génicos de A y B. Debido a la relación no lineal entre estos genes y el fenotipo, los valores intermedios para A y B colocan a la progenie en una cota diferente, que quizá represente una menor viabilidad. Esto tiende a agrupar las poblaciones, pues el cruzamiento entre indivi-
X
N A C I R E M A / E N N U D M O T
Y
1,0 0,8 o
g s
a0,6 R
0,4
Y
0,2
duos delque centro del grupo dará una progenie con los mismos valores los padres.
0
1,0
0 ,6 n
A
Una superficie fenotípica no es más que una representación visual de los procesos que dan lugar a un carácter. Hemos visto cómo pueden construirse superficies para una vía bioquímica sencilla. En principio, es posible extender esto a cualquier variable que influya en el carácter. Hay tres prerrequisitos: conocer los procesos que subyacen al carácter, escribir las ecuaciones que repreN UEVA GENÉTICA
,8
,6 0
0,8
0
,4
G
,2 0
0,4 0,2
e
n
B
0
0
Los paisajes reales son multidimensionales
,0 1 0
X
Ge
ciones en el gen Y de escaso o nulo efecto en el carácter; no se eliminarían por selección. Un biólogo evolutivo llamaría a estas mutaciones “neutras”. Sin embargo, las mutaciones del gen X tendrían seguramente un efecto poderoso en el carácter. Si redujesen la viabilidad del portador, la selección natural podría eliminarlas. Nos hallamos así ante una situación en la cual se permite que la variabilidad de un gen se acumule, mientras que los cambios en otro sufrirán una selección, aunque ambos codifiquen enzimas de la misma vía bioquímica y, si se los estudiara por separado, mostrarían ejercer el mismo efecto sobre el carácter. Al igual que antes, lo contrario valdría para una población de individuos con genotipo B. En este caso, las mutaciones en el gen X tendrían un efecto escaso y parecerían neutras; las mutaciones en el gen Y causarían, por contra, mayores efectos y probablemente la selección actuaría contra ellas. La gravedad de una mutación, de neutra a profunda, no es una propiedad del alelo mutante en sí; viene determinada por los alelos de otros genes que el individuo (o la población) posee.
T IS T N E I C S
a
b X
Y
1, 0 0,8 Y
o
g s
a0,6 R
0, 4
,0 1
0,2
0,
X
0 1,0
8
,6 0 ,4 0
0,8
0 ,6
Ge
n
A
,2 0
0 ,4 0 ,2 0
G
e
B
n
0
c X
Y
Z
1, 0 0,8 o
g s
a0,6 R
0,4
Z
0, 2 0
,0 1
Y
,8 0
X 1 ,0
0, 8
,6 0 0
0,6
Ge
n
A
,2 0
0,4 0,2 0
,4 G
e
B
n
0
71
sentan esos procesos y convertir dichas ecuaciones en gráficos para formar una superficie fenotípica. En la práctica se trata de una tarea formidable, limitada a sistemas bioquímicos debido a la necesidad de descripciones matemáticas de la cinética de la reacción. Sin embargo, desde hace diez años se vienen registrando notables avances en la comprensión de los mecanismos genéticos del desarrollo. Algunos rasgos, mencionemos las primeras fases del Dr os odesarrollo embrionario de ph ila melanogas ter , se abordan ya a través de modelos matemáticos
ción se disperse más allá de la línea de nivel correspondiente. ¿Por qué? Porque el entrecruzamiento entre individuos distantes entre sí, aunque radicados a lo largo de la misma línea de nivel, produciría fenotipos intermedios que, a causa de la no linealidad del sistema, ya no estarían en esa misma cota ( véase la figura 4c ). Los individuos intermedios sufrirían una selección negativa; la dispersión de genotipos no desbordará la línea de nivel. Podemos de este modo predecir que las poblaciones formarán nubes de puntos, bastante apretadas, sobre la superficie feno-
mente cómo cambia ese rasgo en respuesta a la variable se llama modelo de reacción . Así, una sección de un paisaje fenotípico paralela a un eje ambiental de variación representa el modelo de reacción para un genotipo dado, mientras que una sección paralela al eje genético de variación describe el efecto de las mutaciones sobre un carácter en un entorno determinado. En todo lo precedente debe quedar claro que si un paisaje no es plano y lineal (y probablemente ninguno lo es), los efectos del ambiente serán dependientes del contexto, y no en
exactos. Los caracteres reales están afectados por la variación independiente en muchos genes. Requieren, pues, una superficie fenotípica multidimensional con tantos ejes ortogonales como variables independientes haya. Para un ordenador no es particularmente difícil manejar superficies de n dimensiones con sus pendientes correspondientes, pero semejantes formas son imposibles de representar en un papel. Con el propósito de una buena visualización, manejamos sólo dos variables independientes a un tiempo, sin olvidar nunca que se hallan incluidas en un entramado multidimensional mayor.
típica, al menos hasta que aparezcan otras variables que cambien el paisaje o creen una nueva presión de selección.
menor medida que lo fueran los efectos de los genes.
Individuos y poblaciones
Si los individuos se representan mediante puntos en una superficie fenotípica, las poblaciones se representarán en forma de nubes de puntos. La dispersión de esa nube de puntos en diferentes direcciones será entonces una representación de los cambios alélicos presentes en la población para cada uno de los genes que definen el carácter que sea. Diferentes poblaciones residirían en regiones distintas de la superficie. Si conociésemos la forma de la superficie fenotípica, sabríamos intuitivamente cómo afectarían las mutaciones a un carácter dentro de una población determinada: qué parte del grupo sería más vulnerable a una perturbación producida por una variable determinada y cuál sería resistente al mismo cambio. Además, nos hallaríamos preparados para investigar la dispersión de diferentes poblaciones sobre la superficie y cómo se mueven por ella en razón de nuevas mutaciones, y de la selección natural. Las poblaciones con diferentes fenotipos óptimos se establecerán en diferentes líneas de nivel del paisaje. Una vez en una cota de fenotipo óptimo, es improbable que una pobla72
El efecto del ambiente
Una de las ventajas de la descripción matemática cuantitativa del fenotipo es que nos permite incorporar todos los factores que pueden afectar a su desarrollo y propiedades. No tenemos por qué restringirnos a los efectos de genes o enzimas; cabe también considerar los efectos de factores no genéticos, como la temperatura, el aporte de nutrientes y las hormonas segregadas en respuesta a estímulos externos. Estos factores ambientales afectarán a las velocidades de algunas reacciones o introducirán nuevas interacciones antes ausentes; sus efectos se describirán mediante ecuaciones matemáticas con la facilidad con que calculamos la influencia de un gen. Por ejemplo, un incremento de 10 grados en la temper atura pu ede duplicar la velocidad de algunas reacciones bioquímicas al tiempo que inhibe otras; ese fenómeno puede repercutir en el funcionamiento global de una vía bioquímica compleja. Mediante un modelo matemático de dichos procesos, el efecto de la temperatura sobre la velocidad de la reacción puede calcularse explícitamente. En el gráfico correspondiente, la variación de temperatura se representaría mediante un eje independiente, ortogonal a los demás. Ahora la forma de la superficie fenotípica estará determinada tanto por las variables genéticas como por las ambientales, y podremos juzgar con exactitud de qué manera el entorno repercute en la sensibilidad del sistema a las mutaciones de los diferentes genes. Cuando un carácter cambia en respuesta a una variable ambiental, se dice que muestra pla sti cid ad fen otí pic a; el gráfico que describe exacta-
Consideración final
En esta visualización gráfica del paisaje fenotípico, he mostrado que el efecto de un gen determinado varía en función de los otros genes que también controlan el carácter. Esta dependencia del contexto surge de la no linealidad de los procesos que subyacen a la expresión fenotípica. Pese a la limitación del mínimo número de dimensiones que podemos representar sobre un papel, cabe una comprensión intuitiva de la interacción de los genes en los sistemas complejos. Pueden representarse matemáticamente sistemas multidimensionales. En el futuro, el desarrollo de métodos de visualización asistidos por ordenador que permiten al usuario moverse fácilmente dentro de un espacio multidimensional nos ofrecerán mejores vislumbres de estos complejos fenómenos.
BIBLIOGRAFIA COMPLEMENTARIA STRAINDEPENDENT EMBRYONIC LETHALITY IN MICE LACKING THE RETINOBLASTOMARELATED P 130 G ENE . J. E. LeCouter, B. Kablar, P. F. M. Whyte, C. Ying y M. A. Rudnicki en Development, vol. 125, págs. 4669-4679; 1998. THE EVOLUTION OF CANALIZATION AND THE BREAKING OF VON BAER’S LAWS: MODELING THE EVOLUTION OF DEVELOPMENT WITH EPISTASIS. S. H. Rice en Evolution, vol. 52, págs. 647-656; 1998. FROM DNA TO DIVERSITY : MOLECULAR GENETICS AND THE EVOLUTION OF ANIMAL DESIGN . S. B. Carroll, J. K.Science; Grenier y S. D. Weatherbee. Blackwell
Malden, Mass.; 2001. ERWIN BAUR. W.-E. Lönnig y H. Saedler en Encyclopedia of Genetics , vol. 1. Dirigido por S. Brenner y J. H. Miller. Academic Press; San Diego, 2002. THE NATURE OF ROBUSTNESS IN DEVELOPMENT. H. F. Nijhout en BioEssays, vol. 24, págs. 553-563; 2002.
TEMAS 38
GENOMA HUMANO
r) la u c le o m N D A ( N I E T S R E G K R A M Y N O IS R R A H L U A P );
o d n fo ( E N O T S
, L E M R A H K R A M
Los comienzos de la industria del genoma humano Las empresas públicas y privadas que descifraron el primer borrador del código genético humano tuvieron que soportar una larga y penosa travesía Kathryn Brown
E
l Proyecto Genoma, después de catorce años de investigación y una inversión superior a los 3000 millones de euros, anunciaba el pasado octubre el desciframiento completo del ADN humano. El logro, alcanzado cuatro años después de trazarse el primer bosquejo de la secuencia, se ha recibido como una aportación fundamental al conocimiento de la especie humana, que permitirá avances revolucionarios. Este artículo nos retrotrae a 2000, año en que se presentó el primer borrador (provisional) del genoma, para mostrar cómo se articulaba entonces el entramado de empresas e instituciones protagonistas de esta intensa carrera, que acaba de llegar al fin de su comienzo. Ya se puede leer todo el código genético de un ser humano en Internet. No es lo que podría considerarse una lectura fácil: de principio a fin no aparecen más que las letras A, T, C y G, repetidas una y otra vez e n orden variable y con una longitud suficiente como para llenar más de 200 guías telefónicas. Para los biólogos, sin embargo, constituye el gran éxito de la temporada. Las letras representan los productos químicos del ADN que integran todos los genes de los seres humanos e influyen en su forma de hablar, de andar, de pensar y de dormir. Francis S. Collins, director del Instituto Nacional de Investigación sobre el Genoma Humano en Bethesda, Maryland, piensa que es como si leyéramos nuestro propio libro de instrucciones. ¿Qué puede haber más interesante? Collins dirige el Proyecto del Genoma Humano (PGH), un consorcio público integrado por cuatro grandes centros de secuenciación de EE.UU., por el Centro Sanger, de Cambridge, 74
Inglaterra, y por laboratorios de Japón, Francia, Alemania y China. En 2000 ya había gastado 250 millones de dólares para formular por escrito el mapa de todos nuestros genes. Trabajando codo a codo durante más de un decenio, unos 1100 investigadores fabricaron a mano un mapa de los tres mil millones de pares de bases, o unidades, del ADN que constituyen el genoma humano. Y no estaban solos. Una temeraria compañía joven, Celera Genomics, de Rockville, Maryland, propinó un duro golpe al consorcio al anunciar aquel mismo año su propio borrador del genoma humano. Durante mucho tiempo prevaleció el concepto erróneo de que, una vez acabada la secuenciación del ADN, se gozaría de una idea clara de quiénes somos, por qué enfermamos y por qué envejecemos. La verdad es que para el esclarecimiento total faltan todavía unos cuantos decenios. Pero los investigadores ya imaginan cómo será ese día. Las compañías farmacéuticas, por ejemplo, están reuniendo los conocimientos prácticos sobre genética necesarios para fabricar medicinas a la medida de genes específicos, lo que se conoce como farmacogenómica. Los farmacéuticos del futuro podrán proporcionar a sus clientes una versión de antihipertensor adecuada a su exclusivo perfil genético, distinta para cada uno. Otras empresas ya han conseguido, con grandes dificultades, realizar análisis sanguíneos que revelan mutaciones indicadoras de enfermedad en ciertos genes y permiten pronosticar la posibilidad de verse afectado por determinadas enfermedades, como la de Huntington. Y hay investigadores que mantienen todavía el optimismo
respecto de las terapias génicas, que consisten en la adición directa de genes sanos al organismo del paciente. J. Craig Venter, entonces presidente de Celera, pensaba que el conocimiento del genoma cambiaría la forma de realizar los ensayos farmacológicos y daría comienzo a una era completamente nueva de medicina individualizada. Pero, aun disponiendo del borrador del código humano, la industria genómica de 2000 se enfrentaba a numerosos obstáculos. Algunos de ellos eran técnicos: una cosa es conocer una estructura química y otra muy distinta comprender su función real. Otros, legales: ¿cuánto hay que saber sobre un gen para patentarlo? Y tampoco faltaban los sociales: ¿realmente quiere uno que le diagnostiquen una enfermedad que carece de tratamiento y que además no le afectará hasta dentro de veinte años? La carrera
La primavera de 2000 todos los ojos estaban puestos en la primera línea acabada del genoma: un borrador del ADN que hay en el interior de cada una de nuestras células. El método utilizado por el PGH se describió como concienzudo y preciso. Empezando con células sanguíneas y espermáticas, se separaron los 23 pares de cromosomas que albergan los genes humanos. Se cortaron luego fragmentos del ADN de cada cromosoma, se identificó la secuencia de bases del ADN de cada fragmento y, por último, se localizó y se agrupó cada retazo de ADN situado a sus dos lados en el cromosoma. De esta manera artesanal se fueron elaborando progresivamente las secuencias de segmentos génicos TEMAS 38
H S U N R E H C Y A K
CELERA GENOMICS, cuya planta en Rockville, Maryland, contaba en el año 2000 con 300 secuenciadores automatizados de ADN (además de una elegante hélice de ADN azul en el techo).
individual es, de genes completos, de cromosomas completos y, por último, del genoma entero. Fue como arrancar una a una todas las páginas de una enciclopedia, romperlas y luego volverlas a recomponer. Celera tomó, en cambio, un camino más corto: hizo añicos toda la enciclopedia de una vez. Su método de secuenciación consisti ó en romper de un golpe todos los genes en fragmentos y confiar luego en los ordenadores para reincorporarlos a un genoma completo. El énfasis se puso en la potencia de cómputo, utilizando algoritmos para secuenciar los datos, con las ventajas de la eficacia y la velocidad. Los conceptos que los equipos del PGH y de Celera tenían sobre lo que sería un “genoma acabado” no coincidían. Cuando Celera anunció que había acabado de secuenciar el borrador del genoma de una persona anónima y que ordenaría los datos en un mapa en tan sólo seis semanas, el grupo público manifestó inmediatamente su indignación. Collins hizo notar que Celera se había quedado corta con respecto a sus propósitos srcinales de secuenciación del genoN UEVA GENÉTICA
ma. Los responsables de Celera planearon secuenciar los genomas completos de varias pe rsonas, verificando diez veces su genoma “consenso”, cuando la compañía comenzó a trabajar en 1988. Celera declaró en abril de 2000 que la secuenciación preliminar se había realizado por completo con el genoma de una sola persona, secuenciado nada más que tres veces. Si bien PGH y Celera se consideraban competidores en una carrera, la empresa privada gozaba de una ventaja incuestionable. Dado que el PGH es un proyecto público, enviaba de forma rutinaria todos sus datos sobre el genoma al GenBank, una base de datos pública a la que se puede acceder a través de Internet (en www.ncbi.n lm.nih.gov). Como todos los demás, Celera utilizó esos datos; en su caso, para ayudar a verificar y a rellenar las lagunas del borrador del genoma realizado por ella. Celera utilizó los datos públicos del genoma para ir un paso por delante en el esfuerzo de secuenciación, cosa que algunos consideraron intolerable. Pero hubo quienes consideraron razonable, desde el punto de vista de los
negocios, el plan revisado de Celera. No se trataba únicamente de sentarse y de estar secuenciando el resto de la vida. Celera utilizaría su triple análisis para ordenar los datos públicos, lo que se esperaba proporcionaría un cuadro muy preciso del genoma humano. El PGH anunció a principios de mayo de 2000 que había completado su propio borrador de trabajo, así como una secuencia acabada del cromosoma 21, implicado en el síndrome de Down y en muchas otras enfermedades. Los elaboradores del genoma se concentraron en las semejanzas existentes entre todos nosotros. Se cree que el 99,9 por ciento de los genes de todas las personas son exactamente iguales. Pero el 0,1 por ciento restante varía y son estas variaciones lo que más interesa a las compañías farmacéuticas. Incluso un simple polimorfismo de un nucleótido individual (SNP) puede significar un problema (por ejemplo, el hecho de que alguien tenga una T donde otra persona tiene una C). Estas minúsculas variaciones genéticas son la causa de que muchos remedios no produzcan efecto más que entre un 30 y un 50 por ciento de la población humana, en opinión de Venter. Puede llegarse al extremo de que lo que salva la vida de una persona acabe con la de otra. Pone como ejem75
Los dos enfoques de la secuenciación del genoma CELERA GENOMICS ENFOQUE DE FRAGMENTACION COMPLETA SECUENCIA
ENFOQUE DE FRAGMENTACION IMBRICADA
DE ADN HUMANO
1 Se rompe el genoma
SECUENCIA
1 Se corta el genoma
DE ADN HUMANO
en segmentos de tamaño cada vez menor y se les dispone en un orden aproximado
7
completo en fragmentos pequeños
6
1
5
3
2
3
4
5
6
7
8
9
10
1
2 4
9
10
PROYECTO GENOMA HUMANO
2 Se rompe cada segmento
3
1
8
8
6 4
2 Se lee la secuencia de ADN
en fragmentos pequeños 9
2
7
de cada fragmento
5
10
3 Se lee la secuencia
de ADN de cada fragmento R E D N A L C I R E N O C
SECUENCIADORES DE ADN
3 Se reúnen ordenadamente
N IO C A R O B A L O C N E E C A R G E I R U A L
los fragmentos viendo dónde se solapan
5 3
2
3
4
5
6
7
8
9
10
10 4
7
1
plo el Rezulin, un medicamento para la diabetes de tipo II, que se relacionó con más de 60 fallecimientos en todo el mundo por toxicidad hepática. Cree que en el futuro bastará una simple prueba genética para determinar si es probable que una medicina dada proporcione un tratamiento eficaz o si conllevaría graves consecuencias. Mientras desarrollaba su borrador del genoma, Celera comparó también algunos genes de varios individuos, construyendo una base de datos de polimorfismos de nucleótidos aislados (SNP, “snips”, para los ingleses). Otras compañías esperaban también sacar partido de la farmacogenómica. Los gigantes farmacéuticos empezaron a asociarse con empresas especializadas más pequeñas para satisfacer sus sueños génicos: Pfizer de Nueva York se con Incyte Genomics, de Palo Alto, California; SmithKline Beecham, de Filadelfia, con Human Genome Sciences, de Rockville; y Eli Lilly, de Indianápolis, con Millennium Pharmaceuticals, de Cambridge, Mas76
1
8
6 2
9
4 Se reúnen los fragmentos
secuenciados según su orden relativo conocido
sachusetts. Aunque la medicina individualizada no había salido de la mesa del laboratorio, algunos analistas financieros creyeron que en pocos años podría convertirse en un mercado de ingentes beneficios. Con todo, sabían que el camino estaría lleno de baches. Un punto de fricción era el uso de patentes. Nadie pestañea cuando Volvo patenta un nuevo coche o Microsoft un programa informático. Pero hay mucha gente que no acepta que las compañías biotécnicas pretendan tener derechos sobre el ADN humano, la esencia de nuestro ser. Pero sin dichas patentes una compañía como Myriad Genetics, de Salt Lake City, no hubiera podido destinar el tiempo ni el dinero necesarios para elaborar pruebas de detección de mutaciones en los genes BRCA1 y BRCA2, relacionados con los cánceres de mama y de ovario. La mayoría de los investigadores está de acuerdo en este punto, aunque algunos sostienen que las empresas privadas han abusado de los datos públicos del genoma, secuen-
ciado en condiciones rigurosas y, en gran parte, con dinero público. Al enviar dócilmente sus hallazgos al GenBank, los científicos del PGH ofrecieron al mundo una panorámica sin parangón de lo que constituye un ser humano. Y el personal de Celera no fue el único que miró. GenBank contabilizó en abril de 2000 unos 35.000 visitantes diarios. Algunos trabajaban en compañías como Incyte, que aprovechaba los datos públicos para elaborar su propio y creciente catálogo de genes, patentando luego los posibles usos de esos genes. Ese mismo año, Incyte consiguió unas 500 patentes por lo menos de genes completos (más que cualquier otra compañía del sector) y solicitó otros 7000. Varios investigadores deploran que estas compañías patenten genes que apenas entienden y que, al hacerlo, estén restringiendo la investigación futura sobre ellos, ya que, si los datos están bajo llave en una base de datos privada y sólo unos pocos privilegiados pueden tener acceso a ellos por susTEMAS 38
LOS PRINCIPALES ACTORES EN 2000 Celera Genomics División de PE Corp. www.celera.com
Símbolo: CRA Sede central:Rockville, Maryland Máximo responsable:J. Craig Venter, presidente Principales clientes/so cios: Pfizer, Pharmacia, Novartis, Amgen y Takeda Chemical Industries Estrategia:Venta de suscripciones teleinformáticas a diversos genomas comentados. Financiación de 2000:900 millones de dólares Propósito fundamental:negocios en torno a bases de datos genómicos Ventajas competitivas:amplia infraestructura de secuenciación del ADN y abundantes recursos financieros
Human Genome Sciences www.hgsi.com
Incyte Genomics www.incyte.com
Símbolo: INCY Sede central: Palo Alto, California Máximo responsable:Roy A. Whitfield, CEO Principales clientes/soc ios: 18 de las principales 20 compañías farmacéuticas Estrategia:proporcionar acceso comercial no exclusivo a las bases de datos genómicas y vender el acceso a los clones de ADN en ellas genómica; suministro de dianas far- representados macológi cas a sus clientes Financiación de 2000:622 millones Financiación de 2000:525 millones de dólares de dólares Propósito fundamental:convertir la Propósito fundamental:comercialiinformación genómica en un negozar medicamentos basados en el cio duradero genoma Ventaja competitiva:un amplio conVentajas competitivas:patentes junto de datos, que abarca secuenregistradas de más de 7500 genes humanos; tres fármacos genómicos cias génicas, modelos de expresión génica y proteica y variaciones en ensayos clínicos humanos genéticas entre individuos Símbolo: HGSI Sede central:Rockville, Maryland Máximo responsable:William A. Haseltine, director y CEO Principales clientes/so cios: SmithKline Beecham, Takeda Chemical Industries, ScheringPlough, Sanofi-Synthelabo y Merck Estrategias:desarrollo y comercialización de fármacos basados en la
IM SL
Millennium Pharmaceuticals www.mlnm.com
Símbolo: MLNM Sede central:Cambridge, Massachusetts Máximo responsable:Mark. L. Jevin, CEO Principales clientes/so cios: Bayer, Pharmacia, Pfizer y Eli Lilly Estrategias:desarrollo de pruebas terapéuticas y médicas personalizadas; asociación con empresas dedicadas a las técnicas biológicas y farmacológicas en el campo de la farmacogenómica Financiación de 2000:700 millones de dólares Propósito fundamental:traducir la información genómica en productos patentados, como son losmedicamentos y las pruebas analíticas Ventajas competitivas:Alianzas ya establecidas con fabricantes de fármacos; recientemente adquirió LeukoSite
S LM FI
The Human Genome Project www.genome.gov
Sede central:Instituto Nacional de Investigación sobre el Genoma Humano (NHGRI), Bethesda, Maryland Colaboradores:NHGRI, Departamento de Energía (DOE) y Wellcome Trust Máximos responsables:Francis S. Collins, NHGRI; Ari Patrinos, DOE, y Michael Morgan, Wellcome Trust Principales centros de secuenciación: Facultad de medicina de la Universidad de Washington, St. Louis; Facultad de medicina Baylor, Houston; Centro Sanger, Cambridge, Inglaterra; Instituto Whitehead, Cambridge, Massachusetts; Instituto Joint Genome DOE, Walnut Creek, California Estrategia:cartografiar, secuenciar y comentar el genoma humano Financiación de 2000: 112,5 millones de dólares en 260 subvenciones Propósitolafundamental: comprender funcióna génica; fomentar leyeslaque prohíban discriminación genética; la enseñar los médicos a utilizar información del genoma Ventajas competitivas:datos disponibles a las 24 horas de la secuenciación, sin coste y sin restricciones, vía GenBank. También provisión de fondos para estudios sobre las implicaciones éticas, legales y sociales de la genómica
cripción, se retardará el descubrimiento sobre muchas enfermedades. Pero el entonces presidente de Incyte, Randal W. Scott, veía las cosas de modo diferente. Según él, el propósito real del Proyecto Genoma Humano era acelerar los descubrimientos científicos; los trabajos posteriores constituirían su culminación natural. Incyte lanzó en marzo de 2000 un programa de comercio electrónico genómico (como un amazon.com para genes), que permitía a los investigadores pedir datos sobre la secuencia, o copias físicas, de más de 100.000 genes a través del correo electrónico.
silico ”.
Entre los subscriptores a la base de datos genómica de la compañía se contaban gigantes farmacéuticos como Pfizer, Bayer y Eli Lilly. Ese mismo año, Human Genome Sciences ya había conseguido más de 100 patentes génicas (y solicitado otras 7000) mientras elaboraba su propia y colosal colección de genes, que sería aprovechada por sus socios farmacéuticos, entre ellos SmithKline Beecham y Schering-Plough. El gobierno estadounidense complicó el debate de las patentes. El entonces presidente Bill Clinton y el primer ministro británico Tony Blair lanzaron en marzo de 2000 un mensaje ambiguo, en el que se elogiaba el acceso libre a los datos génicos no elaborados, comentario que algunos analistas interpretaron como un golpe a Celera y a otras empresas que guardaban celosamente sus secuencias del genoma. Celera y el consorcio del PGH mantuvieron disputas sobre la publicación de los datos, abandonándose las conversaciones de colaboración iniciales cuando la primera se negó a hacer públicas de inmediato y del completo dominio general sus secuencias génicas. La noche en que Clinton y Blair lanzaron su anuncio la cotización de las acciones biotécnicas descendió, perdiendo alrededor del 20 por ciento. Unas cuantas empresas se apresuraron a dar ruedas de prensa y a hacer declaraciones manifestando que, de hecho, ellas proporcionaban gratis sus datos no elaborados sobre el genoma. Durante las semanas siguientes los funcionarios estadounidenses aclararon que el gobierno estaba a favor de las patentes sobre “nuevos productos sanitarios basados en los genes”. Lo más difícil para los buscadores de patentes es demostrar la utilidad de las secuencias de ADN. Numerosas solicitudes de patente dependen de las técnicas de predicción computacional a las que se suele hacer referencia con la expresión “biología in
concesión génicas ha ido levantandodeelpatentes listón con respecto a las exigencias de utilidad.
78
Los datos de una secuencia génica completa o parcial se introducen en un programa informático que predice la secuencia de aminoácidos de la proteína resultante. La comparación de esta proteína hipotética con las proteínas conocidas permite elaborar una conjetura aproximada sobre la actividad de la secuencia génica subyacente y sobre cuál pueda ser su utilidad para el desarrollo de un remedio o de una prueba diagnóstica. Puede que esto parezca una forma muy superficial de trabajar, pero suele bastar para conseguir una patente. Poco a poco, la normativa que regula la
Pruebas y más pruebas
En 2000, las patentes habían inducido la comercialización o el desarrollo de más de 740 pruebas genéticas, según el norteamericano Instituto Nacional de la Salud. Estas pruebas, sin embargo, mostraron lo lejos que aún debía llegar la genética. Varios años después de comenzar los ensayos sobre el BRCA1 y el BRCA2, por ejemplo, todavía se seguía intentando determinar con precisión en qué medida tales genes contribuyen al riesgo de cáncer femenino. Incluso las mejores pruebas genéticas planteaban múltiples cuestiones. En el caso de la enfermedad de Huntington, se había desarrollado una que informaba con precisión sobre cómo cambia el gen, pero no podía predecirse la edad a la que empezarían los síntomas, la gravedad de la enfermedad ni su ritmo de progreso. Y no podemos olvidar las consideraciones sociales. La mayoría de las naciones civilizadas cuentan con un conjunto confuso de leyes que prohíben que las compañías de seguros y los empresarios puedan actuar discriminadamente contra las personas a partir de la información genética disponible, pero los defensores de la intimidad siguen presionando con vistas a mayores garantías jurídicas.
BIBLIOGRAFIA COMPLEMENTARIA ARE SEQUENCERS READY TO ANNOTATE TH E H UMAN G ENOME ? E. P enn isi en Science, vol. 287, n. o 5461, página 2183; 24 de marzo, 2000. THE HUMAN GENOME PROJECT AND ITS IMPACT ON THE STUDY OF HUMAN DISEASE. E. Green en Metabol ic and Molecula r Bases of Inherited Disease . Charles R. Scriver. Octava edición. McGraw-Hill, 2000.
TEMAS 38
La fiebre bioinformática La elaboración de los datos del genoma se ha convertido en una industria floreciente Ken Howard
lásticos”. Cuando un amigo de familiaalsusurraba ta la palabra personajeesde Dustin Hoffman en la película El graduado en 1967 no sólo abogaba por el estudio de una nueva carrera, sino por una forma de vida completamente diferente. Si esa película se hiciera hoy, en la época del desciframiento del genoma humano, la palabra mágica bien pudiera ser “bioinformática”. Investigadores públicos y privados han compila do ya más de 37.000 millones de pares de A, C, T y G que componen el código genético humano. La información que se está derivando del genoma humano constituye una auténtica avalancha. Se están compilando bases de datos gigantescas que contienen los detalles de las circunstancias de tiempo y lugar en que se activan los genes, la conformación de las proteínas que especifican, la forma en que influyen unas proteínas sobre otras y el papel que tales influjos puedan desarrollar en las enfermedades. Si a esto se añade el torrente de datos sobre los genomas de los denominados organismos modelo, como la mosca de la fruta y los ratones, se tiene un “maremoto” de información. La nueva disciplina de
“P
la bioinformática (la unión entre la
pectiva de encontrar mejores dianas
informática la biología) encontrar sentido ay todo ello. Al busca hacerlo así, está cambiando el aspecto de la biomedicina. Se está obteniendo una cantidad de información fenomenal y abrumadora. En lo que se afanan de forma distinta unos y otros es en la forma de explotarla. Existen muchas empresas puestas a ello. Ya en 2000, el banco de inversión Oscar Gruss & Son, de la ciudad de Nueva York, calculó que la bioinformática podría convertirse en un negocio que reportara dos mil millones de dólares en cinco años. Esta estimación se basó en datos recogidos de más de cincuenta empresas públicas y privadas que ofrecen productos y servicios de bioinformática. Su esfuerzo se concentra en la recogida y el almacenamiento de datos y en la búsqueda y la interpretación de los datos de las bases. La mayoría vende sus servicios a las compañías farmacéuticas y de ingeniería biológica por precios de suscripción millonarios. La razón de que las compañías farmacéuticas estén tan dispuestas a ponerse a la cola y a pagar por tales servicios (o a montar los suyos propios, con importantes inversiones) es que la bioinformática ofrece la pers-
farmacológicas más tempranas del procesoen defases desarrollo de los medicamentos. Esta eficacia pudiera reducir el número de remedios potenciales que tuviesen que pasar por la criba de los ensayos clínicos, reduciendo de manera significativa los costes generales. Beneficios adicionales obtendrían las empresas farmacéuticas si se redujeran así los tiempos de investigación y de desarrollo de los fármacos, alargando su vida comercial antes de que expiren las patentes. Pero antes de que los beneficios económicos empiecen a caer del cielo, las compañías bioinformáticas tienen que habérselas con la actual plétora de datos genómicos y que mejorar constantemente sus técnicas, sus enfoques de investiga ción y sus prácticas comerciales. La auténtica ocasión y las dificultades de verdad se encuentran en el descubrimiento de cómo se relacionan entre sí los fragmentos de información y en la interpretación del conjunto resultante. La bioinformática inició su andadura a principios de los años ochenta del siglo XX con una base de datos denominada GenBank, creada por el Departamento estadounidense de Energía para guardar los cortos tra-
SLIM FILMS
mos de secuencia de ADN que se estaban empezando a obtener de una serie de organismos. En los comienzos del GenBank un puñado de técnicos sentados ante teclados que no tenían más que las cuatro letras A, C, T y G tecleaban monótonamente las secuencias del ADN publicadas en las revistas académicas. Conforme pasaron los años, nuevos métodos de comunicación permitieron a los investigadores acceder directamente al GenBank y descargar sus datos de secuencia. La administración del GenBank se transfirió luego al Centro Nacional
estructuras de las diversas proteínas y los mapas de sus interrelaciones. Mezcla y emparejamiento
Una de las operaciones bioinformáticas más elementales consiste en la búsqueda de semejanzas, u homologías, entre un fragmento de ADN
tos de personas con tumores óseos. (Los osteoclastos son células que descomponen el hueso en el curso normal de la renovación ósea; se cree que su actividad es excesiva en los individuos afectados de osteoporosis.) Human Genome Sciences secuenció la muestra y realizó búsquedas de
para información técnicas Nabiológicas (NCBI) de sobre los Institutos cionales de la Salud estadounidenses. Con la llegada de la gran telaraña mundial (World Wide Web), los investigadores de todo el mundo pudieron acceder gratis a los datos del GenBank. El volumen de datos de secuencias de ADN del GenBank empezó a crecer de manera exponencial cuando el Proyecto del Genoma Humano (PGH) despegó en 1990. La introducción de secuenciadores de gran rendimiento en los años noventa (utilizando máquinas robóticas automatizadas de secuenciación del ADN y ordenadores) disparó las aportaciones a GenBank. Los 49 millones de pares de bases secuenciadas en 1990 pasaron a unos 11.000 millones en 2000; a principios de este año la cifra superaba ya los 37.000 millones. Las empresas privadas iniciaron proyectos paralelos de secuenciaci ón por la misma época, estableciendo por su cuenta enormes bases de datos patentadas. Las hay con capacidad para determinar la secuencia de millones de pares de bases en un solo día. Cuando, en abril de 2000, la central inagotable de secuenciación Celera Genomics anunció que había completado un borrador del genoma humano, tenía almacenados 50 teraoctetos de datos. Pero GenBank y sus primos no son más que una parte del cuadro bioinformático. Otras bases de datos públicas y privadas contienen información sobre la expresión génica (el cuándo y el dónde de la activación de los genes), sobre las minúsculas diferencias genéticas entre individuos denominadas polimorfismos de nucleótidos individuales (SNP), sobre las
recién secuenciado y los segmentos ya disponibles de diversos organismos. El hallazgo de emparejamientos aproximados permite predecir el tipo de proteína que especificará tal secuencia. Esto no sólo proporciona pistas sobre dianas farmacológicas prometedoras en las etapas iniciales del desarrollo de los medicamentos, sino que también suprime algunas que constituirían callejones sin salida. Una serie popular de programas para comparar las secuencias del ADN es el BLAST (de Basic Local Alignment Search Tool), que apareció por primera vez en 1990. BLAST forma parte de un conjunto de instrumentos de investigación de secuencia de ADN y de proteínas que está disponible en varias versiones, ofrecidas por muchos proveedores de bases de datos o directamente a través del NCBI. Este último ofrece también Entrez, un instrumento de los llamados de metabúsqueda, que cubre la mayoría de las bases de datos del NCBI, entre ellas las que albergan las estructuras tridimensionales de las proteínas, los genomas completos de otros organismos y las referencias a revistas científicas que salvaguardan las entradas de la base de datos. Un primer ejemplo de la utilidad de la bioinformática es la catepsina K, una enzima que podría resultar importante para el tratamiento de la osteoporosis, enfermedad incapacitante causada por la rotura de los huesos. Los investiga dores de Smith-Kline Beecham (ahora GlaxoSmithKline) pidieron a Human Genome Sciences en 1993 que les ayudaran a analizar ciertos materiales genéticos obtenidos de los osteoclas-
homología en las bases de datos encontrar emparejamientos quepara dieran pistas sobre las proteínas determinadas por las secuencias génicas obtenidas. Luego se procedió a análisis ulteriores y se descubrió que los osteoclastos expresaban con exceso una secuencia concreta, que coincidía con la de una clase de moléculas ya conocidas: las catepsinas. Este ejercicio de bioinformátic a le proporcionó a SmithKline en unas cuantas semanas un candidato farmacológico prometedor, que los experimentos estándar de laboratorio no hubiesen encontrado sin años de trabajo y una pizca de suerte. La búsqueda de productos que se unan a las dianas farmacológicas y que tengan el efecto deseado sobre ellas sigue realizándose fundamentalmente en un laboratorio “húmedo” tradicional, donde las pruebas para la determinación de la actividad, la toxicidad y la absorción pueden durar años. Pero hay quienes opinan que también este aspecto del desarrollo farmacológico pasará a los ordenadores, en lo que denominan la biología in silico , gracias a las nuevas herramientas bioinformáticas y a las crecientes cantidades de datos sobre las estructuras proteicas y las vías biomoleculares. Todo lo anterior permite predecir un futuro venturoso para la bioinformática, que, en opinión de muchos, alberga las verdaderas promesas de la genómica y constituye el inicio de un período revolucionario. En la revolución participan muchos actores diferentes, cada uno con su método. Hay empresas que atienden a los grandes clientes; sus productos y servicios genómicos y de ingeniería biológica se dirigen a las compañías
SLIM FILMS
LOS DATOS GENETICOS constituyen la esencia de la bioinformática, cuyo cometido puede compararse con la conocida búsqueda de una aguja en un pajar. A modo de ejemplo, en la derecha, la aguja es la palabra “DOG”, enterrada en una secuencia de millares de letras A, C, T y G, las cuatro unidades que constituyen el ADN. Pero la
80
bioinformática también interviene en la comparación de los genes de diversos organismos: las otras ilustraciones de esta página y de la siguiente son mapas de los cromosomas de la mosca de la fruta, junto con códigos de barras que muestran las regiones en las que los genes de la mosca son similares a los de otras especies.
TEMAS 38
ATCCTGACACAGTATAGCGCTAGCTAGCC GCGCGATCTTAGCTAGCGGGCATCATGCT ATTCGGATTCTAGAGGCGGAGGCGCGATA TCTCTCTTATCTTCTTAGCTAGCSGCSAGC TAGCCGCATGCAGCTAGCGCGACGTTAAC GTAGCAAGATCCTCACAGTATAGCGCTAG CTAGCAAGATCCTCACAGTATAGCGCTAG CTAGCCGCGCATGCTATTCGGATTCTAGA GGCGGAGGCGCGATATCTCTCTTATCTTC TTTGTTCTTSTCCGGAGGCGCGATATCTCG GAGGCGCGATATCTCTCTTATCTTCTGCG GAGGCGCGATATCTCTCTTATCTTCTCGAT GCGCGTATATGCGACGTTAACGTAGCAAG ATCCTGACACAGTAAGGCGCTTAGCTAGC GGGCATCATGCTATTCGGATTCGATTCTA GAGGCGGAGGCGACGATGCGCGTATATGC GACGTTAACGTAGCAAGATCCTGAATTCT AGAGGCGGAGGCGCGATATCTCTCTTATC TTCTCGGAGGCGCGATATAGGCGCTTAGC
GCAGGCGCTTAGCTAGCGGGCATCATGCT ATTCGGATTCTAGAGGCGGAGGCGACGAT GCGCGTATATGCGACGTTATCGGATTCTA GAGGCGGAGGCGCGATATCTCTCTTATCT TCCGGAGGCGCGATATCTCTCTTATCTTCC GGAGGCGCGATATCTCTCTTATCTTCTCG GAGGCGCGATATCTCTCTTATCTTCCGGA GGCGCGATATCTCTCTTATCTTCCGGAGG CGAGGCGCTTAGCTAGAGGCGCTTAGCTA GCGGGCATCATGCTATTCGGATTCTAGAG GCAGGCGCTTAGCTAGCGGGCATCATGCT ATTCGGATTCTAGAGGCGGAGGCGACGAT GCGCGTATATGCGACGTTATAGAGGCGGA GGCGACGATGCGCGTATATGCGACGTTAA CGTAGCAAGATCCTGAATTCTAGAGGCGG AGGCGCGATATCTCTCTTATCTTCTCGGA GGCGCGATATAGGCGCTTAGCTAGCGGGC ATCATGCTATTCGGATTCTAGAGGCGGAG GCGACGATGCGCGTATATGCGACGTTAAC
TAGCGGGCATCATGCTATTCGGATTCTAG AGGCGGAGGCGACGATGCGCGTATATGCG ACGTTAACGTAGCAAGATCCTGAGGAGGC GCGATATCTCTCTTATCTTCTGCGCGTATA TGCGACGTTAACGTAGCACGGAGGCGCGA TATCTCTCTTATCTTCTTAGCTAGCCGCGC GATCTTAGCTAGCGGGCATTATCTTCCGG AGGCGCGATACGGAGGCGCGATATCTCTC TTATCTTCTTTCGGAGGCGCGATATCTCTC TTATCTTCCGGAGGCGCGATATCTCTCTTA TCTTCTGACGTTAACGTACGGAGGCGCGA TATCTCTCTTATCTTCTTAGCTAGCCGCGC GATCTTAGCTAGCGGGCATCATGCTCGGA GGCGCGATATCTCTCTTATCTTCTGATCGG CGCGGAGGCGCGATATCTCTCTTATCTTCT AGGCGCGATATCTCTCTTATCTTCTCGGA GGCGCGATATCTCTCTTATCTTCTCGCGAT ATCTCTCTTATCTTCCGGAGGCGCGATAC GGAGGCGCGATATCTCTCTGCGCGTATAT GCGACGTTAACGTAGCAAGATCCTGACAC AGTATAGCGCTAGCAAGATCCTCACAGTA
GTAGCAAGATCCTGAGGAGGCGCGATATC TCTCTTATCTTCTGCGCGTATATGCGACGT TAACGTAGCACGGAGGCGCGATATCTCTC TTATCTTCTTAGCTAGCCGCGCGATCTTAG CTAGCGGGCATTATCTTCCGGAGGCGCGA TACGGAGGCGCGATATCTCTCTTATCTTCT TTCGGAGGCGCGATATCTCTCTTATCTTCC GGAGGCGCGATATCTCTCTTATCTTCTGA CGTTAACGTACGGAGGCGCGATATCTCTC TTATCTTCTTAGCTAGCCGCGCGATCTTAG CTAGCGGGCATCATGCTCGGAGGCGCGAT ATCTCTCTTATCTTCTGATCGGCGCGGAG GCGCGATATCTCTCTTATCTTCTAGGCGCG ATATCTCTCTTATCTTCTCGGAGGCGCGAT ATCTCTCTTATCTTCTCGGAGGCGCGATAT CTCTCTTATCTTCCGGAGGCGCGATACGG AGGCGCGATATCTCTCTTATCTTCCGGAG GCGCGATACGGAGGCGCGATATCTCTCTG CGCGTATATGCGACGTTAACGTAGCAAGA TCCTGACACAGTATAGCGCTAGCAAGATC CTCACAGTATAGCGCTAGCTAGCCGCGCA
TAGCGCTAGCTAGCCGCGCATCATGCTAT TCGGATTCTAGAGGCGGCGCGATATCTCT CTTATCTTCTTTGTTCTTSGATAAGATCCT CACAGTGGAGGCGCGATATCTCTCTTATC TTCCGGAGGCGCGATACGGAGGCGCGATA TCTCTCTTATCTTCCGGAGGCGCGATACG GAGGCGCGATATCTCTCTGCGCGTATATG CGACGTTAACGTAGCAAGATCCTGACACA GTATAGCGCTAGCAAGATCCTCACAGTAT AGCGCTAGCTAGCCGCGCATCATGCTATT CGGATTCTAGAGGCGGCGCGGAGGCGCGA TACGGAGGCGCGCGATATCTCTCTTATCT TCCGGAGGCGCGATACGGAGGCGCGATAT CTCTCTGCGCGTATATGCGACGTTAACGT AGCAAGATCCTGACACAGTATAGCGCTAG CAAGATCCTCACAGTATAGCGCTAGCTAG CCGCGCATCATGCTATTCGGATTCTAGAG GCGGCGCGATATCTCTCTTATCTTCTTTGT TCTTSGATAAGATCCTCACAGTGATATCTC TCTTATCTTCCGGAGGCGCGATACGGAGG CGCGATATCTCTCTGCGCGTATATGCGAC GTTAACGTAGCAAGATCCTGACACAGTAT AGCGCTAGCAAGATCCTCACAGTATAGCG CTAGCTAGCCGCGCATCATGCTATTCGGA TTCTAGAGGCGGCGCGATATCTCTCTTAT CTTCTTTGTTCTTSGATAAGATCCTCACAG TATAGCGCTAGCGCCGCGTCTCTATGCGA CGTTAACGTAGCATGCGCGTATATGCATG CGCGTATATGCGACGATTCTAGAGGCGGA GGCGCGATATCTCTCTATTCGGATTCTAG AGGCGGAGGCGCGATATCTCTCTTATCTT CCGGAGGCGCGATATCTCTCTTATCTTCC GGAGGCGCGATATCTCTCTTATCTTCTCG GAGGCGCGATATCTCTCTTATCTTCCGGA GGCGCGATATCTCTCTTATCTTCCGGAGG
TCATGCTATTCTTCCGGAGGCGCGATATC TCTCTTATCTTCCGGAGGCGAGGCGCTTA GCTAGAGGCGCTTAGCTAGCGGGCATCAT GCTATTCGGATTCTAGAGGCAGGCGCTTA GCTAGCGGGCATCATGCTATTCGGATTCT AGAGGCGGAGGCGACGATGCGCGTATATG CGACGTTAACGTAGCAAGATCCTGATTCG GATTCTAGAGGCGGAGGCGACGATGCGCG TATATGCGACGTTAACGTAGCAAGATCCT GAGATTCTAGAGGCGGAGGCGCTATCTTC CGGAGGCGCGATACGGAGGCGCGATATCT CTCTTAGCTAGCCGCGCGATCTTAGCTAG CGGGCATCATGCTATTCGAGGCGCTTAGC TAGCGGGCAT D O G CTATTCGGATTCTAGA GGCGGAGGCGACGATGCGCGTATATGCGA CGTTAACGTAGCAAGATCCTGAGCCGCGC GATCTTAGCTAGCGGGCATCATGCTATTC GGATTCTAGAGGCGGAGGCGACGTTAACG TAGCAAGATCCTGACACAGTATAGCGCTA GCTAAGGCGCTTAGCTAGCGGGCATCATG TCGGATTCTAGAGGCGGAGGCGACGTTAA CGTAGCAAGATCCTGACACAGTATAGCGC TAGCTAAGGCGCTTAGCTAGCGGGCATCA TGTCGGATTCTAGAGGCGGAGGCGACGTG
S M IL F IM L S
farmacéuticas, para las que elaboran programas a medida y a las que ofrecen servicios de asesoría. Lion Biosciences, con sede en Heidelberg, Alemania, ha tenido un éxito destacado vendiendo programas y servicios bioinformáticos a todo lo largo y ancho del mundo empresarial. Su contrato millonario de 1999 con Bayer para el montaje y la operación de una red informática dedicada específicamente a la biología en todas las divisiones de Bayer representó el de mayor importancia en el mundo hasta entonces. Otras empresas atienden a los clientes pequeños o a los universitarios. Empresas como eBioinformatics ofrecen sus productos a través de Internet. Estos portales directos permiten el acceso a varios tipos de bases de datos y la utilización de programas para manipularlos. Informax, Accelrys y otras empresas parecidas ofrecen programas empaquetados para quienes prefieran tenerlos a seguro en sus propios ordenadores. Relaciones
Las grandes compañías farmacéuticas han intentado también rentabilizar sus esfuerzos genómicos con inversiones directas en bioinformática. Son varias las que han establecido departamentos enteros de integración y de servicio para facilitar el acceso a las bases de datos de múltiples departamentos, entre ellos los de desarrollo de nuevos productos, los de formulación y los de toxicología y ensayos clínicos. El antiguo modelo para la creación de nuevos medicamentos separaba esas funciones, lo que dificultaba la utilización conjunta de los datos obtenidos. La bioinformática permite que todos los investigadores de una empresa vean los mismos datos, aunque cada uno los manipule individualmente. Además de contribuir a la eficacia, el disponer de recursos bioinformáticos propios puede resultar más económico. Sustituir los paquetes individuales utilizados por los diversos departamentos de una empresa por una plataforma informática única de acceso y manipulación de las bases de datos puede suponer un notable ahorro. Para integrar la bioinformática en sus compañías, los gigantes farmacéuticos forjan también alianzas estratégicas, firman acuerdos de licencias y adquieren empresas más pequeñas.
Utilización de la bioinformática para encontrar dianas farmacológicas
S
e buscan genes de los organismos modelo que sean similares a un gen humano determinado. Se obtiene así información sobre la proteína especificada por el gen humano y pueden buscarse productos que la bloqueen. En este ejemplo se utiliza el gen MLH1 , que se asocia con el cáncer de colón humano. CROMOSOMA HUMANO 3
Q (brazo largo)
(brazo p corto)
GEN MLH1 (en la banda 21.3) 1 AISLAMIENTO DE UNA SECUENCIA DE ADN HUMANO
. . . G AG
G K R A M N O C N IO C A R O B A L O C N E E C A R G IE R U A L
G ATGCAA
. . .
E NCLDA
A ATC
K STS
3 BUSQUEDA DE SECUENCIAS SIMILARES EN LAS BASES DE DATOS DE PROTEINAS DE ORGANISMOS MODELO (las áreas verdes reflejan diferencias grandes; las naranjas, variaciones menores)
C AC
AAGT
. . .
. . .
SECUENCIA DE AMINOACIDOS HUMANA 5 DESCUBRIMIENTO DE UNA SUSTANCIA QUE SE UNA A LA PROTEINA
MOSCA DE LA FRUTA (Drosophila melanogaster)
. . . E
N
S
L
D
A
Q
S
T
H
4 PROTEINA HUMANA MODELO BASADA EN LA ESTRUCTURA CONOCIDA DE UNA PROTEINA PARECIDA DE UN ORGANISMO MODELO (el área roja es la representada por los datos de la secuencia mostrados) . . .
NEMATODO (Caenorhabditis elegans)
. . . E
N
S
L
D
A
G
A
T
E
. . .
LEVADURA DEL PAN (Saccharomyces cerevisiae)
. . . E
N
S
I
D
A
N
A
T
M
. . .
BACTERIA (Escherichia coli )
. . . E
N
S
L
D
A
G
A
T
R
. . .
SER HUMANO
. . . ENCLDAKSTS
La utilización de socios y de distribuidores no sólo les permite cubrir los vacíos de sus propias capacidades bioinformáticas, sino que les proporciona flexibilidad para adaptarse a las novedades que se vayan produciendo, en vez de tener que revisar constantemente sus propios sistemas. Empresas como Human Genome Sciences, Celera e Incyte están a horcajadas entre las grandes compañías farmacéuticas y los servicios de integración y extracción de datos ofrecidos por las especializadas. Han aprovechado sin vacilar y con rapidez el grado de automatización que la bioinformática ha aportado a la biología. Toda esta variedad conlleva la posibilidad de malas comunicaciones. Cada vez resulta más importante conseguir la compatibilidad entre bases de datos diferentes (lo que se deno82
TTA
2 TRADUCCION DE LA SECUENCIA DE ADN EN SECUENCIAS DE AMINOACIDOS (los bloques de construcción de las proteínas) MEDIANTE PROGRAMAS DE ORDENADOR
L I C
O K S Y V R E IF N N E J Y R E L E E H W D I V A D , G N I M E L F T A P , N I E T S R E
A ACTGT
. . .
mina interoperabilidad), pudiendo los usuarios pasar rápidamente de una a otra para satisfacer sus necesidades. Una solución obvia sería la anotación: poner etiquetas a los datos con nombres que tengan referencias cruzadas entre las bases de datos una vez que se haya bautizado a los sistemas. Esto ha funcionado hasta cierto punto. Se ha conseguido relacionar bases de datos mediante anotación. Pero una anotación de una base puede cambiar sin que las referencias de las restantes se actualicen, sobre todo cuando el flujo de nuevos datos es constante, problema que se agudiza con el aumento de los conocimientos biológicos y la capacidad de realización de análisis por ordenador. Las mejoras sistemáticas ayudarán, pero el progreso y, en última ins-
POSIBLE MEDICAMENTO
tancia, el beneficio siguen dependiendo del ingenio de los usuarios finales.
BIBLIOGRAFIA COMPLEMENTARIA TRENDS IN COMMERCIAL BIOINFORMATICS. Informe publicado el 13 de marzo de 2000, de Jason Reed, de Oscar Gruss & Son. USING BIOINFORMATICS IN GENEAND DRUG o 5, páginas ISCOVERY Discovery D Today,.vol. D. B. 5, n. Searls en Drug 135-143;
abril, 2000.
BioInform, una hoja informativa bisemanal
sobre el tema de la bioinformática. Puede accederse a ella en www.bioinform.com. Se puede acceder a las bases de datos bioinformáticas mantenidas por el Centro Nacional de Información Biotécnica (NCBI), en www.ncbi.nlm.nih.gov.
TEMAS 38
El cromosoma de la masculinidad Los cromosomas X e Y de los humanos forman una extraña pareja. El X se parece a cualquier otro cromosoma, pero el Y resulta bastante peculiar. ¿Qué evolución han seguido? Karin Jegalian y Bruce T. Lahn
L
os cromosomas que determinan el sexo —X e Y— constituyen una pareja extravagante. Los 22 cromosomas restantes de nuestras células tienen tan idénticas sus parejas correspondientes, que parecen estructuras gemelares. De cada par, un cromosoma procede de la madre y otro del padre; en condiciones normales los dos tienen, sin embargo, el mismo tamaño y llevan los mismos genes. (Los genes son los planos de ADN sobre las proteínas, encargadas de realizar la mayor parte del trabajo del organismo.) Por eso resulta llamativo el contraste entre el Y y el X. El cromosoma Y es mucho menor que el X; en realidad es muy canijo. Aloja unas docenas de genes, frente a los 2000 o 3000 que encontramos en el X. Algunos de los gene s del cromosoma Y carecen del acostumbrado correspondiente en e l X. Por si fuera poco, está cargado de ADN “morralla”, secuencias de nucleótidos que no encierran instrucciones para la síntesis de moléculas útiles. Hasta hace poco, los biólogos se veían incapaces de explicar los mecanismos que le habían conducido a semejante estado de penuria. Algunas teorías había, pero no sabían cómo someterlas a contrastación. La situación ha dado un giro copernicano, gracias en buena medida al Proyecto Genoma Humano y otros esfuerzos parecidos encaminado s a descifrar la secuencia completa de los nucleótidos de ADN en los 24 cromosomas del ser humano: X, Y y los 22 autosomas (los cromosomas no involucrados en la determinación del sexo). A la manera en que los paleontólogos trazan la evolución seguida por una especie apoyados en el estudio de los esqueletos de los animales actuales y de los fósiles, los biólogos moleculares recorren la evolución de cromosomas y 84
genes mediante las huellas dejadas en las secuencias de ADN. Los hallazgos recientes demuestran una historia de los cromosomas sexuales sorprendentemente dinámica, marcada por una serie de perturbaciones drástic as en el Y y cambios compensatorios en el X. Esa relación se sigue dando también hoy. Además, el cromosoma Y —durante largo tiempo considerado un desbarajuste, capaz de hacer poco más que poner en marcha el programa de la masculinidad— resulta que esconde posibilidades insospechadas para la mayoría de los biólogos. A lo largo de más de 300 millones de años se las ha arreglado para conservar un puñado de genes importantes en la supervivencia del macho y para adquirir otros necesarios en el proceso de fecundación. Pese a su aspecto modesto, tiene en sus manos un sorprendente poder. La investigación sobre la evolución de los cromosomas sexuales humanos partió de la curiosidad científica. Pero no sólo de ésta. Con una aspiración más pragmática se buscaba explicar y revertir la esterilidad del varón. El descubrimient o de genes del cromosoma Y que influyen sobre la capacidad reproductora podría llevar a tratamientos innovadores en el hombre privado de tales genes o portador de versiones defectuosas de los mismos. Los avances recientes hunden sus raíces en ideas asentadas 100 años atrás. Antes del siglo XX, los biólogos, observando lo que acontecía en los reptiles, pensaban que el ambiente determinaba el sexo también en el ser humano y en otros mamíferos. Por lo que concierne a los reptiles, la temperatura del embrión en un momento precoz del desarrollo insta la intervención de un sistema, poco conocido todavía, que primará la formación de
un macho o una hembra. A comienzos del siglo XX, sin embargo, se dieron cuenta de que en ciertas especies los cromosomas mediaban en la determinación del sexo. Unos veinte años después se vio que los mamíferos estaban entre los que se servían de cromosomas —el X y el Y— para determinar el sexo en el desarrollo embrionario. Rosario de pruebas
En los decenios siguientes, se halló que el cromosoma Y constituía el marcador del sexo masculino. La investigación dedujo, además, que el X y el Y habían evolucionado a partir de autosomas emparejados de un antepasado común. Por azar, poco antes o inmediatamente después de que surgieran los mamíferos, se produjo una mutación en una pequeña zona de la copia del autosoma que originó el Y, determinando que los embriones heredasen ese cromosoma cambiado (junto con su compañero, el futuro cromosoma X) y nacieran machos. Los embriones que heredasen los dos cromosomas X serían hembras. En 1990 los genéticos identificaron la zona del cromosoma Y que confiere masculinidad. Se trata del gen SRY (de “sex-determining region Y” ). La prot eí na cifrada por SR Y insta la formación de los testículos, según parece por la activación de genes de diversos cromosomas. Luego, la testosterona y otras sustancias sintetizadas en los testículos toman las riendas de la configuración de la masculinidad. Para llegar a la conclusión de que los cromosomas sexuales humanos comenzaron su vida de pareja acoplada, la ciencia se fundaba en los extremos de X e Y, que son un tanto gemelares y aptos para participar en TEMAS 38
1. LOS CROMOSOMAS X e Y fueron, hace millones de años, parejas equivalentes. Pero el cromosoma Y se encogió, en tanto que X mantuvo su integridad. La investigación genética ha empezado a aclarar los pasos que condujeron a la notable disparidad de hoy. Las micrografías muestran los cromosomas tal como aparecen en la metafase de la división celular.
S E T IA C O S S A O T O H P IO B
Conocimiento gradual
El trabajo realizado a lo largo de los últimos ocho años ha venido cubriendo muchos vacíos. En 1999 uno de los autores (Lahn) y David C. Page, CROMOSOMA Y
un proceso de recombinación. Durante la meiosis (la división celular que da lugar a espermatozoides y óvulos), los cromosomas emparejados se alinean juntos e intercambian segmentos; después, una copia de cada autosoma más un cromosoma sexual se distribuyen por igual en cada gameto. Aunque ahora la mayor parte del Y se parece poco al X, los extremos de ambos cromosomas se alinean durante la meiosis en los machos e intercambian fragmentos como si X e Y siguieran siendo una pareja. (Esa alineación resulta crucial para la distribución adecuada de los cromosomas en el espermatozoide.) Que el cromosoma X y el Y fueron un tiempo iguales se corrobora con una prueba más, que atañe a la parte de Y que no se recombina con X. Muchos de los genes distribuidos en la región no recombinante siguen teniendo su equivalente en el cromosoma X. La existencia de la región no recombinante, que constituye el 95 por ciento de Y, nos ofrecía una pista de cómo ese cromosoma se convirtió en sombra de su entidad srcinaria. En la naturaleza y en el laboratorio, la recombinación ayuda a mantener la integridad de los cromosomas. Por el contrario, su ausencia provoca que los genes de las regiones no recombinantes acumulen mutaciones destructivas que terminan por degradarlos, si no borrarlos. Parecía razonable pensar, pues, que hubo algo que detuvo el intercambio de partes de X e Y, con el desplome consiguiente de los genes de la región no recombinante del cromosoma Y. Pero transcurrieron decenios sin saberse cuándo y cómo cesó la recombinación después de que surgiera dicho cromosoma. N UEVA GENÉTICA
del Instituto Whitehead de Investigaciones Biomédicas de Cambridge, demostraron que el cromosoma Y perdió su capacidad de intercambio con el X de una manera gradual e inesperada: primero implicó un trozo de ADN circundante al gen SRY y, luego, se expandió, en bloques separados, por el cromosoma. Pero sólo Y se deterioró en respuesta a la pérdida de la recombinación X-Y; el cromosoma X prosiguió con su recombinación entre sus dos copias en la meiosis de las hembras. ¿A qué se debió el fracaso de la recombinación entre X e Y? Cuando el cromosoma X y el cromosoma Y primitivos se aprestaban a intercambiar segmentos durante la meiosis en un antepasado lejano de los mamíferos modernos, parte del ADN del cromosoma Y sufrió, a buen seguro, una inversión o un giro total con respecto a su parte equivalente en el cromosoma X. Puesto que la recombinación requiere que las dos secuencias de ADN similares se alineen juntas, la inversión suprimiría en adelante cualquier interacción entre las zonas de emparejamientos primitivas de X e Y. Descubrimos que la recombinación cesó en distintos episodios cuando examinamos las secuencias nucleotídicas de 19 genes que aparecen en la región no recombinante de X y de Y. (Algunas de las copias de Y han dejado de funcionar.) En general, si las copias emparejadas de un gen perdieron su posibilidad de recombinación, la disparidad de las secuencias crecerá con las generaciones. Ante una cifra limitada de diferencias entenderemos que la recombinación cesó recientemente; si el número es elevado, se detuvo hace mucho tiempo. En su mayoría, los pares X-Y caían en cuatro grupos. Dentro de cada grupo, las copias de X e Y diferían en la misma cuantía, prueba de que la recombinación cesó casi al mismo tiempo. Los grupos se distinguían
CROMOSOMA X
entre sí con claridad. Las copias de Y que empeza ron a diverg ir de su correspondient e en el cromosoma X casi al tiempo en que surgió el gen SRY eran las que más diferían de sus parejas; los otros grupos mostraban una divergencia progresivamente menor entre las copias de X e Y. Mediante la comparación interespecífica de las secuencias de ADN, los biólogos calculan con bastante aproximación el momento en que los genes emparejados (y, por tanto, las regiones que los alojaban) comenzaron a seguir caminos separados. Aplicado el método a nuestro ámbito se reveló que los precursores autosómicos de X e Y seguían emparejados y persistían intactos en los reptiles que vivieron antes de que la línea de los mamíferos iniciara su proceso de frondosa ramificación. Pero los monotremas (así el ornitorrinco y el equidna), que se numeran entre los primeros en ramificarse de otros mamíferos, poseen el gen SRY y una región adyacente no recombinante. De tales diferencias se infería que el 85
D N A L O N I ID E H Y N IA J A M A K . T D E R F L A
Genes del cromosoma Y (o familias de genes) no presentes en X y activos sólo en los testículos
SRY * (determina el sexo masculino)
Genes del cromosoma Y que tienen el correspondiente emparejamiento en X
RPS4Y † ZFY † PCDHY
TTY1 TSPY
Consecuencias asociadas con deleciones de segmentos de Y PRY
AMELY
TTY1 TTY2 TSPY
Centrómero Capacidad reducida para Estatura producir pequeña espermatozoides
USP9Y † DBY † UTY † TB4Y † VCY ‡
CDY XKRY
Capacidad reducida para producir PRY espermatozoides TTY2
SMCY † EIF1AY † RBMY ‡
RBMY ‡
Capacidad DAZ reducida BPY2 para producir PRY espermatozoides CDY Area carente de genes funcionales
gen SRY surgió, y se detuvo la recombinación de una región cercana, en un momento cercano a la aparición de los mamíferos, hace unos 300 millones de años. Nuestro conocimiento acerca de la cronología de los hechos aumentó cuando aplicamos el método del “reloj molecular”. En biología se calcula la llamada tasa de variación de fondo, es decir, la velocidad o tasa de variación de las secuencias de ADN cuando no se encuentran sometidas a una presión especial que les obligue a permanecer inalteradas. Multiplican do la amplitud de la disparidad de la secuencia los paresque X-Ylapor la tasa calculada,en dedujimos primera inversión suspensora de la recombinación aconteció hace de 240 a 320 millones de años. Análisis parecidos señalan que la siguiente inversión ocurrió hace entre 130 y 170 millones de años, poco antes de que surgieran los marsupiales, ramificados de la línea que dio lugar a los mamíferos placentarios. El tercer episodio de inversión se registró hace entre 80 y 130 millones de años, antes de la diversificación de los mamíferos placentarios. Por último, la inversión final se produjo hace entre 30 y 50 millones de años, después de que los simios iniciaran su propia senda evolutiva, aunque antes de que lo hicieran primates y homínidos. Apeándose de la tendencia general
¿Hace 350 millones de años?
TIEMPO ANTEPASADOS REPTILIFORMES DE MAMIFERO S
CENTROMERO
Surge el gen SRY CROMOSOMAS IDENTICO S CAPACES DE RECOMBINACION (DE INTERCAMBIAR FRAGMENTOS)
SRY
PAR DE AUTO SOMAS EN UN ANTEPA SADO REPTILIFORME
Y NACIENTE
de los pares X-Y, algunos genes de la región no recombinante del cromosoma Y determinan proteínas que difieren sorprendentemente poco de las proteínas cifradas por sus equivalentes en X, incluso en zonas que sufrieron la inversión en momentos muy tempranos. La explicación de la conservación de los mismos se apoya, probablemente, en una ley evolutiva
2. LOS CROMOSOMAS de una célula de varón (fotografía) comprenden 22 pares de autosomas (no implicados en la determinación del sexo), más un cromosoma X y otro Y. De cada par, un miembro procede de la madre y el otro del padre. Los genes de la NRY, región no recombinante del cromosoma Y (azul en el diagrama ), han permitido trazar la historia evolutiva de X e Y. Como nos dice su nombre, se trata de una región que no puede recombinarse, o intercambiar ADN, con el cromosoma X. Sólo se indican los genes operativos. Aproximadamente la mitad tienen su pareja correspondiente en X ( rojo ); algunos de estos genes cumplen funciones de “administración y cuidado”, y son necesarios para la supervivencia de la mayoría de las células. Ciertos genes de la NRY son activos sólo en los testículos (púrpura ), donde probablemente participan en la fecundidad del varón.
CROMOSOMA Y
Regiones "pseudoautosómicas", capaces de intercambiar ADN con el cromosoma X
*
determina la formació n de lo s testículos. Procede del gen SOX3 y se parece al SOX3 del cromo soma X, aunque los dos desempeñan funciones distintas
1
2
7
8
13 19
4
5
6
9
10
11
12
14
15
16
17
18
20
21
SRY
† Genes de admi nistración y cuidado ‡ Genes que tienen su pareja en X y activos sólo en los testículos
86
3
22
X
Y TEMAS 38
H S A -N A L IL D A P D E S E H
Hace entre 240 y 320 millones de años
Hace entre 130 y 170 millones de años
Hace entre 80 y 130 millones de años
Hace entre 30 y 50 millones de años
Pre s e nte En algún momento el SRY se trasladó al brazo corto de Y
MAMIFEROS
ZONAS DE EMPAREJAMIENTO CAPACES TODAVIA DE RECOMBINARSE
3
2
1o
ocurre un fallo en la recombinación; la sección afectada del cromosoma Y se degrada y acorta
2o 1
ocurre otro fallo en la recombinación, que provoca una mayor degradación de Y
4
4o
3o
ocurre otro nuevo fallo, que empuja al cromosoma Y hacia su aspecto de un estado muy contraído
ocurre otro fallo, que lleva aun acortamiento ulterior
D N A L O N I D I E H Y N A I J A
ZONAS YA INCAPACES DE RECOMBINACION X NACIENTE
Y X COMO EN LOS MONOTREMAS
Y X COMO EN LOS MARSUPIALES
harto simple, según la cual si un gen es crucial para la supervivenci a, tenderá a conservarse. En efecto, los genes de Y que menos cambios han experimentado coinciden con los “encargados de la administrac ión de la casa”, vale decir, los responsables de mantener la integridad de las células del organismo. Compensación de pérdidas La lógica —y un cuerpo sólido de
resultados de investigación— nos induce a afirmar que a la recombinación fallida entre el cromosoma X y el Y, con la degradación consiguiente de muchos genes en Y, hubo de sucederle un tercer proceso que compensara la degeneración. ¿Por qué? No todos los genes están activos en todas las células. Ahora bien, cuando una célula necesita determinadas proteínas, activa las copias, maternas y paternas, de los genes correspondientes. La cantidad de proteína sintetizada a partir de cada copia se ajusta con finura a las exigencias de desarrollo del organism o y a su desenvolvimiento diario. Por tanto, cuando los genes del cromosoma Y comenzaron a desaparecer, la producción de las proteínas asociadas habría disminuido catastrófica mente en los machos, de no haber logrado las especies afectadas desarrollar algunas mañas compensadoras. La mosca del vinagre y muchas especies más resuelven ese desequilibrio doblando la actividad de las versiones X de los genes Y perdidos en el macho. Otros animales emplean N UEVA GENÉTICA
Y X COMO EN LOS MONOS
Y X COMO EN EL HOMBRE
3. LA DEGENERACION DEL CROMOSOMA Y conoció cuatro episodios distintos. Comenzó hace unos 300 millones de años, después de que un antepasado reptiliforme adquiriera un gen nuevo ( SRY ) en uno de sus cromosomas autosómicos. En cada uno de los episodios se produjo un fallo de la recombinación (intercambio de ADN) entre el cromosoma X y el Y durante la meiosis, la división celular que srcina el espermatozoide y el óvulo. Si la recombinación se bloquea, los genes de las regiones afectadas dejan de funcionar y se degradan. La secuencia que se muestra es muy esquemática. En realidad, el cromosoma Y se expandió temporalmente a veces (enfilando ADN autosómico en zonas todavía capaces de recombinación), antes de que los fracasos de la recombinación condujeran a un acortamiento neto.
una estrategia más compleja. Primero refuerzan la actividad de los genes del cromosoma X, lo mismo en el macho que en la hembra; con ello se colman los niveles de proteína en el macho, aunque se crea un exceso en la hembra. Algunos, como los nemátodos, reducen a la mitad la actividad de los genes de X en la hembra. Otros, mamíferos incluidos, recurren a un proceso de inactivación de X, en cuya virtud las células de embriones tempranos de hembras silencian al azar la mayoría de los genes en uno de sus dos cromosomas X. Las células vecinas podrían silenciar copias de X diferentes, pero todas las descendientes de una determinada célula se acomodarán al mismo patrón de inactivación de X. Aunque desde hacía tiempo se veía en la inactivación de X una respuesta al deterioro de los genes de Y, carecíamos de pruebas tajantes. Si la degeneración de los genes de Y conducía a la inactivación del cromosoma X, entonces los genes de X dotados de pareja funcional en la región no recombinante de Y continuarían, cabía esperar, operando en las hembras
(para evadir la inactivación), de suerte que así se mantuvieran en las hembras niveles de proteína equivalentes a los de los machos. Al analizar los niveles de actividad de los pares X-Y en dos docenas de especies de mamíferos, uno de los autores (Jegalian) y Page descubrieron años atrás que las copias en X de genes funcionales en Y escapaban a la inactivación. Su investigación reveló también que la inactivación de X, aunque hoy sucede en un instante durante el desarrollo del animal, distó mucho de surgir de una forma repentina. Apareció trozo a trozo, quizá gen a gen dentro de un segmento, no de golpe en el cromosoma. Temas nuevos
Resulta cuando menos llamativo que la región no recombinante del cromosoma Y posea, además de un puñado de genes valiosos, reflejados en el cromosoma X, otra docena que promueve la fecundidad en el macho. Estos genes de la masculinidad determinan sólo proteínas sintetizadas exclusivamente en los testículos, presumiblemente para intervenir en la 87
M A K . T D E R F L A
X Y CELULA MASCULINA
PROTEINA CODIFICADA POR GENES
EFECTO: El macho fabrica la mitad de la cantidad de proteína sintetizada por la hembra
EFECTO: El nivel de proteína total en el macho vuelve a su valor normal
EFECTO: Ningún cambio en el macho
N IA J A M A K . T D E R F L A
GEN PERDIDO
COPIAS ACTIVAS DEL GEN CONDICION DE PARTIDA
SUCESO 1
SUCESO 2
SUCESO 3
La copia del gen en Y se deteriora a causa del fallo de la recombinación entre XeY
La copia del gen en X dobla su actividad para compensar la pérdida de proteína en el macho
Las hembras inactivan al azar una copia del gen en cada célula
RESULTADO FINAL El nivel de proteína en macho y hembra se igualan
GEN INACTIVO CELULA FEMENINA
X
X
EFECTO: Ningún cambio en la hembra
S E L R A E S I Z
88
EFECTO: El nivel de proteína en la hembra vuelve a su valor normal
4. EVOLUCION DE LA INACTIVACION DE X o silenciamiento de la mayoría de los genes del cromosoma X en las células de una hembra. Según parece, procedió de una forma gradual —un gen o algunos genes a la vez— para compensar la pérdida de genes del cromosoma Y (diagrama). En el gato moteado encontramos un efecto de la inactivación de X (fotografía ). El gen determinante del color de la piel, naranja o negro, se halla en e l cromosoma X. Las hembras que llevan la versión naranja en un cromosoma X y la versión negra en el otro X tendrán algunas zonas naranja y otras negras, dependiendo de qué X esté inactivo en cada célula. El responsable de las zonas blancas es un gen diferente.
A R
producción de espermatozoides. Algunos parecen haber saltado hasta el cromosoma Y desde otros cromosomas. De otros genes pudiera decirse que estuvieron en Y desde el comienzo, aunque cumpliendo en su inicio una misión diferente; con el tiempo adquirirían las nuevas funciones. De donde se desprende que la degeneración constituye un asunto mayor en el curso evolutivo seguido por el cromosoma Y. Otra segunda cuestión, apenas atisbada hasta hace poco, se refiere a la adquisición de los genes de fertilidad. Los teóricos discrepan a propósito de las fuerzas que convierten al cromosoma Y en un imán para esos genes. La especie, en cuanto tal, podría beneficiarse del secuestro en los machos de genes nocivos o inútiles para las
EFECTO: La hembra produce ahora demasiada proteína
hembras. Es también posible que al estar en el Y los genes de la fertilidad se aseguraría su paso de macho a macho sin tener que desviarse a través de las hembras (que podrían desecharlos sin sufrir consecuencias directas). ¿Cómo pueden los genes de la fertilidad prosperar en ausencia de recombinación, bajo las mismas condiciones que arruinaron a la mayoría de los restantes genes del cromosoma Y? La respuesta podría esconderse tras la observación siguiente: la inmensa mayoría de los genes de fertilidad presenta múltiples copias en el cromosoma Y. Semejante multiplicidad puede servir de tampón contra los efectos de mutaciones destructivas, que acostumbran afectar sólo a una copia por vez. Algunas
copias acumulan mutaciones y terminan por fracasar, en tanto que las restantes siguen cuidando la capacidad reproductora del hombre y sirven de simiente para su propia multiplicación. La evolución de los cromosomas sexuales se ha estudiado a fondo en el hombre. De su comparación con los trabajos acometidos en otras especies han aflorado una serie de principios generales que operan incluso en animales cuyos cromosomas sexuales siguieron un curso evolutivo distinto del expuesto a propósito de los mamíferos. Aves y mariposas usan el sistema W-Z de determinación del sexo. Cuando la herencia de una sola copia de un cromosoma específico induce la formación de un macho, a ese cromosoma se le llama Y, y a su TEMAS 38
Esterilidad del varón
A
demás de revelar la historia de los cromosomas sexuales, los estudios genéticos del cromosoma Y nos permiten conocer las causas de algunos casos de esterilidad. En casi la mitad de las parejas afectadas, el problema reside total o parcialmente en el varón, que produce un número insuficiente de espermatozoides o ninguno en absoluto. A menudo las raíces de estas anomalías permanecen oscuras. Los nuevos hallazgos revelan, sin embargo, que el cromosoma Y contiene genes de fertilidad y que la alteración de uno o varios explica por qué alrededor del 10 por ciento de los hombres producen escasos espermatozoides o incluso ninguno. En los años setenta, tras observar al microscopio que muchos varones estériles carecían de pequeños fragmentos d el cromosoma Y, presentes por norma en los fértiles, se dedujo la responsabilidad de dicho cromosoma en la infecundidad. Sabemos hoy que las deleciones en una cualquiera de tres regiones específicas del Y provocan esterilidad. Se trata de las regiones AZF (por factor de azoospermia) a, b y c. Cada una de ellas contiene múltiples genes. En su mayoría, tales genes se muestran muy activos en los testículos, donde se producen los espermatozoides. (Los genes fabrican en cantidades abundantes las proteínas que codifican.) De semejante comportamiento se desprende la importancia de los genes de las regiones AZF para la formación de fluido seminal, aunque se desconoce su contribución exacta, así como la interacción de los mismos con genes de la fecundidad de otros cromosomas. Algunos andrólogos introducen ya las deleciones del cromosoma Y en valoración diagnóstica. Si los varones que sufren esas deleciones producen al menos algunos espermatozoides, podrían someterse a una terapia de inyección espermática citoplasmática (ICSI), en que se recoge semen de los testículos y se inyecta en el ovocito en el laboratorio. Pero los hijos así concebidos heredarán los cromosomas Y defectuosos y padecerán probablemente los mismos problemas de esterilidad. Una vez se descifren las funciones exactas de las proteínas codificadas E N O T S , L E M R A H K R A M
LA INYECCION del espermatozoide ( visible en la microaguja ) directamente en un óvulo puede venc er la esterilidad en varones afectados por mutaciones en el cromosoma Y .
pareja X. Cuando la herencia de una sola copia de un cromosoma promueve la formación de una hembra, a ese cromosoma se le denomina W, y a su pareja Z. Un principio importante es que los cromosomas sexuales proceden de los autosomas. Pero los autosomas concernidos pueden variar. En las aves los cromosomas W y Z surgieron de autosomas distintos de los que dieron lugar a X e Y en los mamíferos. Por su parte, los cromosomas X e Y de la mosca del vina-
N UEVA GENÉTICA
por losrepararse genes de la la zona AZF, podría quizá esterilidad de los varones con deleciones en el cromosoma Y, mediante la restauración de los genes perdidos y la aportación consiguiente de las proteínas necesarias. Vistas las cosas desde la otra cara, algunos se proponen aprovechar esa información para el diseño de fármacos que alteren la maquinaria de producción de espermatozoides y convertirlos en nuevos anticonceptivos del varón.
gre se srcinaron a partir de autosomas diferentes de los que dieron lugar a esos cromosomas en los seres humanos.
En la mayoría de las especies que se reproducen por vía sexual, una vez que surgieron los cromosomas sexuales, éstos comenzaron a adquirir rasgos muy peculiares a medida que sufrieron uno o más ciclos de tres pasos secuenciales: supresión de la recombinación, degeneración de las regiones no recombinantes del cromosoma específico del sexo (el Y
o el W) y, por último, la compensación por parte del otro cromosoma. Al mismo tiempo, el cromosoma específico del sexo devino importante para la fecundidad, como sucedió con el cromosoma Y en el hombre y en los insectos. Es razonable preguntarse por el futuro que le aguarda a nuestra especie. ¿Podría continuar el ciclo hasta desaparecer toda recombinación entre el cromosoma X y el Y, hasta la destrucción final de Y, quizá dentro de millones de años? Los descubrimientos recientes insinúan que los machos están capacitados para proteger sus genes del cromosoma Y que resultan decisivos para la supervivencia y la fecundidad del varón. Ello no obstante, la degradación total del cromosoma Y sigue ahí como una posibilidad teórica. Muy a menudo, se emprende una investigación génica con la mirada puesta en alguna enfermedad, para conocerla a fondo y repararla si se puede. Así se acometieron varios trabajos sobre el cromosoma Y, que buscaban comprender el desarrollo y la corrección de la esterilidad. A un buen número de estudios, sin embargo, les preocupaba menos la posible terapéutica. Conforme se iban identificando más genes de los cromosomas X e Y, gracias a la investigación médica y a una secuenciac ión sistemática, los científicos no se resistieron a plantear una cuestión más básica, la de si esos genes aportaban alguna novedad sobre el pasado remoto de ese extraño desemparejamiento entre el cromosoma X y el Y. Ahora vemos, en efecto, que los genes tenían una maravillosa historia que contarnos.
BIBLIOGRAFIA COMPLEMENTARIA FUNCTIONAL COHERENCE OF THE HUMAN Y CHROMOSOME. Bruce T. Lahn y David C. Page en Science, vol. 278, págs. 675-680; 24 de octubre de 1997. A PROPOSED PATH BY WHICH GENES COMMON TO MAMMALIAN X AND Y C ROMOSOMES EVOLVE TO BECOME X I NACTIVATED. Karin Jegalian y David C. Page en Nature 394, págs. 776-780; 20 de agosto ,devol. 1998. F OUR E VOLUTIONARY S TRATA ON THE HUMAN X CHROMOSOME. Bruce T. Lahn y David C. Page en Science , vol. 286, págs. 964-967; 29 de octubre de 1999. THE HUMAN Y CHROMOSOME IN EVOLU TION’S LIGHT. Bruce T. Lahn, Nathaniel M. Pearson y Karin Jegalian en Nature Reviews Genetics (en prensa).
89
Genética e historia de las poblaciones del norte de Africa y la península Ibérica El análisis genético ha revelado que los amplios intercambios culturales producidos entre el Magreb y la península Ibérica no conllevaron grandes intercambios de poblaciones E. Bosch, F. Calafell, S. Plaza, A. Pérez-Lezaun, D. Comas, J. Bertranpetit
L
as poblaciones humanas se componen de individuos genéticamente distintos entre sí. Del estudio de la variabilidad de nuestra especie se ocupa la genética de poblaciones aplicada a escala mundial. A dicha disciplina le corresponde exponer la magnitud y distribución de la variabilidad genética humana. Dos personas cualesquiera, tomadas al azar, se distinguen, en promedio, en un 0,1 % de las bases nucleotídicas que conforman su ADN. Expresado de otro modo, discrepan en seis millones de pares de bases. (El ADN humano consta de unos 3000 millones de pares de bases en cada una de las dos dotaciones haploides, una procedente del padre y otra de la madre.) Si del individuo pasamos a las poblaciones, las diferencias observadas explican, a lo su mo, un 15 % de la disparidad genética total; un 10 % se debe a las diferencias entre grandes grupos continentales y el 5 % restante a las diferencias entre poblaciones de un mismo continente. Aun siendo pequeñas, estas últimas diferencias tienen que ver con la historia de cada población. Podemos apoyarnos en la diversidad genética entre poblaciones para reconstruir la historia demográfica. El acervo genético de las poblaciones actuales es el resultado de la interacción entre diversas fuerzas evolutivas. Dependen éstas, a su vez, de la historia demográfica de las poblaciones, de las características intrínsecas de las regiones genómicas estudiadas y de la interacción entre genoma y factores ambientales. 90
Las características intrínsecas de cada región del genoma remiten a sus tasas y patrones de mutación y recombinación, así como a su modo de herencia. Se trata de parámetros que la ciencia conoce con razonable p recisión. La interacción entre la variabilidad de cada gen y el ambiente (tomado en sentido amplio, incluida, pues, la interacción con otros genes) puede promover la selección natural. Es decir, unas variantes pueden mostrarse más eficientes y verse privilegiadas por la selección, en tanto que otras pueden ser desfavorables. Lo observamos en la hemoglobina. Algunas variantes de esta proteína confieren resistencia a la malaria; la selección prima su presencia en zonas palúdicas. En consonancia con ello, el estudio de la variabilidad de la hemoglobina nos informará sobre la distribución de la malaria con mayor rigor que la historia de las poblaciones. Conviene saber que sólo un 1,5 % de la secuencia de ADN humano llega a expresarse, es decir, determina proteínas que se sintetizan y son objeto de selección natural. Por lo tanto, la mejor estrategia para conocer la historia de las poblaciones será la que se centre en la variabilidad presente en el 98,5 % restante, cuy as probabilidades de verse afectada por la selección son mucho menores. A partir de esta premisa podemos analizar dicha variación, explicar las diferencias genéticas neutras (polimorfismos) que encontramos entre los individuos de una población e interpretarl as en términos de historia de las poblaciones.
Disponemos de un amplio bagaje teórico, desarrollado desde los años cuarenta, gracias al cual, dada una historia demográfica, podemos predecir sus efectos sobre la diversidad genética. Podemos reconstruir la historia demográfica a partir de la diversidad genética investigada en diversas regiones del genoma, que difieren en su velocidad de cambio y que permiten reconocer huellas genéticas a distintas profundidades de un tiempo pasado. Deriva genética
¿Cómo influye la historia en la diversidad de las poblaciones? A través de dos mecanismos básicos: la deriva genética y el flujo génico. En la deriva se engloban todos los fenómenos de cambio genético aleatorio que se dan cuando una generación transmite sus genes a la siguiente. Así como hay apellidos que prosperan y otros que se pierden en razón del número de hijos varones procreados en cada generación, las variantes genéticas (o alelos ) pueden también cambiar de frecuencia; en ambos casos se trata de fenómenos aleatorios. Tales oscilaciones serán tanto más intensas cuanto menor sea la población, por un simple efecto de muestreo. Las desviaciones respecto a la probabilidad teórica son mayores si realizamos un número pequeño de ensayos, de la misma forma que al tirar una moneda al aire repetidas veces sólo se alcanza con seguridad la frecuencia esperada de 1/2 si se lanza muchísimas veces. Se presenta un caso extremo de grandes cambios genéticos aleatorios, conocido por efecto fundad or , cuando TEMAS 38
. T R E B M A L A C E T IO L IB B A L E D S E N E G A IM E D L A T I IG D O V I H C R A , L L E S O R IA C R A G . J
1. EMBARQUE DE LOS MORISCOS en el puerto de Vinaroz.
un grupo reducido de individuos establece una nueva población y se lleva consigo una muestra no necesariamente representativa de los genes de la población de srcen. En la colonización sucesiva de las islas de la Polinesia, por ejemplo, se dio una secuencia clara de efectos fundadores; en el curso de la misma, un grupo limitado de individuos partía de una isla y se asentaba en la siguiente. Las oscilaciones aleatorias de las frecuencias alélicas pueden llegar a la extinción de algunas de estas variantes. Puesto que dichas oscilaciones son más intensas en poblaciones pequeñas, se pierde variabilidad más fácilmente en éstas. A no ser que se dé una tasa de mutación extraordinaria, resulta muy poco probable que en las poblaciones pequeñas se regenere la variación perdida. Por lo tanto, al detectar una menor variabilidad genética en una población actual, podemos reconocer episodios de reducción de la población en el pasado (los llamados cuellos de botella), aunque la población actual se haya recuperado. Además, habida cuenta de la naturaleza aleatoria de la deriva genética, las poblaciones pequeñas contiguas tenderán a diferir más entre sí que las mayores. Esta misma natuN UEVA GENÉTICA
raleza aleatoria puede manifestars e de manera ligeramente diversa en regiones genómicas distintas. En consecuencia, los análisis basados en una sola región genómica pueden resultar poco fiables. Conviene siempre considerar la información procedente de un número razonable de regiones genómicas y extraer las tendencias medias. Flujo génico
Dos poblaciones que se hayan diferenciado, por deriva, en su composición genética y entren en contacto, pueden mezclarse y dar lugar a una población con características genéticas de las dos de partida. Este fenómeno de flujo g énico, así se le llama, se debe a la migración. La propia migración en distancias cortas, habitual a través del matrimonio, puede promover, a largo plazo, el intercambio de genes a grandes distancias. Lo observamos, por ejemplo, en las poblaciones de Asia Central, que poseen características genéticas intermedias entre las de Europa y las de Asia Oriental; su peculiar constitución genética podría explicarse por su posición central y milenios de migraciones individuales de corto alcance. La diferenciación entre poblaciones resultante de la deriva genética
se acentúa con el paso del tiempo. Para medirla disponemos de un parámetro, la distancia genética , que indica el grado de diferenciación entre pares de poblaciones para múltiples regiones del genoma. Si se trata de un conjunto de poblaciones, podemos representar su matriz de distancias genéticas mediante algoritmos; ofrecen éstos un paisaje genético que refleja las afinidades y diferencias dentro del conjunto poblacional. El paisaje compendia la historia de las poblaciones en términos de deriva genética y flujo génico. Para trazar y cuantificar con razonable precisión los flujos génicos, disponemos de una nueva herramienta de análisis. Se trata de la filogeografía. Estudia ésta la genealogía del gen que ha dado srcen a la variación existente dentro de una región del genoma y la distribución geográfica de dicha variabilidad. Ante una diversidad genética dada, pensemos en una secuencia de ADN o en un conjunto de polimorfismos, la herramienta mencionada se propone reconstruir el proceso evolutivo o filogenético que ha desembocado en la diferenciación observada a partir de un antepasado común. Al plasmar conjuntamente la diversificación del gen y la de las poblaciones, podemos anclar ciertas variantes genéticas (secuencias o haplotipos) en una rama del árbol 91
A J A C N A B , E T N A IC L A Y N O L L E T S A C , IA C N E L A V E D S O R R O H A E D A J A C A L E D A C I T IS T R A N O I C C E L O C A L A E T N IE C E N E T R E P A R B O
Patrones de herencia: autosomas, cromosoma Y, ADN mitocondrial
N
uestro ADN se dispone en 23 pares de cromosomas. Cada miembro de un par es casi idéntico al otro en longitud y en la información que contiene; se trata de dos rasgos distintivos de cada par. Cada miembro de cada par de cromosomas nos viene de un progenitor; a cada uno de nuestros hijos le legaremos un solo miembro de cada pareja. Pero no es una transmisión fidedigna; en virtud del proceso de recombinación del material genético no heredamos el cromosoma srcinal, sino una mezcla que contiene partes de cada miembro del par, tomadas al azar. Para ilustrarlo, la figura muestra un par de cromosomas que contiene fragmentos de distinta longitud de los cromosomas de los bisabuelos. Por eso resulta imposible predecir a priori de qué antepasado proviene un determinado fragmento de ADN autosómico. Hay en el genoma dos regiones que presentan un patrón de herencia distinto. Nos referimos a los cromosomas sexuales y el ADN mitocondrial. A diferencia de los autosomas, los cromosomas sexuales (X e Y) son muy diferentes entre sí. El cromosoma Y determina la masculinidad a través de la acción de un único gen, SRY ( sex-determining region ); los cigotos con un cromosoma X y un cromosoma Y generan embriones masculinos, en tanto que los portadores de dos cromosomas X generan embriones femeninos. Por lo tanto, los varones heredan el cromosoma Y de su padre, que a su vez lo recibió del abuelo paterno, de la misma forma que se hereda el primer apellido. Lo vemos reflejado en la figura: de los cuatro bisabuelos varones, sólo el abuelo paterno del padre lega su cromosoma Y ( azul liso ) a su bisnieto. Además de los cromosomas, que residen en el núcleo de las células, otros orgánulos contienen ADN. Se trata de las mitocondrias, que alojan decenas de copias de una pequeña molécula circular de ADN. Este ADN mitocondrial (ADNmt)
evolutivo y en un srcen geográfico. Aplicando ese método se ha cuantificado la aportación por vía paterna y materna de africanos, europeos y amerindios al acervo genético de la población brasileña contemporánea. Para datar puntos concretos de la evolución humana se puede recurrir a los microsatélites, segmentos de ADN que contienen repeticiones de breves secuencias de dos a seis nucleótidos. Son marcadores de evolución rápida. A partir de un determinado acontecimiento fundador, la cantidad de variación acumulada y medible es una función de la tasa de mutación (que podemos estimar) y del tiempo transcurrido, que es la incógnita que despejaremos. Por ejemplo, se observó que la mayoría de los judíos apellidados Cohen (“sacerdote”) poseían cierto tipo de cromosoma Y. Concurre, además, que la condición de sacerdote, el apellido y el cromosoma Y se transmiten de padres a hijos exclusivamente por la línea masculina. Pues bien, de la variación acumula da en los microsatélites de este tipo de cromosoma Y se infiere un efecto fundador 92
. .) T I 5 T 9 9 E 1 P ; N 6 A 5 R -4 T 9 R 4 E .4 B . S J G Y A P S , A 1 M1 OO. C N . , D S , C I N T U A E Z N E E -L G Z IN E R S E D P N . E A , R T A Z N A E L H P . IT S M , S L L R E E F L A Y L T A C D
BISABUELOS
ABUELOS
PADRES
.F , H C S O B . E
INDIVIDUO
N A G N I L B O J E D A D A T P A D (A
se hereda por vía materna: el ADNmt del embrión procede sólo del óvulo, porque el ADNmt del espermatozoide no llega a penetrar en el óvulo. Así, en l a genealogía del ejemplo, el ADN mitocondrial del individuo ( magenta ) proviene de su madre, de su abuela materna, de la madre de ésta, y así sucesivamente. Para entender esta figura sobre cromosomas y herencia, adviértase que las barras grandes representan autosomas (cromosomas no ligados al sexo), las pequeñas representan el cromosoma Y (cuya presencia denota un varón) y los círculos, el ADN mitocondrial. De abajo arriba se esquematiza un individuo, su madre y su padre, sus cuatro abuelos y sus ocho bisabuelos.
que operó hace unos 3000 años, coincidente con el establecimiento de una casta sacerdotal hebrea.
A escala regional, podemos abordar también algunas cuestiones abiertas sobre la historia de las poblaciones. Se cuenta aquí con la colaboración El Magreb de otras disciplinas; la arqueología, y la pen íns ula Ibé ric a la paleoantropología o la lingüísti ca El análisis de la diversidad genética suministran a menudo hipótesis que, humana en poblaciones actuales ha en la medida que impliquen distinarrojado luz sobre numerosas cuestas historias demográficas, pueden tiones históricas, en distintas escaverificarse mediante el estudio de la las temporales y espaciales. Sabemos diversidad genética de las poblacioya que la distribució n y la antigüe- nes actuales. dad de la diversidad genética a escala Desde la genética de poblaciones mundial son compatibles con un oripodemos abordar cuestiones que atagen reciente y africano de la humañen a la península Ibérica (España y nidad actual. El punto de arranque, Portugal) y al noroeste de Africa (el situado en Africa, se remontaría, a Magreb: Marruecos, el Sahara Occilo sumo, unos 150.000 años atrás. Por dental, Mauritania, Argelia y Túnez). tanto, ni los habitantes del yacimiento ¿Se puede hablar de un srcen común de Atapuerca ni los neandertales para ambas poblaciones a sendas oriserían antepasados nuestros. llas del Mediterráneo? ¿Quedan en las A escala continental, se debate la pro- poblaciones actuales rastros de un porción de genes de srcen paleolítico substrato paleolítico que represente (hace unos 30.000 años) y neolítico el poblamiento inicial de los antepa(hace 10.000) presentes en los europeos sados de las poblaciones actuales? ¿Es actuales. Los genes, por otro lado, apun- el mismo substrato para ambas regiotan a una fecha antigua (unos 30.000 nes? ¿Cuál fue la aportación de la oleaaños) y a un srcen claramente nortea- da de avance neolítica? ¿Qué fracción siático para la colonización de América. del acervo genético magrebí proviene TEMAS 38
de la invasión árabe? ¿Podemos identificar la contribución magrebí a las poblaciones peninsulares? ¿Es el Sahara una barrera impenetrable al intercambio de genes entre poblaciones? Para resolver esa gavilla de cuestiones sobre el poblamiento y las relaciones genéticas entre la península Ibérica y el Magreb, hemos recurrido al análisis de marcadores clásicos, microsatélites autosómicos, inserciones Alu, secuencias de ADN mitocondrial, polimorfismos de un solo nucleótido (SNP) del cromosoma Y y microsatélites del cromosoma Y en muestras de poblaciones ibéricas,
De acuerdo con nuestro análisis de marcadores clásicos, las distancias genéticas entre ibéricos y poblaciones del Oriente Medio son menores que la que existe entre ibéricos y magrebíes. Se da, además, una discontinuidad abrupta entre las orillas septentrional y meridional en el paisaje genético de la cuenca mediterránea, con una máxima pendiente en el estrecho de Gibraltar . Estas y otras consideraciones nos llevaron a postular que en el Magreb pudo conservarse un substrato paleolítico, distinto del substrato paleolítico europeo. Supondría ello que, a
linaje de más de 19.000 años de existencia. Podemos, pues, postular un escenario en que una expansión paleolítica desde Africa nororiental llevara al Magreb los antepasados del linaje E3b2*, que surgiría in situ después de la expansión. El linaje masculino E3b2* tiene un correlato en el linaje matrilineal mitocondrial U6, también de antepasados etíopes y difusión limitada al noroeste de Africa, aunque no alcanza las elevadas frecuencias de E3b2*. Por consiguiente, dos regiones genómicas independientes con filogeografías bien establecidas confirman la singularidad magrebí y sitúan
beréberes norte, centro sur de Marruecosdel y del centro de yArgelia, árabes marroquíes, argelinos y tunecinos, y saharauis. No se estudiaron todas las poblaciones para todos los marcadores, aunque sí se investigó extensamente un núcleo fundamental. En el caso de los marcadores clásicos, recopilamos la información publicada por otros equipos de trabajo. En otros casos, contrastamos nuestros resultados con los obtenidos por otros autores. De la investigación realizada se desprende una descripción, que creemos ajustada, de la historia de las poblaciones norteafricanas e ibéricas.
diferencia de lo que parece haber sucedido en Europa, la transición al Neolítico norteafrica no se produjo sin un recambio sustancial de genes. En esa hipótesis abunda la cultura capsiense del Mesolítico norteafricano, que se prolonga hacia el Neolítico adoptando las nuevas formas de producción, aunque sin la drástica ruptura que se observa en gran parte de Europa. Planteamiento que viene avalado por investigaci ones con secuencias Alu y microsatélites. Hallamos una confirmación directa de la hipótesis anterior al analizar la filogeografía del cromosoma Y. Los linajes del cromosoma Y, definidos a partir de SNPs, presentan una genealogía muy clara y una distribución geográfica que tiende a ser restringida. Las frecuencias del mismo en una región difieren de las observadas en la otra: en la península Ibérica predominan, lo mismo que en el resto de Europa Occidental, el linaje R1b* y sus inmediatos derivados (el conjunto R1b3, R1b6 y R1b8), en tanto que dos tercios de los cromosomas Y magrebíes pertenecen al linaje E3b2*. Tras la investigación realizada sobre la variación en el cromosoma Y ha quedado patente que el grupo de linajes R1b se encuentra sólo en Oriente Medio y Europa. Ciertos linajes (R1b3, R1b6 y R1b8) se hallan circunscritos a la península Ibérica; habrían surgido aquí a partir del haplotipo fundador, sin apenas dispersarse allende sus fronteras. El grupo de linajes R1b, por su antigüedad y distribución geográfica, se habría srcinado en Oriente Medio y se habría difundido por Europa con las colonizaciones iniciales del Paleolítico superior. El linaje magrebí E3b2* se ha hallado en otras poblaciones, aunque con frecuencias mucho menores. Su antepasado más inmediato aparece entre los etíopes. Si atendemos a la acumulación de variabilidad en microsatélites asociada a E3b2*, se trataría de un
sus raíces en el Paleolítico.
Orígenes remotos de norteafricanos y ha bit ant es de la península Ibérica
Con pocas excepciones, todos los marcadores genéticos analizados muestran una separación clara entre las poblaciones magrebíes y la de España y Portugal, incluidas, sin embargo, en el rango de la variación de las poblaciones caucasoides (las de origen europeo, más las norteafricanas y medioorientales). Ahora bien, las distancias genéticas entre ibéricos y el resto de europeos son menores que entre ibéricos y magrebíes. Este patrón mayoritario no se refleja en todos y cada uno de los genes analizados. Por ejemplo , en la región que lleva la información para la síntesis de los antígenos de los leucocitos humanos (HLA), los cuales definen la compatibilidad en trasplantes de órganos. Basándose en una sola región del genoma (y sometida a selección), algunos autores postularon un srcen común de peninsulares y magrebíes. Pero la naturaleza aleatoria de la deriva genética y la acción de la selección pueden producir este tipo de desviaciones; para evitarlas, la interpretación debe apoyarse en la información conjunta del máximo número posible de genes y no en una sola región del genoma. N UEVA GENÉTICA
El Neolítico: un avance paralelo
Se admite que la agricultur a y ganadería comenzaron en Oriente Medio hace unos 10.500 años. Esa fase prehistórica conllevó el crecimiento y la expansión consiguiente de la población en varias direcciones. Pero se debate si dicha expansión supuso un recambio genético en las poblaciones europeas o si se conserva en la actualidad un importante substrato genético paleolítico (anterior a la expansión del Neolítico), así como el grado en que ocurrió una cosa u otra. Si atendemos al paisaje genético europeo, advertiremos un gradiente o clina desde el sudeste hacia el noroeste. Asimismo, aparece otra clina esteoeste en el norte de Africa, desde Egipto hasta Marruecos. No es fácil dar con una explicación de dichas clinas, pues se produjeron varios movimientos migratorios en esas mismas direcciones; por ejemplo, la primera colonización del Paleolítico y el avance del Neolítico en Europa, o el Neolítico y las invasiones árabes en el norte de Africa. Para nuestra fortuna, los métodos que permiten datar linajes acotan el intervalo de la difusión. Así, para el cromosoma Y en Europa los datos indican un impacto neolítico menor (con estimas en torno al 38,7 %) frente a un substrato paleolítico mayor (en torno al 61,3 %) en el conjunto europeo. Hay razones para postular que los linajes F*, G*, J* y J2* del cromosoma Y se srcinaron en Oriente Medio. Desde allí se difundieron hacia el oeste por ambas riberas del Mediterráneo con la expansión del Neolítico. De acuerdo con nuestra investigación, la frecuenc ia de F* y G* es más elevada en la península Ibérica que en el NO de Africa; por el contrario, J* abunda más en el norte de Africa. Estas frecuencias dis pares son compatibles con la hipótesis de la expansión del Neolítico, siguiendo 93
Tipos de polimorfismos genéticos
L
a variabilidad genética se presenta en múltiples formas. Con las técnicas disponibles nos es dado conocer distintas facetas de dicha variación. Podemos analizar directamente la variabilidad del ADN. Asimismo, los marcadores genéticos clásicos son los sistemas polimórficos detectados en los productos de expresión génica. A través de esta segunda vía, históricamente anterior a la primera, se nos revelaron los primeros sistemas polimórficos genéticos, por ejemplo, el de los grupos sanguíneos, descubiertos en 1900. Otros marcadores clásicos consisten en la variación de movilidad de proteínas plasmáticas, enzimas eritrocitarias y el sistema de antígenos leucocitarios humanos (antígenos HLA), que determinan la compatibilidad de los trasplantes. La variabilidad o polimorfismo del ADN puede tomar varias formas. En la más sencilla, una determinada posición de nuestro genoma puede presentar dos variantes químicas (raras veces más de dos) de las cuatro posibles en las que se escribe el alfabeto del ADN (G, A, T y C). Se trata de un SNP (Single Nucleotide Polymorphism ), de los que se calcula que hay unos tres millones en el genoma humano; se caracteriza por que en una posición concreta del genoma puede haber una u otra base (A o G, por ejemplo). En vez de limitarnos a una sola posición del genoma, podemos definir un cierto segmento y determinar su secuencia en un conjunto de individuos. Esta estrategia permite,
pautas independientes, por ambas orillas del Mediterráneo; la península Ibérica y el Magreb representarían los extremos occidentales de ambas expansiones. Colin Renfrew ha propuesto que en el Neolítico, además de los genes, se propagaron varias familias lingüísticas desde Oriente Medio: la familia indoeuropea hacia Europa, la afroasiática hacia Arabia y el norte de Africa, la elamodravidiana hacia Irán y el subcontinente indio, y la altaica hacia Asia central. Habría, pues, un correlato génico de las expansiones lingüístic as que llevaron las lenguas indoeuropeas hacia Europa y las afroasiáticas hacia el norte de Africa. Esta hipótesis, muy controvertida, cuenta con escaso respaldo en su ap licación rigurosa. Ara bes y be réb ere s
Los beréberes (o imazighen ) constituyen los descendientes directos de una población ancestral que se extendía por gran parte del norte de Africa, desde Egipto hasta Senegal. Suman hoy 20 millones de personas, dispersas en pequeñas minorías de Egipto, Libia y Senegal. Sin embargo, muchos habitantes de Túnez, Argelia y Marruecos se definen a sí mismos como tales y hablan alguna de la veintena de lenguas beréberes, una rama de la familia afroasiática. El resto de la población habla y se considera 94
además de reconocer las variantes existentes en ciertas posiciones, descubrir también toda la variación que hay en el ADN y reconstruir su genealogía, es decir, el proceso evolutivo que dio lugar a la variabilidad observada. Encontramos otro tipo de variación genética en los microsatélites o STR (Short Tandem Repeat Polymorphisms ). Estas secuencias de ADN consisten en la repetición en tándem de una unidad básica de entre 2 y 6 nucleótidos de longitud. Presentan una particularidad distintiva: el número de repeticiones de la unidad básica es muy variable entre individuos. Por ese motivo se han convertido en importantes marcadores en el campo de la genética forense (identificación de personas y de la paternidad). Las inserciones Alu constituyen, por último, otro tipo interesante de polimorfismo. Estas secuencias, de unos 300 nucleótidos de longitud, utilizan la maquinaria celular de replicación del ADN para copiarse a sí mismas y reinsertarse en otras partes del genoma. Las nuevas inserciones, lo mismo que cualquier otro polimorfismo, pueden perderse o fijarse, pero algunas de ellas se hallan en una situación intermedia. Aunque esta tercera situación se da con cierta frecuencia, es un fenómeno variable de una población a otra. Además, caso único entre los polimorfismos, conocemos bien cuál es la dirección de la evolución: normalmente, de la ausencia (estado ancestral) a la presencia (estado derivado) del elemento Alu.
árabe, y se supone descendiente de las invasiones, que desde el siglo VII y con especial intensidad en el XI , llevaron el Islam desde la península Arábiga hasta el Magreb. Así las cosas, podemos plantearnos si las invasiones árabes implicaron una aportación demográfica significativa o si, por el contrario, una elite numéricamente limitada pero culturalmen te prestigiosa consiguió difundir una nueva lengua y religión, sin que ello conllevara una aportación de genes notable. Para resolver tal disyuntiva hemos de acudir al análisis genético de las poblaciones árabes y beréberes. El análisis de gran cantidad de marcadores (inserciones Alu, microsatélites autosómicos y polimorfismos del cromosoma Y) nos revela una llamativa ausencia de diferencias entre poblaciones árabes y beréberes. Sólo el ADN mitocondrial separa de los beréberes a los árabes argelinos y tunecinos (pero no marroquíes). Debemos concluir, pues, que la arabización del Magreb fue un fenómeno básicamente cultural, en que una reducida elite impuso su lengua y religión, sin que hubiera cambios sustanciales en la población local, incluso la actualmente arabófona. Más allá del Sahara
La comparación de la diversidad genética con la hallada al sur del Sahara
permite rastrear el flujo génico transahariano. En el estudio de las inserciones Alu se advierte con nitidez que las poblaciones más al sur de nuestra zona de trabajo (saharauis y beréberes del sur de Marruecos) muestran distancias genéticas más cortas con las poblaciones subsaharianas que las que se dan entre subsaharianos y poblaciones del norte del Magreb. Tal comprobación nos induce a pensar en un gradiente de flujo génico subsahariano; en el curso del mismo, las poblaciones del sur del Magreb habrían recibido una mayor aportación de genes subsaharianos, lo que, dada su posición geográfica y el conocido comercio de esclavos, parece verosímil. Las regiones genómicas con una filogeografía bien establecida permiten cuantificar la aportación subsahariana. Así, en el norte de Africa aparecen en bajas fr ecuencias (un 8 % en conjunto) los linajes E1* y E3a* del cromosoma Y, de srcen subsahariano; no se han hallado en la península Ibérica. En el caso del ADN mitocondrial , son de srcen subsahariano los linajes L1, L2 y L3, que constituyen una media del 25% de los linajes magrebíes (con un rango entr e 3 % en rifeños y 40% en mauritanos). En la península Ibérica, presentan una frecuencia media del 3 %, oscilando entre su ausencia en vascos y u n 6 % en portugueses del centro. En el caso de TEMAS 38
la Península, es difícil decidir si estos linajes proceden directamente de allende el Sahara, traídos con la trata de esclavos, o si, dada su frecuencia en el Magreb, llegaron a Iberia vía contactos a través del estrecho de Gibraltar. De la comparación entre los datos del ADN mitocondrial y los del cromosoma Y se desprende que los linajes subsaharianos heredados por vía materna se hallan a una frecuencia más elevada en magrebíes e ibéricos que los linajes paternos, lo que indicaría una diferencia entre sexos en la movilidad de los individuos desde
A
M91
B
M60 M1 81
C
RPS4Y M216
D M42 M94 M1 3 9
M174
YAP M145 M203
SRY10832.1
* M33 M132
1 P9 M168
E
M96 P29 2 SRY 4064
E1*
M75
* M2 P1
el sur del desierto deldebe Sahara. Esa observación genética contrastarse con datos sociales de movilidad y comercio de esclavos.
a
P2 3
b
Tráfico en el estrecho de Gibraltar
¿Qué decir, por último, de las relaciones entre las poblaciones magrebíes y las peninsulares? Dejamos constancia al principio de la nítida separación entre ambas poblaciones, debido, probablemente, a un substrato paleolítico distinto. Ese hito temporal permite la detección del flujo génico a través del estrecho, así como su cuantificación a partir de linajes del cromosoma Y y del ADN mitocondrial. Las personas y, si se reproducen, sus genes han cruzado el estrecho de Gibraltar con distinta intensidad a lo largo de la historia. En algunos períodos, dicho flujo aumentó. Además, se trata de una corriente bidireccional, pues también se dio un flujo génico de la Península al Magreb. De norte a sur, cruzaron el estrecho romanos, vándalos, judíos y moriscos. Los dos últimos grupos podrían haber difundido genes ibéricos. Del sur llegaron a Hispania los cartagineses; en el 711 arribaron los árabo-beréberes. En el siglo XII vinieron oleadas de almohades, almorávides y benimerines. Los datos genéticos no permiten precisar cuándo se produjo el tráfico. Sólo pode-
M78
1
M35
M81
2
M123
3
F
*
F* Apt
1
G
M201
H
M52 M69
I
P19 M170
G* *
I*
* a P30
M89 M213 P14
P38 1 b
*
P37.2
1 2
M41.2 M26
I1b2* J*
*
J
M62
1 2
12f2.1
M172
J2*
* 1
K
M9
2
M70
3
M147
L
M20 M22 M11 M61 M4 M5 M1 06 P 35 M189 M186
M N
LLY22g M175 M214
O P
* 1
P27 M45 92R7 M74
Q
M124 P36 MEH2
*
M207
* 2 GENEALOGIA DE LOS LINAJES DEL CROMOSOMA Y. Se representan con R números, a lo largo de las ramas, las distintas mutaciones puntuales conocia 1 das (SNP y pequeñas variaciones de longitud) que han aparecido en el curso de M173 la evolución reciente del cromosoma Y. En los extremos de las ramas se representan los linajes o haplotipos del cromosoma Y hallados en la península Ibérica y en el Magreb. Así, el linaje E3a* se caracteriza por contener los estados derivados de los polib morfismos M42, M168, YAP, SRY4064, P2 y M2, que se han sucedido en este orden desde el antepasado común de todos los cromosomas Y e xistentes (indicado con un pequeño trazo en el extremo superior izquierdo del árbol). Además, se definen grupos de linajes o haplogrupos, designados con una sola letra, de la A a la R; por ejemplo, el haplogrupo E contiene todos los linajes que presenten el estado derivado del polimorfismo SRY4064. Alineados en la base del árbol se muestran los haplogrupos representados en ambas regiones estudiadas. N UEVA GENÉTICA
E3a* E3b* E3b1* E3b2*
*
DYS391p
SRY 10832.2
R1a1* * 1
M18 M37 M65
R1b*
2 P25
4M73 5M126 6M153 7M160 SRY2627
8
R1b3 R1b6 R1b8
95
IT T E P N A R T R E B E M U A J Y S A M O C . D , N U A Z E -L Z E R E P . A , A Z A L P . S , L L E F A L A C . F , H C S O B . E
Magreb
Península Ibérica
IT T E P N A R T R E B E M U A J Y S A M O C . D , N U A Z E L Z E R E P . A , A Z A L P . S , L L E F A L A C . F , H C S O B . E
Conclusiones
(a)
(b)
(c)
3. HISTORIA DE LA POBLACION y linajes del cromosoma Y en el Magreb y la península Ibérica. (a ) La primera colonización del Paleolítico se da independientemente en ambas regiones; introduce en el Magreb (verde ) los linajes E3b*, E3b1* y E3b2*; en la pen ínsula Ibérica (rojo ), los linajes R1a1*, R1b* (que ulteriormente dio lugar a R1b8), R1b3 y R1b6. En los diagramas de sectores se muestra la frecuencia de dichos linajes en cada población. (b ) La expansión del Neolítico, desde el Creciente Fértil y en paralelo por ambas riberas del Mediterráneo, aporta los linajes F*, J*, J2*, I* e I1b2* ( azul ). (c ) Los fenómenos migratorios génico península hacia el Magreb ( en rojo do contrarioimplican (verde ), yflujo desde más desde allá dellaSahara hacia el Magreb ( malva ). ), en senti-
mos descubrir el conjunto acumulado de los intercambios genéticos. Como hemos comentado, el linaje E3b2* del cromosoma Y se srcinó en el Magreb, donde constituye unos dos tercios del total. En España y Portugal, su frecuencia se estima alrededor del 6 %, con mínimos en el Pa ís Vasco y Cataluña y máximos en Extremadura y Andalucía occidental. Dado que el flujo génico del Magreb hacia la Península acarrearía otros linajes, subestimaríamos la contribución genética magrebí de la Península si sólo consideráramos E3b2*; corrigiendo a tenor de la frecuencia de E3b2* respecto al total de linajes del cromosoma Y, la contribución norteafricana al acervo genético ibérico se puede estimar en un 8 %. Al estudiar la variación de microsatélites dentro de este linaje, se observa una estrecha similaridad entre los haplotipos ibéricos y los magrebíes. La variación observada en haplotipos peninsulares pudo haberse acumulado en un intervalo temporal que la hace compatible con 96
las entradas del siglo VIII y, sobre todo, con las del siglo XII . Por lo que respecta al ADN mitocondrial, encontramos un equivalente de E3b2* en U6, de srcen magrebí, aunque menos frecuente. Se halla en un 10 % de los magrebíes y en un 1,5 % de los habitantes de nuestra península. La ausencia de linajes maternos específicamente norteafricanos a frecuencias moderadas o elevadas dificulta la estimación de la contribución femenina magrebí a la península; aunque existe, obviamente. En un sentido inverso, los cromosomas Y del grupo R1b que hay en el Magreb pueden ser de srcen europeo, si bien no podemos precisar que fuera específicamente ibérico. Su frecuencia, del 2,8 % en norteafricanos, alcanza el 78,4 % en ibéricos; ello supone una contribución europea del 3,6 % al acervo genétic o magrebí. Por lo que respecta al ADN mitocondrial, el linaje V, de srcen europeo, se encuentra en una fre cuencia del 6,8 % en norteafrica nos.
La historia nos recuerda las intensas relaciones culturales y sociales que han existido, a lo largo de los siglos, entre el Magreb y la península Ibérica (España y Portugal). Elites o pueblo llano, mercaderes o guerreros, portaban una lengua, una religión, una cultura, en definitiva. Pero hasta ahora se nos mostraba esquivo el impacto demográfico ejercido por esos flujos, que los datos genéticos nos muestran existente pero moderado. Y todavía se debaten los movimientos relacionados con la expansión islámica. Los datos genéticos, con sus limitaciones, han permitido trazar primer marco comparativo entre un ambas orillas del Mediterráneo, con la reconstrucción consiguiente de la historia e intercambios mutuos de sus poblaciones. La genética aporta el marco de la historia demográfica, en cuyo interior hemos de identificar las pruebas de intercambios suministradas por otras disciplinas. Los cambios y sustituciones en el credo religioso, en la lengua o en los perfiles de las excavaciones arqueológicas nos hablan de interrelaciones y desplazamiento culturales. El alcance demográfico de los procesos demográficos asociados a esas transformaciones culturales hallan un correlato genético, cuya magnitud se va desentrañando merced al avance en el conocimiento del genoma. Es una de las múltiples sorpresas que la biología actual nos depara. BIBLIOGRAFIA COMPLEMENTARIA GENETIC STRUCTURE OF NORTHWESTERN AFRICA REVEALED BY STR A NALYSIS . E. Bosch, F. Calafell, A. Pérez-Lezaun, J. Clarimon, D. Comas, E. Mateu, R. Martínez, B. Morera, Z. Brakez, O. Akhayat, A. Sefrani, G. Hariti, A. Cambon-Thomsen y J. Bertranpetit en European Journal of Human Genetics , n.o 8, págs. 360-366; 2000. ALU INSERTION POLYMORPHIS MS IN NW A FRICA AND THE IBERIAN PENINSULA : EVIDENCE FOR A STRONG GENETIC BOUNDARY THROUGH THE GIBRALTAR STRAITS. D. Comas, F. Calafell, N. Benchemsi, A. Helal, G. Lefranch, M. Stoneking, M. A. Batzer, J. Bertranpetit y A. Sajantila en Human Genetics, n.o 107, páginas 2000. ANALYSIS OF HUMAN H312-319; IGH RESOLUTION Y-C HROMOSOME VARIATION SHOWS A S HARP D ISCO NTIN UITY AND L IMITED GENE FLOW BETWEEN NORTHWESTERN A FRICA AND THE IBERIAN P ENINSULA . E. Bosch, F. Calafell, D. Comas, P. J. Oefner, P. A. Underhill y J. Bertranpetit en American Journal of Human Genetics , n.o 68, págs. 1019-1029; 2001.
TEMAS 38