Nueva Nueva Genética
8 3 0 0 0
8 6 6 5 5 3 1 1 4 8 7 7 9
6,50 EURO
o i r a m u S
ADN
4 Topoisomerasas de ADN de tipo II Joaquim Roca
14 Microsatélites de ADN E. Richard Moxon y Christopher Wills
20 Micromatrices de ADN Stephen H. Friend y Roland B. Stoughton
ARN
28 MicroARN César Llave
36 Interferencia de ARN Nelson C. Lau y David P. Bartel
EPIGENETICA
44 El genoma oculto W. Wayt Gibbs
51 El nacimiento de la epigenética W. Wayt Gibbs
58 La evolución codificada Stephen J. Freeland y Laurence D. Hurst
66 Importancia del contexto en la genética H. Frederik Nijhout
GENOMA HUMANO
74 Los comienzos de la industria
del genoma humano Kathryn Brown
79 La fiebre bioinformática Ken Howard
84 El cromosoma de la masculinidad Karin Jegalian y Bruce T. Lahn
90 Genética e historia de las poblaciones
del norte de Africa y la península Ibérica E. Bosch, F. Calafell, S. Plaza, A. Pérez-Lezaun, D. Comas, J. Bertranpetit
AD A DN
) N D A e d a n e d a c ( A M I H S A R A N O M O T ; ) o d n o f ( A C O R M I U Q A O J
Topoisomerasas de ADN de tipo II Mediante cortes Mediante cortes momentáneo momentáneoss en las cadena cadenass del ADN ADN las topoiso topoisomerasas merasas de tipo II modulan la torsión de la molécula y eliminan los anudamientos que se generan en la doble hélice durante los procesos de actividad genética Joaquim Roca
C
uando en los años cincuenta se Zarcillos descubrió la estructura del Además Adem ás de mant mantener enerse se unidas por el ADN, el sop soport ortee de la inf inforor- apareamiento de las bases nucleotímación genética pasó a ser un objeto dicas, las dos cadenas de la doble tangible. La complementariedad en- hélice de ADN se enroscan en zarcitre las bases nucleotídicas de las llos muy cerrados. Cada cadena gira cadenas que forman la doble hélice en sentido dextrógiro alrededor de la de ADN y la elucidación del código otra con un paso de hélice cercano a genético escrito en la secuencia de 3,4 nanómetros, lo que implica 10,5 dichas bases establecieron los fun- pares de bases en cada giro aproxidamentos de la biología moderna. madamente. El grado de enzarcillaDesde entonces, se ha trabajado sin miento se expresa mediante el número descanso en los mecanismos mole- de enlace, un parámetro topológico culares implicados en la replicación, transcripción, recombinación y reparación del ADN. Queda por averiguar la modulación de esos procesos y su integración con otras funciones de la vida celular. En este ámbito, uno de los aspectos de mayor repercusión biológica lo ofrece la estructura del ADN: su organización espacial y su topología. La doble hélice de ADN tiene un diámetro de 2 nanómetros (dos milmillonésimas partes de un metro), pero su longitud puede abarcar varios centímetros si se trata de una molécula con millones de bases nucleotídicas. nucleotídic as. Tal disparidad entre diámetro y longitud del ADN nos adelanta ya cuán condensado se halla en el interior celular, donde forma los cromosomas. En cada cromosoma, la longitud del ADN se comprime diez mil veces, lo que equivale a recoger en nuestro puño un finísimo hilo de un kilómetro de largo.
cuyo valor aumenta una unidad cada vez que una cadena completa un giro alrededor de la otra. Así, por cada mil pares de bases el número de enlace entre las cadenas del ADN adquiere un valor cercano a cien. La enorme longitud del ADN, junto al intenso enroscamiento de las cadenas de la doble hélice, genera constantes problemas topológicos dentro del minúsculo espacio celular. Así, durante su replicación, las dos cadenas de ADN de cada cromosoma deben
A C O R M I U Q A O J
1. LA EXISTENCIA DE MOLECULAS DE ADN circulares se conoce por microscopía elec-
La condensación del ADN está de- trónica desde los años sesenta. Curiosamente, se observa que muchas de esas molécuterminada mediante precisos meca- las se encuentran retorcidas sobre sí mismas (izquierda ).). Adoptaban una estructura sinismos moleculares. La doble hélice milar a la de un tubo de goma cuando, antes de unir sus extremos, hacemos girar varias se retuerce sobre sí misma una y veces uno de ellos. Hoy sabemos que este exceso de torsión o superenrollamiento otra vez dibujando hélices y tejiendo ocurre en todas las moléculas de ADN en el interior de las células. Ello es debido a que fibras cada vez más complejas. De el número de enlace entre ambas cadenas de la doble hélice presenta en promedio un son capaces de eliminar esa torsión mediante cortes un modo paralelo se agrupan, entre déficit del 5 %. Las topoisomerasas son sí, segmentos de ADN distantes momentáneos en segmentos del ADN, entre los cuales provocan el paso de otros segvarios miles de pares de bases para mentos. La repetición de este proceso permite recuperar el valor normal del número de enlaces y el ADN queda más relajado (derecha ). ). formar grandes asas o lazos. 4
TEMAS 38
a
A C O R M I U Q A O J
b
a OH
G T
OH
b
T
O O-P=O O –
G
OH-3'
3'-HO
O – O=P-O O
c
+ ATP
G O O=P-O O – 3'-HO
OH-3' O – O=P-O O
desenlazarse del todo, para condensarse de nuevo en cromosomas independientes; lo que requiere reducir a cero el número de enlace entre las cadenas de ADN en el cromosoma original. De no ser así, al terminar la replicación, las nuevas moléculas de ADN AD N pe pers rsis isti tirí rían an en enza zarc rcil illa lada dass o encadenadas entre sí. N UEVA GENÉTICA
2. LAS TOPOISOMERASAS DE TIPO II son enzimas homodiméricas. Transportan una doble hélice de ADN, o segmento T (en rojo ), ), a través de un corte transitorio en otra doble hélice de ADN, o segmento G (en verde ). ). Para cortar ambas cadenas del ADN, la topoisomerasa ataca dos enlaces internucleotídicos separados por cuatro pares de bases (A ). La escisión consiste en una transesterificación reversible; en el curso de la misma se forma un intermediario covalente entre el fosfato del extremo 5’ del ADN y un aminoácido tirosina en cada mitad de la enzima. En presencia de ATP, la topoisomerasa transporta otro segmento de ADN a través del segmento escindido. Si el segmento G y el segmento T residen en moléculas de ADN dis tintas, la topoisomerasa encadenará enc adenará o desencadenará dichas moléculas de ADN (B ,a ). ). Si ambos segmentos se hallan en la misma molécula de ADN, la topoisomerasa producirá cambios en el grado de superenrollamiento (b ) o de anudamiento (c ) de dicha molécula.
Superenrollamiento
En los años sesenta del siglo pasado se produjo un descubrimiento sorprendente en la topología del ADN. Se hallaron moléculas de ADN circulares. Retorcidas sobre sí mismas de una manera singular, recuerdan la figura de un tubo de goma cuando, al unir sus extremos, hacemos girar
varias veces uno de ellos. En el caso del ADN, este superenrollamiento es consecuencia de la torsión generada por un exceso, o por un defecto, del valor del número de enlace entre ambas cadenas de la doble hélice. Sabemos hoy que la torsión constituye un fenómeno ubicuo en el ADN intracelular, que presenta en pro5
A C O R M I U Q A O J
ATP
Y
400
TOPO II
DIMERO
1200
C
N
(Top2)
TOPO IV
N
C
(ParE)
Girasa
(ParC)
N
C
(GyrB)
(GyrA)
3. CARACTER UBICUO DE LAS TOPOISOMERASAS de tipo II. Las ParC , y la girasa por los genes GyrB y GyrA. La estrecha homoloencontramos en células eucariotas, procariotas y en numerosos gía en su secuencia de aminoácidos (zonas rectangulares ) nos revirus. Cada mitad de la enzima consta de una o más subunidades, vela que todas las topoisomerasas de tipo II guardan parentesco codificadas por genes independientes. En los eucariotas, las to- evolutivo y poseen estructuras muy similares. El dominio responpoisomerasas de tipo II, o TOPOII, forman dímeros de una proteína sable de la unión e hidrólisis del ATP (en rojo ) ocupa la región amide 170 kilodalton (unos 1400 aminoácidos) codificada por el gen no terminal (N) de la enzima, mientras que el dominio principal de Top 2. En bacterias, las topoisomerasas de tipo II constituyen te- dimerización se halla cerca de la región carboxiterminal (C ). En la trámeros, integrados por dos pares de subunidades proteicas. Por figura se indica la posición de la tirosina (Y) involucrada en el c orejemplo, en E. coli la TOPO IV es codificada por los genes ParE y te y sellado del ADN.
medio un déficit del 5 % en el valor de su número de enlace. En moléculas de ADN circulares, esta torsión no puede disiparse mientras no se produzcan cortes en las cadenas que permitan a sus extremos rotar libremente. En moléculas lineales de ADN de gran longitud, la torsión queda confinada a dominios discretos entre las estructuras que las mantienen condensadas. Los cambios de torsión y superenrollamiento generados en la doble hélice determinan la conformación local del ADN a lo largo del cromosoma; influyen de un modo notable en la transcripción y recombinación del genoma. La célula debe disponer de mecanismos para eliminar los encadenamientos y anudamientos generados en el ADN, así como para modificar el número de enlace de la doble hélice y modular, por ende, su grado de torsión y superenrollamiento. Tales mecanismos tendrían que operar cortando las cadenas del ADN para que las atrave saran otras cadenas, con la consiguiente restauración de la continuidad de las cadenas escindidas.
en el transcurso de los años setenta Las topoisomerasas de tipo IA corse descubrió que las hoy denomina- tan y empalman cadenas aisladas de das topoisomerasas se bastaban para ADN; forman el intermediario covaalterar la topología del ADN ( véase lente con el cabo 5’ del segmento escin“Topoisomerasas de ADN”, por James dido. Las de tipo IB cortan y empalC. Wang, en INVESTIGACIÓN Y CIENCIA , man una de las cadenas en una doble septiembre 1982). hélice de ADN; establecen el interDos rasgos distintivos caracteri- mediario covalente con el cabo 3’ de zan a esas enzimas. En primer lugar, la cadena escindida. Por último, las pueden cortar y empalmar repetida- topoisomerasas de tipo II cortan y mente los enlaces fosfodiéster que empalman ambas cadenas de una unen los nucleótidos constituyentes doble hélice simultáneamente, forde las cadenas de ADN. En segundo mando intermediarios covalentes con lugar, permiten que otras cadenas de los cabos 5’. A diferencia de las dos ADN pasen entre los dos cabos mo- primeras, las topoisomerasas de timentáneamente escindidos. Para evi- po II son enzimas homodiméricas, es tar que los cabos del ADN escindido decir, se constituyen con dos mitades vayan a la deriva, las topoisomera- idénticas; requieren ATP para su funsas los sujetan con firmeza, mientras cionamiento. otras cadenas de ADN los atraviesan. En el desempeño de esa tarea, Enzimas fascinantes las topoisomerasas utilizan la ener- Resulta sorprendente que unas simgía del enlace internucleotídico escin- ples proteínas puedan cortar momendido para unirse covalentemente al táneamente el ADN y sostener los cabo 3’ o 5’ del ADN. Cuando empal- extremos escindidos mientras transman nuevamente el ADN, revierte portan otro segmento de ADN a traesa unión covalente: restablecen el vés de ellos. A este respecto, las toenlace internucleotídico inicial. poisomerasas de tipo II provocan La comparación de las propiedades auténtica fascinación; téngase precatalíticas y de la secuencia de ami- sente que, al cortar las dos cadenas noácidos lleva a una clasificación de de la doble hélice, ponen en continuo Topoisomerasas las topoisomerasas en tres tipos o gru- aprieto la integridad del genoma. Si bien se esperaba que en ese deli- pos evolutivos distintos: topoisomeInteresado por el mecanismo de accado proceso modificador participa- rasas de tipo IA, topoisomerasas de ción de las topoisomerasas de tipo II, ran varias actividades enzimáticas, tipo IB y topoisomerasas de tipo II. me incorporé, en 1988, al laboratorio 6
TEMAS 38
de James Wang en la Universidad de Harvard. Desde finales de los años setenta se conocía la actividad de estas enzimas. En varios tipos de células y bacterias se detectó una actividad enzimática, que en presencia de ATP y magnesio, era capaz de encadenar o anudar moléculas de ADN circulares, así como de alterar el número de enlace de la doble hélice de dos en dos unidades. Cuando se suspendía dicha actividad mediante detergentes o cambios bruscos de pH, se producían cortes irreversibles en ambas cadenas del ADN. No cabía duda de que las enzimas en cuestión constituían un tipo de topoisomerasas que transportaban una doble hélice de ADN a través de un corte transitorio en otra doble hélice de ADN. Segmento G, segmento T
Si la doble hélice cortada, o segmento G (de “gate” o puerta), y la doble hélice transportada, o segmento T, residen en moléculas de ADN distinta s, tal es topoiso mera-
sas producen un encadenamiento o desencadenamiento entre tales moléculas. Si ambos segmentos, G y T, pertenecen a la misma molécula de ADN, las topoisomerasas alteran el número de enlace en dos unidades, en cada ciclo de transporte; de lo que resulta un cambio del grado de superenrollamiento o de anudamiento del ADN. Estas modificaciones topológicas condicionan el volumen, forma y rigidez de las moléculas de ADN; son, pues, fácilmente detectables en el laboratorio mediante técnicas de sedimentación o electroforéticas. En el transcurso de los años ochenta, varios laboratorios purificaron topoisomerasas de tipo II procedentes de virus, procariotas y organismos eucariotas. En todos los casos, se manifestaba una estrecha seme janza en sus propiedades bioquímicas. Cuando se identificaron los genes codificantes de estas proteínas, la homología en su secuencia de aminoácidos reveló que todas las topoi-
ATP
AMPPNP
NH2
N O O O HC | | | O - P - O - P - O - P - O - CH2 N | | | O O O O H OH OH
C C
C N
NH2
N O O O HC | | | O - P - N - P - O - P - O - CH2 N | | | | O O H O O
N CH
C C
C N
N CH
H
No hidrolizable
Hidrolizable
A
somerasas de tipo II guardaban un parentesco evolutivo y debían, por tanto, compartir los mismos rasgos estructurales y funcionales. Las topoisomerasas de tipo II son enzimas homodiméricas de un tamaño cercano a 350 kilodalton. Según el organismo, cada mitad de la enzima constará de una o más subunidades codificadas por genes independientes. Así, en levaduras, la mosca de la fruta o células humanas, es decir, en los eucariotas, las topoisomerasas de tipo II son dímeros de una proteína de unos 170 kilodalton (unos 1400 aminoácidos aproximadamente). En bacterias, las topoisomerasas de tipo II constituyen tetrámeros formados por dos pares iguales de subunidades proteicas, dos de 80 kilodalton y dos de 90 kilodalton. Por fin, en los virus bacterianos, esas enzimas son hexámeros integrados por tres pares de subunidades. El análisis de los cortes producidos en el ADN por las topoisomerasas de tipo II permitió d escubrir que
B
OH
OH
C
AMPPNP
A C O R M I U Q A O J
4. LA UTILIZACION DE MOLECULAS ANALOGAS AL ATP resultó decisiva para entender el papel de este cofactor energético en el mecanismo de acción de las topoisomerasas de tipo II. Una de ellas es el AMPPNP, un imido derivado del ATP que no puede hidrolizarse. La unión del AMPPNP a las topoisomerasas de tipo II provoca un cambio de conformación: la enzima se convierte en un anillo proteico al-
N UEVA GENÉTICA
rededor del ADN. En moléculas de ADN circulares, la topoisomerasa queda así permanentemente anclada en la doble hélice, aunque puede deslizarse con libertad a lo largo de la misma (A ). Si el ADN es lineal, la topoisomerasa puede disociarse, o engarzarse de nuevo, a través de sus extremos (B ). Sólo el ADN ubicado en el interior del anillo se halla expuesto a ser cortado por la topoisomerasa (C ).
7
A C O R M I U Q A O J
AMPPNP
G a
T b
e
d
c
5. CUANDO UNA TOPOISOMERASA DE TIPO II entra en interacción anillo proteico (d ). Dado que el segmento G permanece unido a la con un par de círculos encadenados (a ), la unión del AMPPNP pro- enzima a lo largo del proceso, el segmento T debe ser capturado, voca un episodio de transporte de ADN (b ), que terminará por soltar transportado y expulsado del interior del anillo proteico por el lado los círculos (c ). Al final del proceso, el círculo utilizado como seg- opuesto al que ha entrado. Mediante la creación en el laboratorio mento G (en verde ) permanece esposado por la topoisomerasa; el de un enlace disulfuro en la compuerta de salida, puede bloquearcírculo utilizado como segmento T (en rojo ) queda libre fuera del se selectivamente la expulsión del segmento T (e ).
éstas se unían covalentemente al fos- lo que sugiere que cada mitad de la Para estudiar la función del ATP fato del cabo 5’ en cada cadena de la enzima une e hidroliza una molécula en el proceso de transporte, fue clave doble hélice mediante una tirosina. de ATP. la utilización de moléculas análogas En el caso de la topoisomerasa de al ATP que no pueden hidrolizarse o tipo II de la levadura Saccharomyces Función del ATP bien lo hacen con suma parsimonia. el aminoácido ocupa la Resultó interesante advertir que el Ahora bien, cuando estos análogos se cerevisiae posición 783. En nuestras investiga- consumo de ATP no dependía de que unen a la topoisomerasa, en vez del ciones nos servíamos de esa enzima el transporte de ADN conllevara un ATP, permiten a cada enzima realiparticular por razones prácticas: aumento o una pérdida de energía zar un solo ciclo de transporte de ADN. podíamos purificarla, entera o frag- libre en el estado topológico del ADN. Basta, pues, la mera unión del ATP mentada, en gran cantidad y permi- La mayoría de las topoisomerasas de para desencadenar el transporte del tía la manipulación genética de su tipo II tienden siempre a simplificar segmento T. Además, la energía libesecuencia de aminoácidos. la topología del ADN, llegando a rada por la hidrólisis del ATP debe Iniciamos nuestros experimentos alcanzar valores de equilibrio incluso utilizarse para regenerar la capaciabordando uno de los aspectos fun- por debajo de los impuestos por la dad que tiene la topoisomerasa de inicionales más intrigantes de las topoi- fluctuación térmica; es decir, mini- ciar un nuevo ciclo de transporte. somerasas de tipo II: su utilización mizan el superenrollamiento, desaEn 1986, Neil Osheroff observó que del ATP. La región responsable de la nudan y desencadenan con gran efi- la adición de AMPPNP, un análogo unión e hidrólisis de ATP se encuen- ciencia las moléculas de ADN. no hidrolizable del ATP, incrementra en los primeros 300 aminoácidos La única excepción a este respecto taba enormemente la fuerza de unión de la proteína. En ausencia de ATP la encontramos en la girasa de ADN. entre las topoisomerasas de tipo II y o en enzimas con mutaciones en el Como comentaré más adelante, la gi- moléculas circulares de ADN. Esta sitio de unión para este cofactor ener- rasa es una topoisomerasa de tipo II unión era resistente a altas concengético, no cataliza el transporte del especializada en reducir el número traciones de sal, pero no se trataba segmento T, si bien la topoisomerasa de enlace de la doble hélice; por tanto, de un enlace covalente, puesto que mantiene su capacidad para cortar sólo relaja el superenrollamiento posi- podía disolverse mediante la aplicay empalmar las cadenas del segmen- tivo y genera superenrollamiento ción de detergentes. to G. Estimamos que las topoisome- negativo en el ADN. El consumo de Paralelamente, en nuestro laborasas de tipo II consumen dos molé- ATP de la girasa no deja de ser, sin ratorio, Janet Lindsley observó que culas de ATP en cada operación de embargo, similar al de otras topoi- el AMPPNP modificaba la sensibilitransporte de un segmento de ADN, somerasas de tipo II. dad de estas enzimas a determina8
TEMAS 38
das proteasas. Cuando posterior- tanto, el diámetro interno del anillo mente realicé experimentos simila- debería ser inferior a ocho nanómeres, comprobé que la unión del ATP tros, un tamaño insuficiente para frano sus análogos a las topoisomerasas quear el paso a una doble hélice de de tipo II producía un cambio en su ADN doblada sobre sí misma. Como conformación, de modo que la enzima únicamente el ADN ubicado en el intese convertía en un toro o anillo pro- rior del anillo era susceptible de ser teico alrededor del ADN. A partir de cortado por la topoisomerasa, el cenaquí, sólo la hidrólisis del ATP per- tro de corte y sellado del ADN debía mitía a la enzima recuperar su con- encontrarse en el perímetro interior formación inicial. de la enzima. Cuando el anillo estaba cerrado, podía deslizarse con libertad a lo largo Proceso de transporte del ADN, pero sólo se disociaba a tra- ¿Qué relación hay entre los cambios vés de sus extremos; por ello, en molé- estructurales, provocados por la unión culas de ADN circulares la topoiso- e hidrólisis del ATP, con el proceso merasa quedaba permanentemente de transporte del ADN? Antes de resesposada a la doble hélice. Si el ani- ponder a la pregunta, había que resolllo se formaba sin ADN en su interior, ver otra cuestión: de qué modo una podía entonces enhebrar en él una topoisomerasa de tipo II podía manimolécula de ADN lineal y, luego, crear pular los segmentos G y T durante el un círculo empalmando sus extremos. proceso de transporte. Sólo una molécula de ADN lineal podía Se me presentaban varias opcioenhebrarse a través del anillo; por nes. Una posibilidad era que la enzima
se uniese primero al segmento T y, luego, al segmento G. En esta configuración, la topoisomerasa expulsaría al segmento T, a través del corte transitorio generado en el segmento G. Otra posibilidad sería que la enzima se uniera primero al segmento G y a continuación al segmento T, con lo que el proceso de transporte tendría que ir desde el exterior hacia el interior de la topoisomerasa. En este caso, la enzima se disociaría del segmento G en cada ciclo de transporte, para permitir la salida del segmento T de su interior, a no ser que el segmento T escapase del interior de la topoisomerasa por un sitio distinto del que había entrado. Había pues tres mecanismos posibles: transporte del interior al exterior, transporte desde el exterior hacia el interior con una sola puerta de entrada y salida, o bien con puerta de entrada y salida distintas. A C O R M I U Q A O J
6. RECOMPOSICION DE LA ESTRUCTURA ATOMICA de las topoisomerasas de tipo II a partir de dos fragmentos de estructura conocida. El primer fragmento (en rojo ), de 43 kilodalton, comprende los primeros 398 aminoácidos de la subunidad B de la girasa de E. coli . El segundo fragmento (en amarillo y azul ), de 92 kilodalton, abarca los aminoácidos 410 a 1202 de la TOPO II de la levadura S. cerevisiae . El fragmento de 43 kilodalton es el dominio que dimeriza modulado por la unión e hidrólisis del ATP, mientras que el fragmento de 92 kilo-
N UEVA GENÉTICA
dalton posee los dominios responsables del corte y sellado del ADN; muestra éste en la parte inferior de su estructura la principal región de dimerización de la topoisomerasa. El panel de la izquierda ofrece la representación atómica completa; el de la derecha, el plegamiento de las cadenas de aminoácidos. Se distingue la posición en el interior de las tirosinas (en rojo ) involucradas en el corte y sellado del ADN, así como la ubicación del ATP (en verde ) que estabiliza la dimerización del dominio amino terminal de la enzima.
9
7. CONOCIDA LA ESTRUCTURA ATOMICA de la principal región de dimerización de la topoisomerasa, fue posible crear mediante ingeniería genética un enlace disulfuro en esa zona. Para ello se sustituyó el aminoácido lisina de la posición 1127 y el aminoácido asparagina de la posición 1043 por cisteínas. La formación de un enlace covalente entre los átomos de azufre de las cisteínas, así creadas en tre ambos lados del dímero, bloqueaba la salida del segmento T del ADN. Este enlace covalente podía eliminarse mediante oxido-reducción y en este caso el segmento T era capaz de salir del interior de la topoisomerasa. Este experimento demostraba inequívocamente que el segmento T del ADN cruzaba totalmente las dos mitades de la topoisomerasa durante cada ciclo de reacción.
A C O R M I U Q A O J
Para descubrir cuál de los modelos era correcto, analicé la interacción entre la topoisomerasa y mezclas de ADN circulares de distinto tamaño. Al añadir AMPPNP para provocar un ciclo de transporte en cada enzima, algunos de los círculos de ADN inicialmente unidos a la topoisomerasa se encadenaban en un segundo grupo de círculos. Observé que los segmentos G y T habían de estar presentes antes de que se produjera el cambio conformacional de la topoisomerasa, ya que los círculos añadidos posteriormente al AMPPNP nunca se agregaban a la cadena. Con estos experimentos se concluía que el segmento G era el primero en unirse en el interior de la topoisomerasa y no el segmento T. Asimismo, se sugería que la conformación en anillo generada por la 10
unión del análogo de ATP servía para capturar el segmento T, llevándolo desde el exterior hacia el interior de la enzima, en donde era transportado a través del segmento G. Si realizaba esos experimentos con una topoisomerasa incapacitada para transportar ADN, debido a una mutación en las tirosinas del centro de corte, la enzima seguía uniendo al segmento G en su interior, pero el segmento T no quedaba capturado al cerrarse el anillo. De lo que se desprendía que el proceso de captura y el de transporte se hallarían estrechamente acoplados. ¿Qué ocurre una vez que el segmento T ha cruzado el segmento G? Para averiguarlo construí moléculas de ADN circulares encadenadas por pares y uní una topoisomerasa a cada
pareja de círculos. La adición de AMPPNP pr ovocaba entonces un evento de transporte en cada topoisomerasa, que resultaba en la liberación de su pareja de círculos. Observé que, una vez desencadenados, el círculo utilizado como segmento T siempre aparecía libre fuera del toro proteico; en cambio, el círculo utilizado como segmento G permanecía esposado por la topoisomerasa. De ello se infería que, e n cuanto el segmento T era capturado y transportado, se expulsaba de inmediato del anillo proteico. Dado que el segmento G seguía unido a la topoisomerasa durante todo el proceso, el segmento T debería forzosamente salir de la enzima por el lado opuesto por el que había entrado. Llegué así a la conclusión de que las topoisomerasas de tipo II funcionaban mediante un mecanismo de dos compuertas: una de entrada y otra de salida. El mecanismo de apertura y cierre de la compuerta de entrada estaría modulado por el uso de ATP. Por su parte, la compuerta de salida actuaría a modo de válvula de escape. Una vez la topoisomerasa se uniera a un segmento G, el enlace del ATP provocaría el cierre de la compuerta de entrada, lo que permitiría capturar el segmento T. El segmento T viajaría entonces entre las dos mitades de la enzima, cruzando en su trayecto el corte transitorio en el segmento G. Terminaría expulsado por el lado opuesto, a través de la fugaz apertura de la compuerta de salida. Pese a su demostración experimental, el modelo de dos compuertas fue recibido con cierto escepticismo. Niega este mecanismo que exista ningún contacto permanente entre las dos mitades de la topoisomerasa, tesis que parecía muy arriesgada, habida cuenta de que, cuando la topoisomerasa corta el ADN, cada mitad de la TEMAS 38
enzima tiene que sujetar uno de los cabos del ADN escindido. No obstante, la validez de nuestro modelo se confirmó en cuanto se conoció la estructura tridimensional de las topoisomerasas de tipo II.
tacta su pareja por arriba a través de Posteriormente, se obtuvieron crisla región amino terminal y, con mayor tales de este fragmento, en los que amplitud, a través de la región car- las tirosinas aparecían a la distanboxi terminal por abajo, lugar que cia esperada para realizar el corte corresponde a la principal región de del segmento G, lo que conlleva una dimerización de la topoisomerasa. En importante reducción del diámetro la región amino terminal se perfila de la cavidad central. La aproximaEstructura tridimensional una hendidura rica en cargas positi- ción y separación de las tirosinas se de la enzima vas, que cruza el dímero transversal- explican por la flexibilidad de la prinEn 1991, Anthony Wigley, de la mente y en cuyo interior protruyen cipal región de dimerización de la Universidad de Leicester, cristalizó las tirosinas involucradas en el corte topoisomerasa. y representó la estructura tridi- y sellado del ADN. De todo ello se desmensional de los primeros 398 ami- prendía que el segmento G se acomoda Un primer modelo físico noácidos del extremo amino termi- a lo largo de dicha hendidura. Sin Podíamos ya esbozar un primer monal de la subunidad B de la girasa embargo, la distancia entre las tiro- delo físico de una topoisomerasa II de la enterobacteria Escherichia coli. sinas era aquí superior a la necesaria con capacidad funcional. Bastaba con En este fragmento de 43 kilodalton, para que la topoisomerasa pudiera conectar el extremo carboxi terminal que se conserva en todas las topoi- cortar ambas cadenas de una doble del dominio de 43 kilodalton con el somerasas de tipo II, se encuentra la hélice simultáneamente. Por ello, se extremo amino terminal del fragregión responsable de la unión e concluyó que este fragmento había mento de 92 kilodalton, alineando los hidrólisis del ATP. Los intentos ini- cristalizado en la conformación corres- ejes de simetría de ambos dímeros. ciales de obtener la cristalización pondiente al momento en que la topoi- La estructura resultante concordaba exclusiva del fragmento en cuestión somerasa ha cortado y separado los con la que habíamos anticipado por fracasaron. cabos del segmento G. medios bioquímicos. Permitía, adePero no tardó en demostrarse que, si se añadía AMPPNP, el fragmento formaba un dímero tenaz, que cristalizaba con facilidad. La estructura del dímero revela que los tres fosfatos del AMPPNP (o ATP en su caso) ATP coordinan la posición de varios amiADP + P noácidos involucrados en la dimerización del fragmento. Esta estructura sugería que la unión y la hidrólisis a de ATP modulaba la dimerización y separación entre los extremos amino terminal de la enzima; lo que, en el marco de nuestro modelo, debería constituir la compuerta de entrada de la topoisomerasa. En 1994, James Berger y Stephen d b Harrison, en nuestro departamento de Harvard, cristalizaron y obtuvieron la estructura de un fragmento notable, que comprendía los aminoácidos 410 a 1202 de la topoisomerasa tipo II de S. cerevisiae. La estructura de este fragmento de 92 kilodalton c aportó valiosa información: contenía las tirosinas en posición 783 que intervenían en el corte y sellado del segmento G; incluía la región principal de dimerización de la topoisomerasa, que, de acuerdo con nuestro modelo de dos compuertas, debería ser cruzada en algún momento por el segmento T; por último, este fragmento 8. EL CONJUNTO DE INFORMACION ESTRUCTURAL Y FUNCIONAL permite esbozar un mocomplementaba al dominio amino ter- delo de una topoisomerasa tipo II activo. Cuando la topoisomera sa interacciona con el ADN, minal resuelto anteriormente, de acomoda primero en su interior al segmento G (en verde ) y queda a la espera de la aparimodo que una estructura compuesta ción del segmento T (en rojo ) (A ). La unión del ATP provoca la dimerización de los domipor ambos fragmentos poseía toda la nios amino terminales (en púrpura ); el cierre de esta compuerta captura al segmento T hacapacidad funcional de una topoiso- cia el interior de la enzima (B ). En su trayecto, el segmento T se abre paso a través del corte merasa de tipo II. producido en el segmento G y alcanza la cavidad central de la topoisomerasa. Al sellarse El fragmento de 92 kilodalton cris- de nuevo el segmento G, se estrecha el diámetro de la cavidad central; el segmento T se ve talizó en la forma de un dímero toroi- entonces forzado a salir de la misma cruzando la principal región de dimerización de la endal de 12 12 5,5 nanómetros, cuyo zima (C ). Una vez la compuerta de salida ha vuelto a cerrarse (D ), la hidrólisis del ATP perhueco interior tenía un diámetro medio mite a la topoisomerasa adquirir su configuración inicial para empezar un nuevo ciclo de de 5 nanómetros. Cada protómero con- transporte de ADN. ×
×
N UEVA GENÉTICA
11
A C O R M I U Q A O J
A C O R M I U Q A O J
9. LA GIRASA es una topoisomerasa de tipo II. Una vez se une al segmento G, dobla el ADN en sentido dextrógiro; con ello se apropia del segmento T que debe transpor tarse. Esa es la causa de que la girasa utilice siempre segmentos G y segmentos T ubicados en la misma molécula de ADN y transporte unos a través de otros en el mismo sentido. De ese modo, la enzima sólo puede eliminar la superhelicidad positiva (+) y generar selectivamente superhelicidad negativa (–) en el ADN. Al margen de su especialización, la girasa funciona y consume el ATP igual que cualquier otra topoisomerasa de tipo II.
su camino al segmento G. Alcanzada la posición, el segmento T sólo salía del interior del anillo proteico cuando revertían los enlaces covalentes que impedían la fugaz apertura de la principal región de dimerización. Girasa de ADN
(+)
más, modelar a la perfección el mecanismo de dos compuertas. En efecto, antes de unirse al ADN, la topoisomerasa tendría una conformación abierta en forma de “v”, con la principal región de dimerización ubicada en el vértice y sito cada uno de los dominios de unión del ATP en la punta de las aristas. Al interaccionar con el ADN, la topoisomerasa acomoda primero en su interior al segmento G; queda a la espera de que un segmento T se aproxime a la compuerta de entrada. La unión de ATP provoca el cierre de esta compuerta, lo que resulta en la captura del segmento T. En su trayecto desde el exterior hacia el interior de la enzima, el segmento T se abre paso a través del corte producido en el segmento G y alcanza la cavidad central de la topoisomerasa. Al sellarse de nuevo el segmento G, se reduce el espacio en la cavidad central y el segmento T es forzado a salir de la misma, encontrando su única puerta de salida en la principal región de dimerización de la enzima. Terminado este proceso, la hidrólisis del ATP provoca la rea12
(-)
Si bien las topoisomerasas de tipo II son un alarde de nanomecánica, algunas encierran un grado particular de complejidad. Sucede con la girasa de ADN, una topoisomerasa de tipo II ubicua en las bacterias. La girasa sólo puede reducir el número de enlace del ADN; gracias a ello, elimina de forma selectiva superhelicidad positiva y genera superhelicidad negativa en el ADN. Para cumplir esa función, emplea siempre segmentos G y segmentos T contiguos en la misma molécula de ADN; y siempre transporta unos a través de otros en el mismo sentido. La base estructural de semejante preferencia radica en el modo de interacción entre la girasa y el ADN. Una vez unida al segmento G, la topoisomerasa dobla el ADN en sentido dextrógiro, con lo que se proporciona a sí misma el segmento T que debe ser capturado. A partir de aquí, la girasa opera como todas las topoisomerasas de tipo II.
pertura de la compuerta de entrada y permite a la enzima iniciar un nuevo ciclo de transporte. Apoyados en la información estructural, diseñamos un experimento que demostraba que el segmento T salía del interior de la enzima por el lado opuesto al que había entrado, tras cruzar la interfase entre las dos mitades de la topoisomerasa. Sustituimos algunos de los aminoácidos de la región principal de dimerización por cisteínas, con el fin de que pudieran Aplicaciones formarse enlaces covalentes entre El avance en los estudios estructuátomos de azufre entre ambos lados rales y funcionales u operativos de las del dímero. Dado que la formación de topoisomerasas de tipo II repercute estos enlaces puede modularse me- en varios ámbitos. En el campo de la diante oxido-reducción, podíamos con- enzimología, estas proteínas repretrolar la apertura o el cierre perma- sentan una de las máquinas molenente de la supuesta puerta de salida culares más refinadas y sobresaliendel segmento T. tes. En cuanto a sus implicaciones Cuando utilicé esta topoisomerasa biológicas, conocemos mejor cómo se para desengarzar parejas de anillos eliminan los encadenamientos y anude ADN, observé que, una vez apre- damientos entre cromosomas, así hendido y transportado, el segmen- como la modulación de la superhelito T se sitúa en la cavidad central de cidad del ADN intracelular. la topoisomerasa. Eso significa que Por último, incide en el avance de ha entrado por arriba y cruzado en la farmacología clínica. Numerosos TEMAS 38
A C O R M I U Q A O J
H H3 C
O
NHSO2 CH3
O O
COOH
O HO
H3 C
O H
HO
N
N
H3 CO
O
NH O
C2 H5
O
Acido nadilíxico (Quinolona)
O Etoposido (Epipodofilotoxina)
N m-AMSA (Aminoacridina)
OCH3
H3 CO OH CH3
CH3 CH3 O
O
O
OH
O
O
OH
OH
N-C H O
CH3 CH3
Novobiocina (Coumarina)
10. NUMEROSOS COMPUESTOS de interés farmacológico alteran la actividad de las topoisomerasas de tipo II. En su operación emplean mecanismos diversos. La mayoría de tales medicinas atentan con tra el proceso de corte y sellado del segmento G; inducen, en particular, que las topoisomerasas de tipo II produzcan roturas en el ADN. Pertenecen a ese grupo las quinolonas (ácido nadilíxico, norfloxacina y ciprofloxacina), que desarrollan una potente actividad antibiótica. Otros fármacos de estructura química muy distinta, como las
antibióticos y drogas antitumorales ejercen sus efectos porque alteran de modo específico la actividad de las topoisomerasas de tipo II. La explicación es sencilla. Tales enzimas constituyen un auténtico “talón de Aquiles” para la viabilidad celular. Su mal funcionamiento genera el caos en la topología del ADN y roturas irreversibles en el genoma, lo que aboca en la muerte celular. Las células que se caracterizan por una alta tasa de proliferación (por ejemplo, las tumorales o las bacterias) poseen una elevada actividad topoisomerásica y son, por tanto, las más susceptibles a drogas que afectan a estas enzimas. Hoy conocemos múltiples compuestos que, mediante distintos mecanismos, alteran la actividad de las topoisomerasas de tipo II. La mayoría de estas drogas inciden de una forma selectiva en el proceso de corte N UEVA GENÉTICA
O
O
CH3 H2 N-C-O
CH3
HN O
NCH
CHN
CH3
NH O
ICRF-193 (Bisdioxopiperacina)
aminoacridinas y epipodofilotoxinas, alteran el sellado del ADN; se prescriben por su eficacia en la terapia antitumoral. Las coumarinas (grupo en el que se integran la novobiocina, coumericina y clorobiocina) impiden la unión del ATP a las topoisomerasas de tipo II. Hay, por último, compuestos que bloquean los movimientos de la topoisomerasa durante el transporte de ADN. Las bisdioxopiperacinas, por ejemplo, impiden la reapertura de la compuerta de entrada de las topoisomerasas de tipo II.
y sellado del segmento G; inducen que la topoisomerasa produzca roturas irreparables en el ADN. Dentro de este grupo cabe destacar a las quinolonas y sus derivados, utilizadas como potentes antibióticos, y a las drogas de eficaz actividad antitumoral, como son el m-AMSA y el etoposido. Otros compuestos impiden la unión del ATP a la enzima; tal ocurre con el ácido nadilíxico y sus análogos. Por último, hay diversidad de moléculas de elevada toxicidad para la célula que bloquean los movimientos que hacen las topoisomerasas de tipo II durante el transporte de ADN. El uso reiterado de esa batería de fármacos genera, sin embargo, la aparición de mutaciones que convierten a las células en resistentes a la acción de los mismos. Sólo el avance en los estudios estructurales y bioquímicos de estas enzimas nos permite seguir en esta carrera y diseñar nuevos com-
puestos con potencial terapéutico. Entretanto, como auténticos magos del universo molecular, las topoisomerasas de tipo II siguen manteniendo al ADN intracelular en paz y orden. BIBLIOGRAFIA COMPLEMENTARIA THE CAPTUREOF A DNA DOUBLE HELIX BY AN ATP-DEPENDENT PROTEIN CLAMP: A KEY STEPIN DNA TRANSPORT BY TYPE II DNA TOPOISOMERASES. Joaquim Roca y James C. Wang, en Cell, vol. 71, págs. 833-840; 1992. DNA TRANSPORT BY A TYPE II DNA TOPOISOMERASE: EVIDENCE IN FAVOUR OF A TWO-GATE MECHANISM. Joaquim Roca y James C. Wang, en Cell, vol. 77, págs. 609-616; 1994. THE MECHANISM OF DNA TOPOISOMERASES. Joaquim Roca, en Trends in Biochemical Sciences, vol. 20, págs. 133-168; 1995.
13
A
T
Microsatélites de ADN Las secuencias repetitivas de ADN desempeñan un papel destacado en la adaptación de las bacterias a los ambientes donde medran. ¿Cumplen una función similar en organismos superiores?
A
C
G
T
A A T A
E. Richard Moxon y Christopher Wills T
C
E
l código genético humano está constituido por unos 3000 millones de bases de ADN. Sólo de un 10 a un 15 por ciento de esas bases forman parte de los genes, los planos maestros que la célula utiliza para construir sus proteínas. A otras secuencias de pares de bases les competen —en el hombre y otros muchos organismos— funciones muy importantes; por ejemplo, promover la activación o inactivación de los genes y mantener unidos los cromosomas. Queda una buena parte del ADN sin manifiesta misión obvia. Algunos la llaman “chatarra”. En ese “ADN chatarra” hay secuencias de características singulares, agrupadas bajo la denominación común de ADN satélite. Lo forman, en efecto, secuencias repetitivas de las cuatro bases del ADN —adenina ( A ), citosina (C ), guanina (G ) y timina (T )—, en diversa combinación y repetidas en una suerte de tartamudeo. Los microsatélites, que contienen las repeticiones más cortas, encierran un interés muy superior al que cabría deducir de su tamaño; realizan funciones múltiples y sorprendentes. Se hace cada vez más patente que la naturaleza repetitiva del ADN microsatélite le capacita para crecer o disminuir en longitud y que estos cambios pueden acarrear consecuencias buenas o malas para los organismos portadores. En determinadas bacterias patógenas las secuencias repetitivas promueven la aparición de propiedades nuevas que capacitan a esos microorganismos para sobrevivir ante cambios del entorno potencialmente letales. Es probable que algunos microsatélites ejerzan efectos importantes en el hombre, pues hay en el genoma humano —el conjunto del ADN de cada una de nuestras células— unos 100.000. Hasta la fecha, la única misión asignada a los micro14
T
A
A
T
C T
G
A
A
A
T
T
A
C
A
G
T
A
T T
C
A M I H S A R A N O M O T
satélites del hombre es negativa; causan diversas enfermedades neurológicas. Sin embargo, podrían ser restos supervivientes de procesos evolutivos que desembocaron en la conformación de nuestra especie. Mientras unos indagan los motivos de la cuantiosa presencia de ADN EL MICROSATELITE (región resaltada ) ilusrepetitivo en el hombre, otros se apo- trado consta de una secuencia de unidades yan en los microsatélites para el de ADN o bases —CAAT (citosina-adenidiagnóstico de enfermedades neuro- na-adenina-timina)— que se repite cinco lógicas y para la detección de perso- veces. Cada secuencia de CAAT se empanas en riesgo de padecerlas. Se está reja con su complementaria GTTA (guanicomprobando que los microsatélites na-timina-timina-adenina) en la hebra cambian de longitud en fases pre- opuesta de la escalera de ADN. Las secoces de ciertos cánceres, lo que les cuencias repetitivas, o motivos, pueden convierte en valiosos marcadores pa- contener en los microsatélites hasta seis ra el diagnóstico precoz de tales pa- bases, y cada secuencia puede aparecer tologías. Y puesto que la longitud de en múltiples copias. TEMAS 38
T
los microsatélites varía de una per- genes Opa . (Les viene el nombre de sona a otra, en ellos comienzan a la “opacidad” que presentan las coloapoyarse la identificación de crimi- nias bacterianas que sintetizan pronales y la determinación de la pater- teínas Opa.) Merced a las proteínas nidad. A este procedimiento se le Opa, la bacteria se adhiere e invade denomina “identificación dactilar a las células epiteliales —las que por ADN” (“fingerprinting”). tapizan el tracto respiratorio— y los En los años sesenta se conoció el fagocitos, células del sistema inmuprimer ADN satélite. Se descubrió nitario. Cada gen Opa contiene un que, cuando se centrifugaba ADN en microsatélite compuesto por múltideterminadas condiciones, el ácido ples copias de un motivo de cinco nucleico se disponía en dos o más bases, CTCTT . capas: una banda o estrato principal, El enorme potencial de variación que contenía los genes, y bandas que arrastran las repeticiones de los secundarias, o bandas satélites. Las microsatélites obedece a su proclivibandas satélites constaban de secuen- dad a equivocarse en la replicación cias muy largas de ADN repetitivo. del ADN; cometen un error frecuente: En 1985 Alec J. Jeffreys encontró el desajuste por deslizamiento entre otras regiones más cortas de ADN secuencias complementarias. Antes repetitivo; tales minisatélites —así de que una célula —bacteriana o de los llamó— eran zonas repetidas de otro tipo— se divida, ha de duplicarse 15 o más bases. (El grupo de Jeffreys su ADN. En este proceso complicado, determinó que el número de repeti- cada molécula de ADN es una doble ciones en un minisatélite difería de hélice en escalera de caracol, cuyos un individuo a otro, y en ello basó su peldaños corresponden a los pares de diseño de la técnica de la identifica- bases. El código genético se escribe ción por ADN.) A finales de los con las bases de un lado de la escaochenta, James L. Weber y Paula L. lera; las del otro lado son compleMay, por un lado, y Michael Litt y mentarias ( A siempre se empareja Jeffrey A. Lutty, por otro, aislaron con T , y C con G). satélites constituidos por zonas repeDurante la replicación del ADN, la titivas de ADN menores incluso. Los escalera se parte por la mitad de cada denominaron microsatélites. Se han peldaño; se separan los pares de bases mostrado muy eficaces para la iden- al alejarse ambas cadenas helicoidatificación de las personas por ADN. les. Las ADN polimerasas copian cada Se admite que el ADN microsaté- una de las hebras. Mientras se va lite está constituido por secuencias construyendo la nueva hebra, ésta se de hasta unos seis pares de bases, ite- empareja con la que le sirve de molde. rados y unidos en secuencia continua. Pueden darse errores de replicación Debe su interés especial en los pro- por corrimiento cuando la hebra vieja, cesos evolutivos a una altísima tasa el molde o la hebra que se está forde mutación: la probabilidad de que mando se deslizan y establecen un un microsatélite adquiera o pierda, de emparejamiento inadecuado con la una generación a la siguiente, una de zona repetitiva de la otra hebra. Este las regiones repetidas multiplica deslizamiento es la causa de que la 10.000 veces la probabilidad de que ADN polimerasa añada o elimine una tal ocurra en el gen responsable de la o más copias de las zonas repetitivas anemia falciforme, en el que la muta- de la nueva hebra de ADN. ción de una base da lugar a la enferLa frecuencia de este mecanismo de medad. Y si es raro que esa mutación deslizamiento alcanza valores altos en singular de la anemia falciforme re- N. gonor rho eae. En cada tanda de vierta el gen a su estado inocuo, no división bacteriana, de cada 100 o puede predicarse lo mismo de los mi- 1000 células hijas habrá una que porte crosatélites, que vuelven sin problema una mutación que modifica el número a sus longitudes previas, incluso a las de repeticiones de CTCTT . Esta modipocas generaciones. ficación puede ejercer efectos drásticos sobre los genes Opa , porque la Opa información genética se interpreta en En 1986 el grupo de Thomas F. Meyer “palabras” de tres bases, los codones. sacaba a la luz la función de los mi- Las proteínas son ristras de aminoácrosatélites en las bacterias patóge- cidos y cada codón determina qué aminas. El equipo de Meyer investigaba noácido ha de incorporarse en la Neisseria gonor rhoeae , la bacteria cadena proteica. Como la secuencia causante de la gonorrea, una enfer- repetitiva no está constituida por tres medad de transmisión sexual. N. go- bases, un aumento o una disminución norrhoeae , unicelular, posee una del número de estas secuencias desfamilia de hasta 12 proteínas de la plaza el significado de los codones membrana externa determinadas por subsiguientes. N UEVA GENÉTICA
En el caso de los genes Opa , la deleción de una secuencia CTCTT conduce a la producción de una proteína recortada. No podrá ya adherirse a la célula hospedadora; en consecuencia, la bacteria portadora de la proteína acortada queda incapacitada para penetrar en las células. Pero el deslizamiento subsecuente abre la posibilidad de recuperar la zona repetitiva, permitiendo, por tanto, al gen Opa producir de nuevo una proteína funcional. Conocido por variación de fase, este cambio reversible se da en muchas bacterias causantes de enfermedades. Con los cambios alternativos que llevan a la conexión y desconexión de los genes Opa de una generación a otra, N. gono rrhoeae incrementa sus posibilidades de supervivencia. Hay momentos en que al microorganismo le conviene adherirse a la célula hospedadora y penetrar en ella. Tal acontece cuando la bacteria se propaga y llega a un nuevo huésped. En otras ocasiones le resulta a ésta más ventajoso no interaccionar con la célula huésped; en particular si se trata de fagocitos, que destruyen las bacterias tras atraparlas en su interior. Las implicaciones del emparejamiento incorrecto por deslizamiento y su relación con la capacidad para modificar las moléculas de superficie se han estudiado in extenso a propósito de la bacteria Hemophilus influen zae . Las células del tipo b de esta ba cteria pueden provocar una meningitis infecciosa que afecta al cerebro y puede resultar letal. Hasta la introducción de la vacuna a finales de los ochenta, uno de cada 750 infantes menores de cinco años contraía la meningitis por H. influenzae . La membrana externa del H. in flue nzae está festoneada con moléculas de lípidos y azúcares unidas entre sí para formar un lipopolisacárido (LPS). Una parte del LPS, el colínfosfato, facilita la adhesión de H. influenzae a las células de la mucosa de la nariz y de la garganta, d onde la bacteria se instala sin producir síntomas. Al menos tres de los genes requeridos para la síntesis del LPS contienen microsatélites construidos a partir de la secuencia de cuatro bases CAAT . Igual que sucede con los genes Opa de Neiss eria gonorrh oeae , los cambios aquí en el número de repeticiones de CAAT pueden hacer que el H. influenzae sintetice LPS dotado de colín-fosfato o sin él. Adaptació n al ent orno
Jeffrey N. Weiser ha demostrado que las cepas de H. influenzae que tienen colín-fosfato (ChoP) en sus moléculas 15
mente en el tracto respiratorio, pues se adhieren a las células huésped sin la fuerza de las cepas ChoP+. Ahora bien, si el huésped contrae una infección vírica y se produce una inflamación de la mucosa nasal, se refuerza la exposición de las bacterias a las proteínas defensivas del sistema inmunitario del huésped. En ese caso, las variantes ChoP– tendrían ventaja para repeler el ataque. Una vez que la infección vírica remite, las mutantes ChoP+ generadas por ulteriores emparejamientos defectuosos del ADN microsatélite tornarán a predominar. Este tipo de genes que se activan o inactivan sin problemas se cobijan bajo la denominación común de genes de contingencia; capacitan, por lo menos a unas cuantas bacterias de una determinada población, para adaptarse a los avatares o riesgos de un nuevo escenario. Entre los rasgos codificados por los genes de contingencia no podemos omitir los que gobiernan el reconocimiento inmunitario, la motilidad general, el movimiento hacia las señales químicas (quimiotaxis), la unión a las células huésped y su ulterior invasión, la adquisición de nutrientes y la sensibilidad a los antibióticos. Los genes de contingencia, que representan una fracción muy pequeña del ADN de una bacteria, le confieren una gran flexibilidad en su funcionamiento. Si sólo 10 de los 2000 genes de una bacteria típica son genes de contingencia, por ejemplo, la bacteria podría dar lugar a 2 10, es decir 1024, combinaciones diferentes de genes “activos” o “inactivos”. Esta diversidad asegura que al menos una bacteria de la población pueda sobrevivir al ataque inmunitario del huésped o a la acción de otras defensas, para replicarse luego y fundar una nueva colonia. La inducción de la enfermedad —que se torna en su contra al destruir el huésped que le permite vivir— podría ser parte del precio que las bacterias pagan por disfrutar de esa capacidad de generar tantas variantes. Una de las variantes puede aventurarse allende su nicho ecológico habitual en el tracto respiratorio o el intestino y desencadenar una infección potencialmente letal en otra región del organismo. Habida cuenta de que tal sucede sólo en contadas ocasiones, las ventajas que los genes de contingencia aportan a la pervivencia de una especie bacteriana superan los inconvenientes de destruir algunos huéspedes. Los microsatélites de estas bacterias son auténticas adaptaciones evolutivas. Es poco probable que secuencias N UEVA GENÉTICA
En busca de papá Chimpancé
S
e ha recurrido a microsatélites de ADN para identificar criminales a través del análisis de las huellas nucleotídicas. Se emplean también esas secuencias para conocer la vida sexual de los animales, en el marco de programas conservacionistas de especies en peligro de extinción. La huella de ADN, peculiar de cada individuo, revela que la longitud de las secuencias nucleotídicas de los microsatélites difiere en cada persona. Se obtienen esas huellas mediante enzimas especiales, que permiten fabricar millones de copias exactas de varios microsatélites de un individuo. Luego, en un gel se separan las copias en razón del tamaño. Se configura así un patrón de bandas, similar al código de barras. Pascal Gagneux, David S. Woodruff y Christophe Boesch han empleado microsatélites de ADN como trazadores para sondear los hábitos de apareamiento de un grupo de chimpancés del bosque Taï de Costa de Marfil. Han recogido pelos de los nidos que cada animal se construye en la copa de los árboles, donde se refugian para dormir. De las raíces de estos pelos se ha extraído ADN y determinado sus huellas características. Al comparar las huellas de los microsatélites de ADN de hembras y machos adultos con los de 13 crías, Gagneux, Woodruff y Boesch han observado que siete crías no habían sido engendradas por machos pertenecientes al grupo. Aunque los investigadores nunca vieron esos encuentros furtivos entre las hembras y machos de bosques vecinos. Estas aventuras nocturnas podrían explicar la diversidad genética mos-
repetitivas tan singulares surgieran al azar; aparecerían, y se han conservado, porque capacitan a las poblaciones bacterianas para una pronta adaptación a los cambios del entorno. En los organismos superiores
Pese a su interés, diríase que los genes de contingencia se circunscriben a las bacterias. En los eucariotas, nosotros mismos, cuyas células contienen un núcleo, los microsatélites cumplen otras misiones. Ninguno de los microsatélites eucariotas identificados hasta la fecha ha logrado, que se sepa, liar el ADN para que determine proteínas no funcionales. Se sitúan fuera de los genes, salvo un 10 por ciento que cae
S I N N E D . J L E G I N
LAS HEMBRAS DE CHIMPANCE, como ésta que aparece aquí con su cría, hacen frecuen- tes escapadas furtivas para aparearse con machos pertenecientes a otros grupos, según se deduce de estudios con huellas de ADN de microsatélites.
trada incluso por grupos reducidos de chimpancés. La diversidad refuerza la resistencia frente a enfermedades y favorece, sin duda, la pervivencia. Es probable que la conservación de la variedad sea esencial para la supervivencia de las poblaciones de chimpancés en libertad. Por desgracia, a medida que estas poblaciones se fragmentan y las distancias que las separan son mayores, la capacidad de las hembras para encontrarse con machos de otros grupos e introducir nuevos genes en sus grupos queda drásticamente recortada. —E.R.M. y C.W.
en su interior. De este 10 por ciento, casi todos pertenecen a los tripletes repetidos, que tienden a extenderse o a contraerse en tríos de bases. Igual que al añadir el artículo “las” o al suprimir el artículo “los” de una frase no se pierde por lo común el sentido, de modo similar estas repeticiones pueden iterarse o perderse sin perturbar el mensaje del gen. Por tener la misma longitud que un codón, podrían dar lugar a la inserción o deleción de unos cuantos aminoácidos repetidos sin que se alterase la secuencia de todos los demás de la ristra. ¿Qué funciones desempeñan, pues, los microsatélites en los organismos superiores? Se sospecha que algunos 17
Detección del cáncer
E
l ADN microsatélite puede convertirse muy pronto en un poderoso condicionante de nuestra vida. Con su ayuda podrá afinarse en la detección precoz del cáncer. Las pruebas capaces de descubrir mutaciones en genes cuya alteración predispone al cáncer, pensemos en el p5 3 y el ra s , se emplean ya para detectar hasta una célula maligna en medio de 10.000 normales. Pero las mutaciones en estos genes ni se dan en todos los tipos de cáncer, ni en todos los cánceres de un mismo tipo. Los microsatélites ofrecen una nueva posibilidad para la detección precoz del cáncer. En efecto, la tasa de expansión o de contracción de microsatélites en las células se dispara en ciertas formas tumorales. Estos cambios repentinos ponen en jaqu e muchos micro satélites dife rentes, fenómeno que puede detectarse con bastante facilidad. Con dicho enfoque se descubre ahora una célula cancerosa entre 500 normales. Fue Manuel Perucho quien descubrió en 1993 los cambios operados en los microsatélites de células cancerosas en el marco de una investigación de un tipo de cáncer de colon, hereditario, que no se acompaña de la formación de pólipos. Perucho observó que muchos de los microsatélites de las células cancerosas eran o más largos o más cortos que los de las células normales del mismo paciente. No tardó en demostrarse que uno de los defectos causantes de estas alteraciones se encontraba en un gen determinante de una enzima cuya función era corregir la longitud de los microsatélites que se extienden o menguan durante la replicación del ADN. La pérdida de este gen funcional habría de conducir a un aumento de la probabilidad de que los errores quedaran sin corregir.
al menos tienen su cometido. Los eucariotas poseen más microsatélites que las bacterias y muchos de ellos suelen estar alojados cerca o dentro mismo de genes implicados en vías reguladoras de procesos fundamentales. Sin embargo, hasta el momento sólo disponemos de pistas dispersas acerca de su posible tarea. Los contados efectos cuya pista se ha podido seguir y atribuir a microsatélites eucariotas son, por lo general, nocivos. Así la enfermedad de 18
La prueba se completó cuando Richard C. Boland y otros insertaron un cromosoma humano portador de un gen normal reparador de ADN en células cancerosas cultivadas. Observaron que el gen insertado corregía la tendencia a mutar que presentaban los microsatéli tes de células cancerosas. Mas, por muy sorprendentes que parezcan estos hallazgos, la inestabilidad de los microsatélites puede constituir un síntoma, no la causa del cáncer. Aunque los ratones en que se ha eliminado el gen que codifica una de las principales proteínas reparadoras de emparejamientos incorrectos de ADN viven poco y adquieren diversos tipos de cáncer, ninguna de las células malignas muestra niveles elevados de mutaciones en los microsatélites. Según parece, este tipo de alteraciones forma parte de los cambios genéticos que se suceden en cascada a lo largo del genoma celular, una vez incoado el proceso de carcinogénesis; ello significa que podría tratarse de productos secundarios del proceso carcinogenéti co y no de agentes que intervinieran en su desarrollo. Ahora bien, esas asociaciones se dan con suficiente frecuencia. Y los clínicos empiezan a servirse de la inestabilidad de los microsatélites como un nuevo y poderosos instrumento para la detección precoz del cáncer de colon y de vejiga. Las pruebas clínicas se han visto coronadas por el éxito, lo que explica la voluntad de llev ar su aplicación a otros tipos de cánce r. De momento, ninguna de esas pruebas ha salido todavía de los muros de los l aboratorios. A medida que los clínicos adquieran experiencia con estos patrones, podrá diagnosticarse el cáncer antes y contar con datos más fiables del tipo de cáncer en razón del patrón de microsatélite. —E.R.M. y C.W.
Huntington, una afección neurodegenerativa grave caracterizada por la aparición tardía de demencia y pérdida progresiva del control motor. Esta patología se dispara con la intervención de un gen defectuoso que codifica una proteína de gran tamaño, la huntingtina, de función desconocida. El gen normal contiene un microsatélite largo, constituido por repeticiones de tripletes, que añade una ristra de glutaminas cerca del extremo inicial de la proteína.
E C R U O S E C N E I C S / S E T A I C O S S A O T O H P O I B
PULMON NORMAL
T A
C
MICROSATELITE
A
C A
C A
T A
A T
G
T
G
T
G
T
A
T
G
C
A
T
T C G
A G C
A
T
T C C C
A G G G
MATERNO
A
C A
C A
C
A
C A
T
G
T
G
T
G
T
G
T
C
G
A
T
T
A
A
T
G
C
A
T
T C G A
T C
A G C
T
A G
PATERNO
GEL
PATERNO
MATERNO
PRUEBA para la detección del cáncer, que descubre los cambios de longitud de micro- satélites; por ejemplo, los formados por repe- ticiones de la secuencia CA. Las células pul- monares normales (izquierda) contienen regiones repetitivas de dos longitudes dife- rentes —una heredada de la madre y otra del
El número de glutaminas del extremo inicial de la huntingtina varía de 10 a 30. Pero las personas con Huntington portan un microsatélite que codifica una ristra de glutaminas excesivamente larga, de hasta 36 unidades o más. Basta la herencia de una copia del gen defectivo —la paterna o la materna— para dictaminar la enfermedad. Se ignora en virtud de qué mecanismo esa ristra de glutaminas repetidas insta la patogénesis. TEMAS 38
Micromatrices de ADN Con unas ingeniosas plantillas de ADN, la ciencia se está adentrando en las raíces moleculares de la salud y la enfermedad, al tiempo que acelera el paso en el descubrimiento de nuevos fármacos y en el desarrollo de terapias personalizadas Stephen H. Friend y Roland B. Stoughton
L
a mayoría de los pacientes que sufren linfoma difuso de células grandes tipo B responde bien a la terapia estándar. Pero, en más de la mitad de los casos, el cáncer no tarda en reaparecer con violencia letal. Los médicos venían atribuyendo el hundimiento rápido de unos y la resistencia de otros a diferentes formas del tumor causadas por anomalías moleculares distintas. Pero hasta hace dos años la ciencia carecía de medios para detectar qué pacientes sufrían la forma más virulenta y debían, por tanto, recibir un tratamiento más enérgico y arriesgado. El problema lo resolvió una herramienta poderosa, la micromatriz de ADN (“DNA microarray”). Recurriendo a la misma, investigadores del norteamericano Instituto Nacional de la Salud, la Universidad de Stanford y otros centros pudieron distinguir entre supervivientes a corto y a largo plazo. Basábanse para ello en las diferencias observadas en el patrón general de actividad que mostraban cientos de genes de sus células malignas en el momento del diagnóstico. Aquel logro debería llevar a una prueba discriminante, capaz de identificar a los pacientes expuestos a un riesgo mayor. Las micromatrices de ADN existen en el comercio desde 1996. Constituyen hoy uno de los pilares de la investigación farmacológica. Más de 20 compañías se dedican a su distribución o a la venta de los progra mas informáticos asociados. Gracias a esas plantillas asistimos a una revolución en el modo en que se estudia el funcionamiento molecular, normal y patológico, de las células. En ellas se confía para obtener diagnósticos más rápidos y exactos de muchas enfermedades, así como para facilitar la personalización de los tratamientos clínicos, lo que implica elegir los fármacos más eficaces y con menores efectos secundarios en cada paciente. 20
CUANDO SE ANALIZAN muestras de tejido con matrices de ADN, aparecen tramas de puntos. Los médicos podrían basarse en las diferencias individuales entre estas tramas para ajustar sus tratamientos a las necesidades de cada paciente.
Punteados de identificación
Aunque hay varias clases de micromatrices, todas se ordenan a descubrir la composición del material genético en una muestra de tejido. Todas las variedades constan de una serie de moléculas de ADN unicatenario (sondas), dispuestas en una rejilla a menudo no mayor que la huella del pulgar. Las plantillas en cuestión se fundan en una propiedad muy útil del ADN: el emparejamiento complementario de sus bases.
De ADN están formados los más de Las reacciones de emparejamiento 30.000 genes de la célula humana, las complementario de las bases han secuencias codificadoras de la com- resultado cruciales para la ejecución posición de las proteínas. El ADN de numerosas pruebas biológicas consta de cuatro bloques de cons- durante años. Pero lo asombroso de trucción, reconocidos por la primera nuestro caso es que las micromatriletra de sus bases químicas: A, C, G ces de ADN pueden rastrear decenas y T. En una cadena de ADN la base de miles de estas reacciones a la vez A sólo se emparejará con una T (la en una sola tarjeta. ¿En virtud de complementaria de A) de otra cadena; qué? Porque cada una de las sondas la C hará lo propio con G. —trátese de un gen o de una secuenPor tanto, si una molécula de ADN cia de código más corta— se dispone de una muestra de tejido se une a en un lugar determinado de la rejiuna sonda que tiene la secuencia lla, parecida a un tablero de ajedrez, ATCGGC, deduciremos que la mues- y porque las moléculas de ADN o de tra presenta la secuencia comple- ARN que se vierten sobre la plantimentaria: TAGCCG. El otro ácido lla portan un marcador fluorescente nucleico fundamental, el ARN, sigue u otra etiqueta que puede detectarse también esta estricta norma de empa- con un escáner. Una vez leída la microrejamiento de bases cuando se une al matriz por el escáner, los datos se ADN; podemos, pues, deducir también convierten en una impresión con un la secuencia de una cadena de ARN código de colores. que se empareja con ADN en una micromatriz.
E T N A L A G S I N N E D
21
Así funcionan las matrices
P
ara determinar si un fármaco potencial supondrá un daño colateral del hígado, el investigador podría seguir los pasos descritos más abajo. La pregunta planteada sería de este tenor: ¿Provoca el fármaco en cues-
tión la activación de genes (determinantes de las proteínas) de las células hepáticas en un sentido lesivo para el hígado? Una respuesta afirmativa sería señal de problemas.
N G I S E D N A M D I E N H C S D E R A J
A G G A C G T
MICROMATRIZ
SEGMENTO DE MATRIZ
PUNTO QUE CONTIENE COPIAS DE UNA MOLECULA DE ADN
1
Se parte de una micromatriz que contenga ADN de cadena sencilla, representativo de miles de genes diferentes; cada uno se asigna a un punto diferente de la plantilla de 2,5 8 cm o menos. Cada punto alojará miles o millones de copias de la cadena de ADN.
BASES DE ADN
PARTE DE UNA CADENA DE ADN
ARNm GENES INACTIVOS
FARMACO
PROTEINA
GEN ACTIVO ARNm
CELULA SIN TRATAR
ADNc
CELULA TRATADA ADNm
2
Se toman dos muestras de células hepáticas. Se aplica el fármaco a una muestra. Luego, de cada muestra, se recuperan las moléculas de ARN mensajero, que representan las copias móviles de los genes y los moldes para la síntesis celular de proteínas. PAR DE BASES COMPLEMENTARIAS
ADNc
3
El ARNm se transcribe en ADN complementario (ADNc), más estable. Se agregan marcadores fluorescentes, verdes a los ADNc derivados de células sin tratar y rojos a los procedentes de células tratadas.
ADNc DE CELULAS SIN TRATAR
T C C T G C A
4
Los ADNc marcados se aplican a la matriz. Cuando el ADNc de una muestra encuentra su secuencia de bases complementaria en la plantilla, se une a ella. Tal unión evidencia que el gen representado por el ADN de la plantilla se halla activo, vale decir, expresado en la muestra.
A G G A C G T
MATRIZ DE ADN C C C G G A T
G G G C C T A
A A T T C G C
5
GEN QUE E STABA IGUALMENTE ACTIVO EN CELULAS TRATADAS Y SIN TRATAR
ESCANER
LECTURA
Se deposita la matriz o plantilla en el escáner. El ordenador calcula la relación de verde a rojo en cada punto (para cuantificar los cambios en la actividad genética inducidos por el fármaco) y genera una salida impresa en color. PERFILES HIPOTETICOS DE ACTIVIDAD GENETICA EN CELULAS TRATADAS CON DIVERSOS COMPUESTOS
6
22
T T A A G C G
ADNc DE CELULAS SIN TRATAR
GEN QUE HA DISMINUIDO NOTABLEMENTE SU ACTIVIDAD EN CELULAS TRATADAS
Se determina si ha habido genes que responden intensamente al fármaco en el sentido de promover o reflejar la lesión hepática. Puede también compararse el esquema general de expresión génica de los genes que han respondido de un modo intenso con los esquemas producidos cuando esos genes reaccionan a toxinas hepáticas conocidas (derecha ) . Una estrecha similaridad indicaría que nos hallamos ante un candidato tóxico. Cada cuadro del diagrama representa la respuesta de un gen a la sustancia.
A A T T C G C
EJEMPLOS DE REACCIONES
GEN QUE HA INCREMENTADO NOTABLEMENTE SU ACTIVIDAD EN CELULAS TRATADAS
GEN QUE E STABA INACTIVO EN AMBOS GRUPOS
T T A A G C G
GENES SUBSTANCIAS INOCUAS NUEVO CANDIDATO A FARMACO TOXINAS HEPATICAS CONOCIDAS
TEMAS 38
En el dominio de la investigación enfermedades para detectar SNP indi- copias de proteína sintetizará tamlas micromatrices de ADN se aplican viduales y predecir la probabilidad bién. Por consiguiente, la cuantía de a dos usos muy distintos. Las aplica- de que el sujeto en cuestión padezca diversos ARNm apreciados en una ciones genotípicas comparan el ADN Alzheimer, diabetes o un tipo de cán- muestra revelará, indirectamente, los de una microplantilla con el ADN de cer. Las personas proclives podrían tipos y cantidades de proteínas preuna muestra de tejido para determi- someterse a un control estricto, reci- sentes. Compete a las proteínas connar qué genes hay en la muestra o para bir un tratamiento preventivo o pasar trolar y llevar a cabo la mayoría de descifrar el orden de las letras de antes por el quirófano. Queda, empero, las funciones de nuestras células y código en cadenas de ADN sin secuen- abierta la duda de hasta qué punto tejidos. Se hallan en fase de desarrociar. Además de ese uso explorador estas pruebas serán aceptadas por el llo las micromatrices que miden direcde la presencia de genes en una mues- público; ese conocimiento podría ali- tamente los niveles de proteína, auntra, importa otro, el de detectar la mentar la ansiedad del interesado y que su construcción aparece rodeada expresión, o nivel de actividad, de facilitar su posible discriminación por de dificultades. tales genes. Se dice que un gen se aseguradoras o patronos. Con el uso del genoma como sensor expresa cuando se transcribe en un De esos inconvenientes queda exen- para determinar cambios de activi ARN mensajero (ARNm) y se traduce ta otra información valiosa que pro- dad en genes de la célula, se obtenen una proteína. Las moléculas de porcionan las micromatrices de SNP. drán “instantáneas” detalladas del ARN mensajero son los transcriptos Las variantes de genes influyen en la estado de alteración de las funciones móviles de los genes y sirven de molde reacción del cuerpo a las medicinas que celulares provocado por fármacos o para la síntesis de proteínas. tomamos, lo que a su vez influye en la enfermedades. A veces, resulta más eficacia de los fármacos y en la inten- útil conocer el esquema general de ac A la caza de genes sidad de sus efectos secundarios. Las tividad de los genes en una muestra Se recurre al enfoque genotípico para plantillas que pongan de relieve nues- que saber qué genes concretos se acticomparar los genes de organismos di- tras peculiares sensibilidades genéti- van en respuesta ante un estímulo. En ferentes (por ejemplo, para buscar cas ayudarían a los clínicos a elegir esos casos, como veremos, el esquema claves sobre la historia de la evolu- las medicinas que convinieran más a sirve de “firma” taquigráfica que refleja ción de los organismos) y para cote- cada paciente. Las micromatrices de el estado molecular de una muestra jar los genes de los tumores con los SNP que revelan las mutaciones gené- bajo unas condiciones particulares. de tejidos normales (en busca de suti- ticas que incrementan la virulencia de Los perfiles de expresión han deles diferencias de composición o los tumores permitirían que los ana- mostrado su utilidad única en muchos número de genes). Algún día, las com- tomo-patólogos determinaran la ma- frentes. Los biólogos celulares los paraciones de genes mediante micro- lignidad escondida de un tumor en usan porque, si sabemos qué proteímatrices de ADN podrán mostrar su apariencia benigno. Ambos tipos de nas predominan después de exponer valor en clínica. microplantillas se están investigando un tejido a diferentes condiciones, Sin ir más lejos, una micromatriz ya con fines hospitalarios. podemos inferir el modo en que el bien pergeñada podría establecer la tejido compensa las agresiones y qué causa exacta de la infección en un Expresión génica es lo que deja de funcionar cuando se paciente cuyos síntomas, parecidos a No acaban ahí las apasionantes aplica- desarrolla una enfermedad. los de un resfriado (dolor de cabeza, ciones de la técnica. Desde otra óptica Se recurre también a las plantillas fiebre alta y dificultad para respirar), particular, ha atraído también el inte- de expresión génica para descubrir las no denuncian un responsable claro. rés de los investigadores en los últi- funciones de genes identificados a traPodría componerse una superficie con mos años. Nos referimos al estudio de vés de la secuenciación del ADN nu ADN que represente genes que apa- perfiles de expresión génica. Para clear. Hay otras técnicas que no utilirecen sólo en patógenos causantes de obtenerlos, se mide la cantidad de zan micromatrices para mostrar las enfermedades similares; el laborato- diferentes ARNm en una muestra de funciones de esos genes recientemente rio hospitalario podría extraer y mar- tejido. En general, cuantas más copias descubiertos (o, dicho con exactitud car ADN de una muestra de tejido de ARNm produce una célula, más mayor, de las proteínas por ellos cifrainfectado (por ejemplo, de las fosas nasales del enfermo). La unión del ADN del paciente a alguna secuencia Resumen / Micromatrices de un gen del la microplantilla nos descubriría al agente infeccioso responsable. De modo similar, las micro Las micromatrices , o plantillas, de ADN pueden rastrear cientos de miles de matrices que se están desarrollando reacciones moleculares en paralelo en una rejilla parecida a un portaobjetos podrían detectar si los bioterroristas de microscopio. Pueden diseñarse matrices para detectar genes específicos han liberado cepas específicas de caro para medir la actividad génica en muestras de tejido. bunco u otros gérmenes exóticos. Para bien o para mal, las microma Estas propiedades están resultando de un valor incalculable para los biólotrices de ADN podrían también detergos celulares, los oncólogos y los farmacólogos. Se está investigando tamminar la predisposición genética de bién en la aplicación de las microplantillas para convertirlas en instrumentos los individuos a numerosas enfermeseguros y rápidos de diagnóstico y prognosis. dades. La mayoría de las diferencias El estudio se extiende a las plantillas de proteínas, muy prometedoras, asigenéticas que se dan entre las persomismo, en diagnóstico e investigación biológica. nas revisten la forma de polimorfismos de un solo nucleótido, o SNP, en La información básica y diagnóstica proporcionada por las matrices de ADN los que aparece cambiada una letra. y de proteína permitirá, andando el tiempo, instaurar terapias personalizadas . Se podría construir una micromatriz con variantes de genes asociadas a N UEVA GENÉTICA
23
Predicción del desarrollo del cáncer
D
e acuerdo con las investigaciones realizadas en Rosetta Inpharmatics y el Instituto Oncológico de Amsterdam, las micromatrices habrán de ayudarnos a distinguir entre pacientes de cáncer con diferente prognosis. Se determinaron los niveles de actividad (expresión) de los genes en tumores de mama pequeños y localizados en mujeres jóvenes, controladas durante los cinco años subsiguientes a su extirpación quirúrgica. Luego, se descubrió que las afectadas presentaban diferentes perfiles de expresión, como se llaman los patrones generales de activi dad en una selección de genes tumorales. El análisis matemático reveló
PERFILES DE EXPRESION
FRACCION DE PACIENTES CON METASTASIS
) l a r e n e g n ó i s e r p x s e e e l a d u s d e l i i f v i r d e n p i e s d e t d n a e i i d c r a a l i P m i s r o p s a d a p u r g a (
0/20 (0%)
EL SINO DE LAS PACIENTES
6/21 (29%)
100 s i s a t s
18/24 (75%)
10/13 (77%) Niveles de actividad de genes individuales (con respecto a los niveles de tejido mamario normal)
GEN QUE MUESTRA INCREMENTO DE ACTIVIDAD
Aplica ción en farmacología
Los investigadores en el dominio de los fármacos se benefician también de las
)
80
á t e m e60 d e r b i l 40 e j a t n e20 c r o P
0
GEN QUE MUESTRA DISMINUCION DE ACTIVIDAD
das), pero tales métodos no siempre operan bien o con la presteza requerida. Las micromatrices de expresión génica pueden subsanar tales lagunas mediante la aplicación que se ha venido a llamar “culpable por asociación”, incluso sin ninguna pista previa sobre el papel de los genes en el organismo. El método en cuestión se funda en el hallazgo de la interrelación génica. Los genes no son islas. Si los de un tejido se activan e inactivan juntos en respuesta a un estímulo —un fármaco, una infección o una mutación inducida—, nos es dado suponer que esos genes que operan a coro intervienen en la misma vía reguladora; es decir, los genes trabajan juntos o en serie para inducir una respuesta celular. Resulta, pues, razonable pensar que las funciones de un gen del grupo, en principio desconocidas, se parecen a las de los otros genes cuya responsabilidad se ha resuelto ya.
24
que las pacientes cuyos perfiles de expresión génica se parecían al perfil de “mala prognosis” (el esquema medio de tumores que generaban metástasis) tenían más probabilidades de sufrir una rápida recidiva que las pacientes cuyos perfiles se parecían a la signatura de “buena prognosis” (el modelo típico de tumores que no se propagaron). Si estos resultados se confirman en otras investigaciones, los médicos podrán algún día detectar a los pacientes que necesitan el tratamiento más agresivo, basándose en la similaridad entre sus perfiles de expresión y un perfil de buena o mala prognosis normalizado.
ventajas de ese método “culpable por asociación”, cuando buscan proteínas cuya participación en procesos biológicos implicados en enfermedades se desconocía de antemano. Una vez descubiertas esas proteínas, pueden engrosar la lista de blancos para desarrollar nuevas y mejores medicinas. Peter S. Linsley, colaborador nuestro en Rosetta Inpharmatics, se propuso identificar nuevos blancos para fármacos contra enfermedades inflamatorias, en las que el sistema inmunitario pervierte su misión y lesiona partes del cuerpo. Investigó, por tanto, qué genes de los leucocitos del sistema inmunitario aumentaban y disminuían su producción de proteínas en paralelo con el gen de la interleucina-2 (IL-2), una proteína involucrada en los procesos inflamatorios. Obtuvo la respuesta tras conseguir perfiles de expresión génica de leucocitos expuestos a diversas sustancias químicas y ejecutar después un complejo programa de ajuste de pautas para detectar un conjunto de genes que se activaban o desactivaban al
a h c e r e d (
Mujeres con un perfil de expresión de “buena prognosis”
N E H C A R A S ; )
a d r e i u q z i
Mujeres con un perfil de expresión de “mala prognosis”
0
50
100
150
(
200
Tiempo (meses)
tiempo que se activaba el gen IL-2. En ese conjunto de genes había uno cuya función no se había determinado todavía por otros medios. Más o menos al mismo tiempo, otros investigadores del Instituto Pasteur de París confirmaron, por su lado, con un método diferente, que este gen intervenía en el metabolismo del IL-2. Los hallazgos combinados sugieren que la proteína codificada por el gen en cuestión podría convertirse en óptimo blanco para los antiinflamatorios. En los departamentos de investigación de los laboratorios farmacéuticos se utilizan los perfiles de expresión génica de una manera distinta: para detectar (y eliminar) fármacos que ejercerían efectos secundarios inaceptables. Quienes estudian si un determinado compuesto podría dañar el corazón pueden compilar un compendio de perfiles de expresión génica para células cardíacas expuestas a fármacos ya existentes o a sustancias químicas. Si tratan células cardíacas con el fármaco ensayado, pueden esperar que el ordenador compare la firma TEMAS 38
S C I T A M R A H P N I A T T E S O R , I A D E U Y G N O H
Matrices de proteínas: Una nueva opción N. Leigh Anderson y Gunars Valkirs
L
as plantillas de proteínas se asemejan a las de ADN, con la salvedad de que portan polipéptidos en vez de moléculas nucleotídicas en su superficie; pueden medir los niveles de proteínas en los tejidos. De hecho, realizan el trabajo de un modo más directo y, según algunos resultados, con mayor precisión. Las micromatric es de proteínas presentan una característica exclusiva: su capacidad de revelar cuáles, de entre las miles de proteínas de un tejido, interaccionan entre sí. Esa gavilla de propiedades que rodean a las plantillas de proteínas las hacen muy atractivas para los biólogos. Y de i nterés general resulta la posibilidad de que estos dispositivos aumenten espectacularmente el número de enfermedades que los médicos podrán diagnosticar sin demora en sus consultas. Su utilidad diagnóstica reside en parte en que estas microplantillas, a diferencia de las de ADN, pueden extraer información del plasma sanguíneo, muy fácil de obtener. La mayoría de las enfermedades, desde las infecciosas hasta las complicaciones cardíacas o renales, dejan huellas identificables en la sangre, en forma de proteínas segregadas o perdidas. Más aún, en una sola prueba, las matrices podrían medir muchas, si no todas las proteínas indicadoras de problemas médicos. Considérese, por comparación, que las pruebas diagnósticas habituales sólo pueden detectar una o unas pocas proteínas específicas de enfermedades. El diseño de plantillas de proteínas se parece al de las de ADN. Cientos o miles de diferentes proteínas se disponen (en millones de copias) en puntos específicos de una rejilla sobre una placa del grosor de una galleta. La unión de proteínas de una muestra de sangre a una plantilla revela la naturaleza y la cantidad de proteínas de la muestra. Los tipos de proteínas que pueden disponerse sobre la matriz o plantilla dependen de las cuestiones que se quiera abordar. Pero las matrices cuyo desarrollo se halla casi listo
para la comercialización (al principio para uso de investigadores) se basan en los anticuerpos; cada una de estas moléculas del sistema inmunitario reconoce una proteína y se une a ella o, más exactamente, a un segmento determinado de la misma. Algunas de estas plantillas de anticuerpos funcionan por el método del emparedado: las proteínas reconocidas por una matriz quedan atrapadas entre dos anticuerpos diferentes, uno que sujeta la proteína y otro que hinca un marcador fluorescente en la molécula cautiva. Para que las matrices de anticuerpo desarrollen todo su potencial en el dominio de la investigación y del diagnóstico, habrá que vencer al menos dos graves inconvenientes. Uno es la necesidad de técnicas que produzcan en masa anticuerpos muy diferentes a la vez, no sólo unos cuantos (los necesarios para unirse a un blanco, y, de ese modo, revelar incluso pequeñas cantidades en una muestra). Este problema se halla en vías de solución. El segundo obstáculo es más fundamental. La ciencia médica hasta ahora sólo ha descubierto unas docenas de los miles de proteínas capaces de señalar la presencia o el progreso de una enfermedad. Hasta que los fabricantes de matrices sepan qué proteínas tienen que identificar, sólo podrán buscar un número limitado de marcadores de enfermedades en una muestra de tejido. Se ha multiplicado la búsqueda de nuevas proteínas específicas de enfermedades. Cuando converjan los avances en manufactura de anticuerpos y el descubrimiento de proteínas, estaremos ante una segunda generación de matrices de proteínas que bien podrían transformar la investigación médica y la práctica clínica.
N. Leigh Anderson y Gunars Valkirs colaboran en la investigación de matrices de proteínas.
UNA PLANTILLA DE PROTEINA EN ACCION
L
os médicos podrían recurrir a la “prueba del emparedado”para identificar el agente infeccioso responsable de la enfermedad de un paciente. ¿Es un virus normal de la gripe o se trata de una cepa nueva letal? ¿Podría ser el
culpable el bacilo de la tuberculosis, el carbunco, la viruela o los microorganismos de la fiebre Q diseminados por bioterroristas? A través de los pasos siguientes se nos ofrece la respuesta. ANTICUERPO MARCADO
PROTEINAS EN SANGRE
ANTICUERPO PARA UNA PROTEINA DEL CARBUNCO
ANTICUERPOS CON MARCADOR FLUORESCENTE
ANTICUERPO PARA UNA PROTEINA DE VIRUELA
ANTICUERPO PARA UNA PROTEINA DE LA GRIPE
PROTEINA DE LA SANGRE ANTICUERPO DEL CARBUNCO PUNTO QUE INDICA ANTICUERQUE EL PACIENTE POS NO LIGADOS TIENE CARBUNCO ESCANER
MATRIZ DE ANTICUERPO
1
Se aplica la muestra de sangre extraída de un paciente a una plantilla o matriz, que consta de anticuerpos asignados a cuadrados específicos de una rejilla. Cada cuadrado incluye múltiples copias de un anticuerpo capaz de unirse a una proteína específica procedente de un solo organismo; representa, pues, un agente infeccioso concreto.
2
Se aplican anticuerpos marcados con fluorescencia capaces de unirse a un segundo lugar de las proteínas reconocibles por los anticuerpos de la matriz. Si una proteína de la sangre se ha unido a la matriz o plantilla, uno de los anticuerpos fluorescentes se unirá a esa proteína, englobándola en un emparedado de anticuerpos.
3
LECTURA
N G I S E D N A M D I E N H C S D E R A J
Se introduce la matriz en un escáner para determinar qué microorganismo está presente en el cuerpo del paciente. En este caso, se muestra que el culpable es una cepa de carbunco.
resultante con el compendio de per- tituirá un fruto valioso de los perfifiles. Una firma que se corresponda les moleculares obtenidos con las plancon la producida por sustancias que tillas de ADN. Pero muchos médicos se sabe que dañan a las células car- confían en resultados incluso mejores: díacas haría saltar la alarma. sueñan con herramientas rápidas de Un compendio de perfiles de expre- diagnóstico que dividirían a los paciensión génica puede también ayudar a tes con síntomas similares en grupos explicar por qué un fármaco produce distintos; cada grupo recibiría un tradeterminados efectos secundarios. tamiento diferente y apropiado. Igual Apremia hoy saber por qué los inhibi- que quedó demostrado en el caso del dores de la proteasa, que están sal- linfoma, al que nos referíamos al prinvando la vida de los infectados con el cipio de este artículo, los oncólogos VIH (el virus del sida), pueden producir necesitan imperiosamente un procealtos niveles de colesterol y triglicéridos dimiento para identificar a los pacienen sangre, provocar extrañas distribu- tes que requieran, desde el principio, ciones de la grasa corporal e inducir un tratamiento radical. resistencia a la insulina. Conscientes La investigación de nuestro grupo de que el hígado influye en la síntesis de Rosetta, junto con el Instituto Ony degradación de los lípidos (el grupo cológico de Amsterdam, sobre el cánque incluye el colesterol y los triglicé- cer de mama pone de relieve la forma ridos) y las lipoproteínas, nuestro grupo en que podemos servirnos de las matride Rosetta, en colaboración con Roger ces de expresión génica. En este caso, G. Ulrich y su equipo en Abbott buscábamos una prueba para deterLaboratories, decidimos comprobar si minar qué jóvenes pacientes con cánun inhibidor de la proteasa —ritona- cer precoz de mama (sin metástasis en vir— inducía algunos de estos efectos los ganglios linfáticos) necesitaban, y secundarios interesando al hígado. cuáles no, un tratamiento sistémico con Mediante una microplantilla que quimioterapia para evitar la extenrepresentaba unos 25.000 genes de sión del tumor después de la cirugía. rata obtuvimos perfiles de expresión Aunque las normas en uso recomiengénica de tejido hepático de rata dan un tratamiento sistémico para el expuesto a diversos compuestos con 90 % de estas mujeres, muchas de ellas toxicidad potencial para el hígado. probablemente evitarían metástasis Agrupamos luego los compuestos en incluso sin ese tratamiento. Desgraciarazón de la similaridad de sus firmas damente, los métodos estándar no dede expresión sobre unos 2400 genes tectan a las mujeres con mayor riesgo. que respondían intensamente a estas Empezamos por generar perfiles de substancias. A continuación, admi- expresión génica para tumores en cernistramos ritonavir a hígados de rata ca de 100 mujeres de menos de 55 años y comparamos los perfiles de expre- de edad cuyo curso clínico posquisión génica resultantes con los que rúrgico se había seguido durante más habíamos conseguido antes. de cinco años. Al principio trabajamos Descubrimos que el ritonavir acti- con una micromatriz que represenvaba genes que normalmente perma- taba 25.000 genes humanos. Descunecían silentes en respuesta a un brimos, por fin, que cierta firma proagente, bien conocido, que rebaja los ducida por unos 70 genes indicaba niveles de lípidos. El ritonavir frena claramente que no tardarían en apatambién la síntesis de proteínas que recer metástasis. Además, la pauta acostumbran ensamblarse en proteo- opuesta revelaba un pronóstico espesomas, unas estructuras que degradan ranzador. Resulta evidente que alguproteínas que han perdido su utili- nos tumores están programados para dad, entre ellas las lipoproteínas. De producir metástasis antes de alcantales descubrimientos se desprendía zar el tamaño de un guisante, mienque el ritonavir incrementaba los ni- tras que otras masas mayores no están veles de lípidos en el hígado —y por programadas para propagarse. consiguiente en sangre— en parte eleNuestros resultados tendrán que vando la síntesis hepática de lípidos ser confirmados por otros antes de que e inhibiendo la degradación de lipo- los perfiles de expresión génica se conproteínas. Una investigación más de- viertan en una rutina en el tratamiento tenida de la interacción entre el ri- del cáncer de mama. De aquí a dos tonavir y las vías metabólicas de años, es probable que muchos hospilipoproteínas y de proteosomas habrá tales empiecen a ensayar los perfiles de proporcionarnos claves para redu- de expresión génica en su orientación cir sus efectos secundarios. diagnóstica, no sólo para el cáncer de mama, sino también para otros tipos. Aju ste de t ratamientos Hay enfermedades que necesitan mejoDisponer de un arsenal de fármacos res herramientas de diagnóstico. Los con menos efectos secundarios cons- perfiles de expresión génica podrían 26
ayudar a distinguir subgrupos de pacientes asmáticos, diabéticos u obesos que demandan una terapia específica. Hablamos de aplicaciones en las que se está trabajando ya. Antes de que las micromatrices desarrollen todo su potencial en investigación y diagnóstico, deberemos allanar algunos obstáculos. Las plantillas, los escáneres y otros accesorios siguen siendo caros. Podemos suponer que los costes bajarán con el tiempo. Ahora bien, aunque bajen los precios, las técnicas pueden ser inaplicables, cuando menos al principio, para las consultas de los médicos o los laboratorios normales. Escasean los médicos y los técnicos que posean los conocimientos o el instrumental para preparar correctamente las muestras de tejido a utilizar con matrices. Lo que es más, para diagnosticar, pongamos por caso, una enfermedad del hígado por los cambios de expresión génica en células hepáticas, un médico tendría que obtener tejido de ese órgano. Y éste no es fácilmente accesible. Tales problemas, hoy graves, se resolverán con un grano de ingenio. A veces, los tejidos más accesibles pueden funcionar como aceptables sustitutos de los inaccesibles. Además, en algunos casos, no tendrán que usarse las micromatrices; podrían aportar la información necesaria para idear nuevas pruebas diagnósticas, que pueden revestir otras formas.
Conforme mejore nuestra comprensión de las células y del organismo entero, los médicos podrán diagnosticar con mayor precisión, indicar terapias más depuradas (incluidas probablemente las genéticas) y ajustar sus tratamientos a las características genéticas y al estado fisiológico real de cada paciente. Hacia el año 2020, las organizaciones sanitarias podrían conservar, en sus ordenadores, modelos del estado molecular de sus afiliados, simulaciones virtuales que podrían actualizarse constantemente con datos de micromatrices u otros a partir de sus visitas al médico y con nueva información científica sobre biología celular. BIBLIOGRAFIA COMPLEMENTARIA GENOMICS, GENE EXPRESSION AND DNA A RRAYS. David Lockhart y Elizabeth Winzeler en Nature, vol. 405, págs. 827836; 15 de junio, 2000. E XPERIMENTAL A NNOTATION OF THE H UMAN G ENOME USING M ICROARRAY TECHNOLOGY. D. D. Shoemaker et al. en Nature, vol. 409, págs. 922-927; 15 de febrero, 2001.
TEMAS 38
ARN
W O L S N I W E S E R E T
MicroARN El descubrimiento de unas moléculas de ARN diminutas en las células eucariotas ha modificado de raíz nuestro conocimiento sobre los mecanismos de regulación de la expresión génica César Llave
A
principio de los años noventa del siglo pasado, el estudio genético del nemátodo Caenorhabditis elegans revelaba la existencia de unas moléculas de ácido ribonucleico (ARN) diminutas y peculiares. Se las denominó pequeños ARN transitorios, pues se hallaban asociados con el control temporal del desarrollo larvario. La investigación ulterior descubrió que esos pequeños ARN eran, en ver-
S U R I V E D A I M O N O X A T E D L A N O I C A N R E T N I E T I M O C :
E T N E U F ; E V A L L R A S E C
dad, reguladores de la expresión de ciertos genes. Inhibían la traducción de sus ARN mensajeros en momentos clave del desarrollo. (El ARNm porta la información necesaria para la síntesis de proteína.) Desde entonces, y fruto del interés creciente hacia el conocimiento de tales moléculas, se han identificado numerosos ARN de pequeño tamaño con capacidad de modular la expresión génica en orga-
nismos muy dispares: protozoos, hongos, plantas y animales. Los pequeños ARN transitorios, o temporales, forman parte de un grupo numeroso y heterogéneo de ácidos ribonucleicos que no codifican proteínas. Se trata de los microARN. Aunque comenzamos a conocer sus funciones, queda mucho por averiguar en torno a su misión reguladora de genes y sus mecanismos de operación. Poco antes de que se descubrieran los microARN, se dio con un proceso de inesperado alcance: la interferencia por ARN. De este mecanismo de silenciamiento génico subsiguiente a la transcripción se encarga un segundo tipo de moléculas de ARN, los pequeños ARN interferentes. ARN interferent e
El silenciamiento por ARN constituye un proceso altamente específico de degradación del ácido ribonucleico. Se desarrolla después de la transcripción génica. Afecta, pues, a la viabilidad de los ARN producidos por los genes. Para poner en marcha ese mecanismo degradativo de desactivación génica se requiere la presencia en el citoplasma de moléculas de ARN bicatenario con una secuencia de nucleótidos idéntica a la de los genes diana. Los ARN bicatenarios son reconocidos por una RNasa de tipo III, específica de ARN de doble cadena. Esta enzima los procesa para dar lugar a pequeños dúplices de ARN, de 21 a 26 nucleótidos de longitud. De entre estos diminutos ARN interferentes, los menores (21 a 23 nucleótidos) se integran en un complejo ribonucleoproteico (RISC), donde actúan a modo de guías para el reconocimiento de los ARN diana. Fruto de la interacción entre este complejo y el ARN men1. FOTOGRAFIA AL MICROSCOPIO elec trónico de partículas víricas del virus del mosaico dorado de la judía (Begomovirus germiniviridae ).
28
TEMAS 38
E V A L L R A S E C
Partícula vírica ARN vírico
Intermediario replicativo (ARN-dc)
(1)
RNasaIII
Procesamiento del ARN-dc
ARN polimerasa vírica
(2) 21-22 nts 5'
3'
ARN vírico
RNasa III / piARN
RISC/piARN
(3) 23-26 nts
(4) Degradación de ARN vírico
2. MODELO DE SILENCIAMIENTO GENICO en las plantas, inducido por un virus. Una vez en el citoplasma celular, las partículas víricas se desensamblan y liberan su ARN genómico. El virus utiliza sus propias ARN polimerasas para replicarse en la célula infectada; se vale para ello de intermediarios de ARN de doble cadena (ARN-dc) (1 ). Estos inductores de silenciamiento se reconocen y procesan por una
sajero homólogo se produce la degradación y desactivación de este último. Además, los pequeños ARN interferentes pueden unirse por sí mismos con los ARN diana; operan entonces como iniciadores en una reacción de polimerización catalizada por una ARN polimerasa dependiente de ARN. Utilizando de molde el ARN diana, se genera un ARN bicatenario, que es reconocido de nuevo por la RNasaIII y degradado (“digerido”) en pequeños ARN int erf erent es. En numer osos experimentos se ha confirmado que basta la sola expresión “artificial” de moléculas inductoras (ARN bicatenario) en tejidos vegetales o en cultivos celulares para disparar la respuesta de silenciamiento, incluso en ausencia de posibles genes diana. Los pequeños ARN interferentes de mayor tamaño (24 a 26 nucleótidos) no participan en la degradación de los ARN mensajeros. Antes bien, se desplazan a otras células del organismo, donde inician una nueva respuesta de silenciamiento génico. N UEVA GENÉTICA
5'
3' Señal de silenciamiento
Producción de piARN
RNasaIII, para originar pequeños ARN interferentes (piARN) (2 ). Los piARN de menor tamaño se asocian con un complejo enzimático (RISC) para el reconocimiento y posterior degradación del ARN homólogo vírico (3 ). Los piARN de mayor tamaño se hallan asociados con la señal sistémica, que lleva la respuesta de silenciamiento a otras partes de la planta (4 ).
Silenciamiento génico en eucariotas
Pero, ¿qué funciones cumple el silenciamiento génico subsiguiente a la transcripción en los organismos eucariotas? Se ha comprobado que tal represión constituye un mecanismo de defensa contra ácidos nucleicos exógenos (transposones, por ejemplo) y, en el caso de las plantas, contra los virus. Cerca del 90 % de los virus vegetales poseen genomas de ARN de cadena sencilla, que se multiplican en la célula infectada a través de ARN bicatenarios muy estables. Estos virus replicativos son inductores muy potentes que disparan el mecanismo de interferencia por ARN y permiten que la célula infectada degrade el ARN vírico, para así superar la infección. El grupo de David C. Baulcombe, del Laboratorio Sainsbury en Norwich, Inglaterra, detectó pequeños ARN interferentes correspondientes a secuencias de varios virus vegetales (así, el virus X de la patata o el virus del cascabeleo del
tabaco) en plantas infectadas. Demostró que los virus eran reconocidos como objetivo a abatir por la maquinaria celular de silenciamiento. El grupo de Baulcombe demostró también que la infección de plantas transgénicas conducía a la represión del transgén; se trataba de plantas que expresaban constitutivamente el gen de la proteína de fluorescencia verde (GFP) infectadas con un virus quimera que portaba este mismo gen marcador integrado en su genoma. Si la expresión del genoma vírico está regulada post-transcripcionalmente por un mecanismo de silenciamiento, también lo estará la expresión de cualquier secuencia homóloga a la vírica; en este caso, GFP formaba parte de la secuencia vírica en el virus quimera. Pequeños ARN endógenos
La producción y acumulación de pequeños ARN interferentes constituye, pues, un paso clave en la ruta de silenciamiento génico. Su síntesis se 29
E V A L L R A S E C
3. MICROFOTOGRAFIA de partículas víricas del virus “y” de la patata (Potyvirus potyvi- ridae ).
loci dentro de los cinco cromosomas de la planta. Su longitud es de 21 a 25 nucleótidos, similar a los pequeños ARN interferentes originados en respuesta a un fenómeno de silenciamiento inducido por un ARN bicatenario. Estos pequeños ARN presentan homología perfecta de secuencia con genes codificadores de proteínas, transposones o genes estructurales, aunque la mayoría son homólogos con regiones intergénicas del genoma. Funciones de los pequeños ARN end ógenos
produce en repuesta a un inductor planta Arabido psis thaliana ha faciexógeno de silenciamiento, sea la for- litado la caracterización de estas dimima replicativa de un virus o sea cual- nutas moléculas de ARN endógenas. quier otro ARN con estructura bica- En particular, nos ha permitido acotenaria. Pero de la misma manera tar el origen de cada pequeño ARN que la maquinaria celular está pre- en el genoma de estos organismos, parada para regular la expresión de identificar entre ellos microARN, pegenes foráneos por mediación de pe- queños ARN interferentes, así como queños ARN interferentes, los orga- otras muchas moléculas de diminunismos eucariotas han desarrollado tos ARN cuya estructura, biogénesis diversas estrategias, algunas de ellas y función nos son todavía desconocibasadas en la codificación y síntesis das. Además, el estudio de todos estos de pequeños ARN, para el control de ARN nos ha permitido descubrir genes la expresión de sus propios genes. potencialmente regulados por un fenóEn diversos laboratorios se ha meno de silenciamiento génico postvenido aplicando, casi simultánea- transcripcional e identificar posibles mente, una misma estrategia para la genes sujetos a una regulación memultiplicación (“amplificación”), clo- diada por microARN. nación y secuenciación de pequeños En el caso de Arabido psis se han ARN endógenos en protozoos, plan- definido más de 200 secuencias únitas, nemátodos, moscas y mamíferos. cas de pequeños ARN. Algunas de esLa disponibilidad del genoma com- tas secuencias presentan homología pleto del nemátodo C. elegans , de con una sola región del genoma, mien Dr os op hi la me la no ga st er y de la tras que otras se alojan en múltiples 30
Cerca del 20 % de los pequeños ARN descritos en plantas presentan homología perfecta con secuencias genómicas dentro de regiones codificadoras de proteínas, pertenezcan a genes o a transposones. Basados en ese fenómeno peculiar de los vegetales, cabe sospechar que esta clase de pequeños ARN pudiera ser el resultad o de l silenciamiento de ARN endógenos. En el caso de los transposones, existen pruebas que ponen de manifiesto la capacidad de las plantas para limitar su expresión por medio del silenciamiento génico. De hecho, la naturaleza altamente repetitiva de los transposones, unida a la alta probabilidad de que se integren en el genoma y originen por ende transcritos con el potencial de formar estructuras bicatenarias, facilita que sean dianas de silenciamiento posttranscripcional. Habida cuenta del número estimado de transposones en el genoma de Arab idopsi s, el porcentaje de pequeños ARN localizados en transposones es sustancialmente mayor que el de alojados en genes codificadores de proteínas. De ello se desprende que tales moléculas intervienen de una manera decisiva en el control de la expresión de estos elementos móviles. De forma análoga, la expresión de genes codificadores de proteínas podría estar modulada por una estrategia reguladora similar. Algunos de los genes que portan secuencias homólogas con pequeños ARN producen preARN mensajeros cuya configuración en dúplex estable podría ser reconocida por la RNasaIII específica de doble cadena para su procesamiento en pequeños ARN interferentes. En otros casos, los ARN mensajeros diana podrían servir de molde para la síntesis de un ARN bicatenario en una reacción catalizada por una TEMAS 38
ARN po limerasa de pe ndiente de Transgénica GFP ADN; éste, lo mismo que el anterior, Virus quimera PVX-GFP sufriría una fragmentación, por parte 8 K de la maquinaria celular de silen166K 25K GFP CP 12K ciamiento, en pequeños ARN interferentes que contribuirían a la degradación de secuencias homólogas o estrechamente emparentadas. En conclusión, puesto que la expresión de transposones y algunos genes codificadores de proteínas parece estar regulada por un proceso de silenciamiento génico, cabe pensar que una porción de los pequeños ARN existentes en el citoplasma celular for0 13 20 man parte de una población más extensa de pequeños ARN interfeDías post-infección rentes. La planta puede, así, recurrir a esta herramienta molecular, no sólo 4. LOS VIRUS SON INDUCTORES y diana de la respuesta de silenciamiento génico. Por para defenderse ante los virus, sino expresión del transgén, las plantas con la proteína GFP emiten fluorescencia verde bajo también para controlar la expresión iluminación ultravioleta (día 0). Tras la infección con el virus quimera PVX-GFP la hoja se torna roja (coloración de la clorofila bajo luz ultravioleta) debido a la desactivación por de sus propios genes.
A R R E T A L G N I , H C I W R O N , Y R U B S N I A S O I R O T A R O B A L , E B M O C L U A B . C D I V A D
: E T N E U F
; E V A L L R A S E C
silenciamiento génico del transgén GFP (días 13 y 20). PVX es el virus X de la patata.
Regiones intergénicas
Aproximadamente el 90 % de los pequeños ARN encontrados en Arabidopsis thaliana y en otros organismos se corresponde con regiones intergénicas. Se sabe que tales zonas desempeñan un papel crucial en la producción de microARN implicados en la regulación de genes endógenos del organismo. Esto es así porque algunos de estos microARN homólogos con regiones intergénicas son al mismo tiempo complementarios con la secuencia de ARN mensajeros de genes endógenos de la planta. Como resultado de dicha complementariedad, los microARN se emparejan con sus ARN mensajeros diana e interfieren con su expresión. Las regiones intergénicas no son, en absoluto, meros espaciadores en el curso de la secuencia genómica. Para ser más exactos, algunas de las hasta hoy consideradas regiones intergénicas constituyen, en realidad, genes codificadores de precursores para la síntesis de microARN. En efecto, las regiones intergénicas que originan estos microARN se corresponden con secuencias dotadas de capacidad suficiente para formar precursores de ARN con estructura secundaria estable. Estos precursores de doble cadena son los sustratos sobre los que actúa una RNasaIII, similar a la enzima que da origen a los pequeños ARN interferentes, para generar microARN endógenos. Regulación de los microARN
Parece demostrado que la acumulación de estos microARN se regula durante el desarrollo del organismo. En el caso de los microARN descritos N UEVA GENÉTICA
en C.elegans, su producción tiene lugar a lo largo de las distintas fases del desarrollo del gusano. Tampoco en las plantas encontramos una síntesis aleatoria de microARN, sino que, en su mayoría, los microARN presentan patrones de acumulación específicos para un tejido determinado. Debe resaltarse también el alto grado de persistencia, a lo largo de la evolución biológica, de la producción de estos microARN. Algunos de los identificados en nemátodos son exactamente iguales que los encontrados en mamíferos; algunos de los
microARN encontrados en A. thaliana se hallan también presentes en Nico tiana bent hami ana y en Oryza sativa . MicroARN: biosíntesis y expresión
Algunos microARN descritos en plantas y animales presentan características idénticas, en cuanto a su biosíntesis y expresión, a las de los pequeños ARN transitorios de C. ele gans . De hecho, estos últimos pueden englobarse bajo la denominación común de microARN.
s N i R s A p o s d
o i ñ b e a r u q A n e P e
Arabidopsis thaliana
. U U . E E , N O G E R O E D L A T A T S E D A D I S R E V I N U , N O T G N I R R A C . C S E M A J
1 110 100 90 80 70 60 50 40 30 20 10
: E T N E U F
1
2
3
; E V A L L R A S E C
4
1 - Genes codificadores 2 - Transposones 3 - Genes estructurales 4 - Regiones intergénicas 5. DISTRIBUCION Y LOCALIZACION de pequeños ARN en el genoma de Arabidopsis tha- liana . En el eje de ordenadas de la gráfica se muestran el número de loci de la planta homólogos con pequeños ARN.
31
Desde el punto de vista estructural, los microARN son similares a los pequeños ARN interferentes. Presentan, sin embargo, ciertas peculiaridades distintivas. Todos los micro ARN tienen un tamaño próximo a los 21 nucleótidos y se expresan durante el desarrollo del organismo. Se originan a partir de precursores de ARN con estructura a modo de horquilla estable, que contienen la secuencia del microARN en uno de sus brazos; su producción depende de una enzima RNasaIII específica de ARN de doble cadena pero distinta de la que origina los pequeños ARN interferentes. Si bien todos los microARN responden a unos criterios establecidos de expresión y biogénesis, divergen en su función respectiva, en muchos casos todavía desconocida. Se va avanzando, pese a todo. Los pequeños ARN transitorios codificados por los genes lin-4 o let-7 se hallan implicados en el desarrollo temporal del nemátodo C. ele gans e inhiben la traducción de los ARN mensajeros dianas; interaccionan mediante emparejamiento parcial de bases con su región 3’ no codificadora. De esta manera, el reconocimiento del mensajero diana por parte del microARN no depende de una complementariedad de secuencia absoluta entre ambos, sino que ocurre incluso en presencia de varios errores. Es posible que algunos de los microARN identificados en animales y
plantas, para los que no se han encon- los genes diana y afecten a otros protrado genes diana con homología de cesos distintos de la traducción: la secuencia completa, funcionen como maduración del ARN mensajero o la pequeños ARN transitorios; se empa- localización y estabilidad del ARN. rejarían parcialmente con los ARN En este sentido, algunos microARN mensajeros diana y bloquearían su animales se emparejan con dominios, traducción. En el caso de las plantas de aproximadamente 8 nucleótidos, sise han identificado, mediante análi- tuados en regiones 3’ no codificadoras sis informático, algunos genes que de los ARN mensajeros. Dichos domipresentan homología parcial con nios están implicados en la represión microARN; podrían, pues, estar regu- post-transcripcional de la expresión lados potencialmente por un meca- de genes diana; se encargan, sobre nismo de este tipo. todo, de la estabilidad del mensajero Aparentemente, existen diferen- y de la eficacia traduccional. cias sustanciales entre los ARN menRecientemente, el grupo de James sajeros regulados por pequeños ARN C. Carrington, de la Universidad estatransitorios y los ARN mensajeros tal de Oregón, demostró que algunos supuestamente modulados por otros microARN de plantas están capacimicroARN. En primer lugar, la se- tados para dirigir el procesamiento cuencia complementaria entre el ARN específico de ARN mensajeros diana mensajero de la planta y el microARN y hacerlo de forma similar al modo en se encuentra mayoritariamente en el que los pequeños ARN interferentes interior de la región codificadora de fragmentan los ARN. Estos microARN la proteína; en la región 3’ no codifi- se originan, a partir de regiones intercadora del ARN mensajero se ubica génicas del genoma de la planta, por la de los pequeños ARN transitorios medio de transcritos precursores de lin-4 y let-7 en nemátodos. En segundo ARN con estructura secundaria estalugar, la región complementaria entre ble. La expresión de tales microARN el ARN mensajero de la planta y el se regula durante el desarrollo de A. microARN es única, mientras que son thaliana y, también, de N. bent hamúltiples las secuencias comple- miana y O. sativa; donde igualmente mentarias dentro la región 3’ no codi- se generan a partir de regiones interficadora de los mensajeros regulados génicas dotadas de capacidad para por pequeños ARN transitorios. formar transcritos con estructuras Otra posibilidad es que los mi- secundarias firmes. croARN animales y vegetales inteLos microARN presentan homoloraccionen con los ARN mensajeros de gía de secuencia total o parcial con los ARN mensajeros codificadores de factores de transcripción asociados a procesos de desarrollo y crecimiento Gen X Gen Y en plantas. Entre ellos se encuentran IGR ADN los codificados por los genes SCAgenómico RECROW , relacionados con el control (1) de la división radial en células de la raíz y la señalización hormonal y Precursor de microARN luminosa, por CUP-SHAPED-COTYNúcleo LED ONS2 , implicado en la formación del meristemo apical de la raíz, por genes de respuesta a auxinas y Citoplasma (2) por genes vinculados al desarrollo floral, o por genes PHAB ULOSA y Precursor de microARN con estructura secundaria estable PHAVOLU TA , que regulan la iniciación del meristemo y el desarrollo foliar. En este proceso, el ARN precursor o pre-microARN (con estructura secundaria) es reconocido por una (3) RNasaIII; la enzima lo corta espeRNasa III RNasa III cíficamente para producir el microARN correspondiente. Este se inteMicroARN (21-25 nucleótidos) gra en un complejo ribonucleoproteico (RISC) a modo de señal de especifi6. PRODUCCION DE microARN a partir de regiones intergénicas del gen oma. La región in- cidad, ya que determina el reconoci tergénica (IGR), situada entre los genes X e Y, se transcribe independientemente y gene- miento de los ARN mensajeros diana ra un transcrito precursor de microARN (1 ). Este se procesa para dar lugar a un precur- complementarios. Fruto de la interacción entre el sor definitivo con estructura secundaria estable (2 ). La estructura bicatenaria del precursor es reconocida por una RNasaIII, enzima que lo digiere y libera la secuencia RISC y el ARN mensajero se p roduce el corte de la molécula de mensajero del microARN (3 ).
E V A L L R A S E C
32
TEMAS 38
en la región de emparejamiento entre ambos. Aunque estos microARN parecen actuar de forma similar a como lo hacen los pequeños ARN interferentes, existe una diferencia notable en su biogénesis. Los pequeños ARN interferentes resultan del procesamiento de una molécula inductora de ARN bicatenario y, por tanto, se inscriben en una población numerosa de moléculas que se sintetizan a instancias de un fenómeno de silenciamiento. En otras palabras, cada molécula de ARN de doble cadena se procesa para dar lugar a multitud de pequeños ARN interferentes. Los microARN, por el contrario, poseen identidad propia y se originan independiente y específicamente a partir de una región intergénica del genoma de la planta; por eso, el procesamiento de cada ARN bicatenario precursor da lugar a un único tipo de microARN. Incidencia en el desarrollo vegetal
(1)
E V A L L R A S E C
ARN precursor de microARN lin-4
RNasaIII
Caenorhabditis elegans
microARN lin-4
(2)
Lin-14 ARNm diana
3'
UTR An
3'
(3)
5'
Inhibición de la traducción 3'
UTR An
3'
5'
Pero, ¿cuáles son las implicaciones del procesamiento, por microARN, 7. INHIBICION DE LA TRADUCCION de ARN mensajeros (ARNm) por pequeños ARN trande estos genes sobre el desarrollo de sitorios en el nemátodo Caenorhabditis elegans . El microARN lin-4 (o pequeño ARN tranla planta? La mayoría de los genes sitorio lin-4 ) se origina a partir de un precursor de ARN con estructura secundaria estadiana cuya expresión se halla regu- ble por mediación de una RNasaIII (1 ). El microARN interacciona a través de un lada por microARN se corresponde emparejamiento parcial de bases con la región 3’ no codificadora (UTR) del ARN mensacon factores de transcripción. Algu- jero diana (2 ); bloquea su traducción (3 ). nas de tales proteínas intervienen en el control del desarrollo de los meristemos. Este hecho sugiere que las rutas metabólicas dependientes de renciación y desarrollo de los tejidos En determinadas plantas, las proteímicroARN pudieran estar implicadas de la planta. nas supresoras de silenciamiento inhien el control de la expresión génica ben el procesamiento, mediado por durante el desarrollo de los orga- MicroARN microARN, de algunos ARN mensa y defensa anti vírica nismos eucariotas. jeros que codifican factores de trans Veamos un ejemplo ilustrativo de Los virus, parásitos obligados, nece- cripción. Tal labor obstructora se conexión entre ambos procesos: las sitan utilizar los factores, procesos y refleja en defectos del desarrollo de mutaciones de A. thaliana en los genes estructuras del huésped para su pro- la planta: repercute en el crecimiento caf , que codifica la RNasaIII, y hen1, pia multiplicación y consiguiente y la morfología. Con otras palabras, de función desconocida. Las plantas invasión sistémica. Estos factores, estas proteínas de origen vírico modumutantes presentan importantes procesos y estructuras forman la base lan la expresión de genes propios de defectos en el desarrollo; además, su de las interacciones de compatibili- la planta al entorpecer procesos básimaquinaria celular es incapaz de pro- dad entre el virus y el huésped que cos de su metabolismo celular. ducir microARN. En consecuencia, posibilitan el arraigo de la infección. Es posible que los virus, a través todos los procesos reguladores que En el marco de interacciones virus- de sus proteínas supresoras, aprovedependen de microARN se verán afec- huésped, el segundo puede desplegar chen esa obstrucción de la regulación tados en las plantas mutantes. mecanismos moleculares que, como génica mediada por microARN para Los genes PHA BULOSA y PHA - el silenciamiento génico, le permite activar o desactivar genes del huésVOLUTA ofrecen también un interés bloquear algunas de las etapas del ped y así crear las condiciones favoparticular. Se caracterizan por pre- ciclo vírico y oponerse a la infección. rables para la prosecución de su ciclo sentar homología casi perfecta con Los virus de plantas, y al menos algún biológico. microARN. Según parece, las plantas virus animal, han evolucionado bajo Cabe también que las plantas sinportadoras de mutaciones puntuales esta presión selectiva y han cifrado teticen microARN de una manera en la región del ARN mensajero de es- proteínas supresoras de la respuesta espontánea, constitutivamente o en tos genes, que es complementaria con de silenciamiento génico, con la respuesta ante la infección vírica; en el microARN correspondiente, mues- merma consiguiente de su eficacia ambos casos, con la facultad de recotran considerables alteraciones feno- protectora. nocer secuencias víricas y promover típicas. Estos ejemplos mencionados Se descubrió, hace poco, que algu- su desactivación. De modo general, ponen de manifiesto que la actividad nas de estas proteínas supresoras de la expresión de proteínas supresoras reguladora de los microARN es esen- origen vírico se interponían en la acti- durante la infección vírica inhibiría cial para la correcta formación, dife- vidad reguladora de los microARN. no sólo la regulación programada de N UEVA GENÉTICA
33
genes de la planta, sino también cualquier alteración que los microARN ocasionaran en secuencias del virus. Algunos de estos hipotético s microARN complementarios con secuencias víricas podrían ejercer funciones similares a los microARN que regulan la expresión de los genes endógenos de la planta. No sólo instarían el procesamiento de los ARN víricos, sino que se dejarían sentir en su traducción, estabilidad y localización celular.
Al grupo de Tho mas Tuschl, del Instituto Max Planck de Química Biofísica, debemos la demostración de que la transfección de pequeños ARN interferentes en cultivos de células de humanos y otros mamíferos impedía la expresión de genes endógenos homólogos. El hallazgo afianzó el estudio funcional de genes en células de mamíferos y abrió las puertas a su eventual uso con fines terapéuticos. Hoy, la expresión artificial de pequeños ARN en cultivos celulares se ha convertido en un método eficaz y específico para silenciar genes homólogos. Denominada, en su origen, silenciamiento génico mediado por ARN interferente, esta técnica innovadora se fundamenta en la desactivación dirigida de genes de interés por mediación de pequeños ARN sintetizados in vitro. Los ARN así sintetizados operan de modo idéntico a como lo hacen los pequeños ARN interferentes o alguno de los microARN descritos en plantas: reconocen los ARN mensajeros mediante complementariedad de secuencia y guían su degradación. Hasta la fecha, los pequeños ARN interferentes se han empleado con éxito para inhibir la replicación in vitro de diversos virus patógenos (poliovirus, virus VIH y virus de la hepatitis C). En numerosos estudios se ha comprobado que la transfección de estas pequeñas moléculas en cul-
MicroARN y te rapia génica
A diferencia de lo observado en las plantas, los microARN identificados en organismos animales no presentan un alto grado de homología con los correspondientes genes diana. Más bien se emparejan mediante complementariedad parcial de bases resultando en la supresión de la síntesis de proteína; sin embargo, los ensayos in vitro confirman que las células animales poseen la maquinaria bioquímica necesaria para realizar eficazmente el procesamiento de ARN mensajeros por microARN, siempre y cuando el grado de homología de secuencia entre ambos sea alto. La mayor parte de los genes regulados negativamente por micro ARN en los animales están implicados en procesos de diferenciación celular y apoptosis, organogénesis y desarrollo temporal.
(1)
Precursor de microARN
IGR/microARN
(2)
5' 3'
3'
5' microARN
RNasaIII
(3) Gen diana
ARNm diana 3'
5'
An
3'
RISC/ MicroARN
(4) E V A L L R A S E C
5' ARNm
5'
3'
5'
3' ARNm
An
8. MODELO DE PROCESAMIENTO DE ARN mensajeros mediado por microARN. El gen codificador del microARN alojado en la región intergénica (IGR/microARN) se transcribe y da origen a un precursor de microARN con estructura secundaria estable (1 ). Una RNasaIII específica de ARN bicatenario reconoce y degrada al precursor (2 ). El microARN así generado se integra en un complejo enzimático (RISC), donde actúa como guía para la identificación de los ARN mensajeros (ARNm) diana (3 ). El complejo RISC-microARN provoca el procesamiento del ARNm para dar lugar a dos nuevas especies de ARN: 5’ ARNm y 3’ ARNm (4 ).
34
tivos celulares produce inmunidad frente a la infección vírica: inducen la destrucción de los ARN víricos. En el caso particular del virus del sida, la investigación in vitro reveló que el ARN vírico del complejo formado tras la entrada del virus en la célula (donde se forma un ADN vírico intermediario a partir del ARN vírico) se degrada rápidamente; la integración del ADN provírico en el genoma del huésped se bloquea en células inoculadas con pequeños ARN dirigidos contra diversas regiones del genoma vírico. Además de utilizar directamente los virus como secuencias diana, otras estrategias alternativas emplean estos pequeños ARN para silenciar la expresión de otros ARN mensajeros celulares que cifran proteínas cruciales del ciclo vírico. Encontramos un ejemplo ilustrativo de ello en el control de la infección por VIH en células de mamíferos mediante el silenciamiento del ARN mensajero celular que codifica el factor CD4; esta proteína constituye el principal receptor de VIH en células humanas. La transfección de células T con pequeños ARN interferentes provocó la disminución de la expresión de CD4 en la superficie de la mayoría de las células; en consecuencia, cayó sustancialmente la tasa de infección por VIH. Se han cosech ado res ultados similares si tomaba por diana el receptor CCR5, un correceptor necesario para la entrada de VIH en la célula. Otro ejemplo prometedor del potencial de la aplicación de ARN interferente en terapéutica nos lo ofrece la protección contra la “hepatitis fulminante”, enfermedad que se manifiesta en forma de fallo hepático severo. Los ensayos realizados en ratones han demostrado que el tratamiento con microARN contra receptor Fas situado en la superficie celular bloquea el desarrollo de la enfermedad y mejora la recuperación, aun cuando tales moléculas se apliquen después de la inducción de la enfermedad. El receptor Fas es un mediador de la muerte celular en el hígado, se produzca ésta por apoptosis o por necrosis. La reducción de la expresión de Fas en etapas precoces de la hepatitis podría prevenir su progresión hacia un estado más virulento de la enfermedad. Una de las aplicaciones de la técnica de interferencia por ARN que mayores expectativas levanta es el empleo de pequeños ARN en terapia génica contra el cáncer en humanos. Algunos estudios se han centrado en la inhibición de la expresión de la telomerasa, enzima que se manifiesta TEMAS 38
. U U . E E , N O G E R O E D O D A T S E L E D D A D I S R E V I N U , N O T G N I R R A C . C S E M A J : E T N E U F
; E V A L L R A S E C
PLANTA INFECTADA
PLANTA SANA
PLANTA SANA
PLANTA INFECTADA
PLANTA TRANSGENICA
PLANTA SANA
PLANTA TRANSGENICA
9. SINTOMATOLOGIA INDUCIDA por un virus en plantas de Arabidopsis thaliana . Las pro teínas supresoras de silenciamiento génico producidas durante la infección vírica se in terponen en el metabolismo celular al alterar la expresión de genes de las plantas. Las plantas transgénicas que expresan constitutivamente proteínas supresoras muestran una sintomatología idéntica a la observada durante la infección por virus.
en la mayoría de las células malignas pero no en las células normales. Estos trabajos confirman la capacidad de bloquear la producción de telomerasa en líneas celulares cancerígenas (carcinomas y sarcomas) en las que se habían introducido ARN inter- mas celulares, por cuya razón el efecto ferente. silenciador sobre los ARN mensajeSin embargo, la aplicación de esta ros desaparece al cabo de unas pocas nueva técnica de interferencia por generaciones. Para solventar el pro ARN debe antes solucionar algunos blema, algunos grupos están trabaproblemas claves que limitan su uso jando en el diseño de vectores víricos con fines clínicos en humanos. El prin- capaces de expresar microARN de cipal reto reside en la necesidad de forma estable y en cualquier célula o desarrollar sistemas eficaces que per- tipo celular. mitan introducir directamente estos Habrá que superar otra barrera: el pequeños ARN en el tejido de interés. alto grado de especificidad en el recoLa mayoría de los métodos emplea- nocimiento de los mensajeros diana dos resultan ineficientes o inadecua- por parte de los microARN. Sépase dos. Algunos, como la transfección hi- que basta un solo cambio nucleotídico drodinámica, permiten aplicar estas en la secuencia del gen diana para moléculas en los órganos del ratón, si desarbolar por entero la respuesta bien su puesta en práctica para uso de silenciamiento. Una situación cuya clínico en humanos es inviable. importancia se hace patente al obserOtro problema que guarda estre- var la enorme diversidad de ciertos cha relación con la aplicación de los virus patógenos de humanos que, pequeños ARN interferentes estriba como el VIH, presentan altas tasas en su estabilidad dentro del cito- de error en su replicación y muestran plasma celular. Estos microARN se una gran variabilidad genómica entre hallan sujetos a degradación por enzi- las personas infectadas. N UEVA GENÉTICA
El estudio y conocimiento de estas pequeñas moléculas reguladoras nos han abierto las puertas a una nueva concepción en el entendimiento del control de la expresión génica. BIBLIOGRAFIA COMPLEMENTARIA GLIMPSES OFA TINY RNA WORLD. G. Ruvkun en Science, vol. 294, págs. 797-799; 2001. AN RNA MICROCOSM. D. Baulcombe en Science, vol. 297, págs. 2002-2003; 2002. RNA INTERFERENCE. G. Hannon en Nature, vol. 418, págs. 244-251; 2002. R EVEALING M ICRO -RNA S IN P LANTS . L. Jones en Trends in Plant Science, vol. 7, págs. 473-475; 2002. SIRNAS: A NEW WAV E OF RNA-B ASED THERAPEUTICS. G. Coburn y B. Cullen en Journal of Antimicrobial Chemotherapy, DOI: 10.1093/jac/dkg166; 2003.
35
Interferencia de ARN La mayoría de las células animales y vegetales contienen un sistema de silenciamiento de genes. Se valen del mismo para triturar el ARN que producen Nelson C. Lau y David P. Bartel
C
uando se observa una célula viva sobre el porta de un microscopio parece sosegada. Pero debajo de esa quietud externa se esconde una frenética actividad bioquímica. El genoma de ADN del interior de una célula vegetal o animal contiene millares de genes. Dejada a su aire, la maquinaria de transcripción de la célula expresaría de inmediato cada uno de los genes del genoma: desenrollaría la doble hélice del ADN, transcribiría cada gen en su correspondiente ARN mensajero de una hebra (ARNm) y, por último, traduciría los mensajes de ARN en sus proteínas. Ninguna célula podría trabajar con semejante alboroto. Deben las células silenciar la mayoría de sus genes, para permitir que entre en acción el subgrupo apropiado. En la mayoría de los casos, el código del ADN de un gen se transcribe en ARNm sólo si una determinada proteína se ha acoplado, en su ensamblaje, a una región reguladora especial del gen. Algunos genes, sin embargo, son tan subversivos, que nunca se les debería conceder la libertad de expresión. Si a los genes de los elementos genéticos móviles se les dejara emitir sus mensajes de ARN, podrían saltar de un punto a otro del ADN produciendo
cáncer u otras enfermedades. En la cipio, cabe la posibilidad de idear formisma senda, si se permitiera a los mas de obligar a la iARN a silenciar virus expresar su mensaje sin ningún genes implicados en el cáncer, en las control, no tardarían en secuestrar infecciones víricas y en otras patololos mecanismos celulares de síntesis gías. De lograr materializarlo, nos de proteínas para aplicarlos a la fa- hallaríamos ante un prometedor bricación de proteínas víricas. campo, inédito, para la medicación. Las células disponen de medios preMientras llega ese día, los investiventivos y de contragolpe. Hace ya gadores que trabajan con plantas, algún tiempo se identificó un sistema, moscas y otros organismos experila respuesta de interferón, que las mentales han conseguido ya que la células humanas despliegan cuando iARN suprima casi cualquiera de los los genes víricos penetran en su inte- genes en estudio, lo que les permite rior. La respuesta puede impedir la intuir la función del gen. En cuanto expresión de casi todos los genes. El herramienta de investigación, la iARN proceso recuerda la parada de las ha tenido un éxito inmediato. Merced prensas por orden gubernativa. a ella, centenares de laboratorios aborEn fecha más reciente se descubrió dan ya cuestiones que estaban lejos un mecanismo de seguridad mucho de su alcance hace escasos años. más enérgico y preciso; lo poseen casi Aunque la mayoría de los grupos de todas las células animales y vegeta- investigación utilizan la interferenles. A este sistema censor se le conoce cia de ARN como medio para consepor interferencia de ARN, abreviado guir un fin, algunos se han centrado en iARN. Cuando se expresa un gen en la propia naturaleza del fenómeno. amenazador, la maquinaria de la A nosotros nos interesa el papel de la iARN corre a silenciarlo: intercepta maquinaria de la iARN en el desarrollo y destruye sólo el ARNm transgresor, normal de plantas, hongos y animasin perturbar los mensajes de los les, sin excluir al hombre. genes restantes. Conforme se ha ido sondeando el Un silencio extraño modo de operar del censor celular y Las primeras pistas sobre la exisdeterminando los estímulos que lo tencia de la iARN aparecieron caactivan, ha aumentado el interés de torce años atrás. Richard A. Jorlos expertos. Pues, en línea de prin- gensen, hoy en la Universidad de
G N I N N E R B A N A J
36
TEMAS 38
Ariz ona, y Joseph Mol, de la Libre de sistencia opuesta por las plantas a razón por la cual no puede formar doble Arizona, Amsterda Amst erdam, m, cada uno por su cuenta, la infección. hélice con el ARN mensajero. insertaron en petunias de flor púrEl grupo reveló que las plantas no La escena estaba preparada para el pura copias adicionales del gen de su sólo podrían inactivar genes especí- experimento decisivo. Se llevó a cabo, pigmento nativo. Confiaban en que ficos en los virus, sino que también unos cinco años más tarde, en los lalas plantas, así manipuladas, dieran estos agentes podrían disparar el boratorios de Andrew Z. Fire, de la flores de un violeta más intenso. Pero silenciamiento de genes selecciona- Institución Carnegie de Washington, los pétalos de sus petunias se tiñe- dos. Algunas plantas de Dougherty y Craig C. Mello, de la facultad de ron de manchas blancas. que no lograron suprimir por sí mis- medicina de la Universidad de MassaJorgensen y Mol dedujeron que las mas sus genes CP, se infectaron con chusetts. Fire y Mello sospecharon copias extra habían despertado la cen- el virus, que se replicaba sin proble- que las preparaciones anteriores de sura de los genes del pigmento púr- mas en las células vegetales. Cuando ARN con c on sentido y ARN antisen antisentido tido pura, incluidos los genes naturales de los investigadores midieron, más ade- que se inyectaban a los gusanos carelas petunias; el fenómeno provocó la lante, el ARN transcrito por los genes cían de la pureza exigida; probableaparición de flores variegadas o albi- CP de las plantas afectadas, vieron mente, contenían trazas de ARN binas. A esta censura doble, sobre un gen que estos mensajes se habían desva- catenario. Quizás ese ARN bicatenario insertado y el gen nativo correspon- necido casi por completo: la infección alertaba a los censores, pensaron. diente, la llamamos cosupresión. Más había provocado la inactivación de Para comprobar sus sospechas, Fitarde se observaría en hongos, mosca los genes CP. re, Mello y sus colaboradores inocudel vinagre y otros organismos. Mientras tanto los biólogos que laron en los nemátodos ora ARN moLas primeras pistas para desentra- experimentaban con el nemátodo nocatenario, ora ARN bicatenario, ñar el misterio en torno al silencia- Caenorhabditis elegans , un gusano correspondiente al gen unc-22. (Este miento de los genes llegaron unos años diminuto y transparente, andaban gen desempeña un papel destacado después. William G. Dougherty, de la desconcertados en su empeño por en la función muscular.) Las cantiUniversidad estatal de Oregón, había averiguar qué ocurría cuando usa- dades elevadas de ARN unc-22 monoempezado con su grupo a investigar ban ARN “antisentido” para inacti- catenario, con sentido o antisentido, plantas de tabaco especiales: habían var los genes que estudiaban. Propio apenas si ejercían efecto alguno en sido manipuladas genéticamente para del ARN antisentido es emparejarse los gusanos. Pero bastaban unas que incluyeran en su ADN varias co- con una secuencia determinada de pocas moléculas del ARN unc-22 bicapias del gen CP del virus del mosaico ARNm, ARN m, a la man manera era en que do doss heh e- tenario para inducirles espasmos, en del tabaco ( Marmor Marm or eroden er odenss). El gen bras complementarias de ADN se ellos y en su progenie. Se hallaban CP determina la proteína de la cu- entrelazan para formar una hélice ante un signo inequívoco de que algo bierta vírica. doble. Cada hebra de ADN o de ARN había comenzado a interponerse en Cuando estas plantas se expusie- es una cadena de nucleótidos, repre- el camino de la expresión del gen ron al virus, algunas permanecieron sentados por las letras A, C, G y U unc-22 . Fire y Mello observaron idéninmunes a la infección. Dougherty (este último en el ARN) o T (en el tico, y sorprendente, efecto silenciaatribuyó la inmunidad a la cosu- ADN ADN). ). Un nucle nu cleóti ótido do de C se enla e nlaza za dor en casi todos los genes que estupresión. Las plantas reaccionaban siempre con otro de G, y uno de A se diaron, desde los musculares a los ante la expresión inicial de sus genes empareja con otro de U o de T. Una genes de la fertilidad y viabilidad. DeCP de origen foráneo mediante la hebra de ARN antisentido se une con nominaron a este fenómeno “interinactivación de dicha expresión y, la hebra de un ARNm complemen- ferencia de ARN” (iARN), para resalluego, mediante el bloqueo también tario y crean una estructura bicate- tar el papel clave del ARN bicatenario de la expresión del gen CP del virus naria, incapaz de traducirse en una en la censura del gen corresponinvasor (que necesita la proteína de proteína útil. diente. la cubierta para producir la infecCon el paso de los años, estos expeLos estudiosos de vegetales y honción). El laboratorio de Dougherty rimentos con ARN antisentido acome- gos centraron también su atención prosiguió su trabajo. Demostró que tidos en diversos organismos alcanza- sobre el ARN bicatenario en su búsla inmunidad no requería la sínte- ron un éxito desigual. Sin embargo, fue queda del responsable del silenciasis de la proteína de la cubierta por para todos una sorpresa que el ARN miento. Demostraron que las hebras las plantas; debía haber algo, rela- “con sentido” bloqueara la expresión de ARN que podían replegarse sobre cionado con el ARN transcrito desde del gen. El ARN con sentido tiene la sí mismas para formar largas tiras de el gen CP, que diera cuenta de la re- misma secuencia que el ARNm diana, ARN bicatenario constituían potentes
N UEVA GENÉTICA
37
A N O Z I R A E D D A D I S R E V I N U
/ N E S N E G R O J . A D R A H C I R
1. LAS PRIMERAS PISTAS sobre la existencia de censores de genes en el reino vegetal se recabaron entre las petunias púrpura. Tras insertar genes adicionales de pigmentos en plantas normales (izquierda ), ), echaron flores ribeteadas de blanco o con extensas zonas albinas (centro y derecha ). ).
inductores del silenciamiento. Otros análisis revelaron que, en la cosupresión, se requería un gen que capacita a las células para convertir ARN monocatenario en ARN bicatenario. De tal gavilla de hallazgos cabía inferir que las petunias de Jorgensen y Mol reconocían los genes extra del pigmento como insólitos (por un mecanismo que sigue siendo misterioso) y convertían su ARN mensajero en ARN bicatenario, que provocaba el silenciamiento tanto de los genes extra como de los nativos. El concepto de un ARN bicatenario inductor explica también por qué la infección vírica amordazaba los genes CP en las plantas de Dougherty. Marmor mor ero erodens dens El virus del tabaco Mar había producido ARN bicatenario del genoma vírico completo a medida que iba reproduciéndose, un fenómeno que acontece con muchos virus. Las células vegetales respondían bloqueando los mensajes de ARN de todos los genes asociados con el virus,
incluidos los genes CP incorporados en el ADN de la planta. Nadie entendía que semejante sistema, enérgico y ubicuo, de regulación de la expresión génica hubiera pasado inadvertido tanto tiempo. Levantado el velo del misterio que le envolvía, genéticos y bioquímicos se han volcado ahora en el análisis de su mecanismo de acción. Corte y empalme de los mensajes genéticos
Pronto se confirmó el fenómeno de la interferencia de ARN en algas, platelmintos y mosca del vinagre; ramas dispares del árbol evolutivo. La demostración de su presencia en células humanas típicas y de otros mamíferos resultó, sin embargo, una empresa harto más compleja. Cuando una célula humana se infecta con un virus que produce ARN bicatenarios, puede entrar en un estado que podríamos llamar de “cerrojazo”: la enzima PKR bloquea
Resumen / Inte Interfe rferen rencia cia de d e ARN AR N Se ha convertido en práctica rutinaria la inserción, en organismos experimentales, de genes manipulados. Se trata de una técnica conocida desde hace cierto tiempo. Más reciente, sin embargo, es el descubrimiento de un medio eficaz y apropiado para silenciar, en el mismo interior celular, un gen específico. En su mayoría, las células animales y vegetales poseen mecanismos internos que emplean formas insólitas de ARN, molécula mensajera genética, para silenciar determinados genes de un modo natural. Esta maquinaria ha evolucionado. Protege de genes hostiles a la célula y regula la actividad de los normales durante el desarrollo celular. La investigación del proceso abre el camino para la fabricación de fármacos que se apoyen en los mecanismos de interferencia de ARN para prevenir o curar ciertas patologías.
38
la traducción de todos los ARN mensajeros —normales y víricos— y otra enzima, la ARNasa L, destruye indiscriminadamente los ARN mensajeros. Estas reacciones ante los ARN bicatenarios se integran en la respuesta al interferón; se les considera componentes de la misma porque se disparan más fácilmente después de que las células hayan estado expuestas a interferones, moléculas que las células infectadas segregan para alertar de peligro a las células vecinas. Por desgracia, cuando los investigadores introducen ARN bicatenarios artificiales (los empleados para inducir la interferencia de ARN en gusanos y moscas) en el interior de células de mamíferos maduros, la respuesta al interferón inactiva todos y cada uno de los genes de la célula. Se requería, pues, conocer mucho mejor el funcionamiento de la interferencia de ARN antes de que pudiera usarse de manera rutinaria sin hacer saltar las alarmas del interferón. Además Adem ás de los investig inve stigado adores res pionepio neros, que ya hemos mencionado, Thomas Tuschl, de la Universidad Rockefeller, Philip D. Zamore, de la facultad de medicina de la Universidad de Massachusetts, Gregory Hannon, del Laboratorio Cold Spring Harbor de Nueva York, y muchos otros han contribuido a lo que hoy sabemos sobre el mecanismo de la transferencia de ARN. ¿Cómo opera la iARN? En el interior de una célula, el ARN bicatenario sale al encuentro de la enzima “Dicer” (“la tajadora”). Mediante el proceso químico de hidrólisis, Dicer trocea las cadenas largas de ARN en fragmentos, a los que se da el nombre de ARN de interferencia pequeños (ARNip). Cada ARNip consta de unos 22 nucleótidos. La enzima Dicer corta el ARN bicatenario por puntos especiales, en lugares ligeramente no coincidentes; por ello, cada ARNip resultante tiene dos nucleótidos sin emparejar en un extremo. El dúplex ARNip se TEMAS 38
CORTESIA DE LISA TIMMONS / UNIVERSIDAD DE KANSAS ; TIMMONS ET AL. EN GENE , VOL. 263; 2001
desenrolla entonces; una de las ca- en el interior de las células de mamídenas del dúplex se carga en un en- feros se convertía, de la noche a la samblaje de proteínas para formar mañana, en una realidad al alcance el complejo silenciador inducido por de la mano. En cuestión de horas, con ARN (CS (CSIR) IR).. los ARNip puede desactivarse casi Dentro del complejo silenciador, la cualquier gen de interés en un culmolécula de ARNip se acomoda de tivo celular, incluidas las líneas celusuerte tal, que las moléculas de ARN lares humanas. Y, además, el efecto mensajero puedan encontrarse con persiste durante días, lo suficiente ella. El CSIR se las verá con milla- para completar un experimento. 2. LOS NEMATODOS LUMINISCENTES deres de ARNm diferentes que hay en mostraron que la interferencia de ARN opecualquier célula en cualquier mo- Una herramienta soñada raba en los animales, no sólo en las planmento. Pero el ARNip del CSIR se Si importante resulta la interferen- tas. Cua Cuando ndo los gus gusano anoss cuy cuyas as cél célula ulass adherirá sólo al ARN mensajero que cia de ARN para los biólogos de mamí- expresan un gen determinante de una proexactamente se complemente con su feros, mayor servicio rinde a quienes teína fluorescente (izquierda ) se tratan con propia secuencia nucleotídica. Por investigan en organismos inferiores. ARN bicatenario correspondiente al gen, tanto, a diferencia de la respuesta Los estudiosos de gusanos y vegeta- desaparece la luz (derecha ).). del interferón, el complejo silencia- les se encuentran con una ventaja dor es muy selectivo a la hora de esco- añadida: en estos organismos, el efecger su ARNm objetivo. to censor se extiende y difunde más vierta en terapia contra el cáncer, las Cuando un ARN mensajero que allá del punto en que se introdujo el infecciones víricas, ciertas alteracioencaje finalmente se haya adherido ARN bic bicate atenar nario. io. En raz razón ón de ese nes genéticas dominantes y otras al ARNip, la enzima “Slicer” (“reba- carácter sistémico, se han aprove- enfermedades que podrían contronadora”) parte en dos la cadena de chado en gusanos las posibilidades larse al evitar que los genes implica ARN. El CSIR libera entonces enton ces los dos que ofrece la iARN, con sólo alimen- dos sinteticen las proteínas culpables trozos de ARNm (incapacitados ahora tarlos de bacterias genéticamente de la patología. para dirigir la síntesis de proteína) manipuladas para que sinteticen el En numerosas publicaciones se y prosigue en su labor. En sí mismo, ARN bicate bi catenari narioo corresp cor respond ondient ientee al apunta ya en esa dirección. Al menos el CSIR permanece intacto, libre para gen que se desea silenciar. seis laboratorios han conseguido, en salir al encuentro de otro ARN menFácil de inducir y poderosa en su cultivos de células humanas, detesajero y escindirlo. A través de esa acción, la interferencia de ARN aviva ner transitoriamente la proliferación vía, la iARN censora emplea trozos la imaginación de los científicos. Se- del virus VIH, el de la poliomielitis de ARN bicatenarios a modo de lista cuenciados ya genomas enteros de y el de la hepatitis C. Se expusieron negra para identificar y silenciar los diversos organismos, podemos re- las células a ARNip; las células incorrespondientes ARN mensajeros. currir a la interferencia de ARN para terrumpieron entonces la síntesis de El equipo liderado por David C. explorar, de una manera sistemá- proteínas cruciales para la reproducBaulcombe, del Laboratorio Sains- tica, qué sucede cuando se silencia ción de los agentes patógenos. Más bury en Norwich, detectó ARNip en un gen. Es lo que han realizado cua- recientemente, los grupos dirigidos vegetales. Posteriormente, el grupo tro grupos en millares de experi- por Judy Lieberman, de la facultad de Tuschl los aisló de la mosca del mentos paralelos; cada uno se encargó de medicina de Harvard, y Mark A. vinagre y demostró su papel en la de inactivar, en C. elegans , un gen Kay, de la facultad de medicina de la silenciación de genes, tras sinteti- diferente. Se ha emprendido un estu- Universidad de Stanford, dieron a zar ARNip artificiales y usarlos para dio similar de genomas enteros de conocer que los ARNip inyectados en dirigir la destrucción de ARNm dia- plantas; varios equipos se han aunado ratones, en condiciones de presiones nas. Cuando lo consiguió, Tuschl se para acometer una investigación extremadamente elevadas, frenaron planteó si estos trocitos de ARN po- exhaustiva de la iARN en células de hepatitis y libraron a muchos de una drían deslizarse en las células de los mamíferos. enfermedad hepática que hubiera mamíferos sin suprimir la red de El potencial que encierra la inter- acabado con su vida. alerta de la respuesta del interferón, ferencia de ARN no se le ha escapado A pesar p esar de esto estoss éxitos é xitos de labor laboraaque habitualmente se desentiende a la industria farmacéutica. En algu- torio, habrán de pasar años antes de de los ARN bicatenarios de menos de nos laboratorios se recurre a ese fe- que terapias basadas en la iARN pue30 pares de nucleótidos. Introdujo nómeno para rastrear todos los ge- dan aplicarse en los hospitales. El ARNipp sintéticos ARNi sintét icos en cultivos cultivo s de célu célu-- nes de una clase determinada, en reto más difícil será posiblemente el las de mamíferos. El experimento busca de objetivos prometedores para de la administración. Aunque el efecto ratificó lo esperado. Se silenciaron los nuevos medicamentos. El silencia- de iARN puede diseminarse en una genes diana; nunca se activó la res- miento sistemático de genes mediante planta o un gusano, tal propagación puesta de interferón. la iARN podría permitir descubrir un no parece que ocurra en el hombre y Los éxitos de Tuschl sirvieron de gen imprescindible para el desarro- otros mamíferos. Añádase que los acicate para muchos investigadores. llo de ciertas células cancerosas, pero ARNip ARN ip son muy vo volum lumino ino sos si se Desde hacía tiempo, los genéticos menos importante para el de las célu- comparan con los fármacos al uso; no habían conseguido introducir genes las normales. Podría entonces crearse pueden tomarse como comprimidos, nuevos en las células de mamíferos, un candidato farmacológico que se in- porque el sistema digestivo los dessirviéndose de vectores víricos. Pero terpusiera en la síntesis de la proteí- truiría antes de que se absorbieran. bloquear un gen de interés para de- na de dicho gen y contrastar así la e fi- Se están ensayando diversas vías para terminar su función propia podría cacia del fármaco contra el cáncer. diseminar los ARNip por distintos llevar meses de trabajo en el labora- Los laboratorios han apostado fuerte órganos y conducirlos a través de las torio. Ahora, el sueño dorado de silen- sobre la posibilidad de que el silen- membranas externas de las células. ciar con facilidad un gen particular ciamiento de un gen por iARN se conOtro método para resolver el proN UEVA GENÉTICA
39
Así funciona la censura genética EXPRESION NORMAL DE UN GEN
DESENCADENANTES DEL SILENCIAMIENTO DEL ARN a ARN bicatenario procedente de elementos genéticos móviles o genes anómalos
NUCLEO CELULAR
Dicer
ADN
La enzima Dicer corta el ARN
Cadena molde del ADN c Precursor de microARN
Par de bases complementarias
Dicer
ARNm ARNip o microARN
SUPRESION DE LA EXPRESION DE UN GEN POR iARN
Proteína
Hebra sencilla de ARNip o microARN Ribosoma
LAS CELULAS luminiscen- tes manifiestan la traduc- ción correcta de un gen (que codifica la proteína “lámina”) en proteína.
blema de la administración lo aporta la terapia génica. Un gen nuevo que produzca un ARNip particular podría cargarse en el interior de un virus benigno que lo llevaría luego hasta el interior de las células que infectara. A este respecto, el grupo de Beverly Davidson, de la Universidad de Iowa, se ha valido de un adenovirus modificado para introducir genes productores de ARNip en el cerebro e hígado de ratones. Pero la terapia génica aplicada al hombre se enfrenta hoy con dificultades técnicas y normativas. Si dejamos de lado los problemas relacionados con la administración, es obvio que los nuevos planteamientos relacionados con la iARN han levantado un entusiasmo que no desper40
La célula desenrolla las hebras de ARN
ARNm
taron las técnicas del ARN catalítico, paldan esa tesis los trabajos de ni el ARN antisentido; ambos méto- Ronald H. A. Plasterk, del Instituto dos podrían usarse, en principio, con Holandés del Cáncer, y de Hervé fines terapéuticos al impedir la inter- Vauch erer, del Institu to Nacio nal vención de ARN mensajero nocivos. Francés de Investigaciones Agrarias. Esa esperanza se apoya, en parte, en Demostraron que los gusanos moderel reconocimiento de que la interfe- nos cuentan con la interferencia de rencia de ARN domeña la maquina- ARN para defenderse contra los eleria natural de censura de genes que mentos genéticos móviles y, las planla evolución ha ido perfeccionando en tas, contra los virus. el transcurso del tiempo. Pero la interferencia del ARN cumple también otras funciones bioló¿Por qué tienen censores gicas. Los gusanos y las malas hierlas células? bas mutantes, con la enzima Dicer S e cree, en efecto, que el mecanismo alterada o en cuantía insuficiente, de la censura de genes emergió hace sufren numerosos defectos de desaunos mil millones de años para pro- rrollo y no pueden reproducirse. ¿Por teger algunos precursores de vege- qué acarrea alteraciones tan protales, animales y hongos contra virus fundas, en animales y plantas, una y elementos genéticos móviles. Res- merma de la enzima Dicer? TEMAS 38
) s
b ARN bicatenario de un virus replicante
d ARNip artificiales administrados mediante moléculas lipídicas
Complejo silenciador inducido por ARN (CSIR)
U
na célula censura la expresión de un determinado gen cuando se interpone en el camino del ARN mensajero (ARNm) transcrito a partir del gen dañino; evita con ello que los ribosomas traduzcan el ARN R E L ). De la puesta en L en proteína activa según lo habitual (panel izquierdo E F E K marcha de la maquinaria de censura se encargan moléculas pequeñas C O R de ARN bicatenario que portan sueltos los extremos. De los ARN bica D A D tenarios, largos y producidos al autocopiarse secuencias génicas (a )o I S R E virus (b ) , Dicer, una enzima tajadora, trocea cortos ARNip. Los precur V I N U ), secuencias de ARN reguladoras, resultan tam L sores de microARN ( c H C S bién de la acción de la mencionada enzima. Así se nos faculta para, U T S A luego, utilizando moléculas lipídicas, insertar ARNip artificiales en las M O células (d ). H T ; W Los fragmentos de ARN se separan en cadenas sueltas ( panel infe- O L S rior ), que se combinan con proteínas para formar un complejo silencia N I W E dor inducido por ARN (CSIR). El CSIR aprehende entonces el ARNm S E R E que sea complementario de la breve s ecuencia de ARN. Si el empare T jamiento es realmente perfecto el mensaje secuestrado se trocea en fragmentos inútiles (hilera superior ). Pero un emparejamiento menos cabal insta una respuesta diferente; por ejemplo, que el CSIR bloquee los movimientos ribosómicos y, con ello, suspender la traducción del mensaje en proteína ( hilera inferior ). a i f a r g o r c i m (
Si las dos hebras de ARN presentan un alto grado de complementariedad, se produce el corte del ARNm ARN escindido
Emparejamiento incorrecto del ARN
Si las dos hebras están mal emparejadas el CSIR se une al ARNm
De acuerdo con cierta hipótesis, una vez que la naturaleza adquirió un mecanismo tan eficaz para el silenciamiento de genes subversivos en virus y secuencias móviles de ADN, comenzó a pedir en préstamo las virtualidades de la iARN y aplicarlas a diversos fines. Cada célula tiene el mismo conjunto de genes; lo que distingue a una de otra son los genes que se han expresado y los que no. La mayoría de las plantas y de los animales arrancan de una célula embrionaria, que se divide y termina por dar lugar a una multitud de células de diversos tipos. Para que esto ocurra, muchos de los genes que se han expresado en las células embrionarias deben inactivarse conforme va madurando el órgano. Otros genes, hasta entonN UEVA GENÉTICA
Los ribosomas se amarran sobre el ARNm
NO SE SINTETIZA PROTEINA
LA LUMINISCENCIA se des- vanece en las células que han captado ARNip artificiales correspondientes al gen “lá- mina”.
ces inactivos, entran en funciona- mejantes a los ARNip, aunque dismiento. Cuando la maquinaria de la tintos por su origen). Mientras que iARN no está ocupada en la defensa los ARNip proceden de los mismos contra el ataque, interviene mani- tipos de genes o regiones genómicas fiestamente con su ayuda en el silen- que terminan por quedar silenciaciamiento de genes celulares norma- dos, los microARN proceden de genes les durante las transiciones del cuya única misión es producir estos desarrollo, necesarias para formar ARN reguladores diminutos. tipos celulares dispares (neuronas o La molécula de ARN inicialmente miocitos, por ejemplo) u órganos dife- transcrita de un gen de microARN rentes (cerebro y corazón). —el precursor del microARN— se ¿Qué es entonces lo que mueve a pliega sobre sí misma, formando una la maquinaria de la iARN a silenciar estructura similar a una horquilla. determinados genes normales en el Con la intervención de la enzima interior de la célula? En algunos ca- Dicer, se rebana de la horquilla la sos, una célula puede producir ARN sección media; la pieza resultante se bicatenario, largo, con ese fin especí- comporta a la manera de un ARNip, fico. A menudo, sin embargo, los estí- con una salvedad importante: no cenmulos disparadores son “microARN” surará ningún gen que semeje al que (pequeños fragmentos de ARN se- lo ha producido, pero sí a otro distinto. 41
G A T N O C R E H P O T S I R H C E D A I S E T R O C S E N E G A M I E D N O I C A E R C E D A M E T S I S ; 2 0 0 2 , O I L U J
3. SI SE LES INYECTA ADN que contiene el gen de la luciferasa, los ratones devienen fotoemisores (izquierda ). Pero ese efecto se desvanece si, por el contrario, se les inyecta ARNip correspondiente al gen (dere- cha ); se evidencia así una nueva vía para extraer todo el partido posible de la iARN en mamíferos.
E D 4 ; 8 1 4 . L O V , E R U T A N
N E . L A T E Y E R F F A C C M . P N O T N A
Igual que sucedió con el fenómeno de la iARN en general, los biólogos tardaron en darse cuenta del potencial que encerraban los microARN para regular la expresión génica. Hasta hace poco, sólo tenían noticia de dos microARN, el lin-4 ARN y el let-7 ARN, descubiertos por los grupos de Victor Ambros, de la facultad de medicina de Dartmouth, y Gary Ruvkun, de la facultad de medicina de Harvard. En los últimos años, nosotros, Tuschl, Ambros y otros hemos descubierto centenares de genes adicionales de microARN en gusanos, plantas y hombre. Con Christopher Burge, del MIT, hemos estimado que el hombre tiene de 200 a 255 genes de microARN; ello significa casi un 1 por ciento del número total de nuestros genes. Los genes de microARN se habían escapado a la detección porque los programas informáticos diseñados para examinar montones de datos de secuencias genómicas no se habían afinado para este tipo insólito de gen, cuyo producto final es un ARN, no una proteína. Algunos microARN, en particular los de las plantas, dirigen el proceso 42
de corte y empalme de sus ARNm dianas. Lo demostraron James C. Carrington, de la Universidad estatal de Oregón, y Zamore. Nosotros y Bonnie Bartel, de la Universidad Rice, hemos comprobado que los microARN vegetales se ordenan fundamentalmente hacia genes que intervienen en el desarrollo. Al limpiar sus mensajes procedentes de ciertas células durante el desarrollo, las iARN facilitan que las células maduren en el tipo correcto y formen las estructuras pertinentes. Merece subrayarse que los ARN lin-4 y let-7 , cuya existencia se descubrió en los gusanos en razón de su papel decisivo para pautar el desarrollo, pueden emplear también una segunda táctica. Los ARNm que constituyen la diana de estos microARN, son sólo aproximadamente complementarios de los microARN; tales mensajes no son escindidos. Existe otro mecanismo que bloquea la traducción de los ARN mensajero en proteínas funcionales. A la vista de estos mecanismos diferentes de silenciamiento, los biólogos mantienen fija la atención sobre las funciones de los ARN pequeños y de
la maquinaria de la iARN. Se multiplican los datos indicadores de que los ARNip no sólo atrapan ARN mensajeros para su destrucción, sino que además dirigen el silenciamiento de ADN (en el caso más extremo, eliminando los genes del genoma). En la mayoría de los casos, sin embargo, el ADN silenciado no se destruye; sencillamente, experimenta un empaquetamiento más denso para que no pueda transcribirse. Desde unos comienzos humildes en flores blancas y gusanos contrahechos, nuestras ideas acerca de la interferencia de ARN han recorrido un largo trecho. Casi todas las facetas de la biología, biomedicina y bioingeniería comienzan a verse afectadas por las iARN, al par que la técnica del silenciamiento de genes se extiende por nuevos laboratorios y organismos experimentales. Más aún, la iARN nos plantea muchas cuestiones fascinantes . ¿En qué procesos biológicos repercuten la interferencia de ARN, los ARNip y los microARN? ¿De qué modo los mecanismos moleculares de la iARN operan en el plano atómico y en e l de enlace químico? ¿Qué enfermedades cabe atribuir a deficiencias en la iARN o a los procesos de microARN? A medida que se vayan despejando estos interrogantes, nuestras ideas sobre el fenómeno se irán asentando hasta constituir un sólido fundamento para la medicina genética.
BIBLIOGRAFIA COMPLEMENTARIA RNA I : N ATURE A BHORS A D OUBLE STRAND . György Hutvágner y Philip D. Zamore en Current Opinion in Genetics & Development , vol. 12, n.o 2, págs. 225-232; abril de 2002. GENE SILENCING IN MAMMALS BY SMALL INTERFERING RNAs. Michael T. McManus y Philip A. Sharp en Natur e Reviews Genetics , vol. 3, págs. 737-747; octubre de 2002. MICRORNA s: AT THE ROOT OF PLANT DEVELOPMENT ? Bonnie Bartel y David P. Bartel en Plant Physiology, vol. 132, n.o 2; págs. 709-717; junio de 2003.
TEMAS 38
W O L S N I W A S E R E T
EPIGENETICA
El genoma oculto Cuando se daban por conocidos casi todos los datos del ADN, han aparecido dos capas amplias de información en los cromosomas, en buena parte ocultas, que afectan a la herencia, el desarrollo y la enfermedad W. Wayt Gibbs
H
ace unos veinte años, los astrónomos estaban convencidos de que la rotación de las galaxias no se podía explicar sólo a partir de las leyes de la gravedad y la posición de los cuerpos celestes. Poco a poco empezaron a admitir que el universo no estaba tan vacío como parecía, sino que debía contener algún tipo de materia obscura. Aunque se desconocían su composición química y su funcionamiento, no faltaban indicios de su existencia. La investigación de la materia oscura y, más recientemente, la energía oscura obligó a revisar teorías admitidas; incluso a sustituirlas. Al propio tiempo, sin embargo, se dio un nuevo impulso a la astrofísica y la cosmología. Un fenómeno parecido comienza ahora a producirse en la genética molecular. En 2003 se celebró el quincuagésimo aniversario del descubrimiento de la doble hélice; el Proyecto Genoma Humano anunció también la terminación del borrador de la secuencia del ADN de Homo sapiens. Se había logrado domeñar el ADN in vitro. Eso se creía. Sin embargo, cuando se compara el genoma de especies sin parentesco próximo y se escudriña el funcionamiento de los cromosomas in vivo , se observan fenómenos inexplicables en el marco de las teorías vigentes. Las revistas y los congresos científicos han empezado a hacerse eco de nuevos datos que contradicen la idea aceptada de que los genes, segmentos de ADN que codifican proteínas, constituyen la única fuente de herencia y encierran los planos de la vida. Del mismo modo en que la materia oscura influye sobre el destino de las galaxias, el genoma oculto ejerce un control del desarrollo y de los rasgos distintivos de los organismos, desde las bacterias hasta el hombre. El genoma contiene mucho más que genes codificadores de proteínas. Nos hallamos muy lejos de conocer el al cance de ese genoma oculto. Sí sabemos que existen al menos dos capas de información, amén de los genes tradicionales. Una de ellas está entrelazada con el ADN intergénico, las vastas secuencias no codificadoras que interrumpen y sepa-
ran los genes. Desechadas durante largo tiempo por irrelevantes para la síntesis de proteínas, lo cierto es que muchas de estas secciones se han conservado, en su mayor parte intactas, en el transcurso de millones de años de evolución. Cabe, pues, suponer que desempeñarán algún papel indispensable para el organismo. De hecho, un elevado número de las mismas se transcriben en variedades de ARN que realizan funciones muy diversas. Hay incluso quienes sospechan que las diferencias entre individuos de la misma especie, o incluso entre especies, se originan en las variaciones de ese ADN redundante, o “chatarra” por usar el vulgarismo al uso. Más allá de la secuencia de ADN, existe en los cromosomas otra capa de información harto más maleable. Las marcas epigenéticas, incrustadas en una mezcolanza de proteínas y metabolitos, rodean, apoyan y se unen al ADN. Operan a través de códigos crípticos y mecanismos desconocidos. A diferencia de los genes, las señales epigenéticas se asientan, se borran y se reescriben en instantes. Por tanto, mientras que las mutaciones genéticas persisten durante toda una vida, los errores epigenéticos, implicados en una lista creciente de patologías, pueden revertir mediante fármacos. Se están ensayando ya ciertos tratamientos basados en esta estrategia para pacientes de leucemia. Como afirma Carmen Sapienza, de la Universidad de Temple, aumenta el convencimiento de que lo que puede ocurrir en el genoma, termina por suceder. Sapienza comenzó a investigar los fenómenos epigenéticos cuando nadie les prestaba particular atención, por considerárseles anomalías menores. 1. LOS LUNARES DE COLOR MARRON OSCURO del iris podrían deberse a la acción del genoma oculto. Hay rasgos que no se transmiten mediante los genes, sino a través de modificaciones químicas de los cromosomas, cambios que se regulan en parte por fragmentos del ADN redundante. A diferencia de las mutaciones genéticas, estos rasgos heredables son a menudo reversibles; aparecen en unas células y no en otras. (La esfera blanca en el iris no es más que el reflejo de la luz que ilumina el ojo.)
E K P I R K E I M A J
Los peligros del dogmatismo
Llevará años, quizá décadas, construir una teoría que explique y fundadamente la interacción entre ADN, ARN y señales epigenéticas en un sistema autorregulador. Pero resulta claramente necesario encontrar un nuevo modelo teórico que sustituya al dogma central de la biología, en el que se ha basado, desde los años cincuenta, la genética molecular y la biotecnología. A tenor del mismo, el ADN se transcribe en ARN y éste se traduce en proteínas, encargadas de la mayoría de las funciones biológicas. La información genética se almacena en las hebras arrolladas de ADN, concretamente en las bases químicas adenina (A), timina (T), guanina (G) y citosina (C), que se emparejan para formar los peldaños de la escalera de ADN (C con G y A con T). Un gen está constituido por una secuencia determinada de bases, de uno de los lados de la escalera, que especifica una proteína. La síntesis de proteínas, expresión de los genes, discurre en cuatro pasos. Primero, una enzima se une al cromosoma y se desliza a lo largo del gen, transcribiendo la secuencia de una hebra del ADN en una hebra sencilla de ARN. A continuación, los intrones, segmentos del ARN transcrito inicial no codificadores, se eliminan; los fragmentos restantes se empalman para formar ARN mensajero. El ARN mensajero sale entonces del núcleo y pasa al citoplasma, se encuentra con los ribosomas, que lo traducen en una cadena de aminoácidos. Por fin, cada cadena se pliega en función de las interacciones entre sus aminoácidos, formando una estructura tridimensional intrincada, característica de cada proteína. Esta estructura tridimensional les confiere una gran versatilidad. Unas
proteínas forman músculos y órganos; otras constituyen enzimas, que catalizan, metabolizan o señalan. Las hay también que regulan genes al unirse a secciones específicas del ADN o del ARN. No es sorprendente, por tanto, que el dogma central de la genética molecular considere, con escasas excepciones, que una secuencia de ADN constituye un gen sólo si se traduce en una proteína. Cuando se dice que el genoma humano consta de unos 27.000 genes, se alude, por lo común, a los genes que codifican proteínas. Se trata de una cifra provisional, pues las estimaciones oscilan entre 20.000 y 40.000. Con todo, confirma que no existe una correspondencia clara entre la complejidad de una especie y su número de genes. La mosca del vinagre tiene menos genes codificadores que un nemátodo; el arroz tiene más que el hombre. En cambio, la cantidad de ADN no codificador sí parece acompasar a la complejidad del organismo. Participa de esta idea John S. Mattick, de la Universidad de Queensland en Brisbane. En los organismos superiores, hombre incluido, los genes se dividen en exones, fragmentos codificadores de proteínas, e intrones, extensos fragmentos que no codifican. En los cromosomas humanos, los exones representan menos del 2 por ciento del ADN. Por tanto, los 3000 millo nes de pares de bases que porta cada célula de nuestro cuerpo deben cumplir alguna otra misión. Sin embargo, los intrones y las largas secuencias de ADN intergénico se han considerado siempre material redundante, “chatarra” evolutiva. Tal visión comienza a tambalearse. Se está descubriendo un número ingente de “genes” con un cometido claramente funcional, aun cuando no
Resumen / Genes ocultos Desde hace tiempo, los genéticos han centrado su atención en la escueta
región del ADN que contiene las instrucciones para la síntesis de proteínas. El ADN restante, que, en el caso de los humanos, alcanza el 98 por ciento del total, se descartaba por redundantes. Pero el descubrimiento de muchos genes ocultos que operan a través del ARN, y no de las proteínas, ha puesto en cuestión ese punto de vista. Tales genes de sólo ARN , cortos y difíciles de identificar, desempeñan, en algu-
nos casos, funciones importantes en la salud y el desarrollo de los orga nismos. Intervienen también formas activas de ARN en la regulación de una capa epi-
genética de información heredable que reside en los cromosomas, aunque fuera de la secuencia de ADN.
46
determinen ninguna proteína y produzcan sólo ARN. El término “gen” ha recibido siempre una definición bastante borrosa. Estos genes que sólo producen ARN añaden obscuridad a su significado. Para evitar confusiones, se tiende, de un tiempo a esta parte, a evitar el vocablo gen; para referirse a cualquier segmento que se transcriba en ARN algunos prefieren la expresión “unidad de transcripción”. Durante el Congreso Internacional de Genética que tuvo lugar en julio de 2003 en Melbourne, Claes Wahlestedt, del Instituto Karolinska de Estocolmo, hizo públicos sus resultados; de acuerdo con sus estimaciones, fundadas en el estudio exhaustivo del genoma del ratón, habría entre 70.000 y 100.000 unidades de transcripción, la mitad de las cuales sin función codificadora. Si anda en lo cierto, por cada secuencia de ADN que determina una proteína, habría otra que opere exclusivamente a través de formas activas de ARN; formas que no constituyen meros anteproyectos de proteínas, sino que alteran de forma directa el comportamiento celular. Lo que se predica del ratón podrá, a buen seguro, aplicarse al hombre y a otros organismos. En el Instituto Nacional estadounidense de Investigaciones sobre el Genoma Humano se han comparado extractos de genomas del hombre, vaca, perro, cerdo, rata y siete especies más. Mediante análisis por computador se han identificado 1194 segmentos que presentan, en diversas especies, variaciones sólo menores. De lo que se infiere que se trata de secuencias que contribuyen a la adaptación evolutiva de las especies. Lo más sorprendente es que sólo 244 de estos segmentos se encuentran en el interior de una secuencia nucleica codificadora de proteínas. Alrededor de dos tercios de las secuencias conservadas residen en intrones; el resto se encuentra disperso entre el ADN intergénico. No sería de extrañar que el concepto de ADN “chatarra” se convierta en un ejemplo clásico de cómo la doctrina admitida puede desvirtuar la interpretación de las observaciones. Haber ignorado la posibilidad de que estas secuencias no codificadoras transmitieran información paralela en moléculas de ARN ha constituido uno de los grandes errores sufridos por la biología molecular. Más que un mensajero
Con la nueva perspectiva, comienzan a descubrirse en el ARN una TEMAS 38
) 8 5 9 1 0 E R U T A N / 8 3 0 1 . 0 1 : I O D ( 3 0 0 2 E D O T S O G A E D 0 2 ; E R U T A N
N E . L A T E
K I N T A L A P . F R E I V A J E D O S I M R E P N O C O S E R P M I E R
2. GRANDES DIFERENCIAS en el aspecto y la salud de los orga- terfiere en la acción de un microRNA producido por un gen de sónismos pueden deberse a pequeños cambios en los genes. Las lo ARN, las Arabidopsis mutantes desarrollaron defectos toscos plantas Arabidopsis , por ejemplo, tienen hojas en forma de cu- (derecha ). El microARN controla los niveles de actividad de nuchara (izquierda ), pero cuando, por manipulación genética, se in- merosos genes.
amplia gama de misiones celulares. pondieron bien a la presencia de ese tualmente no se transcribe en ARN. Igual que las proteínas, algunos trans- gen foráneo, que controla la deter- Se la denomina a veces copia de segucritos de ARN interaccionan con otros minación sexual y la expresión de los ridad, porque la célula recurre a ella fragmentos de ARN, con ADN, con genes ligados al sexo. Pero en una para reparar una lesión del gen. proteínas e incluso con moléculas cepa, el intruso hizo gala de su nomEn algunos casos, sin embargo, esta pequeñas. Ahora bien, si las proteí- bre: todos los ratones de la misma cadena complementaria actúa por su nas operan de un modo analógico, el murieron antes de la madurez. El gen cuenta: mientras el gen se está trans ARN lo hace, siguiendo la metáfora, Sxl se había insertado en medio de cribiendo en ARN mensajero, su alter de un modo digital. Las proteínas se un pseudogén y lo había alterado. eg o produce un ARN antisentido, unen a sus moléculas diana por seme- Este pseudogén, makorin1-p1, es una dotado de una secuencia comple janza estructural, es decir, como la copia jibarizada de makorin1, un gen mentaria. Cuando un ARN normal llave a su cerradura. El ARN, en cam- antiguo que los ratones comparten se encuentre con su correspondiente bio, se caracteriza por una secuencia con la mosca del vinagre, nemátodos ARN antisentido, las dos hebras se específica, como los códigos postales. y otras muchas especies. Aunque se unirán para formar una doble hebra Así, un fragme nto de ARN pued e ignora la función de makorin1, sí se que impide la síntesis génica de la promoverse sin rumbo hasta tropezar sabe que los ratones poseen grandes teína. con un ADN (u otro ARN) que tenga cantidades de pseudogenes de makoSe sabía que bacterias y plantas una secuencia complementaria. Los rin1 y que ninguno de ellos deter- podían fabricar ARN antisentido. dos brazos de la escalera unen enton- mina proteínas. Si estos pseudogenes Muchos pensaron que, de darse en los ces sus peldaños: las bases C empa- no codifican, cabe preguntarse por mamíferos, constituiría una rareza. rejadas con las bases G, las T o U con qué mueren los ratones que pierden Pero en abril de 2003, Galit Rotman las A. uno de ellos. y su grupo de la empresa CompuGen, Los pseudogenes, copias defectuoPor alguna razón, se desactiva de Tel Aviv, acabaron con tal singusas de genes funcionales, ofrecen un makorin1 —y por lo que parece sólo laridad. Tras una exhaustiva insbuen ejemplo de la potencia infrava- él— cuando se bloquea makorin1-p1. pección de las bases de datos del lorada del ARN. La investigación del Con otras palabras, el ARN consti- genoma humano, llegaron a la con ADN humano ha puesto de manifiesto tuido a partir del pseudogén controla clusión de que al menos 1600 genes la existencia de un número similar la expresión del gen “real”, cuya humanos (probablemente muchos de genes y de pseudogenes. Durante secuencia remeda, aun cuando los más) tenían una cadena compledecenios, los pseudogenes se habían dos residan en cromosomas diferen- mentaria que producía ARN anticonsiderado fósiles moleculares, res- tes. Por tanto, ‘pseudo’ no es el prefi- sentido. tos de genes degradados por muta- jo que mejor describe la actividad de Estos ARN en liza podrían supriciones y desechados en el curso de la makorin1-p1. mir un gen a través del bloqueo de evolución. Pero hace poco, el equipo Resulta todavía prematuro avanzar su ARN mensajero. Rotman, sin dirigido por Shinji Hirotsune, de la que muchos pseudogenes originan un embargo, sospecha que se sirven del Universidad de Saitama, publicó el ARN activo. Pero existe una plétora mecanismo de interferencia del ARN descubrimiento del primer pseudo- de otras fuentes dispersas por las (iARN), un sistema de seguridad que gén funcional. regiones obscuras del genoma. A ca- las células animales y vegetales utiHirotsune buscaba obtener rato- da gen codificador de una proteína le lizan para silenciar genes. Cuando nes transgénicos que portaran el gen corresponde una secuencia de ADN en una célula aparece ARN de doble sex -let hal (Sxl ) de la mosca del vina- complementaria que se asienta en el hebra, las enzimas lo trocean en fraggre. La mayoría de los ratones res- otro brazo de la escalera y que habi- mentos que reciben el nombre de N UEVA GENÉTICA
47
Progresión de la genética
D
esde que la invención de la técnica del ADN recombinante posibilitó el desarrollo de la ingeniería genética, la investigación opera “hacia atrás”. Se escoge un gen de interés, se le estudia en un cultivo celular o en un organismo, se observan los cambios provocados con su presencia y, por fin, se deduce la función del gen. Se trata de un enfoque reduccionista, clásico y potente. Pero a medida que la fracción oculta del genoma (las secuencias funcionales del ADN que se suponían redundantes) gana protagonismo, se pone sobre el tapete un problema desconocido, a saber, que esa genética retrógrada desemboca en un túnel. De ahí el interés creciente por un nuevo enfoque de sentido contrario: progresivo. Se trata de identificar los genes, clásicos o no, con unas técnicas que miran hacia adelante. En este contexto, la compañía Phenomix, de La Jolla, ha puesto en funcionamiento una línea de producción de ratones mutantes. En cada grupo de ratones, las mutaciones aleatorias de su genoma desactivan no sólo genes que codifican proteínas, sino también otros genes ocultos que sólo producen formas activas de ARN. Photomix ha comenzado a la vez con ratones sanos y con otros con patologías análogas a las humanas diabetes, asma, artritis o enfermedad de Parkinson. Algunas mutaciones inducen o alivian los síntomas de estas alteraciones en el ratón. Se realiza entonces un barrido genético para determinar las mutaciones responsables de tales efectos. Está todavía por ver si este nuevo enfoque inspirará un diseño de fármacos más eficaz. De momento, esa genética progresiva ha sacado ya a la luz fenómenos genéticos insospechados: los pseudogenes funcionales, por ejemplo.
ARN de inte rfer en cia pe qu eñ os producido por el gen JAW como si (ARNip). Las dos hebras de ARNip se tratara de un virus. Pero la sese desenrollan entonces y una de las cuencia de JAW se empareja con un cadenas se encarga de encontrar e grupo de genes que producen proincapacitar cualquier molécula de teínas, miembros de una familia que ARN me nsaj ero qu e se un a a su controla la forma y el tamaño de la secuencia. Este sistema censor pro- planta. El censor celular desactiva tege las células contra los virus, que cada uno de ellos recortando casi a menudo vacían su carga en forma por completo el ARN mensajero que de ARN de doble hebra. Además, transcriben. Así, el JA W , un gen constituye una herramienta muy útil diminuto que sólo produce ARN, sirpara los investigadores ya que les ve de palanca para que las células permite silenciar a voluntad cual- de Ara bidops is ajusten el “volumen” quier gen [véase “Interferencia de de un conjunto de genes codificado ARN”, por Nelson C. Lau y David P. res de proteína cruciales. Cuando Bartel; I NVESTIGACIÓN Y C IENCIA , Weigel y los suyos crearon plantas octubre de 2003]. transgénicas en las que los microSin embargo, ni los pseudogenes ARN no podían realizar su funci ón, ni los ARN antisentido pueden ex- los nuevos vegetales enfermaron y plicar el perfil foliar de Arabidop- se deformaron. sis , una mala hierba de la familia En pocos años, se han encontrado de la mostaza. Sus hojas recuerdan centenares de microARN; sólo en el la forma de una cuchara. Según un hombre, más de 150. Parecen constiartículo que Detlef Weigel y su tuir una buena herramienta de conequipo, del Instituto Max Planck de trol genético para los organismos. AlBiología del Desarrollo en Tubinga, rededor de la mitad de los microARN publicaron en Nat ure en agosto de del hombre también aparecen, en for2003, la planta debe sus elegantes ma casi idéntica, en el ADN de un pe z curvas simétricas, en parte, a un de la familia Tetraodontidae, aun microARN. cuando las dos especies tomaron disDescubiertos hace unos años en los tintos caminos evolutivos hace 400 nemátodos, los microARN son ca- millones de años. denas cortas de ARN no codificador Sigue sin comprenderse qué hacen que se doblan sobre sí mismas, a la en el hombre esos 150 microARN. manera de horquillas. En Ar ab i- Anna M. Krichevsky, de la facultad dopsis , la maquinaria de la interfe- de medicina de Harvard, sospecha rencia de ARN captura el microARN que podrían desempeñar un papel 48
importante en el desarrollo del cerebro, por lo menos. En su laboratorio se han valido de un chip de genes para identificar, en neuronas de ratón, hasta 44 clases diferentes de microARN. En septiembre de 2003, Krichevsky señaló que los niveles de nueve microARN se regulaban con suma precisión a medida que se desarrollaba el cerebro del múrido. Para Diya Banerjee, de la Universidad de Yale, nos encontramos en la antesala de una explosión de conocimientos en el nuevo dominio que se ha abierto. Ana lógico y digit al
Si se nos permite la imagen, las proteínas vendrían a ser los percherones de la célula, en tanto que el ARN activo porta a veces la fusta. El ARN se desenvuelve con la eficacia de una proteína en operaciones de catálisis, señalización y activación. Para sorpresa de no pocos, interviene incluso en determinadas enfermedades hereditarias. Los genéticos clínicos se esforzaron a lo largo de más de nueve años en descubrir el gen de la hipoplasia de cartílago y cabello. Esta enfermedad recesiva se identificó entre los amish: uno de cada 19 lleva una copia del gen defectuoso, causante de un enanismo poco habitual. Los que sufren esta enfermedad no sólo tienen una baja estatura, sino que además corren un riesgo elevado de padecer cáncer y trastornos inmunitarios. Maaret Ridanpää, de la Universidad de Helsinki, siguió la pista de este gen hasta el cromosoma nueve, secuenció una región extensa del mismo y estudió, uno por uno, los diez genes codificadores de proteínas situados en aquella zona. Ninguno de ellos causaba la enfermedad. Por fin, en 2001, Ridanpää y sus colaboradores identificaron el responsable: un gen que sólo produce ARN, el RMPP . El ARN transcrito a partir del RMPP se une con proteínas para formar una enzima que actúa en el interior de las mitocondrias, orgánulos generadores de energía de la célula. Basta un cambio en una sola base de este ARN para imponer la diferencia que separa una talla y salud normales de una estatura y vida cortas, si la misma mutación se hereda de ambos padres. Recientemente, se ha descubierto que estos ARN “analógicos”, que se repliegan, lo mismo que las proteínas, en formas comple jas, resultan esenciales para el funcionamiento de enzimas que protegen los cromosomas y escoltan señales proteicas segregadas hacia el exterior de la membrana celular. TEMAS 38
Genes singulares
L
os genes, de acuerdo con la doctrina admitida, constituyen segmentos de ADN que codifican proteínas funcionales. Sin embargo, esas secuencias integran sólo un 2 por ciento del genoma humano. El resto corresponde a ADN que
no se dedica a ese menester, pero que dista de resultar superfluo. Están apareciendo muchos genes no codificadores que originan formas de ARN sorprendentemente activas; entre ellas, las silenciadoras o reguladoras de genes codificadores.
Núcleo celular
El ARN antisentido se origina a partir de la hebra del ADN complementario situada en el lado opuesto de un gen codificador. Los ARN antisentido pueden interceptar el ARN mensajero transcrito a partir del gen (ARNm), evitando la traducción a proteína.
Gen codificador de proteína
ARNm
El ARN antisentido se une al ARNm complementario y bloquea el mecanismo de síntesis proteica.
ADN complementario ARN antisentido
Los genes codificadores de proteínas contienen secuencias sin función codificadora, los intrones. Los intrones se podan del transcrito inicial de ARN; las secciones codificadoras se empalman entonces para generar un ARNm maduro. Aunque muchos intrones se degradan, algunos contienen elementos activos como los microARN, que utilizan la interferencia del ARN para controlar otros genes.
Transcrito de ARN del gen
Sección codificadora
Intrón
ARNm maduro El mecanismo de interferencia del ARN procesa el microARN...
Intrón degradado
... y lo usa para destruir selectivamente ARNm producido por genes determinados.
MicroARN
ARNm interceptado
Gen
Los riboconmutadores, una forma de ARN recientemente descubierta, actúan como conmutadores genéticos de precisión. Producidos en muchos casos a partir de ADN intergénico, se pliegan en estructura compleja. Una parte del ARN plegado se une a una molécula diana. Otra parte contiene el código para sintetizar una proteína. El riboconmutador se activa y produce la proteína sólo en presencia de su molécula diana.
N UEVA GENÉTICA
Secuencia del riboconmutador Proteína resultante
ARN riboconmutador
Secuencia codificadora de proteína
Secuencia no codificadora Estado inactivo
Estado activo
Molécula diana W O L S N I W E S E R E T
49
N A G R O M H G U H
3. IDENTICOS EN TODO, MENOS EN EL NOMBRE, estos ratones de una misma camada y pertenecientes a una cepa endogámica comparten el ADN prácticamente en su totalidad. Sin embargo, su color varía del amarillo dorado al caoba. Ello se debe a las variaciones en las marcas epigenéticas del ADN intergénico. El color del pelo de estos ratones no puede deducirse de las teorías genéticas actuales.
ciones del Genoma Humano ha invertido 36 millones de dólares en un ambicioso proyecto: la “Enciclopedia de Elementos de ADN”. En tres años, se pretende catalogar todo tipo de proteínas y ARN sintetizados a parintergénico. Estos conmutadores tir de un escogido uno por ciento del genéticos de precisión se han extraí- genoma humano. do de especies pertenecientes a toda Nadie sabe todavía qué panorama la escala orgánica. Probablemente, genético se nos abrirá una vez salpues, estaban ya en el último ante- ga a la luz esa capa de información pasado común, en los albores de la ahora oculta. El ADN redundante evolución. que antaño se desechó por ignorarse En agosto de 2003, publicaron un su función, podría quizá convertirestudio sobre una familia de ribocon- se en el fundamento de la complejimutadores que regula la expresión dad humana. Así lo avalan pseudode no menos de 26 genes de Bac illus genes, ARN antisentido, microARN sub tilis ; todos de suma importancia, y riboconmutadores. El ARN activo, al tratarse de genes que el microor- como se empieza a saber ahora, conganismo necesita para metabolizar tribuye a controlar la estructura el azufre y aminoácidos. Breaker cal- general de los cromosomas y algucula que B. sub tilis posee al menos nas de sus modificaciones químicas 68 genes, casi el 2 por ciento del con- cruciales; dicho de otro modo, cons junto total, bajo el control de ribo - tituye una nueva capa de informaconmutadores. En su laboratorio han ción epigenética. comenzado ya a sintetizar moléculas híbridas analógico-digitales, aptas para la destrucción selectiva de gérmenes. BIBLIOGRAFIA COMPLEMENTARIA
Tal vez la forma más curiosa de este ARN descubierta hasta la fecha la constituya el riboconmutador. Fue aislado en 2003 por Ronald R. Breaker, de la Universidad de Yale. Lo mismo que otros muchos, también el equipo de Breaker se cuestionaba cómo pudieron sobrevivir, hace miles de millones de años, los primeros precursores químicos en un mundo de ARN, es decir, antes de que existieran el ADN y las proteínas. El grupo de Yale imaginaba que tales protoorganismos necesitarían los ARN para llevar a cabo misiones de sensores y conmutadores que les facultaran responder a cambios en el entorno y en su metabolismo. Para someter a prueba esta hipótesis, se aprestaron a producir moléculas de ARN con dichas capacidades. Crearon varios conmutadores sintéticos de ARN, largas moléculas de ARN que poseen al mismo tiempo un extremo codificador y otro no codifi- La visión global cador. Cuando el ARN se pliega, el A medida que se identifican nuevos extremo codificador se vuelve sensi- genes de ARN activo en los intrones ble a una determinada molécula. El y el ADN intergénico, tanto tiempo encuentro con esta diana provoca la olvidados, se desvanece la imagen de activación del conmutador; ello com- poseer un listado completo para el porta que el otro extremo, portador hombre o cualquier otra especie supede las instrucciones para la síntesis rior. A diferencia de los genes prode proteína, cambie de forma. Por ductores de proteínas, cuya secuenconsiguiente, el riboconmutador pro- cia está limitada por señales de ‘inicio’ mueve la síntesis proteica, cual si se y ‘fin’, los genes de sólo ARN varían tratara de un gen normal, pero sólo tanto, que los programas informátitras alcanzar su molécula diana. cos no consiguen detectarlos en las En su búsqueda de riboconmuta- secuencias de ADN. dores, el grupo de Breaker no tardó Para estimular la técnica, el Insen hallarlos escondidos en el ADN tituto estadounidense de Investiga50
NON-CODING RNA GE NE S AND T HE MODERN RNA WORLD. Sean R. Eddy en Nature Reviews Genetics, vol. 2, págs. 919929; diciembre de 2001. AN EXPANDING UNIVERSE OF NONCODING RNAS. Gisela Stortz en Science, vol. 296, págs. 1260-1263; 17 de mayo de 2002. WIDESPREAD OCCURRENCE OF ANTISENSE TRANSCRIPTION IN THE HUMAN GENOME. Rodrigo Yelin et al. en Nature Biotechnology, vol. 21, págs. 379-385, abril de 2003. CHALLENGING THE DOGMA : THE HIDDEN LAYER OF NON-PROTEIN-CODING RNAS IN COMPLEX ORGANISMS. John S. Mattick en BioEssays, vol. 25, págs. 930-939, octubre de 2003.
TEMAS 38
El nacimiento de la epigenética El ADN se consideraba hasta hace poco el único depósito de información genética. Pero comienza ya a entreverse, en el interior de los cromosomas, otra capa de información mucho más maleable W. Wayt Gibbs
“E
l genoma humano ensar- manecía fuera de la secuencia de características de un organismo. Altado en un chip”, se leía en ADN. Pero la ingeniería gené tica gunas pasan incluso de padres a hijos. un titular de la portada del siguió dirigiendo su mirada hacia los No se conocen los mecanismos de New Y ork T imes . El artículo comen- genes codificadores y las proteínas, interacción entre los indicadores epitaba que tres empresas biotecnoló- pues éstas continuaban siendo las genéticos y los restantes componengicas habían conseguido registrar en estructuras mejor conocidas. tes del genoma. Mas, por lo que se sabe un pequeño artefacto del tamaño de En los últimos años, se ha explo- de la investigación sobre mecanisuna uña la actividad de todos los rado con mayor atención las partes mos críticos, parece que el papel de genes de una muestra de tejido menos evidentes del genoma, con la la zona epigenética resulta crucial humano. Así se cumplía uno de los esperanza de encontrar allí la expli- para el desarrollo, el envejecimiento objetivos del Proyecto Genoma cación de fenómenos que contradi- y el cáncer. Se sospecha también que Humano: identificar genes, es decir, cen su dogma central: enfermedades las “epimutaciones” contribuyen al fragmentos de ADN que, transcritos de caracterización familiar que apa- desarrollo de la diabetes, la esquizoen ARN, se traducen en proteínas. recen de una manera impredecible o frenia, el trastorno bipolar y otras Cuando se publicó el borrador final incluso sólo en uno de dos gemelos enfermedades complejas. de la secuencia del ADN de Hom o idénticos; genes que, sin mediar La epigenética puede sugerir nue sapiens en abril de 2003, muchos afir- mutación, se activan o desactivan en vos tratamientos contra esas patolomaron que esa hilera de 3000 millo- tumores; clones que habitualmente gías. Al propio tiempo que protegen nes de bases A, T, G y C encerraba mueren en el útero. Se ha visto que su ADN contra la mutación, las célulos planos de la vida, el libro de la esas segunda y tercera capas de infor- las añaden o borran rutinariamente herencia o el código fuente de las célu- mación, distintas de los genes codi- indicadores epigenéticos. En princilas. Pero, a decir verdad, todas esas ficadores de proteínas, intervienen pio, los fármacos podrían conjugarse metáforas resultan engañosas. en la herencia, el desarrollo y la en- con el código epigenético para actiEl genoma, la información here- fermedad. var o desactivar los genes nocivos. dable que contienen los cromosomas La segunda capa de información Con medicinas novedosas podría y dirige el desarrollo de un organismo, oculta yace en innumerables genes revertir algunas de las alteraciones no consiste en un texto estático que de sólo ARN secuestrados dentro de genéticas que acompañan el envejese transmite de una generación a la hileras extensas de ADN no codifi- cimiento y preceden al cáncer. siguiente. Antes bien, se trata de una cador [véase “El genoma oculto”, por compleja máquina bioquímica. Opera W. Wayt Gibbs en este mismo nú- Ancas robu sta s en un espacio tridimensional y consta mero ]. Por no determinar proteínas, La historia que sigue constituye una de distintos elementos dinámicos que ese ADN se había reputado escoria metáfora esclarecedora sobre la coninteraccionan. inútil de la evolución. Pero sabemos jura de los tres componentes del geLos genes codificadores de proteí- ahora que los genes no codificadores noma para acabar con la presentación nas constituyen uno más de esos ele- dan lugar a ARN activos, que alte- clásica de la herencia. En 1983, en mentos. Sin embargo, pese a repre- ran el comportamiento de los genes un rancho de Oklahoma nació un carsentar menos del dos por ciento del codificadores. El funcionamiento in- nero cuyas ancas alcanzaron pro ADN total en cada célula humana, el correcto de estos genes de sólo ARN porciones prodigiosamente ricas en dogma central de la biología molecu- acarrea graves consecuencias. contenido cárnico. Intuyendo los benelar los ha venido considerando, en el El tercer componente del mecanismo ficios económicos de la mutación, el curso de los cinco últimos decenios, genómico, de importancia presumi- ranchero llamó al cordero Oro Macizo los únicos depósitos de la herencia. blemente mayor que el segundo, es- y lo conservó como semental. De ahí la identificación del genoma triba en la capa epigenética de infor A los hijos de Oro Macizo, que tamcon un plano o proyecto. mación almacenada en las proteínas bién gozaban de nalgas robustas, los Ya en los años sesenta, se había des- y metabolitos que rodean y se adhie- cruzaron con ovejas normales. El cubierto información oculta en otras ren al ADN. Tales señales epigenéti- aspecto de la mitad de la descendos zonas de los cromosomas. Una se cas, así se llaman, aunque no alteran dencia, tanto machos como hembras, encontraba escondida en la región no la secuencia del ADN subyacente, pue- se asemejaba al paterno. Recibieron codificadora del ADN. La otra per- den afectar gravemente la salud y las el nombre de callipyge, que en griego N UEVA GENÉTICA
51
M M M ATAGCGCGACGAGCCAGCGCTCTAGACAGACGTAGCCGCGCGGATAGCGACGAGCCAGTCCGCGGACAGTACA M M M
S I R R A H Y D N A R
M M M ATAGCGCGGAGCCAGCGCGCTCTAGACAGACGTAGCATATCGGATAGCGACGAGCCAGTCCGCGCGGACAGTA M M M
1. LOS GEMELOS IDENTICOS poseen idén ticas secuencias de ADN. No obstante, en la mayoría de los casos en que uno de ellos adquiere una enfermedad de origen —esquizofrenia, trastorno bipolar o diabetes infantil—, su hermano se halla exento de la misma. Aunque podrían influir los factores ambientales, la investigación comienza a descubrir rasgos importantes que se transmiten por vía epigenética, a través de los cromosomas pero fuera del ADN.
significa “traseros hermosos”. Suponiendo que se trataba de una mutación en un gen dominante, cabía esperar que la mitad de sus descendientes nacieran con las ancas rollizas. El resultado, sin embargo, fue un tanto extraño. Cuando las hembras calli py ge se cruzaron con machos normales, ni un solo cordero de cualquier sexo presentó los glúteos de la madre, aun cuando había algunos que heredaron la mutación. Parecía como si el callipyge hubiera cambiado de dominante a carácter recesivo. Se procedió luego a cruzar carneros de aspecto normal, aunque portadores de la mutación, con ovejas normales. Para sorpresa de todos, la mitad de la descendencia resultó callipyge. Así pues, el rasgo aparecía sólo cuando la mutación se heredaba del padre. Si el callipyge fuera un gen habitual, los animales que heredaran la forma mutante del padre y de la madre tendrían las ancas robustas bien aseguradas. Sin embargo, todos los corderos con dos alelos callipyge (con la misma mutación en ambas copias del cromosoma) presentaban un aspecto perfectamente normal. ¿Qué ocurría? Tras diez años de experimentos se ha dado, por fin, con la respuesta. En mayo de 2003, el equipo de Michel Georges, de la Universidad de Lieja, publicó la descripción del rasgo y la genealogía callipyge: un gen codificador de proteína, uno o más genes de sólo ARN y dos efectos epigenéticos. Súmese a esa tríada, una pequeña mutación (una base G aparece en lugar de A en medio de un erial génico, a 30.000 bases de distancia del gen conocido más cercano). La sustitución de A por G torna hiperactivos los genes callipyge, de suerte que se produce una cantidad excesiva de proteína o ARN activo en las células musculares. El exceso de proteína explica el volumen trasero, pero no el extraño patrón de herencia. Muchos ven ahí la acción de la impronta genómica en el árbol familiar. N UEVA GENÉTICA
Para la mayoría de los genes, ambos alelos, el materno y el paterno, se activan o desactivan simultáneamente. La impronta rompe ese equilibrio. En los genes afectados por la misma sólo se expresa la versión que procede del padre; se silencia el alelo materno. Así opera el gen codificador implicado en el callipyge . El cordero que recibe la mutación (G en vez de A) de la madre muestra un aspecto normal. La mutación no supera la censura selectiva que impone la impronta genómica. La misma impronta, ahora en sentido opuesto, afecta al gen (o genes) callipyge de sólo ARN. Estos ARN activos se producen únicamente a partir del alelo en el cromosoma materno. Así, el rasgo desaparece en animales que portan dos alelos callipyge . En estos corderos con doble mutación, el gen codificador de proteína del cromosoma paterno se hiperactiva, al tiempo que los genes no codificadores del cromosoma materno también aumentan la producción de ARN activo. El exceso de ARN bloquea la señal amplificada de crecimiento y el animal resulta esbelto. La superdominancia ejercida por la interación de este par de alelos constituye una rareza. No lo es, sin embargo, el fenómeno de la impronta, al menos en las plantas con flores. Randy L. Jirtle, de la Universidad de Duke, mantiene actualizada una lista de genes humanos sujetos a la impronta genómica. A finales de 2003 alcanzaba los 75. Maxwell P. Lee, del estadounidense Instituto Nacional del Cáncer, publicó en agosto de 2003 que, de un barrido de 602 genes en siete personas, un alelo resultaba significativamente más activo que el otro en la mitad de los genes. En 170 de esos genes, las diferencias de expresión alélica se cuadruplicaba de lejos.
En los primeros días después de la concepción, desaparece de los cromosomas casi toda la impronta genómica. Ignoramos por qué. Antes del ecuador de la gestación, se restablece la información epigenética. En ese proceso de reprogramación, sin embargo, se producen algunos errores. El gen humano del factor de crecimiento 2 de la insulina ( IGF2 ), por ejemplo, suele hallarse sujeto a una impronta genómica que desactiva la copia materna. Pero en una de cada diez personas, no hay tal. Según Carmen Sapienza, de la Universidad de Temple, ese defecto se encuentra presente en el 40 por ciento de los pacientes con cáncer esporádico de colon. Se trata sólo de una asociación, pero merece la pena tenerse en cuenta. De hecho, la pérdida de la impronta genómica del IGF2 (que se detecta mediante un test sanguíneo) constituye en la actualidad un criterio predictivo del cáncer de colon. Una impronta defectuosa resulta también un buen indicio de enfermedades genéticas menos frecuentes, como los síndromes de Prader-Willi, Angelman y BeckwithWiedemann. Este último causa deformidades faciales y conlleva un riesgo elevado de cáncer en la infancia. Para Emma Whitelaw, de la Universidad de Sidney, las variaciones epigenéticas explicarían discordancias extrañas de enfermedades entre gemelos idénticos, que se caracterizan por compartir secuencias de ADN idénticas. Ahora bien, cuando uno adquiere una enfermedad de componente genético —esquizofrenia, trastorno bipolar o diabetes infantil—, el otro gemelo normalmente no la padece. En 2002, el grupo de Rachel Weksberg, del Hospital Pediátrico de Toronto, comparó gemelos discordantes ante el síndrome
Resumen / Epigenética La mayoría de los caracteres se transmiten a través de los genes codifi-
cadores de proteínas. Pero existe otro código que ejerce también efectos importantes sobre la salud y el aspecto de los organismos. Se escribe con marcadores químicos y se encuentra fuera de l a secuencia de ADN. El código epigenético podría explicar por qué algunas enfermedades here-
ditarias saltan a través de generaciones o afectan sólo a uno de dos gemelos. Los errores epigenéticos no serían ajenos al cáncer. El genoma opera como una máquina con elementos diversos y complejos
en interacción. El componente epigenético debería resultar más fácil de modificar por medios farmacológi cos de lo que ha sido la secuencia de ADN.
53
de Beckwith-Wiedemann: en todos los casos, el gemelo afectado había perdido la impronta genómica en un área crítica del cromosoma 11, no así su hermano sano. Francis Collins, director del estadounidense Instituto Nacional de Investigación sobre Genoma Humano, sostiene que la impronta constituye un factor muy importante para el cáncer, el desarrollo y los defectos de nacimiento. Pese a reconocer que se desconoce su mecanismo de operación, admite la posibilidad de que intervenga la metilación del ADN. Metilos epigenéticos
Simple pero poderoso, un metilo consta de tres hidrógenos unidos a un carbono con tendencia a enlazarse a otra molécula (para metilarla). El metilo muestra una afinidad especial hacia las citosinas (C) del ADN. Existen enzimas que se dedican a tomar moléculas metiladas derivadas de nutrientes básicos, tales como el ácido fólico y la vitamina B12 , y pegarlas a ciertas bases C del genoma. 2. LAS ANCAS ROBUSTAS distinguen a una oveja callipyge (extremo izquierda ) y un carnero callipyge (centro derecha ) de sus hermanos normales. El patrón hereditario del rasgo callipyge se debe a la interacción entre tres capas distintas de información que yacen en el genoma.
En general, cuanto más metilada se halla una hebra de ADN, menor es la probabilidad de que ésta se transcriba en ARN. El alelo silente de un gen sujeto a impronta, por ejemplo, se encuentra casi siempre muy metilado. Sin embargo, parece que la metilación del ADN se ocupa, sobre todo, de defender el genoma frente a los transposones, fragmentos parasitarios de ADN; la impronta vendría a ser una labor secundaria de la metilación. Nuestro ADN está lleno de parásitos. Aproximadamente el 45 por ciento de la secuencia del genoma humano consiste en genes víricos (o fragmentos de genes) que se han copiado a sí mismos en el genoma en el transcurso de la evolución. Afortunadamente para nosotros, casi todo este ADN “egoísta” se encuentra muy metilado y, por tanto, inactivo. Jirtle acaba de demostrar el vínculo entre metilos y transposones en un experimento realizado con ratones agutí, cuyo color de la piel varía del amarillo al negro bajo el control de un elemento parasitario. Un grupo de hembras preñadas siguió una dieta normal. Alrededor del 60 por ciento de sus descendientes desarrollaron una piel amarilla. Otro grupo se alimentó con un pienso enriquecido con vitamina B12 , ácido fólico y otras fuentes de metilo. El 60 por ciento de las crías de este segundo grupo mostró una piel de color pardo.
El cambio se debía a un aumento en la metilación (y reducción de la expresión) del ADN transposón del agutí. Pero, ¿qué ocurre cuando fallan tales defensas metílicas? Hace unos seis años, mediante técnicas de ingeniería genética se bloqueó una de las enzimas que añaden grupos metilos en células madre embrionarias. Con la protección metílica rebajada, se activaron muchos transposones. La tasa de mutaciones en el ADN se decuplicó. Los resultados planteaban una hipótesis sugestiva: ¿Podrían las anomalías epigenéticas acelerar, o incluso iniciar, el descontrol genético que conduce al cáncer? Al fin y al cabo, las células tumorales presentan a menudo una distribución irregular de las marcas epigenéticas: su genoma, en general, se encuentra escasamente metilado, mientras que algunos genes muestran una metilación excesiva y evitan con ello que las células dañadas se vuelvan malignas. Para Stephen B. Baylin, de la Universidad Johns Hopkins, en los pólipos del colon (neoformaciones benignas que suelen volverse malignas), la metilación del genoma se reduce considerablemente incluso antes de que, en el camino hacia el cáncer, las mutaciones silencien genes supresores clave. Se ignora por qué se produce tal desmetilación del ADN. Ninguna enzima desmetilante se ha identificado hasta
S A X E T E D A C I N C E T D A D I S R E V I N U , N O S K C A J M A S
54
TEMAS 38
Arbol familiar
H
ace veinte años nació Oro Macizo, un carnero singular que, en virtud de una mutación en el cromosoma 18, presentaba unas ancas poderosas. Oro Macizo transmitió este rasgo a la mitad de la descendencia (líneas verdes ), de acuerdo con el patrón típico de un gen dominante. En generaciones posteriores, sin embargo, se observó que l os indi-
viduos que heredaban la mutación de la madre mostraban un aspecto normal ( líneas azules ), incluso cuando le acompañara la mutación del padre ( líneas púrpuras ). A causa de los efectos epigenéticos, los únicos corderos que desarrollan ancas robustas son los que reciben una sola copia de la mutación y ésta proceda del padre (líneas naranjas ).
El primer mutante con ancas robustas fue Oro Macizo, que se cruzó con ovejas normales. La generación 1 desarrolló un rasgo aparentemente dominante (todos los descendientes que heredaban la mutación presentaban ancas rollizas)...
)
n ó i c a r t s u l i
( R E S S A R T S A I D A N ; A C I G L E B , A J E I L E D D A D I S R E V I N U , S E G R O E G L E H C I M Y R E I L R A H C E L O R A C : E T N E U F
...pero sólo los carneros pasaban el rasgo a la generación 2... ...y ya en la generación 3 el patrón hereditario resultó desconcertante.
Cuando se transmite a una oveja, el rasgo salta una generación (líneas azules ). Cuando lo transmite un carnero que porta la mutación en ambas copias del cromosoma 18, el rasgo aparece en cada uno de los descendientes (líneas naranjas ).
CLAVE
Carnero (izquierda ) y oveja ( derecha ) con ancas robustas
Corderos normales no emparentados con Oro Macizo
ahora. Se sospecha que los cromosomas pobres en grupos metilo tienden a funcionar peor durante la división celular. Por tanto, constituyen un primer paso hacia la malignidad. El trabajo de Rudolph Jaenisch, del Instituto Whitehead del MIT, aportó un aval para tal hipótesis. Su grupo creó ratones transgénicos con una deficiencia congénita de una enzima metilante. En la mayoría de los ratones, al menos uno de los cromosomas pobremente metilados se hizo inestable. Las mutaciones no tardaron en acumularse; el 80 por ciento de los individuos murieron de cáncer antes del noveno mes de vida. La idea de que la carencia de metilos en el ADN desemboque en un cáncer en el hombre se mueve todavía en el terreno de la hipótesis; en cualquier caso, no existen fármacos que corri jan una baja metilación del genoma. Pero se están ensayando diversos fármacos contra el cáncer que actúan N UEVA GENÉTICA
Descendientes normales de Oro Macizo
Cruce
Cromosoma 18 paterno (izquierda ) y mater no (derecha )
Cromosoma mutante
sobre la otra vertiente de la metila- ensayo en pacientes con leucemia ción: la que sufren en demasía ciertos avanzada. Lo mismo que la mayoría genes asociados al cáncer. Hasta hace de las sustancias utilizadas en quipoco, muchos pensaban que, para que mioterapia, el compuesto resulta basun tumor se asentase, era preciso que tante tóxico. Pero cuando el fármaco una mutación silenciara los genes ejerce su acción, se vence la leucemia: oncosupresores. Sin embargo, en mu- el 99,9 por ciento de las células canchas células tumorales estos genes cerosas desaparecen. De acuerdo con supresores poseen secuencias nor- la información aportada, ocho de los males de ADN. Los errores de meti- 130 pacientes tratados se recuperalación, no las mutaciones, son los que ron y en otros 22 la medicina desdejan inoperantes a los genes. metilante dejó la enfermedad en una Se están ensayando, en esta direc- remisión parcial. ción, varias sustancias anticanceroSabine Maier, de la empresa Episas que abordan el problema de la genomics, que trabaja en asociación metilación excesiva. La procaína (un con la compañía Roche en el desarroanestésico), el ácido valproico (un llo de diagnósticos del cáncer basaestabilizador del talante) y la deci- dos en la metilación, afirma que, tabina (un agente empleado en qui- pese a resultar prometedores, todos mioterapia) parecen arrancar meti- estos fármacos conllevan un prolos del ADN o impedir que se peguen blema: su acción se funda en la desa las células recién formadas. Jean metilación de todo el genoma, lo que Pierre Issa, del Centro Oncológico M. podría acarrear efectos secundarios. D. Anderson de la Universidad de Además, el efecto pud iera ser temTexas, ha sometido la decitabina a poral, con recidiva de las marcas me55
Control epigenético del “volumen” de los genes
L
a secuencia de ADN no constituye el único código almacenado en los cromosomas. Los fenómenos epigenéticos controlan el “volumen” de los genes: amplifican o silencian su actividad. El código epigenético está constituido por un sis-
tema de moléculas unidas al ADN o a las histonas que regulan su morfología en el interior cromosómico. Entre otras funciones, los controles epigenéticos se encargan de amordazar los transposones, fragmentos parasitarios de ADN.
Fibra de cromatina ALTO
Nucleosomas BAJO
Núcleo celular
Histonas ADN expuesto que se transcribe en ARN
Proteínas represoras
2
Los cromosomas están constituidos por cromatina, una mezcla de ADN, proteínas y otras moléculas. Dentro de la cromatina, la doble hélice se enrolla alrededor de las madejas de ocho histonas para formar un rosario de nucleosomas.
Cromatina activa Cromatina silente
1
Obligadas por ciertos cambios químicos en la cromatina, partes de la misma se condensan en una masa compacta e inaccesible o bien atraen proteínas represoras. En ambos casos, los genes situados en esa zona del ADN se tornan transitoriamente inoperantes.
ALTO
Marcas químicas unidas a las colas de las histonas Enzima desacetilante
ADN Enzima metilante
ALTO
BAJO
Metilo
BAJO
Gen activo
Gen silenciado
4
Los genes también se desactivan mediante metilos que se unen directamente al ADN, por lo común en los sitios donde a una base C le sigue otra G. Ignoramos si la metilación del ADN resulta suficiente para bloquear los genes o si debe combinarse con la señalización de las histonas.
Acetilo (–COCH3)
Fosfato
Metilo (–CH3)
Ubiquitina
3
Un complejo código de histonas —escrito con marcas químicas adheridas a las colas de las histonas— gobierna también la expresión de los genes. Los marcadores acetilo amplifican los genes vecinos; las enzimas desacetilantes, en cambio, los silencian. El resto del código está aún por descifrar.
Transposón activo
Transposón bloqueado por metilos
5
Los transposones, o genes saltarines, se autoclonan y después insertan sus copias en secciones distantes del genoma. Unas veces desactivan genes, otras los hiperactivan. Una de las principales funciones de la metilación del ADN parece ser el bloqueo de los transposones, que constituyen casi la mitad del genoma humano.
Copias de ADN Cromosoma distante
Transcritos de ARN
Gen desactivado Gen hiperactivo
W O L S N I W E S E R E T
56
TEMAS 38
tílicas y silenciamiento de los genes oncosupresores. Issa admite la posibilidad del carácter transitorio de las modificaciones inducidas en la expresión del gen; pero si los cambios permiten que el sistema inmunitario identifique la célula tumoral o inducen la apoptosis (muerte celular programada), entonces la célula seguiría anulada. Descifrar el código
La reemergencia de un patrón de metilación del ADN después de la acción de los fármacos desmetilantes constituye un extraño eco de la reprogramación de las marcas de impronta poco después de la concepción. ¿Qué redirige las enzimas metilantes hacia esos genes supresores de tumores o esos pocos alelos marcados para la impronta genómica? Hay que ofrecer una respuesta si queremos acometer el proceso de clonación animal. La reprogramación epigenética fracasa estrepitosamente en los clones obtenidos al sustituir, por ADN de una célula adulta, el ADN de un óvulo fecundado. La mayoría de esos clones presenta patrones anormales de metilación y de expresión génica. Aun cuando su secuencia de ADN sea correcta, el 90 por ciento de los animales muere antes del parto y la mitad de los que nacen vivos no llega a la edad adulta. Los pocos que sobreviven hasta la madurez son proclives a la obesidad y enfermedades del sistema inmunitario. Para prevenir o anular permanentemente los errores de metilación, tan habituales en clones, tumores y afecciones vinculadas a la impronta genómica, resulta necesario descifrar un código epigenético, separado del ADN. Baylin sostiene que la metilación, por sí sola, no silencia los genes; se encarga únicamente de fijar su estado silente. En cuanto a las enzimas metilantes, parece que reciben sus órdenes de alguna otra parte. Un cromosoma se suele representar por un revoltijo azaroso de ADN. Pero si lo examinamos de cerca, encontramos algo muy distinto. Se trata de un conjunto dinámico de ADN, proteínas y otras moléculas. Este ensamblaje filamentoso, la cromatina, no sólo sirve de soporte del ADN, sino que controla también el acceso al mismo. La cromatina contiene en ADN la mitad de lo que contiene en proteína, la mayoría de la cual está en forma de histonas. Las histonas constituyen la base del empaquetamiento del ADN nuclear. Los 1,8 metros de ADN se enrollan alrededor de los carretes de histonas para formar una cadena en N UEVA GENÉTICA
forma de rosario que después se pliega como una madeja. Las secciones de cromatina pueden condensarse o expandirse de forma independiente. Así, ciertas zonas de ADN se ocultan eficazmente, al tiempo que otras quedan expuestas para la transcripción. Las hembras, por ejemplo, comienzan su vida con dos cromosoma s X activos. Los machos heredan sólo uno. Un embrión femenino debe embozar el X extra para evitar que sus células obtengan una dosis doble de lo que producen los genes de los cromosomas X. Para conseguirlo, dos partes de la máquina genómica conspiran para desactivar la tercera. Un gen no codificador llamado Xis t produce un ARN activo que recubre el cromosoma X redundante. Al propio tiempo, el cromosoma X necesario produce ARN antisentido que lo protege d el Xis t. Una reacción en cadena se propaga a lo largo del cromosoma sobrante: los metilos marcan una buena parte del ADN, las histonas se desprenden de los grupos acetilo (—COCH 3) de sus colas y la cromatina se compacta en una masa inaccesible cubierta de ARN. El cromosoma X silente se entrega entonces inactivo a cada célula portadora del genoma, conforme la hembra avanza en su desarrollo. Aunque todavía no se cono ce con precisión el papel de las histonas en esta historia, la investigación reciente ha demostrado que las colas proteicas que sobresalen de las histonas catalizan una gran variedad de adiciones químicas. En aquellas zonas donde los acetilos adornan las histonas, por ejemplo, la cromatina habitualmente se encuentra abierta para realizar su función; permite que la maquinaria de transcripción de la célula lea el ADN en esa parte del cromosoma. La cromatina silente, compacta, carece generalmente de acetilos en las posiciones especiales. En cambio, muestra metilos insertos en diferentes puntos de las colas de las histonas. Las histonas acogen también fosfatos y ubiquitina, un péptido. Todas estas marcas aparecen en una asombrosa variedad de localizaciones y combinaciones. Descifrar el código de las histonas no va a resultar nada fácil. A diferencia del código estático del ADN, numerosas marcas epigenéticas se hallan en flujo constante. Cuando una sección de la cromatina se condensa, el silenciamiento puede extenderse por todo el cromosoma hasta alcanzar una barrera. Xin Bi, de la Universidad de Rochester, iden-
tificó recientemente elementos fronterizos que atraen enzimas acetilantes hacia las histonas para asegurar que permanezcan activas. En ocasiones, una separación física ofrece suficiente espacio para que el ADN flote libre de histonas; es ahí donde se detiene la propagación del silenciamiento. En otros lugares no existe frontera, sino un tira y afloja entre las regiones activas y silentes del cromosoma. Issa sostiene que esta pugna podría explicar por qué el riesgo de padecer cáncer crece con la edad. Tal vez las barreras que en los cromosomas separan las regiones muy condensadas, altamente metiladas y silenciosas de las regiones activas, accesibles y no metiladas se desintegran con el paso de los años, a medida que las células se dividen o envejecen. Con todo, las zonas más ocultas del genoma se perciben sólo en penumbra. Tras el hito que supuso la coronación del Proyecto Genoma Humano importa ahora alcanzar una descripción semejante del panorama epigenético. En octubre de 2003, Epigenomics y el Instituto Sanger del Consorcio Wellcome, emprendieron el Proyecto Epigenoma Humano: un plan de investigación de cinco años para cartografiar los sitios de metilación del ADN. Habían levantado ya el mapa de más de 100.000 marcas metílicas unidas al complejo principal de histocompatibilidad, un sector del cromosoma 6 vinculado a muchas enfermedades. La nueva concepción de la naturaleza del genoma abre nuevas vías a la ingeniería genética. Los genes codificadores de proteínas, importantes e inmutables, no constituyen la única fuente de instrucciones para las células. El ADN no codificador cumple también una función destacada, al par que las histonas, las señales químicas unidas al ADN y la forma de la cromatina.
BIBLIOGRAFIA COMPLEMENTARIA THE EPIGENOME: MOLECULAR HI DE AN D SEEK. Dirigido por Stephan Beck y Alexander Olek. Wiley, 2003. CONTROLLING THE DOUBLE HELIX. Gary Felsenfeld y Mark Groudinein en Nature, vol. 421, págs 448-453; 23 de enero de 2003. THE CALLIPYGE LOCUS: EVIDENCE FOR THE T RANS INTERACTION OF RECIPROCALLY IMPRINTED GENES. Michel Georges, Carole Charlier y Noelle Cockett en Trends in Genetics, vol. 19, n.o 5, págs 248-252; mayo de 2003.
57
La evolución codificada Nuevos descubrimientos concernientes a las reglas que gobiernan la codificación génica de las proteínas han revelado cuán excelente es la “programación” con la que la naturaleza protege a la vida de errores catastróficos y acelera su evolución Stephen J. Freeland y Laurence D. Hurst
E
l 14 de abril de 2003 se anunció la secuenciación del genoma humano, un inventario de los 3000millones de pares de nucleótidos de ADN que encierran los planos de construcción de un ser humano. Subsiste, empero, el difícil problema de separar todos los genes funcionales de los residuos sin valor, amén de lograr un conocimiento más pleno del cómo y el cuándo de la activación génica, de qué modo afectan sus instrucciones al comportamiento de las proteínas que cifran. No es maravilla, pues, que el director del Proyecto Genoma Humano, Francis S. Collins, dijera que la hazaña de su grupo era solamente “el fin del principio”. Collins aludía también a otro acontecimiento conmemorado esa misma semana: el principio del principio, ocurrido 50 años antes, cuando James D. Watson y Francis H. Crick desvelaron la estructura de la molécula misma de ADN. Fue aquélla, asimismo, una época apasionante. Se sabía que la molécula que habían conseguido visualizar encerraba nada menos que el secreto de la vida, que era la molécula que permitía a los organismos compendiarse a sí mismos en un conjunto de instrucciones de montaje, para después convertir otra vez en metabolismo vivo la información así inscrita. Los esfuerzos para desentrañar la forma en que se producía esta conversión mantuvieron embelesada a la comunidad científica durante los años siguientes. Se sabía que el alfabeto del ADN constaba sólo de cuatro tipos de nucleótidos. Por consiguiente, las reglas que descodificasen la información encerrada en la doble hélice tenían que indicar a las células cuáles, de los 20 aminoácidos, debían concatenarse entre sí para formar los millares de proteínas de que se componen los varios miles de millones de distintos tipos de organismos. De hecho, la totalidad de la biosfera vive en un permanente y frenético proceso de descodificación conforme hacen eclosión los huevos, germinan las semillas, proliferan los hongos y se escinden las bacterias.
Pero en aquellos tiempos el conocimiento sobre los mecanismos celulares implicados en la traducción del mensaje del ADN era tan limitado, que
las tentativas de descifrar el código genético se centraron sobre todo en los aspectos matemáticos del problema. Muchas de las propuestas iniciales resultaron erróneas, a pesar de que su originalidad y sagaz ingenio siguen constituyendo una lectura fascinante. Hasta el extremo de que, cuando el verdadero código se descifró por fin en los años sesenta del siglo pasado, resultó punto menos que decepcionante. La versión de la naturaleza parecía menos elegante que las hipótesis de los teóricos. La muy excelente obra de programación que el código genético es en realidad, no ha quedado de manifiesto hasta hace pocos años, merced a nuevos descubrimientos. Han empezado a aclararse las razones de que la naturaleza eligiese tales reglas fundamentales, así como la causa de que esas normas hayan persistido a lo largo de unos tres mil millones de años de selección natural. Estamos ya capacitados para mostrar que las reglas del código podrían acelerar la evolución, al tiempo que protegen a la vida de la comisión de errores desastrosos en la síntesis de proteínas. El estudio del código está proporcionando también claves para la resolución de algunos de los problemas que se les plantean a los laboratorios en la era posgenómica. Y al remontarnos hasta los comienzos mismos, con el propósito de comprender las reglas del código subyacente a la vida, vamos descubriendo instrumentos útiles para futuras investigaciones. Al hablar de “código” y de “descodificación” nos estamos expresando en un sentido bastante literal. Las instrucciones genéticas están almacenadas en el ADN y en el ARN, compuestos ambos, a su vez, por un ácido nucleico. Pero los organismos se hallan en su mayor parte construidos a partir de un tipo de moléculas muy diferentes, las proteínas. Así, aunque tradicionalmente se diga que un gen consiste en una secuencia de nucleótidos que contiene la descripción de una proteína, la sentencia genética que contiene tal descripción debe traducirse antes desde un cierto sistema de símbolos hacia otro sistema cuyos símbolos son totalmente distintos.
S M L I F M I L S
SECUENCIAS DE TRES “LETRAS”, llamadas codones, del ADN y del ARN (cuadra- dos rotulados ) codifican los aminoácidos con los que se edifica y mantiene la vida de la Tierra.
que dejaba solamente entrever un Cuando Watson y Crick expusieron intrigante rompecabezas matemático. la estructura del ADN en 1953, ellos Y la primera solución propuesta no y sus contemporáneos pudieron apre- llegó de los biólogos, sino de George ciar que los genes estaban escritos con Gamow, físico que ideó la teoría de la un alfabeto que constaba de sólo cua- gran explosión. Su “código diamante”, tro “letras”, las bases nitrogenadas publicado en 1954, combinaba con eleadenina, citosina, guanina y timina gancia los aspectos aritméticos de la (A, C, G, T); caracterizan a cada nu- obtención de 20 “significados” amicleótido y forman los peldaños de la noacídicos a partir de un alfabeto de doble hélice del ADN. El alfabeto de cuatro nucleótidos con la estructura las proteínas, en cambio, constaba física del propio ADN. de 20 aminoácidos distintos, por lo que Según Gamow, en cada vuelta de resultaba evidente que, para especi- la doble hélice había un hueco de forma ficar un aminoácido dado cualquiera, rómbica (el diamante de la baraja), sería necesaria una “palabra” gené- delimitado por nucleótidos situados tica polinucleótida. Las combinacio- en sus cuatro vértices. Esos huecos nes binarias (con repetición) de dos permitirían al ADN actuar a modo de letras seleccionadas entre las cuatro una falsilla sobre la cual se alinearían bases generan solamente 16 pala- los aminoácidos, determinados por bras, o “codones”. Las combinaciones las combinaciones de nucleótidos preternarias, en cambio, en las cuales las sentes en cada vuelta. En su modelo letras se toman de tres en tres, per- se eliminaba un vértice de cada rombo; miten 64 codones posibles, que son después, los 64 codones trinucleótiholgadamente suficientes para deter- dos se clasificaban en grupos químiminar los 20 aminoácidos. camente emparentados. El modelo Poco más se sabía entonces sobre consentía también que los codones la traducción de los genes en proteí- significativos se traslapasen, depennas. Ahora comprendemos que las diendo del “marco de lectura” o del secuencias génicas sí se valen de codo- lugar donde comenzase la lectura de nes de tres letras para especificar la secuencia de letras a lo largo de la aminoácidos individuales; conocemos molécula de ADN. Semejante econotambién que se requieren varias eta- mía en la compresión de datos resulpas para que la secuencia de bases taba muy apreciada por los teóricos del gen se convierta en una secuen- de la época. Pero no tardaron en descia de aminoácidos. En primer lugar, cubrirse cadenas de aminoácidos cuya el gen de ADN se copia, corrige y explicación no podía hallarse ni por transcribe en ARN, ácido nucleico el método de Gamow ni por ningún que utiliza bases similares a las otro de los códigos de solapamiento. empleadas por el ADN con la salve Al propio tiempo, los datos existendad de que, por timina, porta uracilo. tes parecían negar una interacción diDespués, la maquinaria celular lee recta entre el ADN y los aminoácidos. esta versión del gen, copiada en ARN Crick elaboró una hipótesis según la mensajero (ARNm), a razón de tres cual unas moléculas, llamadas adaptaletras cada vez, al tiempo que la molé- doras, podrían servir de intermediacula de ARN de transferencia (ARNt) rias; enunció, ya en 1957, una serie de se encarga de traer los aminoácidos reglas a las que podría atenerse el funespecificados, para su mutuo engarce. cionamiento de dichas moléculas. En Pero en los primeros años de la términos simples, las moléculas adapdécada de los cincuenta este proceso tadoras de Crick reconocían sólo 20 coera totalmente opaco, una caja negra dones significativos, correspondientes El descifrado del código
Resumen / El código de la vida Las instrucciones genéticas para la síntesis de proteínas están escritas en
“palabras” de tres letras, llamadas codones. Cada codón especifica uno de los 20 aminoácidos o bien una señal traductora de paro (“stop”). En otro tiempo se supuso que la disposición de estos codones y de sus significados aminoacídicos se debieron al azar, pero los descubrimientos recientes indican que ha sido la selección natural la que ha elegido y mantenido este orden. Simulaciones computarizadas han revelado el motivo: al comparar el código
estándar con otros hipotéticamente posibles, aquél resulta extraordinariamente eficaz en la minimización de los daños causados por errores en los propios genes o en el proceso de traducción de los genes a proteínas.
60
a los 20 aminoácidos; las ternas de nucleótidos restantes, hasta las 64 posibles, carecían de significado. El código de Crick, en lugar de solapamientos, era un código “sin comas”: los codones sin significado les resultaban invisibles a las moléculas adaptadoras, por lo que la naturaleza no precisaba de una puntuación figurativa para designar el comienzo de un marco de lectura. El modelo “sin comas” era tan estilizado y elegante, que se ganó la aceptación casi universal. La mereció hasta que los hechos demostraron que, no obstante su rigor aparente, se trataba de una teoría errónea. Experimentos realizados en los primeros años sesenta demostraron que incluso los codones presuntamente faltos de significado podían provocar en un matraz la síntesis de proteínas. Hacia 1965 se habían establecido ya in vitro los significados genuinos de la totalidad de los 64codones ternarios. No parecían existir relaciones numéricas claras. Ciertos codones eran redundantes: diversos aminoácidos podían estar especificados por dos, cuatro, e incluso seis codones diferentes. Después de tantas entusiastas especulaciones, muchos llegaron a considerar que el código real de la naturaleza era poco más que una casualidad evolutiva. ¿Un azar fosilizado?
En efecto: ya descifrado el código, se descubrió que, de las bacterias a los humanos, los organismos empleaban las mismas reglas de codificación. Parecía como si nada hubiera cambiado en los miles de millones de años transcurridos desde que los tres dominios fundamentales de la vida —archaea, bacterias y eucariotas— divergieron a partir de un antepasado común. En consecuencia, el sencillo y persuasivo argumento de la “casualidad fosilizada”, propuesto por Crick en 1968, presidió el pensamiento científico hasta no hace mucho. “La correspondencia entre los codones y los aminoácidos fue en este punto cosa enteramente debida al azar”, escribió. Pero una vez que el código se hubo concretado en una cierta forma, resultó tan fundamental para la vida, que cualquier cambio ulterior hubiera desencadenado una catástrofe. La selección natural darwinista se funda en la premisa de que, en ocasiones, un pequeño cambio en un gen puede resultar beneficioso si ello permite a los organismos desenvolverse mejor en su ambiente. Ahora bien, la modificación de las reglas de descodificación de un organismo entrañaría la introducción simultánea de cambios en un sinfín de sitios de su dotación TEMAS 38
El código de la naturaleza
S
i se acepta que cada secuencia génica describe una proteína, resulta que las unidades básicas de tales secuencias son “palabras” de tres letras. Cada codón, o tríada, se traduce en uno de los 20 aminoácidos o en una señal de “paro de la traducción”. La maquinaria celular transcribe los genes del ADN a versiones en ARN —cuyos bloques nucleotídicos de construcción se representan por las letras A, C, G y U— y finalmente traduce los genes del ARN, codón tras codón, en la cadena de aminoáci dos correspondiente. A principios de los años sesenta se establecieron las definici ones exactas de la naturaleza de los aminoácidos dadas por la naturaleza ( abajo ) . Pero la importancia de las regularidades del código tardó todavía varios decenios en apreciarse.
SINONIMOS Y SEMEJANZAS De los 64 posibles codones de tres letras hay varios que especifican un mismo aminoácido; ello significa que habrá formas diversas de cifrar una proteína. Tales codones sinónimos tienden a diferir en una letra, la última, por lo común, formando una pauta de bloques. Los codones correspondientes a aminoácidos de parecida afinidad por el agua también tienden a diferir en su última letra;
genética, con la alteración consiguiente de sus funciones metabólicas. Sería la diferencia entre introducir un nuevo signo tipográfico en una máquina de escribir (la mutación) y reorganizar por completo su teclado (alteración de la descodificación). Este razonamiento, tan directo y atractivo, peca de un reduccionismo simplista. Si bien la gran mayoría de los sistemas vivos utilizan el código genético estándar, se conocen por lo menos 16 variantes, repartidas por una amplia gama de linajes evolutivos, que asignan a ciertos codones significados diferentes. El sistema subyacente sigue siendo el mismo: codones de tres nucleótidos que se traducen en aminoácidos. Pero mientras que la mayoría de los organismos, al leer en el ARN el codón “CUG”, entenderían que se trataba del aminoácido leucina, no pocas especies de Candida , un hongo, traducen “CUG” por serina. Las mitocondrias, diminutos generadores de energía que encontramos en todo tipo de células, tienen su propio genoma; muchas han desarrollado también asignaciones idiosincrásicas para los codones. Por ejemplo, en el genoma mitocondrial de la levadura del pan (Saccharomyces cerevisiae), cuatro de los seis codones que de ordinario se traducen en leucina codifican, en cambio, a la treonina. Conforme fueron multiplicándose los descubrimientos sobre tales variantes en el curso del decenio de los noventa, se hizo cada vez más evidenN UEVA GENÉTICA
mientras que los codones que comparten una misma primera letra suelen codificar aminoácidos que son productos o precursores unos de otros. Tales propiedades resultan decisivas para la supervivencia de los organismos; podrían incluso haber contribuid o a acelerar su evolución.
U
Posición del segundo nucleótido C A
UUU Fenilala nina o d i t ó e l c
r C e m i r p l e d n
A
UCA Serina UCG Serina
CUU CUC CUA CUG
Leucina Leucina Leucina Leucina
CCU CCC CCA CCG
Prolina Prolina Prolina Prolina
CAU Histidina CAC Histidina CAA Glutamina CAG Glutamina
CGU CGC CGA CGG
Arginina Arginina Arginina Arginina
AUU AUC AUA AUG
Isoleucina Isoleucina Isoleucina Metionina
ACU ACC ACA ACG
Treonina Treonina Treonina Treonina
AAU AAC AAA AAG
Asparagina Asparagina Lisina Lisina
AGU AGC AGA AGG
Serina Serina Arginina Arginina
Valina Valina Valina Valina
GCU GCC GCA GCG
Alanina Alanina Alanina Alanina
GAU Aspartato GAC Aspartato GAA Glutamato GAG Glutamato
GGU GGC GGA GGG
Glicina Glicina Glicina Glicina
te que el código no está, en absoluto, “fosilizado”. Puesto que evoluciona, cabe presumir que evo luc ionó . Por tanto, las correspondencias normales de codones y aminoácidos, refinadas y preservadas a lo largo de miles de millones de años de selección natural, no han sido una casualidad. A decir verdad, la forma en que tal correspondencia se halla organizada realiza un excelente trabajo de minimización del impacto de accidentes. Control de daños
Cisteína Cisteína STOP Triptófano
UUA Leucina UUG Leucina
GUU GUC G GUA GUG
Todo sistema de codificación ha de habérselas con posibles errores. Pero no todos los errores comportan la misma insidia. En nuestro idioma, las vocales y las consonantes son muy diferentes, por lo que la sustitución de las “a” por “s” hsce lss frsses cssi sbsurdss. En cambio, las letras “s” y “z” tienen un zonido zimilar, azí que ezta fraze zigue ziendo comprenzible. En el caso de sistemas propensos a errores, una estrategia de codificación eficaz sería la que redujera los efectos de los fallos ocasionales, inevitables. En los organismos, los errores se producen de muchas formas. Unas veces, se modifica, por mutación, la versión original en ADN de un gen. En otras ocasiones, un adaptador indebido (un ARNt) se une al transcrito ARNm de un gen y agrega erróneamente un cierto aminoácido a una proteína en formación. Pero incluso en la época en que se creía que el
Tirosina Tirosina STOP STOP
UGU UGC UGA UGG
UAU UAC UAA UAG
U UUC Fenilala nina UCC Serina
u n
ó i c i s o P
UCU Serina
G
G N I D A E R Y C U L
código era producto del azar, se observó que parecía estar bien configurado para garantizar que los errores solitarios apenas tuvieran repercusión. Ya en 1965, Carl R. Woese, a la sazón en la Universidad de Illinois, descubrió que los codones similares (los que compartían dos de tres letras) solían especificar aminoácidos similares, por lo que un error cometido acá o allá no afectaba sustancialmente a la proteína resultante. Precisar el significado de “similares” cuando se habla de aminoácidos no constituye una tarea fácil. Los 20 aminoácidos divergen unos de otros por su forma, tamaño y carga eléctrica. Lo que observaron Woese y otros fue que los codones que comparten dos de las tres bases propenden a corresponderse con aminoácidos que se asemejan mucho en la medida en que son atraídos o repelidos por el agua. Esta propiedad (hidrofobicidad) es crucial para el funcionamiento de las proteínas. Una cadena de aminoácidos recién formada se pliega de una forma característica en función de las posiciones que ocupen los aminoácidos hidrófobos, que prefieren juntarse y apiñarse al tratar de alejarse del citoplasma celular, que es acuoso, dejando así que sean los hidrófilos los que formen la superficie de la proteína. Merece destacarse cierta peculiaridad del código genético: cuando se produce un error mononucleótido, el aminoácido realmente agregado y el que debía haber sido presentan, a menudo, 61
TAMI J. TOLPA
Protección de las proteínas El código de la naturaleza minimiza los efectos de los errores genéticos, se deban a mutaciones en los propios genes o a fallos del proceso de traducción. Una secuencia génica se traduce en una secuencia correspondiente de aminoácidos, que dicta la estructura tridimensional definitiva que adquirirá la proteína cifrada (1, 2 y 3 ).
Incluso en el caso de que se agregue, por error, un aminoácido indebido, la organización del código garantiza que el inserto sea, de ordinario, químicamente similar al correcto, de suerte que apenas si se resiente la proteína sintetizada. Una excepción, ilustrativa del tipo de daño que puede provocar un error en un solo nucleótido, nos la ofrece la anemia falciforme ( abajo ).
Codón
Núcleo
ARNm
ARNm
ADN
Cadena de aminoácidos
1
Cuando un gen de ADN se activa, se expresa (izquierda extrema ) , primero se transcribe en una versión en ARN, anotado casi con el mismo alfabeto de nucleótidos: adenina, citosina, guanina y uracilo. Este ARN mensajero (ARNm) porta las instrucciones genéticas desde el núcleo celular hasta el citoplasma, donde se traduce.
Citoplasma Aminoácido
2 ARNt
Los ribosomas, unos orgánulos celulares, van “leyendo” el ARNm, codón tras codón (izquierda ) . Al mismo tiempo, otra forma de ARN, el ARN de transferencia (ARNt), aprehende aminoácidos libres y se los presenta al ribosoma, donde se agregarán a la secuencia correspondiente de la cadena en formación. Cada ARNt se enlaza a un codón trinucleotídico del ARNm por un extremo y a un aminoácido por el otro.
La cadena de aminoácidos se pliega en el espacio, formando una estructura tridimensional
ARNm Ribosoma Glutamato
3
La proteína, al tiempo que se forma, se pliega sobre sí misma, adoptando una estructura tridimensional cuya morfología depende sobre todo de la afinidad de los aminoácidos por el agua. Los aminoácidos hidrofóbicos tienden a replegarse hacia el interior de la proteína, dejando que sean las partes hidrofílicas, como el glutamato, las que den frente al citoplasma celular, que es acuoso. La molécula de hemoglobina (a la derecha ) consta de cuatro cadenas de aminoácidos: dos cadenas alfa (en azul ) y otras dos cadenas beta (en amarillo ).
HEMOGLOBINA NORMAL
Valina
UN ERROR CRITICO: En el gen de la hemoglobina existen varias mutaciones que permanecen “silentes” (no provocan enfermedad), pues los aminoácidos sustituidos lo fueron por otros similares. Pero si se produce el error de que un aminoácido hidrófilo se reemplace por otro hidrófobo, puede alterarse drásticamente la forma y la función de la proteína resultante. En la enfermedad de anemia falciforme, una mutación, que afecta a un solo nucleótido en el gen correspondiente a la cadena beta de la hemoglobina, cambia el codón CAG del ARNm en el codón CUG (arriba ), con la sustitución consiguiente del aminoácido glutamato, hidrófilo, por el aminoácido valina, hidrófobo. Los correspondientes lugares hidrófobos de la superficie de la hemoglobina se ven arrastrados unos hacia otros, haciendo que las moléculas se apilen juntas (a la derecha ) produciendo fibras rígidas que deforman los hematíes y les dan forma de hoz.
MOLECULAS DE HEMOGLOBINA DE LA ANEMIA FALCIFORME
pareja hidrofobicidad, por cuya razón la alteración que sufre la proteína resultante es relativamente inocua. Ahora bien, ¿cuál es el grado de eficacia del código en este respecto? En torno a esa cuestión empezó, en 1998, nuestra intervención. Nos propusimos desarrollar las observaciones de quienes nos habían precedido. El código, a prueba
Empezamos por calcular la hidrofobicidad de los 20 aminoácidos. Los valores obtenidos nos sirvieron para estimar el error del código genético, que definimos como el valor medio de la variación de hidrofobicidad que experimentan los aminoácidos resultantes de cambiar una sola letra, de todas las formas posibles, en el con junto de los 64 codones del código. Dicho valor representa la proclividad del código genético a los errores; por sí solo, carece, sin embargo, de mayor interés. Era necesario saber en qué puesto quedaría situado el sistema de codificación de la naturaleza al compararlo con otros códigos teóricamente posibles. Para generar esa gavilla de códigos hipotéticos, hubimos de partir de ciertos supuestos, concernientes a restricciones que verosímilmente tendrían que respetar un código que funcionase en un mundo de ADN, ARN y aminoácidos. Importa señalar que los errores de traducción del ARNm en el correspo ndi ente aminoácido se dan con mayor frecuencia en la tercera posición del codón. Este lugar corresponde, sencillamente, al punto en que la afinidad del enlace entre el ARNm y el ARNt es más débil; por tal motivo Crick dio a este fenómeno el nombre de “bamboleo”. Pero los codones sinónimos —aquellos que codifican el mismo aminoácido— a menudo se diferencian sólo en sus últimas letras, por lo que estas traducciones erróneas acostumbran producir, no obstante, un aminoácido correcto. A pesar de que este agrupamiento de codones sinónimos reduce de por sí el valor de error del código, la mecánica del bamboleo sugiere que la disposición resulte de una limitación bioquímica con mayor probabilidad que de una adaptación evolutiva. Así pues, por ser mejor pecar de cautos, para deducir nuestra medida nos ceñiríamos a los códigos hipotéticos que compartieran esta propiedad. Por otra parte, era imposible cuantificar la hidrofobicidad de los codones de paro (“stop”); en consecuencia, mantuvimos invariables su número y su significado en todos los códigos hipotéticos. N UEVA GENÉTICA
El código a prueba
L
os daños sufridos por las proteínas a resultas de mutaciones génicas, o de errores en la traducción o transcripción quedan minimizados cuando los errores provocan la sustitución de aminoácidos por otros de parecida afinidad por el agua (hidrofobicidad). Si se define el valor de error de un código como la variación media de hidrofobicidad de los aminoácidos provocada por todos los posibles cambios de una sola base en todos los codones de un código, tendremos que un elevado valor de error indicaría que el código es muy vulnerable a los errores, mientras que un valor bajo significaría que tal código minimiza los daños. Los autores han generado una extensa muestra aleatoria de hipotéticos códigos, y han observado que solamente 100 de entre 1 millón de esos códigos posibles mostraban un valor de error inferior al del código de la naturaleza ( izquierda ) . Se introdujeron después reglas, tomadas del mundo real, referentes a la forma en que mutan los genes o en que son defectuosamente traducidos: el código de la naturaleza supera a todas, excepto a una, del millón de variantes considerado (derecha ). 21.000
5,19
s
o g i d ó c e d o r e m ú N
25.000
Código natural
15.000 9000 3000
4,0
6,4 8,8 11,2 13,6 Error del código
Tomadas en consideración estas limitaciones técnicas, procedimos a generar códigos hipotéticos distribuyendo aleatoriamente los 20 significados entre los 20 bloques de codo nes. Pero aun así resultaban posibles todavía unas 2,5 10 18 configuraciones (número aproximadamente igual al de segundos transcurridos desde la formación de la Tierra). Para facilitar el manejo de tal cantidad de opciones, las agrupamos en grandes muestras aleatorias. Descubrimos que en una muestra de 1 millón de códigos hipotéticos había sólo un centenar que tuvieran un valor de error menor que el correspondiente al código natural. Decidimos perfeccionar nuestro algoritmo de generación de códigos. Para que éste simulara mejor las condiciones del “mundo real”, añadimos restricciones que reflejaban ciertas pautas observadas en las mutaciones del ADN y en los errores de transcripción en ARN. En estas condiciones “del mundo real”, el valor de error del código natural parecía ser todavía inferior en varios órdenes de magnitud, superando en eficacia al millón de hipotéticas variantes, menos a una. Tan extraordinaria robustez del código genético cabe atribuirla a la selección natural. Es posible que alguna vez hubiera muchos códigos, todos con diferentes grados de proclividad a error. ×
s
o g i d ó c e d o r e m ú N
Código natural 20.000 2,63 15.000 10.000 5000 0 2,0
4,4 6,8 9,2 11,6 Error del código
G N I D A E R Y C U L
Los organismos cuyos códigos mostrasen mayor capacidad de soportar errores gozarían de mayores probabilidades de sobrevivir; lo ocurrido fue, sencillamente, que el código genético estándar actual venció en la lucha por la existencia. Sabemos que el código admite variantes, por lo que esta hipótesis es razonable. Las pruebas a favor de la hipótesis de que ha sido la minimización de errores la fuerza motriz evolutiva que subyace bajo la organización del código no carecen de críticos. Refinadas búsquedas informáticas pueden sin duda mejorar las elecciones de la naturaleza, aun cuando sea aceptada la premisa de que un código es “bueno” si minimiza la variación de hidrofobicidad de los aminoácidos provocada por errores genéticos. Pero la optimalidad de los códigos resultantes de predicciones informáticas es mera optimalidad con respecto a los criterios suministrados por el programador, y la mayoría de los códigos “superiores” que han sido descritos hasta la fecha, se basan en presunciones simplistas sobre los tipos de errores a que se expone un código en el mundo real. Tales presunciones no tienen en cuenta, por ejemplo, el efecto de bamboleo, lo que imposibilita que sus algoritmos perciban la ventaja de que los codones 63
El código en evolución
E
xisten al menos 16 organismos, perpuesta al codón UAG, que en el código tenecientes a un amplio abanico estándar indica paro (“stop”). de linajes evolutivos, que se desvían Es probable que el código utilizado del código estándar de la naturaleza por la vida primitiva no alcanzase a al asignar “significado aminoacídico” a especificar 20 aminoácidos. De hecho, determinados codones. Por ejemplo, los aminoácidos más complejos derimuchas especies de Acetabularia , un van de otros más sencillos por modifialga verde, traducen los codones UAG cación bioquímica. Por ejemplo, en y UAA en el aminoácido glicina, mienvarias especies de bacterias el amitras que en el código estándar tales noácido glutamina se sintetiza a parcodones son señales de paro (“stop”). tir de glutamato, mientras éste se Para los hongos Candida el codón CUG encuentra todavía engarzado a su ARN. del ARN especifica serina, cuando por Este fenómeno induce a pensar que norma determina el aminoácido leucina. ciertos aminoácidos recientes pudieACETABULARIA, un alga marina, puede alcan- ran haber aparecido en forma de modiLa existencia de tales variaciones pone zar una longitud de 5 cm. Cada pedículo está ficaciones de un conjunto primordial de manifiesto que el código genético constituido por una sola célula, la mayor que más restringido y que los recién llegaha podido evolucionar, e incluso dar conoce la ciencia. indicaciones de cómo lo hizo. dos “se apropiaron” de un subconjunto En los tres dominios de la vida, se de los ARNt y de codones asignados fabrica en ocasiones el aminoácido selenocisteína, no pera sus parientes relativamente más simples; también, cierteneciente al cupo de los 20, en respuesta al codón estántos codones parecen haber sido “capturados” por aminoácidar UGA. La selenocisteína se origina por alteración biodos estándar en los organismos que se sabe que emplean química de la serina mientras ésta se encuentra todavía códigos variantes. Estos descubrimientos suscitan la cuesaprehendida en su ARN en el ribosoma. En dos dominios tión de cuántos códigos variantes más pueden existir en la (archaea y bacterias) existe un vigésimo segundo aminoánaturaleza y la de si el código estándar acabará ampliáncido, la pirrolisina, que es producido de igual modo, en resdose y dando cabida a muchos más aminoácidos.
sinónimos se diferencien, de modo exclusivo, en su tercera letra. Esta insuficiencia pone de manifiesto un segundo problema asociado a los códigos optimizados por la simulación teórica. La selección natural es un “diseñador ciego”: solamente puede tender a un ideal eligiendo, en cada generación, la mejor opción que haya en una población de variantes. Si se opera por esa vía una simulación de la evolución natural, encontramos que el grado de minimización de error conseguido por el código genético estándar sigue todavía siendo bastante impresionante: menos del 3 por ciento de los códigos hipotéticos pueden evolucionar por medio de la selección para llegar a igualar la robustez del código natural. Dicho de otro modo: el código “diamante” y el código “sin comas” parecieron antaño ser superiores al propio código de la naturaleza; cabría incluso generar, por medios informáticos, códigos matemáticamente más idealizados todavía. Pero la mera exhibición de la posibilidad de que existan códigos superiores, sin tener en cuenta el proceso evolutivo, resulta de dudosa relevancia para comprender la solidez de la solución alcanzada por selección natural. El código genético no sólo es un producto de la selección natural. Podría operar al modo de un algo64
. C N I , S R E H C R A E S E R O T O H P / Y R A R B I L O T O H P E C N E I C S / D L E F N E S O R S I X E L A
ritmo de exploración que busque acelerar la evolución. Las propiedades del código asociadas a la minimización de impactos, con sus bloques de codones sinónimos y de codones que especifican aminoácidos similares, no se limitan a restringir los daños. A diferencia de lo que sucede con las alteraciones de gran alcance, las micromutaciones tienen, en términos estadísticos, mayores probabilidades de resultar beneficiosas; de ese modo, al minimizar los efectos de una mutación cualquiera, el código maximiza la probabilidad de que una mutación génica conduzca a una me jora en la proteína resultante. Utilización del código
La comprensión de las fuerzas que configuraron el código y la forma en que éste, a su vez, moldea el curso de la evolución, no sólo permite admirar la pericia de la naturaleza en cuanto diseñadora de software . Ese conocimiento puede contribuir a la solución de los problemas planteados hoy en los laboratorios. Entre las prioridades en biología molecular destaca la identificación de genes. Se trata de ir cerniendo resmas de secuencias de genoma en bruto hasta descubrir las que definen auténticos genes. Pero las búsquedas en curso se limitan a usar como patrón las propiedades características de los
genes conocidos ya. Al tener en cuenta la forma en que el código genético filtra las mutaciones génicas, tales búsquedas podrían resultar potenciadas, pues permitirían reconocer genes sumamente diversificados e, incluso, inferir quizá la función de las proteínas por ellos cifradas. Cabe también la posibilidad de extraer claves sobre el plegamiento de las proteínas —dictado por la disposición de sus aminoácidos—, mediante el análisis de las propiedades de minimización de error de sus codones y el examen de la forma en que sus sustituciones podrían repercutir en el tamaño, carga, o hidrofobicidad de los aminoácidos. También los biólogos pueden aplicar los conocimientos adquiridos sobre el código estándar para “disfrazar” genes con fines de investigación. La existencia de un código que es universal, o poco menos, para todas las formas de vida ha posibilitado que se convierta en práctica común tomar un gen de interés (un oncogén, por ejemplo) e insertarlo en Escherisch ia coli, que fabricará la proteína correspondiente. Aunque no siempre se logra, porque el organismo receptor no puede expresar el gen, porque produce menos proteína de la esperada o porque sintetiza una proteína ligeramente diferente de la humana. Este problema, verdadera cruz de la investigación, resulta, en ocasioTEMAS 38
nes, de la dispar preferencia de los organismos por codones sinónimos. Pensemos, por ejemplo, en el código estándar, que contiene seis codones para el aminoácido arginina: los genes humanos tienden a preferir el uso de los codones AGA y AGG, en tanto que la bacteria E. coli sólo muy raramente se vale de AGA y a menudo lo traduce mal. El conocimiento de estas variaciones y preferencias consiente el diseño de versiones del gen humano que funcionarán fiablemente al introducirlas en otros organismos. Uno de nuestros laboratorios (el de Freeland) está desarrollando aplicaciones informáticas destinadas a facilitar la conversión de las anteriores acotaciones teóricas al código en instrumentos aptos para la ingeniería genética, el rastreo de genes y la predicción del plegamiento de las proteínas. Junto con otros especialistas estamos investigando el camino recorrido hasta la constitución del código, es decir, de qué modo empezó el ARN a interactuar con los aminoácidos, cómo llegó su asociación a desarrollar un sistema formal de codificación, y de qué manera se fue ampliando el alfabeto de aminoácidos durante las primeras fases de la evolución. Esta metodología podría abrir caminos hacia muchas otras cuestiones pendientes: ¿A qué se debe que haya sólo 20 aminoácidos estándar, ni uno más ni uno menos? ¿Por qué se hallan ciertos aminoácidos en correspondencia con seis codones, mientras que otros lo están con uno o dos? ¿Tendrá esta organización que ver con la minimización de errores? El desciframiento del código ha demostrado ser meramente el principio para comprender su significado.
COLABORADORES DE ESTE NUMERO Asesoramiento y traducción:
Esteban Santiago: El genoma o culto, El nacimient o de la e pigenética, Microsatéli tes de ADN , Interferencia de ARN y El cromosoma de la masc ulinidad ; Luis Bou: La evoluci ón codific ada; Felipe Cortés: Importancia del context o en la genética; Alfonso Susana: Micromatrice s de ADN ; Ana María Rubio: Los comienz os de la industria del genoma humano y La fiebre b ioinformá tica.
Portada: Slim Films INVESTIGACION Y CIENCIA DIIRECTOR GENERAL José M. a Valderas Gallardo DIRECTORA FINANCIERA Pilar Bronchal Garfella EDICIONES Juan Pedro Campos Gómez
Laia Torres Casas M. a Cruz Iglesias Capón Albert Marín Garau SECRETARÍA Purificación Mayoral Martínez ADMINISTRACIÓN Victoria Andrés Laiglesia SUSCRIPCIONES Concepción Orenes Delgado Olga Blanco Romero EDITA Prensa Científica, S. A. Muntaner, 339 pral. 1. a 08021 Barcelona (España) Teléfono 934 143 344 Telefax 934 145 413 www.investigacionyciencia.es PRODUCCIÓN
SCIENTIFIC AMERICAN EDITOR IN CHIEF John Rennie EXECUTIVE EDITOR Mariette DiChristina MANAGING EDITOR Ricki L. Rusting SENIOR EDITOR Michelle Press NEWS EDITOR Philip M. Yam SPECIAL PROJECTS EDITOR Gary Stix SENIOR WRITER W. Wayt Gibbs EDITORS Mark Alpert, Steven Ashley,
Graham P. Collins, Carol Ezzell, Steve Mirsky y George Musser PRODUCTION EDITOR Richard Hunt GENERAL MANAGER Michael Florek
VICE PRESIDENT AND MANAGING DIRECTOR, INTERNACIONAL
Dean Sanderson
PRESIDENT AND CHIEF EXECUTIVE OFFICER
Gretchen G. Teichgraeber John Sargent
CHAIRMAN
DISTRIBUCION
PUBLICIDAD
para España:
Madrid: GM Exclusivas Publicidad Menorca, 8, Bajo, Centro Izda. 28009 Madrid Tel. y Fax 914 097 046
LOGISTA, S. A.
BIBLIOGRAFIA COMPLEMENTARIA A QUANTITATIVE MEASURE OF ERROR MINIMIZATION IN THE GENETIC CODE. David Haig y Laurence D. Hurst en Journal of Molecular Evolution, vol. 33, n.º 5, págs. 412-417; noviembre de 1991. THE IN VE NT IO N O F T HE GENETIC CODE . Brian Hayes en American Scientist , vol. 86, n.º 1, págs. 8–14; enero-febrero de 1998. THE GENETIC CODE IS ONE IN A MILLION. Stephen J. Freeland y Laurence D. Hurst en Journal of Molecular Evolution, vol. 47, n.º 3, págs. 238–248; septiembre de 1998. THE CASE FOR AN ERROR-MINIMIZING GENETIC CODE. Stephen J. Freeland, Nick Keulmann y Tao Wu en Origins of Life and Evolution of the Biosphere, vol. 33, n.º 4–5; págs. 457–477; octubre de 2003.
N UEVA GENÉTICA
Pol. Ind. Polvoranca Trigo, 39 Edif. 2 28914 Leganés (Madrid) Teléfono 914 819 800
Cataluña: QUERALTO COMUNICACION
para los restantes países: Prensa Científica, S. A.
Julián Queraltó Sant Antoni M.a Claret, 281 4.º 3.a 08041 Barcelona Tel. y fax 933 524 532 Móvil 629 555 703
Muntaner, 339 pral. 1.a 08021 Barcelona Teléfono 934 143 344
Copyright © 2004 Scientific American Inc., 415 Madison Av., New York N. Y. 10017. Copyright © 2004 Prensa Científica S.A. Muntaner, 339 pral. 1.a 08021 Barcelona (España) Reservados todos los derechos. Prohibida la reproducción en todo o en parte por ningún medio mecánico, fotográfico o electrónico, así como cualquier clase de copia, reproducción, registro o transmisión para uso público o privado, sin la previa autorización escrita del editor de la revista. El nombre y la marca comercial SCIENTIFIC AMERICAN , así como el logotipo correspondiente, son propiedad exclusiva de Scientific American, Inc., con cuya licencia se utilizan aquí.
ISSN: 1135-5662
Dep. legal: B. 32.350 – 1995
Imprime Rotocayfo-Quebecor, S.A. Ctra. de Caldes, km 3 - 08130 Santa Perpètua de Mogoda (Barcelona) Printed in Spain - Impreso en España
65
Importancia del contexto en la genética El entorno influye en los efectos de los genes y condiciona la herencia de los caracteres, se trate del color de una flor o de la probabilidad de desarrollar un cáncer H. Frederik Nijhout
E
n los primeros días de la genética se pensaba que cada gen codificaba la información correspondiente a un único rasgo: el color, la forma o el tamaño. Esta creencia surgió en el siglo XIX como resultado del trabajo del padre de la genética, Gregor Mendel, quien de intento o por casualidad estudió caracteres cuya variación se debía casi por completo a los cambios en un solo gen. Pudo así deducir los patrones básicos que conforman las leyes fundamentales de la genética. A medida que nuestra experiencia con la genética creció, se hizo patente, sin embargo, que la mayoría de los caracteres o fe no tipo s se heredan mediante mecanismos más complicados que los descritos por Mendel. La razón estriba en que las diferencias observadas entre los rasgos de cualquier par de individuos se deben casi siempre a diferencias en muchos genes. El efecto aislado de un solo gen se observa normalmente sólo mediante experimentos de entrecruzamiento muy controlados, o bien en aquellos casos, poco frecuentes, en que un gen se encuentra tan dañado, que su ausencia afecta al fenotipo sobremanera, enmascarando la variación de otros genes que influyen en el mismo. Cuando muchos genes contribuyen a un carácter, quizá resulte difícil discernir la contribución particular de cada uno al resultado final. Además, cuando abundan los genes que varían de un individuo a otro, el patrón hereditario de un rasgo determinado puede ser extraordinariamente complejo. De hecho, la expresión carácter complejo se refiere a los rasgos cuya herencia de generación en generación no se ajusta a las leyes de Mendel. El análisis de los mecanismos bioquímicos mediante los cuales los genes afectan al fenotipo es una de 66
las maneras que tenemos de entender la transmisión de los caracteres complejos. Más adelante, hablaré de la naturaleza general de los rasgos genéticos complejos e ilustraré con simples gráficas de qué forma las interacciones entre muchos genes controlan un carácter. Tal visualización nos proporciona una clave para una comprensión intuitiva de la herencia compleja y nos ayuda a explicar por qué el ser portador de un gen de una determinada enfermedad no siempre permite una predicción del riesgo de desarrollarla. Flores y fenotipos
Mendel observó que, cuando se cruzaba una planta de guisante de flores blancas genéticamente pura con otra de flores violetas, también pura, siempre resultaba una progenie con flores violetas. Curiosamente, cuando esas flores violetas de segunda generación se cruzaban a su vez entre sí, una cuarta parte de la progenie presentaban flores blancas y el resto eran, de nuevo, plantas con flores violetas. Esta observación se explica por el hecho de que cada individuo hereda una versión de un gen, llamada alelo, de cada progenitor; a su vez, uno de dichos alelos se transmite a cada uno de sus descendientes. Se denomina a esta composición genética el genot ipo de un individuo. En este caso, el alelo para el color violeta es dominante sobre el del color blanco, de manera que, cuando los dos alelos se encuentran, la flor es siempre violeta. Que exista la misma probabilidad de que un descendiente reciba uno u otro alelo de cada progenitor explica que dos progenitores con flores violetas puedan tener descendencia con flores blancas. Todos los caracteres estudiados por Mendel son ejemplos de fenotipos discontinuos: flores blancas o violetas,
guisantes lisos o rugosos, tallos largos o cortos. En cada caso había dos alelos por gen, y uno de ellos era completamente dominante sobre el otro. No obstante, no siempre funcionan así las cosas, ni siquiera cuando se trata de rasgos que parecen estar gobernados por un solo gen. Consideremos la herencia del color en las flores de dragón, descrita, en la aurora del siglo XX , por Erwin Baur, investigador del que hoy es el Instituto Max Planck de Mejora Vegetal. Como ocurre con las del guisante, el color de las flores del dragón depende de un simple gen con dos alelos típicos: rojo y blanco. La particularidad reside aquí en que ninguno es dominante. Cruzando una planta pura con flores rojas con una planta pura con flores blancas se obtiene progenie con flores rosas. O sea, la combinación de alelos rojo y blanco produce un resultado intermedio. Este fenómeno de dominancia incompleta puede observarse enseguida porque el color de la flor de dragón es un fenot ipo conti nuo , potencialmente con un rango continuo de tonos rosa entre el blanco y el rojo. Caracteres simples y pasos que limitan rendimientos
Los dragones reflejan una observación común: la existencia de caracteres que varían de manera continua dentro de una población. En unos pocos casos se debe a cambios en un solo gen, pero en la inmensa mayoría de los rasgos intervienen muchos genes. El mismo color de una flor es producto de varias causas genéticas subyacentes. Los genes que controlan la biosíntesis de pigmentos en las flores son muchos. Unos codifican enzimas que transforman precursores incoloros —aminoácidos, azúcares— en TEMAS 38
T S I T N E I C S N A C I R E M A / A N A I N O S H T I M S N O I C U T I T S N I , L A R U T A N A I R O T S I H E D L A N O I C A N O E S U M / K R A L C P I H C
1. ALGUNOS CARACTERES ofrecen una amplia gama de variación en el seno de una población, como se muestra en esta fotografía de conchas del caracol arborícola cubano Polymita picta , especie endémica del extremo oriental de la isla de Cuba. Esta variación es el producto de la acción conjunta de muchos genes; el resultado de la variación de cualquier gen está bajo la influencia de la composición genética global del individuo.
varios pigmentos cromáticos. Esas rutas de biosíntesis pueden incluir más de una docena de pasos, cada uno de ellos regulado por una enzima diferente. Otros genes codifican proteínas que regulan la síntesis y la actividad enzimática; se trata de ficada por ese gen actúa en el paso reguladores que afectan al momento que limite la velocidad de reacción, y lugar donde se producen los pig- ese punto de cualquier sistema que mentos. Y otras proteínas controlan obstruye el flujo. Imaginemos agua la estabilidad y localización subce- que fluya sucesivamente por tres lular de los pigmentos. Los genes embudos de diferente tamaño. ¿Qué que codifican estas proteínas regula- determinará el caudal del flujo en doras están, a su vez, regulados por este sistema? El embudo más estreotras proteínas, los factores de trans- cho (véase la figura 2) cripción, cada uno de ellos codificado Para aplicar la imagen a la explipor un gen particular. Y un conjunto cación de los genotipos y fenotipos, diferente de genes controla la pro- imaginemos que cada embudo repreducción de factores de transcripción. senta la acción de una enzima en una Esta especie de regresión intermina- ruta metabólica. Altos niveles de actible de regulación e interacción entre vidad enzimática —que podrían reflegenes, por extraña que parezca, cons- jar una abundancia de proteína o una tituye la regla general, incluso para alta eficiencia— corresponden a el más simple de los caracteres. embudos de boca ancha, mientras que ¿Cómo es posible entonces que un los niveles bajos vendrían represensolo gen parezca controlar las pro- tados por las bocas estrechas. piedades de un carácter determinado? Por otra parte, podemos extender Puede ocurrir, de manera hasta cierto este ejemplo para explicar por qué la punto inmediata, si la enzima codi- transmisión en la herencia del color N UEVA GENÉTICA
de la flor parece estar controlada por un solo gen, aunque se requiera un gran número de genes para la correcta síntesis del pigmento. El agua representará en este caso las moléculas precursoras que recorren pasos sucesivos de un proceso que conduce a la formación de un pigmento. Cada embudo simbolizaría el producto de un gen: cuanto más estrecha fuese la boca del embudo, menor sería la actividad de esa enzima. Si el producto (enzima) del gen rojo/blanco de Baur es el embudo más estrecho de la serie, el rendimiento total de la formación de pigmento será una función de la actividad de esa enzima. Mientras no haya otro producto génico con una actividad más baja, diremos que los cambios en tal gen controlarán la variación del color de la flor. ¿Qué ocurre si fluctúan los niveles de actividad de otros genes d e la 67
ruta? En este modelo simple, la resla ingeniería genética introduce un puesta es: nada, mientras dichos niveoncogén en un ratón, de ordinario les no se aproximen al punto limitante sólo induce cáncer en unos cuantos del rendimiento. Si alguno de los tejidos, aun cuando el gen se exprese otros pasos de la ruta se convierte en de manera general. Esta observalimitante del rendimiento, el paso ción sugiere que sólo algunos tejidos rojo/blanco ya no determinará en proveen las condiciones requeridas exclusiva el color de la flor. En cuanto para que el gen defectuoso ejerza su Pa o otro gen codifique una enzima defiefecto deletéreo. limita te ciente que bloquee de manera eficaz La aditividad la ruta (una “mutación nula”), la com y por qué es un error posición alélica rojo/blanco se volverá irrelevante para la determinaLos efectos diversos de los oncogenes se atribuyen a “factores coadyuvanción del color de la flor. Epi sta sis se denomina a este efecto, en el cual un tes”, que varían según el tejido y el gen altera la expresión de otro. Así, individuo. Por lo normal, se descoincluso en un ejemplo tan elemental, nocen las identidades de esos factoel efecto de un gen sobre un carácter res. Según la hipótesis más simple, puede ser sensible a otros genes que cada factor que afecta a un carácter participen en la ruta. tiene un pequeño efecto por sí solo y Nuestra metáfora de los embudos la suma de esos pequeños efectos provale también para explicar los rasgos duce una influencia grande y obserdicotómicos de las flores del guisante vable en el fenotipo. de Mendel. Un genotipo binario sólo Podemos llamar a esta idea la hi pót esis aditiv a. Si fuese correcta, porequiere que añadamos al modelo un discriminador sensible a un umbral. dríamos elaborar un catálogo de los Podría ser un brazo que sujetase el efectos independientes de cada alelo recipiente que recoge el agua bajo los 2. EL CONCEPTO DE PASO LIMITANTE del de cada gen y aprovechar esa inforembudos; por encima de cierta can- rendimiento puede ilustrarse con el ejem- mación para deducir el efecto de tidad de agua, el brazo cedería y el plo de un agua que fluya a través de una se- varias combinaciones alélicas. A la recipiente apretaría al bajar un botón rie de embudos. Dado que el agua no fluirá suma genética podríamos añadirle que pondría en marcha la producción más deprisa de lo que pueda pasar a través las consecuencias numéricas de los de pigmento violeta. Si el flujo a tra- del más estrecho de los embudos, este úl- factores ambientales y obtendríamos vés del sistema se encuentra por timo determinará el rendimiento total del una descripción fenotípica precisa. Si debajo del umbral, se manifestará un flujo en el sistema. Será el paso limitante el rasgo de interés fuese una e nfergenotipo; si se sobrepasa el umbral, del rendimiento. medad, digamos que el cáncer, la el genotipo será otro. hipótesis aditiva nos permitiría determinar, para cada individuo, si va a Mutaciones y moderadores los efectos del knoc kout, o supresión sufrirla partiendo del conocimiento Un modo frecuente de estudiar la de genes específicos, del ratón. Este de los factores participantes. relación entre un gen y un carácter método elimina la función de un proPero no conocemos todos los factoes examinar los efectos de mutacio- ducto génico. Por ejemplo, el knock- res que contribuyen. Por eso, sólo nes espontáneas o artificialmente out de un gen relacionado con el reti- podemos calcular la probabilidad de inducidas en dicho gen. La mayoría noblastoma causa anomalías severas una enfermedad. Estas probabilidade las mutaciones disminuyen la acti- y muerte embrionaria en una cepa de des se obtienen del análisis estadístico vidad de un producto génico; los efec- ratón, mientras que la misma mu- de un grupo extenso de personas, tos de tal mutación pueden suminis- tación en otra cepa no ejerce efecto algunas de las cuales sufren la enfertrarnos pistas acerca del papel normal alguno: los ratones son viables y al- medad. Establecer una correlación que desempeña el gen en la deter- canzan la madurez sexual, tal como entre la incidencia de la enfermedad minación de un carácter. han demostrado Michael Rudnicki y y los factores que se sospecha que Con el tiempo, se ha comprendido sus colaboradores de la Universidad intervienen en su aparición predice que el efecto de una mutación gené- McMaster. el riesgo asociado a la presencia de tica sobre un carácter no constituye Otros ejemplos de la importancia cada factor. Las probabilidades no una propiedad intrínseca del gen. La del contexto proceden de los estu- son auténticas predicciones, sino la naturaleza del efecto depende mucho dios de la genética del cáncer. Mu- descripción estadística de ese grupo del contexto celular en que se exp rese taciones en genes que regulan el desa- de estudio específico. Sólo hay una el gen. Sean Carroll y sus colabora- rrollo normal de la célula y su división predicción segura: en grupos idéntidores de la Universidad de Wisconsin pueden trastornar tal regulación y cos las correlaciones y probabilidademostraron que, en los embriones dar lugar a esa proliferación des- des serán más o menos iguales. de oruga, la expresión localizada del controlada que conocemos como cán Ahora bien, aun cuando pud iésegen distalless inducía la formación cer. A los correspondientes alelos mos medir todos los factores que conde las patas. Si el mismo gen se mutados se los llama oncogenes. Que tribuyen, lo que sabemos acerca de expresa durante una fase más avan- un oncogén en particular origine un los mecanismos con que los genes zada, en el ala en desarrollo, induce cáncer depende con frecuencia del influyen en los caracteres nos indica la formación de un patrón de man- fondo genético del individuo, así como que la simple hipótesis aditiva debe chas coloreado. de determinadas variables ambien- ser errónea. Para empezar, los genes También ilustran la importancia tales —una deficiencia en vitami- ejercen su influencia por medio de del contexto los estudios acerca de nas, el hábito de fumar—. Cuando redes de interacciones proteicas com T S I T N E I C S N A C I R E M A / E N N U D M O T
s s n
68
s
TEMAS 38
plejas e interconectadas; los efectos de cualquiera de los participantes en el sistema tomado en su conjunto no son directos, en absoluto. Lo observamos en la red reguladora génica de las primeras fases del desarrollo de la mosca de la fruta ( véase la figura 3 ). Aquí, los propios productos regulan la expresión génica, controlando hasta qué grado se producirá cualquier otra proteína, con frecuencia otro regulador. En tales entramados complejos, con ramificaciones y rutas convergentes, con retrorregulación positiva y negativa, resulta improbable que los efectos de la variación en un componente interactúen aditivamente con la diversidad de otros componentes. Quizá la razón más importante de que no haya aditividad en los efectos genéticos estribe en la relación entre diversidad genética y variaciones en los caracteres, que no es lineal. La no linealidad se debe a que el efecto de la variabilidad genética depende del contexto, y ello hace difícil de predecir el efecto de la variación simultánea en varios genes. Para entender las propiedades de los sistemas genéticos no lineales partiremos de un ejemplo sencillo: el origen de la dominancia entre los alelos de un gen en un individuo híbrido.
cidad de la reacción (el flujo a traLa lección que debe aprenderse vés de la ruta) se convierte en una aquí es que la dominancia no constifunción no lineal de la actividad de tuye una propiedad del alelo en sí, porcualquiera de las enzimas. Esa no que, en cuanto a la enzima sola, los linealidad resulta cada vez más pro- alelos operan de un modo simplenunciada conforme se va alargando mente aditivo. La dominancia surge la cadena. del contexto; en este caso, la cadena Examinemos ahora una de las enzi- de reacciones en la que la enzima está mas de la cadena de reacciones. Su- integrada. La dominancia resulta así pongamos que el gen que codifica esta una propiedad del sistema en su conenzima presenta dos alelos, y que las junto. enzimas codificadas por esos dos alelos cumplen misiones diferentes. Los Variabili dad en múltiples individuos homocigóticos son aque- pasos de una ruta llos que tienen dos copias idénticas En el proceso de calcular cómo se relade uno o el otro alelo; definen los lími- ciona la actividad de una enzima indites inferior o superior de la actividad vidual con la velocidad de una reacenzimática de los individuos. Los hete- ción en su conjunto, Kacser y Burns rocigotos poseen una copia del alelo supusieron constantes las actividade baja actividad y una copia de la des de las demás enzimas de la ruta. versión de alta actividad: la activi- En un sistema biológico real esto es dad total de la enzima en un hete- muy improbable. A lo largo de miles rocigoto se encontrará exactamente de generaciones, la mayoría de las en el término medio entre las activi- enzimas, si no todas, que participan dades de los homocigotos. Sin em- en una cadena habrán acumulado bargo, debido a que el flujo a través cambios genéticos. Imaginemos por de la ruta no es una función lineal de ello qué ocurriría si hay cambios genéla actividad enzimática, el flujo del ticos en dos de las enzimas de una heterocigoto se parecerá más al de uno ruta. Puesto que ahora tenemos dos de los dos homocigotos. Uno de los ale- variables independientes, ya no podelos parecerá ser dominante con res- mos representar la reacción con una pecto al otro. línea en una gráfica bidimensional.
No linealidad y dominancia
La no linealidad de un resultado significa que no depende, de manera directa, de lo que entre en el sistema. La existencia de alelos dominantes y recesivos en los guisantes de Mendel nos ofrece un ejemplo. En las flores del guisante, la existencia de un discriminador, el brazo sensible a un umbral de peso, impide que el resultado varíe continuamente según lo que entre. No ha de sorprender, pues, que la dominancia se deba, por lo común, a la existencia de procesos no lineales (umbrales) en la bioquímica y el desarrollo. En la historia de la bioquímica encontramos un caso prototípico de cómo la no linealidad produce dominancia. En 1981, Henrik Kacser y James Burns, de la Universidad de Edimburgo, describieron de qué modo la velocidad global de una serie de reacciones catalizadas por enzimas dependía de la actividad de una de las enzimas de la cadena. La velocidad del conjunto dependerá de cuántas enzimas haya en la cadena. Para un sistema de una sola enzima, la velocidad de la reacción es simplemente una función lineal de la actividad de la proteína en cuestión. Pero si la cadena consta de más de una enzima, la velo N UEVA GENÉTICA
Genes maternos
Genes gap
Genes de regla par
caudal
g i ant
tai l less
fush i tarazu
b i co i d
hunchback
even-sk i pped
nanos
Krüppel
runt
kni r ps
ha i ry
Inhibición Activación Inhibición a altos niveles, Activación a bajo s niveles
Genes de polaridad de segmento
engra i led
hedgehog
T S I T N E I C S N A C I R E M A / E N N U D M O T
wi ngless
3. LOS GENES QUE CONTROLAN las primeras fases del desarrollo de la mosca de la fruta forman una red compleja; abarca circuitos de retroalimentación positiva, negativa y variable, así como una organización de múltiples niveles. La jerarquía y asignación de clase (gen materno, gap o de regla par) se basan en las propiedades funcionales de los productos génicos, determinadas por otros genes del sistema. Estas interacciones ilustran por qué las diferencias genéticas simultáneas en muchos pasos de una vía compleja pueden alterar el efecto de cualquier gen sobre el fenotipo.
69
GUISANTES LISOS
GUISANTES LISOS
alelo no es algo intrínseco, sino una propiedad emergente del sistema; en este caso, una función del lugar donde reside exactamente el individuo en la superficie fenotípica. Supongamos que no hay variación genética. Cada gen porta un solo alelo y todos los individuos de una población son homocigotos para todos los genes. Existe entonces un solo valor genético para cada gen; todos los individuos de la población ocupan el mismo punto en la superficie fenotípica. En tales circunstancias nos podríamos preguntar: si ocurre una mutación en uno de los genes, ¿qué efecto tendrá en el fenotipo? Dependería tanto de la magnitud del efecto de la mutación como de dónde se concentrase la población en la superficie fenotípica. Supongamos que la mutación tiene un gran efecto sobre uno de los genes, la deleción de una región inhibidora; con ello se maximiza la actividad de la enzima que codifica. Esta mutación desplaza al individuo hasta otro punto sobre la superficie, a lo largo de una línea paralela al eje que representa al gen mutado (véase la figura 4). Si el individuo se encuentra en una zona de la superficie con una pendiente muy pronunciada, la mutación comportará un cambio fenotípico mucho mayor que si la pendiente fuera suave. Por tanto, el efecto de una mutación sobre un carácter depende, tal y como pasa con la dominancia de ese carácter, del punto exacto de la superficie fenotípica de que se trate. En otras palabras, el efecto no es una propiedad de la mutación propiamente dicha, sino una función del sistema en su conjunto.
GUISANTES RUGOSOS
GUISANTES LISOS
GUISANTES LISOS
GUISANTES LISOS
El paisaje fenotípico
GUISANTES LISOS Y RUGOSOS EN LA MISMA VAINA, CON PREDOMINIO DE LOS LISOS
Se convierte en una superficie en un espacio tridimensional (véase la figura 4). La llamaremos “superficie fenotípica”, porque describe la relación del fenotipo con la variación genética. Cada punto de la superficie fenotípica representa el efecto combinado de dos variables independientes. La variable dependiente —fenotipo— equivale al flujo o caudal a través de la ruta. Dos puntos (o dos individuos) 70
I T T E N A Z A N A I Z I T E D O J U B I D
pueden tener el mismo valor fenotípico pero muy diferentes genotipos. En este caso el grado de dominancia de un gen dependerá también de los alelos presentes en el otro gen variable. Si el segundo gen codifica enzimas con alta actividad, la relación no lineal entre el primer gen y el flujo de la reacción diferirá de lo que sería en presencia de baja actividad. De nuevo, pues, la dominancia de un
Ahora ya estamos en condiciones de entender por qué las mutaciones ejercen efectos tan dispares en diferentes fondos genéticos. El fondo genético define dónde se encuentra alojado un individuo o población genética dentro de un paisaje fenotípico. La figura 4 muestra dicha superficie con dos individuos, X e Y, que portan el mismo fenotipo (la misma cota en la gráfica tridimensional) a pesar de tener alelos distintos para los genes A y B. Debido a sus posiciones relativas en la superficie, las mutaciones en el gen A acarrearán distintas consecuencias para Y (gran efecto fenotípico) que para X (efecto mínimo). Ocurriría lo contrario para una mutación del gen Y. Cabe entonces imaginar que una población de individuos con genotipo A podría acumular muchas mutaTEMAS 38
4. DOS INDIVIDUOS QUE RESIDEN EN LA MISMA LINEA DE NIVEL de la superficie fenotípica (X e Y) cuentan con idéntico fenotipo, aunque tengan valores muy diferentes para los genes A y B (a ). En consecuencia, a X e Y les afectará de forma muy diferente una mutación del gen A que maximice la actividad de la proteína que codifica (b ). La persona X no resultará afectada por la mutación; seguirá ocupando la misma cota. Por el contrario, Y adquirirá un fenotipo completamente diferente en virtud del cambio. La superficie fenotípica explica por qué las poblaciones tienden a apiñarse a lo largo de una cota ideal (c ). Cuando los individuos X e Y de los extremos opuestos de la población se cruzan, su progenie presenta valores intermedios de los productos génicos de A y B. Debido a la relación no lineal entre estos genes y el fenotipo, los valores intermedios para A y B colocan a la progenie en una co ta diferente, que quizá represente una menor viabilidad. Esto tiende a agrupar las poblaciones, pues el cruzamiento entre individuos del centro del grupo dará una progenie con los mismos valores que los padres.
a X
Y
1,0 0,8 o
g s
a0,6 R
0,4
Y
0,2 0
1 , 0
B
n 4 , e 0
0 , 8
0 , 6
A
2 , 0
0 , 4 0 , 2 0
Los paisajes reales son multidimensionales
Una superficie fenotípica no es más que una representación visual de los procesos que dan lugar a un carácter. Hemos visto cómo pueden construirse superficies para una vía bioquímica sencilla. En principio, es posible extender esto a cualquier variable que influya en el carácter. Hay tres prerrequisitos: conocer los procesos que subyacen al carácter, escribir las ecuaciones que repreN UEVA GENÉTICA
0 , 1 8 , 0 6 , 0
X
G e n
ciones en el gen Y de escaso o nulo efecto en el carácter; no se eliminarían por selección. Un biólogo evolutivo llamaría a estas mutaciones “neutras”. Sin embargo, las mutaciones del gen X tendrían seguramente un efecto poderoso en el carácter. Si redu jesen la viabilidad del portador, la selección natural podría eliminarlas. Nos hallamos así ante una situación en la cual se permite que la variabilidad de un gen se acumule, mientras que los cambios en otro sufrirán una selección, aunque ambos codifiquen enzimas de la misma vía bioquímica y, si se los estudiara por separado, mostrarían ejercer el mismo efecto sobre el carácter. Al igual que antes, lo contrario valdría para una población de individuos con genotipo B. En este caso, las mutaciones en el gen X tendrían un efecto escaso y parecerían neutras; las mutaciones en el gen Y causarían, por contra, mayores efectos y probablemente la selección actuaría contra ellas. La gravedad de una mutación, de neutra a profunda, no es una propiedad del alelo mutante en sí; viene determinada por los alelos de otros genes que el individuo (o la población) posee.
T S I T N E I C S N A C I R E M A / E N N U D M O T
G
0
b X
Y
1,0 0,8 Y
o
g s
a0,6
R
0,4
0 , 1
X
0,2 0 1 ,0
0 , 8
8 , 0 6 , 0 B 4 , n 0 e G 2 , 0
0 , 6
0 G , 4 e n A
0 , 2 0
0
c X
Y
Z
1,0 0,8 o
g s
a0,6 R
0,4
Z
0,2 0
Y
X 1 , 0
0 , 8
0 , 6
0 G , 4 e n A
0 , 2 0
0 , 1 8 , 0 6 , 0 B 4 , n 0 e G 2 , 0
0
71
sentan esos procesos y convertir dichas ecuaciones en gráficos para formar una superficie fenotípica. En la práctica se trata de una tarea formidable, limitada a sistemas bioquímicos debido a la necesidad de descripciones matemáticas de la cinética de la reacción. Sin embargo, desde hace diez años se vienen registrando notables avances en la comprensión de los mecanismos genéticos del desarrollo. Algunos rasgos, mencionemos las primeras fases del desarrollo embrionario de Dr os o phila melanogas ter , se abordan ya a través de modelos matemáticos exactos. Los caracteres reales están afectados por la variación independiente en muchos genes. Requieren, pues, una superficie fenotípica multidimensional con tantos ejes ortogonales como variables independientes haya. Para un ordenador no es particularmente difícil manejar superficies de n dimensiones con sus pendientes correspondientes, pero semejantes formas son imposibles de representar en un papel. Con el propósito de una buena visualización, manejamos sólo dos variables independientes a un tiempo, sin olvidar nunca que se hallan incluidas en un entramado multidimensional mayor. Individuos y poblaciones
Si los individuos se representan mediante puntos en una superficie fenotípica, las poblaciones se representarán en forma de nubes de puntos. La dispersión de esa nube de puntos en diferentes direcciones será entonces una representación de los cambios alélicos presentes en la población para cada uno de los genes que definen el carácter que sea. Diferentes poblaciones residirían en regiones distintas de la superficie. Si conociésemos la forma de la superficie fenotípica, sabríamos intuitivamente cómo afectarían las mutaciones a un carácter dentro de una población determinada: qué parte del grupo sería más vulnerable a una perturbación producida por una variable determinada y cuál sería resistente al mismo cambio. Además, nos hallaríamos preparados para investigar la dispersión de diferentes poblaciones sobre la superficie y cómo se mueven por ella en razón de nuevas mutaciones, y de la selección natural. Las poblaciones con diferentes fenotipos óptimos se establecerán en diferentes líneas de nivel del paisaje. Una vez en una cota de fenotipo óptimo, es improbable que una pobla72
ción se disperse más allá de la línea de nivel correspondiente. ¿Por qué? Porque el entrecruzamiento entre individuos distantes entre sí, aunque radicados a lo largo de la misma línea de nivel, produciría fenotipos intermedios que, a causa de la no linealidad del sistema, ya no estarían en esa misma cota ( véase la figura 4c). Los individuos intermedios sufrirían una selección negativa; la dispersión de genotipos no desbordará la línea de nivel. Podemos de este modo predecir que las poblaciones formarán nubes de puntos, bastante apretadas, sobre la superficie fenotípica, al menos hasta que aparezcan otras variables que cambien el paisaje o creen una nueva presión de selección. El efecto del ambiente
Una de las ventajas de la descripción matemática cuantitativa del fenotipo es que nos permite incorporar todos los factores que pueden afectar a su desarrollo y propiedades. No tenemos por qué restringirnos a los efectos de genes o enzimas; cabe también considerar los efectos de factores no genéticos, como la temperatura, el aporte de nutrientes y las hormonas segregadas en respuesta a estímulos externos. Estos factores ambientales afectarán a las velocidades de algunas reacciones o introducirán nuevas interacciones antes ausentes; sus efectos se describirán mediante ecuaciones matemáticas con la facilidad con que calculamos la influencia de un gen. Por ejemplo, un incremento de 10 grados en la temperatura puede duplicar la velocidad de algunas reacciones bioquímicas al tiempo que inhibe otras; ese fenómeno puede repercutir en el funcionamiento global de una vía bioquímica compleja. Mediante un modelo matemático de dichos procesos, el efecto de la temperatura sobre la velocidad de la reacción puede calcularse explícitamente. En el gráfico correspondiente, la variación de temperatura se representaría mediante un eje independiente, ortogonal a los demás. Ahora la forma de la superficie fenotípica estará determinada tanto por las variables genéticas como por las ambientales, y podremos juzgar con exactitud de qué manera el entorno repercute en la sensibilidad del sistema a las mutaciones de los diferentes genes. Cuando un carácter cambia en respuesta a una variable ambiental, se dice que muestra pla sti cidad fenotí pic a; el gráfico que describe exacta-
mente cómo cambia ese rasgo en respuesta a la variable se llama modelo de reacción. Así, una sección de un paisaje fenotípico paralela a un eje ambiental de variación representa el modelo de reacción para un genotipo dado, mientras que una sección paralela al eje genético de variación describe el efecto de las mutaciones sobre un carácter en un entorno determinado. En todo lo precedente debe quedar claro que si un paisaje no es plano y lineal (y probablemente ninguno lo es), los efectos del ambiente serán dependientes del contexto, y no en menor medida que lo fueran los efectos de los genes. Consideración final
En esta visualización gráfica del paisaje fenotípico, he mostrado que el efecto de un gen determinado varía en función de los otros genes que también controlan el carácter. Esta dependencia del contexto surge de la no linealidad de los procesos que subyacen a la expresión fenotípica. Pese a la limitación del mínimo número de dimensiones que podemos representar sobre un papel, cabe una comprensión intuitiva de la interacción de los genes en los sistemas comple jos. Pueden representarse matemáticamente sistemas multidimensionales. En el futuro, el desarrollo de métodos de visualización asistidos por ordenador que permiten al usuario moverse fácilmente dentro de un espacio multidimensional nos ofrecerán mejores vislumbres de estos complejos fenómenos.
BIBLIOGRAFIA COMPLEMENTARIA STRAINDEPENDENT EMBRYONIC LETHALITY IN MICE LACKING THE RETINOBLASTOMAR EL AT ED P 130 G ENE . J. E. LeCouter, B. Kablar, P. F. M. Whyte, C. Ying y M. A. Rudnicki en Development , vol. 125, págs. 4669-4679; 1998. THE EVOLUTION OF CANALIZATION AND THE BREAKING OF VON BAER’S LAWS: MODELING THE EVOLUTION OF DEVELOPMENT WITH EPISTASIS. S. H. Rice en Evolution, vol. 52, págs. 647-656; 1998. FROM DNA TO DIVERSITY : MOLECULAR GENETICS AND THE EVOLUTION OF ANIMAL DESIGN. S. B. Carroll, J. K. Grenier y S. D. Weatherbee. Blackwell Science; Malden, Mass.; 2001. ERWIN BAUR. W.-E. Lönnig y H. Saedler en Encyclopedia of Genetics, vol. 1. Dirigido por S. Brenner y J. H. Miller. Academic Press; San Diego, 2002. THE NATURE OF ROBUSTNESS IN DEVELOPMENT. H. F. Nijhout en BioEssays, vol. 24, págs. 553-563; 2002.
TEMAS 38
GENOMA HUMANO
) r a l u c e l o m N D A (
N I E T S R E G K R A M Y N O S I R R A H L U A P ; )
o d n o f (
E N O T S
, L E M R A H K R A M
Los comienzos de la industria del genoma humano Las empresas públicas y privadas que descifraron el primer borrador del código genético humano tuvieron que soportar una larga y penosa travesía Kathryn Brown
E
l Proyecto Genoma, después de catorce años de investigación y una inversión superior a los 3000 millones de euros, anunciaba el pasado octubre el desciframiento completo del ADN humano. El logro, alcanzado cuatro años después de trazarse el primer bosquejo de la secuencia, se ha recibido como una aportación fundamental al conocimiento de la especie humana, que permitirá avances revolucionarios. Este artículo nos retrotrae a 2000, año en que se presentó el primer borrador (provisional) del genoma, para mostrar cómo se articulaba entonces el entramado de empresas e instituciones protagonistas de esta intensa carrera, que acaba de llegar al fin de su comienzo. Ya se puede leer todo el código genético de un ser humano en Internet. No es lo que podría considerarse una lectura fácil: de principio a fin no aparecen más que las letras A, T, C y G, repetidas una y otra vez en orden variable y con una longitud suficiente como para llenar más de 200 guías telefónicas. Para los biólogos, sin embargo, constituye el gran éxito de la temporada. Las letras representan los productos químicos del ADN que integran todos los genes de los seres humanos e influyen en su forma de hablar, de andar, de pensar y de dormir. Francis S. Collins, director del Instituto Nacional de Investigación sobre el Genoma Humano en Bethesda, Maryland, piensa que es como si leyéramos nuestro propio libro de instrucciones. ¿Qué puede haber más interesante? Collins dirige el Proyecto del Genoma Humano (PGH), un consorcio público integrado por cuatro grandes centros de secuenciación de EE.UU., por el Centro Sanger, de Cambridge, 74
Inglaterra, y por laboratorios de Ja- respecto de las terapias génicas, que pón, Francia, Alemania y China. En consisten en la adición directa de 2000 ya había gastado 250 millones genes sanos al organismo del paciente. de dólares para formular por escrito J. Craig Venter, entonces presidente el mapa de todos nuestros genes. de Celera, pensaba que el conociTrabajando codo a codo durante más miento del genoma cambiaría la forma de un decenio, unos 1100 investiga- de realizar los ensayos farmacológidores fabricaron a mano un mapa de cos y daría comienzo a una era comlos tres mil millones de pares de bases, pletamente nueva de medicina indio unidades, del ADN que constitu- vidualizada. yen el genoma humano. Y no estaban Pero, aun disponiendo del borrador solos. Una temeraria compañía joven, del código humano, la industria genóCelera Genomics, de Rockville, Mary- mica de 2000 se enfrentaba a numeland, propinó un duro golpe al consor- rosos obstáculos. Algunos de ellos cio al anunciar aquel mismo año su eran técnicos: una cosa es conocer propio borrador del genoma humano. una estructura química y otra muy Durante mucho tiempo prevaleció distinta comprender su función real. el concepto erróneo de que, una vez Otros, legales: ¿cuánto hay que saber acabada la secuenciación del ADN, sobre un gen para patentarlo? Y tamse gozaría de una idea clara de quié- poco faltaban los sociales: ¿realmente nes somos, por qué enfermamos y por quiere uno que le diagnostiquen una qué envejecemos. La verdad es que enfermedad que carece de tratapara el esclarecimiento total faltan miento y que además no le afectará todavía unos cuantos decenios. hasta dentro de veinte años? Pero los investigadores ya imaginan cómo será ese día. Las compañías La carrera farmacéuticas, por ejemplo, están reu- La primavera de 2000 todos los ojos niendo los conocimientos prácticos estaban puestos en la primera línea sobre genética necesarios para fabri- acabada del genoma: un borrador del car medicinas a la medida de genes ADN que hay en el interior de cada específicos, lo que se conoce como far- una de nuestras células. El método macogenómica. Los farmacéuticos del utilizado por el PGH se describió como futuro podrán proporcionar a sus concienzudo y preciso. Empezando clientes una versión de antihiperten- con células sanguíneas y espermátisor adecuada a su exclusivo perfil ge- cas, se separaron los 23 pares de cronético, distinta para cada uno. Otras mosomas que albergan los genes empresas ya han conseguido, con humanos. Se cortaron luego fraggrandes dificultades, realizar análi- mentos del ADN de cada cromosoma, sis sanguíneos que revelan mutacio- se identificó la secuencia de bases del nes indicadoras de enfermedad en ADN de cada fragmento y, por último, ciertos genes y permiten pronosticar se localizó y se agrupó cada retazo de la posibilidad de verse afectado por ADN situado a sus dos lados en el crodeterminadas enfermedades, como la mosoma. De esta manera artesanal de Huntington. Y hay investigadores se fueron elaborando progresivamente que mantienen todavía el optimismo las secuencias de segmentos génicos TEMAS 38
H S U N R E H C Y A K
CELERA GENOMICS, cuya planta en Rockville, Maryland, contaba en el año 2000 con 300 secuenciadores automatizados de ADN (además de una elegante hélice de ADN azul en el techo).
individuales, de genes completos, de cromosomas completos y, por último, del genoma entero. Fue como arrancar una a una todas las páginas de una enciclopedia, romperlas y luego volverlas a recomponer. Celera tomó, en cambio, un camino más corto: hizo añicos toda la enciclopedia de una vez. Su método de secuenciación consistió en romper de un golpe todos los genes en fragmentos y confiar luego en los ordenadores para reincorporarlos a un genoma completo. El énfasis se puso en la potencia de cómputo, utilizando algoritmos para secuenciar los datos, con las ventajas de la eficacia y la velocidad. Los conceptos que los equipos del PGH y de Celera tenían sobre lo que sería un “genoma acabado” no coincidían. Cuando Celera anunció que había acabado de secuenciar el borrador del genoma de una persona anónima y que ordenaría los datos en un mapa en tan sólo seis semanas, el grupo público manifestó inmediatamente su indignación. Collins hizo notar que Celera se había quedado corta con respecto a sus propósitos originales de secuenciación del genoN UEVA GENÉTICA
ma. Los responsables de Celera planearon secuenciar los genomas completos de varias personas, verificando diez veces su genoma “consenso”, cuando la compañía comenzó a trabajar en 1988. Celera declaró en abril de 2000 que la secuenciación preliminar se había realizado por completo con el genoma de una sola persona, secuenciado nada más que tres veces. Si bien PGH y Celera se consideraban competidores en una carrera, la empresa privada gozaba de una ventaja incuestionable. Dado que el PGH es un proyecto público, enviaba de forma rutinaria todos sus datos sobre el genoma al GenBank, una base de datos pública a la que se puede acceder a través de Internet (en www.ncbi.nlm.nih.gov). Como todos los demás, Celera utilizó esos datos; en su caso, para ayudar a verificar y a rellenar las lagunas del borrador del genoma realizado por ella. Celera utilizó los datos públicos del genoma para ir un paso por delante en el esfuerzo de secuenciación, cosa que algunos consideraron intolerable. Pero hubo quienes consideraron razonable, desde el punto de vista de los
negocios, el plan revisado de Celera. No se trataba únicamente de sentarse y de estar secuenciando el resto de la vida. Celera utilizaría su triple análisis para ordenar los datos públicos, lo que se esperaba proporcionaría un cuadro muy preciso del genoma humano. El PGH anunció a principios de mayo de 2000 que había completado su propio borrador de trabajo, así como una secuencia acabada del cromosoma 21, implicado en el síndrome de Down y en muchas otras enfermedades. Los elaboradores del genoma se concentraron en las semejanzas existentes entre todos nosotros. Se cree que el 99,9 por ciento de los genes de todas las personas son exactamente iguales. Pero el 0,1 por ciento restante varía y son estas variaciones lo que más interesa a las compañías farmacéuticas. Incluso un simple polimorfismo de un nucleótido individual (SNP) puede significar un problema (por ejemplo, el hecho de que alguien tenga una T donde otra persona tiene una C). Estas minúsculas variaciones genéticas son la causa de que muchos remedios no produzcan efecto más que entre un 30 y un 50 por ciento de la población humana, en opinión de Venter. Puede llegarse al extremo de que lo que salva la vida de una persona acabe con la de otra. Pone como ejem75
Los dos enfoques de la secuenciación del genoma CELERA GENOMICS
PROYECTO GENOMA HUMANO
ENFOQUE DE FRAGMENTACION COMPLETA
ENFOQUE DE FRAGMENTACION IMBRICADA
SECUENCIA DE ADN HUMANO
SECUENCIA DE ADN HUMANO
1 Se rompe el genoma
en segmentos de tamaño cada vez menor y se les dispone en un orden aproximado
7
completo en fragmentos pequeños
6
1
5
3
2
3
4
5
6
7
8
9
10
1
2 4
9
10
1 Se corta el genoma
8
3
1
4
2 Se lee la secuencia de ADN
2 Se rompe cada segmento
8
en fragmentos pequeños
6 9
2
7
de cada fragmento
5
10
3 Se lee la secuencia
de ADN de cada fragmento R E D N A L C I R E N O C N O I C A R O B A L O C N E E C A R G E I R U A L
SECUENCIADORES DE ADN
3 Se reúnen ordenadamente
los fragmentos viendo dónde se solapan
5 3
1
4
1
8
6 2
2
3
4
5
7
8
9
10
7 9
plo el Rezulin, un medicamento para sachusetts. Aunque la medicina indila diabetes de tipo II, que se rela- vidualizada no había salido de la mesa cionó con más de 60 fallecimientos en del laboratorio, algunos analistas todo el mundo por toxicidad hepá- financieros creyeron que en pocos años tica. Cree que en el futuro bastará una podría convertirse en un mercado de simple prueba genética para deter- ingentes beneficios. minar si es probable que una mediCon todo, sabían que el camino estacina dada proporcione un tratamiento ría lleno de baches. Un punto de friceficaz o si conllevaría graves conse- ción era el uso de patentes. Nadie pescuencias. Mientras desarrollaba su tañea cuando Volvo patenta un nuevo borrador del genoma, Celera comparó coche o Microsoft un programa infortambién algunos genes de varios indi- mático. Pero hay mucha gente que no viduos, construyendo una base de acepta que las compañías biotécnicas datos de polimorfismos de nucleóti- pretendan tener derechos sobre el dos aislados (SNP, “snips”, para los ADN humano, la esencia de nuestro ingleses). ser. Pero sin dichas patentes una comOtras compañías esperaban tam- pañía como Myriad Genetics, de Salt bién sacar partido de la farmacoge- Lake City, no hubiera podido destinómica. Los gigantes farmacéuticos nar el tiempo ni el dinero necesarios empezaron a asociarse con empresas para elaborar pruebas de detección de especializadas más pequeñas para mutaciones en los genes BRCA1 y satisfacer sus sueños génicos: Pfizer BRCA2, relacionados con los cáncede Nueva York se con Incyte Genomics, res de mama y de ovario. de Palo Alto, California; SmithKline La mayoría de los investigadores Beecham, de Filadelfia, con Human está de acuerdo en este punto, aunGenome Sciences, de Rockville; y Eli que algunos sostienen que las empreLilly, de Indianápolis, con Millennium sas privadas han abusado de los Pharmaceuticals, de Cambridge, Mas- datos públicos del genoma, secuen76
6
10
4 Se reúnen los fragmentos
secuenciados según su orden relativo conocido
ciado en condiciones rigurosas y, en gran parte, con dinero público. Al enviar dócilmente sus hallazgos al GenBank, los científicos del PGH ofrecieron al mundo una panorámica sin parangón de lo que constituye un ser humano. Y el personal de Celera no fue el único que miró. GenBank contabilizó en abril de 2000 unos 35.000 visitantes diarios. Algunos trabajaban en compañías como Incyte, que aprovechaba los datos públicos para elaborar su propio y creciente catálogo de genes, patentando luego los posibles usos de esos genes. Ese mismo año, Incyte consiguió unas 500 patentes por lo menos de genes completos (más que cualquier otra compañía del sector) y solicitó otros 7000. Varios investigadores deploran que estas compañías patenten genes que apenas entienden y que, al hacerlo, estén restringiendo la investigación futura sobre ellos, ya que, si los datos están bajo llave en una base de datos privada y sólo unos pocos privilegiados pueden tener acceso a ellos por susTEMAS 38
LOS PRINCIPALES ACTORES EN 2000 Celera Genomics División de PE Corp. www.celera.com
Símbolo: CRA Sede central: Rockville, Maryland Máximo responsable: J. Craig Venter, presidente Principales clientes/socios: Pfizer, Pharmacia, Novartis, Amgen y Takeda Chemical Industries Estrategia: Venta de suscripciones teleinformáticas a diversos genomas comentados. Financiación de 2000: 900 millones de dólares Propósito fundamental: negocios en torno a bases de datos genómicos Ventajas competitivas: amplia infraestructura de secuenciación del ADN y abundantes recursos financieros
Human Genome Sciences www.hgsi.com
Símbolo: HGSI Sede central: Rockville, Maryland Máximo responsable: William A. Haseltine, director y CEO Principales clientes/socios: SmithKline Beecham, Takeda Chemical Industries, ScheringPlough, Sanofi-Synthelabo y Merck Estrategias: desarrollo y comercialización de fármacos basados en la genómica; suministro de dianas farmacológicas a sus clientes Financiación de 2000: 525 millones de dólares Propósito fundamental: comercializar medicamentos basados en el genoma Ventajas competitivas: patentes registradas de más de 7500 genes humanos; tres fármacos genómicos en ensayos clínicos humanos
Incyte Genomics www.incyte.com
Símbolo: INCY Sede central: Palo Alto, California Máximo responsable: Roy A. Whitfield, CEO Principales clientes/socios: 18 de las principales 20 compañías farmacéuticas Estrategia: proporcionar acceso comercial no exclusivo a las bases de datos genómicas y vender el acceso a los clones de ADN en ellas representados Financiación de 2000: 622 millones de dólares Propósito fundamental: convertir la información genómica en un negocio duradero Ventaja competitiva: un amplio conjunto de datos, que abarca secuencias génicas, modelos de expresión génica y proteica y variaciones genéticas entre individuos
S M L I F M I L S
Millennium Pharmaceuticals www.mlnm.com
Símbolo: MLNM Sede central: Cambridge, Massachusetts Máximo responsable: Mark. L. Jevin, CEO Principales clientes/socios: Bayer, Pharmacia, Pfizer y Eli Lilly Estrategias: desarrollo de pruebas terapéuticas y médicas personalizadas; asociación con empresas dedicadas a las técnicas biológicas y farmacológicas en el campo de la farmacogenómica Financiación de 2000: 700 millones de dólares Propósito fundamental: traducir la información genómica en productos patentados, como son losmedicamentos y las pruebas analíticas Ventajas competitivas: Alianzas ya establecidas con fabricantes de fármacos; recientemente adquirió LeukoSite
The Human Genome Project www.genome.gov
Sede central: Instituto Nacional de Investigación sobre el Genoma Humano (NHGRI), Bethesda, Maryland Colaboradores: NHGRI, Departamento de Energía (DOE) y Wellcome Trust Máximos responsables: Francis S. Collins, NHGRI; Ari Patrinos, DOE, y Michael Morgan, Wellcome Trust Principales centros de secuenciación: Facultad de medicina de la Universidad de Washington, St. Louis; Facultad de medicina Baylor, Houston; Centro Sanger, Cambridge, Inglaterra; Instituto Whitehead, Cambridge, Massachusetts; Instituto Joint Genome DOE, Walnut Creek, California Estrategia: cartografiar, secuenciar y comentar el genoma humano Financiación de 2000: 112,5 millones de dólares en 260 subvenciones Propósito fundamental: comprender la función génica; fomentar leyes que prohíban la discriminación genética; enseñar a los médicos a utilizar la información del genoma Ventajas competitivas: datos disponibles a las 24 horas de la secuenciación, sin coste y sin restricciones, vía GenBank. También provisión de fondos para estudios sobre las implicaciones éticas, legales y sociales de la genómica
cripción, se retardará el descubri- silico ”. Los datos de una secuencia miento sobre muchas enfermedades. génica completa o parcial se introduPero el entonces presidente de In- cen en un programa informático que cyte, Randal W. Scott, veía las cosas predice la secuencia de aminoácidos de modo diferente. Según él, el pro- de la proteína resultante. La compapósito real del Proyecto Genoma Hu- ración de esta proteína hipotética con mano era acelerar los descubrimien- las proteínas conocidas permite elatos científicos; los trabajos posteriores borar una conjetura aproximada sobre constituirían su culminación natu- la actividad de la secuencia génica ral. Incyte lanzó en marzo de 2000 subyacente y sobre cuál pueda ser su un programa de comercio electrónico utilidad para el desarrollo de un remegenómico (como un amazon.com para dio o de una prueba diagnóstica. Puede genes), que permitía a los investiga- que esto parezca una forma muy dores pedir datos sobre la secuencia, superficial de trabajar, pero suele baso copias físicas, de más de 100.000 tar para conseguir una patente. Poco genes a través del correo electrónico. a poco, la normativa que regula la Entre los subscriptores a la base de concesión de patentes génicas ha ido datos genómica de la compañía se levantando el listón con respecto a contaban gigantes farmacéuticos co- las exigencias de utilidad. mo Pfizer, Bayer y Eli Lilly. Ese mismo año, Human Genome Sciences ya Pruebas y más pruebas había conseguido más de 100 patentes En 2000, las patentes habían inducido génicas (y solicitado otras 7000) mien- la comercialización o el desarrollo de tras elaboraba su propia y colosal co- más de 740 pruebas genéticas, según lección de genes, que sería aprovecha- el norteamericano Instituto Nacional da por sus socios farmacéuticos, entre de la Salud. Estas pruebas, sin embarellos SmithKline Beecham y Sche- go, mostraron lo lejos que aún debía ring-Plough. llegar la genética. Varios años después El gobierno estadounidense com- de comenzar los ensayos sobre el plicó el debate de las patentes. El BRCA1 y el BRCA2, por ejemplo, todaentonces presidente Bill Clinton y el vía se seguía intentando determinar primer ministro británico Tony Blair con precisión en qué medida tales genes lanzaron en marzo de 2000 un men- contribuyen al riesgo de cáncer femesaje ambiguo, en el que se elogiaba nino. Incluso las mejores pruebas genéel acceso libre a los datos génicos no ticas planteaban múltiples cuestiones. elaborados, comentario que algunos En el caso de la enfermedad de Hunanalistas interpretaron como un golpe tington, se había desarrollado una que a Celera y a otras empresas que guar- informaba con precisión sobre cómo daban celosamente sus secuencias cambia el gen, pero no podía predecirse del genoma. Celera y el consorcio del la edad a la que empezarían los sínPGH mantuvieron disputas sobre la tomas, la gravedad de la enfermedad publicación de los datos, abando- ni su ritmo de progreso. nándose las conversaciones de cola Y no podemos olvidar las consideraboración iniciales cuando la primera ciones sociales. La mayoría de las nase negó a hacer públicas de inmediato ciones civilizadas cuentan con un cony del completo dominio general sus junto confuso de leyes que prohíben secuencias génicas. La noche en que que las compañías de seguros y los Clinton y Blair lanzaron su anuncio empresarios puedan actuar discrimila cotización de las acciones biotéc- nadamente contra las personas a parnicas descendió, perdiendo alrededor tir de la información genética disdel 20 por ciento. Unas cuantas em- ponible, pero los defensores de la presas se apresuraron a dar ruedas intimidad siguen presionando con visde prensa y a hacer declaraciones tas a mayores garantías jurídicas. manifestando que, de hecho, ellas proporcionaban gratis sus datos no elaborados sobre el genoma. Durante las semanas siguientes los funcioBIBLIOGRAFIA COMPLEMENTARIA narios estadounidenses aclararon que el gobierno estaba a favor de las patenARE SEQUENCERS RE AD Y T O ANNOTATE TH E H UMAN G ENOME ? E. Pennisi en tes sobre “nuevos productos sanitaScience, vol. 287, n.o 5461, página 2183; rios basados en los genes”. 24 de marzo, 2000. Lo más difícil para los buscadores THE HUMAN GENOME PROJECT AND ITS IMde patentes es demostrar la utilidad PACT ON THE STUDY OF HUMAN DISEASE. de las secuencias de ADN. Numerosas E. Green en Metabol ic and Molecula r solicitudes de patente dependen de Bases of Inherited Disease. Charles R. las técnicas de predicción computaScriver. Octava edición. McGraw-Hill, 2000. cional a las que se suele hacer referencia con la expresión “biología in 78
TEMAS 38
La fiebre bioinformática La elaboración de los datos del genoma se ha convertido en una industria floreciente Ken Howard
“P
lásticos”. Cuando un amigo de la familia susurraba esta palabra al personaje de Dustin Hoffman en la película El graduado en 1967 no sólo abogaba por el estudio de una nueva carrera, sino por una forma de vida completamente diferente. Si esa película se hiciera hoy, en la época del desciframiento del genoma humano, la palabra mágica bien pudiera ser “bioinformática”. Investigadores públicos y privados han compilado ya más de 37.000 millones de pares de A, C, T y G que componen el código genético humano. La información que se está derivando del genoma humano constituye una auténtica avalancha. Se están compilando bases de datos gigantescas que contienen los detalles de las circunstancias de tiempo y lugar en que se activan los genes, la conformación de las proteínas que especifican, la forma en que influyen unas proteínas sobre otras y el papel que tales influjos puedan desarrollar en las enfermedades. Si a esto se añade el torrente de datos sobre los genomas de los denominados organismos modelo, como la mosca de la fruta y los ratones, se tiene un “maremoto” de información. La nueva disciplina de
la bioinformática (la unión entre la informática y la biología) busca encontrar sentido a todo ello. Al hacerlo así, está cambiando el aspecto de la biomedicina. Se está obteniendo una cantidad de información fenomenal y abrumadora. En lo que se afanan de forma distinta unos y otros es en la forma de explotarla. Existen muchas empresas puestas a ello. Ya en 2000, el banco de inversión Oscar Gruss & Son, de la ciudad de Nueva York, calculó que la bioinformática podría convertirse en un negocio que reportara dos mil millones de dólares en cinco años. Esta estimación se basó en datos recogidos de más de cincuenta empresas públicas y privadas que ofrecen productos y servicios de bioinformática. Su esfuerzo se concentra en la recogida y el almacenamiento de datos y en la búsqueda y la interpretación de los datos de las bases. La mayoría vende sus servicios a las compañías farmacéuticas y de ingeniería biológica por precios de suscripción millonarios. La razón de que las compañías farmacéuticas estén tan dispuestas a ponerse a la cola y a pagar por tales servicios (o a montar los suyos propios, con importantes inversiones) es que la bioinformática ofrece la pers-
pectiva de encontrar mejores dianas farmacológicas en fases más tempranas del proceso de desarrollo de los medicamentos. Esta eficacia pudiera reducir el número de remedios potenciales que tuviesen que pasar por la criba de los ensayos clínicos, reduciendo de manera significativa los costes generales. Beneficios adicionales obtendrían las empresas farmacéuticas si se redujeran así los tiempos de investigación y de desarrollo de los fármacos, alargando su vida comercial antes de que expiren las patentes. Pero antes de que los beneficios económicos empiecen a caer del cielo, las compañías bioinformáticas tienen que habérselas con la actual plétora de datos genómicos y que mejorar constantemente sus técnicas, sus enfoques de investigación y sus prácticas comerciales. La auténtica ocasión y las dificultades de verdad se encuentran en el descubrimiento de cómo se relacionan entre sí los fragmentos de información y en la interpretación del conjunto resultante. La bioinformática inició su andadura a principios de los años ochenta del siglo XX con una base de datos denominada GenBank, creada por el Departamento estadounidense de Energía para guardar los cortos tra-
SLIM FILMS
mos de secuencia de ADN que se estaban empezando a obtener de una serie de organismos. En los comienzos del GenBank un puñado de técnicos sentados ante teclados que no tenían más que las cuatro letras A, C, T y G tecleaban monótonamente las secuencias del ADN publicadas en las revistas académicas. Conforme pasaron los años, nuevos métodos de comunicación permitieron a los investigadores acceder directamente al GenBank y descargar sus datos de secuencia. La administración del GenBank se transfirió luego al Centro Nacional para información sobre técnicas biológicas (NCBI) de los Institutos Nacionales de la Salud estadounidenses. Con la llegada de la gran telaraña mundial (World Wide Web), los investigadores de todo el mundo pudieron acceder gratis a los datos del GenBank. El volumen de datos de secuencias de ADN del GenBank empezó a crecer de manera exponencial cuando el Proyecto del Genoma Humano (PGH) despegó en 1990. La introducción de secuenciadores de gran rendimiento en los años noventa (utilizando máquinas robóticas automatizadas de secuenciación del ADN y ordenadores) disparó las aportaciones a GenBank. Los 49 millones de pares de bases secuenciadas en 1990 pasaron a unos 11.000 millones en 2000; a principios de este año la cifra superaba ya los 37.000 millones. Las empresas privadas iniciaron proyectos paralelos de secuenciación por la misma época, estableciendo por su cuenta enormes bases de datos patentadas. Las hay con capacidad para determinar la secuencia de millones de pares de bases en un solo día. Cuando, en abril de 2000, la central inagotable de secuenciación Celera Genomics anunció que había completado un borrador del genoma humano, tenía almacenados 50 teraoctetos de datos. Pero GenBank y sus primos no son más que una parte del cuadro bioinformático. Otras bases de datos públicas y privadas contienen información sobre la expresión génica (el cuándo y el dónde de la activación de los genes), sobre las minúsculas diferencias genéticas entre individuos denominadas polimorfismos de nucleótidos individuales (SNP), sobre las
SLIM FILMS
estructuras de las diversas proteínas y los mapas de sus interrelaciones.
tos de personas con tumores óseos. (Los osteoclastos son células que descomponen el hueso en el curso normal Mezcla y emparejamiento de la renovación ósea; se cree que su Una de las operaciones bioinformá- actividad es excesiva en los indiviticas más elementales consiste en la duos afectados de osteoporosis.) búsqueda de semejanzas, u homoloHuman Genome Sciences secuengías, entre un fragmento de ADN ció la muestra y realizó búsquedas de recién secuenciado y los segmentos homología en las bases de datos para ya disponibles de diversos organis- encontrar emparejamientos que diemos. El hallazgo de emparejamien- ran pistas sobre las proteínas detertos aproximados permite predecir el minadas por las secuencias génicas tipo de proteína que especificará tal obtenidas. Luego se procedió a anásecuencia. Esto no sólo proporciona lisis ulteriores y se descubrió que los pistas sobre dianas farmacológicas osteoclastos expresaban con exceso prometedoras en las etapas iniciales una secuencia concreta, que coincidel desarrollo de los medicamentos, día con la de una clase de moléculas sino que también suprime algunas ya conocidas: las catepsinas. que constituirían callejones sin salida. Este ejercicio de bioinformática le Una serie popular de programas proporcionó a SmithKline en unas para comparar las secuencias del cuantas semanas un candidato far ADN es el BLAST (de Basic Local macológico prometedor, que los expe Alignment Search Tool), que ap are- rimentos estándar de laboratorio no ció por primera vez en 1990. BLAST hubiesen encontrado sin años de traforma parte de un conjunto de ins- bajo y una pizca de suerte. La bústrumentos de investigación de se- queda de productos que se unan a las cuencia de ADN y de proteínas que dianas farmacológicas y que tengan está disponible en varias versiones, el efecto deseado sobre ellas sigue ofrecidas por muchos proveedores de realizándose fundamentalmente en bases de datos o directamente a tra- un laboratorio “húmedo” tradicional, vés del NCBI. Este último ofrece tam- donde las pruebas para la determibién Entrez, un instrumento de los nación de la actividad, la toxicidad y llamados de metabúsqueda, que cu- la absorción pueden durar años. Pero bre la mayoría de las bases de datos hay quienes opinan que también este del NCBI, entre ellas las que alber- aspecto del desarrollo farmacológico gan las estructuras tridimensionales pasará a los ordenadores, en lo que de las proteínas, los genomas com- denominan la biología in silico , grapletos de otros organismos y las re- cias a las nuevas herramientas bioinferencias a revistas científicas que formáticas y a las crecientes cantisalvaguardan las entradas de la base dades de datos sobre las estructuras de datos. proteicas y las vías biomoleculares. Un primer ejemplo de la utilidad Todo lo anterior permite predecir de la bioinformática es la catepsi- un futuro venturoso para la bioinforna K, una enzima que podría resul- mática, que, en opinión de muchos, altar importante para el tratamiento berga las verdaderas promesas de la de la osteoporosis, enfermedad in- genómica y constituye el inicio de un capacitante causada por la rotura de período revolucionario. los huesos. Los investigadores de En la revolución participan muchos Smith-Kline Beecham (ahora Glaxo- actores diferentes, cada uno con su SmithKline) pidieron a Human Ge- método. Hay empresas que atienden nome Sciences en 1993 que les ayu- a los grandes clientes; sus productos daran a analizar ciertos materiales y servicios genómicos y de ingeniería genéticos obtenidos de los osteoclas- biológica se dirigen a las compañías
LOS DATOS GENETICOS constituyen la esencia de la bioinformática, cuyo cometido puede compararse con la conocida búsqueda de una aguja en un pajar. A modo de ejemplo, en la derecha, la aguja es la palabra “DOG”, enterrada en una secuencia de millares de le tras A, C, T y G, las cuatro unidades que constituyen el ADN. Pero la
80
bioinformática también interviene en la comparación de los genes de diversos organismos: las otras ilustraciones de esta página y de la siguiente son mapas de los cromosomas de la mosca de la fruta, junto con códigos de barras que muestran las regiones en las que los genes de la mosca son similares a los de otras especies.
TEMAS 38
ATCCTGACACAGTATAGCGCTAGCTAGCC GCGCGATCTTAGCTAGCGGGCATCATGCT ATTCGGATTCTAGAGGCGGAGGCGCGATA TCTCTCTTATCTTCTTAGCTAGCSGCSAGC TAGCCGCATGCAGCTAGCGCGACGTTAAC GTAGCAAGATCCTCACAGTATAGCGCTAG CTAGCAAGATCCTCACAGTATAGCGCTAG CTAGCCGCGCATGCTATTCGGATTCTAGA GGCGGAGGCGCGATATCTCTCTTATCTTC TTTGTTCTTSTCCGGAGGCGCGATATCTCG GAGGCGCGATATCTCTCTTATCTTCTGCG GAGGCGCGATATCTCTCTTATCTTCTCGAT GCGCGTATATGCGACGTTAACGTAGCAAG ATCCTGACACAGTAAGGCGCTTAGCTAGC GGGCATCATGCTATTCGGATTCGATTCTA GAGGCGGAGGCGACGATGCGCGTATATGC GACGTTAACGTAGCAAGATCCTGAATTCT AGAGGCGGAGGCGCGATATCTCTCTTATC TTCTCGGAGGCGCGATATAGGCGCTTAGC TAGCGGGCATCATGCTATTCGGATTCTAG AGGCGGAGGCGACGATGCGCGTATATGCG ACGTTAACGTAGCAAGATCCTGAGGAGGC GCGATATCTCTCTTATCTTCTGCGCGTATA TGCGACGTTAACGTAGCACGGAGGCGCGA TATCTCTCTTATCTTCTTAGCTAGCCGCGC GATCTTAGCTAGCGGGCATTATCTTCCGG AGGCGCGATACGGAGGCGCGATATCTCTC TTATCTTCTTTCGGAGGCGCGATATCTCTC TTATCTTCCGGAGGCGCGATATCTCTCTTA TCTTCTGACGTTAACGTACGGAGGCGCGA TATCTCTCTTATCTTCTTAGCTAGCCGCGC GATCTTAGCTAGCGGGCATCATGCTCGGA GGCGCGATATCTCTCTTATCTTCTGATCGG CGCGGAGGCGCGATATCTCTCTTATCTTCT AGGCGCGATATCTCTCTTATCTTCTCGGA GGCGCGATATCTCTCTTATCTTCTCGCGAT ATCTCTCTTATCTTCCGGAGGCGCGATAC GGAGGCGCGATATCTCTCTGCGCGTATAT GCGACGTTAACGTAGCAAGATCCTGACAC AGTATAGCGCTAGCAAGATCCTCACAGTA TAGCGCTAGCTAGCCGCGCATCATGCTAT TCGGATTCTAGAGGCGGCGCGATATCTCT CTTATCTTCTTTGTTCTTSGATAAGATCCT CACAGTGGAGGCGCGATATCTCTCTTATC TTCCGGAGGCGCGATACGGAGGCGCGATA TCTCTCTTATCTTCCGGAGGCGCGATACG GAGGCGCGATATCTCTCTGCGCGTATATG CGACGTTAACGTAGCAAGATCCTGACACA GTATAGCGCTAGCAAGATCCTCACAGTAT AGCGCTAGCTAGCCGCGCATCATGCTATT CGGATTCTAGAGGCGGCGCGGAGGCGCGA TACGGAGGCGCGCGATATCTCTCTTATCT TCCGGAGGCGCGATACGGAGGCGCGATAT CTCTCTGCGCGTATATGCGACGTTAACGT AGCAAGATCCTGACACAGTATAGCGCTAG CAAGATCCTCACAGTATAGCGCTAGCTAG CCGCGCATCATGCTATTCGGATTCTAGAG GCGGCGCGATATCTCTCTTATCTTCTTTGT TCTTSGATAAGATCCTCACAGTGATATCTC TCTTATCTTCCGGAGGCGCGATACGGAGG CGCGATATCTCTCTGCGCGTATATGCGAC GTTAACGTAGCAAGATCCTGACACAGTAT AGCGCTAGCAAGATCCTCACAGTATAGCG CTAGCTAGCCGCGCATCATGCTATTCGGA TTCTAGAGGCGGCGCGATATCTCTCTTAT CTTCTTTGTTCTTSGATAAGATCCTCACAG TATAGCGCTAGCGCCGCGTCTCTATGCGA CGTTAACGTAGCATGCGCGTATATGCATG CGCGTATATGCGACGATTCTAGAGGCGGA GGCGCGATATCTCTCTATTCGGATTCTAG AGGCGGAGGCGCGATATCTCTCTTATCTT CCGGAGGCGCGATATCTCTCTTATCTTCC GGAGGCGCGATATCTCTCTTATCTTCTCG GAGGCGCGATATCTCTCTTATCTTCCGGA
GCAGGCGCTTAGCTAGCGGGCATCATGCT ATTCGGATTCTAGAGGCGGAGGCGACGAT GCGCGTATATGCGACGTTATCGGATTCTA GAGGCGGAGGCGCGATATCTCTCTTATCT TCCGGAGGCGCGATATCTCTCTTATCTTCC GGAGGCGCGATATCTCTCTTATCTTCTCG GAGGCGCGATATCTCTCTTATCTTCCGGA GGCGCGATATCTCTCTTATCTTCCGGAGG CGAGGCGCTTAGCTAGAGGCGCTTAGCTA GCGGGCATCATGCTATTCGGATTCTAGAG GCAGGCGCTTAGCTAGCGGGCATCATGCT ATTCGGATTCTAGAGGCGGAGGCGACGAT GCGCGTATATGCGACGTTATAGAGGCGGA GGCGACGATGCGCGTATATGCGACGTTAA CGTAGCAAGATCCTGAATTCTAGAGGCGG AGGCGCGATATCTCTCTTATCTTCTCGGA GGCGCGATATAGGCGCTTAGCTAGCGGGC ATCATGCTATTCGGATTCTAGAGGCGGAG GCGACGATGCGCGTATATGCGACGTTAAC GTAGCAAGATCCTGAGGAGGCGCGATATC TCTCTTATCTTCTGCGCGTATATGCGACGT TAACGTAGCACGGAGGCGCGATATCTCTC TTATCTTCTTAGCTAGCCGCGCGATCTTAG CTAGCGGGCATTATCTTCCGGAGGCGCGA TACGGAGGCGCGATATCTCTCTTATCTTCT TTCGGAGGCGCGATATCTCTCTTATCTTCC GGAGGCGCGATATCTCTCTTATCTTCTGA CGTTAACGTACGGAGGCGCGATATCTCTC TTATCTTCTTAGCTAGCCGCGCGATCTTAG CTAGCGGGCATCATGCTCGGAGGCGCGAT ATCTCTCTTATCTTCTGATCGGCGCGGAG GCGCGATATCTCTCTTATCTTCTAGGCGCG ATATCTCTCTTATCTTCTCGGAGGCGCGAT ATCTCTCTTATCTTCTCGGAGGCGCGATAT CTCTCTTATCTTCCGGAGGCGCGATACGG AGGCGCGATATCTCTCTTATCTTCCGGAG GCGCGATACGGAGGCGCGATATCTCTCTG CGCGTATATGCGACGTTAACGTAGCAAGA TCCTGACACAGTATAGCGCTAGCAAGATC CTCACAGTATAGCGCTAGCTAGCCGCGCA TCATGCTATTCTTCCGGAGGCGCGATATC TCTCTTATCTTCCGGAGGCGAGGCGCTTA GCTAGAGGCGCTTAGCTAGCGGGCATCAT GCTATTCGGATTCTAGAGGCAGGCGCTTA GCTAGCGGGCATCATGCTATTCGGATTCT AGAGGCGGAGGCGACGATGCGCGTATATG CGACGTTAACGTAGCAAGATCCTGATTCG GATTCTAGAGGCGGAGGCGACGATGCGCG TATATGCGACGTTAACGTAGCAAGATCCT GAGATTCTAGAGGCGGAGGCGCTATCTTC CGGAGGCGCGATACGGAGGCGCGATATCT CTCTTAGCTAGCCGCGCGATCTTAGCTAG CGGGCATCATGCTATTCGAGGCGCTTAGC T A G C G G G C A TD OG CTATTCGGATTCTAGA GGCGGAGGCGACGATGCGCGTATATGCGA CGTTAACGTAGCAAGATCCTGAGCCGCGC GATCTTAGCTAGCGGGCATCATGCTATTC GGATTCTAGAGGCGGAGGCGACGTTAACG TAGCAAGATCCTGACACAGTATAGCGCTA GCTAAGGCGCTTAGCTAGCGGGCATCATG TCGGATTCTAGAGGCGGAGGCGACGTTAA CGTAGCAAGATCCTGACACAGTATAGCGC TAGCTAAGGCGCTTAGCTAGCGGGCATCA TGTCGGATTCTAGAGGCGGAGGCGACGTG
S M L I F M I L S
farmacéuticas, para las que elaboran programas a medida y a las que ofrecen servicios de asesoría. Lion Biosciences, con sede en Heidelberg, Alemania, ha tenido un éxito destacado vendiendo programas y servicios bioinformáticos a todo lo largo y ancho del mundo empresarial. Su contrato millonario de 1999 con Bayer para el montaje y la operación de una red informática dedicada específicamente a la biología en todas las divisiones de Bayer representó el de mayor importancia en el mundo hasta entonces. Otras empresas atienden a los clientes pequeños o a los universitarios. Empresas como eBioinformatics ofrecen sus productos a través de Internet. Estos portales directos permiten el acceso a varios tipos de bases de datos y la utilización de programas para manipularlos. Informax, Accelrys y otras empresas parecidas ofrecen programas empaquetados para quienes prefieran tenerlos a seguro en sus propios ordenadores. Relaciones
Las grandes compañías farmacéuticas han intentado también rentabilizar sus esfuerzos genómicos con inversiones directas en bioinformática. Son varias las que han establecido departamentos enteros de integración y de servicio para facilitar el acceso a las bases de datos de múltiples departamentos, entre ellos los de desarrollo de nuevos productos, los de formulación y los de toxicología y ensayos clínicos. El antiguo modelo para la creación de nuevos medicamentos separaba esas funciones, lo que dificultaba la utilización con junta de los datos obtenidos. La bioinformática permite que todos los investigadores de una empresa vean los mismos datos, aunque cada uno los manipule individualmente. Además de contribuir a la eficacia, el disponer de recursos bioinformáticos propios puede resultar más económico. Sustituir los paquetes individuales utilizados por los diversos departamentos de una empresa por una plataforma informática única de acceso y manipulación de las bases de datos puede suponer un notable ahorro. Para integrar la bioinformática en sus compañías, los gigantes farmacéuticos forjan también alianzas estratégicas, firman acuerdos de licencias y adquieren empresas más pequeñas.
Utilización de la bioinformática para encontrar dianas farmacológicas
S
e buscan genes de los organismos modelo que sean similares a un gen humano determinado. Se obtiene así información sobre la proteína especificada por el gen humano y pueden buscarse productos que la bloqueen. En este ejemplo se utiliza el gen MLH1, que se asocia con el cáncer de colón humano. CROMOSOMA HUMANO 3
Q (brazo largo)
p (brazo corto)
GEN MLH1 (en la banda 21.3) 1 AISLAMIENTO DE UNA SECUENCIA DE ADN HUMANO
...
L I C O K S Y V R E F I N N E J Y R E L E E H W D I V A D , G N I M E L F T A P , N I E T S R E G K R A M N O C N O I C A R O B A L O C N E E C A R G E I R U A L
G A G A A C T G T T T A G A T G C A A A A T C C A C A A G T ... 2 TRADUCCION DE LA SECUENCIA DE ADN EN SECUENCIAS DE AMINOACIDOS (los bloques de construcción de las proteínas) MEDIANTE PROGRAMAS DE ORDENADOR
...
3 BUSQUEDA DE SECUENCIAS SIMILARES EN LAS BASES DE DATOS DE PROTEINAS DE ORGANISMOS MODELO (las áreas verdes reflejan diferencias grandes; las naran jas, variaciones menores)
...
SECUENCIA DE AMINOACIDOS HUMANA 5 DESCUBRIMIENTO DE UNA SUSTANCIA QUE SE UNA A LA PROTEINA
MOSCA DE LA FRUTA (Drosophila melanogaster )
... E
N
S
L
D
A
Q
S
T
H
4 PROTEINA HUMANA MODELO BASADA EN LA ESTRUCTURA CONOCIDA DE UNA PROTEINA PARECIDA DE UN ORGANISMO MODELO (el área roja es la representada por los datos de la secuencia mostrados) ...
NEMATODO (Caenorhabditis elegans )
... E
N
S
L
D
A
G
A
T
E
...
LEVADURA DEL PAN (Saccharomyces cerevisiae )
... E
N
S
I
D
A
N
A
T
M
...
BACTERIA (Escherichia coli )
... E
N
S
L
D
A
G
A
T
R
...
SER HUMANO
... E
N
La utilización de socios y de distribuidores no sólo les permite cubrir los vacíos de sus propias capacidades bioinformáticas, sino que les proporciona flexibilidad para adaptarse a las novedades que se vayan produciendo, en vez de tener que revisar constantemente sus propios sistemas. Empresas como Human Genome Sciences, Celera e Incyte están a horca jadas entre las grandes compañías farmacéuticas y los servicios de integración y extracción de datos ofrecidos por las especializadas. Han aprovechado sin vacilar y con rapidez el grado de automatización que la bioinformática ha aportado a la biología. Toda esta variedad conlleva la posibilidad de malas comunicaciones. Cada vez resulta más importante conseguir la compatibilidad entre bases de datos diferentes (lo que se deno82
E N C L D A K S T S
C
L
D
A
K
S
T
S
...
mina interoperabilidad), pudiendo los usuarios pasar rápidamente de una a otra para satisfacer sus necesidades. Una solución obvia sería la anotación: poner etiquetas a los datos con nombres que tengan referencias cruzadas entre las bases de datos una vez que se haya bautizado a los sistemas. Esto ha funcionado hasta cierto punto. Se ha conseguido relacionar bases de datos mediante anotación. Pero una anotación de una base puede cambiar sin que las referencias de las restantes se actualicen, sobre todo cuando el flujo de nuevos datos es constante, problema que se agudiza con el aumento de los conocimientos biológicos y la capacidad de realización de análisis por ordenador. Las mejoras sistemáticas ayudarán, pero el progreso y, en última ins-
POSIBLE MEDICAMENTO
tancia, el beneficio siguen dependiendo del ingenio de los usuarios finales.
BIBLIOGRAFIA COMPLEMENTARIA TRENDS IN COMMERCIAL BIOINFORMATICS. Informe publicado el 13 de marzo de 2000, de Jason Reed, de Oscar Gruss & Son. USING BIOINFORMATICS IN GENEAND DRUG DISCOVERY. D. B. Searls en Drug Discovery Today, vol. 5, n.o 5, páginas 135-143; abril, 2000. BioInform, una hoja informativa bisemanal sobre el tema de la bioinformática. Puede accederse a ella en www.bioinform.com. Se puede acceder a las bases de datos bioinformáticas mantenidas por el Centro Nacional de Información Biotécnica (NCBI), en www.ncbi.nlm.nih.gov.
TEMAS 38
El cromosoma de la masculinidad Los cromosomas X e Y de los humanos forman una extraña pareja. El X se parece a cualquier otro cromosoma, pero el Y resulta bastante peculiar. ¿Qué evolución han seguido? Karin Jegalian y Bruce T. Lahn
L
os cromosomas que determinan el sexo —X e Y— constituyen una pareja extravagante. Los 22 cromosomas restantes de nuestras células tienen tan idénticas sus parejas correspondientes, que parecen estructuras gemelares. De cada par, un cromosoma procede de la madre y otro del padre; en condiciones normales los dos tienen, sin embargo, el mismo tamaño y llevan los mismos genes. (Los genes son los planos de ADN sobre las proteínas, encargadas de realizar la mayor parte del trabajo del organismo.) Por eso resulta llamativo el contraste entre el Y y el X. El cromosoma Y es mucho menor que el X; en realidad es muy canijo. Aloja unas docenas de genes, frente a los 2000 o 3000 que encontramos en el X. Algunos de los gene s del cromosoma Y carecen del acostumbrado correspondiente en e l X. Por si fuera poco, está cargado de ADN “morralla”, secuencias de nucleótidos que no encierran instrucciones para la síntesis de moléculas útiles. Hasta hace poco, los biólogos se veían incapaces de explicar los mecanismos que le habían conducido a semejante estado de penuria. Algunas teorías había, pero no sabían cómo someterlas a contrastación. La situación ha dado un giro copernicano, gracias en buena medida al Proyecto Genoma Humano y otros esfuerzos parecidos encaminados a descifrar la secuencia completa de los nucleótidos de ADN en los 24 cromosomas del ser humano: X, Y y los 22 autosomas (los cromosomas no involucrados en la determinación del sexo). A la manera en que los paleontólogos trazan la evolución seguida por una especie apoyados en el estudio de los esqueletos de los animales actuales y de los fósiles, los biólogos moleculares recorren la evolución de cromosomas y 84
genes mediante las huellas dejadas un macho o una hembra. A comienen las secuencias de ADN. zos del siglo XX , sin embargo, se dieLos hallazgos recientes demues- ron cuenta de que en ciertas especies tran una historia de los cromosomas los cromosomas mediaban en la detersexuales sorprendentemente diná- minación del sexo. Unos veinte años mica, marcada por una serie de per- después se vio que los mamíferos esturbaciones drásticas en el Y y cam- taban entre los que se servían de crobios compensatorios en el X. Esa mosomas —el X y el Y— para derelación se sigue dando también hoy. terminar el sexo en el desarrollo Además, el cromosoma Y —durante embrionario. largo tiempo considerado un desbarajuste, capaz de hacer poco más que Rosario de pruebas poner en marcha el programa de la En los decenios siguientes, se halló masculinidad— resulta que esconde que el cromosoma Y constituía el posibilidades insospechadas para la marcador del sexo masculino. La mayoría de los biólogos. A lo largo de investigación dedujo, además, que el más de 300 millones de años se las X y el Y habían evolucionado a parha arreglado para conservar un pu- tir de autosomas emparejados de un ñado de genes importantes en la su- antepasado común. Por azar, poco pervivencia del macho y para adqui- antes o inmediatamente después de rir otros necesarios en el proceso de que surgieran los mamíferos, se profecundación. Pese a su aspecto mo- dujo una mutación en una pequeña desto, tiene en sus manos un sorpren- zona de la copia del autosoma que oridente poder. ginó el Y, determinando que los La investigación sobre la evolución embriones heredasen ese cromosode los cromosomas sexuales humanos ma cambiado (junto con su compapartió de la curiosidad científica. Pero ñero, el futuro cromosoma X) y nano sólo de ésta. Con una aspiración cieran machos. Los embriones que más pragmática se buscaba explicar heredasen los dos cromosomas X y revertir la esterilidad del varón. El serían hembras. descubrimiento de genes del cromoEn 1990 los genéticos identificasoma Y que influyen sobre la capaci- ron la zona del cromosoma Y que dad reproductora podría llevar a tra- confiere masculinidad. Se trata del tamientos innovadores en el hombre gen SRY (de “sex-determining region privado de tales genes o portador de Y” ). La prot eína cifrad a po r SR Y versiones defectuosas de los mismos. insta la formación de los testículos, Los avances recientes hunden sus según parece por la activación de raíces en ideas asentadas 100 años genes de diversos cromosomas. Lueatrás. Antes del siglo XX , los biólogos, go, la testosterona y otras sustanobservando lo que acontecía en los cias sintetizadas en los testículos reptiles, pensaban que el ambiente toman las riendas de la configuradeterminaba el sexo también en el ser ción de la masculinidad. humano y en otros mamíferos. Por lo Para llegar a la conclusión de que que concierne a los reptiles, la tem- los cromosomas sexuales humanos peratura del embrión en un momento comenzaron su vida de pareja acoprecoz del desarrollo insta la inter- plada, la ciencia se fundaba en los vención de un sistema, poco conocido extremos de X e Y, que son un tanto todavía, que primará la formación de gemelares y aptos para participar en TEMAS 38
1. LOS CROMOSOMAS X e Y fueron, hace millones de años, parejas equivalentes. Pero el cromosoma Y se encogió, en tanto que X mantuvo su integridad. La investigación genética ha empezado a aclarar los pasos que condujeron a la notable disparidad de hoy. Las micrografías muestran los cromosomas tal como aparecen en la me tafase de la división celular.
S E T A I C O S S A O T O H P O I B
Conocimiento gradual
CROMOSOMA Y
un proceso de recombinación. Durante la meiosis (la división celular que da lugar a espermatozoides y óvulos), los cromosomas emparejados se alinean juntos e intercambian segmentos; después, una copia de cada autosoma más un cromosoma sexual se distribuyen por igual en cada gameto. Aunque ahora la mayor parte del Y se parece poco al X, los extremos de ambos cromosomas se alinean durante la meiosis en los machos e intercambian fragmentos como si X e Y siguieran siendo una pareja. (Esa alineación resulta crucial para la distribución adecuada de los cromosomas en el espermatozoide.) Que el cromosoma X y el Y fueron un tiempo iguales se corrobora con una prueba más, que atañe a la parte de Y que no se recombina con X. Muchos de los genes distribuidos en la región no recombinante siguen teniendo su equivalente en el cromosoma X. La existencia de la región no recombinante, que constituye el 95 por ciento de Y, nos ofrecía una pista de cómo ese cromosoma se convirtió en sombra de su entidad originaria. En la naturaleza y en el laboratorio, la recombinación ayuda a mantener la integridad de los cromosomas. Por el contrario, su ausencia provoca que los genes de las regiones no recombinantes acumulen mutaciones destructivas que terminan por degradarlos, si no borrarlos. Parecía razonable pensar, pues, que hubo algo que detuvo el intercambio de partes de X e Y, con el desplome consiguiente de los genes de la región no recombinante del cromosoma Y. Pero transcurrieron decenios sin saberse cuándo y cómo cesó la recombinación después de que surgiera dicho cromosoma. N UEVA GENÉTICA
El trabajo realizado a lo largo de los últimos ocho años ha venido cubriendo muchos vacíos. En 1999 uno de los autores (Lahn) y David C. Page, del Instituto Whitehead de Investigaciones Biomédicas de Cambridge, demostraron que el cromosoma Y perdió su capacidad de intercambio con el X de una manera gradual e inesperada: primero implicó un trozo de ADN circundante al gen SRY y, luego, se expandió, en bloques separados, por el cromosoma. Pero sólo Y se deterioró en respuesta a la pérdida de la recombinación X-Y; el cromosoma X prosiguió con su recombinación entre sus dos copias en la meiosis de las hembras. ¿A qué se debió el fracaso de la recombinación entre X e Y? Cuando el cromosoma X y el cromosoma Y primitivos se aprestaban a intercambiar segmentos durante la meiosis en un antepasado lejano de los mamíferos modernos, parte del ADN del cromosoma Y sufrió, a buen seguro, una inversión o un giro total con respecto a su parte equivalente en el cromosoma X. Puesto que la recombinación requiere que las dos secuencias de ADN similares se alineen juntas, la inversión suprimiría en adelante cualquier interacción entre las zonas de emparejamientos primitivas de X e Y. Descubrimos que la recombinación cesó en distintos episodios cuando examinamos las secuencias nucleotídicas de 19 genes que aparecen en la región no recombinante de X y de Y. (Algunas de las copias de Y han dejado de funcionar.) En general, si las copias emparejadas de un gen perdieron su posibilidad de recombinación, la disparidad de las secuencias crecerá con las generaciones. Ante una cifra limitada de diferencias entenderemos que la recombinación cesó recientemente; si el número es elevado, se detuvo hace mucho tiempo. En su mayoría, los pares X-Y caían en cuatro grupos. Dentro de cada grupo, las copias de X e Y diferían en la misma cuantía, prueba de que la recombinación cesó casi al mismo tiempo. Los grupos se distinguían
CROMOSOMA X
entre sí con claridad. Las copias de Y que emp eza ron a diverg ir de su correspondiente en el cromosoma X casi al tiempo en que surgió el gen SRY eran las que más diferían de sus parejas; los otros grupos mostraban una divergencia progresivamente menor entre las copias de X e Y. Mediante la comparación interespecífica de las secuencias de ADN, los biólogos calculan con bastante aproximación el momento en que los genes emparejados (y, por tanto, las regiones que los alojaban) comenzaron a seguir caminos separados. Aplicado el método a nuestro ámbito se reveló que los precursores autosómicos de X e Y seguían emparejados y persistían intactos en los reptiles que vivieron antes de que la línea de los mamíferos iniciara su proceso de frondosa ramificación. Pero los monotremas (así el ornitorrinco y el equidna), que se numeran entre los primeros en ramificarse de otros mamíferos, poseen el gen SRY y una región adyacente no recombinante. De tales diferencias se infería que el 85
D N A L O N I D I E H Y N A I J A M A K . T D E R F L A
Genes del cromosoma Y (o familias de genes) no presentes en X y activos sólo en los testículos
SRY * (determina el sexo masculino)
Consecuencias asociadas con deleciones de segmentos de Y
Genes del cromosoma Y que tienen el correspondiente emparejamiento en X
RPS4Y † ZFY † PCDHY
TTY1 TSPY
PRY TTY1 TTY2 TSPY
AMELY
Centrómero Capacidad reducida para Estatura producir pequeña espermatozoides
USP9Y † DBY † UTY † TB4Y † VCY ‡
CDY XKRY
Capacidad reducida para producir PRY espermatozoides TTY2
SMCY † EIF1AY † RBMY ‡
RBMY ‡
Capacidad DAZ reducida BPY2 para producir PRY espermatozoides CDY Area carente de genes funcionales
gen SRY surgió, y se detuvo la recombinación de una región cercana, en un momento cercano a la aparición de los mamíferos, hace unos 300 millones de años. Nuestro conocimiento acerca de la cronología de los hechos aumentó cuando aplicamos el método del “reloj molecular”. En biología se calcula la llamada tasa de variación de fondo, es decir, la velocidad o tasa de variación de las secuencias de ADN cuando no se encuentran sometidas a una presión especial que les obligue a permanecer inalteradas. Multiplicando la amplitud de la disparidad de la secuencia en los pares X-Y por la tasa calculada, dedujimos que la primera inversión suspensora de la recombinación aconteció hace de 240 a 320 millones de años. Análisis parecidos señalan que la siguiente inversión ocurrió hace entre 130 y 170 millones de años, poco antes de que surgieran los marsupiales, ramificados de la línea que dio lugar a los mamíferos placentarios. El tercer episodio de inversión se registró hace entre 80 y 130 millones de años, antes de la diversificación de los mamíferos placentarios. Por último, la inversión final se produjo hace entre 30 y 50 millones de años, después de que los simios iniciaran su propia senda evolutiva, aunque antes de que lo hicieran primates y homínidos. Apeándose de la tendencia general
¿Hace 350 millones de años?
TIEMPO ANTEPASADOS REPTILIFORMES DE MAMIFEROS
CENTROMERO
Surge el gen SRY CROMOSOMAS IDENTICOS CAPACES DE RECOMBINACION (DE INTERCAMBIAR FRAGMENTOS)
SRY
PAR DE AUTOSOMAS EN UN ANTEPASADO REPTILIFORME
Y NACIENTE
de los pares X-Y, algunos genes de la región no recombinante del cromosoma Y determinan proteínas que difieren sorprendentemente poco de las proteínas cifradas por sus equivalentes en X, incluso en zonas que sufrieron la inversión en momentos muy tempranos. La explicación de la conservación de los mismos se apoya, probablemente, en una ley evolutiva
2. LOS CROMOSOMAS de una célula de varón (fotografía ) comprenden 22 pares de autosomas (no implicados en la determinación del sexo), más un cromosoma X y otro Y. De cada par, un miembro procede de la madre y el otro del padre. Los genes de la NRY, región no recombinante del cromosoma Y (azul en el diagrama ), han permitido trazar la historia evolutiva de X e Y. Como nos dice su nombre, se trata de una región que no puede recombinarse, o intercambiar ADN, con el cromosoma X. Sólo se indican los genes operativos. Aproximadamente la mitad tienen su pareja correspondiente en X (rojo ); algunos de estos genes cumplen funciones de “administración y cuidado”, y son necesarios para la supervivencia de la mayoría de las células. Ciertos genes de la NRY son activos sólo en los testículos ( púr- pura ), donde probablemente participan en la fecundidad del varón.
CROMOSOMA Y
Regiones "pseudoautosómicas", capaces de intercambiar ADN con el cromosoma X
*
1
2
7
8
13 19
4
5
6
9
10
11
12
14
15
16
17
18
20
21
SRY determina la formación de los testículos. Procede del gen SOX3 y se parece al SOX3
del cromosoma X, aunque los dos desempeñan funciones distintas
† Genes de administración y cuidado ‡ Genes que tienen su pareja en X y activos sólo en los testículos
86
3
22
X
Y TEMAS 38
H S A N A L L I D A P D E S E H
Hace entre 240 y 320 millones de años
Hace entre 130 y 170 millones de años
Hace entre 80 y 130 millones de años
Hace entre 30 y 50 millones de años
Pre s ente En algún momento el SRY se trasladó al brazo corto de Y
MAMIFEROS
ZONAS DE EMPAREJAMIENTO CAPACES TODAVIA DE RECOMBINARSE
3
2
1o
ocurre un fallo en la recombinación; la sección afectada del cromosoma Y se degrada y acorta
2o 1
ocurre otro fallo en la recombinación, que provoca una mayor degradación de Y
4
4o
3o
ocurre otro nuevo fallo, que empu ja al cromosoma Y hacia su aspecto de un estado muy contraído
ocurre otro fallo, que lleva a un acortamiento ulterior
D N A L O N I D I E H Y N A I J A M A K . T D E R F L A
ZONAS YA INCAPACES DE RECOMBINACION X NACIENTE
Y X COMO EN LOS MONOTREMAS
Y X COMO EN LOS MARSUPIALES
harto simple, según la cual si un gen es crucial para la supervivencia, tenderá a conservarse. En efecto, los genes de Y que menos cambios han experimentado coinciden con los “encargados de la administración de la casa”, vale decir, los responsables de mantener la integridad de las células del organismo. Compensación de pérdidas
La lógica —y un cuerpo sólido de resultados de investigación— nos induce a afirmar que a la recombinación fallida entre el cromosoma X y el Y, con la degradación consiguiente de muchos genes en Y, hubo de sucederle un tercer proceso que compensara la degeneración. ¿Por qué? No todos los genes están activos en todas las células. Ahora bien, cuando una célula necesita determinadas proteínas, activa las copias, maternas y paternas, de los genes correspondientes. La cantidad de proteína sintetizada a partir de cada copia se ajusta con finura a las exigencias de desarrollo del organismo y a su desenvolvimiento diario. Por tanto, cuando los genes del cromosoma Y comenzaron a desaparecer, la producción de las proteínas asociadas habría disminuido catastróficamente en los machos, de no haber logrado las especies afectadas desarrollar algunas mañas compensadoras. La mosca del vinagre y muchas especies más resuelven ese desequilibrio doblando la actividad de las versiones X de los genes Y perdidos en el macho. Otros animales emplean N UEVA GENÉTICA
Y X COMO EN LOS MONOS
Y X COMO EN EL HOMBRE
3. LA DEGENERACION DEL CROMOSOMA Y conoció cuatro episodios distintos. Comenzó hace unos 300 millones de años, después de que un antepasado reptiliforme adquiriera un gen nuevo (SRY ) en uno de sus cromosomas autosómicos. En cada uno de los episodios se produjo un fallo de la recombinación (intercambio de ADN) entre el cromosoma X y el Y durante la meiosis, la división celular que origina el espermatozoide y el óvulo. Si la recombinación se bloquea, los genes de las regiones afectadas dejan de funcionar y se degradan. La secuencia que se muestra es muy esquemática. En realidad, el cromosoma Y se expandió temporalmente a veces (enfilando ADN autosómico en zonas todavía capaces de recombinación), antes de que los fracasos de la recombinación condujeran a un acortamiento neto.
una estrategia más compleja. Primero refuerzan la actividad de los genes del cromosoma X, lo mismo en el macho que en la hembra; con ello se colman los niveles de proteína en el macho, aunque se crea un exceso en la hembra. Algunos, como los nemátodos, reducen a la mitad la actividad de los genes de X en la hembra. Otros, mamíferos incluidos, recurren a un proceso de inactivación de X, en cuya virtud las células de embriones tempranos de hembras silencian al azar la mayoría de los genes en uno de sus dos cromosomas X. Las células vecinas podrían silenciar copias de X diferentes, pero todas las descendientes de una determinada célula se acomodarán al mismo patrón de inactivación de X. Aunque desde hacía tiempo se veía en la inactivación de X una respuesta al deterioro de los genes de Y, carecíamos de pruebas tajantes. Si la degeneración de los genes de Y conducía a la inactivación del cromosoma X, entonces los genes de X dotados de pareja funcional en la región no recombinante de Y continuarían, cabía esperar, operando en las hembras
(para evadir la inactivación), de suerte que así se mantuvieran en las hembras niveles de proteína equivalentes a los de los machos. Al analizar los niveles de actividad de los pares X-Y en dos docenas de especie s de mamíferos, uno de los autores (Jegalian) y Page descubrieron años atrás que las copias en X de genes funcionales en Y escapaban a la inactivación. Su investigación reveló también que la inactivación de X, aunque hoy sucede en un instante durante el desarrollo del animal, distó mucho de surgir de una forma repentina. Apareció trozo a trozo, quizá gen a gen dentro de un segmento, no de golpe en el cromosoma. Temas nuevos
Resulta cuando menos llamativo que la región no recombinante del cromosoma Y posea, además de un puñado de genes valiosos, reflejados en el cromosoma X, otra docena que promueve la fecundidad en el macho. Estos genes de la masculinidad determinan sólo proteínas sintetizadas exclusivamente en los testículos, presumiblemente para intervenir en la 87
X Y CELULA MASCULINA
PROTEINA CODIFICADA POR GENES
EFECTO: El macho fabrica la mitad de la cantidad de proteína sintetizada por la hembra
EFECTO: El nivel de proteí na total en el macho vuelve a su valor normal
EFECTO: Ningún cambio en el macho
N A I J A M A K . T D E R F L A
GEN PERDIDO
COPIAS ACTIVAS DEL GEN CONDICION DE PARTIDA
SUCESO 1
SUCESO 2
SUCESO 3
La copia del gen en Y se deteriora a causa del fallo de la recombinación entre XeY
La copia del gen en X dobla su actividad para compensar la pérdida de proteína en el macho
Las hembras inactivan al azar una copia del gen en cada célula
RESULTADO FINAL El nivel de proteí na en macho y hembra se igualan
GEN INACTIVO CELULA FEMENINA
X
X
EFECTO: Ningún cambio e n la hembra
EFECTO: La hembra produce ahora demasiada proteína
S E L R A E S I Z A R
producción de espermatozoides. Algunos parecen haber saltado hasta el cromosoma Y desde otros cromosomas. De otros genes pudiera decirse que estuvieron en Y desde el comienzo, aunque cumpliendo en su inicio una misión diferente; con el tiempo adquirirían las nuevas funciones. De donde se desprende que la degeneración constituye un asunto mayor en el curso evolutivo seguido por el cromosoma Y. Otra segunda cuestión, apenas atisbada hasta hace poco, se refiere a la adquisición de los genes de fertilidad. Los teóricos discrepan a propósito de las fuerzas que convierten al cromosoma Y en un imán para esos genes. La especie, en cuanto tal, podría beneficiarse del secuestro en los machos de genes nocivos o inútiles para las 88
EFECTO: El nivel de proteí na en la hembra vuelve a su valor normal
4. EVOLUCION DE LA INACTIVACION DE X o silenciamiento de la mayoría de los genes del cromosoma X en las células de una hembra. Según parece, procedió de una forma gradual —un gen o algunos genes a la vez— para compensar la pérdida de genes del cromosoma Y (diagrama ). En el ga to moteado encontramos un efecto de la inactivación de X (fotografía ). El gen determinante del color de la piel, naranja o negro, se halla en el cromosoma X. Las hembras que llevan la versión naranja en un cromosoma X y la versión negra en el otro X tendrán algunas zonas naranja y otras negras, dependiendo de qué X esté inactivo en cada célula. El responsable de las zonas blancas es un gen diferente.
hembras. Es también posible que al estar en el Y los genes de la fertilidad se aseguraría su paso de macho a macho sin tener que desviarse a través de las hembras (que podrían desecharlos sin sufrir consecuencias directas). ¿Cómo pueden los genes de la fertilidad prosperar en ausencia de recombinación, bajo las mismas condiciones que arruinaron a la mayoría de los restantes genes del cromosoma Y? La respuesta podría esconderse tras la observación siguiente: la inmensa mayoría de los genes de fertilidad presenta múltiples copias en el cromosoma Y. Semejante multiplicidad puede servir de tampón contra los efectos de mutaciones destructivas, que acostumbran afectar sólo a una copia por vez. Algunas
copias acumulan mutaciones y terminan por fracasar, en tanto que las restantes siguen cuidando la capacidad reproductora del hombre y sirven de simiente para su propia multiplicación. La evolución de los cromosomas sexuales se ha estudiado a fondo en el hombre. De su comparación con los trabajos acometidos en otras especies han aflorado una serie de principios generales que operan incluso en animales cuyos cromosomas sexuales siguieron un curso evolutivo distinto del expuesto a propósito de los mamíferos. Aves y mariposas usan el sistema W-Z de determinación del sexo. Cuando la herencia de una sola copia de un cromosoma específico induce la formación de un macho, a ese cromosoma se le llama Y, y a su TEMAS 38
Esterilidad del varón
A
demás de revelar la historia de los cromosomas sexuales, los estudios genéticos del cromosoma Y nos permiten conocer las causas de algunos casos de esterilidad. En casi la mitad de las parejas afectadas, el problema reside total o parcialmente en el varón, que produce un número insuficiente de espermatozoides o ninguno en absoluto. A menudo las raíces de estas anomalías permanecen oscuras. Los nuevos hallazgos revelan, sin embargo, que el cromosoma Y contiene genes de fertilidad y que la alteración de uno o varios explica por qué alrededor del 10 por ciento de los hombres producen escasos espermatozoides o incluso ninguno. En los años setenta, tras observar al microscopio que muchos varones estériles carecían de pequeños fragmentos d el cromosoma Y, presentes por norma en los fértiles, se dedujo la responsabilidad de dicho cromosoma en la infecundidad. Sabemos hoy que las deleciones en una cualquiera de tres regiones específicas del Y provocan esterilidad. Se trata de las regiones AZF (por factor de azoospermia) a, b y c. Cada una de ellas contiene múltiples genes. En su mayoría, tales genes se muestran muy activos en los testículos, donde se producen los espermatozoides. (Los genes fabrican en cantidades abundantes las proteínas que codifican.) De semejante comportamiento se desprende la importancia de los genes de las regiones AZF para la formación de fluido seminal, aunque se desconoce su contribución exacta, así como la interacción de los mismos con genes de la fecundidad de otros cromosomas. Algunos andrólogos introducen ya las deleciones del cromosoma Y en valoración diagnóstica. Si los varones que sufren esas deleciones producen al menos algunos espermatozoides, podrían someterse a una terapia de inyección espermática citoplasmática (ICSI), en que se recoge semen de los testículos y se inyecta en el ovocito en el laboratorio. Pero los hijos así concebidos heredarán los cromosomas Y defectuosos y padecerán probablemente los mismos problemas de esterilidad. Una vez se descifren las funciones exactas de las proteínas codificadas por los genes de la zona AZF, podría quizá repararse la esterilidad de los varones con deleciones en el cromosoma Y, mediante la restauración de los genes perdidos y la aportación consiguiente de las proteínas necesarias. Vistas las cosas desde LA INYECCION del espermatozoide la otra cara, algunos se proponen (visible en la microaguja ) directa- aprovechar esa información para el mente en un óvulo puede vencer la es- diseño de fármacos que alteren la terilidad en varones afectados por mu- maquinaria de producción de espermatozoides y convertirlos en nuevos taciones en el cromosoma Y. anticonceptivos del varón. E N O T S , L E M R A H K R A M
pareja X. Cuando la herencia de una sola copia de un cromosoma promueve la formación de una hembra, a ese cromosoma se le denomina W, y a su pareja Z. Un principio importante es que los cromosomas sexuales proceden de los autosomas. Pero los autosomas concernidos pueden variar. En las aves los cromosomas W y Z surgieron de autosomas distintos de los que dieron lugar a X e Y en los mamíferos. Por su parte, los cromosomas X e Y de la mosca del vina-
N UEVA GENÉTICA
gre se originaron a partir de autosomas diferentes de los que dieron lugar a esos cromosomas en los seres humanos.
En la mayoría de las especies que se reproducen por vía sexual, una vez que surgieron los cromosomas sexuales, éstos comenzaron a adquirir rasgos muy peculiares a medida que sufrieron uno o más ciclos de tres pasos secuenciales: supresión de la recombinación, degeneración de las regiones no recombinantes del cromosoma específico del sexo (el Y
o el W) y, por último, la compensación por parte del otro cromosoma. Al mismo tiempo, el cromosoma específico del sexo devino importante para la fecundidad, como sucedió con el cromosoma Y en el hombre y en los insectos. Es razonable preguntarse por el futuro que le aguarda a nuestra especie. ¿Podría continuar el ciclo hasta desaparecer toda recombinación entre el cromosoma X y el Y, hasta la destrucción final de Y, quizá dentro de millones de años? Los descubrimientos recientes insinúan que los machos están capacitados para proteger sus genes del cromosoma Y que resultan decisivos para la supervivencia y la fecundidad del varón. Ello no obstante, la degradación total del cromosoma Y sigue ahí como una posibilidad teórica. Muy a menudo, se emprende una investigación génica con la mirada puesta en alguna enfermedad, para conocerla a fondo y repararla si se puede. Así se acometieron varios trabajos sobre el cromosoma Y, que buscaban comprender el desarrollo y la corrección de la esterilidad. A un buen número de estudios, sin embargo, les preocupaba menos la posible terapéutica. Conforme se iban identificando más genes de los cromosomas X e Y, gracias a la inve stigación médica y a una secuenciación sistemática, los científicos no se resistieron a plantear una cuestión más básica, la de si esos genes aportaban alguna novedad sobre el pasado remoto de ese extraño desemparejamiento entre el cromosoma X y el Y. Ahora vemos, en efecto, que los genes tenían una maravillosa historia que contarnos.
BIBLIOGRAFIA COMPLEMENTARIA FUNCTIONAL COHERENCE OF THE HUMAN Y CHROMOSOME. Bruce T. Lahn y David C. Page en Science, vol. 278, págs. 675-680; 24 de octubre de 1997. A PROPOSED PATH BY WHICH GENES COMMON TO MAMMALIAN X AND Y C ROMOSOMES EVOLVE TO BECOME X I NACTIVATED. Karin Jegalian y David C. Page en Nature, vol. 394, págs. 776-780; 20 de agosto de 1998. F OUR E VOLUTIONARY S TRATA ON THE HUMAN X CHROMOSOME. Bruce T. Lahn y David C. Page en Science, vol. 286, págs. 964-967; 29 de octubre de 1999. THE HUMAN Y CHROMOSOME IN EVOLU TION’S LIGHT. Bruce T. Lahn, Nathaniel M. Pearson y Karin Jegalian en Nature Reviews Genetics (en prensa).
89
Genética e historia de las poblaciones del norte de Africa y la península Ibérica El análisis genético ha revelado que los amplios intercambios culturales producidos entre el Magreb y la península Ibérica no conllevaron grandes intercambios de poblaciones E. Bosch, F. Calafell, S. Plaza, A. Pérez-Lezaun, D. Comas, J. Bertranpetit
L
as poblaciones humanas se componen de individuos genéticamente distintos entre sí. Del estudio de la variabilidad de nuestra especie se ocupa la genética de poblaciones aplicada a escala mundial. A dicha disciplina le corresponde exponer la magnitud y distribución de la variabilidad genética humana. Dos personas cualesquiera, tomadas al azar, se distinguen, en promedio, en un 0,1 % de las bases nucleotídicas que conforman su ADN. Expresado de otro modo, discrepan en seis millones de pares de bases. (El ADN humano consta de unos 3000 millones de pares de bases en cada una de las dos dotaciones haploides, una procedente del padre y otra de la madre.) Si del individuo pasamos a las poblaciones, las diferencias observadas explican, a lo sumo, un 15 % de la disparidad genética total; un 10 % se debe a las diferencias entre grandes grupos continentales y el 5 % restante a las diferencias entre poblaciones de un mismo continente. Aun siendo pequeñas, estas últimas diferencias tienen que ver con la historia de cada población. Podemos apoyarnos en la diversidad genética entre poblaciones para reconstruir la historia demográfica. El acervo genético de las poblaciones actuales es el resultado de la interacción entre diversas fuerzas evolutivas. Dependen éstas, a su vez, de la historia demográfica de las poblaciones, de las características intrínsecas de las regiones genómicas estudiadas y de la interacción entre genoma y factores ambientales. 90
Las características intrínsecas de cada región del genoma remiten a sus tasas y patrones de mutación y recombinación, así como a su modo de herencia. Se trata de parámetros que la ciencia conoce con razonable precisión. La interacción entre la variabilidad de cada gen y el ambiente (tomado en sentido amplio, incluida, pues, la interacción con otros genes) puede promover la selección natural. Es decir, unas variantes pueden mostrarse más eficientes y verse privilegiadas por la selección, en tanto que otras pueden ser desfavorables. Lo observamos en la hemoglobina. Algunas variantes de esta proteína confieren resistencia a la malaria; la selección prima su presencia en zonas palúdicas. En consonancia con ello, el estudio de la variabilidad de la hemoglobina nos informará sobre la distribución de la malaria con mayor rigor que la historia de las poblaciones. Conviene saber que sólo un 1,5 % de la secuencia de ADN humano llega a expresarse, es decir, determina proteínas que se sintetizan y son objeto de selección natural. Por lo tanto, la mejor estrategia para conocer la historia de las poblaciones será la que se centre en la variabilidad presente en el 98,5 % restante, cuyas probabilidades de verse afectada por la selección son mucho menores. A partir de esta premisa podemos analizar dicha variación, explicar las diferencias genéticas neutras (polimorfismos) que encontramos entre los individuos de una población e interpretarlas en términos de historia de las poblaciones.
Disponemos de un amplio bagaje teórico, desarrollado desde los años cuarenta, gracias al cual, dada una historia demográfica, podemos predecir sus efectos sobre la diversidad genética. Podemos reconstruir la historia demográfica a partir de la diversidad genética investigada en diversas regiones del genoma, que difieren en su velocidad de cambio y que permiten reconocer huellas genéticas a distintas profundidades de un tiempo pasado. Deriva genética
¿Cómo influye la historia en la diversidad de las poblaciones? A través de dos mecanismos básicos: la deriva genética y el flujo génico. En la deriva se engloban todos los fenómenos de cambio genético aleatorio que se dan cuando una generación transmite sus genes a la siguiente. Así como hay apellidos que prosperan y otros que se pierden en razón del número de hijos varones procreados en cada generación, las variantes genéticas (o alelos) pueden también cambiar de frecuencia; en ambos casos se trata de fenómenos aleatorios. Tales oscilaciones serán tanto más intensas cuanto menor sea la población, por un simple efecto de muestreo. Las desviaciones respecto a la probabilidad teórica son mayores si realizamos un número pequeño de ensayos, de la misma forma que al tirar una moneda al aire repetidas veces sólo se alcanza con seguridad la frecuencia esperada de 1/2 si se lanza muchísimas veces. Se presenta un caso extremo de grandes cambios genéticos aleatorios, conocido por efecto fundador , cuando TEMAS 38
. A T J R A E C B N M A A L B , E A T C N E A T C O I I L L A B I Y B N A L O L E L D E T S S E A N C E , G A I A C M I N E E L D L A V A T I E D G I S D O O R V R I O H H C A R A E , L D L A J E A S C O R A L A I E C D R A A C G I . J T S I T R A N O I C C E L O C A L A E T N E I C E N E T R E P A R B O
1. EMBARQUE DE LOS MORISCOS en el puerto de Vinaroz.
un grupo reducido de individuos establece una nueva población y se lleva consigo una muestra no necesariamente representativa de los genes de la población de origen. En la colonización sucesiva de las islas de la Polinesia, por ejemplo, se dio una secuencia clara de efectos fundadores; en el curso de la misma, un grupo limitado de individuos partía de una isla y se asentaba en la siguiente. Las oscilaciones aleatorias de las frecuencias alélicas pueden llegar a la extinción de algunas de estas variantes. Puesto que dichas oscilaciones son más intensas en poblaciones pequeñas, se pierde variabilidad más fácilmente en éstas. A no ser que se dé una tasa de mutación extraordinaria, resulta muy poco probable que en las poblaciones pequeñas se regenere la variación perdida. Por lo tanto, al detectar una menor variabilidad genética en una población actual, podemos reconocer episodios de reducción de la población en el pasado (los llamados cuellos de botella), aunque la población actual se haya recuperado. Además, habida cuenta de la naturaleza aleatoria de la deriva genética, las poblaciones pequeñas contiguas tenderán a diferir más entre sí que las mayores. Esta misma natuN UEVA GENÉTICA
raleza aleatoria puede manifestarse de manera ligeramente diversa en regiones genómicas distintas. En consecuencia, los análisis basados en una sola región genómica pueden resultar poco fiables. Conviene siempre considerar la información procedente de un número razonable de regiones genómicas y extraer las tendencias medias. Flujo génico
Dos poblaciones que se hayan diferenciado, por deriva, en su composición genética y entren en contacto, pueden mezclarse y dar lugar a una población con características genéticas de las dos de partida. Este fenómeno de flujo génico , así se le llama, se debe a la migración. La propia migración en distancias cortas, habitual a través del matrimonio, puede promover, a largo plazo, el intercambio de genes a grandes distancias. Lo observamos, por ejemplo, en las poblaciones de Asia Central, que poseen características genéticas intermedias entre las de Europa y las de Asia Oriental; su peculiar constitución genética podría explicarse por su posición central y milenios de migraciones individuales de corto alcance. La diferenciación entre poblaciones resultante de la deriva genética
se acentúa con el paso del tiempo. Para medirla disponemos de un parámetro, la distancia genética , que indica el grado de diferenciación entre pares de poblaciones para múltiples regiones del genoma. Si se trata de un conjunto de poblaciones, podemos representar su matriz de distancias genéticas mediante algoritmos; ofrecen éstos un paisaje genético que refleja las afinidades y diferencias dentro del conjunto poblacional. El paisaje compendia la historia de las poblaciones en términos de deriva genética y flujo génico. Para trazar y cuantificar con razonable precisión los flujos génicos, disponemos de una nueva herramienta de análisis. Se trata de la filogeografía. Estudia ésta la genealogía del gen que ha dado origen a la variación existente dentro de una región del genoma y la distribución geográfica de dicha variabilidad. Ante una diversidad genética dada, pensemos en una secuencia de ADN o en un conjunto de polimorfismos, la herramienta mencionada se propone reconstruir el proceso evolutivo o filogenético que ha desembocado en la diferenciación observada a partir de un antepasado común. Al plasmar con juntamente la diversificación del gen y la de las poblaciones, podemos anclar ciertas variantes genéticas (secuencias o haplotipos) en una rama del árbol 91
Patrones de herencia: autosomas, cromosoma Y, ADN mitocondrial
N
uestro ADN se dispone en 23 pares de cromosomas. Cada miembro de un par es casi idéntico al otro en longitud y en la información que contiene; se trata de dos rasgos distintivos de cada par. Cada miembro de cada par de cromosomas nos viene de un progenitor; a cada uno de nuestros hijos le legaremos un solo miembro de cada pareja. Pero no es una transmisión fidedigna; en virtud del proceso de recombinación del material genético no heredamos el cromosoma original, sino una mezcla que contiene partes de cada miembro del par, tomadas al azar. Para ilustrarlo, la figura muestra un par de cromosomas que contiene fragmentos de distinta longitud de los cromosomas de los bisabuelos. Por eso resulta imposible predecir a priori de qué antepasado proviene un determinado fragmento de ADN autosómico. Hay en el genoma dos regiones que presentan un patrón de herencia distinto. Nos referimos a los cromosomas sexuales y el ADN mitocondrial. A diferencia de los autosomas, los cromosomas sexuales (X e Y) son muy diferentes entre sí. El cromosoma Y determina la masculinidad a través de la acción de un único gen, SRY (sex-determining region ); los cigotos con un cromosoma X y un cromosoma Y generan embriones masculinos, en tanto que los portadores de dos cromosomas X generan embriones femeninos. Por lo tanto, los varones heredan el cromosoma Y de su padre, que a su vez lo recibió del abuelo paterno, de la misma forma que se hereda el primer apellido. Lo vemos reflejado en la figura: de los cuatro bisabuelos varones, sólo el abuelo paterno del padre lega su cromosoma Y (azul liso ) a su bisnieto. Además de los cromosomas, que residen en el núcleo de las células, otros orgánulos contienen ADN. Se trata de las mitocondrias, que alojan decenas de copias de una pequeña molécula circular de ADN. Este ADN mitocondrial (ADNmt)
BISABUELOS
ABUELOS
PADRES
INDIVIDUO
se hereda por vía materna: el ADNmt del embrión procede sólo del óvulo, porque el ADNmt del espermatozoide no llega a penetrar en el óvulo. Así, en l a genealogía del ejemplo, el ADN mitocondrial del individuo (magenta ) proviene de su madre, de su abuela materna, de la madre de ésta, y así sucesivamente. Para entender esta figura sobre cromosomas y herencia, adviértase que las barras grandes representan autosomas (cromosomas no ligados al sexo), las pequeñas representan el cromosoma Y (cuya presencia denota un varón) y los círculos, el ADN mitocondrial. De abajo arriba se esquematiza un individuo, su madre y su padre, sus cuatro abuelos y sus ocho bisabuelos.
evolutivo y en un origen geográfico. que operó hace unos 3000 años, coin Aplicando ese método se ha cuantifi- cidente con el establecimiento de una cado la aportación por vía paterna y casta sacerdotal hebrea. materna de africanos, europeos y amerindios al acervo genético de la pobla- El Magreb y la peníns ula Ibérica ción brasileña contemporánea. Para datar puntos concretos de la El análisis de la diversidad genética evolución humana se puede recurrir a humana en poblaciones actuales ha los microsatélites, segmentos de ADN arrojado luz sobre numerosas cuesque contienen repeticiones de breves tiones históricas, en distintas escasecuencias de dos a seis nucleótidos. las temporales y espaciales. Sabemos Son marcadores de evolución rápida. ya que la distribución y la antigüe A partir de un determinado aconte- dad de la diversidad genética a escala cimiento fundador, la cantidad de va- mundial son compatibles con un oririación acumulada y medible es una gen reciente y africano de la humafunción de la tasa de mutación (que nidad actual. El punto de arranque, podemos estimar) y del tiempo trans- situado en Africa, se remontaría, a currido, que es la incógnita que des- lo sumo, unos 150.000 años atrás. Por pejaremos. Por ejemplo, se observó tanto, ni los habitantes del yacimiento que la mayoría de los judíos apellida- de Atapuerca ni los neandertales dos Cohen (“sacerdote”) poseían cierto serían antepasados nuestros. tipo de cromosoma Y. Concurre, ade A escala continental, se debate la promás, que la condición de sacerdote, el porción de genes de origen paleolítico apellido y el cromosoma Y se trans- (hace unos 30.000 años) y neolítico miten de padres a hijos exclusiva- (hace 10.000) presentes en los europeos mente por la línea masculina. Pues actuales. Los genes, por otro lado, apunbien, de la variación acumulada en los tan a una fecha antigua (unos 30.000 microsatélites de este tipo de cromo- años) y a un origen claramente norteasoma Y se infiere un efecto fundador siático para la colonización de América. 92
. ) . T I 5 9 T 9 E 1 P ; N 6 A 5 4 R T 9 4 R 4 E B . . S J G A Y P S , A 1 1 M O O . C N . , D S , C I N T U E A N Z E E L - G Z N I E S R D E N P . E A R , T A N Z E A L H P . T I S , M L S L R E E F L A Y L T A D C . N F A , G H N C I S L B O B O . J E E D A D A T P A D A (
A escala regional, podemos abordar también algunas cuestiones abiertas sobre la historia de las poblaciones. Se cuenta aquí con la colaboración de otras disciplinas; la arqueología, la paleoantropología o la lingüística suministran a menudo hipótesis que, en la medida que impliquen distintas historias demográficas, pueden verificarse mediante el estudio de la diversidad genética de las poblaciones actuales. Desde la genética de poblaciones podemos abordar cuestiones que atañen a la península Ibérica (España y Portugal) y al noroeste de Africa (el Magreb: Marruecos, el Sahara Occidental, Mauritania, Argelia y Túnez). ¿Se puede hablar de un origen común para ambas poblaciones a sendas orillas del Mediterráneo? ¿Quedan en las poblaciones actuales rastros de un substrato paleolítico que represente el poblamiento inicial de los antepasados de las poblaciones actuales? ¿Es el mismo substrato para ambas regiones? ¿Cuál fue la aportación de la oleada de avance neolítica? ¿Qué fracción del acervo genético magrebí proviene TEMAS 38
de la invasión árabe? ¿Podemos identificar la contribución magrebí a las poblaciones peninsulares? ¿Es el Sahara una barrera impenetrable al intercambio de genes entre poblaciones? Para resolver esa gavilla de cuestiones sobre el poblamiento y las relaciones genéticas entre la península Ibérica y el Magreb, hemos recurrido al análisis de marcadores clásicos, microsatélites autosómicos, inserciones Alu, secuencias de ADN mitocondrial, polimorfismos de un solo nucleótido (SNP) del cromosoma Y y microsatélites del cromosoma Y en muestras de poblaciones ibéricas, beréberes del norte, centro y sur de Marruecos y del centro de Argelia, árabes marroquíes, argelinos y tunecinos, y saharauis. No se estudiaron todas las poblaciones para todos los marcadores, aunque sí se investigó extensamente un núcleo fundamental. En el caso de los marcadores clásicos, recopilamos la información publicada por otros equipos de trabajo. En otros casos, contrastamos nuestros resultados con los obtenidos por otros autores. De la investigación realizada se desprende una descripción, que creemos ajustada, de la historia de las poblaciones norteafricanas e ibéricas. Orígenes remotos de norteafricanos y ha bitant es de la península Ibérica
Con pocas excepciones, todos los marcadores genéticos analizados muestran una separación clara entre las poblaciones magrebíes y la de España y Portugal, incluidas, sin embargo, en el rango de la variación de las poblaciones caucasoides (las de origen europeo, más las norteafricanas y medioorientales). Ahora bien, las distancias genéticas entre ibéricos y el resto de europeos son menores que entre ibéricos y magrebíes. Este patrón mayoritario no se refleja en todos y cada uno de los genes analizados. Por ejemplo, en la región que lleva la información para la síntesis de los antígenos de los leucocitos humanos (HLA), los cuales definen la compatibilidad en trasplantes de órganos. Basándose en una sola región del genoma (y sometida a selección), algunos autores postularon un origen común de peninsulares y magrebíes. Pero la naturaleza aleatoria de la deriva genética y la acción de la selección pueden producir este tipo de desviaciones; para evitarlas, la interpretación debe apoyarse en la información conjunta del máximo número posible de genes y no en una sola región del genoma. N UEVA GENÉTICA
De acuerdo con nuestro análisis de marcadores clásicos, las distancias genéticas entre ibéricos y poblaciones del Oriente Medio son menores que la que existe entre ibéricos y magrebíes. Se da, además, una discontinuidad abrupta entre las orillas septentrional y meridional en el paisaje genético de la cuenca mediterránea, con una máxima pendiente en el estrecho de Gibraltar. Estas y otras consideraciones nos llevaron a postular que en el Magreb pudo conservarse un substrato paleolítico, distinto del substrato paleolítico europeo. Supondría ello que, a diferencia de lo que parece haber sucedido en Europa, la transición al Neolítico norteafricano se produjo sin un recambio sustancial de genes. En esa hipótesis abunda la cultura capsiense del Mesolítico norteafricano, que se prolonga hacia el Neolítico adoptando las nuevas formas de producción, aunque sin la drástica ruptura que se observa en gran parte de Europa. Planteamiento que viene avalado por investigaciones con secuencias Alu y microsatélites. Hallamos una confirmación directa de la hipótesis anterior al analizar la filogeografía del cromosoma Y. Los linajes del cromosoma Y, definidos a partir de SNPs, presentan una genealogía muy clara y una distribución geográfica que tiende a ser restringida. Las frecuencias del mismo en una región difieren de las observadas en la otra: en la península Ibérica predominan, lo mismo que en el resto de Europa Occidental, el linaje R1b* y sus inmediatos derivados (el conjunto R1b3, R1b6 y R1b8), en tanto que dos tercios de los cromosomas Y magrebíes pertenecen al linaje E3b2*. Tras la investigación realizada sobre la variación en el cromosoma Y ha quedado patente que el grupo de linajes R1b se encuentra sólo en Oriente Medio y Europa. Ciertos lina jes (R1b3, R1b6 y R1b8) se hallan circunscritos a la península Ibérica; habrían surgido aquí a partir del haplotipo fundador, sin apenas dispersarse allende sus fronteras. El grupo de linajes R1b, por su antigüedad y distribución geográfica, se habría originado en Oriente Medio y se habría difundido por Europa con las colonizaciones iniciales del Paleolítico superior. El linaje magrebí E3b2* se ha hallado en otras poblaciones, aunque con frecuencias mucho menores. Su antepasado más inmediato aparece entre los etíopes. Si atendemos a la acumulación de variabilidad en microsatélites asociada a E3b2*, se trataría de un
linaje de más de 19.000 años de existencia. Podemos, pues, postular un escenario en que una expansión paleolítica desde Africa nororiental llevara al Magreb los antepasados del linaje E3b2*, que surgiría in situ después de la expansión. El linaje masculino E3b2* tiene un correlato en el linaje matrilineal mitocondrial U6, también de antepasados etíopes y difusión limitada al noroeste de Africa, aunque no alcanza las elevadas frecuencias de E3b2*. Por consiguiente, dos regiones genómicas independientes con filogeografías bien establecidas confirman la singularidad magrebí y sitúan sus raíces en el Paleolítico. El Neolítico: un avance paralelo
Se admite que la agricultura y ganadería comenzaron en Oriente Medio hace unos 10.500 años. Esa fase prehistórica conllevó el crecimiento y la expansión consiguiente de la población en varias direcciones. Pero se debate si dicha expansión supuso un recambio genético en las poblaciones europeas o si se conserva en la actualidad un importante substrato genético paleolítico (anterior a la expansión del Neolítico), así como el grado en que ocurrió una cosa u otra. Si atendemos al paisaje genético europeo, advertiremos un gradiente o clina desde el sudeste hacia el noroeste. Asimismo, aparece otra clina esteoeste en el norte de Africa, desde Egipto hasta Marruecos. No es fácil dar con una explicación de dichas clinas, pues se produjeron varios movimientos migratorios en esas mismas direcciones; por ejemplo, la primera colonización del Paleolítico y el avance del Neolítico en Europa, o el Neolítico y las invasiones árabes en el norte de Africa. Para nuestra fortuna, los métodos que permiten datar linajes acotan el intervalo de la difusión. Así, para el cromosoma Y en Europa los datos indican un impacto neolítico menor (con estimas en torno al 38,7 %) frente a un substrato paleolítico mayor (en torno al 61,3 %) en el conjunto europeo. Hay razones para postular que los linajes F*, G*, J* y J2* del cromosoma Y se originaron en Oriente Medio. Desde allí se difundieron hacia el oeste por ambas riberas del Mediterráneo con la expansión del Neolítico. De acuerdo con nuestra investigación, la frecuencia de F* y G* es más elevada en la península Ibérica que en el NO de Africa; por el contrario, J* abunda más en el norte de Africa. Estas fre cuencias dis pares son compatibles con la hipótesis de la expansión del Neolítico, siguiendo 93
Tipos de polimorfismos genéticos
L
a variabilidad genética se presenta en múltiples formas. Con las técnicas disponibles nos es dado conocer distintas facetas de dicha variación. Podemos analizar directamente la variabilidad del ADN. Asimismo, los marcadores genéti- cos clásicos son los sistemas polimórficos detectados en los productos de expresión génica. A través de esta segunda vía, históricamente anterior a la primera, se nos revelaron los primeros sistemas polimórficos genéticos, por ejemplo, el de los grupos sanguíneos, descubiertos en 1900. Otros marcadores clásicos consisten en la variación de movilidad de proteínas plasmáticas, enzimas eritrocitarias y el sistema de antígenos leucocitarios humanos (antígenos HLA), que determinan la compatibilidad de los trasplantes. La variabilidad o polimorfismo del ADN puede tomar varias formas. En la más sencilla, una determinada posición de nuestro genoma puede presentar dos variantes químicas (raras veces más de dos) de las cuatro posibles en las que se escribe el alfabeto del ADN (G, A, T y C). Se trata de un SNP (Single Nucleotide Polymorphism ), de los que se calcula que hay unos tres millones en el genoma humano; se caracteriza por que en una posición concreta del genoma puede haber una u otra base (A o G, por ejemplo). En vez de limitarnos a una sola posición del genoma, podemos definir un cierto segmento y determinar su secuencia en un conjunto de individuos. Esta estrategia permite,
además de reconocer las variantes existentes en ciertas posiciones, descubrir también toda la variación que hay en el ADN y reconstruir su genealogía, es decir, el proceso evolutivo que dio lugar a la variabilidad observada. Encontramos otro tipo de variación genética en los micro- satélites o STR (Short Tandem Repeat Polymorphisms ). Estas secuencias de ADN consisten en la repetición en tándem de una unidad básica de entre 2 y 6 nucleótidos de longitud. Presentan una particularidad distintiva: el número de repeticiones de la unidad básica es muy variable entre individuos. Por ese motivo se han convertido en importantes marcadores en el campo de la genética forense (identificación de personas y de la paternidad). Las inserciones Alu constituyen, por último, otro tipo interesante de polimorfismo. Estas secuencias, de unos 300 nucleótidos de longitud, utilizan la maquinaria celular de replicación del ADN para copiarse a sí mismas y reinsertarse en otras partes del genoma. Las nuevas inserciones, lo mismo que cualquier otro polimorfismo, pueden perderse o fijarse, pero algunas de ellas se hallan en una situación intermedia. Aunque esta tercera situación se da con cierta frecuencia, es un fenómeno variable de una población a otra. Además, caso único entre los polimorfismos, conocemos bien cuál es la dirección de la evolución: normalmente, de la ausencia (estado ancestral) a la presencia (estado derivado) del elemento Alu.
pautas independientes, por ambas árabe, y se supone descendiente de permite rastrear el flujo génico tranorillas del Mediterráneo; la penín- las invasiones, que desde el siglo VII sahariano. En el estudio de las insersula Ibérica y el Magreb representa- y con especial intensidad en el XI , lle- ciones Alu se advierte con nitidez que rían los extremos occidentales de varon el Islam desde la península las poblaciones más al sur de nuestra ambas expansiones. Arábiga hasta el Magreb. zona de trabajo (saharauis y berébeColin Renfrew ha propuesto que en Así las cosas, podemos plantear- res del sur de Marruecos) muestran el Neolítico, además de los genes, se nos si las invasiones árabes implica- distancias genéticas más cortas con propagaron varias familias lingüís- ron una aportación demográfica sig- las poblaciones subsaharianas que las ticas desde Oriente Medio: la fami- nificativa o si, por el contrario, una que se dan entre subsaharianos y lia indoeuropea hacia Europa, la afro- elite numéricamente limitada pero poblaciones del norte del Magreb. Tal asiática hacia Arabia y el norte de culturalmente prestigiosa consiguió comprobación nos induce a pensar en Africa, la elamodravidiana hacia Irán difundir una nueva lengua y religión, un gradiente de flujo génico subsahay el subcontinente indio, y la altaica sin que ello conllevara una aporta- riano; en el curso del mismo, las poblahacia Asia central. Habría, pues, un ción de genes notable. Para resolver ciones del sur del Magreb habrían correlato génico de las expansiones tal disyuntiva hemos de acudir al recibido una mayor aportación de lingüísticas que llevaron las lenguas análisis genético de las poblaciones genes subsaharianos, lo que, dada su indoeuropeas hacia Europa y las afro- árabes y beréberes. posición geográfica y el conocido comerasiáticas hacia el norte de Africa. El análisis de gran cantidad de cio de esclavos, parece verosímil. Esta hipótesis, muy controvertida, marcadores (inserciones Alu, microLas regiones genómicas con una ficuenta con escaso respaldo en su ap li- satélites autosómicos y polimorfis- logeografía bien establecida permicación rigurosa. mos del cromosoma Y) nos revela una ten cuantificar la aportación subsallamativa ausencia de diferencias hariana. Así, en el norte de Africa Arabes y beréberes entre poblaciones árabes y berébe- aparecen en bajas frecuencias (un 8 % Los beréberes (o imazighen) consti- res. Sólo el ADN mitocondrial separa en conjunto) los linajes E1* y E3a* tuyen los descendientes directos de de los beréberes a los árabes argeli- del cromosoma Y, de origen subsauna población ancestral que se exten- nos y tunecinos (pero no marroquíes). hariano; no se han hallado en la peníndía por gran parte del norte de Africa, Debemos concluir, pues, que la ara- sula Ibérica. desde Egipto hasta Senegal. Suman bización del Magreb fue un fenómeno En el caso del ADN mitocondrial, hoy 20 millones de personas, disper- básicamente cultural, en que una son de origen subsahariano los linasas en pequeñas minorías de Egipto, reducida elite impuso su lengua y jes L1, L2 y L3, que constituyen una Libia y Senegal. Sin embargo, muchos religión, sin que hubiera cambios sus- media del 25% de los linajes magrehabitantes de Túnez, Argelia y tanciales en la población local, incluso bíes (con un rango entre 3 % en rifeMarruecos se definen a sí mismos la actualmente arabófona. ños y 40% en mauritanos). En la como tales y hablan alguna de la veinpenínsula Ibérica, presentan una fretena de lenguas beréberes, una rama Más allá del Sahara cuencia media del 3 %, oscilando entre de la familia afroasiática. El resto de La comparación de la diversidad gené- su ausencia en vascos y un 6 % en la población habla y se considera tica con la hallada al sur del Sahara portugueses del centro. En el caso de 94
TEMAS 38
la Península, es difícil decidir si estos linajes proceden directamente de allende el Sahara, traídos con la trata de esclavos, o si, dada su frecuencia en el Magreb, llegaron a Iberia vía contactos a través del estrecho de Gibraltar. De la comparación entre los datos del ADN mitocondrial y los del cromosoma Y se desprende que los lina jes subsaharianos heredados por vía materna se hallan a una frecuencia más elevada en magrebíes e ibéricos que los linajes paternos, lo que indicaría una diferencia entre sexos en la movilidad de los individuos desde el sur del desierto del Sahara. Esa observación genética debe contrastarse con datos sociales de movilidad y comercio de esclavos.
T I T
A
M91
B
M60 M181
C
RPS4Y M216
D
M42 M94 M1 39
M174
YAP M145 M203
SRY10832.1
* M33 M132
1
P9 M168
E
M96 P29 2 SRY 4064
M75
* a
3
M2 P1
P2
b
M78
1
M35
M81
2
M123
3
F*
* F
Apt
1
M89 M213 P14
E3a* E3b* E3b1* E3b2*
*
DYS391p
Tráfico en el estrecho de Gibraltar
¿Qué decir, por último, de las relaciones entre las poblaciones magrebíes y las peninsulares? Dejamos constancia al principio de la nítida separación entre ambas poblaciones, debido, probablemente, a un substrato paleolítico distinto. Ese hito temporal permite la detección del flujo génico a través del estrecho, así como su cuantificación a partir de linajes del cromosoma Y y del ADN mitocondrial. Las personas y, si se reproducen, sus genes han cruzado el estrecho de Gibraltar con distinta intensidad a lo largo de la historia. En algunos períodos, dicho flujo aumentó. Además, se trata de una corriente bidireccional, pues también se dio un flujo génico de la Península al Magreb. De norte a sur, cruzaron el estrecho romanos, vándalos, judíos y moriscos. Los dos últimos grupos podrían haber difundido genes ibéricos. Del sur llegaron a Hispania los cartagineses; en el 711 arribaron los árabo-beréberes. En el siglo XII vinieron oleadas de almohades, almorávides y benimerines. Los datos genéticos no permiten precisar cuándo se produjo el tráfico. Sólo pode-
E1*
G
M201
H
M52 M69
I
P19 M170
G* *
I*
*
P38 1
a P30
b
*
P37.2
1
2
*
J 12f2.1
1
M62
2
M172
M41.2 M26
I1b2* J* J2*
*
1
K 2
M70 M147
3
M9
L
M20 M22 M11 M61
M N
M4 M5 M106 P35 M189 M186
O
LLY22g M175 M214
* P 1
M124
P36 MEH2 P27 Q M45 * 92R7 M207 * M74
2 GENEALOGIA DE LOS LINAJES DEL CROMOSOMA Y. Se representan con R números, a lo largo de las ramas, las distintas mutaciones puntuales conoci a 1 das (SNP y pequeñas variaciones de longitud) que han aparecido en el curso de M173 la evolución reciente del cromosoma Y. En los extremos de las ramas se represen tan los linajes o haplotipos del cromosoma Y hallados en la península Ibérica y en el Magreb. Así, el linaje E3a* se caracteriza por contener los estados derivados de los poli b morfismos M42, M168, YAP, SRY4064, P2 y M2, que se han sucedido en este orden desde el an tepasado común de todos los cromosomas Y existentes (indicado con un pequeño trazo en el extremo superior izquierdo del árbol). Además, se definen grupos de linajes o haplogrupos, designados con una sola letra, de la A a la R; por ejemplo, el haplogrupo E contiene todos los linajes que presenten el estado derivado del polimorfismo SRY4064. Alineados en la base del árbol se muestran los haplogrupos representados en ambas regiones estudiadas.
N UEVA GENÉTICA
SRY 10832.2
*
P25
M18 1 M37 2 M65 4M73
5M126 M153 6 7M160
SRY2627
8
R1a1* R1b* R1b3 R1b6 R1b8
95
E P N A R T R E B E M U A J Y S A M O C . D , N U A Z E L Z E R E P . A , A Z A L P . S , L L E F A L A C . F , H C S O B . E
Magreb
Península Ibérica
T I T
Conclusiones
E P N A R T R E B E M U A J Y S A M O C . D , N U A Z E L Z E R E P . A , A Z A L P . S , L L E F A L A C . F , H C S O B . E
La historia nos recuerda las intensas relaciones culturales y sociales que han existido, a lo largo de los siglos, (a) entre el Magreb y la península Ibérica (España y Portugal). Elites o pueblo llano, mercaderes o guerreros, portaban una lengua, una religión, una cultura, en definitiva. Pero hasta ahora se nos mostraba esquivo el impacto demográfico ejercido por esos flujos, que los datos genéticos nos muestran existente pero moderado. Y todavía (b) se debaten los movimientos relacionados con la expansión islámica. Los datos genéticos, con sus limitaciones, han permitido trazar un primer marco comparativo entre ambas orillas del Mediterráneo, con la reconstrucción consiguiente de la historia e intercambios mutuos de sus poblaciones. La genética aporta el marco de la historia demográfica, en cuyo interior hemos de identificar las prue(c) bas de intercambios suministradas por otras disciplinas. Los cambios y sustituciones en el credo religioso, en la lengua o en los perfiles de las excavaciones arqueológicas nos hablan de interrelaciones 3. HISTORIA DE LA POBLACION y linajes del cromosoma Y en el Magreb y la península y desplazamiento culturales. El alIbérica. (a ) La primera colonización del Paleolítico se da independientemente en ambas cance demográfico de los procesos regiones; introduce en el Magreb (verde ) los linajes E3b*, E3b1* y E3b2*; en la península demográficos asociados a esas transIbérica (rojo ), los linajes R1a1*, R1b* (que ulteriormente dio lugar a R1b8), R1b3 y R1b6. formaciones culturales hallan un En los diagramas de sectores se muestra la frecuencia de dichos linajes en cada pobla- correlato genético, cuya magnitud se ción. (b ) La expansión del Neolítico, desde el Creciente Fértil y en paralelo por ambas ri- va desentrañando merced al avance beras del Mediterráneo, aporta los linajes F*, J*, J2*, I* e I1b2* (azul ). (c ) Los fenómenos en el conocimiento del genoma. Es migratorios implican flujo génico desde la península hacia el Magreb (en rojo ), en senti- una de las múltiples sorpresas que la biología actual nos depara. do contrario (verde ), y desde más allá del Sahara hacia el Magreb (malva ).
mos descubrir el conjunto acumulado de los intercambios genéticos. Como hemos comentado, el linaje E3b2* del cromosoma Y se originó en el Magreb, donde constituye unos dos tercios del total. En España y Portugal, su frecuencia se estima alrededor del 6 %, con mínimos en el País Vasco y Cataluña y máximos en Extremadura y Andalucía occidental. Dado que el flujo génico del Magreb hacia la Península acarrearía otros linajes, subestimaríamos la contribución genética magrebí de la Península si sólo consideráramos E3b2*; corrigiendo a tenor de la frecuencia de E3b2* respecto al total de linajes del cromosoma Y, la contribución norteafricana al acervo genético ibérico se puede estimar en un 8 %. Al estudiar la variación de microsatélites dentro de este linaje, se observa una estrecha similaridad entre los haplotipos ibéricos y los magrebíes. La variación observada en haplotipos peninsulares pudo haberse acumulado en un intervalo temporal que la hace compatible con 96
las entradas del siglo VIII y, sobre todo, con las del siglo XII . Por lo que respecta al ADN mitocondrial, encontramos un equivalente de E3b2* en U6, de origen magrebí, aunque menos frecuente. Se halla en un 10 % de los magrebíes y en un 1,5 % de los habitantes de nuestra península. La ausencia de linajes maternos específicamente norteafricanos a frecuencias moderadas o elevadas dificulta la estimación de la contribución femenina magrebí a la península; aunque existe, obviamente. En un sentido inverso, los cromosomas Y del grupo R1b que hay en el Magreb pueden ser de origen europeo, si bien no podemos precisar que fuera específicamente ibérico. Su frecuencia, del 2,8 % en norteafricanos, alcanza el 78,4 % en ibéricos; ello supone una contribución europea del 3,6 % al acervo genético magrebí. Por lo que respecta al ADN mitocondrial, el linaje V, de origen europeo, se encuentra en una frecuencia del 6,8 % en norteafricanos.
BIBLIOGRAFIA COMPLEMENTARIA GENETIC STRUCTURE OF NORTHWESTERN AFRICA REVEALED BY STR ANALYSIS . E. Bosch, F. Calafell, A. Pérez-Lezaun, J. Clarimon, D. Comas, E. Mateu, R. Martínez, B. Morera, Z. Brakez, O. Akhayat, A. Sefrani, G. Hariti, A. Cambon-Thomsen y J. Bertranpetit en European Journal of Human Genetics, n.o 8, págs. 360-366; 2000. ALU INSERTION POLYMORPHISMS IN NW A F RI CA AN D T HE IBERIAN PENINSULA: EVIDENCE FOR A STRONG GENETIC BOUNDARY THROUGH THE GIBRALTAR STRAITS. D. Comas, F. Calafell, N. Benchemsi, A. Helal, G. Lefranch, M. Stoneking, M. A. Batzer, J. Bertranpetit y A. Sajantila en Human Genetics, n.o 107, páginas 312-319; 2000. HIGH RESOLUTION ANALYSIS OF HUMAN Y-C HROMOSOME VARIATION SHOWS A S HARP D ISCONTINUITY AND L IMITED GENE FLOW BETWEEN NORTHWESTERN A F RI CA A ND T HE IBERIAN PENINSULA. E. Bosch, F. Calafell, D. Comas, P. J. Oefner, P. A. Underhill y J. Bertranpetit en American Journal of Human Genetics, n.o 68, págs. 1019-1029; 2001.
TEMAS 38