GENOMA Y PROTEOMA
Monografía elaborado por : Loayza Pichardo Xiomara Miranda Roca Guisel Laura Bonifacio Jorge Balbín Mejía arem Gamarra Puchoc Guadalupe !urso de Bio"uímica
HUANCAYO,
DEDICATORIA
Agradecemos a Dios porque de él siempre sentimos esa fuerza interior interior que nos motivó a seguir adelante apartando las espinas de nuestro sendero para culminar con éxito lo que nos propusimos A nuestros padres porque en ellos encontramos la fortaleza ! protección necesaria necesaria para para transcurri transcurrirr el camino de la vida con valores ! aspiraciones aspiraciones para encontrar el éxito éxito en nuestro presente ! futuro A nuestra profesora porque de ella adquirimos todos los conocimientos necesarios para poder realizar esta monograf"a
DEDICATORIA
Agradecemos a Dios porque de él siempre sentimos esa fuerza interior interior que nos motivó a seguir adelante apartando las espinas de nuestro sendero para culminar con éxito lo que nos propusimos A nuestros padres porque en ellos encontramos la fortaleza ! protección necesaria necesaria para para transcurri transcurrirr el camino de la vida con valores ! aspiraciones aspiraciones para encontrar el éxito éxito en nuestro presente ! futuro A nuestra profesora porque de ella adquirimos todos los conocimientos necesarios para poder realizar esta monograf"a
indice
#$%R&'(!!#&$
La genética molecular y los diversos aspectos derivados (clonación, investigación con células madre) es una de las áreas de investigación más emergentes en los últimos años. No obstante es bastante amplio el desconocimiento real sobre su significado y, sobre todo, de las verdaderas posibilidades de dico campo de investigación. !l presente traba"o supone una puesta al d#a sobre genética general, genética molecular y sobre los diversos aspectos de la clonación y de las posibilidades futuras $ue de todo ello se deriva. %simismo tampoco debemos ser en la actualidad desmesuradamente optimistas en relación al estado actual de las investigaciones en este campo. &ueda todav#a muco $ue recorrer (y mucos años de investigación) para poder iniciar si$uiera la terapéutica y la curación de enfermedades $ue se derivarán de dicos estudios. 'ara apoyar las posibles aplicaciones futuras de la genética molecular describiré algunas enfermedades de origen parcial o totalmente genético y epondré las aplicaciones terapéuticas $ue algún d#a podrán resolver dicas alteraciones. !stas enfermedades citadas anteriormente son el autismo y la enfermedad de untington.
)#*%&R#+ ', L+ G,$,%#!+
-. GR,G&R M,$',L
!l núcleo de sus traba"os le permitió descubrir las tres leyes de la erencia o leyes de *endel, gracias a las cuales es posible describir los mecanismos de la erencia y $ue fueron eplicadas con posterioridad por el padre de la genética eperimental moderna, el biólogo estadounidense +omas unt *organ (-/ 012). !stas tres leyes son3 1. PRIMERA LEY:
4uando se cru5an dos variedades puras de una misma especie, los descendientes serán todos iguales y pueden parecerse a alguno de sus progenitores. 2. SEGUNDA LEY:
%l cru5ar entre s# los #bridos de la segunda generación, los descendientes se dividen en cuatro grupos, de los cuales uno se parece a su abuela, otro a su abuelo y las otras dos restantes a sus progenitores.
3. TERCERA LEY:
4oncluye diciendo $ue si se cru5an ra5as distintas en uno o más alelos (cada una de las modificaciones de un gen producidas por mutación), estos son independientes o ligados y siguen las dos primeras leyes de *endel. 4ada uno de los caracteres ereditarios se transmite al i"o con total independencia de los restantes. !n el cuadro $ue tenemos a continuación se puede observar la descendencia de cru5ar dos semillas iguales (amarillas y lisas).
/ +(00R+1 !harles. 2,L G,$&M+ )(M+$&34 566-
%l observar el resultado de sus eperimentos, *endel pudo deducir $ue si se cru5an dos ra5as diferentes al menos en dos caracteres, se pueden crear nuevas ra5as estables (combinaciones nuevas omocigóticas).
-.5 R&*+L#$' 0R+$L#$
!n 026, la revista británica Nature publica un art#culo elaborado por cuatro cient#ficos notables3 7rancis 4ric8, 9ames :. ;atson, *aurice ;il8ins y 5 +P+R#*# M#R+LL,*4 7ngela 8 /99
-.; J+M,* <+%*&$ 1 0R+$!#* !R#! .3.1 !AMES "ATSON
7ue uno de los mayores impulsores del proyecto ?enoma umano $ue representa un importante avance para la curación de enfermedades de origen genético. @us traba"os se basan mayormente en el estudio del %=N, campo en el $ue colaboró con 4ric8 en el descubrimiento de la estructura de la doble élice del %=N y en el estudio de la replicación de éste. 4uando volvió a estados Anidos, colaboró en traba"os $ue le permitieron descifrar el código genético y descubrir la presencia del %
@e especiali5ó en el estudio de los genes y desarrolló un método para saber si una imagen de rayos B remit#a a una estructura elicoidal. 9unto con 9ames ;atson se especiali5ó en el estudio del %=N. 4onsiguieron sentar las bases de diversos estudios posteriores al conocer el modo en el $ue se replican los genes, además de confirmar $ue son portadores de información. 9untos descubrieron el principio molecular de doble élice para el %=N. 4onsiguió el 'remio Nobel. Luego sus investigaciones siguieron encaminadas acia el estudio de los ácidos nucleicos relacionados con el código de la erencia.
.3.3 EL MODELO DE "ATSON Y CRAC$
!n 026, ;atson y 4ric8 propusieron el modelo $ue establece las bases de la molécula responsable de contener toda la información genética de cual$uier se r vivo, esto es una estructura tridimensional llamada ácido desoirribonucleico (%=N). La doble élice propuesta por 9ames ;atson y 7rancis 4ric8, permitió dar la respuesta a los interrogantes $ue de la estructura y los mecanismos de la erencia.
=escubrieron $ue el %=N está formado por unidades $u#micas, llamadas nucleótidos, formados por cuatro bases nitrogenadas distintas, las cuales son, %denina (%), ?uanina (?), 4itosina (4) y +imina (+), por un a5úcar (ribosa o desoirribosa) y por una molécula de ácido fosfórico. Las bases nitrogenadas se alinean para luego "untarse con la otra cadena igual para formar la doble élice (% se "unta con + y ? con 4). !s muca la importancia del orden de los nucleótidos ya $ue determina las prote#nas, responsables de la estructura y funcionamiento de cada célula de todos y cada uno de los seres vivos de este planeta. 4uando estas dos cadenas se separan, cada una sirve como molde para la construcción de una complementariaC as#, una molécula de %=N dividida puede formar dos de su mismo tipo. ?racias a esta duplicación de las moléculas de %=N se puede transmitir la información genética a los siguientes descendentes, y as# sucesivamente. 'ara poder definir el modelo se apoyaron en gran parte en los rayos B $ue ab#a obtenido
L+ G,$=%#!+ : +'$ 1 +R$
',0#$#!#&$ 1 ,*%R(!%(R+ ',L +'$: ; Rafael &li>a ?irgili4 Jos@ Manuel ?idal %aboada 8 566A
La molécula de %=N (ácido desoirribonucleico) está formada por dos largas cadenas de nucleótidos (compuestos formados por una base nitrogenada, un a5úcar y un fosfato y forman los ácidos nucleicos) unida entre s# formando una doble élice. !stas dos cadenas de nucleótidos, $ue forman una molécula de %=N, $uedan unidas entre s#, gracias a los enlaces $ue se forman entre las bases nitrogenadas (%, ?, +, 4) de ambas cadenas $ue $uedan enfrentadas . La unión se reali5a mediante puentes de idrógeno (se forman cuando un átomo de idrógeno se encuentra entre dos átomos más electronegativos, estableciendo un v#nculo entre ellos). D está condicionado $u#micamente de forma $ue la %denina sólo se puede unir con la +imina, y la ?uanina sólo con la 4itosina. La estructura de un %=N está definida por la EsecuenciaE de las bases nitrogenadas, estando precisamente en esta secuencia de bases nitrogenadas la información genética del %=N. An cierto número de secuencias de bases nitrogenadas constituirán los distintos genes $ue regirán la formación de prote#nas y otras actividades estructurales y en5imáticas necesarias para la vida. !l orden en el $ue aparecen las cuatro bases es muy importante para la célula ya $ue es el $ue constituye las instrucciones del programa genético de cada organismo. 1
;.5R,PL#!+!#$ ',L +'$
- +(00R+1 !harles. 2,L G,$&M+ )(M+$&: (na eCplicaciDn para comprender.3 566-.
!s la capacidad $ue tiene el %=N de acer copias o réplicas de su molécula. !ste proceso es imprescindible para la transferencia de la información genética de generación en generación. !l procedimiento $ue se sigue es el siguiente3 la doble élice se separa y cada una de las cadenas sirve de molde para la creación de una nueva cadena complementaria. !l resultado final de este proceso son dos moléculas idénticas a la original.2
;.; ',0#$#!#$ 1 ,*%R(!%(R+ ',L +R$
!l %
'articipa en el transporte de la información de una cadena del %=N, desde el núcleo, para generar una cadena de %
+R$ ribosDmico E+R$rF: Rafael &li>a ?irgili4 Jos@ Manuel ?idal %aboada. G,$&M+ )(M+$& 8 566A
'articipa en la constitución de unos orgánulos citoplasmáticos (ribosomas) y en el paso de la información del %
+R$ de Hransferencia E+R$HF
'articipa en el transporte de aminoácidos $ue corresponden a los diversos nucleótidos según el código genético, incorporándolos en el orden correcto. Ana mala lectura o un error en la serie de nucleótidos es lo $ue origina las mutaciones. La secuencia de aminoácidos constituirán las prote#nas. Los tres tipos de %
,L G,$&M+ )(M+$& A Jean 0ranIois MaHHei 8 5665
!l genoma umano es toda la información $ue cada individuo tiene almacenado en el %=N de las células. 4ada persona es diferente respecto a las demás y cada una tiene su propio genoma, el cual tiene una gran similitud (00,-H) respecto a los de su propia especie y tan solo se diferencia en el del cimpancé en un H. !l genoma es el $ue nos ace ser únicos e independientes de todos los demás. 4ontiene las instrucciones $ue caracteri5an el aspecto f#sico de cada persona y, en gran parte, las psicológicas e intelectuales. %ctualmente se a conseguido descifrar el 00H de este código, gracias a dos grandes empresasC una pública ('royecto ?enoma umano, subvencionada con fondos públicos de diversos pa#ses), y otra privada (4elera ?enomics, @an 7rancisco). !l genoma umano es el genoma del omo sapiens, es decir, la secuencia de %=N contenida en >6 pares de cromosomas en el núcleo de cada célula umana diploide. =e los >6 pares, >> son cromosomas autosómicos y un par determinante del seo (dos cromosomas B en mu"eres y uno B y uno D en ombres). !l genoma aploide (es decir, con una sola representación de cada par) tiene una longitud total aproimada de 6>II millones de pares de bases de %=N (6>II *b) $ue contienen unos >I.III/>2.III genesJK (las estimaciones más recientes apuntan a unos >I.2II). =e las 6>II *b unas >02I *b corresponden a eucromatina y unas >2I *b a eterocromatina. !l 'royecto ?enoma umano produ"o una secuencia de referencia del genoma umano eucromático, usado en todo el mundo en las ciencias biomédicas. La secuencia de %=N $ue conforma el genoma umano contiene codificada la información necesaria para la epresión, altamente coordinada y adaptable al ambiente, del proteoma umano, es decir, del con"unto de las prote#nas del ser umano. Las prote#nas, y no el %=N, son las principales biomoléculas efectorasC poseen funciones estructurales, en5imáticas, metabólicas, reguladoras, señali5adoras, organi5ándose en enormes redes funcionales de interacciones. !n definitiva, el proteoma fundamenta la particular morfolog#a y funcionalidad de cada célula. %simismo, la organi5ación estructural y funcional de las distintas células conforma cada te"ido y cada órgano, y, finalmente, el organismo vivo en su con"unto. %s#, el genoma umano contiene la información básica necesaria para el desarrollo f#sico de un ser umano completo. !l genoma umano presenta una densidad de genes muy inferior a la $ue inicialmente se ab#a predico, con sólo en torno al ,2H JK de su longitud compuesta por eones codificantes de prote#nas. An IH está compuesto por %=N etragénico y un 6I H por secuencias relacionadas con genes. =el total de %=N etragénico, aproimadamente un IH corresponde a repeticiones dispersas, de manera $ue,
más o menos, la mitad del genoma umano corresponde a secuencias repetitivas de %=N. 'or su parte, del total de %=N relacionado con genes se estima $ue el 02H corresponde a %=N no codificante3 pseudogenes, fragmentos de genes, intrones o secuencias A+<, entre otros. !n el genoma umano se detectan más de >-I.III elementos reguladores, aproimadamente un total de *b de secuencia, $ue se originaron por medio de inserciones de elementos móviles. !stas regiones reguladoras se conservan en elementos no eónicos (4N!!s), fueron nombrados como3 @FN!, LFN!, L+<. @e sabe $ue al menos entre un H y un >IH de estas secuencias reguladoras de genes, y $ue están conservados entre especies, fue formado por elementos móviles.
4ontenido en genes y tamaño del genoma de varios organismo del Número de genes
!specie
+amaño genoma (*b)
4andidatus 4arsonella ruddii
I,2
->
@treptococcus pneumoniae
>,>
>6II
!scericia coli
1,
1.1II
@accaromyces cerevisiae
>
2.-II
4aenorabditis elegans
0
0.III
%rabidopsis taliana
>2
>2.2II
=rosopila melanogaster (mosca)
-I
6.II
Mry5a sativa (arro5)
1
12/22.III
*us musculus (ratón)
>2II
>0.III
omo sapiens (ser umano)
>0II
>.III
COMPONENTES: Cromosomas
!l genoma umano (como el de cual$uier organismo eucariota) está formado por cromosomas, $ue son largas secuencias continuas de %=N altamente organi5adas espacialmente (con ayuda de prote#nas istónicas y no istónicas) para adoptar una forma ultra condensada en metafase. @on observables con microscop#a óptica
convencional o de fluorescencia mediante técnicas de citogenética y se ordenan formando un cariotipo.
!l cariotipo umano normal contiene un total de >6 pares de cromosomas distintos3 >> pares de autosomas más par de cromosomas seuales $ue determinan el seo del individuo. Los cromosomas />> fueron numerados en orden decreciente de tamaño en base al cariotipo. @in embargo, posteriormente pudo comprobarse $ue el cromosoma >> es en realidad mayor $ue el >.
Las células somáticas de un organismo poseen en su núcleo un total de 1 cromosomas (>6 pares)3 una dotación de >> autosomas procedentes de cada progenitor y un par de cromosomas seuales, un cromosoma B de la madre y un B o un D del padre. Los gametos /óvulos y espermato5oides/ poseen una dotación aploide de >6 cromosomas.
4romosoma > 6 1 2 0 I >
?enes 1.>>I .10 .22I 11 I0 >.>- >.62 .I .0>I .06 60 .16I
Número de bases >1.00.0 >1>.2.10 00.11.-> 0.>6.I6 -I.-6.- I.-0.006 2-.->.1>1 1.>1.-> 1I.11>.>062.61.6 61.12>.6-1 6>.>-0.261
:ases secuenciadas >>1.000.0 >6.>.10 01.I1.-> -.>0.I6 .I>. .>6.006 21.02>.1>1 1>.>.-> >I.6>.>06.>1.6 6.6I.-26 6I.6I6.261
4romosoma 6 1 2 0 >I > >> B (cromosoma seual) D (cromosoma seual) +otal
?enes 0>1 .61 0> 0I0 .> 20 .222 .II2.I0> .-1 121 6>.-2
Número de bases 1.>.0-I I.6I.2-2 II.66-.02 --.->>.>21 -.21.1> ..26 6.-I.2 >.162.02 1.011.6>6 10.2>-.026 21.06.21 2.1.2> 6.I0.-16.1
:ases secuenciadas 02.220.0-I --.>0I.2-2 -.61.02 -.--1.21 .-II.>>I 1.2.22 22.-2.2 20.2I2.>21 61..0061.-06.026 2.I2-.21 >2.>.2> >.-2.0-.2I
ADN intragénico Genes
An gen es la unidad básica de la erencia, y porta la información genética necesaria para la s#ntesis de una prote#na (genes codificantes) o de un %I.III y >2.III genes codificantes de prote#nas, estimación muy inferior a las predicciones iniciales $ue ablaban de unos II.III genes o más. !sto implica $ue el genoma umano tiene menos del doble de genes $ue organismos eucariotas muco más simples, como la mosca de la fruta o el nematodo 4aenorabditis elegans. @in embargo, las células umanas recurren ampliamente al splicing ( ayuste) alternativo para producir varias prote#nas distintas a partir de un mismo gen, como consecuencia de lo cual el proteoma umano es más amplio $ue el de otros organismos muco más simples. !n la práctica, el genoma tan sólo porta la información necesaria para una epresión perfectamente coordinada y regulada del con"unto de prote#nas $ue conforman el proteoma, siendo éste el encargado de e"ecutar la mayor parte de las funciones celulares. 4on base en los resultados iniciales arro"ados por el proyecto !N4M=!JK (acrónimo de !nciclopedia Mf =N% !lements), algunos autores an propuesto redefinir el concepto actual de gen. Las observaciones más recientes acen dif#cilmente sostenible la visión tradicional de un gen, como una secuencia formada por las regiones A+
estimaciones iniciales, y algunas de estas secuencias se sitúan en regiones muy ale"adas de la traducida, por lo $ue los A+< 2 pueden abarcar secuencias largas dificultando la delimitación del gen. 'or otro lado, un mismo transcrito puede dar lugar a %
%demás de los genes codificantes de prote#nas, el genoma umano contiene varios miles de genes %I/6IH de los genes del genoma umano puede estar regulado por el mecanismo de interferencia por mi%
% continuación se muestran algunos valores promedio del genoma umano. 4abe advertir, sin embargo, $ue la enorme eterogeneidad $ue presentan estas variables ace poco representativos a los valores promedio, aun$ue tienen valor orientativo.
La densidad media de genes es de gen cada II 8b, con un tamaño medio de >I/ 6I 8b, y un número de eones promedio de /- por cada gen, con un tamaño medio de 2I nucleótidos. !l tamaño medio de un %,> 8b, incluyendo las regiones A+< (regiones no traducidas flan$ueantes), siendo la longitud media de la región codificante de ,1 8b.
Fsocoros. 7recuencia y ri$ue5a en ?O4 y genes, en el genoma umano.
!l genoma umano se caracteri5a por presentar una gran eterogeneidad en su secuencia. !n particular, la ri$ue5a en bases de guanina (?) y citosina (4) frente a las de adenina (%) y timina (+) se distribuye eterogéneamente, con regiones muy ricas en ?O4 flan$ueadas por regiones muy pobres, siendo el contenido medio de ?O4 del 1H, menor al teóricamente esperado (2IH). =ica eterogeneidad esta correlacionada con la ri$ue5a en genes, de manera $ue los genes tienden a concentrarse en las regiones más ricas en ?O4. !ste eco era conocido ya desde ace años gracias a la separación mediante centrifugación en gradiente de densidad de regiones ricas en ?O4 ($ue recibieron el nombre de isócoros C del inglés ig) y regiones ricas en %O+ Secuencias reguladoras
!l genoma tiene diversos sistemas de regulación de la epresión génica, basados en la regulación de la unión de factores de transcripción a las secuencias promotoras, en mecanismos de modificación epigenética (metilación del %=N o metilación/acetilación de istonas) o en el control de la accesibilidad a los promotores determinada por el grado de condensación de la cromatinaC todos ellos muy interrelacionados. %demás ay otros sistemas de regulación a nivel del procesamiento, estabilidad y traducción del %
reguladoras se basa en parte en la bús$ueda de regiones no codificantes evolutivamente conservadas. JK 'or e"emplo, la divergencia evolutiva entre el ratón y el ser umano ocurrió ace I/0I millones de años. JK *ediante estudios de genómica comparada, alineando secuencias de ambos genomas pueden identificarse regiones con alto grado de coincidencia, mucas correspondientes a genes y otras a secuencias no codificantes de prote#nas pero de gran importancia funcional, dado $ue an estado sometidas a presión selectiva. Elementos ultra conserados
II pares de bases totalmente conservados (IIH de coincidencia) entre los genomas de umano, ratón y rata, y casi totalmente conservados en perro (00H) y pollo (02H).JK Pseudogenes
!n el genoma umano se an encontrado asimismo unos 0.III pseudogenes, $ue son versiones completas o parciales de genes $ue an acumulado diversas mutaciones y $ue generalmente no se transcriben. @e clasifican en pseudogenes no procesados (P6IH) y pseudogenes procesados (PIH) JK •
•
Los pseudogenes no procesados son copias de genes generalmente originadas por duplicación, $ue no se transcriben por carecer de una secuencia promotora y aber acumulado múltiples mutaciones, algunas de las cuales sin sentido (lo $ue origina codones de parada prematuros). @e caracteri5an por poseer tanto eones como intrones. Los pseudogenes procesados, por el contrario, son copias de %
+'$ inHerg@nico
Las regiones intergénicas o etragénicas comprenden la mayor parte de la secuencia del genoma umano, y su función es generalmente desconocida. :uena parte de estas regiones está compuesta por elementos repetitivos, clasificables como repeticiones en tándem o repeticiones dispersas, aun$ue el resto de la secuencia no responde a un patrón definido y clasificable. ?ran parte del %=N intergénico puede ser un artefacto evolutivo sin una función determinada en el genoma actual, por lo $ue tradicionalmente estas regiones an sido denominadas %=N EbasuraE (9un8 =N%), denominación $ue incluye también las secuencias
intrónicas y pseudogenes. No obstante, esta denominación no es la más acertada dado el papel regulador conocido de mucas de estas secuencias. %demás el notable grado de conservación evolutiva de algunas de estas secuencias parece indicar $ue poseen otras funciones esenciales aún desconocidas o poco conocidas. 'or lo tanto, algunos prefieren denominarlo E%=N no codificanteE (aun$ue el llamado E%=N basuraE incluye también transposones codificantes) o E%=N repetitivoE. %lgunas de estas regiones constituyen en realidad genes precursores para la s#ntesis te micro%
@on repeticiones $ue se ordenan de manera consecutiva, de modo $ue secuencias idénticas, o casi, se disponen unas detrás de otras. Satélites
!l con"unto de repeticiones en tándem de tipo satélite comprende un total de >2I *b del genoma umano. @on secuencias de entre 2 y varios cientos de nucleótidos $ue se repiten en tándem miles de veces generando regiones repetidas con tamaños $ue oscilan entre II 8b (II.III nucleótidos) asta varias megas bases. nucleótidos. @ituado en los centrómeros de los cromosomas 6 y 1 y el bra5o corto de los cromosomas acrocéntricos (en posición distal respecto al clúster codificante de %
>. Satélite $3 la secuencia básica es %++44%++4?. 'resente en las proimidades de los centrómeros de los cromosomas > y I, y en la constricción secundaria de y . 6. Satélite %: la secuencia básica es %++44. 'resente en la constricción secundaria de los cromosomas 0 e D, y en posición proimal respecto al clúster de %=Nr del bra5o corto de los cromosomas acrocéntricos. 1. Satélite al&a: secuencia básica de nucleótidos. 7orma parte del %=N de los centrómeros cromosómicos. 2. Satélite beta: secuencia básica de - nucleótidos. %parece en torno al centrómero en los cromosomas acrocéntricos y en la constricción secundaria del cromosoma . . Satélite gamma: secuencia básica de >>I nucleótidos. 'róimo al centrómero de los cromosomas - y B. Mini satélites
!stán compuestas por una unidad básica de secuencia de />2 JK nucleótidos $ue se repite en tándem generando secuencias de entre II y >I.III pares de bases. @e estima $ue el genoma umano contiene unos 6I.III mini satélites. =iversos estudios an relacionado los mini satélites con procesos de regulación de la epresión génica. %simismo, se an asociado con puntos de fragilidad cromosómica dado $ue se sitúan próimos a lugares preferentes de rotura cromosómica, translocación genética y recombinación meiótica. 'or último, algunos mini satélites umanos (/IH) son impermutables, presentando una tasa media de mutación entre el I.2H y el >IH en las células de la l#nea germinal, siendo as# las regiones más inestables del genoma umano conocidas asta la feca. !n el genoma umano, aproimadamente el 0IH de los mini satélites se sitúan en los telómeros de los cromosomas. La secuencia básica de seis nucleótidos ++%??? se repite miles de veces en tándem, generando regiones de 2/>I 8b $ue conforman los telómeros. %lgunos mini satélites por su gran inestabilidad presentan una notable variabilidad entre individuos distintos. @e consideran polimorfismos multialélicos, dado $ue pueden presentarse en un número de repeticiones muy variable, y se denominan QN+<. @on marcadores muy utili5ados en genética forense, ya $ue permiten establecer una uella genética caracter#stica de cada individuo, y son identificables mediante ibridación. Micros satélites
!stán compuestos por secuencias básicas de >/1 nucleótidos, cuya repetición en tándem origina frecuentemente secuencias de menos de 2I nucleótidos. %lgunos e"emplos importantes son el di nucleótido 4% y el trinucleótido 4%?.
Los micro satélites son también polimorfismos multialélicos, denominados @+< y pueden identificarse mediante '4<, de modo rápido y sencillo. @e estima $ue el genoma umano contiene unos >II.III micro satélites, $ue se distribuyen más o menos omogéneamente, al contrario $ue los mini satélites, lo $ue los ace más informativos como marcadores. ADN re!etido dis!erso
@on secuencias de %=N $ue se repiten de modo disperso por todo el genoma, constituyendo el 12H del genoma umano. Los elementos cuantitativamente más importantes son los LFN!@ y @FN!@, $ue se distinguen por el tamaño de la unidad repetida. !stas secuencias tienen la potencialidad de auto propagarse al transcribirse a una %II neonatos portan una inserción nueva de un %lu o un L, $ue pueden resultar patogénicos por muta génesis insercional, por desregulación de la epresión de genes próimos (por los propios promotores de los @FN! y LFN!) o por recombinación ileg#tima entre dos copias idénticas de distinta locali5ación cromosómica (recombinación intra o intercromosómica), especialmente entre elementos %lu. 7recuencias y tipos de repeticiones dispersas en el genoma de varios organismos JK +ipo repetición
omo sapiens
=rosopila melanogaster
4aenorabditis elegans
%rabidopsis taliana
LFN!,@FN!
66,1H
I,H
I,1H
I,2H
L+
-,H
,2H
IH
1,-H
+ransposones %=N
>,-H
I,H
2,6H
2,H
+otal
11,1H
6,H
,2H
I,1H
S'NE
!lementos nucleares dispersos cortos. @on secuencias cortas, generalmente de unos pocos cientos de bases, $ue aparecen repetidas miles de veces en el genoma umano. @uponen el 6H del genoma umano, JK un IH debido eclusivamente a la familia de elementos %lu (caracter#stica de primates). ('NE
Los elementos %lu son secuencias de >2I/>-I nucleótidos presentes en .2II.IIIJIK de copias dispersas por todo el genoma. !structuralmente son d#meros casi idénticos, ecepto $ue la segunda unidad contiene un inserto de 6> nucleótidos, siendo mayor $ue la primera. !n cuanto a su secuencia, tienen una considerable ri$ue5a en ?O4 (2H),JK por lo $ue predominan en las bandas <, y ambos
monómeros presentan una cola poli % (secuencia de adeninas) vestigio de su origen de %IH del genoma umano, contiene unos II.III/2II.III copias de retrotransposones L $ue es la familia de mayor importancia cuantitativa, es una secuencia de 8b repetida unas -II.III veces de modo disperso por todo el genoma, aun$ue la gran mayor#a de las copias es incompleta al presentar el etremo 2 truncado por una retro transcripción incompleta. %s#, se estima $ue ay unas 2.III copias completas de L, sólo 0I de las cuales son activas, JK estando el resto inibidas por metilación de su promotor. @u ri$ue5a en ?O4 es del 1>H, próima a la media del genoma (1H) y se locali5an preferentemente en las bandas ? de los cromosomas. 'oseen además un promotor de la %. !n5ima con actividad retro transcriptasa y endonucleasa3 codificada por el M<7>. %mbas prote#nas son necesarias para la retro transposición. !stos elementos móviles están flan$ueados por > regiones no codificantes, denominados como 2TA+< y 6TA+<. 'or lo tanto, se consideran retrotransopsones autónomos, ya $ue codifican las prote#nas $ue necesitan para propagarse. La %
@e a visto $ue la inserción aleatoria de L activos en el genoma umano a dado lugar a enfermedades genéticas, ya $ue interfiere en la epresión normal. +ambién se observa una predilección de L por regiones ricas en %+. )ER*
), $ue supone en torno al H de los !
:a"o la denominación de transposones a veces se incluyen los retrotransposones, tales como los pseudogenes procesados, los @FN!@ y los LFN!@. !n tal caso se abla de transposones de clase F para acer referencia a los retrotransposones, y de clase FF para referirse a transposones de %=N, a los $ue se dedica el presente apartado. Los transposones de %=N completos poseen la potencialidad de auto propagarse sin un intermediario de %
patogénica por la generación de reordenaciones cromosómicas los elementos mariner, as# como las familias *!< y *!<>. *ariabilidad
@i bien dos seres umanos del mismo seo comparten un porcenta"e elevad#simo (en torno al 00,0H) de su secuencia de %=N, lo $ue nos permite traba"ar con una única secuencia de referencia, pe$ueñas variaciones genómicas fundamentan buena parte de la variabilidad fenot#pica interindividual. Ana variación en el genoma, por sustitución, de lesión o inserción, se denomina polimorfismo o alelo genético. No todo polimorfismo genético provoca una alteración en la secuencia de una prote#na o de su nivel de epresión, es decir, mucos son silenciosos y carecen de epresión fenot#pica. SNPs
La principal fuente de variabilidad en los genomas de dos seres umanos procede de las variaciones en un sólo nucleótido, conocidas como @N's, en las cuales se an centrado la mayor parte de los estudios. =ada su importancia, en la actualidad eiste un proyecto internacional ( Fnternational ap*ap 'ro"ect) para catalogar a gran escala los @N's del genoma umano. !n este conteto, la denominación de @N' frecuentemente se restringe a a$uellos polimorfismos de un sólo nucleótido en los $ue el alelo menos frecuente aparece en al menos el H de la población. Los @N' son marcadores tetralélicos, dado $ue en teor#a en una posición puede aber cuatro nucleótidos distintos, cada uno de los cuales identificar#a un aleloC sin embargo, en la práctica suelen presentar sólo dos alelos en la población. @e estima $ue la frecuencia de @N's en el genoma umano es de un @N' cada 2II/II pares de bases, de los $ue una parte relevante son polimorfismos codificantes, $ue causan la sustitución de un aminoácido por otro en una prote#na. ?racias a su abundancia y a $ue presentan una distribución aproimadamente uniforme en el genoma, an tenido gran utilidad como marcadores para los mapas de ligamiento, erramienta fundamental del 'royecto ?enoma umano. %demás son fácilmente detectables a gran escala mediante el empleo de cips de %=N *ariación estructural
!ste tipo de variaciones se refiere a duplicaciones, inversiones, inserciones o variantes en el número de copias de segmentos grandes del genoma (por lo general de III nucleótidos o más). !stas variantes implican a una gran proporción del genoma, por lo $ue se piensa $ue son, al menos, tan importantes como los @N's. Qariación estructural es el término general para abarcar un grupo de alteraciones genómicas $ue implican segmentos de %=N mayores de Vb. La variación estructural puede ser cuantitativa (variante en número de copia, $ue comprende3 deleciones, inserciones y duplicaciones), posicional (translocaciones) y orientacional (inversiones).
% pesar de $ue este campo de estudio es relativamente nuevo (los primeros estudios a gran escala se publicaron en los años >II1 y >II2), a tenido un gran auge, asta el punto de $ue se a creado un nuevo proyecto para estudiar este tipo de variantes en los mismos individuos en los $ue se basó el 'royecto ap*ap. %un$ue aún $uedan dudas acerca de las causas de este tipo de variantes, cada ve5 eiste más evidencia a favor de $ue es un fenómeno recurrente $ue todav#a continua moldeando y creando nuevas variantes del genoma. !ste tipo de variaciones an potenciado la idea de $ue el genoma umano no es una entidad estática, sino $ue se encuentra en constante cambio y evolución.
Eolución
Los estudios de genómica comparada se basan en comparación de secuencias genómicas a gran escala, generalmente mediante erramientas bioinformáticas. =icos estudios permiten aondar en el conocimiento de aspectos evolutivos de escala temporal y espacial muy diversa, desde el estudio de la evolución de los primeros seres vivos ace miles de millones de años o las radiaciones filogenéticas en mam#feros, asta el estudio de las migraciones de seres umanos en los últimos II.III años, $ue eplican la actual distribución de las distintas ra5as umanas. Gen%&ic' c(&'*'d' en+*e di+in+' eecie
Los estudios de genómica comparada con genomas de mam#feros sugieren $ue aproimadamente el 2H del genoma umano se a conservado evolutivamente en los últimos >II millones de añosC lo cual incluye la gran mayor#a de los genes y secuencias reguladoras. @in embargo, los genes y las secuencias reguladoras actualmente conocidas suponen sólo el >H del genoma, lo $ue sugiere $ue la mayor parte de la secuencia genómica con gran importancia funcional es desconocida. An porcenta"e importante de los genes umanos presenta un alto grado de conservación evolutiva. La similitud entre el genoma umano y el del cimpancé ('an troglodytes) es del 0-,H. !n promedio, una prote#na umana se diferencia de su ortóloga de cimpancé en tan sólo dos aminoácidos, y casi un tercio de los genes tiene la misma secuencia. Ana diferencia importante entre los dos genomas es el cromosoma > umano, $ue es el producto de una fusión entre los cromosomas > y 6 del cimpancéJK Mtra conclusión de la comparación del genoma de distintos primates es la notable pérdida de genes de receptores olfativos $ue se a producido paralelamente al desarrollo de la visión en color (tricrómica) durante la evolución de primates.
Genómica com!arada entre genomas +umanos
*apa de las migraciones umanas creado a partir de genómica comparada con los genomas mitocondriales de individuos actuales. Los números de la leyenda representan miles de años antes del presente. La l#nea a5ul rayada delimita el área cubierta de ielo o de tundra durante la última glaciación. Las letras englobadas por c#rculos indican los alo grupos de %=N mitocondrialC los alo grupos se usan para definir subpoblaciones genéticas, $ue frecuentemente tienen una correlación geográfica. Los principales alogrupos de %=Nmt son3 Wfrica3 L, L, L>, L6. Mriente próimo3 9, N. !uropa meridional3 9, V. !uropa (general)3 , Q. !uropa septentrional3 +, A, B. %sia3 %, :, 4, =, !, 7, ? (en el dibu"o3 * está compuesta por 4, =, !, y ?). Nativos %mericanos3 %, :, 4, = y a menudo B. Qéase el art#culo3 aplogrupos de %=N mitocondrial umano . =urante décadas las únicas evidencias $ue permit#an profundi5ar en el conocimiento del origen y la epansión del omo sapiens an sido los escasos alla5gos ar$ueológicos. @in embargo, en la actualidad, los estudios de genómica comparada a partir de genomas de individuos actuales de todo el mundo, están aportando información muy relevante. @u fundamento básico consiste en identificar un polimorfismo, una mutación, $ue se asume $ue se originó en un individuo de una población ancestral, y $ue a eredado toda su descendencia asta la actualidad. %demás, dado $ue las mutaciones parecen producirse a un ritmo constante, puede estimarse la antigUedad de una determinada mutación en base al tamaño del aplotipo en el $ue se sitúa, es decir, el tamaño de la secuencia conservada $ue flan$uea la mutación. !sta metodolog#a se ve complicada por el fenómeno de recombinación entre los pares de cromosomas de un individuo, procedentes de sus dos progenitores. @in embargo, ay dos regiones en las $ue no eiste dico inconveniente por$ue presentan una erencia uniparental3 el genoma mitocondrial (de erencia matrilineal), y el cromosoma D (de erencia patrilineal). !n las últimas décadas, los estudios de genómica comparada basada en el genoma mitocondrial, y en menor medida en el cromosoma D, an reportado conclusiones de
gran interés. !n diversos estudios se a tra5ado la filogenia de estas secuencias, estimándose $ue todos los seres umanos actuales comparten un antepasado femenino común $ue vivió en Wfrica ace unos 2I.III años. 'or su parte, por ra5ones aún poco conocidas, la mayor convergencia del %=N del cromosoma D establece $ue el antepasado masculino común más reciente data de ace unos I.III años. !stos individuos an sido bauti5ados como !va mitocondrial e D/ cromosoma %dán. La mayor diversidad de marcadores genéticos y en consecuencia, los aplotipos de menor longitud, se an allado en Wfrica. +odo el resto de la población mundial presenta sólo una pe$ueña parte de estos marcadores, de modo $ue la composición genómica del resto de la población umana actual es sólo un subcon"unto de la $ue puede apreciarse en Wfrica. !sto induce a afirmar $ue un pe$ueño grupo de seres umanos ($ui5á en torno a un millar) emigró del continente africano acia las costas de %sia occidental, ace unos 2I.III/I.III años, según estudios basados en el genoma mitocondrial. ace unos 2I.III años alcan5aron %ustralia y ace en torno a 1I.III/6I.III años otras subpoblaciones coloni5aron !uropa occidental y el centro de %sia. %simismo, se estima $ue ace >I.III/2.III años alcan5aron el continente americano a través del estreco de :ering (el nivel del mar era menor durante la última glaciación, o glaciación de ;Urm o ;isconsin), poblando @udamérica ace unos 2.III/>.III años. No obstante, estos datos sólo son estimaciones, y la metodolog#a presenta ciertas limitaciones. !n la actualidad, la tendencia es combinar los estudios de genómica comparada basados en el %=N mitocondrial con análisis de la secuencia del cromosoma D.
PRO,ECTO PROTEOMA )-MANO
'royecto proteoma umano ('')3 +ras descifrar el código del genoma umano, de >I.III a >2.III genes $ue componen la secuencia de %=N umano, se a ampliado la bús$ueda, intentando descifrar aora el proteoma umano, es decir, se necesita saber el funcionamiento y acción de cada prote#na, cuya secuencia, plegamiento y doblamiento viene determinado por cada uno de los genes determinados mediante el anterior 'royecto ?enoma umano. %demás, el '' permite conocer los mecanismos de modificación postraduccionales de las prote#nas, cómo afectan la fosforilación, glicosilación, polimeri5ación, etc., a los aspectos fundamentales de su funcionalidad. +ambién se detectan a la funcionalidad
de las prote#nas aspectos relacionados con la influencia medioambiental o las relaciones multigénicas $ue se establecen en la mayor#a de las enfermedades. Ob.etios del PP)
Los ob"etivos principales y generales de este proyecto, se determinaron por la EMrgani5ación del proteoma umanoE (A'M) en el primer Di&icultades del Pro/ecto Proteoma )umano
!l campo de la proteómica a emergido con la meta de desarrollar y aplicar los conocimientos obtenidos de la secuencia genética para conocer el comportamiento y la funcionalidad de las prote#nas, y con esto surgió el ''. @in embargo, reali5ar el '' es más complicado $ue el 'royecto ?enoma umano ya $ue tienen $ue superar dificultades como las siguientes3 •
•
•
Las prote#nas, aun$ue pueden ser fácilmente aisladas, no pueden ser amplificadas con métodos similares a la '4<, por lo $ue la cantidad de éstas presente en una muestra es la cantidad de prote#nas $ue se va a poder estudiar. 4on esto surge la dificultad de detectar, identificar, y caracteri5ar numerosos casos de prote#nas minoritarias en las concentraciones celulares naturales. % diferencia del %
% pesar de todo esto, el 'royecto 'roteoma umano, al igual $ue la proteómica, alcan5ará un gran esplendor en un per#odo no muy le"ano de tiempo, cuando se disponga de los conocimientos y métodos de estudio necesarios para comprender los mecanismos proteicos
B#BL#&G+R0#+
•
:%<+MLM*X D%NVMQF4, Nola. Y!L ?!NM*% A*%NM %L %L4%N4! =! +M=M@Z. @antiago3 II.
•
%A77<%D 4arles. Y!L ?!NM*% A*%NM3 Ana eplicación para comprender.Z [ ed. :uenos %ires3 @iglo BBF editores %rgentina, >II1.
•
MLFQ% QFII.
•
7<%N4MF@ *%++!F, 9ean. YL%*F<%=% =! L% 4F!N4F%Z. [ ed. *adrid3 !ditorial 4omplutense, >II>.
•
%'%
•
Nombela 4an, 4ésarC @imón Qallés, 4arlos. Y4!LAL%@ *%=II.