Monografia de Geneoma Humano

GENOMA Y PROTEOMA

Monografía elaborado por :  Loayza Pichardo Xiomara  Miranda Roca Guisel  Laura Bonifacio Jorge  Balbín Mejía arem  Gamarra Puchoc Guadalupe !urso de Bio"uímica

HUANCAYO,

DEDICATORIA

Agradecemos a Dios porque de él siempre sentimos esa fuerza interior interior que nos motivó a seguir adelante apartando las espinas de nuestro sendero para culminar con éxito lo que nos propusimos A nuestros padres porque en ellos encontramos la fortaleza ! protección necesaria necesaria para para transcurri transcurrirr el camino de la vida con valores ! aspiraciones aspiraciones para encontrar el éxito éxito en nuestro presente ! futuro A nuestra profesora porque de ella adquirimos todos los conocimientos necesarios para poder realizar esta monograf"a

DEDICATORIA

Agradecemos a Dios porque de él siempre sentimos esa fuerza interior interior que nos motivó a seguir adelante apartando las espinas de nuestro sendero para culminar con éxito lo que nos propusimos A nuestros padres porque en ellos encontramos la fortaleza ! protección necesaria necesaria para para transcurri transcurrirr el camino de la vida con valores ! aspiraciones aspiraciones para encontrar el éxito éxito en nuestro presente ! futuro A nuestra profesora porque de ella adquirimos todos los conocimientos necesarios para poder realizar esta monograf"a

indice

#$%R&'(!!#&$

La genética molecular y los diversos aspectos derivados (clonación, investigación con células madre) es una de las áreas de investigación más emergentes en los últimos años. No obstante es bastante amplio el desconocimiento real sobre su significado y, sobre todo, de las verdaderas posibilidades de dico campo de investigación. !l presente traba"o supone una puesta al d#a sobre genética general, genética molecular y sobre los diversos aspectos de la clonación y de las posibilidades futuras $ue de todo ello se deriva. %simismo tampoco debemos ser en la actualidad desmesuradamente optimistas en relación al estado actual de las investigaciones en este campo. &ueda todav#a muco $ue recorrer (y mucos años de investigación) para poder iniciar si$uiera la terapéutica y la curación de enfermedades $ue se derivarán de dicos estudios. 'ara apoyar las posibles aplicaciones futuras de la genética molecular describiré algunas enfermedades de origen parcial o totalmente genético y epondré las aplicaciones terapéuticas $ue algún d#a podrán resolver dicas alteraciones. !stas enfermedades citadas anteriormente son el autismo y la enfermedad de untington.

)#*%&R#+ ', L+ G,$,%#!+

-. GR,G&R M,$',L

!l núcleo de sus traba"os le permitió descubrir las tres leyes de la erencia o leyes de *endel, gracias a las cuales es posible describir los mecanismos de la erencia y $ue fueron eplicadas con posterioridad por el padre de la genética eperimental moderna, el biólogo estadounidense +omas unt *organ (-/ 012). !stas tres leyes son3 1. PRIMERA LEY:

4uando se cru5an dos variedades puras de una misma especie, los descendientes serán todos iguales y pueden parecerse a alguno de sus progenitores. 2. SEGUNDA LEY:

%l cru5ar entre s# los #bridos de la segunda generación, los descendientes se dividen en cuatro grupos, de los cuales uno se parece a su abuela, otro a su abuelo y las otras dos restantes a sus progenitores.

3. TERCERA LEY:

4oncluye diciendo $ue si se cru5an ra5as distintas en uno o más alelos (cada una de las modificaciones de un gen producidas por mutación), estos son independientes o ligados y siguen las dos primeras leyes de *endel. 4ada uno de los caracteres ereditarios se transmite al i"o con total independencia de los restantes. !n el cuadro $ue tenemos a continuación se puede observar la descendencia de cru5ar dos semillas iguales (amarillas y lisas). 

/ +(00R+1 !harles. 2,L G,$&M+ )(M+$&34 566-

%l observar el resultado de sus eperimentos, *endel pudo deducir $ue si se cru5an dos ra5as diferentes al menos en dos caracteres, se pueden crear nuevas ra5as estables (combinaciones nuevas omocigóticas).

-.5 R&*+L#$' 0R+$L#$

!n 026, la revista británica Nature publica un art#culo elaborado por cuatro cient#ficos notables3 7rancis 4ric8, 9ames :. ;atson, *aurice ;il8ins y 5 +P+R#*# M#R+LL,*4 7ngela 8 /99

-.; J+M,* <+%*&$ 1 0R+$!#* !R#! .3.1 !AMES "ATSON

7ue uno de los mayores impulsores del proyecto ?enoma umano $ue representa un importante avance para la curación de enfermedades de origen genético. @us traba"os se basan mayormente en el estudio del %=N, campo en el $ue colaboró con 4ric8 en el descubrimiento de la estructura de la doble élice del %=N y en el estudio de la replicación de éste. 4uando volvió a estados Anidos, colaboró en traba"os $ue le permitieron descifrar el código genético y descubrir la presencia del %
@e especiali5ó en el estudio de los genes y desarrolló un método para saber si una imagen de rayos B remit#a a una estructura elicoidal. 9unto con 9ames ;atson se especiali5ó en el estudio del %=N. 4onsiguieron sentar las bases de diversos estudios posteriores al conocer el modo en el $ue se replican los genes, además de confirmar $ue son portadores de información. 9untos descubrieron el principio molecular de doble élice para el %=N. 4onsiguió el 'remio Nobel. Luego sus investigaciones siguieron encaminadas acia el estudio de los ácidos nucleicos relacionados con el código de la erencia.

.3.3 EL MODELO DE "ATSON Y CRAC$

!n 026, ;atson y 4ric8 propusieron el modelo $ue establece las bases de la molécula responsable de contener toda la información genética de cual$uier se r vivo, esto es una estructura tridimensional llamada ácido desoirribonucleico (%=N). La doble élice propuesta por 9ames ;atson y 7rancis 4ric8, permitió dar la respuesta a los interrogantes $ue de la estructura y los mecanismos de la erencia.

=escubrieron $ue el %=N está formado por unidades $u#micas, llamadas nucleótidos, formados por cuatro bases nitrogenadas distintas, las cuales son, %denina (%), ?uanina (?), 4itosina (4) y +imina (+), por un a5úcar (ribosa o desoirribosa) y por una molécula de ácido fosfórico. Las bases nitrogenadas se alinean para luego "untarse con la otra cadena igual para formar la doble élice (% se "unta con + y ? con 4). !s muca la importancia del orden de los nucleótidos ya $ue determina las prote#nas, responsables de la estructura y funcionamiento de cada célula de todos y cada uno de los seres vivos de este planeta. 4uando estas dos cadenas se separan, cada una sirve como molde para la construcción de una complementariaC as#, una molécula de %=N dividida puede formar dos de su mismo tipo. ?racias a esta duplicación de las moléculas de %=N se puede transmitir la información genética a los siguientes descendentes, y as# sucesivamente. 'ara poder definir el modelo se apoyaron en gran parte en los rayos B $ue ab#a obtenido
L+ G,$=%#!+ : +'$ 1 +R$

',0#$#!#&$ 1 ,*%R(!%(R+ ',L +'$: ; Rafael &li>a ?irgili4 Jos@ Manuel ?idal %aboada 8 566A

La molécula de %=N (ácido desoirribonucleico) está formada por dos largas cadenas de nucleótidos (compuestos formados por una base nitrogenada, un a5úcar y un fosfato y forman los ácidos nucleicos) unida entre s# formando una doble élice. !stas dos cadenas de nucleótidos, $ue forman una molécula de %=N, $uedan unidas entre s#, gracias a los enlaces $ue se forman entre las bases nitrogenadas (%, ?, +, 4) de ambas cadenas $ue $uedan enfrentadas . La unión se reali5a mediante puentes de idrógeno (se forman cuando un átomo de idrógeno se encuentra entre dos átomos más electronegativos, estableciendo un v#nculo entre ellos). D está condicionado $u#micamente de forma $ue la %denina sólo se puede unir con la +imina, y la ?uanina sólo con la 4itosina. La estructura de un %=N está definida por la EsecuenciaE de las bases nitrogenadas, estando precisamente en esta secuencia de bases nitrogenadas la información genética del %=N. An cierto número de secuencias de bases nitrogenadas constituirán los distintos genes $ue regirán la formación de prote#nas y otras actividades estructurales y en5imáticas necesarias para la vida. !l orden en el $ue aparecen las cuatro bases es muy importante para la célula ya $ue es el $ue constituye las instrucciones del programa genético de cada organismo. 1

;.5R,PL#!+!#$ ',L +'$

- +(00R+1 !harles. 2,L G,$&M+ )(M+$&: (na eCplicaciDn para comprender.3 566-.

!s la capacidad $ue tiene el %=N de acer copias o réplicas de su molécula. !ste proceso es imprescindible para la transferencia de la información genética de generación en generación. !l procedimiento $ue se sigue es el siguiente3 la doble élice se separa y cada una de las cadenas sirve de molde para la creación de una nueva cadena complementaria. !l resultado final de este proceso son dos moléculas idénticas a la original.2

;.; ',0#$#!#$ 1 ,*%R(!%(R+ ',L +R$

!l %
'articipa en el transporte de la información de una cadena del %=N, desde el núcleo, para generar una cadena de %
+R$ ribosDmico E+R$rF:  Rafael &li>a ?irgili4 Jos@ Manuel ?idal %aboada. G,$&M+ )(M+$& 8 566A

'articipa en la constitución de unos orgánulos citoplasmáticos (ribosomas) y en el paso de la información del %
+R$ de Hransferencia E+R$HF

'articipa en el transporte de aminoácidos $ue corresponden a los diversos nucleótidos según el código genético, incorporándolos en el orden correcto. Ana mala lectura o un error en la serie de nucleótidos es lo $ue origina las mutaciones. La secuencia de aminoácidos constituirán las prote#nas. Los tres tipos de %
,L G,$&M+ )(M+$& A Jean 0ranIois MaHHei 8 5665

!l genoma umano es toda la información $ue cada individuo tiene almacenado en el %=N de las células. 4ada persona es diferente respecto a las demás y cada una tiene su propio genoma, el cual tiene una gran similitud (00,-H) respecto a los de su propia especie y tan solo se diferencia en el del cimpancé en un H. !l genoma es el $ue nos ace ser únicos e independientes de todos los demás. 4ontiene las instrucciones $ue caracteri5an el aspecto f#sico de cada persona y, en gran parte, las psicológicas e intelectuales. %ctualmente se a conseguido descifrar el 00H de este código, gracias a dos grandes empresasC una pública ('royecto ?enoma umano, subvencionada con fondos públicos de diversos pa#ses), y otra privada (4elera ?enomics, @an 7rancisco). !l genoma umano es el genoma del omo sapiens, es decir, la secuencia de %=N contenida en >6 pares de cromosomas en el núcleo de cada célula umana diploide. =e los >6 pares, >> son cromosomas autosómicos y un par determinante del seo (dos cromosomas B en mu"eres y uno B y uno D en ombres). !l genoma aploide (es decir, con una sola representación de cada par) tiene una longitud total aproimada de 6>II millones de pares de bases de %=N (6>II *b) $ue contienen unos >I.III/>2.III genesJK (las estimaciones más recientes apuntan a unos >I.2II). =e las 6>II *b unas >02I *b corresponden a eucromatina y unas >2I *b a eterocromatina. !l 'royecto ?enoma umano produ"o una secuencia de referencia del genoma umano eucromático, usado en todo el mundo en las ciencias biomédicas. La secuencia de %=N $ue conforma el genoma umano contiene codificada la información necesaria para la epresión, altamente coordinada y adaptable al ambiente, del proteoma umano, es decir, del con"unto de las prote#nas del ser umano. Las prote#nas, y no el %=N, son las principales biomoléculas efectorasC poseen funciones estructurales, en5imáticas, metabólicas, reguladoras, señali5adoras, organi5ándose en enormes redes funcionales de interacciones. !n definitiva, el proteoma fundamenta la particular morfolog#a y funcionalidad de cada célula. %simismo, la organi5ación estructural y funcional de las distintas células conforma cada te"ido y cada órgano, y, finalmente, el organismo vivo en su con"unto. %s#, el genoma umano contiene la información básica necesaria para el desarrollo f#sico de un ser umano completo. !l genoma umano presenta una densidad de genes muy inferior a la $ue inicialmente se ab#a predico, con sólo en torno al ,2H JK de su longitud compuesta por eones codificantes de prote#nas. An IH está compuesto por %=N etragénico y un 6I H por secuencias relacionadas con genes. =el total de %=N etragénico, aproimadamente un IH corresponde a repeticiones dispersas, de manera $ue,

más o menos, la mitad del genoma umano corresponde a secuencias repetitivas de %=N. 'or su parte, del total de %=N relacionado con genes se estima $ue el 02H corresponde a %=N no codificante3 pseudogenes, fragmentos de genes, intrones o secuencias A+<, entre otros. !n el genoma umano se detectan más de >-I.III elementos reguladores, aproimadamente un total de *b de secuencia, $ue se originaron por medio de inserciones de elementos móviles. !stas regiones reguladoras se conservan en elementos no eónicos (4N!!s), fueron nombrados como3 @FN!, LFN!, L+<. @e sabe $ue al menos entre un H y un >IH de estas secuencias reguladoras de genes, y $ue están conservados entre especies, fue formado por elementos móviles.

4ontenido en genes y tamaño del genoma de varios organismo del Número de genes

!specie

+amaño genoma (*b)

4andidatus 4arsonella ruddii

I,2

->

@treptococcus pneumoniae

>,>

>6II

!scericia coli

1,

1.1II

@accaromyces cerevisiae

>

2.-II

4aenorabditis elegans

0

0.III

%rabidopsis taliana

>2

>2.2II

=rosopila melanogaster (mosca)

-I

6.II

Mry5a sativa (arro5)

1

12/22.III

*us musculus (ratón)

>2II

>0.III

omo sapiens (ser umano)

>0II

>.III

COMPONENTES: Cromosomas

!l genoma umano (como el de cual$uier organismo eucariota) está formado por cromosomas, $ue son largas secuencias continuas de %=N altamente organi5adas espacialmente (con ayuda de prote#nas istónicas y no istónicas) para adoptar una forma ultra condensada en metafase. @on observables con microscop#a óptica

convencional o de fluorescencia mediante técnicas de citogenética y se ordenan formando un cariotipo.

!l cariotipo umano normal contiene un total de >6 pares de cromosomas distintos3 >> pares de autosomas más  par de cromosomas seuales $ue determinan el seo del individuo. Los cromosomas />> fueron numerados en orden decreciente de tamaño en base al cariotipo. @in embargo, posteriormente pudo comprobarse $ue el cromosoma >> es en realidad mayor $ue el >.

Las células somáticas de un organismo poseen en su núcleo un total de 1 cromosomas (>6 pares)3 una dotación de >> autosomas procedentes de cada progenitor y un par de cromosomas seuales, un cromosoma B de la madre y un B o un D del padre. Los gametos /óvulos y espermato5oides/ poseen una dotación aploide de >6 cromosomas.

4romosoma  > 6 1 2   0 I  >

?enes 1.>>I .10 .22I 11 I0 >.>- >.62 .I .0>I .06 60 .16I

Número de bases >1.00.0 >1>.2.10 00.11.-> 0.>6.I6 -I.-6.- I.-0.006 2-.->.1>1 1.>1.-> 1I.11>.>062.61.6 61.12>.6-1 6>.>-0.261

:ases secuenciadas >>1.000.0 >6.>.10 01.I1.-> -.>0.I6 .I>. .>6.006 21.02>.1>1 1>.>.-> >I.6>.>06.>1.6 6.6I.-26 6I.6I6.261

4romosoma 6 1 2   0 >I > >> B (cromosoma seual) D (cromosoma seual) +otal

?enes 0>1 .61 0> 0I0 .> 20 .222 .II2.I0> .-1 121 6>.-2

Número de bases 1.>.0-I I.6I.2-2 II.66-.02 --.->>.>21 -.21.1> ..26 6.-I.2 >.162.02 1.011.6>6 10.2>-.026 21.06.21 2.1.2> 6.I0.-16.1

:ases secuenciadas 02.220.0-I --.>0I.2-2 -.61.02 -.--1.21 .-II.>>I 1.2.22 22.-2.2 20.2I2.>21 61..0061.-06.026 2.I2-.21 >2.>.2> >.-2.0-.2I

ADN intragénico Genes

An gen es la unidad básica de la erencia, y porta la información genética necesaria para la s#ntesis de una prote#na (genes codificantes) o de un %I.III y >2.III genes codificantes de prote#nas, estimación muy inferior a las predicciones iniciales $ue ablaban de unos II.III genes o más. !sto implica $ue el genoma umano tiene menos del doble de genes $ue organismos eucariotas muco más simples, como la mosca de la fruta o el nematodo 4aenorabditis elegans. @in embargo, las células umanas recurren ampliamente al splicing ( ayuste) alternativo para producir varias prote#nas distintas a partir de un mismo gen, como consecuencia de lo cual el proteoma umano es más amplio $ue el de otros organismos muco más simples. !n la práctica, el genoma tan sólo porta la información necesaria para una epresión perfectamente coordinada y regulada del con"unto de prote#nas $ue conforman el proteoma, siendo éste el encargado de e"ecutar la mayor parte de las funciones celulares. 4on base en los resultados iniciales arro"ados por el proyecto !N4M=!JK (acrónimo de !nciclopedia Mf =N% !lements), algunos autores an propuesto redefinir el concepto actual de gen. Las observaciones más recientes acen dif#cilmente sostenible la visión tradicional de un gen, como una secuencia formada por las regiones A+
estimaciones iniciales, y algunas de estas secuencias se sitúan en regiones muy ale"adas de la traducida, por lo $ue los A+< 2 pueden abarcar secuencias largas dificultando la delimitación del gen. 'or otro lado, un mismo transcrito puede dar lugar a %
%demás de los genes codificantes de prote#nas, el genoma umano contiene varios miles de genes %I/6IH de los genes del genoma umano puede estar regulado por el mecanismo de interferencia por mi%
% continuación se muestran algunos valores promedio del genoma umano. 4abe advertir, sin embargo, $ue la enorme eterogeneidad $ue presentan estas variables ace poco representativos a los valores promedio, aun$ue tienen valor orientativo.

La densidad media de genes es de  gen cada II 8b, con un tamaño medio de >I/ 6I 8b, y un número de eones promedio de /- por cada gen, con un tamaño medio de 2I nucleótidos. !l tamaño medio de un %,> 8b, incluyendo las regiones A+< (regiones no traducidas flan$ueantes), siendo la longitud media de la región codificante de ,1 8b.

Fsocoros. 7recuencia y ri$ue5a en ?O4 y genes, en el genoma umano.

!l genoma umano se caracteri5a por presentar una gran eterogeneidad en su secuencia. !n particular, la ri$ue5a en bases de guanina (?) y citosina (4) frente a las de adenina (%) y timina (+) se distribuye eterogéneamente, con regiones muy ricas en ?O4 flan$ueadas por regiones muy pobres, siendo el contenido medio de ?O4 del 1H, menor al teóricamente esperado (2IH). =ica eterogeneidad esta correlacionada con la ri$ue5a en genes, de manera $ue los genes tienden a concentrarse en las regiones más ricas en ?O4. !ste eco era conocido ya desde ace años gracias a la separación mediante centrifugación en gradiente de densidad de regiones ricas en ?O4 ($ue recibieron el nombre de isócoros C del inglés ig) y regiones ricas en %O+ Secuencias reguladoras

!l genoma tiene diversos sistemas de regulación de la epresión génica, basados en la regulación de la unión de factores de transcripción a las secuencias promotoras, en mecanismos de modificación epigenética (metilación del %=N o metilación/acetilación de istonas) o en el control de la accesibilidad a los promotores determinada por el grado de condensación de la cromatinaC todos ellos muy interrelacionados. %demás ay otros sistemas de regulación a nivel del procesamiento, estabilidad y traducción del %
reguladoras se basa en parte en la bús$ueda de regiones no codificantes evolutivamente conservadas. JK 'or e"emplo, la divergencia evolutiva entre el ratón y el ser umano ocurrió ace I/0I millones de años. JK *ediante estudios de genómica comparada, alineando secuencias de ambos genomas pueden identificarse regiones con alto grado de coincidencia, mucas correspondientes a genes y otras a secuencias no codificantes de prote#nas pero de gran importancia funcional, dado $ue an estado sometidas a presión selectiva. Elementos ultra conserados

II pares de bases totalmente conservados (IIH de coincidencia) entre los genomas de umano, ratón y rata, y casi totalmente conservados en perro (00H) y pollo (02H).JK Pseudogenes

!n el genoma umano se an encontrado asimismo unos 0.III pseudogenes, $ue son versiones completas o parciales de genes $ue an acumulado diversas mutaciones y $ue generalmente no se transcriben. @e clasifican en pseudogenes no procesados (P6IH) y pseudogenes procesados (PIH) JK •

•

Los pseudogenes no procesados son copias de genes generalmente originadas por duplicación, $ue no se transcriben por carecer de una secuencia promotora y aber acumulado múltiples mutaciones, algunas de las cuales sin sentido (lo $ue origina codones de parada prematuros). @e caracteri5an por poseer tanto eones como intrones. Los pseudogenes procesados, por el contrario, son copias de %
+'$ inHerg@nico

Las regiones intergénicas o etragénicas comprenden la mayor parte de la secuencia del genoma umano, y su función es generalmente desconocida. :uena parte de estas regiones está compuesta por elementos repetitivos, clasificables como repeticiones en tándem o repeticiones dispersas, aun$ue el resto de la secuencia no responde a un patrón definido y clasificable. ?ran parte del %=N intergénico puede ser un artefacto evolutivo sin una función determinada en el genoma actual, por lo $ue tradicionalmente estas regiones an sido denominadas %=N EbasuraE (9un8 =N%), denominación $ue incluye también las secuencias

intrónicas y pseudogenes. No obstante, esta denominación no es la más acertada dado el papel regulador conocido de mucas de estas secuencias. %demás el notable grado de conservación evolutiva de algunas de estas secuencias parece indicar $ue poseen otras funciones esenciales aún desconocidas o poco conocidas. 'or lo tanto, algunos prefieren denominarlo E%=N no codificanteE (aun$ue el llamado E%=N basuraE incluye también transposones codificantes) o E%=N repetitivoE. %lgunas de estas regiones constituyen en realidad genes precursores para la s#ntesis te micro%
@on repeticiones $ue se ordenan de manera consecutiva, de modo $ue secuencias idénticas, o casi, se disponen unas detrás de otras. Satélites

!l con"unto de repeticiones en tándem de tipo satélite comprende un total de >2I *b del genoma umano. @on secuencias de entre 2 y varios cientos de nucleótidos $ue se repiten en tándem miles de veces generando regiones repetidas con tamaños $ue oscilan entre II 8b (II.III nucleótidos) asta varias megas bases. nucleótidos. @ituado en los centrómeros de los cromosomas 6 y 1 y el bra5o corto de los cromosomas acrocéntricos (en posición distal respecto al clúster codificante de %
>. Satélite $3 la secuencia básica es %++44%++4?. 'resente en las proimidades de los centrómeros de los cromosomas > y I, y en la constricción secundaria de  y . 6. Satélite %: la secuencia básica es %++44. 'resente en la constricción secundaria de los cromosomas 0 e D, y en posición proimal respecto al clúster de %=Nr del bra5o corto de los cromosomas acrocéntricos. 1. Satélite al&a: secuencia básica de  nucleótidos. 7orma parte del %=N de los centrómeros cromosómicos. 2. Satélite beta: secuencia básica de - nucleótidos. %parece en torno al centrómero en los cromosomas acrocéntricos y en la constricción secundaria del cromosoma . . Satélite gamma: secuencia básica de >>I nucleótidos. 'róimo al centrómero de los cromosomas - y B. Mini satélites

!stán compuestas por una unidad básica de secuencia de />2 JK nucleótidos $ue se repite en tándem generando secuencias de entre II y >I.III pares de bases. @e estima $ue el genoma umano contiene unos 6I.III mini satélites. =iversos estudios an relacionado los mini satélites con procesos de regulación de la epresión génica. %simismo, se an asociado con puntos de fragilidad cromosómica dado $ue se sitúan próimos a lugares preferentes de rotura cromosómica, translocación genética y recombinación meiótica. 'or último, algunos mini satélites umanos (/IH) son impermutables, presentando una tasa media de mutación entre el I.2H y el >IH en las células de la l#nea germinal, siendo as# las regiones más inestables del genoma umano conocidas asta la feca. !n el genoma umano, aproimadamente el 0IH de los mini satélites se sitúan en los telómeros de los cromosomas. La secuencia básica de seis nucleótidos ++%??? se repite miles de veces en tándem, generando regiones de 2/>I 8b $ue conforman los telómeros. %lgunos mini satélites por su gran inestabilidad presentan una notable variabilidad entre individuos distintos. @e consideran polimorfismos multialélicos, dado $ue pueden presentarse en un número de repeticiones muy variable, y se denominan QN+<. @on marcadores muy utili5ados en genética forense, ya $ue permiten establecer una uella genética caracter#stica de cada individuo, y son identificables mediante ibridación. Micros satélites

!stán compuestos por secuencias básicas de >/1 nucleótidos, cuya repetición en tándem origina frecuentemente secuencias de menos de 2I nucleótidos. %lgunos e"emplos importantes son el di nucleótido 4% y el trinucleótido 4%?.

Los micro satélites son también polimorfismos multialélicos, denominados @+< y pueden identificarse mediante '4<, de modo rápido y sencillo. @e estima $ue el genoma umano contiene unos >II.III micro satélites, $ue se distribuyen más o menos omogéneamente, al contrario $ue los mini satélites, lo $ue los ace más informativos como marcadores. ADN re!etido dis!erso

@on secuencias de %=N $ue se repiten de modo disperso por todo el genoma, constituyendo el 12H del genoma umano. Los elementos cuantitativamente más importantes son los LFN!@ y @FN!@, $ue se distinguen por el tamaño de la unidad repetida. !stas secuencias tienen la potencialidad de auto propagarse al transcribirse a una %II neonatos portan una inserción nueva de un %lu o un L, $ue pueden resultar patogénicos por muta génesis insercional, por desregulación de la epresión de genes próimos (por los propios promotores de los @FN! y LFN!) o por recombinación ileg#tima entre dos copias idénticas de distinta locali5ación cromosómica (recombinación intra o intercromosómica), especialmente entre elementos %lu. 7recuencias y tipos de repeticiones dispersas en el genoma de varios organismos JK +ipo repetición

omo sapiens

=rosopila melanogaster

4aenorabditis elegans

%rabidopsis taliana

LFN!,@FN!

66,1H

I,H

I,1H

I,2H

L+
-,H

,2H

IH

1,-H

+ransposones %=N

>,-H

I,H

2,6H

2,H

+otal

11,1H

6,H

,2H

I,1H

S'NE

!lementos nucleares dispersos cortos. @on secuencias cortas, generalmente de unos pocos cientos de bases, $ue aparecen repetidas miles de veces en el genoma umano. @uponen el 6H del genoma umano, JK un IH debido eclusivamente a la familia de elementos %lu (caracter#stica de primates). ('NE

Los elementos %lu son secuencias de >2I/>-I nucleótidos presentes en .2II.IIIJIK de copias dispersas por todo el genoma. !structuralmente son d#meros casi idénticos, ecepto $ue la segunda unidad contiene un inserto de 6> nucleótidos, siendo mayor $ue la primera. !n cuanto a su secuencia, tienen una considerable ri$ue5a en ?O4 (2H),JK por lo $ue predominan en las bandas <, y ambos

monómeros presentan una cola poli % (secuencia de adeninas) vestigio de su origen de %IH del genoma umano, contiene unos II.III/2II.III copias de retrotransposones L $ue es la familia de mayor importancia cuantitativa, es una secuencia de  8b repetida unas -II.III veces de modo disperso por todo el genoma, aun$ue la gran mayor#a de las copias es incompleta al presentar el etremo 2 truncado por una retro transcripción incompleta. %s#, se estima $ue ay unas 2.III copias completas de L, sólo 0I de las cuales son activas, JK estando el resto inibidas por metilación de su promotor. @u ri$ue5a en ?O4 es del 1>H, próima a la media del genoma (1H) y se locali5an preferentemente en las bandas ? de los cromosomas. 'oseen además un promotor de la %. !n5ima con actividad retro transcriptasa y endonucleasa3 codificada por el M<7>. %mbas prote#nas son necesarias para la retro transposición. !stos elementos móviles están flan$ueados por > regiones no codificantes, denominados como 2TA+< y 6TA+<. 'or lo tanto, se consideran retrotransopsones autónomos, ya $ue codifican las prote#nas $ue necesitan para propagarse. La %
@e a visto $ue la inserción aleatoria de L activos en el genoma umano a dado lugar a enfermedades genéticas, ya $ue interfiere en la epresión normal. +ambién se observa una predilección de L por regiones ricas en %+. )ER*

), $ue supone en torno al H de los !
:a"o la denominación de transposones a veces se incluyen los retrotransposones, tales como los pseudogenes procesados, los @FN!@ y los LFN!@. !n tal caso se abla de transposones de clase F para acer referencia a los retrotransposones, y de clase FF para referirse a transposones de %=N, a los $ue se dedica el presente apartado. Los transposones de %=N completos poseen la potencialidad de auto propagarse sin un intermediario de %
patogénica por la generación de reordenaciones cromosómicas los elementos mariner, as# como las familias *!< y *!<>. *ariabilidad

@i bien dos seres umanos del mismo seo comparten un porcenta"e elevad#simo (en torno al 00,0H) de su secuencia de %=N, lo $ue nos permite traba"ar con una única secuencia de referencia, pe$ueñas variaciones genómicas fundamentan buena parte de la variabilidad fenot#pica interindividual. Ana variación en el genoma, por sustitución, de lesión o inserción, se denomina polimorfismo o alelo genético. No todo polimorfismo genético provoca una alteración en la secuencia de una prote#na o de su nivel de epresión, es decir, mucos son silenciosos y carecen de epresión fenot#pica. SNPs

La principal fuente de variabilidad en los genomas de dos seres umanos procede de las variaciones en un sólo nucleótido, conocidas como @N's, en las cuales se an centrado la mayor parte de los estudios. =ada su importancia, en la actualidad eiste un proyecto internacional ( Fnternational ap*ap 'ro"ect) para catalogar a gran escala los @N's del genoma umano. !n este conteto, la denominación de @N' frecuentemente se restringe a a$uellos polimorfismos de un sólo nucleótido en los $ue el alelo menos frecuente aparece en al menos el H de la población. Los @N' son marcadores tetralélicos, dado $ue en teor#a en una posición puede aber cuatro nucleótidos distintos, cada uno de los cuales identificar#a un aleloC sin embargo, en la práctica suelen presentar sólo dos alelos en la población. @e estima $ue la frecuencia de @N's en el genoma umano es de un @N' cada 2II/II pares de bases, de los $ue una parte relevante son polimorfismos codificantes, $ue causan la sustitución de un aminoácido por otro en una prote#na. ?racias a su abundancia y a $ue presentan una distribución aproimadamente uniforme en el genoma, an tenido gran utilidad como marcadores para los mapas de ligamiento, erramienta fundamental del 'royecto ?enoma umano. %demás son fácilmente detectables a gran escala mediante el empleo de cips de %=N *ariación estructural

!ste tipo de variaciones se refiere a duplicaciones, inversiones, inserciones o variantes en el número de copias de segmentos grandes del genoma (por lo general de III nucleótidos o más). !stas variantes implican a una gran proporción del genoma, por lo $ue se piensa $ue son, al menos, tan importantes como los @N's. Qariación estructural es el término general para abarcar un grupo de alteraciones genómicas $ue implican segmentos de %=N mayores de Vb. La variación estructural puede ser cuantitativa (variante en número de copia, $ue comprende3 deleciones, inserciones y duplicaciones), posicional (translocaciones) y orientacional (inversiones).

% pesar de $ue este campo de estudio es relativamente nuevo (los primeros estudios a gran escala se publicaron en los años >II1 y >II2), a tenido un gran auge, asta el punto de $ue se a creado un nuevo proyecto para estudiar este tipo de variantes en los mismos individuos en los $ue se basó el 'royecto ap*ap. %un$ue aún $uedan dudas acerca de las causas de este tipo de variantes, cada ve5 eiste más evidencia a favor de $ue es un fenómeno recurrente $ue todav#a continua moldeando y creando nuevas variantes del genoma. !ste tipo de variaciones an potenciado la idea de $ue el genoma umano no es una entidad estática, sino $ue se encuentra en constante cambio y evolución.

Eolución

Los estudios de genómica comparada se basan en comparación de secuencias genómicas a gran escala, generalmente mediante erramientas bioinformáticas. =icos estudios permiten aondar en el conocimiento de aspectos evolutivos de escala temporal y espacial muy diversa, desde el estudio de la evolución de los primeros seres vivos ace miles de millones de años o las radiaciones filogenéticas en mam#feros, asta el estudio de las migraciones de seres umanos en los últimos II.III años, $ue eplican la actual distribución de las distintas ra5as umanas. Gen%&ic' c(&'*'d' en+*e di+in+' eecie

Los estudios de genómica comparada con genomas de mam#feros sugieren $ue aproimadamente el 2H del genoma umano se a conservado evolutivamente en los últimos >II millones de añosC lo cual incluye la gran mayor#a de los genes y secuencias reguladoras. @in embargo, los genes y las secuencias reguladoras actualmente conocidas suponen sólo el >H del genoma, lo $ue sugiere $ue la mayor parte de la secuencia genómica con gran importancia funcional es desconocida. An porcenta"e importante de los genes umanos presenta un alto grado de conservación evolutiva. La similitud entre el genoma umano y el del cimpancé ('an troglodytes) es del 0-,H. !n promedio, una prote#na umana se diferencia de su ortóloga de cimpancé en tan sólo dos aminoácidos, y casi un tercio de los genes tiene la misma secuencia. Ana diferencia importante entre los dos genomas es el cromosoma > umano, $ue es el producto de una fusión entre los cromosomas > y 6 del cimpancéJK Mtra conclusión de la comparación del genoma de distintos primates es la notable pérdida de genes de receptores olfativos $ue se a producido paralelamente al desarrollo de la visión en color (tricrómica) durante la evolución de primates.

Genómica com!arada entre genomas +umanos

*apa de las migraciones umanas creado a partir de genómica comparada con los genomas mitocondriales de individuos actuales. Los números de la leyenda representan miles de años antes del presente. La l#nea a5ul rayada delimita el área cubierta de ielo o de tundra durante la última glaciación. Las letras englobadas por c#rculos indican los alo grupos de %=N mitocondrialC los alo grupos se usan para definir subpoblaciones genéticas, $ue frecuentemente tienen una correlación geográfica. Los principales alogrupos de %=Nmt son3 Wfrica3 L, L, L>, L6. Mriente próimo3 9, N. !uropa meridional3 9, V. !uropa (general)3 , Q. !uropa septentrional3 +, A, B. %sia3 %, :, 4, =, !, 7, ? (en el dibu"o3 * está compuesta por 4, =, !, y ?). Nativos %mericanos3 %, :, 4, = y a menudo B. Qéase el art#culo3 aplogrupos de %=N mitocondrial umano . =urante décadas las únicas evidencias $ue permit#an profundi5ar en el conocimiento del origen y la epansión del omo sapiens an sido los escasos alla5gos ar$ueológicos. @in embargo, en la actualidad, los estudios de genómica comparada a partir de genomas de individuos actuales de todo el mundo, están aportando información muy relevante. @u fundamento básico consiste en identificar un polimorfismo, una mutación, $ue se asume $ue se originó en un individuo de una población ancestral, y $ue a eredado toda su descendencia asta la actualidad. %demás, dado $ue las mutaciones parecen producirse a un ritmo constante, puede estimarse la antigUedad de una determinada mutación en base al tamaño del aplotipo en el $ue se sitúa, es decir, el tamaño de la secuencia conservada $ue flan$uea la mutación. !sta metodolog#a se ve complicada por el fenómeno de recombinación entre los pares de cromosomas de un individuo, procedentes de sus dos progenitores. @in embargo, ay dos regiones en las $ue no eiste dico inconveniente por$ue presentan una erencia uniparental3 el genoma mitocondrial (de erencia matrilineal), y el cromosoma D (de erencia patrilineal). !n las últimas décadas, los estudios de genómica comparada basada en el genoma mitocondrial, y en menor medida en el cromosoma D, an reportado conclusiones de

gran interés. !n diversos estudios se a tra5ado la filogenia de estas secuencias, estimándose $ue todos los seres umanos actuales comparten un antepasado femenino común $ue vivió en Wfrica ace unos 2I.III años. 'or su parte, por ra5ones aún poco conocidas, la mayor convergencia del %=N del cromosoma D establece $ue el antepasado masculino común más reciente data de ace unos I.III años. !stos individuos an sido bauti5ados como !va mitocondrial e D/ cromosoma %dán. La mayor diversidad de marcadores genéticos y en consecuencia, los aplotipos de menor longitud, se an allado en Wfrica. +odo el resto de la población mundial presenta sólo una pe$ueña parte de estos marcadores, de modo $ue la composición genómica del resto de la población umana actual es sólo un subcon"unto de la $ue puede apreciarse en Wfrica. !sto induce a afirmar $ue un pe$ueño grupo de seres umanos ($ui5á en torno a un millar) emigró del continente africano acia las costas de %sia occidental, ace unos 2I.III/I.III años, según estudios basados en el genoma mitocondrial. ace unos 2I.III años alcan5aron %ustralia y ace en torno a 1I.III/6I.III años otras subpoblaciones coloni5aron !uropa occidental y el centro de %sia. %simismo, se estima $ue ace >I.III/2.III años alcan5aron el continente americano a través del estreco de :ering (el nivel del mar era menor durante la última glaciación, o glaciación de ;Urm o ;isconsin), poblando @udamérica ace unos 2.III/>.III años. No obstante, estos datos sólo son estimaciones, y la metodolog#a presenta ciertas limitaciones. !n la actualidad, la tendencia es combinar los estudios de genómica comparada basados en el %=N mitocondrial con análisis de la secuencia del cromosoma D.

PRO,ECTO PROTEOMA )-MANO

'royecto proteoma umano ('')3 +ras descifrar el código del genoma umano, de >I.III a >2.III genes $ue componen la secuencia de %=N umano, se a ampliado la bús$ueda, intentando descifrar aora el proteoma umano, es decir, se necesita saber el funcionamiento y acción de cada prote#na, cuya secuencia, plegamiento y doblamiento viene determinado por cada uno de los genes determinados mediante el anterior 'royecto ?enoma umano. %demás, el '' permite conocer los mecanismos de modificación postraduccionales de las prote#nas, cómo afectan la fosforilación, glicosilación, polimeri5ación, etc., a los aspectos fundamentales de su funcionalidad. +ambién se detectan a la funcionalidad

de las prote#nas aspectos relacionados con la influencia medioambiental o las relaciones multigénicas $ue se establecen en la mayor#a de las enfermedades. Ob.etios del PP)

Los ob"etivos principales y generales de este proyecto, se determinaron por la EMrgani5ación del proteoma umanoE (A'M) en el primer Di&icultades del Pro/ecto Proteoma )umano

!l campo de la proteómica a emergido con la meta de desarrollar y aplicar los conocimientos obtenidos de la secuencia genética para conocer el comportamiento y la funcionalidad de las prote#nas, y con esto surgió el ''. @in embargo, reali5ar el '' es más complicado $ue el 'royecto ?enoma umano ya $ue tienen $ue superar dificultades como las siguientes3 •

•

•

Las prote#nas, aun$ue pueden ser fácilmente aisladas, no pueden ser amplificadas con métodos similares a la '4<, por lo $ue la cantidad de éstas presente en una muestra es la cantidad de prote#nas $ue se va a poder estudiar. 4on esto surge la dificultad de detectar, identificar, y caracteri5ar numerosos casos de prote#nas minoritarias en las concentraciones celulares naturales. % diferencia del %
% pesar de todo esto, el 'royecto 'roteoma umano, al igual $ue la proteómica, alcan5ará un gran esplendor en un per#odo no muy le"ano de tiempo, cuando se disponga de los conocimientos y métodos de estudio necesarios para comprender los mecanismos proteicos

B#BL#&G+R0#+

•

:%<+MLM*X D%NVMQF4, Nola. Y!L ?!NM*% A*%NM %L %L4%N4! =! +M=M@Z. @antiago3 II.

•

%A77<%D 4arles. Y!L ?!NM*% A*%NM3 Ana eplicación para comprender.Z [ ed. :uenos %ires3 @iglo BBF editores %rgentina, >II1.

•

MLFQ% QFII.

•

7<%N4MF@ *%++!F, 9ean. YL%*F<%=% =! L% 4F!N4F%Z. [ ed. *adrid3 !ditorial 4omplutense, >II>.

•

%'%
•

Nombela 4an, 4ésarC @imón Qallés, 4arlos. Y4!LAL%@ *%=II.

Monografia de Geneoma Humano

Recommend Documents