Artículo
Las adaptaciones fisiológicas y genéticas para el buceo en nómadas del mar Gráficamente abstracto
autores Melissa A. Ilardo, Ida Moltke, Thor fi nn S. Korneliussen, ..., Suhartini Salingkat, Rasmus Nielsen, Eske Willerslev
Correspondencia
[email protected] (RN),
[email protected] (EW)
En breve adaptaciones genéticas y fisiológicas permiten la notable capacidad de apnea de nómadas marinos.
Reflejos re
El Bajau, o '' nómadas del mar '', han participado en apnea buceo desde hace miles de años
re
Selección ha aumentado aumentado Bajau el tamaño tamaño del bazo, proporcionando una
reserva de oxígeno para el buceo
re
Nos fi nd pruebas adicionales de los fenotipos relacionados con el buceo en virtud de selección
re
Estos hallazgos tienen implicaciones para la investigación hipoxia, una
cuestión médica pertinente
Ilardo et al., 2018, Cell 173, 569-580 19 de de abril de, 2018 ª 2018 Elsevier Inc. https://doi.org/10.1016/j.cell.2018.03.054
Artículo Las adaptaciones fisiológicas y genéticas para el buceo en nómadas del mar Melissa A. Ilardo, 1 Ida Moltke, 2 Thor fi nn S. Korneliussen, 1,3 Jade Cheng, 4 Aaron J. Stern, 4,5 Fernando Racimo, Pedro de Barros Damgaard, 1 Martin Sikora, 1 Andaine Seguin-Orlando, 1,6 Simon Rasmussen, 7 Inge van den CL Munckhof, 8 Rob ter Horst, 8 Leo AB Joosten, 8 Mihai G. Netea, 8,9 Suhartini Salingkat, 10 Rasmus Nielsen, 1,4,12, * y Eske Willerslev 1,3,11, * 1
1
Centro de GeoGenetics, Universidad de Copenhague, Copenhague 1350, Dinamarca
2
Departamento de Biología, Universidad de Copenhague, Copenhague 2200, Dinamarca
3
Departamento de Zoología de la Universidad de Cambridge, Cambridge, CB2 3EJ, Reino Unido
4
Departamento de Biología Integrativa de la Universidad de California en Berkeley, Berkeley, CA 94720, EE.UU.
5
Departamento de Biología Computacional de la Universidad de California en Berkeley, Berkeley, CA 94720, EE.UU.
6
Nacional Danesa de alto rendimiento de secuenciación de ADN Center, Universidad de Copenhague 1353, Dinamarca
7
Bioinformática de la Universidad Técnica de Dinamarca, Lyngby 2800, Dinamarca
8
Departamento de Medicina Interna y el Centro de Radboud de Enfermedades Infecciosas (RCI), la Universidad de Radboud Centro Médico Nijmegen 6525, los Países Bajos
9
Departamento de Genómica y Inmunorregulación, Vida y medicina Sciences Institute (CALES), Universidad de Bonn, Bonn 53115, Alemania
10
Tompotika Luwuk Banggai, Universidad Tompotika, Luwuk 94711, Indonesia
11 Wellcome Trust, Sanger 12
Institute, Hinxton CB10 1SA, UK
Contacto plomo
* Correspondencia:
[email protected] (RN),
[email protected] (EW) https://doi.org/10.1016/j.cell.2018.03.054
RESUMEN
poblaciones adaptadas ofrecen la oportunidad de estudiar las perturbaciones ambientales consequencesof andphysiological genéticos. Por ejemplo,
La comprensión de la fisiología y la genética de la tolerancia a la hipoxia
researchonadaptations en thepeopleof Tibet ( Beall et al., 2010; Peng et al., 2011;
humana tiene importantes implicaciones médicas, pero este fenómeno hoy
Simonson et al., 2010; Wuren et al, 2014.; Xiang et al, 2013.; Xu et al., 2011; Yang et
por hoy sólo ha investigado en las poblaciones humanas a gran altitud.
al, 2017.; Yi et al., 2010 ) Y otras otras poblaciones a gran altitud ( Beall, 2006 ) Ha revelado
Otro sistema, aún no se ha explorado, es el ser humano que se involucran
una nueva comprensión de la fisiología de la hipoxia con una amplia gama de
en el buceo en apnea. Los indígenas Bajau ( '' nómadas del mar '') del
implicaciones en campos campos de relevancia médica ( Grocott et al., 2007; Oosthuyse y
sudeste de Asia viven un estilo de vida de subsistencia basada en el buceo en apnea y son reconocidos por sus habilidades extraordinarias breathholding. Sin embargo, se desconoce si esto tiene una base genética. El uso de un estudio genómico comparativo, se muestra que la selección
col., 2001; Rankin y Giaccia, 2008; Las conversaciones et al., 2000; Zhonget al., 1999 ), Incluyendo el tratamiento Intensivos ( McKenna y Martin, 2016 ) Y la tumorigénesis ( Rankin y Giaccia, 2008 ). Otra posible sistema de adaptación humana a ambientes extremos con implicaciones para la investigación investigación hipoxia es la de los
seres humanos que participan en el buceo en apnea.
natural en variantes genéticas en el gen PDE10A han aumentado el tamaño del bazo en el Bajau, suministrándoles un depósito más grande de las células rojas de la sangre oxigenada. También nos encontramos
Las personas Bajau, a menudo referida como nómadas del mar, han vivido una
evidencia de una fuerte selección específico a los bajau en BDKRB2, un
existencia enteramente marina dependiente, recorriendo los mares del sudeste
gen que afecta al buceo humana re fl ejo. Así,
asiático en casas flotantes de más de 1.000 años ( Sather, 1997 ). Su marina existencia de cazadores-recolectores depende mucho de la comida que recogen a través de buceo libre. Ellos son famosos por sus habilidades extraordinarias, el
buceo a profundidades de más de 70 m con nada más que un conjunto de pesos y un par de gafas de madera ( Schagatay, 2014 ) Y el gasto de 60% de su tiempo de trabajo diario bajo el agua ( Schagatay et al., 2011 ). El estilo de vida único de la Bajau se basa en una serie de rasgos culturales e innovaciones técnicas, pero también se puede facilitar mediante adaptaciones fisiológicas a la hipoxia buceo y
submarinismo (inducida Clifton y Majors, 2012; Sopher de 1965 ). Los seres mamíferos de buceo, tienen una respuesta de buceo humanos, al igual que otros mamíferos
INTRODUCCIÓN
inducida p or apnea y de agua fría fría de inmersión facial ( Thornton y Hochachka, 2004;
Los seres humanos son los únicos mamíferos que han colonizado todos los ambientes
bradicardia, lo que disminuye el consumo de oxígeno ( Elsner et al., 1966; Ferrigno
más extremos de la Tierra, desde las cadenas montañosas de gran altitud a las islas
et al., 1997; Kooyman y Campbell, 1972; Lin et al., 1972, 1983 ); periférico
Sterba y Lundgren, 1988 ). Efectos fisiológicos de esta respuesta incluyen
remotas del Pacífico. adaptaciones fenotípicas humanos a ambientes extremos han sido objeto de mucha investigación ( Beall, 2006; Yi et al., 2010 ), En parte porque a nivel local
Celda 173, 569-580, 19 de Abril, 2 018 ª 2018 Elsevier Inc. 569
Figura 1. Bajau frente saluán bazo distribuciones de tamaño y Bajau Spleen Tamaños Strati fi ed por imputado genotipos de los SNP rs3008052 Distribuciones (A) y gráficos de caja de tamaños de bazo en saluán no todo estrechamente relacionados (n = 33) en rojo y Bajau (n = 43) en azul. Las gruesas líneas centrales negras representan las medianas y los límites inferior y superior de las cajas representan el 25 º y 75 º
percentiles, respectivamente. respectivamente. Los valores atípicos no se muestran. (B) el bazo no transformado tamaños de estratificación ed fi por los genotipos imputados de rs3008052 para individuos Bajau solamente (n = 43).
vasoconstricción, que redistribuye selectivamente fl sangre ow a los órganos más
RESULTADOS
sensibles a la hipoxia ( Lin et al., 1983; Zapol et al., 1979 ); y la contracción del bazo, que inyecta un suministro de las células rojas de la sangre oxigenada en el sistema
Bazo tamaño de la diferencia en el Bajau
circulatorio ( Hurford et al., 1996; Stewart y McKenzie, 2002 ). la contracción esplénica
Primero se propusimos identificar si hay evidencia de que los Bajau tienen bazos mayores
como un componente de la respuesta humana de buceo se observó primero en el
que sus vecinos cercanos geográficas, la saluán, que interactúan mínimamente con el
Ama, un grupo de pescadores de perlas japonesas ( Hurford et al., 1990 ) Y está
medio marino. Nos identi fi cados dos pueblos costeros 25 km de di stancia en la península
inducida por una alfa-2 adrenérgicos respuesta mediada por catecolaminas ( Foster y
de Sulawesi central de Indonesia Jaya: Bakti y Koyoan, habitadas principalmente por
Sheel, 2005 ). Una sola contracción contracción expulsa 160 mLa de las células rojas de la sangre,
poblaciones étnicas y Bajau saluán, respectivamente. Se reclutaron 59 Bajau y 34
provocando un aumento de la hemoglobina que corresponde a una
individuos saluán para participar en el estudio, y a partir de cada individuo se recogieron muestras de saliva para mediciones de ADN y de bazo usando una máquina de ultrasonido portátil. Se encontraron 16 individuos Bajau y 1 saluán estar estrechamente
2,8% de aumento -9,6% en el contenido de oxígeno ( Stewart y McKenzie, 2002 ). Por ello se
relacionada con otros de sus respectivas comunidades sobre la base de los datos
ha planteado la hipótesis de que el propósito de esta contracción es proporcionar un impulso
genéticos. Estos individuos fueron excluidos de todos los nuevos análisis ya que la
de oxígeno, lo que prolonga el tiempo de inmersión ( Hochachka, 1986 ). En un estudio de
mayoría se basan en el supuesto de que los individuos analizados no están
especies de focas de buceo, se observó una correlación positiva entre el tiempo de
estrechamente relacionados. WeMade medidas de ultrasonido en dos planos de tal
inmersión máxima y la masa bazo ( Mottishaw et al., 1999 ), Lo que sugiere que el tamaño del
manera que hemos sido capaces de calcular los volúmenes de bazo de acuerdo con la
bazo podría ser un rasgo importante que influye en el tiempo de buceo. Sin embargo, la
metodología descrita en Yetter et al. (2003) que mejor se correlaciona con volúmenes
relación entre el tamaño del bazo y la capacidad de buceo nunca antes ha sido examinada
obtenidos usando una tomografía computarizada (CT). Utilizamos thesemeasurements
en el nivel genético. De hecho, se sabe muy poco sobre las bases genéticas de la respuesta
para comparar tamaños bazo en las dos poblaciones, que revela una diferencia visual
de submarinismo en el ser humano: sólo un estudio ha reclamado nunca para mostrar una
clara, con el tamaño medio de bazo siendo mayor e ntre los bajau ( Figura 1 ). Esta
variante genética que directamente influye en la respuesta de buceo ( Baranova et al., 2017 ).
diferencia fue estadísticamente significativo significativo (Welch t de dos muestras de ensayo, p =
La bradiquinina receptor B2 (BDKRB2), un péptido señal asociado tanto con la vasodilatación
3.538e 07). Cabe destacar que esta diferencia no es signi fi cativa al comparar los buzos
y vasoconstricción, se sugirió para afectar a la vasoconstricción periférica inducida por la
Bajau a Bajau no buceadores (p = 0,2663), lo que sugiere la diferencia entre los bajau y
respuesta de buceo en este estudio ( Baranova et al., 2017 ).
saluán no es simplemente impulsado por el hecho de que los individuos más Bajau son buceadores. Sin embargo, otros factores distintos de si los individuos son buzos pueden afectar a los resultados de la prueba (ver
Es totalmente desconocido si los nómadas del mar están genéticamente adaptado a su estilo de vida extremo. El único rasgo q ue ha sido investigado en poblaciones con un estilo de vida depende de buceo bajo el agua es la visión superior de los niños tailandesa Mar del nómada ( Gisle' n et al., 2003 ). Sin embargo, esta tarde se demostró ser una respuesta
Métodos de STAR y Figura S1 para detalles). Por lo tanto, también a prueba de una
plástica a través de la formación de buceo repetido, replicable en una cohorte Europea ( Gisle' diferencia en el tamaño del bazo entre Bajau y saluán usando un modelo lineal que n et al., 2006 ). En este caso, se utilizó un enfoque de dos vías para abordar la cuestión de
nos permitió tomar factores adicionales en cuenta. Específicamente, Específicamente, se incluyer on
las posibles adaptaciones genéticas en los bajau. En primer lugar, se realizó un análisis de
género, edad, peso, altura, y si los individuos son buzos como covariables. Los
sus genomas para las firmas de selección para identificar los genes que han sido dirigidos
resultados de esta prueba también se indica que Bajau tiene significativamente bazos
únicamente por la selección natural en el Bajau. En segundo lugar, se examinó si alguno
más grandes que el saluán, incluso cuando la corrección de varios posibles factores
de los candidatos loci están asociados con el tamaño del bazo, uno de los rasgos más
de confusión (p = 0,0438, b = 44.40, 21.62 SE, consulte Métodos de STAR para
relevantes candidatos para para la adaptación al buceo li bre y la tolerancia a la hipoxia.
detalles). Estos resultados sugieren una diferencia fisiológica entre la Bajau y la saluán que no es atribuible exclusivamente a una respuesta de plástico del bazo para el buceo
570 Celda 173, 569-580, 19 de Abril, 2018
Celda 173, 569-580, 19 de Abril, 570 570
Figura 2. PCA que muestra la relación genética de los bajau y saluán a Otros Pan-Asia Poblaciones El 43 Bajau y 33 individuos saluán parecen estar más estrechamente
relacionados entre sí (ver Figura S5 para PCs adicionales). En general, agruparse con otras personas austronesios en la región, sino que tenga cierta afinidad a la Melanesia en un gradiente r elacionada con la proximidad geográfica (véase también Lipson et al., 2014 ). Ver también Figura S3 .
Este componente también puede verse en mezcla analiza, presente en niveles que varían a lo largo de los individuos Bajau cuando K> 7 como un componente de color salmón ( figura 3 , Para el análisis de mezcla completa ver Figura S4 ) Que es mucho menos abundante en los individuos saluán. entonces Modelamos la distribución conjunta de frecuencias de los alelos a través de componentes ascendencia como amultivariate gaussiana, de manera similar a los modelos de TREEMIX ( Pickrell y Pritchard, 2012 ) Y Bayenv ( Gu Günther y Coop, 2013 ). A partir de eso, hemos estimado actividad. Mientras que otros factores ambientales desconocidos potencialmente podrían
la población treemost compatible con la matriz de covarianza inferido para K = 19,
explicar la diferencia observada entre los grupos, los factores genéticos sigue siendo una
donde el Bajau y saluán reciben cada uno su propio componente único (ver figura 3 ,
posibilidad.
Detalles sobre los procedimientos de inferencia en Cheng et al. [2016] ).
Población análisis demográficos
Se estimó la historia demográfica conjunta, incluyendo el tiempo de divergencia,
A continuación, se generaron bajo profundidad datos de secuenciación de todo el
de las poblaciones Bajau y utilizando saluán
genoma para los mismos Bajau y saluán individuos y analizaron los datos mediante
fastsimcoal2 ( Excof fi er et al., 2013 ). Este método optimiza una probabilidad
métodos que toman incertidumbre genotipo en cuenta al trabajar directamente en
compuesta del espectro observado joint-frecuencia sitio (SFS) a través de un espacio
probabilidades genotípicas ( Cheng et al, 2016.; Korneliussen et al, 2014.; Skotte et al.,
de alta dimensional de posibles modelos demográficos. Asumimos estas dos
2012 ). A los efectos del análisis de la genética de poblaciones, fusionamos estos datos
poblaciones se separaron de una población ancestral y luego se sometieron a la
con los datos del proyecto del genoma pan-asiática ( Ngamphiw et al., 2011 ) (descrito en Méctoodnotr sacción exponencial o el crecimiento y la migración en tre las dos poblaciones (a Métodos de STAR con resultados adicionales en Figuras S2 y S3 ). de STAR ). Este panel contiene los individuos de una variedad de poblaciones de Asia Pan, pero con un número limitado de SNPs ( 50 k).
Se realizó un análisis de componentes principales (PC) sugiere que los bajau son
genéticamente más cerca de la saluán que a la mayoría de otras poblaciones de Asia, con las posibles excepciones de sus vecinos geográficos (por ejemplo, el Toraja) que también viven en la isla de Sulawesi ( Figura 2 ). Al otro lado de poblaciones más cercanas a la Bajau y saluán, observamos un gradiente de Melanesian a la ascendencia Austronesian, con un componente Melanesian aumento asociado con mayor proximidad geográfica a Melanesia.
Lipson et al. (2014) sugirieron que los componentes ancestrales de la mayoría de estas poblaciones pueden ser modelados como una mezcla entre hablantes de diferentes estratos lenguaje y sustratos hace más de 1.000 años. Combinado con nuestros resultados, parece que una de las principales causas de la diferenciación entre la Bajau y la sal uán, indicado por la separación del Bajau en la dirección de la población Manggarai Rampasasa, podría haber un mayor componente austroasiática (discutido más en
571 Celda 173, 569-580, 19 de Abril, 2018
Celda 173, 569-580, 19 de Abril, 571 571
tasas posiblemente asimétricos) hasta el presente. Encontramos un modelo compatible con los datos que tiene un tiempo de divergencia de 16 kya, con posteriores fromBajau highmigration a saluán y baja migración de saluán a Bajau (para detalles ver Métodos de STAR ). Observamos que la estimación de 16 kya puede reflejar la divergencia de componentes de mezcla viejos compartidos en diferentes proporciones por el saluán y los bajau, al igual que, por ejemplo, las poblaciones europeas están estrechamente relacionados entre sí pero que difieren en la proporción de componentes de mezcla antiguos .
Scan selección Los resultados de nuestros análisis d e genética de poblaciones sugieren que un análisis Selección comparando Bajau y saluán con un grupo de población más divergentes como un grupo externo, como por ejemplo los chinos Han, sería apropiado para detectar
Bajau-específico selección positiva. Debido a que nuestros datos son de una cobertura relativamente baja (en promedio 5 3) y debido a la ausencia de buenas referencias paneles de haplotipos para los bajau, eliminación gradual haplotipo computacional para nuestros datos
probablemente no sería fiable. Además, estudios anteriores han demostrado que los métodos basados en los patrones locales
572 Celda 173, 569-580, 19 de Abril, 2018
Celda 173, 569-580, 19 de Abril, 572 572
Figura 3. Pan-Asian Admixture y árbol Estimación para K = 19, ¿Dónde Bajau y saluán reciben sus propios componentes únicos Ver también Figura S4 .
de alelo diferenciación frecuencia son altamente potente para la detección de la
nos permitió detectar SNPs que se desvían fuertemente en el Bajau de la estructura de
adaptación local ( Fumagalli et al, 2015.; Yi et al., 2010 ). Por lo tanto, nos fusionamos
covarianza de todo el genoma utilizando una prueba de razón de verosimilitud. Para
nuestros datos de secuenciación del Bajau y saluán con Han genomas chinos del
cada SNP, hemos introducido una variable escalar que se multiplica en la varianza
Proyecto 1000 Genomas ( Auton et al., 2015 ) Y realizado una exploración de selección de
asociada con la población Bajau. Esto estableció dos modelos de probabilidad
todo el genoma utilizando un nuevo método para la detección de la selección local,
anidadas: una que asume la fi c cambio de frecuencia alelo Bajau especí se puede
similar a la estadística de PBS ( Yi et al., 2010 ) Pero en base a un modelo de probabilidad
predecir a partir del patrón de covarianza de todo el genoma y uno que permite un
explícita y ajustado a la cuenta para la mezcla y diferentes componentes ancestrales ( Chengcambio más grande en el Bajau (y por tanto una variación mayor en el componente et al., 2016 ). El 'programa '' selscan' proporcionado en el paquete de software Ohana ( ChengBajau) de se espera a partir del patrón de todo el genoma. Se utilizó la prueba de razón et al., 2016 )
573 Celda 173, 569-580, 19 de Abril, 2018
de verosimilitud resultante
Celda 173, 569-580, 19 de Abril, 573 573
Cuadro 1. Los 25 SNPs candidato de l análisis Selección chr
POS
rsid
Gene
Relación de LL
1
62249296
rs55870274
INADL
16.297
Puntuación CADD
1.057
Asociación p Valor 0.9525
relación LL, log de razón de verosimilitud del análisis de selección para cada SNP; puntuación CADD, disruptiveness putativo de cada SNP como se predijo por la herramienta en línea agotamiento anotación dependiente combinado (PHRED-escala); valor p asociación, los valores de p de las pruebas para la asociación con el tamaño del bazo utilizando profundidad secuenciación, altura, peso, edad, sexo, buceo, y el primer 5 PCs como covariables. Cuando un SNP cae dentro de una región génica, el gen relevante aparece en la lista.
identificar loci en el que el Bajau experimentó un cambio mayor de lo esperado en la
albergar la variación genética que ha sido blanco de selección relacionados con
frecuencia de alelos en comparación con la predicción a partir del patrón de todo el
fenotipos de importancia para el buceo.
genoma, que es una firma de selección (ver Métodos de STAR y Figura S5 para más detalles). Observamos que las exploraciones de selección con diseños similares y de manera
Mientras que algunas de las señales de selección única presentes en el Bajau puede estar relacionado con otros factores ambientales, tales como los agentes patógenos, varios de los otros éxitos top también caen en genes candidatos asociados con rasgos
similar muestras de pequeño tamaño han tenido éxito en la identificación de variantes
que pudieran ser importantes para el buceo. Los ejemplos incluyen FAM178B, que
subyacentes importantes adaptaciones fisiológicas en otras poblaciones humanas, como los
codifica una proteína que forma un complejo estable con la anhidrasa carbónica, la
inuit ( Fumagalli e t al., 2015 ) Y tibetanos ( Yi et al., 2010 ). Mientras que los estudios de
principal enzima responsable de mantener el dióxido de carbono equilibrio /
asociación del genoma de ancho (GWAS) deben corregir para las pruebas en todos los
bicarbonato, de ese modo ayudando a mantener el pH de la sangre (y la prevención de
sitios en el genoma, el poder de utilizar la selección natural para la función dilucidar es que
la acumulación de dióxido de carbono) ( De Drew et al., 2017 ); CACNA1A, que está
la única los sitios de fi identificado por la exploración de selección se analizan para
implicado en la regulación de la liberación del neurotransmisor excitador glutamato ( Catterall,
determinar asociaciones fenotípicas, aliviando así la carga de múltiples pruebas.
1998 ) Y la respuesta a condiciones de hipoxia ( Wang et al., 2005 ); y PDE10A, una fosfodiesterasa de nucleótidos cíclicos que participan en la regulación de la contracción del músculo liso, incluida la de que el músculo que rodea el bazo ( Exton, 1981 ).
Sorprendentemente, el primero éxito de nuestra selección de exploración ( tabla 1 ) Es SNP
También se evaluó la importancia funcional de los mejores candidatos SNPs con la
rs7158863, situado justo aguas arriba de BDKRB2, el único gen hasta el momento sugiere
función combinada de anotación dependiente de agotamiento en línea (CADD v1.3) ( Kircher
que se asocia con la respuesta de buceo en los seres humanos ( Baranova et al., 2017 ).
et al., 2014 ). Encontramos varios de ellos que se encuentran en regiones reguladoras,
La variación genética en este gen se cree que está asociada con un aumento de la
incluyendo el plomo CANA1A SNP, que se encuentra en una posición muy conservadas
vasoconstricción periférica, que ayuda a tejidos importantes preferentemente oxigenados
y mentiras
como el cerebro, el corazón y los p ulmones, lo que potencialmente aumentar el tiempo de inmersión. Este resultado sugiere fuertemente que los bajau
574 Celda 173, 569-580, 19 de Abril, 2018
Celda 173, 569-580, 19 de Abril, 574 574
Figura 4. Efecto Tamaño estimaciones obtenidas a partir de datos utilizando imputado lm (A-C) las estimaciones del tamaño del efecto para cinco diferentes subconjuntos de los conjuntos de datos los datos obtenidos usando (A) tamaños de bazo sin transformar, (B) bazo tamaños del cuantil transforma a una distribución normal, y (C)
REGISTRO bazo transformado tamaños cuantil transformado a una normal distribución.
dentro de un factor de transcripción sitio de unión en una región de la cromatina abierta (véase Métodos
usando una prueba de puntuación, que tiene en cuenta la incertidumbre genotipo que es
de STAR para detalles).
inherente a los datos de secuenciación de baja profundidad ( Skotte et al., 2012 ). En estas pruebas, se incluyeron profundidad secuenciación, altura, peso, edad, sexo, buceo, y los
Explorar señales de introgresión adaptativo
primeros 5 PCs de un análisis de PCA que sólo i ncluía los individuos utilizados en la
Con el fin de investigar los posibles orígenes de los alelos seleccionados identificados por
prueba como covariables (véase STARMethods para detalles). Se optó por incluir los
nuestro análisis Selección, hemos aplicado estadísticas que son sensibles a la introgresión
ordenadores con el fin de corregir la estructura de la población. Sólo un SNP era
de adaptación (AI) de los humanos arcaicos. Aplicamos estas estadísticas sobre las
significativamente asociada con el tamaño del bazo en el nivel de significación
ventanas de 100 kb del genoma con un solapamiento de 20 kb ( Martin et al, 2015.;
Bonferronicorrected 5% (0.002): rs3008052, localizado en el gen de la fosfodiesterasa
Racimo et al., 2017 ) Utilizando estimaciones población frecuencia themaximum de
10A (PDE10A) ( tabla 1 ). En particular, la asociación en este SNP es robusto a una serie
probabilidad obtenidos de ANGSD ( Korneliussen et al., 2014 ). Utilizamos Yoruba (YRI)
de factores, incluyendo diferentes transformaciones de los tamaños del bazo así como
como el grupo afuera no i ntrogresión y, o bien el Al tai Neandertal ( PRU fer et al., 2014 ) O
correcciones adicionales para estructura de la población que no sea in cluyendo PCs como
la Denisovan ( Meyer et al., 2012 ) Genomas como la fuente de introgresión. Hemos
covariables (ver Métodos de STAR y Figura S6 ). El efecto del alelo que ha sido favorecida
probado la Bajau como la población objetivo, así como chinos Han y saluán para la
en el Bajau es para un aumento en el tamaño del bazo ( Figura 1 ; para más detalles ver Métodos
comparación. Entonces, buscamos coincidencias entre las primeras regiones en esta
de STAR ), Y el tamaño del efecto parece consistente a través de submuestras de datos y
exploración y la parte superior candidatos identi fi cado en el Ohana análisis Selección.
las transformaciones ( Figura 4 ). PDE10A codifica una fosfodiesterasa de nucleótidos cíclicos que se pueden hidrolizar tanto cAMP y cGMP ( Fujishige et al., 1999 ). Mediante la regulación de la concentración de nucleótidos cíclicos, que desempeña un papel fundamental en la transducción de señales, incluyendo las respuestas alfa-adrenérgicos
Hemos identificado ed una región ChR2 superponen: 97627143, que cae en el
como la contracción de la smoothmuscle que rodea el bazo ( Exton, 1981 ). Nuestra
FAM178B gen, que cae en el cuantil 99% de la distribución de todo el genoma para
principal SNP, rs3008052, se asocia con una variación genética que afecta a la expresión
la f re estadística ( Martin et al., 2015 ). De las poblaciones consideradas, esta región
de PDE10A ( Figura 5 ). PDE10A está más altamente expresado en el tejido neuronal, pero
se encuentra exclusivamente en el Bajau, y l a señal más fuerte aparece cuando se
la asociación más fuerte para rs3008052 es con l a expresión en la glándula tiroides (p =
utiliza como fuente de Denisova. Cabe destacar que esta región también se propuso
0,000016) ( Lonsdale et al., 2013 ), Otro órgano con liberación de hormona de cAMP
como candidato a Denisovan introgresión en poblaciones oceánicas por Sankararaman mediada. Por tanto, el modo más probable de acción se aumenta el tamaño del bazo et al. (2016) . Dos regiones adicionales, que se superponen: 62249296 chr1 y Chr2: Para investigar si alguno de los 25 SNPs de la Ohana scan 116902921, también tenían valores de la Q95 y estadísticas (U20 Racimo et al., 2017 ) Que están en el cuantil 99% de la distribución de todo el genoma para ambos
selección están asociados con el tamaño del bazo, la prueba de asociación
Denisova y Neanderthal. Sin embargo, a diferencia de l a región FAM178B, estas señales también están presentes en chinos Han y la saluán y so n por lo tanto no específica a la Bajau. Notablemente, no hay evidencia de introgresión arcaica en PDE10A o BDKRB2.
Prueba de Asociación
575 Celda 173, 569-580, 19 de Abril, 2018
Celda 173, 569-580, 19 de Abril, 575 575
como consecuencia de un aumento de los niveles de hormona de la tiroides.
PDE10A y Bazo Tamaño Para investigar más a fondo el modo de acción de PDE10A, se analizó el bazo de tamaño superior asociado SNPs partir de los datos Bajau en el Biobanco del motor Global (Global Biobanco del motor, Stanford, CA; https://biobankengine.stanford.edu/ , Octubre 2017). Este motor contiene una gran cantidad de asociación de casos y controles
576 Celda 173, 569-580, 19 de Abril, 2018
Celda 173, 569-580, 19 de Abril, 576 576
Figura 5. Un simultáneos en horas punta en la selección, de asociación y de expresión Scans marca la ubicación de l SNP de interés en PDE10A, rs3008052 Top: posición genómica asignada contra el cociente de probabilidad de registro, una medida de pruebas de selección. En el panel central, la posición se representa frente a -log los SNP y el tamaño del bazo. Inferior: posición se representa fr ente a -log
10 (
10 (
valor p) a partir de las pruebas de asociación entre
valor p) de las pruebas para la asociación entre los SNPs y la expresión fi c tiroides-específico de PDE10A. Los valores de la expresión de P son de Gtex
( Lonsdale et al., 2013 ).
Los resultados del hospital Biobanco del Reino Unido en los resultados del paciente
Sin embargo, los niveles de hormonas tiroideas (TH) han sido fuertemente ligada a tamaño
relacionados con la salud de datos de información de resumen. Por desgracia, nuestra
del bazo en ratones. En una serie de estudios, el efecto de la TH en el tamaño del bazo se
principal SNP no está presente en estos datos, por lo que hemos examinado SNPs en
ha investigado a través del gen pax8,
que controla la producción de folículos en el tiroides en desarrollo. pax8 / ratones
alta desequilibrio de ligamiento (LD) con nuestro SNP; los tres SNPs más altamente correlacionados en la región 1-MB circundante (rs2983527, rs3008050, rs3008049 y con r
2
knockout, exhibiendo hipotiroidismo congénito profunda (una ausencia casi completa
valores de 0,8501, 0,6402, y 0,6140, respectivamente). Se encontró que los tres SNPs
de T4 y T3), mostraron una reducción drástica en el tamaño del bazo ( Angelin-Duclo s
son significativamente asociado con hipotiroidismo a nivel de signi fi cación 5% después
et al., 2005; Flamant et al., 2002 ). Curiosamente, la pequeña fenotipo bazo se
de la corrección de Bonferroni (p = 0,0017, p = 0,00011, y P = 0,0043), y el alelo
demostró que era parcialmente reversible a través de la inyección de TH ( Angelin-Duclo s
favorecido en el Bajau conduce a una disminución en el hipotiroidismo en toda tres SNP.
et al., 2005 ). En apoyo adicional de la relación entre TH y el tamaño del bazo, los ratones tratados con T4 a arti fi inducir cialmente hipertiroxinemia han mostrado aumentos significativos en el peso del bazo en periodos de 8 y 32 semanas (p <0,001
Hasta la fecha, no ha habido informes sobre la relación entre los niveles de l as
para ambos períodos de tiempo) ( Watanabe et al., 1995 ).
hormonas tiroideas (tiroxina [T4], que se convierte en la forma activa de triidothyronine [T3]) y el tamaño del bazo en los seres humanos.
577 Celda 173, 569-580, 19 de Abril, 2018
Celda 173, 569-580, 19 de Abril, 577 577
A fin de probar la hipótesis de una asociación entre los SNPs seleccionados en los
de alta frecuencia en Bajau (37,1%), que también segrega a frecuencias apreciables
niveles de PDE10A y de la hormona tiroidea, que se convirtió a la 500-FGcohort de
en tanto Saluans (6,7%) y chinos Han (3,0%). La ubicuidad de este SNP en alguna
thehuman funcional Proyecto Genomics ( ter Horst et al., 2016 ), Que ha sido genotipo
frecuencia a través de estas poblaciones sugiere que la selección puede haber
utilizando un chip de SNP (Illumina HumanOmniExpressExome-8 v1.0) y para la que
ocurrido cuando rs3008049 era una variante de pie, segregando neutral en todas
T4 y la hormona estimulante del tiroides (TSH se han medido) las concentracione s
estas poblaciones antes de la selección en el Bajau. Para rs7158863, nuestra mayor
(véase Métodos de STAR para detalles). Observamos que esta cohorte proviene de
éxito en la exploración de selección, se estima este a lelo sea al 18,3% en el Bajau y
una población europea que está muy divergentes de la Bajau, con una estructura de
<1%, o esencialmente nonsegregating, tanto en el Saluans y chinos Han.
haplotipos potencialmente diferente, y por lo tanto que la validación en esta cohorte puede ser difícil. No obstante, la prueba de asociación utilizando una técnica de regresión lineal como se aplica en el paquete Matrix eQTL R ( Shabalin, 2012 ). El
Con el fin d e probar si las diferencias de frecuencia de alelo inter-población observados
método se aplicó a 'dosificación' imputada '' de datos de SNP, donde en la imputación
son debidos a la deriva o error de muestreo en lugar de la selección, se utilizó el modelo
los genotipos no son llamados discretamente, pero son valores en lugar dado entre 0
inferido aislamiento-con-migración demográfica para simular la evolución de alelos neutros
y 2 en cada individuo. Los individuos que estaban relacionadas o que tenían
virtud de la selección de una variante de pie. Hemos encontrado que estas diferencias de
ascendencia no europea se eliminaron, y las pruebas se corrigieron para la edad,
frecuencia son poco probable debido a la deriva o error de muestreo (p <0,001 y p <0,024
sexo, índice de masa corporal, y el uso de anticonceptivos orales mediante la
para PDE10A y BDKRB2, respectivamente, vemos Métodos de STAR para detalles). A
inclusión de estos factores como covariables. Se examinaron cuatro SNP: el plomo
continuación, prueba el grado en que la selección puede haber llevado a estos cambios de
SNP, rs3008052 y otros tres SNPs en alto LD en los europeos con rs3008052
frecuencia alelo mediante la cuantificación de la fuerza y el momento de este evento
(rs2983527,
selectivo potencial.
rs3008050 y
Con el fin de encajar de forma explícita t un modelo de selección en pie variación a estas
rs3008049). Todos estos SNPs tienen asociaciones significativas con hipotiroidismo
frecuencias de los alelos, simulamos las trayectorias de frecuencia de alelos bajo el mismo
en el Biobanco de datos globales del motor. Para el SNP PDE10A superior,
modelo de aislamiento-con-migración, variando los valores de los tres parámetros: (1) s, el
rs300805 2, encontramos una, signi fi clara asociación no puede (p = 0,0017), con el
ciente selección coef fi, (2) t, el tiempo en el que la selección comenzó a actuar e n el alelo, y
alelo en una frecuencia más alta en el Bajau associatedwith elevada T4 circulante s
(3) F, la frecuencia del alelo en el momento divergencia. Hemos encontrado que el alelo
concentraciones plasmáticas. También encontramos asociaciones significantes en los
PDE10A tiene una diferencia de frecuencia compatible con una moderadamente fuerte
SNPs de alta LD, así como asociaciones negativas con concentraciones de TSH
ciente selección de coe fi s = 0.005 que actúa sobre una variante de pie ( f = 0.02),
(véase Figura S7 ). Se espera que la correlación negativa entre las asociaciones con
comenzando aproximadamente en el momento de divergencia ( t = 15,4 kya) ( Figura 6 ).
las concentraciones de T4 y TSH debido a la retroalimentación negativa conocida
Estas estimaciones, lo que sugiere una variante barrido froma de pie, son concordantes con
entre T4 y TSH.
la frecuencia del alelo en los paneles de un número de otras poblaciones, como los chinos Han, cuya ruptura con los bajau es anterior a la división Bajau-saluán. También hallamos el
No hay estudios GWAS de tamaño del bazo a cabo en cualquier otras poblaciones que
alelo BDKRB2 tiene una diferencia de frecuencia compatible con una fuerte selección
allowus todirectly validar la asociación con el tamaño del bazo. Sin embargo,
coeficiente de s = 0,01 actúa sobre una variante de baja frecuencia ( f = 0,0001) también
exploraciones de MRI abdominal han llevado a cabo en un estudio para evaluar la
comenzando aproximadamente en el momento de divergencia ( t = 15.4 kya). Es importante
incidencia de la esteatosis hepática en la cohorte de 300-OB (ver STARMethods para más
tener en cuenta que debido a las variantes de plomo p ueden no ser las variantes causales,
detalles sobre la cohorte) .Wewere capaz de estimar tamaños de bazo de los individuos
esto podría afectar nuestras estimaciones y el sesgado hacia nuestras conclusiones
en esta cohorte de imágenes theMRI, y que probamos asociación tamaño del bazo para
selección a partir de la variación de pie e n lugar de de novo mutación. Como una
los mismos cuatro SNPs como se usa en la prueba de asociación T4. No hay que esperar
comprobación adicional, por lo tanto examinamos la anchura de los picos de razón de
necesariamente una asociación en esta cohorte, debido a sus diferentes antecedentes
verosimilitud para el SNP plomo en PDE10A andBDKRB2 mediante el cálculo de la distancia
genéticos, pero rs3008050 y rs3008049weremarginally associatedwith tamaño del bazo,
entre los dos SNPs más distantes que definen la región de barrido. Encontramos las
igualando la asociación encontrada en el Bajau, con valores de p de límite de significación
anchuras de los picos a ser extremadamente corto (5583 pb y 2825 pb, respectivamente),
(p = 0.05083andp = 0,06493). Por desgracia, rs3008050 no estaba presente en los datos
proporcionando evidencia adicional de un barrido de pie variación.
Bajau. Sin embargo, rs3008049 está presente y tiene una a sociación fi no puede altamente signi con el tamaño del bazo (p = 0,00043) en el Bajau. El valor p combinado de los dos estudios (utilizando el método de Fisher) para rs3008049 es 2.79e 05, proporcionando una fuerte evidencia de una asociación con el tamaño del bazo en la región con la evidencia de la selección natural en PDE10A. Incluso tras la corrección de
Bonferroni para el hecho de q ue hemos investigado dos SNPs con un solapamiento entre los dos conjuntos de datos (rs3008052 y rs3008049), así como la proyección original se
DISCUSIÓN
basó en 25 SNPs en 25 genes, los resultados siguen siendo significativo (p = 0,00073). En este estudio, identificamos varios genes candidatos para la adaptación al buceo en apnea en el Bajau. Hemos investigado uno de los genes candidatos, PDE10A, en detalle, y el resto permanecerá objetivos prometedores para futuros estudios. En la región de PDEA10, se encuentra que los SNPs en el pico de exploración de
La historia evolutiva de los loci seleccionados
selección están asociados con la función de la tiroides y el tamaño del bazo. Dado que las
El rs3008049 SNP, que ha estado bajo selección en el Bajau, también tiene una
hormonas tiroideas regulan la eritropoyesis normal durante el desarrollo postnatal temprano ( Angelin-Duclos
amplia distribución geográfica. Si bien se produce a una
et al., 2005 ),
578 Celda 173, 569-580, 19 de Abril, 2018
Celda 173, 569-580, 19 de Abril, 578 578
UN
Figura 6. estimado fuerza y la sincronización de la selección
segundo
para los alelos seleccionados e n PDE10A y BDKRB2 (A y B) Las probabilidades para la (A) (B) BDKRB2 PDE10A y alelos, xing fi f = 0,03, 0,0001, respectivamente.
(C y D) Las probabilidades antes mencionados a escala utilizando la probabilidad previa de un alelo neutral segregantes a la frecuencia f (p (f) F 1 / f), y fi jación
f = 0,02, 0,0001 para (C) PDE10A y (D) BDKRB2, respectivamente.
nuevas prácticas culturales, lo que ilustra que la cultura humana y la biología han sido coevolving
re
do
durante miles de años. Además, como tanto de las adaptaciones en la Bajau descritos anteriormente se refieren a tolerancia a la hipoxia, pueden ser de fi relevancia médica significativa (por ejemplo, proporcionando una nueva comprensión de la relación entre la hipoxia, la función tiroidea, el volumen celular, y el tamaño del bazo). Estudios previos utilizando poblaciones localmente adaptadas para investigar la genética subyacente de la tolerancia a la hipoxia y los procesos fisiológicos relacionados con los seres humanos se han centrado casi exclusivamente en las poblaciones de gran altitud (revisado en McKenna y Martin, 2016 ). El Bajau, y otra buceo dependiente
el fenotipo gran bazo observado en el Bajau puede ser indicativo de un mayor volumen
poblaciones, exhiben un nuevo sistema de adaptaciones fisiológicas humanas a
de las células eritrocitarias. El genotipo seleccionado podría proporcionar una ventaja
condiciones ambientales no exploradas con anterioridad.
fenotípica de 2 veces de tanto un aumento de la cantidad de células oxigenadas y un depósito mayor en el que para almacenarlos. Alternativamente, el tamaño del bazo más grande puede ser simplemente un efecto secundario del volumen celular aumentado.
STAR y Métodos
Independientemente, el cambio fisiológico resultante parece haber proporcionado una adaptación funcional a las condiciones de hipoxia aguda que es característico de buceo
Métodos detallados se proporcionan en la versión en línea de este documento e incluyen los
apnea.
siguientes:
La mayoría de la evidencia sugiere que las adaptaciones que observamos en los bajau
re RECURSOS clave de la tabla
provienen de pie variación. En primer lug ar, las variantes en los genes candidatos como
re
Contacto para reactivos y el intercambio de recursos
PDE10A y BDKRB2 tienen una amplia distribución geográfica. Aunque puede que no
re
Modelo experimental y los detalles del sujeto
tengamos identi fi cado las variantes causales en estos genes, no parece estar asociado
re
MÉTODO DE DATOS
con variantes particulares a los bajau las señales de selección. Nuestras inferencias
segundo
basadas en modelos también son compatibles con la selección que actúa sobre el pie
segundo muestras europeas
variación. Además, la variante en FAM178B puede originarse introgresión fromadaptive,
re
muestras de Indonesia
Cuantificación y análisis estadístico
posiblemente fromDenisovans, mientras que el PDE10A y BDKRB2 variantes probable es
segundo
leer procesamiento
que no lo hacen.
segundo
estimación de la tasa de error
segundo la
En general, nuestros resultados sugieren que los Bajau han sido objeto de adaptaciones únicas asociadas con el tamaño del bazo y la respuesta de submarinismo,
estimación de la relación
segundo
Los análisis de genética de poblaciones
segundo
Las pruebas para detectar una diferencia en el tamaño del bazo entre Bajau
y saluán
añadiendo nuevos ejemplos a la lista de notables adaptaciones genéticas seres
análisis selección Bajau usando Ohana
humanos han experimentado en la historia evolutiva reciente. Similar a otros de lo
segundo
humano adaptaciones más extrema han experimentado, como la adaptación a la dieta
segundo
asociada con el pastoreo ( Ranciaro et al., 2014 ) O los cambios en la disponibilidad de
segundo
recursos alimenticios del medio ambiente ( Fumagalli et al., 2015 ), Estas adaptaciones
segundo asociación segundo La
genéticas han surgido como consecuencia de re
579 Celda 173, 569-580, 19 de Abril, 2018
anotación funcional de SNPs seleccionados Spleen asociación de ensayo tamaño de ensayo La hormona tiroidea
estimación de la fuerza y el momento de la selección
Datos y el software DISPONIBILIDAD
Celda 173, 569-580, 19 de Abril, 579 579
INFORMACIÓN SUPLEMENTARIA
Auton, A., Brooks, LD, Durbin, RM, Garrison, EP, Kang, HM, Korbel, JO, Marchini, JL, McCarthy, S., McVean, GA, y Abecasis, GR; 1000 Genomas Consorcio del Proyecto (2015). Una referencia global para la variación
Información adicional incluye siete figuras y dos tablas y se puede encontrar con este artículo en línea en https://doi. org e/1n0é.t1ci 0a16 h/uj.m cealnl.2a0 .N 18a.t0u3ra.0le5z4a 526, 68-74. . Un resumen de vídeo está disponible en https://doi.org/10.1016/j.cell.2018.03. # 054 mmc3 . Baranov a, TI, Berlov, DN, Glotov, OS, Korf, EA, Minigalin, A D, Mitrofanova, AV, Ahmetov, II y Glotov, AS (2017).
determinación genética de las reacciones vasculares en los seres humanos en respuesta a la buceo re fl ex. A.m. J. Physiol. Circ corazón. Physiol. 312, H622-H631. EXPRESIONES DE GRATITUD
Agradecemos a Richard Dougherty para la consulta de imágenes médicas, Yani Mile y mardiyanto Saahi de asistencia en Indonesia, y los residentes de Jaya Bakti y Koyoan por su participación y apoyo, especialmente
Beall, CM (2006). Andino, tibetano, y los patrones de Etiopía de la adaptación a la hipoxia de altura. Integr. Comp. Biol. 46, 18-24. Beall, CM, Cavalleri, GL, Deng, L., Elston, RC, Gao, Y., Knight, J., Li, C., Li,
Kepala Desa Hasan y Pai Bayubu. También nos gustaría r econocer GenomeDK HPC Hub en la Universidad de Aarhus y su personal, el personal de la Nacional de Alto rendimiento de secuenciación de ADN Centro Danés,
JC, Liang, Y., McCormack, M., et al. (2010). La selección natural en EPAS1 (HIF2alpha) asociado con baja
los técnicos de laboratorio del Centro de GeoGenetics, y Kurt Kjær para obtener ayuda con el diseño gráfico.
concentración de hemoglobina en las tierras altas tibetano. Proc. Natl. Acad. Sci. Estados Unidos 107, 11459 a
Los autores desean agradecer al laboratorio Rivas para hacer el recurso global Biobanco de motor disponible.
11464. Catterall, WA (1998). Estructura y función de Ca2 + canales neuronal y su papel en la liberación de
Agradecemos Marinette van der Graaf para la asistencia en la resonancia magnética y Vincenzo Positano del
neurotransmisores. Cell Calcium 24, 307-323. Chang, CC, Chow, CC, Tellier, LC, Vattikuti, S., Purcell, SM, y Lee,
Instituto de Fisiología Clínica del CNR, Pisa, Italia, para que nos proporciona el hipopótamo gordo. Este proyecto
JJ (2015). La segunda generación de PLINK: responder al reto de conjuntos de datos más grandes y más ricos.
fue apoyado por la Fundación Lundbeck, la Fundación de Investigación Nacional de Dinamarca (DNRF94), la
Gigascience 4, 7.
Fundación Nacional de Ciencia de Dinamarca (UNF 109931), y KU2016. El estudio de la 500FG HFGP se apoya en un (ERC) subvención consolidador Consejo Europeo de Investigación (CEI 310372) a Cheng, JY, Mailund, T., y Nielsen, R. (2016). Ohana, un conjunto de herramientas para la población análisis genéticos de componentes de mezcla. bioRxiv. https://doi.org/10. 1101/071233 .
MGN El estudio 300-OB fue apoyado por una beca EN-CONTROL CVON (CVON2012-03) de la Fundación
Clifton, J., y Majors, C. (2012). La cultura, la conservación y el conflicto: perspectivas sobre la protección del
Holandesa del Corazón de MGN y
medio marino, entre los bajau del sudeste de Asia. Soc. Nat. Resour. 25, 716-725.
LABJMGN fue apoyado por una beca de Spinoza de la Organización Holandesa para la Investigación científica. EW gracias St. Johns College, Cambridge, para proporcionar un entorno estimulante para la discusión científica fi co.
ENCODE Consorcio del Proyecto (2012). Una enciclopedia integrada de elementos de ADN en el genoma humano. Naturaleza 489, 57-74. Coop, G., Witonsky, D., Di Rienzo, A., y Pritchard, JK (2010). El uso de
CONTRIBUCIONES DE AUTOR
MAI concebido del proyecto. MAI y EW inició el proyecto. MAI,
correlaciones ambientales para identificar loci adaptación local subyacente. Genética
185, 1411-1423.
RN, y EW diseñó el estudio. SS proporcionó apoyo logístico en Indonesia. MAI y PdBD recogieron las muestras
Davydov, EV, Goode, DL, Sirota, M., Cooper, GM, Sidow, A., y Batzoglou, S. (2010). La identificación de una
y preparó el ADN para la secuenciación con AS-OSR procesa los datos de secuenciación. RN supervisó todos
alta fracción del genoma humano a estar bajo restricción selectiva usando GERP ++. PLoS Comput. Biol. 6, e1001025.
los análisis computacionales, que se realizaron por IM, JC, TSK,
DePristo, MA, Banks, E., Poplin, R., Garimella, KV, Maguire, JR, Hartl, C., Philippakis , AA, del Angel, G., Rivas, MA, Hanna, M., et al. (2011). Un marco para el descubrimiento de la variación y la genotipificación utilizando los
MS, AJS, FR, y MAIMGN y LABJ diseñado y coordinado los estudios 300-OB y 500-FG dentro de la HFGP, para los que ICLvdM y Rth recoge las muestras y se analizaron los datos. MAI, RN, y EW escribió el manuscrito con el aporte de todos los autores. RN y EW supervisado el proyecto.
datos de secuenciación de ADN de próxima generación. Nat. Gineta. 43, 491-498. Drew, K., Lee, C., Huizar, RL, Tu, F., Borgeson, B., McWhite, CD, Ma, Y., Wallingford, JB, y Marcotte, EM (2017). La integración de más de 9.000 experimentos de espectrometría de masas construye un mapa global de complejos de proteínas humanas. Mol. Syst. Biol. 13, 932.
Declaración de intereses
Los autores declaran no tener conflictos de intereses.
Elsner, R., Franklin, DL, Van Citters, RL, y Kenney, DW (1966). defensa contra la asfixia
cardiovascular. Ciencia 153,
941-949. Excof fi er, L., Dupanloup, I., Huerta-Sa' Sánchez, E., Sousa, VC, y Foll, M. (2013). inferencia Recibido: 21 de julio 2017 Revisado: 1
demográfica robusto a partir de datos genómicas y de SNP. PLoS Genetics 9.
Enero 2018 Aceptado: 21 Marzo 2018 Publicado: 19 Abril 2018 Exton, JH (1981). Los mecanismos moleculares implicados en las respuestas alfa-adrenérgicos. Mol. Celda. Endocrinol. 23, 233-264. Ferrigno, M., Ferretti, G., Ellis, A., Warkander, D., Costa, M., Cerretelli, P., y Lundgren,
Referencias
Aguirre-Gamboa, R., Joosten, I., Urbano, PCM, van der Molen, RG, van Rijssen, E., van Cranenbroek, B., Oosting, M., Smeekens, S., Jaeger, M., Zorro , M., et al. (2016). Efectos diferenciales de factores genéticos y ambientales en los teléfonos rasgos inmunes T y B. Cell Rep. 17, 2474-2487.
CE (1997). Los cambios cardiovasculares durante las inmersiones en apnea profundos en una cámara de presión. J. Appl. Physiol. 83, 1282-1290. Flamant, F., Poguet, AL, Plateroti, M., Chassande, O., Gauthier, K.,
Streichenberger, N., Mansouri, A., y Samarut, J. (2002). Pax8 hipotiroidismo congénito (- / -) ratones mutantes puede ser rescatado mediante la inactivación del gen TRalpha. Mol. Endocrinol. dieciséis, 24-32.
Allentoft, ME, Sikora, M., Sjögren, KG, Rasmussen, S., Rasmussen, M., Stenderup , J., Damgaard, PB, Schroeder, H., Ahlstro¨ m, T., Vinner, L. , et al. (2015). genómica de la población en edad de bronce Eurasia. Naturaleza 522,
Foster, GE, y Sheel, AW (2005). La respuesta de buceo humano, su función, y su control. Scand. J. Med. Sci.
167-172.
Deportes 15, 3-12. Fujishige, K., Kotera, J., Michibata , H., Yuasa, K., Takebayashi, S., Okumura,
Angelin-Duclos, C., Domenget, C., Kolbus, A., Beug, H., Jurdic, P., y Samarut, J. (2005). La hormona tir oidea T3 actuando a través de la hormona tiroidea un receptor es necesaria para la implementación de la eritropoyesis en
K., y Omori, K. (1999). Clonación y caracterización de una fosfodiesterasa humana novedosa que hidroliza tanto
el entorno del bazo neonatal en el ratón. Desarrollo 132, 925-934.
AMPc y GMPc (PDE10A). J. Biol. Chem.
274, 18.438 a 18.445.
580 Celda 173, 569-580, 19 de Abril, 2018
Celda 173, 569-580, 19 de Abril, 580 580
Fumagalli, M., Moltke, I., Grarup, N., Racimo, F., Bjerregaard, P., Jørgensen,
McKenna, H., y Martin, D. (2016). Sobrevivir a estrés fisiológico: ¿Pueden los conocimientos sobre la adaptación
ME, Korneliussen, TS, Gerbault, P., Skotte, L., Linneberg, A., et al. (2015). Inuit de Groenlandia muestran las
humana a condiciones adversas pueden aplicar a la unidad de cuidados intensivos? Tendencias Anestesia Crit.
firmas genéticas de la dieta y la adaptación al clima. Ciencia 349, 1343-1347.
Cuidado 11, 6-13. Meyer, M., Kircher , M., Gansauge, MT, Li, H., Racimo, F., Mallick, S., Schraiber, JG, Jay, F., Pru fer, K., de Filippo, C. , et al. (2012). Una secuencia del genoma de alta cobertura de un individuo Denisovan
Gisle' n, A., Dacke, M., KRO ger, RH, Abrahamsson, M., Nilsson, D.-E., y garantiza, EJ (2003). Superior visión
arcaico. Ciencia 338,
bajo el agua en una población humana de los gitanos del mar. Curr. Biol. 13, 833-836.
222-226. Gisle' n, A., Warrant, EJ, Dacke, M., andKro¨ ger, RH (2006). entrenamiento visual mejora la visión bajo el agua
Mottishaw, PD, Thornton, SJ, y Hochachka, PW (1999). El mecanismo de respuesta de submarinismo y su
en los niños. Vision Res. 46, 3443-3450. Grocott, M., Richardson, A., Montgomery, H., y Mythen, M. (2007).
trayectoria evolutiva sorprendente en focas y leones mari nos. A.m. Zool. 39, 434-450.
Caudwell Xtreme Everest: un estudio de campo de la adaptación humana a la hipoxia. Crit. Cuidado Netea, MG, Joosten, LA, Li, Y., Kumar, V., Oosting, M., Smeekens, S., Jaeger, M., Ter Horst, R., Schirmer,
M.,
11, 151.
Vlamakis, H., et Alabama. (2016). La comprensión de la función inmune humano utilizando los recursos del
Günther Gu, T., andCoop, G. (2013). Robust fi cación de la adaptación local de frecuencias de los alelos.
Proyecto de Genómica Funcional Humana. Nat. Medicina. 22, 831-833. Ngamphiw, C., Assawamakin, A., Xu, S.,
Genética 195, 205-220.
Shaw, PJ, Yang, JO, Ghang , H., Bhak, J., Liu, E., y Tongsima, S .; SNP Consortium HUGO Pan-As ia (2011). PanSNPdb: la base de datos de genotipos SNP pan-asiática. Más uno 6,
Hochachka, PW (1986). Equilibrio con fl demandas ictingmetabolic de ejercicio y el buceo. Alimentado. Proc. 45, 2948-2952. Hoffman, MM, Buske, DO, Wang, J., Weng, Z., Bilmes, JA, andNoble, WS (2012). patrón de descubrimiento no e21451. supervisada en estructura de la cromatina humana a través de la segmentación genómico. Nat. métodos 9, 473-476. Oosthuyse, B., Moons, L., Storkebaum, E., Beck, H., Nuyens, D., Brusselmans, K., Van Dorpe, J., Hellings, P., Gorselink, M., Heymans, S. , et al. (2001). Supresión del elemento de hipoxia-respuesta en el promotor del factor
Holewijn, S., den Heijer, M., Swinkels, DW H, Stalenhoef, AF , y de Graaf, J. (2010). La apolipoproteína B, colesterol no HDL y colesterol LDL para identificar individuos con mayor riesgo
cardiovascular. J. Intern. Medicina. 268,
131-138.
567-577. R Development Core Team (2008). R: Un lenguaje y entorno de computación estadística (R Fundación para la
Computación de Estadística). Hurford, WE, Hong, SK, Park, YS, Ahn, DW, Shiraki, K., Mohri, M., y Zapol, WM (1990). la contracción
de crecimiento endotelial vascular causa la degeneración de las neuronas motoras. Nat. Gineta. 28,
Orlando, L., Ginolhac, A., Zhang, G., Froese, D., Albrechtsen, A., Stiller, M., Schubert, M., Cappellini, E., Petersen, B., Moltke I., et al. (2013). Volver a calibrar la evolución del Equus utilizando la secuencia del genoma de un caballo a principios del Pleistoceno Medio. Naturaleza 499, 74-78.
esplénica
durante el buceo en apnea en el ama de Corea. J. Appl. Physiol. 69, 932-936. Peng, Y., Yang, Z., Zhang, H., Cui, C., Qi, X., Luo, X., Tao, X., Wu, T.,
Ouzhuluobu, Basang, et al. (2011). Las
variaciones genéticas en las poblaciones tibetanas y la adaptación a gran altitud en el Himalaya. Mol. Biol. Evol. 28, Hurford, WE, Hochachka, PW, Schneider, RC, Guyton, GP, Stanek, KS, Zapol, DG, Liggins, GC, y Zapol, WM (1996). contracción esplénica, la liberación de catecolamina, y la redistribución del volumen sanguíneo durante el buceo en el sello de Weddell. J. Appl. Physiol. 80, 298-306.
1075-1081. Pickrell, JK, y Pritchard, JK (2012). Inferencia de la población se divide andmixtures de datos de frecuencia de alelo de todo el genoma. PLoS Genet. 8, e1002967. PRU fer, K., Racimo, F., Patterson, N., Jay, F.,
Sankararaman, S., Sawyer, S., Heinze, A ., Renaud, G., Sudmant , PH, de Filippo, C ., et al. (2014). La secuencia Kircher, M., Witten, DM, Jain, P., O'Roak, BJ, Cooper, GM, y Shendure,
del genoma completo de un Neanderthal de las montañas de Altai. Naturaleza
J. (2014). Un marco general para la estimación de la patogenicidad relativa de variantes genéticas humanas. Nat. Gineta. 46, 310-315.
505, 43-49.
Kooyman, GL, y Campbell, BM (1972). Las frecuencias cardíacas en las focas de Weddell libremente buceo,
Leptonychotes weddelli. Comp. Biochem. Physiol. UN 43, 31-36. Korneliussen, TS, y Moltke, I. (2015). NgsRelate: una herramienta de software par a la estimación de la relación de pares de datos de secuenciación de próxima generación. bioinformática 31, 4.009-4.011.
Quinlan, AR, y Hall, IM (2010). BEDTools: un conjunto flexible de servicios públicos para la comparación de las
características genómicas. bioinformática 26, 841-842. Racimo, F., Marnetto, D., y Huerta-Sa' Sánchez, E. (2017). Firmas de introgresión adaptativo arcaico en las poblaciones humanas actuales. Mol. Biol. Evol. 34, 296-317.
Korneliussen, TS, Albrechtsen, A., andNielsen, R. (2014). ANGSD: análisis de los datos de secuenciación de nueva generación. BMC Bioinformatics 15, 356. Li, H. (2013). secuencia Alineación de lee, secuencias de clon y contigs de montaje con BWA-MEM. arXiv, arXiv:
1303.3997.
Ranciaro, A., Campbell, MC, Hirbo, JB, Ko, W.-Y., Froment, A., Anagnostou, P., Kotze, MJ, Ibrahim, M., Nyambo, T., Omar, SA, y Tishkoff, SA (2014). orígenes genéticos de la persistencia de la lactasa y la propagación del pastoreo en África. A.m. J. Hum. Gineta. 94, 496-510. Rankin, EB, y Giaccia, AJ (2008). El papel de los factores inducibles por hipoxia en la tumorigénesis. La muerte celular Differ. 15, 678-685. Sankararaman,
Li, H., Handsaker, B., Wysoker, A., Fennell, T., Ruan, J., Homer, N., Marth, G., Abecasis, G., y Durbin, R .; 1000 Proyecto del Genoma de procesamiento de datos de subgrupos (2009). El formato de alineación de secuencias / mapa y SAMtools. bioinformática 25, 2078-2079.
S., Mallick, S., Patterson, N., y Reich, D. (2016). El paisaje combinado de Denisovan y Neanderthal linaje en los seres humanos de hoy en día. Curr. Biol. 26, 1241-1247.
Lin, YC, Matsuura, DT, y Whittow, GC (1972). variación respiratoria de la frecuencia c ardíaca en el león marino
de California. A.m. J. Physiol. 222, 260-264. Lin, YC, Shida, KK, y Hong, SK (1983). Efectos de la hipercapnia, la hipoxia y de nueva respiración sobre la respuesta circulatoria a la apnea. J. Appl. Physiol. 54,
Sather, C. (1997). El Bajau Laut: Adaptación, historia y destino en una Sociedad de Pesca Marítima de Sabah Oriental-Sur (Oxford University Press). Schagatay, E. (2014). la capacidad de buceo en apnea humana y la
172-177.
fisiología subyacente. Tararear. Evol. 29, 125-140.
Lipson, M., Loh, P.-R., Patterson, N., Moorjani, P., Ko, Y.-C., Stoneking, M., Berger, B., y Reich, D. (2014). La
reconstrucción de la historia de la población en la isla de Austronesio el sudeste de Asia. Nat. Commun. 5, 4689.
Schagatay, E., Lodin-Sundstro¨ m, A., andAbrahamsson, E. (2011). tiempos de trabajo bajo el agua en dos grupos de buceadores de apnea tradicionales en Asia: el Ama y los bajau. Hyperb buceo. Medicina. 41, 27-30.
Lonsdal e, J., Thomas, J., Salvato re, M., Phillips, R., Lo, E., Shad, S., Hasz, R., Walters , G., García, F., Young,
Schubert, M., Lindgreen, S., andOrlando, L. (2016). AdapterRemoval v2: rápida adaptador de recorte, la identi fi
N., et al .; Gtex Consortium (2013). El proyecto de Expression genotipo-tisular (Gtex). Nat. Gineta. 45, 580-585.
cación, y leer la fusión. BMC Res. notas 9, 88. Shabalin, AA (2012). Matrix eQTL: análisis eQTL ultra rápido a
Martin, SH, Davey, JW, y Jiggins, CD (2015). Evaluar el uso de estadísticas ABBA-BABA para localizar los loci
través de operaciones largematrix. bioinformática 28, 1353-1358.
de introgresión. Mol. Biol. Evol. 32, 244-257.
581 Celda 173, 569-580, 19 de Abril, 2018
Celda 173, 569-580, 19 de Abril, 581 581
Siepel, A., Bejerano, G., Pedersen, JS, Hinrichs, AS, Hou, M., Rosenbloom,
Wang, V., Davis, DA, Haque, M., Huang, LE, y Yarchoan, R. (2005). génica diferencial regulación por
K., Clawson, H., Spieth, J., Hillier, LW, Richards, S., et al. (2005). conservado evolutivamente elementos en
hipoxia-inducible factor 1 alfa inducible por hipoxia y factor de 2 alfa en células HEK293T. Cancer Res. sesenta y
genomas de vertebrados, insectos, gusanos, y de levadura. Genome Res. 15, 1034-1050.
cinco, 3299 a 3306. Watanabe, K., Iwatani, Y., Hidaka, Y., Watanabe, M., y amino, N. (1995). Efecto s a largo
plazo de la hormona tiroidea en los subgrupos de linfocitos en los bazos y timos de ratones. Endocr. J. 42, 661-668. Simonson, TS, Yang, Y., Huff, CD, Yun, H., Qin, G., Witherspoon, DJ, Bai,
Wuren, T ., Simonson, TS, Qin, G., Xing, J., Huff, CD, Witherspoon, DJ, Jorde, LB, y Ge, RL (2014). Compartida
Z., Lorenzo, FR, Xing, J., Jorde, LB, et al. (2010). La evidencia genética para la adaptación de highaltitude en el
y señales únicas de adaptación a gran altitud en las poblaciones tibetanas geográficamente distintas. Más uno 9,
Tíbet. Ciencia 329, 72-75. Skoglund , P., Malmstro¨ m, H., Raghavan, M., Stora, J., Hall, P., Willers lev, E., Gilbert, MT, ir therstr o¨ m, A., y Jakobsson, M . (2012). Orígenes y herencia genética de los agricultores neolíticos y los cazadores-recolectores en Europa. Ciencia 336,
466-469.
e88252. Xiang, K., Ouzhuluobu, Peng, Y., Yang, Z., Zhang, X., Cui, C., Zhang, H., Li, M., Zhang, Y., Bianba, et al. (2013). La identificación de una mutación fi co tibetano-específica en el gen EGLN1 hipóxico y su contribución a la
Skotte, L., Korneliussen, TS, y Albrecht sen, A. (2012). la asociación de ensayo para los datos de secuenciación de próxima
adaptación a gran altitud. Mol. Biol. Evol. 30, 1889-1898.
generación, utilizando las estadísticas de puntuación. Gineta. Epidemiol.
36, 430-437. Xu, S., Li, S., Yang, Y., Tan, J., Lou, H., Jin, W., Yang, L., Pan, X., Wang, J., Shen, Y., et al. (2011). Sopher, DE (1965). Los nómadas del mar: Un Estudio de los marítimos Boat People del Sudeste Asiático (Museo Nacional).
Una
búsqueda en todo el genoma para señales de adaptación a gran altitud en los tibetanos. Mol. Biol. Evol. 28, 1003-1011. Yang, J., Jin, ZB, Chen, J., Huang, XF, Li, XM, Liang, YB, Mao, JY, Chen,
Sterba, JA, y Lundgren, CE (1988). duración de apnea en el hombre y la respuesta de buceo inducida por inmersión cara. Undersea Biomed. Res. 15,
X., Zheng, Z., Bakshi, A., et al. (2017). las firmas genéticas de adaptación a gran altitud en los tibetanos. Proc.
361-375.
Natl. Acad. Sci. Estados Unidos 114, 4.189-419 4. Yett er, EM, Acosta, KB, Olson, MC, y Blundell, K. (2003).
Stewart, IB, andMcKenzie, DC (2002). El bazo humano durante el estrés fisiológico. Sports Med. 32, 361-369.
Estimación de volumen esplénica: mediciones ecográficas correlacionados con determinación CT helicoidal. AJR Am. J. Roentgenol. 181, 1615-1620 . Yi, X., Liang, Y., Huerta-Sánchez, E., Jin, X., Cuo, ZXP, piscina, JE, Xu,
Las conversaciones, KL, Turley, H., Gatter, KC, Maxwell, pH, Pugh, CW, Ratcliffe, PJ, y Harris, AL (2000). La expresión y la distribución de los factores inducibles por hipoxia HIF-1 alfa y HIF-2 alfa en tejidos normales humanos, cánceres, y los macrófagos asociados a tumores. A.m. J. Pathol. 157, 411-421.
ter Horst, R., Jaeger, M., Smeekens, SP, Oosting, M., Swertz, MA, Li, Y., Kumar, V., Diavatopoulos, DA, Jansen, AFM, Lemmers, H., et al. (2016). Host y los factores ambientales que influyen en las respuestas de citoquinas humanos individuales. Celda 167, 1111-1124.
X., Jiang, H., Vinckenbosch, N., Korneliussen, TS, et Alabama. (2010). La secuenciación de los 50 exomas humanos revela adaptación a la altura. Ciencia 329, 75-78. Zapol, WM, Liggins, GC, Schneider, RC, Qvist, J., Snider, MT, Creasy,
RK, y Hochachka, PW (1979). fl sanguíneo regional ow durante el buceo simulado en el sello Weddell consciente. J. Appl. Physiol. 47, 968-973. Zhong, H., De Marzo, AM, Laughner, E., Lim, M., Hilton, DA, Zagzag, D., Buechler, P., Isaacs, WB, Semenza, GL, y Simons, JW (1999). La sobreexpresión de 1 alfa del factor inducible por hipoxia en los cánceres humanos comunes y sus metástasis. Cancer Res. 59, 5.830 hasta 5.835.
Thornton, SJ, y Hochachka, PW (2004). El oxígeno y el sello de buceo. Submarina Hyperb. Medicina. 31, 81-95.
582 Celda 173, 569-580, 19 de Abril, 2018
Celda 173, 569-580, 19 de Abril, 582 582
STAR y Métodos RECURSOS clave de la tabla
FUENTE
IDENTIFICADOR
voluntarios sanos
1104-1106, 1201, 1202, 1204-1208, 1301, 1302, 1304, 1306-1309, 1401-1419, 1501-1510, 1512-1516, 1518, 1519, 1601, 1602, 1701,
Muestras Biológicas La muestra de saliva
1702, 1705-1707, 2301, 2302, 2401-2408, 2410-2413, 2415-2425, 2427, 2428, 2430, 2501, 2502, 2504 a 2507 que dichos datos Los datos en bruto, Bajau y saluán
Este papel
EGAS00001002823
referencia del genoma humano NCBI construir 37, GRCh37
Consorcio de referencia del genoma
https://www.ncbi.nlm.nih.gov/projects/genome/assembly/grc/human/
1000 Genomas chinos Han
Proyecto Genoma Consorcio
http://www.internationalgenome.org/data
PanAsian datos de SNP
Ngamphiw et al., 2011
http://www4a.biotec.or.th/PASNP
Li, 2013
http://bio-bwa.sourceforge.net/
Nijmegen ( Holewijn et al., 2010 ). Entre los pacientes 45% eran hombres y 55% mujeres. REACTIVO o recurso
Software y algoritmos BWA
Samtools
Li et al., 2009
h Aab mr e ic1iones no invasivas de la DeijP isgtoeent -am l., e2d 01 G Tían K participado en el estudio biomédico N
http://samtools.sourceforge.net/
athettr poss:/c/sleor f otwsaisre1.b(r N A.o1r )g/egsattukd oaBdS in-sN titIuMte / io, un estudio basado en la población de residentes
ANGSD
Korneliussen et al., 2014
http://www.popgen.dk/angsd/index.php/ANGSD
NGSRelate
Korneliussen y Moltke, 2015
http://www.popgen.dk/software/index.php/NgsRelate
fastsimcoal
Excof fi er et al., 2013
http://cmpg.unibe.ch/software/fastsimcoal2/
Ohana
Cheng et al., 2016
https://github.com/jade-cheng/ohana
Plink
Chang et al., 2015
http://zzz.bwh.harvard.edu/plink/
Kircher et al., 2014
http://cadd.gs.washington.edu/
Centro Médico de la Universidad Radboud en el período entre 2014 y 2016 ( Netea et al., 2016 ). Todos los sujetos tenían un IMC superior a 27 kg / m 2 y la mayoría también
CADD
eOdDaIFdIC m C ARedia
ololludyeópr 3o3j0e2ct.in de 28,5 ± 13,9 años, 44,5% eraInsthituotm OwB.ei nco htetp3s:0//0ww or dgi/viduos con edades comprendidas entre los 55 y 80 en el o Nbar ceiosnayl deel I5 nv5e,s5tig% acm iónu j delres. La cohorte d Genoma Humano
Horst et al., 2016 ). La inclusión de los voluntarios tuvo lugar entre 8/2013 y 12/2014 en el Centro Médico de la Universidad Radboud, Holanda. Los voluntarios tenían una Contacto para reactivos y el intercambio de recursos Más información se debe dirigir hacia y será fi ful llena por el contacto con plomo, Rasmus Nielsen (
[email protected] ). acuerdo con los principios expresados en la Declaración de Helsinki. La cohorte 500FG consistió en 534 individuos sanos de ascendencia genética occidental-europea ( ter
Modelo experimental y los detalles del sujeto Indonesia muestras fueron tomadas de acuerdo con un protocolo aprobado por el Comité de los países en desarrollo de la Comisión Nacional danesa sobre Ética de la Investigación dRealdabSoaud ludN. iTjm odeogsenlo,syptaordtiocsiplaonstepsadrtiiecripoan nstuescorencseibnie tim roinenintofoinrm foarm ciaódnodpeatarallasduapiamrtpicriepsaaciyónoreanl eysetescersitoudeiloc. oEnl s5e9nétitm niiceonB toaijanu foyrm3a4dinod. iLvoidsuo esxpsearluim ánenéttonsicsoes lalenvaalizroandoas ceanbeosdtee estudio eran de los pueblos de Indonesia de Jaya Bakti y Koyoan, respectivamente. Ambos pueblos se encuentran en el extremo oriental de la península de theCentral del Sulawesi. Los individuos tenían una edad media de 41,1 (rango de 18-85), y se componen de 75,3% hombres y 24,7% mujeres. Los datos europeos proceden de dos cohortes, la 500FGcohort y el 300-obesidad (OB-300) cohorte. Tanto studieswere aprobado por el Comité Ético de la Universidad de
e1 Celda 173, 569-580.e1-e8 19 de abril de 2.018 mil
Celda 173, 569-580.e1-e8 19 de abril de 2.018 mi l e1
MÉTODO DE DATOS muestras de Indonesia muestras de saliva se recogieron utilizando el kit DNA Oragene a partir de ADN Genotek.
mediciones de bazo se realizaron utilizando el SonoScape A6 Ultrasonido portátil Systemwith un C321 2-5MHz Convex transductor. mediciones de bazo se hicieron en
los planos transversales y longitudinales con el fin de calcular el volumen del bazo de acuerdo con la metodología descrita en Yetter et al. (2003) demostrado tener la mayor correlación con los valores obtenidos a través de una tomografía computarizada (CT). Todas las mediciones de bazo fueron tomadas por el mismo investigador para garantizar mediciones consistentes. Otros dos mediciones fenotípicas, altura y peso, se obtuvieron al mismo tiempo que se tomaron las muestras de ADN y las mediciones de bazo. A través de una breve entrevista con cada participante, se obtuvo información demográfica incluyendo el origen étnico, la edad, el género, y la historia del buceo. Un individuo se define como un buzo si participan en el buceo en apnea, en promedio, al menos tres veces a la semana, con la última inmersión se haya producido en la última semana. No buceadores eran aquellos que nunca habían participado en el salto de frecuencia o nonrecreational (excluyendo así a los buceadores anteriormente frecuentes). No hubo casos ambiguos en el que un individuo se redujo entre buzo y no bucea. El ADN genómico fue extraído de muestras de saliva utilizando el kit de extracción de pozos previos L2P a partir de ADN Genotek. extractos de ADN genómicos se cuanti fi usando un qubit dsDNA ensayo de alta sensibilidad. Las alícuotas que contienen 75 ng de ADN se transfirieron a Covaris micro-TUBE-15 y fragmentados a 550 pb e n un Covaris M220 ultrasonicador (factor de trabajo del 20%, 50 ciclos por ráfaga, 23 s). bibliotecas de secuenciación fueron construidos utilizando el Kit TruSeq Nano Biblioteca Preparación de ADN en un instrumento Illumina NeoPrep, siguiendo las instrucciones del fabricante, pero sin paso de normalización. Cada sesión de preparación de la biblioteca incluye un control negativo. Bibliotecas de secuenciación se comprueban para la distribución de tamaño y la molaridad en un instrumento Agilent 2100 Bioan alyser, utilizando la alta sensibilidad DNAKit, y se agruparon equimolares (8 a 16 bibliotecas por la piscina). Cada grupo fue secuenciado 125 Paired-End más de uno o dos carriles de la Illumina HiSeq2500 (versión 4 química). Las muestras se secuenciaron para una profundidad media de 5x.
muestras europeas En la cohorte 500FG, las muestras de sangre se recolectaron por punción venosa de la vena cubital en themorning, y un gran conjunto de mediadores, incluyendo esteroides y hormonas tiroideas circulantes, se midieron como se informó anteriormente ( ter Horst et al., 2016 ). En la cohorte de 300-OB, se realizaron imágenes de resonancia magnética del abdomen para evaluar la prevalencia de la esteatosis hepática y la distribución de la grasa abdominal. Todos los exámenes de resonancia magnética se realizaron utilizando un T Magnetom Trio 3.0 o Skyra (Siemens, Erlangen, Alemania). Los sujetos fueron examinados en la posición supina con los brazos posicionados paralelos a los lados laterales del cuerpo. Para cada sujeto, una serie de treinta imágenes de RM axiales ponderadas en T1 TIRM de 5 mm cada uno fueron adquiridos de la región de hígado. Las imágenes obtenidas se recuperaron del escáner de RM en DICOM (Digital Imaging and Communication in Medicine) de formato, y se analizaron con el software desarrollado en el IDL
6.0 medio ambiente, calledHIPPOFAT (versión 1.3, V. Positano
22).
InHIPPOFAT los treinta sliceswere evaluado para el tamaño del bazo. De la rebanada con visualmente el tamaño del bazo
más grande, las líneas de contorno se colocaron manualmente y el tamaño se calculó automáticamente. Los coeficientes de correlación coef fi intraclase del tamaño del bazo era 0.995.
Cuantificación y análisis estadístico leer procesamiento Las secuencias se basecalled usando el software Illumina Casava-1.8.2 y multiplexan des utilizando un partido completo del índice 6 nucleótido incorporado durante biblioteca de ligación adaptador. Las lecturas fueron recortados usando AdapterRemoval-2.1.3 ( Schubert et al., 2016 ) Para las secuencias adaptadoras y tramos principales / trasero de Ns. Además, las bases con calidad de 2 o menos se eliminaron p or el recorte de la 3 0 y sólo lee más grande que 30bpwere mantuvo. Retenidas pares leyeron después de trimmingwere alineados utilizando BWAmem-0.7.10 ( Li, 2013 ) Para GRCh37 y se procesa utilizando samtools-1.3.1 ( Li et al., 2009 ) Eliminar lee con una calidad inferior a la asignación de 30 y se fusionaron para bibliotecas. duplicados en adelante fueron marcados usando Picard-1.127 MarkDuplicates ( https://broadinstitute.github.io/picard/ ), Las bibliotecas se combinaron para probar el nivel y realinearse usando GATK-3.3.0 ( DePristo et al., 2011 ) Con Mills y 1000G indeles estándar de oro. Por último, bams realineados tenían la etiqueta md y actualiza ECAF extendidos calculados usando samtools calmd. Leer profundidad y cobertura se determinaron utilizando pysam ( https://code.google.com/archive/p/pysam/ ) Y BEDtools ( Quinlan y Hall, 2010 ).
estimación de la tasa de error
Para estimar las tasas de error, se analizaron cada una de las muestras de interés por separado utilizando un método en el ANGSD ( Korneliussen et al., 2014 ) Que se basa en la comparación de un genoma libre de errores. Brevemente explicado, themethod explota el hecho de que si la muestra analizada no tiene errores que debe tener el mismo número esperado de a lelos derivados como un genoma libre de error, y que cualquier exceso observado de alelos derivados en la muestra analizada en comparación con un thereforemust genoma libre de error ser debido a errores en la muestra analizada. así Themethod basa sus estimaciones de error en el exceso de alelos derivados en la muestra analizada en comparación con un genoma libre de error dado. Dado que no genomas son completamente libre de e rrores, las estimaciones en la práctica se hacen estimaciones de exceso de error en comparación con un genoma de alta calidad,
es decir, las tasas de error relativos. Sin embargo, si se utiliza un genoma de alta calidad, las estimaciones deben estar cerca de las tasas de error absolutos (para más detalles sobre el método de ver Orlando et al., 2013 ).
e2 Celda 173, 569-580.e1-e8 19 de abril de 2.018 mil
Celda 173, 569-580.e1-e8 19 de abril de 2.018 mi l e2
Se utilizó el genoma del chimpancé de l a alineación hg19 multiz46 como un grupo externo para l a evaluación de lo alelos se de rivan. A medida que el genoma de alta calidad, utilizamos NA12778 genoma bajo la cobertura a partir de 2013 la liberación de mayo de Genomas del Proyecto 1000. Antes de los análisis, se filtró a los datos de este genoma de modo que sólo lee con MapQ> 35 y se utilizaron bases con baseQ> 35 para asegurar que los datos usedwere hecho de alta calidad. Además, sólo se incluyeron los dat os de posiciones fromgenomic donde hay cobertura tanto en el chimpancé, la muestra de interés, y el gen oma de alta calidad. Utilizamos todas las lecturas de las muestras de interés en lugar de sólo uno por muestreo sitio. Sin embargo, antes de realizar la estimación que se filtra de distancia lee con MapQ <30 y con bases baseQ <20 para imitar el fi ltrado que hemos utilizado en la muchos de los análisis realizados en este estudio. Ninguna de las tasas de error fi específicos de tipo base destacan por cualquiera de los individuos y todas las estimaciones globales están por debajo o igual a 0,05% lo que sugiere que todos los genomas tienen tasas de error ba jas y pueden ser utilizados en los análisis.
la estimación de la relación Varios de los análisis que llevamos a cabo en este estudio se basan en el supuesto de que los individuos analizados no están estrechamente relacionados. Por lo tanto, se realizó un análisis para inferir en qué medida los individuos secuenciados están relacionados. Más específicamente, se estimaron l os tres coef relación coe fi k0, k1 y k2 para cada par de individuos dentro de cada una de las 2 poblaciones y en base a estos WeMade una lista de individuos para excluir fromanalyses de individuos que no están
estrechamente relacionados. La coeficientes k0, k1, k2 y aquí denotan las proporciones del genoma en el que el par de individuos analizados cuota de 0, 1 y 2 alelos
idénticos por descendencia, respectivamente. Es importante destacar que, el menos relacionado es, se espera que el k0 superi or un par de individuos no consanguíneas de ser, con k0 es igual a 1 para los individuos completamente no relacionados. Utilizamos below0 K0.
Dado que muchos de los individuos se secuencian a muy baja profundidad, se utilizó el programNGSrelate ( Korneliussen y Moltke, 2015 ) para inferir k0, k1, k2 y para cada par. NGSrelate es programa basado amaximum-probabilidad de que permite la inferencia de los tres coeficientes de relación de probabilidades genotípicas en lugar de llamadas genotipos y por medio de que se tenga en cuenta la incertidumbre de los verdaderos genotipos, que es inherente a los datos de secuenciación de baja profundidad.
Cuando se ejecuta NGSrelate, utilizamos estándar EM para la optimización, se admiten hasta 500.000 iteraciones EM para cada par y se utilizó un criterio de parada de 1e-12 diferencia en la probabilidad entre dos EM-iteraciones consecutivas. Además, nos encontramos cada análisis 10 veces con diferentes semillas de nú mero aleatorio a ser capaz de evaluar la convergencia de la EM-algoritmo. Para todos los pares, la diferencia en la probabilidad de r egistro entre las 10 soluciones NGSrelate fue de menos de 0.002, lo que sugiere que se alcanzó la convergencia. Dado que varias de las personas informaron a sí mismos a mezclar y NGSrelate, como la mayoría método de estimación de la relación, asumen los individuos no se mezclan, nos encontramos con los análisis tanto del conjunto de datos completo y de los subconjuntos que consisten en la 49Bajau y 23 individuos que eran saluán auto-reporte para ser unadmixed ( aquí denominado '' sin mezclar ''). Utilizamos este último para comprobar hasta qué punto la mezcla potencial afectó a las estimaciones de la antigua base de datos.
Una vez que tuvimos las estimaciones de los coe fi cientes de relación, que identi fi cado todos los pares de parientes cercanos defi ne como pares con una estimación K0 inferior a 0,75. A continuación, nos retiramos de forma iterativa a la persona con el mayor número de parientes cercanos hasta que se quedó sin par de parientes cercanos.
Para estos análisis, sólo se incluyeron sitios fromautosomal datos que overlappedwith el conjunto de datos PanAsia, que se describe más adelante. Para cada una de las dos poblaciones que utilizamos ANGSD ( Korneliussen et al., 2014 ) Para estimar las frecuencias de los alelos y genotipo probabilidades de lee withMapQ <30 y bases con baseQ <20 para los sitios seleccionados. Esto se hizo utilizando la información alelo del chip SNP (-doMajorMinor 3) y con el modelo genotipo probabilidad SAMtools (-GL 1). Para cada una de las dos poblaciones, se realizó la estimación y el genotipo de estimación de probabilidad de frecuencia de los alelos tanto para todas las muestras de la población y para el subconjunto de 'individuos 'sin mezclar''. Los resultados de los análisis de todos los individuos que se muestran en la Figura S2 . Estas estimaciones revelan numerosos cerca PARENTESCO familiar
buques, incluidos los padres e hijos y hermanos completos. Nuestro enfoque fi ltrado posterior dio lugar a una lista de muestras de eliminar de los análisis que no debe contener datos de personas estrechamente relacionadas. Esta lista contiene 16 Bajau y 1 personas saluán. Los análisis de genética de poblaciones
Para investigar las afinidades población de fi Bajau y saluán individuos en un contexto más amplio de las poblaciones regiona les, las hemos analizado en conjunto con publicada SNP serie de datos de 79 poblaciones de Asia ( Ngamphiw et al., 2011 ). Desde nuestros individuos del estudio son una mezcla de ambos individuos de baja y alta cobertura, que no trató de llamar genotipos diploides, sino más bien representados cada uno por un nucleótido de la muestra al azar de una alta calidad de lectura en cada una de la posición 50796 autosómica SNP en el panel. Este es un enfoque establecido para ascendencia genética analiza en conjuntos de datos con baja cobertura y / o la calidad genómico (por ejemplo, estudios de ADN antiguo ( Allentoft et al, 2015.; Skoglund et al., 2012 ). También llevamos a cabo análisis de compartir la deriva genética utilizando grupo externo F 3 estadísticas, utilizando los individuos HapMap Yoruban como grupo externo. La matriz del par de valores F 3 Compartir redes luego se convirtió en una matriz de distancia mediante el cálculo de 1- F 3, después de la normalización de todos los valores a la ga ma [0,1], seguido de escala bymultidimensional utilizando la función de 'cmdscale' en R ( RDevelopment Core Team, 2008 ). Los resultados se muestran en Figuras S2 y S3 .
Análisis de componentes principales (PCA) se llevó a cabo usando la opción '-pca' en PLINK ( Chang et al., 2015 ). El primero se muestran 2 PCs en el texto principal, PCS adicionales se muestran en la Figura S3 .
e3 Celda 173, 569-580.e1-e8 19 de abril de 2.018 mil
Celda 173, 569-580.e1-e8 19 de abril de 2.018 mi l e3
Se utilizó el paquete de herramientas Ohana ( Cheng et al., 2016 ) Para inferir ascendencia global y la e structura de covarianza de las frecuencias alélicas entre
poblaciones. Se analizó una gama de valores de K, dónde K es el número de componentes ascendencia. Para cada valor de K, utilizamos 32 ejecuciones independientes con diferentes semillas aleatorias, y sólo reportamos los que alcanzaron la mejor probabilidad para cada K ( ver Figura S4 ). Para estimar los parámetros del modelo demográficos, fastsimcoal requiere que el usuario especifique la topología del modelo; en nuestro caso, suponemos que Bajau y saluán comparten una población ancestral del tamaño efectivo de la población constante, lo que en algún momento se dividió en l as modernas demos Bajau y saluán. También asumimos estos demos cada crecieron de manera exponencial o contratados hasta la fecha de muestreo, y permitimos que la migración entre estos dos demos a precios constantes y potencialmente asimétricos. Como entrada, fastsimcoal toma el espectro observado sitio conjunta de frecuencia (JSF) de las dos poblaciones. En la práctica, fastsimcoal puede producir estimaciones inestables de los parámetros demográficos debido al gran espacio de parámetros para los que es probable que los JSFs observados. Para combatir esto, tal como se recomienda para la mejor práctica, nos encontramos fastsimcoal 100 veces y elegimos el modelo con la mayor probabilidad.
De F 3 estadísticas, encontramos que ambas poblaciones Bajau y saluán muestran la deriva similares compartir per fi les, exhibiendo mayor intercambio con las poblaciones de habla austronesios de Taiwán (Ami, atayal; Figura S2 ). Esto corresponde a la reportada previamente ascendencia compartida como consecuencia de la 'expansión Austronesio', que probablemente se originó fromTaiwan ( Lipson et al., 2014 ). agrupamiento genético basado en pares F 3 Los valores coloca tanto Bajau y saluán cerca de otras poblaciones de habla austronesios de Indonesia y las Filipinas. Como se ve en la PCA ( Figura 2 , PCs adicionales en Figura S3 ), Las poblaciones de Indonesia están dispuestos en un Cline entre las poblaciones austronesios taiwaneses y Papuans, con poblaciones en mayor proximidad geográfica a Oceanía también muestra una mayor afinidad genética. También se observa un cambio sutil de algunas poblaciones de Indonesia, incluyendo los bajau towardmainland poblaciones del sudeste asiático. Los resultados del análisis mezcla ( Figura S4 ) Sugieren que esta re fl eje bajos niveles de ascendencia compartida con Austroasiatic idiomas que hablan, que ha sido previamente reportado en otro estudio ( Lipson et al., 2014 ). Nuestros resultados de fastsimcoal indicar que el modelo más compatible tiene un tamaño de las poblaciones ancestrales eficaces de 48670. Suponiendo un tiempo medio de generación de 25 años, el tiempo de divergencia estimada es de 16,1 kya. Después de divergencia, se estiman los tamaños de población efectiva modernos que han contraído / crecido a tasas de 0,009%, 0,040% + en Bajau y saluán, respectivamente, de tal manera que sus tamaños de las poblaciones modernas efecto son 51.267 y 405.050, respectivamente. También estimamos las tasas de migración altamente asimétricos, lo que sugiere una mayor tasa de migración por generación de Bajau a saluán que viceversa (5,48, 1.19e-4, respectivamente, en unidades de población-escalado de 4N baj metro). La simulación de los JSFs bajo el modelo elegido, que confirman el modelo es compatible con los datos. Hemos simulado 1000 1Mbp regiones con las tasas de mutación y recombinación de m = 2.5e-8, r = 1.15e-8 por generación por nucleótido usando MSMS.
Las pruebas para detectar una diferencia en el tamaño del bazo entre Bajau y saluán Antes de realizar una exploración de la selección, que primero queríamos probar si hay una diferencia en el tamaño del bazo entre los bajau y saluán con el f in de determinar si se trata de un objetivo apropiado para nuestra investigación de selección. Como una prueba exploratorio de los datos, se realizó u n Welch t de dos muestras de ensayo comparando los tamaños del bazo del Bajau a los de la saluán. Este valor de p dado de 3.538e 07, indicando los bazos de la Bajau son significativamente más grandes que los de la saluán. Es importante destacar que, también se realizó la prueba de Welch t de dos muestras dentro de la Bajau, comparando los buceadores con no buceadores, y no se encontraron diferencias estadísticamente significativa en el tamaño del bazo (valor p:
0,2663). Este resultado sugiere que la diferencia observada en el tamaño del bazo entre Bajau y saluán no es atribuible a una respuesta de plástico del bazo para el buceo. Sin embargo, otros factores que si los individuos son buzos pueden afectar a los resultados de la Welch dos muestra de ensayo t. Por lo tanto, se procedió con un modelo lineal, lo que nos permite tener en cuenta factores adicionales, como la edad y el sexo también. En primer lugar, hemos utilizado la función R lm para encajar un modelo lineal de la forma
y = a + segundo popular población + segundo género género + segundo buzo buceador + segundo años edad + segundo peso peso + segundo altura altura
(1)
dónde y es el tamaño del bazo, un es el punto de intersección, población es un indicador binario, que toma el valor 0 para l os individuos saluán y 1 para l os individuos Bajau y buzo es un indicador binario de si los individuos son buceadores. Hicimos esto con el objetivo de probar si segundo popular es significativamente diferente de 0, lo que indicaría que el Bajau y saluán tienen diferentes tamaños de bazo cuando se toma en cuenta el sexo, edad, altura, peso y si l os individuos son buceadores. Nos FI TTED el modelo utilizando dos conjuntos de dato s diferentes para ser capaz de evaluar si los resultados se ven afectados por la mezcla: Del conjunto de datos 1: todas las muestras que no están estrechamente relacionados
Conjunto de datos 2: el conjunto de datos 1 con muestras estima que tienen por encima de 5% mezcla retira
Después de fi tting el modelo de uso de estos dos conjuntos de datos que comprueba si los residuos eran normales distribuido por hacer QQ-parcelas y ejecutar una prueba de Shapiro-Wilks de normalidad, ya que los valores de p proporcionados por lm se basan en la suposición de los residuos que son normales distribuida.
Debido a que la prueba de Shapiro-Wilks condujo al rechazo de la hipótesis nula de los residuos que son normales distribuido para el primero de los dos conjuntos de datos, no nos basamos nuestras conclusiones sobre los valores de p proporcionados por lm. En su lugar hemos realizado pruebas de permutación para alcanzar los valores de p mediante la función lmp en el lmPerm paquete R. Cuando se utiliza esta función, fijamos el parámetro parar California a 0.001 y
e4 Celda 173, 569-580.e1-e8 19 de abril de 2.018 mil
Celda 173, 569-580.e1-e8 19 de abril de 2.018 mi l e4
el maxiter parámetro a 10 9, lo que significa que l a toma de muestras de permutación se fijó a parar cuando la desviación estándar estimada cayó below0.1 del valor estimado p, o 10 9 permutaciones habían sido muestreados (se utiliza el criterio alcanzado primero). En la práctica, la función se detuvo antes de llegar a 10 9 iteraciones en todos nuestros análisis. En segundo lugar, se realizó exactamente las mismas proporciones estimadas utilizando análisis ascendencia como el Bajau población predictor para explorar cómo esto podría afectar a lo s resultados. Los resultados de fi tting el modelo en ecuación 1 con los dos conjuntos de datos descritos en la sección de datos se pueden encontrar en Tabla S1 . Esta
incluye valores de p para la hipótesis nula de segundo
popular
siendo 0, que se proporciona por la norma lm función en R ( '' lm valor de p '' en
Tabla S1 ). Sin embargo, observamos que ambas QQ-parcelas y los resultados de la prueba de Shapiro-Wilks para la normalidad sugieren que las desviaciones del modelo de fi tted con datos de todos los individuos que no están estrechamente relacionados no están distribuidos normal ( Figura S1 ). Esto significa que uno tiene que tener cuidado usando los valores de p proporcionadas por LM, ya que estos se basan en la suposición de lo s residuos que son normales distribuidos. por lo tanto, también se realizaron pruebas de pe rmutación de la hipótesis nula misma ( '' permutación p-valor '' en Tabla S1 ) Y se utiliza eso como una base para nuestras conclusiones en su lugar.
Este enfoque dio lugar a una segundo
popular estimar
de forma significativa por encima de 0 para ambos conjuntos de datos, lo que sugiere que la Bajau tienen un tamaño medio superior bazo de
saluán evenwhen de corregir por sexo, edad, altura, peso andwhether los individuos son buceadores. Y lo más importante, el hecho de que e l resultado es válido para el subconjunto de los individu os con menos del 5% mezcla, sugiere que los resultados obtenidos a partir de individuos no todo estrechamente relacionados no es simplemente un artefacto de mezcla.
Los resultados de fi tting el modelo en ecuación 1 con los dos conjuntos de datos mediante la proporción estimada ascendencia Bajau en lugar de simplemente una variable binaria como predictor de la población se pueden encontrar en Tabla S1 . Esto incluye los valores de p para la hipótesis nula de segundo popular siendo 0, que se proporciona por la norma lm función en R ( '' lm valor de p '' en Tabla S1 ). Sin e mbargo, también en este predictor observamos que ambas QQ-parcelas y los resultados de la prueba de Shapiro-Wilks para la normalidad sugieren que las desviaciones del modelo de fi tted con datos de todos los individuos que no están estrechamente relacionados no están distribuidos normal ( Figura S1 ). por lo tanto, también se realizaron pruebas de permutación de la hipótesis nula misma ( '' permutación p-valor '' en Tabla S1 ). Es importante destacar que este enfoque dio lugar a una segundo popular estimar por encima de 0 para ambos conjuntos de datos, pero sólo significativamente tan (valor de p <0,05) para el subconjunto de los in dividuos con menos de 5% mezcla. Para el conjunto de datos se mezcla más grande que incluye individuos mezclados, el valor p es ligeramente superior a 0,05. Sin embargo, observamos que el aditivo reduce la potencia para detectar diferencias en la población si son causados por la genética.
análisis selección Bajau usando Ohana El conjunto de datos de análisis de selección original contenía 153 muestras: 59 Bajau, 34 saluán, y 60 CHS (Han chinos) muestras de los proyecto 1.000 Genomas ( Auton et al., 2015 ). Después de la eliminación de los individuos estrechamente relacionados a partir de los conjuntos Bajau y saluán, como se describe anteriormente, el conjunto de datos contenía 136 individuos: 43 muestras Bajau, 33 muestras saluán, y 60 CHS.
Utilizamos ANGSD ( Korneliussen et al., 2014 ) Para estimar probabilidades genotípicas de lee con MapQ <30 y bases con baseQ <20. Esto se hizo utilizando la información alelo inferirse directamente de probabilidades (-doMajorMinor 1) y el SAMtools modelo de probabilidad genotipo (-GL 1). SNPs se filtraron para desviaciones de Hardy Weinberg (-hwe_pval 5E-7), el sesgo de hebra (-sb_pval 5E-7), y theWilcox prueba de suma de rangos para qscore sesgo (-qscore_pval 5e-9). El conjunto de datos completo contenía probabilidades genotípicas para 2,665,716 marcadores. Después de enmascaramiento usando el 1000 Genomas de filtro ( Auton et al., 2015 ), Que contenía 2,333,499markers que resulta en una tasa de reducción de 12,5%. Se realizaron análisis con y sin los 1000 Genomas de enmascaramiento.
En la anotación de marcadores, asignamos RSID a ubicaciones físicas del genoma comparando a ellos a dbSNP construir 147 [Base de datos de polimorfismos de nucleótido único (dbSNP). Bethesda (MD): Centro Nacional de Información sobre Biotecnología, Biblioteca Nacional de Medicina. (DbSNPBuild ID: 147), 2016]. Esta acumulación dbSNP contenía 154,822,082markers, de las cuales 2,665,716 2,660,285were entre nuestros marcadores. 5.431 marcadores (0,2%) no han asignado RSID, pero ninguno de estos marcadores fueron identificados en la selección de exploración como potenciales candidatos para ser objetivos de selección. Para estimar las proporciones de mezcla en todo el genoma y el árbol de estructura de correlación y población necesaria para la exploración de la selección, se utilizó el mismo conjunto de datos como para la exploración de selección. Sin embargo, para reducir la carga computacional en la realización de estos análisis, abajo en la muestra el conjunto de datos a partir de los marcadores 2,333,499 completos a 100.000 marcadores elegidos al azar.
Los análisis de mezcla y el árbol se realizaron de la misma manera como se describió anteriormente en el texto, pero utilizando el conjunto de datos Bajau, saluán, y Han descrito anteriormente. Se realizó el análisis tanto para K = 2 y K = 3, pero sólo se utilizan los resultados de K = 3 en el análisis de aguas abajo ( Figura S5 ). Se utilizó el '' selscan '' inOhana programprovided para detectar SNPs que se desvían fuertemente en el Bajau de la estructura de covarianza de todo el genoma utilizando una prueba de razón de verosimilitud. Para cada SNPwe introducir una variable escalar que ismultiplied a la varianza asociada con la población Bajau. Esto establece dos modelos de probabilidad anidados, uno que supone el cambio Bajau específico alelo frecuencia es como se predijo a partir del pa trón de covarianza de todo el genoma, y una que permite un cambio más grande en el Bajau y por lo tanto una variación mayor en el componente Bajau de lo esperado de la de todo el genoma patrón ( Figura S5 ). La prueba de razón de verosimilitud resultante se puede utilizar para identificar loci en el que la población Bajau ha experimentado un mayor que el cambio esperado en la frecuencia de alelos en comparación con la predicción a partir del patrón d e todo el genoma, que es una firma de selección. Este método es inspirado por un número de métodos similares, recientemente desarrollados que utilizan una distribución gaussiana como una aproximación para modelar la distribución de frecuencias de los alelos entre poblaciones ( Coop et al., 2010; Pickrell y Pritchard, 2012 ).
e5 Celda 173, 569-580.e1-e8 19 de abril de 2.018 mil
Celda 173, 569-580.e1-e8 19 de abril de 2.018 mi l e5
Hemos eliminado las señales accionadas por un único SNP que podrían ser debido a la Base de llamada o mapeo errores, e identi fi cada SNP potenciales causales por SNPs única de retención para los que: 1) el SNP no tiene ningún vecino dentro de ± 100kb (ventana de 200kb) que tiene una relación de probabilidad más alta; 2) el SNP no es el único dentro de ± 100kb (ventana de 200kb) que se encuentra entre los coeficientes de probabilidad más extremas 1%. Dos picos ejemplo a partir de lo s resultados se muestran en Figura S5 .
anotación funcional de SNPs seleccionados Se evaluó la forma potencialmente perjudicial cada una de las 25 principales SNP identi fi cados en el análisis Selección eran través de una consulta del agotamiento dependiente herramienta en línea combinada de anotación (CADD v1.3) ( Kircher et al., 2014 ). a continuación, nos centramos en los 5 SNPs más perturbadores para determinar la naturaleza de su puntuación perjudicial al inspeccionar manualmente sus anotaciones y visualizando sus correspondientes pistas de segmentación (ENCODE ENCODE Consorcio del Proyecto de 2012 ) En el navegador de la Universidad de Washington Epigenómica (v.44.1). La puntuación CADD para cada SNP aparece en tabla 1 en el texto principal. El SNP con la mayor puntuación de CADD (22,8, PHRED de escamas), rs10483896, se encuentra en una región represor Segway ( Hoffman et al., 2012 ) Aguas arriba de NRXN3 y se expresa preferentemente en los tejidos del cerebro. La posición está altamente conservada a través de primates, mamíferos y vertebrados (puntuaciones phastCons excluyendo genoma humano =
0,98, 1 y 1, respectivamente ( Siepel et al., 2005 )) Con una alta puntuación de sustitución PCIG ++ rechazado (5.26) ( Davydov et al., 2010 ). El SNP con la puntuación más alta segundo CADD (12), rs77280170, se encuentra en una región intergénica. No está altamente conservada y se encuentra en una región heterochromatic de baja actividad reguladora. El rs118149708 SNP, con la tercera puntuación CADD más alto (9.838), está en una región represor Segway en un intrón de RP11-499F3.2. El SNPwith la puntuación más alta cuarto CADD (8.527), rs16030, es un cambio sinónimo altamente conservada que también se encuentra dentro de un factor de transcripción sitio de unión en una región de la cromatina abierta. Se encuentra en la CACNA1A gen. La inspección visual en el navegador Epigenómica sugiere el sitio está en una región potenciadora que se superpone a un exón del gen. Por último, el rs28544477 SNP, con el quinto puntuación más alta CADD (6.521), se encuentra en una característica de regulación (región Segway FAIRE-seq), pero no está altamente conservada.
Spleen asociación de ensayo tamaño Inicialmente, la prueba de asociación entre el tamaño del bazo y cada uno de los 25 SNPs con la puntuación más alta en la exploración de selección mediante la estadística de puntuación basedmethod por Skotte et al. (2012) como se aplica en ANGSD. Elegimos thismethod por dos razones. En primer lugar, que basa su prueba en probabilidades de genotipo posterior y las utiliza para tener en cuenta la incertidumbre del genotipo, que es inherente a los datos de secuenciación de baja profundidad. En segundo lugar, este método se basa en un marco modelo lineal generalizado. Por lo tanto, permite la inclusión de covariables en las pruebas y por lo tanto hace que sea posible corregir posibles factores de confusión, como mezcla.
Al realizar estos puntuación de estadísticas pruebas basadas, asumimos un modelo de efecto aditivo y se incluyeron los cinco componentes de primer principio (PC) como covariables para corregir la mezcla y otra estructura de la población. Adicionalmente, se incluyeron edad, sexo, altura, peso, profundidad de secuenciación, y si los individuos son buceadores como covariables. Por lo tanto se asumió el modelo lineal: y = a + segundo genotipo genotipo + segundo género género + segundo buzo buceador + segundo años edad + segundo peso peso + segundo altura altura + segundo
profundidadsecuenciación
secuenciación profundidad + segundo
ordenador personal 1
ordenador personal 1+ segundo
ordenador personal 2
ordenador personal 2+ segundo
ordenador personal 3
ordenador personal 3+ segundo
dónde y es el tamaño del bazo y genotipo se codifica como 0, 1, o 2 correspondiente al número de copias del alelo seleccionado llevado por un individuo. La prueba se realizó para cada uno de los 25 SNPs era si segundo
genotipo
es fi signi cativamente diferente de 0. Al evaluar significación de los resultados de la prueba, se utilizó una Bonferroni corregido
umbral valor p de 0,05 / 25 = 0,002. Observamos que una suposición subyacente en el modelo utilizado es que los residuos son normales distribuida. Por desgracia, ANGSD no ofrece ninguna posibilidad de investigar si se viola este supuesto. Por lo tanto, se realizó las pruebas no sólo usando las mediciones del tamaño del bazo prima, sino también mediante el cuantil tamaño del bazo transformado a una distribución normal y de los tamaños de bazo logtransformed ser tan seguro como sea posible que cualquier señal asociación potencial no está causado simplemente por una violación de la hipótesis de normalidad subyacente. Para el seguimiento de los resultados de las pruebas iniciales, hemos realizado dos análisis adicionales, tanto con el propósito de investigar si los resultados iniciales se ven afectados por la mezcla (a pesar del hecho de que hemos incluido el primeros cinco PCs como covariables). Hicimos esto porque es bien sabido que la e structura de mezcla y la población en general puede dar l ugar a falsos positivos. En primer lugar, se aplicó la misma prueba a un gran número de SNPs adicionales fromacross el genoma y en base a los valores de p de estas pruebas se calcularon de control genómico en factores in fl ación para evaluar si hay un general la inflación en el -log (P)-valores debido a estructura de la población.
En segundo lugar, hemos realizado pruebas de asociación muy similares a las pruebas iniciales con la única diferencia de que no hemos incluido cualquier PC como covariables. En lugar de ello, se emplearon genómica de control para corregir la estructura de la población. Hicimos esto para investigar si los resultados son robustos a la proximidad de la corrección de estructura de la población. Hemos basado la corrección de control genómico en los resultados de la misma serie de nuevos SNPs como en el análisis anterior.
Todos los análisis basados puntuación estadística anteriores proporcionan evidencia de una asociación entre el tamaño del bazo y uno de los ensayados 25 SNPs. Para investigar más a esta señal, se utilizó el mismo modelo lineal como en los análisis iniciales pero esta vez fi TTED usando el lm función en R basa en datos imputados. Hicimos esto usando los siguientes
subconjuntos de los datos:
1) Los mismos individuos como en los análisis iniciales (propósito: para investigar si la señal de asociación de la inicial a naliza es un artefacto de utilizar el método de ensayo de puntuación)
e6 Celda 173, 569-580.e1-e8 19 de abril de 2.018 mil
Celda 173, 569-580.e1-e8 19 de abril de 2.018 mi l e6
ordenador personal 4
2) El subconjunto de personas que se Bajau, excluyendo el de un individuo que, según los análisis de la mezcla, tiene muy poca (si existe) ascendencia Bajau (propósito: para investigar si el resultado asociación de los primeros análisis es un artefacto del hecho de que los individuos saluán se incluyeron en los análisis
iniciales) 3) Tres subconjuntos de los individuos Bajau con diferentes cantidades, limitadas de ascendencia no Bajau (propósito: para asegurar aún más la señal de asociación no es un artefacto de la estructura de la población no contabilizada en los análisis anteriores) Es importante destacar que todos estos lm análisis también nos dio la oportunidad de investigar la dirección del efecto, lo cual no es posible el uso de la prueba basada en la puntuación.
Después de fi tting los modelos, se comprobó si los residuos eran normales distribuido mediante la ejecución de una prueba de Shapiro-Wilks de la normalidad, ya que los resultados proporcionados por lm se basan en la suposición de los residuos que son normales distribuida. Todas las pruebas basadas puntuación estadística se aplicaron a los datos fromboth Bajau y saluán individuos. Antes de realizar las pruebas de todos los parientes cercanos se filtran de distancia, que nos dejó con 43 y 33 Bajau saluán con mediciones del tamaño del bazo. Todas las pruebas basadas imputación se aplicaron a los datos de estos mismos individuos y subconjuntos de éstos, en función de su cantidad de ascendencia estimado Bajau.
Los análisis sobre la que basamos nuestra relación fi ltrado se describen anteriormente, así como los análisis en los que basamos nuestra ltrado mezcla fi. Todas las pruebas basadas en puntuación estadística se llevaron a cabo en la probabilidad del genotipo posterior, que se calcula utilizando ANGSD ( Korneliussen et al., 2014 ) Con el SAMtools genotipo modelo de probabilidad (-GL 1), y con mayor y menor alelos se infiere de las probabilidades de genotipo (-doMajorMinor 1). Sólo lee withMapQ> 35 y bases con baseQ> 35 se utilizan para asegurar que los datos utilizados eran de hecho de alta calidad. Los sitios fueron restringidos a los que se consideran accesibles de acuerdo con la máscara de accesibilidad 1000 genomas. Para los ensayos basados en la imputación, se imputaron datos para el SNP de interés utilizando la misma entrada y los ajustes como para las pruebas de puntuación statisticbased.
Para fenotipos, se utilizó el tamaño del bazo, el peso, y mediciones de la altura obtenida al mismo tiempo que se tomaron muestras de material de ADN. Para la edad, el género, y buzo (sí / no) se utilizó valores obtenidos a través de una entrevista también se realiza al mismo tiempo que se tomaron muestras del material de ADN. Los PCs se calcularon utilizando los datos genéticos de los individuos incluidos en sólo en las pruebas de asociación. Se probó la asociación entre el tamaño del bazo y cada uno de los 25 SNPs de l a exploración de selección utilizando un ensayo basado puntuación estadística. Un SNP, rs3008052 en el gen PDE10A, mostró evidencia de ser asociado ( tabla 1 themain de texto). Notablemente, este resultado es consistente a través de tres diferentes transformaciones de las mediciones del tamaño del bazo, lo que sugiere que el resultado no es simplemente un artefacto de una posible violación de la hipótesis de normalidad subyacente al método utilizado.
En las pruebas iniciales, se incluyeron los cinco primeros PCs como covariables para corregir la estructura de la población. Para investigar si los resultados obtenidos de estas pruebas se vieron afectados por estructura de la población (a pesar de esta inclusión de PC), se realizó la misma prueba en un gran conjunto de SNPs en todo el genoma y, basándose en los valores de p d e estas pruebas, se calculó genómica en los factores de inflación e hizo gráficos QQ ( Figura S6 ). Estos resultados sugieren que los (valores p) -log no son en general marcadamente inflado debido a la población. Además, QQ-parcelas de los 25 SNPs de la exploración selección sugieren que los valores de p para estos en general no parece ser inflado
o bien, a pesar del hecho de que estos SNPs se caracterizan por tener muy diferentes frecuencias de los alelos en Bajau en comparación con otro (poblaciones Figura S6 ).
También se realizó la puntuación de la prueba basada en la a sociación estadística usando el control genómico en lugar de los PC para corregir la estructura de la población. Esto dio lugar a los valores de p, incluso más bajos para rs3008052 (3.8E-05, 3.0E-05 y 7,2E-05 para no transformado, Qnorm transformada, y registro de los datos transformados, respectivamente). De ahí que, en general, no detectamos ninguna evidencia de que la señal de asociación observada es un artefacto de la estructura de la población.
Para investigar más la señal de asociación entre el tamaño del bazo y rs3008052, se imputó genotipos para rs3008052 y analizado estos durante varios subconjuntos de los datos: exactamente el mismo conjunto de datos como en la inicial, el subconjunto que consta sólo de los individuos Bajau, y tres subconjuntos diferentes de estos individuos Bajau con sólo cantidades limitadas de no Bajau ascendencia. En primer lugar, que trazan el bazo tamaños de estratificación ed por el genotipo imputado para todos los conjuntos de datos y todas las transformaciones de los tamaños bazos utilizados en las pruebas iniciales. La inspección vi sual de estas parcelas para todos los conjuntos de datos mostró una clara tendencia que, las más copias del alelo seleccionado (T), mayor será el tamaño del bazo, y de este modo una asociación entre rs3008052 y el tamaño del bazo de acuerdo con los resultados iniciales.
A continuación, probamos si estas asociaciones son estadísticamente significativos usando el mismo modelo exacto como en las pruebas iniciales basadas puntuación estadística, pero esta vez utilizando la función R lm para encajar themodel y realizar las pruebas. Observamos que para estos análisis los residuos eran rechazados en ningún caso ser normal distribuido, lo que sugiere que el supuesto subyacente de la normalidad de lm No se viola, evidentemente. Al realizar estas pruebas utilizando los datos de los mismos individuos como en los análisis basados estadística inicial puntuación, tenemos los valores de p, incluso más bajos que los obtenidos usando la prueba basada puntuación estadística, lo que sugiere que la señal de asociación inicial no era simplemente un artefacto de la utilización de la puntuación marco basado estadística ( Tabla S2 ). Del mismo modo, cuando se realiza la prueba basada sólo en el subconjunto de personas que se Bajau, también obtenemos valores de p fi cativos altamente significantes a pesar del tamaño de la muestra mucho más pequeño (n = 43 en lugar de n = 76), lo que sugiere que la señal de asociación inicial es no un artefacto de la inclusión de individuos saluán en el análisis inicial o bien ( Tabla S2 ). Al realizar la prueba de tres diferentes subconjuntos de los individuos Bajau con sólo cantidades limitadas de no Bajau ascendencia, los resultados fueron más mixta. Para el subconjunto más grande que consiste en el 50% de los individuos Bajau con menos ascendencia no Bajau (donde se estima que todo individuo a tener <16% ascendencia no Bajau) todavía había amarginally signi valor p fi no puede, a pesar de un tamaño de muestra de sólo el 21 . Pero este no fue el caso de los conjuntos de datos más pequeños que consisten en individuos Bajau con menos del 10% y el 5% no Bajau
e7 Celda 173, 569-580.e1-e8 19 de abril de 2.018 mil
Celda 173, 569-580.e1-e8 19 de abril de 2.018 mi l e7
ascendencia. Sin embargo, estos dos conjuntos de datos son bastante pequeñas (n = 18 y n = 15, respectivamente) y las estimaciones de los tamaños del efecto obtenidos a partir de ellos son consistentes con las estimaciones obtenidas a partir de todos los conjuntos de datos más grandes (texto principal Figura 4 ). Por lo tanto, parece probable que la falta de significación para estos dos conjuntos de datos es debi do a su tamaño limitado, en lugar de una señal de que la señal de asociación señales observadas en el mayor conjunto de datos más mezclada son causados por la población mezcla no corregida por los PCs.
Se alsoworth señalar que las estimaciones del tamaño del efecto son todos consistentes con un efecto positivo en el tamaño del bazo del alelo seleccionado (T), es decir, tener más Ts está asociado con tener un mayor tamaño del bazo.
asociación de ensayo La hormona tiroidea Utilizando datos de la cohorte 500FG, la prueba de asociación utilizando una técnica de regresión lineal como se aplica en el paquete Matrix eQTL ( Shabalin, 2012 ). El método se aplicó a 'dosificación' imputada '' de datos de SNP, donde en la imputación los genotipos no son llamados discretamente, sino más bien valores entre 0 y 2 se les da a cada individuo. individuos etnicidad relacionadas y no europeos se eliminaron, y las pruebas se corrigieron para la edad, sexo, índice de masa corporal, y el uso de anticonceptivos orales mediante la inclusión de estos factores como covariable. Las concentraciones de hormona de tiroides se escalaron utilizando una transformación rango inverso (IRT) algoritmo, similar a la aplicada en
Aguirre-Gamboa et al. (2016) . Se examinaron cuatro SNP: el plomo SNP, rs3008052 y otros tres SNPs en alto LD en los europeos con rs3008052 (rs2983527, rs3008050,
rs3008049 y). Todos estos SNPs tienen asociaciones significativas con hipotiroidismo en el Biobanco de datos globales del motor. Se encontró asociación fi no puede clara, signi para nuestros SNPs investigado con el alelo en una frecuencia más alta en e l Bajau significativamente asociado con elevada T4 circulantes concentraciones plasmáticas. Resultados para todos los SNPs ensayados se encuentran junto con diagramas de caja que ilustra la direccionalidad de las asociaciones en Figura S7 .
La estimación de la fuerza y el momento de la selección Por tanto la PDE10A y alelos BDKRB2, se estima la fuerza, la sincronización, y la frecuencia del alelo en el tiempo de divergencia ( s, t, f, respectivamente) mediante la simulación de trayectorias de frecuencia de a lelos conjuntos en Bajau y saluán utilizando el modelo deducido anteriormente. Asumimos que el alelo que se va segregando antes de la divergencia tiempo debido a la presencia de e ste alelo en una serie de otros paneles humanos, como los chinos Han, cuyos ancestros comunes son an teriores a la escisión Bajau-saluán.
A través de una rejilla 3-D de valores de estos 3 parámetros, en cada puntos de malla simulamos 1000 trayectorias en MSMS. Para estimar selección en un alelo particular, tomamos un bin en torno a sus estimados frecuencias de los alelos en Bajau y saluán, que construimos utilizando un 99% de intervalo de confianza con fi ClopperPearson en verdaderos frecuencias de la población del alelo ( PDE10A: Bajau 0.371 [0,24 a 0,515], saluán 0,067 [0,013 a 0,188]; BDKRB2: Bajau 0,183 [0,089 a 0,311], saluán 1e-05 [0-0,077]). Como heurístico para la probabilidad de q ue un valor particular de ( s, t, f), calculamos la proporción de simulaciones para el que l a trayectoria aterriza en tanto los contenedores Bajau y saluán. Para alelos simulados virtud de la neutralidad (es decir, s = 0), observamos ninguna pelota en los contenedores para PDE10A bajo ninguna combinaciones de ( t, f), lo que sugiere que la discrepancia frecuencia de los alelos es poco probable bajo evolución neutral en el modelo demográfica inferida (p <0,001). por BDKRB2, la probabilidad máxima a través de estos contenedores neutros es 0.024, y por lo tanto sugieren que BDKRB2 'S discrepancia de frecuencia es poco probable bajo evolución neutral
en el modelo demográfica inferida (p <0,024). Los resultados se muestran en el texto principal Figura 6 .
Datos y el software DISPONIBILIDAD El número de acceso para los datos del genoma recién generadas reportados en este documento es Genome-Fenoma Archivo Europeo: EGAS00001002823.
e8 Celda 173, 569-580.e1-e8 19 de abril de 2.018 mil
Celda 173, 569-580.e1-e8 19 de abril de 2.018 mi l e8
Figuras suplementarios UN
segundo
do
re
Figura S1. QQ-Parcelas en los residuales de la theModels Fittedwith lm Función, en relación con La cuantificación y análisis estadístico -Testing de una diferencia en tamaño entre bazo y Bajau saluán (A-D) parcela QQ para residuos obtenidos cuando racor (A) del modelo en ecuación 1 con el conjunto de datos 1 y un predictor población binario, (B) el modelo en ecuación 1 con el conjunto de datos 2 y un predictor población binario, (C) el modelo en ecuación 1 con el conjunto de datos 1 y estimado proporción ascendencia Bajau como predictor de la población, y (D) el modelo en ecuación 1 con el conjunto de datos 2 y proporción estimada ascendencia Bajau como predictor de la población. Los correspondientes valores de p obtenidos a partir de la realización de la prueba de normalidad Shapiro-Wilks son: 0.001879, 0.142, 0,001352 y 0,146, respectivamente.
Figura S2. F 3 Estadísticas, relacionadas con La cuantificación y análisis estadístico A saber, población Genética análisis (A) Las distribuciones de grupo externo F 3 estadísticas para poblaciones Bajau y saluán. poblaciones de referencia se agrupan por familia lingüística y la localización geográfica. Las etiquetas en los paneles indican los mejores cinco poblaciones con más alto F 3 valores. (B) Mapa de calor de grupo externo pairwise F 3 estadísticas: compartir la deriva genética para todos los pares de poblaciones. bares y etiquetas de colores indican la familia lingüística de la población respectiva.
Figura S3. Bajau y saluán Población Demografía, relacionado con La cuantificación y análisis estadístico A saber, población Genética y análisis Figura 2 (A) El escalamiento multidimensional de pairwise F 3. Gráfico muestra las dos primeras dimensiones de una MDS basados en el F 3 distancia entre pares de poblaciones. (B y C) (B) PCs adicionales en la PCA de Bajau, saluán, y las poblaciones PanAsia, PCs 3 y 4, y PCs (C) 5 y 6.
Figura S4. Mezcla estimaciones Asiática, relacionado con La cuantificación y análisis estadístico A saber, población Genética y análisis figura 3 colores componentes se combinan a través de parcelas.
Figura S5. Hipótesis de selección y el ejemplo picos resultantes, relacionados con La cuantificación y análisis estadístico Análisis Selección -Bajau Usando Ohana Utilizando el fromOhana suite de selección, las hipótesis de selección se construyó en base a la estructura y los resultados de los árboles K = 3. La prueba de razón de verosimilitud compara un modelo en el que las experiencias de componentes Bajau más rápidos cambios de frecuencia de los alelos en un locus específico (hipótesis de selección) de lo esperado a partir de la distribución genómica de los cambios de frecuencia de los alelos (estimación global). Se muestran dos picos resultantes del análisis de selección; el pico primera, ocupando el # 1, está situado aguas arriba de BDKRB2 gen. El segundo pico, ocupando el # 22, se encuentra en la PDE10A gen.
Figura S6. QQ-Parcelas en un gran conjunto de SNPs y los 25 SNPs de la selección de escaneado, en relación con La cuantificación y análisis estadístico - Pruebas Bazo Asociación Tamaño QQ-parcelas utilizando una prueba basada estadístico de puntuación y un modelo con el cinco primeros PCs incluidas como covariables para corregir la estructura de la población. (A) QQ-plot para probar todas (1536467431) SNPs para la asociación con tamaños de bazo no transformadas. (B) QQ-plot para probar todos los SNPs para la asociación con tamaños de bazo cuantil transformadas a una distribución normal. (C) QQ-plot para probar todos los SNPs para la asociación con log transformado bazo. (D) QQ-plot para el ensayo de los 25 mejores SNPs para la asociación con tamaños de bazo no transformadas.
(E) QQ-plot para el ensayo de los 25 mejores SNPs para la asociación con el bazo tamaños del cuantil transforma a una distribución normal. (F) QQ-plot para el ensayo de los 25 mejores SNPs para la asociación con log transformado bazo.