Distribución muestral de diferencia de medias
Con frecuencia, el interés se centra en dos poblaciones. Puede ser que un investigador desee saber algo acerca de las diferencias entre las medias de dos dos pobl poblac acio ione nes. s. Para Para este este y otro otros s caso casos, s, el cono conoci cimi mien ento to acer acerca ca de la distribución muestral de la diferencia entre dos medias es muy útil. Se tienen dos poblaciones distintas, la primera con media µ 1 y desviación estándar estándar σ 1, y la segunda con media µ y desviación desviación estándar estándar σ . Se elige una muestra aleatoria de tama!o n 1 de la primera población y una muestra independiente aleatoria de tama!o n de la segunda población" se calcula la media muestral para cada muestra y la diferencia entre dic#as medias. $a cole colecc cció ión n de toda todas s esas esas dife difere renc ncia ias s %unt %unto o con con sus sus frecu frecuen enci cias as,, se llam llama a distribución muestral de las diferencias entre medias o la distribución muestral del estad&stico $a distri distribuc bución ión es apro' apro'ima imadam dament ente e normal normal para para n1 ( ) y n (). Si las las poblacion poblaciones es son normales, entonces entonces la distribuci distribución ón muestral muestral de medias medias es normal sin importar los tama!os de las muestras. Sabemos que cuando n es grande, la distribución muestral de medias tendrá apro'imadamente una distribución normal con una media igual a µ *la media de la población+ población+ y una desviación desviación estándar estándar de σ / n . Con esto podemos deducir que la media para esta distribución muestral de diferencia de medias es igual a las diferencia entre las medias reales de las poblaciones µ 1 µ . $a varian-a es igual a * σ 1n1+ / * σ n+. 0 el error estándar de la diferencia entre las medias muestrales es
.
$a fórmula que se utili-ará para el cálculo de probabilidad del estad&stico de diferencia de medias es
2ste procedimiento es válido incluso cuando el tama!o de las muestras es diferente y cuando las varian-as tienen valores diferentes. Ejemplo: 2n Ejemplo: 2n un estudio para comparar los pesos promedio de ni!os y ni!as de se'to grado en una escuela primaria se usará una muestra aleatoria de ) ni!os y otra de 3 ni!as. Se sabe que tanto para ni!os como para ni!as los pesos siguen una distribución normal. 2l promedio de los pesos de todos los ni!os de se'to grado de esa escuela es de 1)) libras y su desviación estándar es de 14.14, mientras que el promedio de los pesos de todas las ni!as del se'to grado de esa escuela es de 53 libras y su desviación estándar es de 1.46 libras. Si
representa el promedio de los pesos de ) ni!os y
es el
1
promedio de los pesos de una muestra de 3 ni!as, encuentre la probabilidad de que el promedio de los pesos de los ) ni!os sea al menos ) libras más grande que el de las 3 ni!as. Solución: 7atos µ 1 8
1)) libras µ 8 53 libras σ 1 8 14.14 libras σ 8 1.46 libras n1 8 ) ni!os n 8 3 ni!as 89
Por lo tanto, la probabilidad de que el promedio de los pesos de la muestra de ni!os sea al menos ) libras más grande que el de la muestra de las ni!as es ).1)3:.
Estimación de la Diferencia entre dos Medias
2n cierto ciertos s casos, casos, se desea desea estimar estimar la difere diferenci ncia a entre entre las medias medias de dos poblaciones. ;eniendo dos poblaciones donde el carácter que estudiamos en ambas * X X 1 y X y X + son v.a. v.a. distribuidas según leyes gaussianas, podemos reali-ar una estimación de la diferencia entre dos medias. < partir de cada población se e'trae una muestra aleatoria independiente y de los datos de cada una se calculan las medias muestrales x 1 y x . Sabemos que el estima estimador dor x 1 x proporcion proporciona a una estimación estimación insesgad insesgada a de µ 1 µ , que es la diferencia entre las medias de las poblaciones. $a varian-a del estimador es * σ 1n1+ / * σ n+. Por tanto, para obtener una estimación puntual de µ 1 µ , se seleccionan dos muestras aleatorias independientes que no tienen por qué ser necesariamente del mismo tama!o, una de cada población, de tama!o n1 y n, se calcula la diferencia , de las medias muestrales. =ntervalo para la diferencia de medias cuando se conoce la varian-a
2
>ecordando a la distribución muestral de diferencia de medias
2n el caso en que se descono-can las varian-as de la población y los tama!os de muestra sean mayores a () se podrá utili-ar la varian-a de la muestra como una estimación puntual. Ejemplo: < un equipo de investigación le interesa conocer la diferencia entre las concentraciones de acido úrico en pacientes con y sin mongolismo. 2n una #ospital para el tratamiento del retardo mental, una muestra de 1 individuos con mongolismo proporciona una media de x 18 4.3mg1))ml. 2n un #ospital general se encontró que una muestra de 13 individuos normales de la misma edad y se'o presenta un nivel medio de x 8 (.4. Si suponemos que las dos poblaciones de valores muestran una distribución normal y sus varian-as son iguales a 1, calcular el intervalo de confian-a del ?3@ para µ 1 µ . Solución: Para una estimación puntual de µ 1 µ se utili-a 8 4.3 (.481.1. 2l coeficiente de confiabilidad correspondiente al .?3, que se #alla en la tabla normal, es 1.?:. 2l error estándar es 1 12
+
1 15
8 ).(?
Por lo tanto el intervalo de confian-a del ?3@ es 1.1 ± 1.?: *).(?+ 1.1 ± ).5 *).( " 1.?+ Se dice que se tiene una confian-a del ?3@ de que la diferencia real µ 1 µ , está entre ).( y 1.? debido a que en muestreos repetidos el ?3@ de los intervalos construidos de esa manera incluir&a la diferencia entre las medias reales. =ntervalo para la diferencia de medias cuando se desconoce la varian-a Cuando se desconocen las varian-as de la población y se requiere estimar la diferencia entre las medias de dos poblaciones con un intervalo de 3
confian-a, se puede utili-ar la distribución t para e'traer el factor de confiabilidad, siempre que las poblaciones sean normales o supongamos que lo son. 1.
=ntervalo para la diferencia de medias #omocedáticas
Si suponemos que las varian-as de dos poblaciones son iguales, las dos varian-as de las muestras calculadas a partir de las muestras independientes pueden construirse como estimaciones de una sola cosa, la varian-a común. 2sta varian-a se obtiene calculando el promedio ponderado de las dos varian-as de las muestras. Cada varian-a de las muestras es ponderada en base a sus grados de libertad. $a estimación con%unta se obtiene con la formula
ˆ 7onde se #a definido a como la cuasivarianza muestral ponderada de S 1 y ˆ S . $as varian-as se desconocen, el intervalo se distribuye entonces como una de Student con n1/n grados de libertad Si 1 α es el nivel de significación con el que deseamos establecer el intervalo para la diferencia de las dos medias, calculamos el valor t n1+n2-1,1- α /2 que de%a por encima de si α /2 de la masa de probabilidad de T n1/n. 2l intervalo de confian-a al nivel 1- α para la diferencia de esperan-as de dos poblaciones con la misma varian-a *aunque esta sea desconocida+ es
Ejemplo Se efectuaron estudios sobre la concentración media de amilasa en suero de una población sana. $as mediciones se efectuaron en una muestra de 13 individuos aparentemente saludables. $a muestra proporcionó una media de ?: unidades1))ml y una desviación estándar de (3 unidades1))ml. Se #icieron también las determinaciones de amilasa en el suero de individuos #ospitali-ados que forman una muestra independiente. $a media y la desviación estándar de esta muestra son 1) y 4) unidadesml, respectivamente. $a estimación puntual de µ 1 µ es de 1) A ?: 84. Se desea construir un intervalo de confian-a para la diferencia entre las concentraciones medias de amilasa del suero en individuos aparentemente sanos y la media para los pacientes #ospitali-ados. Solución: Suponemos que las dos poblaciones en estudio tienen una distribución normal y que sus varian-as son iguales. Primero, buscamos la estimación con%unta de la varian-a común como sigue ˆ S
8 14*(3+ / 1*4)+ 13 / A 8 143)
2l intervalo de confian-a del ?3@ para µ 1 µ es
4
*1)?:+
±
.)()1
1450 15
+
1450 22
4 ± *.)()1+*1.63+ 4 ± : * " 3)+ Se dice que se tiene un ?3@ de confian-a de que la diferencia real µ 1 µ esta entre y 3) ya que, al muestrear varias veces, el ?3@ de los intervalos as& construidos incluyen a µ 1 µ . Ejemplo: Bueremos estudiar la influencia que puede tener el tabaco con el peso de los ni!os al nacer. Para ello se consideran dos grupos de mu%eres embara-adas *unas que fuman un paquete al d&a y otras que no+ y se obtienen los siguientes datos sobre el peso X , de sus #i%os
2n ambos grupos los pesos de los recién nacidos provienen de sendas distribuciones normales de medias desconocidas, y con varian-as que si bien son desconocidas, podemos suponer que son las mismas. Calcular en cuanto influye el que la madre sea fumadora en el peso de su #i%o. Solución: Si queremos estimar en cuanto influye el que la madre sea fumadora en el peso de su #i%o, podemos estimar un intervalo de confian-a para µ 1 µ , lo que nos dará la diferencia de peso esperado entre un ni!o del primer grupo y otro del segundo. 2l estad&stico que se #a de aplicar para esta cuestión es
donde
Consideramos un nivel de significación que nos pare-ca aceptable, por e%emplo α 8).)3, y el intervalo buscado se obtiene a partir de
?3@ Con lo cual se puede decir que un intervalo de confian-a para el peso esperado
5
en que supera un #i%o de madre no fumadora al de otro de madre fumadora está comprendido con un nivel de confian-a del ?3@ entre los ),):5 g y los ),6(1 g.
Contrastes para la diferencia de medias apareadas
2n el análisis de la diferencia de medias de dos poblaciones, se supone que las muestras son independientes. Dn método que se utili-a con frecuencia para averiguar la efectividad de un tratamiento o procedimiento e'perimental es aquel que #ace uso de observaciones relacionadas que resultan de muestras no independientes. Dna prueba de #ipótesis que se basa en este tipo de datos se conoce como prueba de comparaciones por pare%as o para muestras apareadas. $as muestras apareadas aparecen como distintas observaciones reali-adas sobre los mismos individuos. Dn e%emplo de observaciones apareadas consiste en considerar a un con%unto de n personas a las que se le aplica un tratamiento médico y se mide por e%emplo el nivel de insulina en la sangre antes * X + y después del mismo *Y +. Eo es posible considerar a X e Y como variables independientes ya que va a e'istir una dependencia clara entre las dos variables. Si queremos contrastar el que los pacientes #an e'perimentado o no una me%or&a con el tratamiento, llamemos d i a la diferencia entre las observaciones antes y después del tratamiento d i = x i- y i
2l ob%etivo de la prueba de comparaciones por pares es eliminar al má'imo las fuentes de variación por medio de la formación de pare%as similares respecto a tantas variables como sea posible. 2n estos casos, en lugar de llevar a cabo el análisis con observaciones individuales, se puede utili-ar como variable de interés la diferencia entre los pares individuales de observación. Supongamos que la v.a. que define la diferencia entre el antes y después del tratamiento es una v.a. d que se distribuye normalmente, pero cuyas media y varian-a son desconocidas. Si queremos contrastar la #ipótesis de que el tratamiento #a producido cierto efecto
6
2n el caso en que ) fuese cierta tendr&amos que el estad&stico de contraste que nos conviene es
ˆ 7onde es la media muestral de las diferencias d i y S d es la cuasivarian-a muestral de las mismas. 2l tipo de contraste ser&a entonces del mismo tipo que el reali-ado para la media con varian-a desconocida. Cuando F) es verdadera la estad&stica de prueba sigue una distribución t de Student con n1 grados de libertad.
1. Contraste bilateral Consideramos el contraste de tipo
2ntonces se define
y se rec#a-a la #ipótesis nula cuando ó
.
2. Contrastes unilaterales 2n los dos tipos de contrastes unilaterales o de una cola se utili-a el mismo estad&stico
Si el contraste es
entonces Se rechaza H 0 si
. 7
Para el test contrario
Se rec#a-a ) si T exp > t n-1 ,1- α . Si el contraste se reali-a cuando σ 2d es conocida, entonces el estad&stico del contraste es
y el tratamiento es análogo en los tres casos. Contrastes de diferencia entre medias poblacionales independientes
2ste tipo de contraste también es aplicado para diferencia de medias, pero en los casos en los que se comparan medias poblacionales para un carácter determinado en dos poblaciones distintas. Sean dos poblaciones normales N ( µ x , σ x ) y N ( µ y , σ y ) con σ x y σ y conocidas, de las cuales se e'traen dos muestras aleatorias e independientes de tama!o n x y n y respectivamente. Con un nivel de significación G dado, queremos reali-ar los siguientes contrastes
H 0 : µ − µ = d 0 1. H1 : µ − µ ≠ d 0 x
y
x
y
H 0 : µ − µ ≤ d 0 2. H1 : µ − µ > d 0 x
y
x
y
H 0 : µ − µ ≥ d 0 !. H1 : µ − µ < d 0 x
y
x
y
2l caso más frecuente es cuando d 08). Sin embrago, es posible probar la #ipótesis de que la diferencia es igual que, mayor o igual que, menor o igual que algún valor distinto de cero.
Dtili-ando el estad&stico
z exp =
x − y − d 0 2
σ x
n x
2
+
σ y
se tienen los siguientes contrastes.
ny
8
!ontraste de medias con varianzas conocidas: 7e manera similar al caso del contraste para una media, queremos en esta ocasión contrastar la #ipótesis de que las dos poblaciones *cuyas varian-as suponemos conocidas+ sólo difieren en una cantidad
frente a #ipótesis alternativas que darán lugar a contrastes unilaterales o bilaterales. Para ello nos basamos en la distribución del siguiente estad&stico de contraste
1. Contraste bilateral o de dos colas
Se define entonces
Se acepta H 0 si
− zα / 2 ≤ zexp ≤ z α / 2
y el test consiste en
9
2. Contrastes unilaterales o de una cola
Se utili-a en ambos caso el mismo estad&stico utili-ado para el contraste bilateral
Para el test
Se acepta H 0 si
exp > − z α
z
y para el contraste de significación contrario
Se acepta H 0 si zexp ≤ z α
Ejemplo: Dn equipo de investigadores desea saber si los datos que #an recolectado proporcionan la evidencia suficiente para indicar una diferencia entre las concentraciones medias de ácido úrico en el suero de individuos normales e individuos con s&ndrome de 7oHn. $os datos presentan las concentraciones de acido úrico en el suero de 1 individuos con s&ndrome de 7oHn y 13 individuos sanos. $as medias son x 184.3mg1))ml y x 8(.4mg1))ml. Solución: 2l contraste es F) µ 1 µ 8 ) o µ 18 µ F1 µ 1 µ I ) o µ 1I µ Si α 8).)3, los valores cr&ticos de z son J 1.?:. Se rec#a-a F ) a menos que 1.?:K z calculadaK1.?:.
10
Cálculo de la estad&stica de prueba Z 8
(4.5 − 3.4) − 0 1 / 12 − 1 / 15
8
1.1 0.39
8.5
Como .5 es mayor que 1.?: se rec#a-a la #ipótesis nula. Se concluye que, de acuerdo con estos datos, #ay indicios de que las medias de las poblaciones son diferentes. !ontraste de medias "omoced#ticas
2l estad&stico que usaremos para el contraste ya lo #emos visto. Si suponemos que ) es cierta se tiene
7onde
es la cuasivarian-a muestral ponderada de S 21 y S 22. ˆ
ˆ
Se #an perdido dos grados de libertad a causa de la estimación de σ 18 σ ˆ 2 y S ˆ 2 . mediante S 1 2 1. Contraste bilateral
Para el contraste de significación
Se tiene como en casos anteriores que el contraste adecuado consiste en definir
0 rec#a-ar o admitir la #ipótesis nula siguiendo el criterio
11
2. Contrastes unilaterales
Cuando el contraste es unilateral del modo
2l contraste se reali-a siguiendo el mismo proceso que en otros reali-ados anteriormente y utili-ando el mismo estad&stico, lo que nos lleva a
0 cuando el contraste de significación es el contrario
7el mismo modo
Ejemplo: Dn grupo de investigadores colecto datos acerca de las concentraciones de amilasa en el suero de muestras de individuos sanos y de individuos #ospitali-ados. 7esean saber si es posible concluir que las medias de las poblaciones son distintas. $os datos son las mediciones de amilasa en suero de n8 13 individuos sanos y n 18 individuos #ospitali-ados. $as medias muestrales y sus desviaciones estándar son las siguientes x 181) unidadesml s184) unidadesml x 8?: unidadesml s8(3 unidadesml Solución: 2l contraste es F) µ 1 µ 8 ) F1 µ 1 µ I ) Si definimos a α 8).)3, los valores cr&ticos de t son J .)()1. Se rec#a-a F ) a menos que .)()1Kt calculada K.)()1. 2l cálculo de la estad&stica de prueba es ˆ S
8
21(1600) + 14(1225) 21 + 14
8143)
12
(120 − 96 ) − 0
t 8
1450 15
24
1450 8 81.55 + 12.75 22
Eo es posible rec#a-ar F ) porque .)()1K1.55K.)()1. 2s decir, 1.55 cae dentro de la región de aceptación. Con base a estos datos no es posible concluir que las dos medias de la población son diferentes. !ontraste de medias no "omoced#ticas 2s un tipo de contraste que se aplica en el caso más problemático, es decir cuando sólo conocemos de las dos poblaciones que su distribución es normal, y que sus varian-as no son conocidas y si$ni%icativamente diferentes. 2l contraste es
2n este caso el estad&stico de contraste tendrá una ley de distribución muy particular. Consistirá en una distribución t de Student, con un número de grados de libertad que en lugar de depender de modo determinista de la muestra *a través de su tama!o+, depende de un modo aleatorio mediante las varian-as muestrales. Concretamente, el estad&stico que nos interesa es
donde % es el n&mero de $rados de li'ertad que se calcula mediante la fórmula de "elch
Eo desarrollamos en detalle los cálculos a reali-ar, pues la técnica para efectuar los contrastes es análoga a las vistas anteriormente cuando las varian-as son desconocidas e iguales. Nota
Si lo que pretendemos contrastar es si las medias poblacionales de dos muestras independientes obtenidas de poblaciones normales son
13
idénticas, esto se reduce a los casos anteriores tomando decir, reali-ando el contraste
, es
Distribución Muestral de Diferencia de #roporciones
Luc#as aplicaciones involucran poblaciones de datos cualitativos que deben compararse utili-ando proporciones o porcenta%es. Cuando el muestreo procede de dos poblaciones binomiales y se traba%a con dos proporciones muestrales, la distribución muestral de diferencia de proporciones es apro'imadamente normal para tama!os de muestra grande *n1p1 3, n1q1 3, np 3 y nq 3+. 2ntonces p 1 y p tienen distribuciones muestrales apro'imadamente normales, as& que su diferencia p 1p también tiene una distribución muestral apro'imadamente normal. Cuando se estudió la distribución muestral de proporciones se comprobó que ˆ µ p
= p y que σ
ˆ p
=
pq
por lo que se puede deducir que
n
µ
ˆ p
µ 1
ˆ p
8 p1-p2 y que
.
Si tenemos dos poblaciones suficientemente peque!as, podemos e'traer de la población 1 todas las muestras aleatorias posibles de tama!o n1 y calcular a ˆ 1. partir de cada con%unto de datos de la muestra la proporción de la muestra p $o mismo podemos #acer con la población . $uego es posible calcular las diferencias entre todos los pares posibles de proporciones muestrales, donde ˆ 1 y el otro un valor p ˆ . $a distribución un miembro de cada par tiene un valor p muestral de la diferencia ente las dos porciones de las muestras consiste en todas las diferencias e'istentes acompa!adas de sus frecuencias de ocurrencias. $a fórmula que se utili-ará para el cálculo de probabilidad del estad&stico de diferencia de proporciones es
Ejemplo: $os #ombres y mu%eres adultos de una ciudad grande en sus opiniones sobre la promulgación de la pena de muerte para personas culpables de asesinato. Se cree que el 1@ de los #ombres adultos están a favor de la pena de muerte, mientras que sólo 1)@ de las mu%eres adultas lo están. Si se pregunta a dos muestras aleatorias de 1)) #ombres y 1)) mu%eres su opinión sobre la promulgación de la pena de muerte, determine la probabilidad de que
14
el porcenta%e de #ombres a favor sea al menos (@ mayor que el de las mu%eres. Solución: 7atos PF 8 ).1 PL 8 ).1) nF 8 1)) nL 8 1)) p*pFpL ).)(+ 8 9 Fay que tener en cuanta que debe incluirse el factor de corrección de ).3 por ser una distribución binomial y que se está utili-ando la distribución normal.
Se concluye que la probabilidad de que el porcenta%e de #ombres a favor de la pena de muerte, al menos (@ mayor que el de mu%eres es de ).43:. Estimación de la Diferencia de dos #roporciones
Luc#as veces se tiene interés en conocer la magnitud de la diferencia entre dos poblaciones, podemos comparar por e%emplo, entre #ombres y mu%eres, dos grupos de edades, dos grupos socioeconómicos. Dn estimador puntual insesgado de la diferencia de proporciones de las poblaciones se obtiene al calcular las diferencias de las proporciones de las ˆ 1 p . Cuando n1 y n son de gran tama!o y las proporciones de muestras p la población no están muy cerca de ) o de 1, es posible aplicar el teorema del l&mite central y utili-ar la teor&a de la distribución normal para obtener los intervalos de confian-a. Mamos a considerar que tenemos dos poblaciones de modo que en cada una de ellas estudiamos una v.a. dicotómica *Nernoulli+ de parámetros respectivos p1 y p. 7e cada población vamos a e'traer muestras de tama!o n1 y n Si las muestras son suficientemente grandes ocurre que ˆ
15
ecordando la formula
7espe%ando ( 1-( 2 de esta ecuación obtenemos un intervalo de confian-a del 1))*1 α + para ( 1-( 2
7onde ) se obtiene de la tabla de distribución normal al nivel 1G.
Dsuaria
Eo Dsuaria
;ama!o Luestral
14:
11165
Eúmero de disfunciones
4
?4
Proporción muestral
).)((6
).):(
2ncuentre el intervalo de confian-a del ??@ para l a diferencia de proporciones. Solución: >epresentemos ( 1 la proporción de nacimientos donde aparecen disfunciones entre todas las madres que fuman mari#uana y definamos ( 2, de manera similar, para las no fumadoras. 2l valor de - para un ??@ de confian-a es de .35.
16
-0.00$%-#2&0.0212
2ste intervalo es bastante angosto, lo cual sugiere que P1P #a sido estimado de manera precisa. Contrastes sobre la diferencia de proporciones
Supongamos que tenemos dos muestras independientes tomadas sobre dos poblaciones, en la que estudiamos una variable de tipo dicotómico *Nernoulli+
Si X 1 y X contabili-an en cada caso el número de é'itos en cada muestra se tiene que cada una de ellas se distribuye como una variable aleatoria binomial, de modo que los estimadores de las proporciones en cada población tienen distribuciones que de un modo apro'imado son normales *cuando n1 y n son bastante grandes+
2l contraste que nos interesa reali-ar es el de si la diferencia entre las proporciones en cada población es una cantidad conocida
Si ) fuese cierta se tendr&a que
7esafortunadamente ni p1 ni p son conocidos de antemano y utili-amos sus estimadores, lo que da lugar a un error que es peque!o cuando los tama!os muestrales son importantes
17
$a prueba que se utili-a con más frecuencia con relación a la diferencia entre las proporciones de dos poblaciones es aquella en la que su diferencia es cero. Sin embargo, es posible probar que dic#a diferencia es igual a algún otro valor. Se pueden #acer pruebas unilaterales y bilaterales. Siempre que la #ipótesis nula sea p 1p8), se supone que las proporciones de las dos poblaciones son iguales. 2sto permite combinar los resultados de las dos muestras y obtener una estimación ponderada de la proporción común supuesta p * 1+ 2 / n1+n2 7onde '1 y ' son el número de la primera y segunda muestra que poseen la caracter&stica de interés. 2sta estimación ponderada se utili-a para calcular el error estándar estimado para el estimador como sigue ˆ σ
=
p (1 − p )
+
n
p (1 − p ) n
2l estad&stico de contraste se convierte en )*
( pˆ − pˆ ) − ( p − p ) ˆ σ
1. Contraste bilateral
2l contraste bilateral sobre la diferencia de proporciones es
2ntonces se define
y se rec#a-a la #ipótesis nula si Z exp<-z 1- α /2 o si Z exp>-z 1- α /2 2. Contrastes unilaterales
2n el contraste
18
Se rec#a-ará ) si Z exp< -z 1- α . Para el test contrario
Se rec#a-a F) si Z exp> -z 1- α . Ejemplo: 2n un estudio para comparar un nuevo tratamiento para la migra!a con el tratamiento #abitual, 65 de los 1)) individuos que recibieron el tratamiento #abitual respondieron favorablemente. 7e los 1)) individuos que recibieron el nuevo tratamiento, ?) respondieron satisfactoriamente. OProporcionan estos datos la evidencia suficiente para afirmar que el nuevo tratamiento es más efectivo que el #abitual9 Solución: Se calculan
ˆ p
1
ˆ p
8 651))8).65 p*
90 + 78 100 + 100
8?)1))8).?)
*.
$as #ipótesis son F)8pp1 ≤ ) F18 pp1) Sea α 8).)3. 2l valor cr&tico de z es 1.:43. Se rec#a-a F ) si el valor de z es mayor que 1.:43. 2l cálculo del estad&stico de prueba es (0.90 − 0.78)
z 8
(0.84)(0.16) 100
+
(0.84)(0.16)
=
0.12 0.0518
8.(
100
Como .(1:43, se rec#a-a F). 2stos datos sugieren que el tratamiento es más efectivo que el #abitual
E'E(C)C)*S DE D)S+(),C)* MES+(/
Dn investigador se siente inclinado a creer que los niveles de vitamina < en el #&gado de dos poblaciones de seres #umanos tiene, cada una, una distribución normal. Se supone que las varian-as de las dos poblaciones son las siguientes 1.
19
Población 1
σ 181?.:))
Población
σ 851))
OCuál es la probabilidad de que una muestra aleatoria de tama!o 13 de la primer población y otra de tama!o 1) de la segunda población proporcionen un valor de mayor o igual a 3), si no #ay diferencia entre las dos medias de la población9 2. Se cree que en una ciudad el )@ de las familias tiene por lo menos un miembro que sufre de algún malestar debido a la contaminación atmosférica. Dna muestra aleatoria de 13) familias produ%o un valor de p 8).6. Si el valor del )@ es correcto, OCuál es la probabilidad de obtener una proporción muestral mayor o igual de la muestra9 !. Si las concentraciones de acido úrico en #ombres adultos normales siguen una distribución apro'imadamente normal, con una media y desviación estándar de 3.6 y 1 mg por ciento, respectivamente, encontrar la probabilidad de que una muestra aleatoria de tama!o ? proporcione una media ˆ
a. Layor que : b. Lenor que 3. c. 2ntre 3 y : 1. 2n una población de ni!os con retardo mental, se sabe que la proporción de los que son #iperactivos es de ).4). Se e'tra%o una muestra aleatoria de tama!o 1) de esa población y otra de tama!o 1)) a partir de otra población con el mismo problema. Si la proporción de ni!os #iperactivos es la misma en ambas poblaciones, OCuál es la probabilidad de que la muestra proporcione ˆ de ).1: o mas9 una diferencia p 1 p ˆ
2. Supóngase que una población se compone de los siguientes valores 1, (, 3, 6, ?. Construir la distribución muestral de ' a partir de muestras de tama!o seleccionadas sin reempla-o. Calcular la media y la varian-a. !. Para una población de #ombres %óvenes de 16 a!os y otra población de mu%eres de 16 a!os, las medias y desviaciones estándar respectivamente del grosor del pliegue subescapular son para los varones ?.6 y :.)" y para las mu%eres 13.: y ?.3. Si se obtiene una muestra aleatoria simple de 4) varones y otra de (3 mu%eres a partir de dic#a población, OCuál es la probabilidad de que la diferencia entre las medias de las muestras *'c#icas 'c#icos + sea mayor que 1)9 %. 2l resultado de una investigación sanitaria revela que el 33@ de los individuos de la población < y el (3@ de los de la población N no padecen enfermedades cardiovasculares. Suponer que se e'trae una muestra aleatoria de tama!o 1) a partir de la población <, y una muestra aleatoria independiente de tama!o 1() de la población N. OCuál es la probabilidad de que las diferencias entre las proporciones de la muestras p < p N esté entre ).() y ).4)+9 ˆ
ˆ
20
. 2n una muestra al a-ar de 63 adultos, (3 de ellos consideran que el cáncer de mamas es curable. Si en la población de la cual se e'tra%o la muestra, la probabilidad real de quienes piensan que dic#o tipo de cáncer es curable es de ).33, OCuál es la probabilidad de obtener una proporción muestral menor o igual que la obtenida en esta muestra9
E'E(C)C)*S DE ES+)M/C)* 1. 2n cierta comunidad se efectuó un análisis neurológico a 11) empleados de una fábrica de #erbicidas, el cual mostró que 44 ten&an anormalidades neurológicas. 2n una muestra de 13) residentes que no eran empleados de la fábrica, 1: individuos mostraron anormalidades neurológicas. Construir un intervalo de confian-a del ?3@ para la diferencia entre las proporciones de las poblaciones. 2. 2n un e'perimento dise!ado para estimar el número promedio de latidos del cora-ón por minuto para cierta población, se encontró que el número promedio de latidos por minutos para 4? personas era de ?). Si resulta lógico suponer que esos 4? pacientes constituyen una muestra aleatoria y que la población sigue una distribución normal, con una desviación estándar de 1), calcular el intervalo de confian-a de ?)@ y ?3@ para µ . !. Se llevo a cabo un estudio para comparar las concentraciones de lipo prote&na de alta densidad en #ombres adultos con traba%os sedentarios y con traba%os manuales. $os datos de la muestra proporcionaron los siguientes resultados
;raba%adores sedentarios x 8 3:.3, s 814.1, n833 ;raba%adores manuales x 8 31.(, s 81(.3, n83) Construir un intervalo de confian-a del ?3@ para la diferencia entre las medias de las poblaciones. %. < nueve pacientes que sufren la misma incapacidad f&sica, y por lo tanto son comparables, se les pidió que llevaran a cabo cierta tarea como parte de un e'perimento. 2l tiempo promedio necesario para reali-ar la tarea fue de siete minutos con una desviación estándar de dos minutos. Suponiendo que la distribución de datos es normal, construir intervalos de confian-a del ?)@ y ?3@ para el tiempo medio real necesario para que este tipo de pacientes efectúe la tarea. . 2n un estudio dise!ado para establecer la relación entre un medicamento y cierta anomal&a en los embriones de pollo, se inyectaron con el medicamento 3) #uevos fecundados al cuarto d&a de incubación. 2n el vigésimo d&a de incubación se e'aminaron los embriones y se observó la presencia de la anomal&a en 1 de ellos. 2ncontrar los intervalos de confian-a del ?3@ y ??@ para p. $. Meinticuatro animales de laboratorio con deficiencia de vitamina 7 fueron divididos en dos grupos iguales. 2l grupo 1 recibió un tratamiento consistente en una dieta que proporcionaba la vitamina 7. 2l segundo grupo no fue tratado.
21
O2s posible concluir que los ni!os crónicamente enfermos tienden, en promedio, a tener menos confian-a en s& mismos que los ni!os sanos9 Se aplicó una prueba dise!ada para estimar la confian-a en s& mismos de 1: ni!os crónicamente enfermos y a 1 ni!os sanos. $os punta%es medios y desviaciones estándar fueron 1.
Ei!os enfermos x 8.3 s84.1 Ei!os sanos x 8:.? s8(. Sea α 8).)3 2n una muestra de 13)) residentes de un barrio de la ciudad, quienes participaron en un programa selectivo de salud, 13 pruebas proporcionaron resultados positivos en cuanto a la anemia de células falciformes. OProporcionan estos datos la evidencia suficiente para indicar que la proporción de individuos con anemia de células falciformes en la población muestreada es mayor que ).):9 Sea α 8).)3. !. Setenta pacientes que sufren de epilepsia se dividieron al a-ar en dos grupos iguales. 2l grupo < recibió un tratamiento que inclu&a dosis diarias de vitamina 7. 2l grupo N recibió el mismo tratamiento con la e'cepción de que a este grupo se le dio un placebo en lugar de la vitamina 7. 2l número medio de ataques convulsivos observados durante el periodo de tratamiento en los grupos fue x <813 y x N84. $as varian-as de las muestras fueron S <85 y SN81. O2stos datos proporcionan evidencia suficiente para indicar que la vitamina 7 es efectiva para disminuir el número de ataques convulsivos9 Sea α 8).)3 %. 2n una muestra de 4? adolescentes que se prestaron como su%etos para un estudio inmunológico, una variable de interés fue la prueba del diámetro de reacción de la piel a un ant&geno. $a media de la muestra y la desviación estándar fueron 1 y 11 mm de eritema, respectivamente. O2s posible concluir 2.
22
a partir de estos datos que la media de la población es menor que ()9 Sea α 8).)3. . Se desea saber si los ni!os de dos grupos étnicos difieren con respecto a la proporción de anémicos. 7e cada grupo se e'tra%o una muestra de ni!os de un a!o de edad atendidos en cierto grupo de departamentos de salud locales en un periodo de un a!o. Se obtuvo la siguiente información respecto a la anemia Qrupo étnico 1
Eúmero de elementos 43) (63
Eúmero de anémicos 1)3 1)
OProporcionan estos datos la suficiente evidencia para indicar una diferencia entre las dos poblaciones con respecto a la proporción de anémicos9 Sea α 8).)3. $. Dna muestra de 1)) empleados de un #ospital, los cuales #ab&an estado en contacto con sangre o sus derivados, fue e'aminada para averiguar si presentaban evidencia serológica de #epatitis N. Se encontró que ( de ellos presentaron resultados positivos. O2s posible concluir a partir de estos datos que la proporción de la población de individuos que presentaron resultados positivos en la población muestreada es mayor que ).139 Sea α 8).)3 . Se desea saber si es posible concluir que el consumo medio diario de calor&as de la población rural de un pa&s en desarrollo es de menos de ))). Dna muestra de 3)) individuos produ%o un consumo medio de 1?53 y una desviación estándar de 1). Sea α 8).)3.
23