5.1 INTRODUCCION
5.5 DISTRIBUCION
5.2 DISTRIBUCIONES MUESTRALES 5.3 DISTRIBUCION DE LA
MUESTRA
LA
MEDIA DE
5.4 DISTRIBUCION DE LA DIFERENCIA ENTRE LAS MEDIAS DE DOS MUESTRAS
5.1
DE LA
PROPORCION DE LA MUESTRA
5.6 DISTRIBUCION
DE LA DIFERENCIA ENTRE LAS
PROPORCIONES DE DOS MUESTRAS
5.7 RESUMEN
INTRODUCCION
Antes de examinar el tema de estudio de este capftulo es conveniente repasar algunos de los conceptos importantes estudiados hasta ahora. En el capitulo 1 s presenta un vocabulario estadfstico estadfstico util y basico, basico, y tambi en se e studia n los conceptos fundamentales para la recolecci6n de datos. En el capitulo 2 se hace resaltar los procesos de organizaci6n y resumen de datos. Aquf es donde se introducen los conceptos de tendencia central y dispersi6n, y en donde se estudia c6mo ca1cular sus medidas descriptivas. En el capitulo 3 se presen tan las ideas fundamentales de probabilidad y en el capitulo 4 se considera el concepto de distribuci6n de probabilidad. Estos conceptos son importantes para comprender la inferencia estadfsti estadfstica, ca, tem a de estudio qu e abarca la mayor parte de este libro. Este capitulo sirve para vincular los conceptos ya ya menci onados, de naturaleza esencialmente descriptiva, con la mayorfa de los temas subsecuentes, seleccionados del area de estudio de la inferencia estadfstica.
124
5.2
5.2
DISTRIBUCIONES MUESTRALES MUESTRALES
12
DISTIUBUCIONES MUES'mALES
El tema principal de este capitulo trata ace rca de las distribuciones muestrales. Es necesario un entendimiento claro estas dones, ya que este concepto es la clave para comprender la inferencia estadfs tica. Las distribuci ones de probabilidad sirven para do prop6sitos: 1) permiten responder preguntas de probabilidad acerca de estadisticas muestrales y 2) proporcionan la teoria necesaria para hacer'validos los procedimientos in ferencia estadistica. En este capitulo se utiliza la distribuci6n distribuci6n muestral para contestar preguntas de probabilidad acerca d e l a estadfstica muestral. Se debe recordar qu en el capitulo 2 se dijo que la estadistica muestral es na medida descriptiva, como la media, la mediana, la varian cia la desviaci6n estandar la muestra. En los siguientes capftulos se qu se calcula a partir de los datos estudia c6mo la distribud6n muestral hace validas las inferendas estadisticas. Po ahora, se inicia con la siguiente definicion.
DEFINICION La distribucion puede todos los valores posibles estadfstica, calculados p a r t i r d e muestras asumir la mism o tamano, seleccionadas aleatoriamen te llamadistribuci6n muestrul m i s m a p o b l a c io io n , estadistica. Distribuciones Distribuciones muestrules: elaboraci6n La distribuciones muestrales partir de poblaciones finitas y discretas. pueden construirse empfricamente Para ello, se procede como sigue:
. 2. 3.
poblaci6n finita de tamano N, se extraen de manera aleatoria todas las muestras posibles de tamano n. un
e
Iii estadistica de interes para cada muestra.
c;olumna los los distint os valores observad os de la estadistica y, ordenan en un c;olumna en otra col-qmna, las frecuencias de ocurrencia correspondientes de cada va
lor observado.
Elaborar la distribuci6n muestral es un tarea formidable si la poblaci6n es un tamano mu grande, imposible si la poblaci6n es infinita. En ultimo caso, es posible obtener aproximaciones de las distribuciones muestrales to muestras de mando gran numero tamano dado.
Distribuciones HllIestrales: curacteristicasirnporlantes Normalmente, para un distribuci6n muestral se tiene interes en cono cer tres cosas: media, variancia forma funcional (apariencia gnlfica) gnlfica) Es bien conocida la dificultad qu existe para elaborar elaborar una distribuci6n muestral de acuerdo co el procedimiento anterior cuando la poblaci6n es muy poblaci6n es infinita. En grande. Tambien constituye problema cuando este caso, 10 mejor qu se puede hacer de manera experimental es aproximar la distribuci6n distribuci6n muestral de la estadfstica.
126
CAPITULO 5
ALGUNAS DISTRIBUCIONES DE MUESTREO IMPORTANTES
Ambos Ambos problem as pueden evitarse or medio las matematicas. Aunque los procedimientos que intervienen no so compatibles co el nivel matematico deeste libro, las distribuciones muestrales pueden deducirse matematicamente. Ellectodnteresado puede consultar cualquiera de.los libro de texto de estadfs tica matematica, ejemplo, Larsen Marx (1 Rice (2). En las siguientes secciones se estudian algunas de las distribuciones mues trales mas frecuentes.
5.3 DE
DISTRIBUCION DISTRIBUCION DE IA MEDIA MllESTRA distribuci6n distribuci6n muestral importan te es la distribucionde la media de la muestra. A continuaci6n se da un ejemplo de como elaborar esta distribuci6n distribuci6n siguiendo los en pasos del procedimiento descrito la seccion anterior. Un
EJEMPLO 5.3.1 Considere un poblaci6nde tamano 5, la cual se compone de las edades de cinco ninos que son pacientes externos de un clfnica de salud mental. Las 6, 8, X3 10, 12 Y X5 14. La media edades so las siguientes: poblaciones igual a I . x ) N la variancia es 8. 11 para es
talllano TABLA 5 . 3 . 1 T o d a s l a s p o s i b l e s l l l u e s t r a s talllano l l l u e s t r a s a r ~ ' i b a a r ~ a' ibb aa j o d e l a poblacion llluestreo es diagon31 p r i n c i p a l r e s u lt lt a n c u a n d o reelllplazos. llluestras es mn en t r e parentesis. llledia.."i d t ~ Segunda seleccion
12 6,6.
Primera seleccion
(6)
(7)
(7)
(8 10,8
10
10,6
12
12,6
14
(9)
(9) 12, 8 (10)
(10)
(11)
(8)
14,6
14,8
6, lO (8) 8, 10 (9) 10,10 (10) 12, 10 (11)
14; 10 (12)
6, 12 (9) 8, 12 (10) 10, 12 (11)
12, 12 (12) 14, 12 (I3)
14 6, 14 0)
8,14 (11)
10, 14 (12) 12, 14
(13) 14, 14
(14)
5.3 TABLA
5.3.2
DISTRIBUCION DE
a pm·th· tabla 5.3.1
de la
de
MEDIA DE LA l\iUESTRA
muestral las muestras
Distribucion
calculada
LA
27
de
Frecuencia Frecuencia
9 10
5
1/25 2/25 3/25 4/25 5/25 4/25 3/25 2/25 1/25
25
25/25
11
12 13
14 Total
relativa
Se calcula otra medida de dispersion y se designa con la letra 40
como sigue:
lO
Esta cantidad se utilizara en el siguiente capitulo. Po ahora, se pretende elaborar la distribucion muestral de la media de la muestra, X, con base en las muestras de tamafio == 2 seleccionadas de esta poblacion. Solucion: Seleccione todas la muestras posibles de tamafio de esta pobla ci6n. Estas muestras junto con sus medias, se encuentran en la tabla 5 . 3 ~ 5 . 3 ~
En este ejemplo se observa observa que, cuand el muestreo se efectua efectua co reemplazos, hay 25 muestras posibles. En general, cuando e1 muestreo se neva a cabo con reemplazos, el numero de muestras posibles es es igual aNn. Puede construirse la distribuci6n muestral de xordenando los di ferentes valores de en una colu mna, y sus frecuencias de ocurrencia en Ia otra, tal como 10 muest ra la tabla 5.3.2. En la tabla 5.3.2 se aprecian los datos que satisfacen los requerimientos para la distribuci6n de probabilidad. La probabilidade s individuales todas son mayores a 0 y la suma es igual 1. interes principal radica en la forma Se mencion6 al principio que la variancia. Ahora, estas funcional de la distribuci6n muestral, la media caracteristicas se consideran para la distribucion muestral de la media de la muestra, x.
12
CAPITULO 5
ALGUNAS
DISTRIBUCIONES DE MUESTREO IMPORTANTES
fIx)
10
14
12
Distribucion de la poblacion fIX)
,0
Distribucion muestral de FIGURA
5.3.1
Distribuci6n
DistribuciOn muestral d
la poblaci6n
distribuci6n muestral de
x.
~ x : f Q r m a f u n c i Q n a l d ~ En x : la f Q figura r m a f 5.3.1 u n c i se Q n a l
junto co el distribucion poblacion. Es la diferencia entre la apariencia del histograma de la poblacion la de histograma de la distribuci6n muestral de x. Mientras qu el primero esta dis tribuido uniformemente, el segundo crece gradualmente hasta un punto maxi despues decrece fonnando una figura simetrica.
bl
Distribuci6n muestral
x:
la media
EI siguiente paso es calcular la
media, representada po /lx' de la distribucion muestral. Para hacerlo, se su man,las 25 medias de la muestra·y el resultado se divide entre 25. As!:
Il
LX N"
------6+7+7+8+···+14
250
25
25
10
,Es interesante notar qu la media de ladistribucion muestral para ne el mismo valor qu la media de la poblacion original.
tie
.3
DISTRIBU CION DE LA MEDIA DE LA lI>1UESTRA
Dislribuei6n mueslral variancia de
varianeia
x, representada <,
L,(x
12
Finalmente, el calculo de la
es como sigue:
ilx)2
cr;;=----
N"
(6
10)2+(7-10)2+(7-10)2+ ... +(14
10)2
=-------------------------------- 25
100
=-=4
25
Tambien se puede adverti r que la variancia de la distribucion muestral no es igual a la variancia de la poblacion. Sin embargo, es interesante observar qu Ia variancia de la distribucion muestral es igual a la variancia de la poblacion dividida entre el tamano de la muestra utilizada para obtener la distribuci6n muestral. Esto es
c r ~ =
cr
=-=4
A la raiz cuadrada de la variancia de la distribucion muestral, cr .r;;,se Ie llama error esttindar de fa media, simplemente error estandar. Estos resultados no son coincidencias sino ejemplos de las caracteristicas de las distribuciones muestrales general, cuando el muestreo es con reemplazo cuando se efectUa a partir de un poblaci6n infinita. Para generalizar, se debe dis tinguir entre dos situaciones: muestreo a partir de una poblaci6n que sigue un distribuci6n normal muestreo a partir de un poblacion qu no sigue un distri bucion normaL mueslreo partir p o b l a e io io n e s q u e DislribuciOn m ues lral siguen d i s l r i b u c i 6 n n o r m a l Cuando el mues treo se realiza partir de un poblacion que sigue un distribucion distribucion normal, la distribucion de la media de la muestra tiene las siguientes propiedades: 1.
La distribucion de
sera normal.
2. La media, ilx, de la distribuci6n de sera igual a la media de la poblaci6n de la cual se seleccionaron las muestras. 3. La variancia, cri, de la distribuci6n de sera igual a la variancia de la pobla cion dividida entre el tamano de la muestra. ll#ueslreo p a r l i r de p o b l a c i o n e s signen dlslribuei6n normal Cuando el muestreo seefectua partir de un poblacion que no sigue un distribu teorema matematico conocido como teorema del limite cion normal, se utiliza central. La importancia de este teorema en la inferencia estadistica se resume en el
siguiente parrafo.
130
CAPITULO 5
ALGUNAS DISTRIBUCIONES DE MUESTREO IMPORTANTES
Teorema del limite central
Dada una poblaci6n de cualquier forma funcional no normal can una media!! y variancia finita de La distribuci6n muestraL de x, calculada a partir de muesiras de tamano dicha poblacion, sera cc.si r.ormal con media!! variancia 021n wando la muestra es muy grande.
Observe que el teore ma del limite central permite tomar muestras a partir de poblaciones con distribucion no normal y garantizar que se obtengan aproximada mente los mismos resultados qu si la poblacion tuviera un distribucion normal, siempre que se tome un muestra grande. La importancia de esto se se demostrar a mas adelante al estudiar que un distri bucion muestral con distribucion normal es un herramienta importante en la infe rencia estadfstica. En el caso de la media de la muestra, se dene la seguridad de qu la distribucion muestral esta distribuida en forma al menos aproximadamente nor mal con tres condiciones: 1) cuand o se hace el el muestreo a partir de un poblacion muestreo a parti de un poblacion qu con distribucion normal; 2) cuando se hace el muestreo no exhibe un distribucion distribucion normal y la muestra es grande, 3) cuando se hace el muestreo a partir de un poblacion cuya forma funcional se desconoce, siempre que el tamano de la muestra sea grande. Alllegar a este punto, surge un pregunta logica: (que tan grande debe ser la muestra p ara que e l teorema d ellfmite central sea aplica aplicable? ble? No existe existe un sola respues ta, pues el tamano de la muestra depende de la condicion de no-normalidad en la poblacion. Un regIa empiric a establece que, en la mayoria de las situaciones prac ticas, un muestra de tamano 30 es suficiente. En general, la aproximacion a la normalidad de la distribucion muestral para llega a se mucho mejor a medida que crece el tamano de la muestra. Los Los resultados anter iores se ha dado con la premisa de que el muestreo es con reemplazo que la muestra fue extrafda de un poblacion infinita. En general, no se efectuan muestreos con reemplazo, y en muchos casos practicos, el muestreo debe hacerse a partir de un poblacion finita; po 10 tanto, es necesario necesario conocer el comportami ento de la distribucion muestral de la media de la muestra co estas condiciones. Antes de hacer cualquier afirmacion general, convie ne revisar nuevamente los datos de la tabla 5.3.1. Las medias de la muestra qu resultan cuando el muestreo es sin reemplazos se present an sobre la diagonal princi pal, que son las mismas que estan debajo de dicha diagonal, siempr e y cuando se ignore el orden en que se hiciero n las observaciones. observaciones. Se observa que hay 10 muestras posibles. En general, cuando se extraen sin reemplazos reemplazos muestras de tamano a par ti de un poblacion finita de tamano N, y se se ignor a el orden en que son extraidas las muestras, se obtiene el numero de muestras posibles posibles medi ante la combinacion de cosas tomadas a la vez. En el siguiente ejemplo se tiene que:
Muestreo sin reemplazo
n!(N
n)!
51
5·4·31
2131
213!
10 muestras posibles posibles
.3
DISTRIBUCION DE LA MEDIA DE LA MUESTRA
131
La media de las lO medias muestrales es
Nuevamente se aprecia que la media de la distribuci6n muestral es igual a la me di de la poblaci6n. La variancia de la distribuci6n muestral se calcula como sigue: 30 10
en esta-ocasi6n se observa qu
la variancia de la distribuci6n muestral no es igual a la variancia de la poblaci6n dividida entre el tamano de la muestra, porque ( J ~ 4. Sin embargo,existe un relaci6n interesante qu se 3" 8/2 descubre al multiplicar (J2/n po (N 1). Esto es: )/(N
Este resultado indica qu si se multiplica la variancia de la distribuci6n muestral que se obtendria si el muestreo fuese co reemplazos, el factor (N n ) / ( N I), se obtiene el valor de la variancia de la distribuci6n muestral qu resulta cuando el muestreo es sin reemplazos. Es posible generalizar estos resultados con el siguiente enunciado: Cuando el muestreo es sin reemplazos a partir de un muestral de tendra un media J..L variancia
poblaci6n finit a, la distribuci6n
Si el tamano de la muestra es muy grande, el teorema de Hmite central es distribuci6n muestral de sera aproximadamente normal. aplicable y la distribuci6n Carreccion
pab/acion fi it
AI factor (N
n) (N
1) se Ie llama
correcci6n por poblaci6n jinita, y se puede omitir cuando el tamano. de la muestra es pequeno en comparaci6n co el tamano de la poblaci6n. Cuando la pobla cion es mucho mayor qu la muestra, la diferencia entre (J2/n «J2/n)[ (N )/(N 1)] es insignificante. Por ejemplo, si un poblaci6n tiene un tamano de 10,000 el tamano de una muestra de esta poblaci6n es de 25, la correcci6n po po blaci6n finita es igual a (10,000 25)/(9999 25)/(9999)) .9976. Multiplicar (J2/n po .9976 es casi equivalente multiplicar po 1. La mayorfa de los estadfsticos no utilizan la correccion po poblaci6n finita a menos qu la muestra se de mas de or ciento de la poblaci6n. Es decir, decir, la correcci 6n de poblaci6n finita gene ralmente se ignora cuando n/N:::; .05.
13
CAPITULO 5
ALGUNAS DlSTRIBUCIONES DE MUESTREO IMPORTANTES
Distribuci6n m u e s t r a l d e x: r e s u m e n Las Las caracteristi cas de la distribu de en cion muestral se resumen las dos siguientes condiciones: 1. Cuando el muestreo se realiza a partir de un pobJacion distribuida normal mente con un variancia de poblacion conocida:
a)
Il
b)
Ox
:::;
Il
f;
c) La distribucion muestral de
es normal.
2. EI muestreo se efectua a partir de un poblacion qu sigue un no normal con un variancia de poblacion conocida: a) Ilx
Il
b) Ox Ox
distribucion
donde
IN::;; .05
,- !N-n
(o!-vn),I-
c) La distribucion muestral de
aproximadamente normal.
Como se vera en capitulos posteriores, el conocimiento la comprension de las distribuciones muestrales son necesarios para entender los conceptos de la inferencia estadfstica. La aplicacion mas sencilla para la distribucion muestral de la media de la muestra es el ca.lculo de la probabilidad de obtener muestra co media de alguna magnitud especificada. Esto se ilustra con algunos ejemplos.
AplicaciQnes
EJEMPLO 5.3.2
Suponga que en una poblacion grande de seres humano s, la dimension del diame tro craneal sigue un distribucion aproximadamente normal, co un media de 185.6 mm un desviacion desviacion estand ar de 12.7 mm. ~ C u a I es la probabilidad de que un muestra aleatoria de tamafio lOde esta poblacion tenga un media mayor que 190?
Soluci6n: Se sabe qu la muestra individual qu se estudia es solo un de todas las muestras posibles de tamano 10 qu pueden ser extrafdas de la pobla cion, de modo qu la media a la qu conduc e e una de las que forman parte de la distribucion muestral de que, teoricamente, podria inferirse de esta poblacion. Cuando se dice qu la poblacion tiene un distribucion aproxima damente normal, se supone que la distribucion distribucion muestral de sigue, para fines pnicticos, un distribuci6n normal. Tambien se sabe que la media la desviaci6n estandar de la distribuci6n muest ral son iguales a
12.7/-110 4.0161, respectivamente. Se supone 185.6 y J02.7)2 /1 qu la poblacion es grande con respecto a la muestra, de manera qu la correccion po poblacion finita puede omitirse. En el capItulo 4 se aprendi6 que siempre qu se tenga un variable aleatoria co distribucion distribucion normal, esta puede transformarse facilmente
.3
DISTRIBUCION DE LA MEDIA DE LA MUESTRA
13
distribuci6n normal est<:indar. Ahor a la variable variable aleatoria es x,la -V n su desviaci6n estandar es (J media de su distribuci6n es li (J AI modificar adecuadamente la formula anterior, se obtiene la siguiente f6rmula para transformar la distribuci6 normal de en la distribuci6n en un
normal estandar
Jlx
(5.3.1)
z=---
(5/{;;
La probabilidad qu responde a la pregunta formulada e representa en el area la derecha de 190 bajo la curva de la distribuci6n muestral.
(a)
x= . ; ; ; '110
4.0161
.1357
/kJi=185.6
190
(b
.1357
1.09 (e)
Distribuci6n de la poblaci6n, distribuci6n muestral distribu ci6n normal estandar, ejemplo 5.3.2: a) distribuci6n de la poblaci6n; b) distri buci6n muestra de para muestras muestras de tamafio 10; c) distribuci6n normal estfudar. FIGURA 5.3.2
CAPIT ULO 5
13
ALGUNAS ALGUNAS DISTRIB UCIONES DE MUESTRE O IMPORTA NTES
Esta area es igual al area de la derecha de: =1.10 4. 4.0161 4.0161 AI consultar la tabla normal estandar, se encuentra qu el area a la dere cha de 1.10 es .1357; po 10 tanto, se puede decir que la probabilidad de qu la muestra de tamaiio 10 tenga una media mayor qu 190 es .1357. La figura 5.3.2 muestra la relaci6n entre la poblaci6n original, la distribuci6n muestral de y la distribuci6n normal estandar. • z=-----
EJEMPLO
5.3.3
Si la media y desviaci6n estandar de la concentraci6n concentraci6n de hierro en el suero en cada 100 ml, respectivamente, hombres sanos es de 120 y 15 microgram os un muestra aleatoria de 50 hombres normales ~ c u a l es la probabilidad de qu tenga un media entre 115 y 125 microgramos po cada 100 ml? Soluci6n: No se especifica la forma funcional de la poblaci6n de valores de con
centraciones de hierro el suero, pero dado qu se tiene tamaiio de mayor el muestra qu 30, se puede utilizar teorema del lfmite central para transformar la distribuci6n muestral casi normal resultante de (la cual tiene un media de 120 y un desviaci6n estandar de -J5O 2.1213) en un distribuci6n normal estandar. La probab ilidad buscada es P(1l5
125) = p l 1 l 5 -120 2.12 P(-2.36
125 - 1 2 0 ] 2.12 2.36)
= .9909 .9909 .0091 .0091 =.9818
EJERCICIOS 5.3.1
La National Health an Nutrition Examination Survey de 1976-1980 (A-l) encontr6 que los niveles de colesterol en individuos varones, varones, estadounidenses, con edades entre 20-74 afios, afios, fue de 211. La desviaci6n estandar fue aproximadamente de 90. Considere la distribuci6n muestral de la media de la muestra basada en muestras de tamafio 50 extraidas de esta poblaci6n de individuos varones. ~ C u a l es la media de la distribuci6n muestral y el error estandar?
2
estudio mencionado en el ejercicio 5.3.1 report6 niveles de colesterol de 180 en varones con edades entre 20 y 24 afios, co
desviaci6n estandar de aproximadamente 43. Si se extrae un muestra aleatoria simple de tamafio 60, calcule calcule la probabili dad de que el nivel de colesterol de la media de la muestra sea: a) Entre 170 y 195 c) Arriba de 190
b) Abajo de 175
5.4
DISTRIBUCION DE LA DIFERENCIA ENTRE LAS MEDIAS
5.3.3 5.3.3 Si las las conce concentra ntracion ciones es de acido urico en hombres adultos normales siguen un distribuci6n aproximadamente normal, co un media y desviaci6n estandar de 5.7 Y 1 mg po ciento, respectivamente, encuentre la probabilidad de qu un muestra de tamafio proporcione un media: a) Mayor que 6
b) Entre 5 y
c) Menor que 5.2
5.3.4 5.3.4 Para Para cierto cierto secto sectorr amplio amplio de poblaci6n en un afio afio determinado suponga que el numero medio de dias de incapacida d es 5.4, con un desviaci6n estandar de 2.S dfas dfas.. E ncuen tre la probabilidad de que un muestra aleatoria de tamafio 49 de esa poblaci6n tenga un media: a)
Mayor a 6 dias
c) Entre 4.5
5
b) Entr e 4 y 6 dfas
5.5 dfas
D ad ad a un poblacion distribuida distribuida normalmen te can una media de 100 una desviaci6n estandar de 20, encuentre las siguientes probabilidades para una muestra de tamafio 16: a) P( X
b) P(96
100)
lOS)
c ) P ( x S 110)
5.3.6 Dada: f.l= 50,
(J
16
64, calcular:
a) P(45 S XS 55)
b ) P ( x > 53)
c ) P ( x < 47)
d) P(49
56)
5.3.7 Suponga que un poblaci6n se compone de los siguiente s valores 1 , 3 , 5 , 7 , 9 . Construya la distribuci6n muestral de seleccionadas sin reempla partir de muestras de tamafio dos, seleccionadas zoo Calcule Calcule la media y la varian cia de la distribuci6n. 5.3.8
Utilic Utilicee los los datos del ejemplo 5.3. 5.3. para obtener la distribuci6n muestral de partir de muestras de tamafio tres seleccionadas sin reemplazo. Calcule Calcule la med ia y la variancia. variancia.
5.3.9 En una poblaci6n de j6venes de 17 afios de edad, la me dia del espesor del pliegue subescapular (en miHmetros) es de 9.7, con un desviaci6n estandar de 6.0. A partir de una muestra aleatoria simple de tamafio 40 extrafda de esa poblaci6n, calcule la probabilidad de que la media de la muestra: a) Sea mayor que 11
5.4
b) Se menor
igual qu
7.5
c) Este entre 7 y 10.5
DISmmUCION DE lA DIFERENCIA ENTRE
lAS MEDIAS DE DO
MUESTRAS
frecuencia, el interes en una investigacion se dirige hacia dos poblaciones. Especfficamente, puede ser que un investigador desee saber algo acerca de la dife rencia entre las medias de dos poblaciones. En un investigacion, po ejemplo, el investigador investig ador tal vez vez deseara saber si es razonable concluir que dos medias poblacionales son diferentes. En otra situaci6n, es posible que el investigador quiera conocer la magnitud de la diferen cia entr e elIas elIas Un equipo de investigaci6n medica, po ejem plo, quiza requiera saber si el nivel medio de cole sterol en el suero es mayor en grupo de oficinistas que en grupo de obreros. Si los investigadores concluyen que las medias de la poblaci6n son diferentes, es posible qu deseen saber qu Co
13
ALGUNA ALGUNAS S DISTRIBUCI ONES DE MUESTREO IMPORTANTES
CAPITULO 5
tanto difieren. El conocimiento acerca de la distribuci6n muestral de la diferencia utH investigaciones de este tipo.
entre dos medias es mu
partir de poblaciones d i s t r i b u c i o n n o r m a l Los ejem plos siguientes describen la elaboraci6n y las caracterfsticas de la distribuci6n muestral de la diferencia entre las medias de las muestras cuando el muestreo se hace a partir de dos poblaciones con distribuci6n normaL
JUuestreo
EJEMPLO 5.4.1
Supong a que se tiene n dos poblaciones poblaciones de individuos. Un de ellas (la poblaci6n 1) ha experimentado alguna enfermedad que se considera esci asociada con retraso mental, y la otra (la poblac i6n 2) no experi mentado tal enfermedad . Se cree que la distribuci6n de calificaciones de inteligencia de cada un de las poblaciones presenta un distribuc distribuci6n i6n aproximadamente normal con un desviaci6n estandar de 20. Suponga, tambien, tambien, que se toma un muestra de 15 individuos de cada pobla ci6n y se calcula en cada muestra la media de las calificaciones de inteligencia, co los siguientes resultados: Xl 92 105. Si no hay diferencia entre las dos poblaciones co respecto a la media real de las calificaciones de inteligencia, ~ c u a l mayor es la probabilidad de observar un diferencia de esta magnitud (Xl entre las medias de las muestras? Soludon: Para
responder a esta pregunta es necesario conocer la natural eza de la distribuci6n muestral para la estadfstica principal, es decir, la diferencia
Es importante notar que se entre las dos medias de las muestras, busca la probabi lidad asociada co la diferencia entre las medias de dos muestras en lugar de una. • Aunque en la practica no se intentarfa construir la distribuci6n muestral deseada, es posible un idea con ceptual acerca de la forma qu podrfa efectuarse cuando el muestr eo se realiza a partir de poblaciones finitas. Se comenzarfa po seleccionar de la poblaci6n 1 todas las muestras posibles de tamano 15 y calcular la media de cada muestra. Se sabe qu hay N,C., de tales muestras, donde es el tamano de la poblaci6n y n 15. De la misma forma, se podr fa seleccionar todas las posibles posibles muestras de tamano 15 de la poblaci6 n 2 y calcular calcular las las medias. Se toma rian todos los pares posibles de las las medias muestrales, un de la poblaci6n 1 y otra de la poblaci6n 2, asf como su diferencia. En la tabla 5.1.1 aparec en los resultados de seguir este procedimiento. Cabe aclara r que, los 1 y los 2 la ultima linea de la tabla no son exponentes sin indicadores de poblaci6n 1 y 2, respectivamente.
D i s t r i b u c i o n m u e s t r a l de
elaboracion
Distribucion muestral c a r a c t e r i s t i c a s Lo qu se pretende es caIcular l;'l distribuci6n de la diferencia entre las medias de las muestras. Si se elabora grMica de las diferencias de las muestras contra sus frecuencias media igual ocurrencia, se podrfa obtener na distribuci6n normal co f.!J f.!2' la diferencia entre las medias reales de los do grupos poblaciones, (O'f na variancia igual ( O ' ~ ). Esto es, el error estandar de la dife rencia entre las medias serfa igual
( O ' ~
(O'i
)
.4
DISTRIBUCION DE LA DIFERENCIA ENTRE LAS MEDLi\S
TABlA 5.4.1 Tabla de Q'abajo pal'a elaboral' la distl'ibuci6n difel'encias entre las do medias la muestras Muestras de la poblacion
Medias de las muestras de la poblacion
Muestras de de la poblacion
il
12
21
Z2
31
32
Medias de la muestras de la poblacion
xJl
las
Todas las posibles posibles diferencias entre la medias
l2
Xll
l2
21
22
xl!
22
31
S2
II
S2
media igual Para el ejemplo 5.4.1 habria una distribuci6n normal co a 0 (si no ha diferencia entre las medias reales de la poblaci6n) variancia [(20)2/15] 53.3333. La gn'ifica la distribuci6n muestral se de [(20)2/15] ilustra en la figura 5.4.1. Conversion a
Se sabe qu la distribuci6n normal descrita en el ejemplo 5.4.1 se puede transformar en una distribuci6n normal estandar mediante la modificaci6n de na f6rmula estudiada co anterioridad. La nueva f6rmula es como sigue: (Xl
(J.ll (J
EI area bajo la curva de izquierda de Xl
I-lz)
(J
(5.4.1)
correspondiente a l probabilidad buscada es el
XI
92
area
lOS
-13. Suponiendo que no hay diferencia
=53.33
P- x,
FIG[jRAS.4.1
P-1
P-2
Gn'ifica de la distribuci6n muestral de X;
entre las medias de las poblaciones, ejemplo 5.4.1.
cuando no existe diferencia
13
-:APITULO
ALGUNAS DISTRIBUCIONES DE MUESTREO IMPORTANTES
entre las medias de las poblaciones,el valor de z que corresponde
-1
(20)2
(20)2
15
15
es:
13 =-1.78
-;=-===== - - + -
-1
~ 5 3 . 3
7.3
AI consultar la tabla D, se encuentra que el area bajo la curva normal estandar a la izquierda de -1.78 es igual a .0375. Para responder a la pregunta original, se puede decir que, si no hay diferencia entre las medias poblacionales, poblacionales, la probabilidad d e ob te ne un diferencia mayor igual que 13 entre las medias de las muestras es de .0375.
lJ1ues/reo a parlir de poblaciones normales El procedimiento anterior es valido incluso cuando el tamano de las muestras, son diferentes, y cuando las variancias, c r ~ c r ~ , tien en valores diferentes. Los resultados te6ricos sobre los que se basa este procedimien to, se resum en de la siguiente forma. Dadas dos poblaciones con una distribucion normal, con medias III 112 Y variancias ( j ~ entre las medias ( j ~ , respectivamente, la distribucilin muestral de la diferencia, Xl de muestras independientes de tamaiio n Y n extraidas de esas poblaciones siguen una distribucion normal con media III 112 Y variancia « j ~ « j ~ I
La mayorfa de las veces iJ1ueslreo a partir de poblacioHes no normales el investigador se enfrenta a uno de los siguientes problemas: 1) la necesidad de extraer muestras de un poblaci6n co distribuci6n no normal, 2) extraer mues tras de poblaciones cuya forma funcional se desconoce. Un soluci6n para estos problem as consist en tomar muestras grandes, dado que, ruando el tamano de las muestras es grande, e1 teorem a de1limite cen tral es aplicable y la distribuci6n de la diferencia entre las dos medias de las muestras sigue un distribuci6n distribuci6n aproximada ( c r ~ mente normal, con un media igua:I III 112 un variancia de ( c r ~ / Para calcular probabil idades asociadas asociadas con los los valores valores espedficos de la estadfstica, e1 procedimiento es e1 mismo qu el dado ruando el muestreo se hace a partir de poblaciones poblaciones con disttibuci6n normal. EJElUPLO 5.4.2
Suponga que se estableci6 que para cierto tipo de pacientes e1 tiempo promedio de visita domiciliaria hecha po un enfermera es de 45 minutos co un desviaci6n estandar de 15 minutos, y para un segundo tipo de paciente, el promedio de visit a domiciliaria es de 30 minutos con un desviaci6n estandar de 20 minutos. Si la enfermera visita al azar a 35 pacientes del primer tipo y 40 del segundo tipo, ~ c u a l ~ es la probabilidad de qu el tiempo promedio de visita visita domiciliaria difiera ent re los dos grupos po 20 minutos mas? Soluci6n: No
se menciona nada respecto a la forma funcional de las poblaciones, or 10 qu se supone qu est a caracteristica se desconoce que las po blaciones no presentan un distribuci6n normal. Puesto que las mues
c u a l
.4
DISTRIBUCION DE LA D I F E R E N C L
ENTRE LAS MEDIAS
13
tras son grandes (mayores que 30) en ambos casos, se hace uso de los resultados del teorema dellfmite centraL Se sabe que la diferencia entre las medias de las muestras sigue un distribuci6n distribuci6n al menos aprox imada mente normal con las siguientes media variancia: I1x,
111
-x,
cr': x,-x,
==
112 =:
c r ~
c r ~
45
30
(15)2
35
15 (20)2
40
==
16.4286
El area bajo la curva de XI qu se busca se encuentra 1a derecha de 20. EI valor valor correspondient de en la distribuci6n normal estandar es: 20
15
~ 1 6 . 4 2 8 6
4.0532
1.23
1.23 es En la tabla D se encuentra que el area a la derecha de .8907 .1093. Por 10 tanto, se puede decir que la probabilidad de que las visitas visitas al azar de la enfermera difieran entre las dos medias or 20 mas minutos es de .1093. La curva de Xl la curva normal estandar correspondiente se muestran en la figura 5.4.2
. 1093
.1093
1.23
5.4.2 Distribuci6n muestra de Xl Y a distribuci6n normal es tandar correspondiente, ejemplo de visitas domicil iarias. iarias .
FIGURA
CAPiTULO 5
14
ALGUN ALGUNAS AS DISTRIBUCIONES DE MUESTREO IMPORTANTES
FJERCICIOS 5.4.1
La referencia de los los ejercicios ejercicios 5.3.1 5.3.1 y 5.3.2 arro ja los los siguientes datos del nivel de colesterol en el suero de varones estadounidenses:
Poblaci6n
Edad
Media
Desviaci6n estandar
20-24
180
43
25-34
199
49
Suponga que se escoge un muestra aleatoria simple de tamano 50 independiente, a partir de cad ... poblaci6n. ~ C u a l es la probabilidad de que las diferencias entre las medias de las muestras (XB sea mayor que 25? 2
analisis de gastos familiares anuales para el cuidado general de la salud, se investiga un analisis
ron dos poblaciones con los siguientes resultados: Poblaci6n Poblaci6n
1:
2:
40, 35,
Xl
$346 $300
Si se sabe que la variancia de las poblaciones es de c r ~ 2800 Y c r ~ 3250, respectivamente, tan amplios como los ~ c u a I es la probabilidad de obtener resultados de muestras (XI que se muestran, si no hay diferencia entre las medias de las dos poblaciones? 5.4.3 Dadas dos dos poblaciones poblaciones con distribuci6n distribuci6n normal, con medias iguales iguales y variancias variancias crf 100 y 80, ~ c u a l es la probabilidad de que las muestras de tamano n 25 Y 16, propor c r ~ cionen un valor de Xl mayor igual que 8? 5.4.4
Dadas dos poblaciones con distribuci6n normal, con medias iguales y variancias de crf 240 Y c r ~ 350, ~ c u a I es la probabilidad de que dos muestras de taman o n 40 Y 35, un de respectivamente, respectivamente, proporcione valor XI mayor igual que 12?
5.4.5
Para ambas poblaciones de hombres y mujeres j6venes de 17 anos de edad, las medias y desviaciones estandar, respectivamente, del grosor del pliegue subescalpular son como si gue: para los varones es de 9.7 y 6.0; para las mujeres es de 15.6 y 9.5. Si se obtiene un muestra aleatoria simple de 40 varones y otra de 35 mujeres a partir de dicha poblaci6n, ~ c u a l es I, probabilidad de que la diferencia entre las medias de las muestras (xmujeres - xhombreJ sea mayor que 10
".5 DISTRIBUCION DE IA PROPORCION DE IA MUESTRA
seccioness anterio res se estudia ron las distribuciones muestrales para estadfs En las seccione ticas calculadas a partir de variables medidas. Sin embargo, frecuentemente se tie estadfsticas icas,, como la propor ci6n de muestras, ne interes en la distribuci6n muestral de estadfst que resulta de los datos de conteo frecuencias.
.5
DISTRIBUCION DE LA PROPORCrON DE LA MUESTRA
14
EJEMPLO 5.5.1
Suponga que en una poblacion de seres humanos, .08 son daltonicos. Si la proporcion de la poblacion se designa como p, se puede decir para este ejem plo que .08. Si se eligen aleatoriamente 150 individuos de es poblacion, ~ c U ( H es la probabilidad de que la proporcion en la muestra de individuos
daltonicos sea igual a .15 Solucion:
Para responder a esta pregunta es necesario conocer algunas de las propiedades de la distribucion muestral de la proporcion de la muestra. Se designara la proporcion de la muest ra con el simbolo p. se EI lector reconocera la similitud entre este ejemplo y los qu presentan en la seccion 4.3, que se refieren a la distribucion binomial. Ademas, la variable daltonismo es un variable dicotomica, porque un in dividuo se puede clasificar en una otra de dos categorias mutuamente excluyentes, daltonico no daltonico. En la seccion 4.3 se da la misma informacion y se pide calcular el numero con la caracteristica caracteristica de interes, mientras qu en el presente ej emplo se busca la la proporci on de la mues tr qu posea tal caracteristica. Mediante el uso de un tabla 10 suficien temente grande de probabilidades binomiales binomiales,, como la tabla B, es posible determinar la probabilidad asociada con el numero correspondiente a la proporcion de interes. Como se vera mas adelante, esto no sera nece sario, porque se dispone de otro procedimiento que, en general, es mas conveniente cua ndo el tamafio de la muestra es grande.
/I:
La distribucion muestral de la proporcion de la muestra se puede obtener experimentalmente de la misma forma que se sugiere para el caso de la media aritmetica y la diferencia entre do medias. A partir de la poblacion, qu se supone es frnita, se to todas las muestras posibles de un tamafio dado para cada muestra se calcula la proporcion de la muestra, p. Despues se elabora un distribucion de frecuen ci de p, ordenando los valores distintos de junto co sus frecuencias de ocurrencia. Esta distribucion de frecuencia (al igual igual que la distribucion de fre cuencias relativa correspondiente) constituye la distribucion muestral de p.
Distribucion mue.dral de
elaboracion
/I: c a r a c t e r i s t i c a s Cuando la muestra es grande, la distribucion de las proporciones de la muestra es aproximadamente normal de acuerdo co el teorema del limite central. La media de la distribucion qu es el promedio de todas las proporciones posibles de la muestra, es !-i igual a la proporcion real de la poblacion p, y la variancia de la distribucion, p. Entonces, para responder es igual a P( pq n, donde P) las preguntas acerca de la probabilidad respecto a p, se utiliza la si guiente formula:
Distribucion mue stral de
P
z=-====
~ P ( l : P )
(5.5.1 )
142
CAPiTULO 5
ALGUNAS D1STRIB UCION ES DE MUESTREO IMPORTANTES
La pregunta que surge ahora es: ~ q u e ta grande debe ser la muestra para que sea valido el uso de la aproximaci6n normal? Un criterio ampliament e utiliza utiliza p) deben ser mayores qu 5, po 10 que se seguira dicha regIa do es que np n( el presente texto. Ahora se esta posibilidad de responder a la pregunta referente al daltonis mo en la muestra de 150 individuos de un poblaci6n en la cual .08 son dalt6nicos. Puesto quenpyn (I-P) son mayores que (IS0x .08= 12 ISO x .92 138), se puede decir que, en este caso, sigue un distribuci6n aproximadamente normal co un media IJ.ji .08 ofi P ( I - p ) / n = (.08)(.92)/150 .00049. La probabili da buscada es el area bajo la curva de derecha de .IS. Esta area es igual al area bajo la curva normal estandar a la derecha de: z=-;:====-
.15-.08
.07
r====--=3.15
.0222
La transformaci6n para la distribuci6n distribuci6n norm al estandar se lleva a cabo de la mane ra usual: se calcula al divid ir el error estandar entre la diferencia de un valor de la estadfstica y su media. AI utilizar la tabla D se tiene qu el area a la derecha de 3.15 es 1 .0008. Por 10 tanto, se puede decir que la probabilidad de .15 en una muestra aleatoria de tamaiio 150 de una poblaci6n observar .08 es .0008. De hecho, si se extrajera un muestra de este tipo, much la que gente la consideraria evento extraiio. continuidad Correcci6n La aproximaci6n normal puede mejorar con la ajuste en el caso de qu un correcci6n por continuidad, un mecanismo qu hace distribuci6n distribuci6n continua se aproxime un distribuci6n discreta. Suponga que se tie np, el numero en la muestra qu e posee la caracteristica ne caracteristica de interes, cuando la porci6n es p. Para aplicar la correcci6n po continuidad se calcula:
x+.S Zc = - = = - , p a r a x
(5.5.2)
o bien .S
z,
donde
cuando
Wn pq/n
, p a r a x> np
(5.5.3)
1 - p. La correcci6n po continuidad no produce una gran diferencia 150(.15) 22.5 es grande. En el ejemplo de arriba np
22.5
.5
.08
--=1c:;=50====-_ = 3.01
100049
1 .0013. Este resultado no es muy diferente del que se obtiene sin la correcci6n po continuidad. P ( P ~ . 1 5 ) =
EJERCICIOS
14
EJEMPLO 5.5.2
Supo nga que se conoce que en una poblaci6n de mujeres, 90 po ciento de quienes comienzan su tercer trimestre de embarazo ha tenido alglin cui dado prenatal. Si se extrae de esta poblaci6n poblaci6n un muest ra aleatoria de tama no 200, 2cual 2cual es la prob a bilidad de que la proporci6n de la muestra de las mujeres que ha tenido alglin cuidado prenat al sea menor que .85? Soluci6n: Se puede suponer que
la distribuci6n muestr al de buci6n aproximadamente normal, con 11,; .90 .00045. Se calcula:
=
.85
.90
-.05 ==
presenta un distri (.1)(.9) / 200
(J;
-2.36
:V.00045 .0212 EI area a la izquierda de -2.36 bajo la curva normal estandar es .0091. Por 10 tanto, P(P .85) P(z -2.36) .0091. • EJERCICIOS 5.5.1 Un il1vestigaci6n del National Center for Heal th Statistics Statistics (Centro Nacional para la Estadfs tica de la Salud) (A-2) encontre que a 33.2 po ciento de las mujeres de 40 anos de edad mas se les practice un examen de pecho (BPE) durante el an anterior. Si se extrae un muestra aleatoria simple de 200 individuos individuos a partir de esa poblaci6n, ~ c u a l ~ es c u a la l probabili da de que la proporci6n de la muestra de mujeres a las que se les practice el examen BPE durante elanD anteri or este entre .28 y .37? .37? 5.5.2 5.5.2 A mediados mediados de la decada decada de 1970 1970.. segiln segiln informe informe de National Center for Healt h Statistic Statistic (A-3), 19.4 po ciento de la poblaci6n de adultos varones, en EVA, eran obesos. ~ C u a l es la probabilidad de que, en una muestra aleatoria simple de 150 individuos, menos de IS po ciento sean obesos? 5.5.3 Vn investigaci6n realizada en 1990 po el National Center for Health Statistics (A-4) , 19 po ciento de los encuestados mayores de 18 anos, dijo no saber del virus VIH del SIDA. ~ C u a l es la probabilidad de que en un muestra de 175 individuos de esa poblaci6n 25 po ciento mas no sepa d e la existencia del virus del SIDA 5.5.4 5.5.4
e sab sabee que que un medicamento estandar utilizado para tratar cierta enfermedad es eficaz en un lapso de tres dias en 75 po ciento de los casos. Para evaluar la eficacia de un nuevo medicamento para tratar la misma enfermedad, este se administr6 a 150 150 personas que la padedan. AI termino de tres dlas, sanaron 97 personas. Si este nuevo nuevo medicam ento es ta eficaz como el primero, ~ c u a l es la probabilidad de obtener un proporci6n de pacientes que se recuperan tan pequena como esta?
. 5. 5. 5
D ad ad a un poblaci6n en la que 100, calcule: b)
5.5.6 5.5.6
Pcp
.6
.58)
un
muestra aleatoria de esta poblaci6n de tamano c)
P(.56
.63)
e sabe sabe que 35 po ciento de los miembros de una poblaci6n sufren de un mas enferme dades cr6nicas. ~ C u a l es la probabilidad de que en un muestra aleatoria de 200 individuos 80 mas de ellos tengan al menos una enfermedad cr6nica?
14
5.6
CAPITULO 5
ALGUNA ALGUNAS S DISTRIBUCIONES DE MUESTREO IMPORTANTES
DIS'fRmUCION DE lA DIFERENCIA ENTRE
lAS PROPORCIONES DE DOS MllES'fRAS
Con frecuencia son de interes las proporcione s de dos poblaciones y se de sea averi guar la probabilidad asociada con la diferencia de las proporciones calculadas a partir de muestras extraidas de cada un de dichas poblaciones. La distribuci6n muestral pertinente es la distribuci6n de la diferencia entr e las las proporcion es de dos muestras. DistribuclOn " , u e s t r a l d e /11
/12: c a r a c t e r l s t i c a s
Las caracteristicas de
esta distribuci6n muestr al se resumen co mo sigue: sigue: Si se extraen muestras aLeatorias independientes de tamafio Y de dos poblaciones de variables dicotomicas, donde las proporciones de las observaciones con La caracteristica interes en ambas pobLaciones son PlY !espe,rtivamente, la distribuciOn de La diferen cia entre las proporciones de las muestras, PI P2> es aproximadamente normal con una media de:
con variancia
cuando
Y
son [Jrandes.
Se considera a n suficientemente suficientemente grand es cuandondl' ), son mayores que 5.
P2'
nJ(l-P
),
Dirf;tribucion nzuestral /11 /12: e l a b o r a c i o n Para elab orar fisicame te la distribuci6n muestral de la diferencia entre las las proporci ones de dos muestras, se procede en la forma descrita en la seccion 5.4 para obten er la distribucion distribucion muestral diferencia entr e dos medias. medias. de la diferencia Dadas dos poblaciones suficientemente pequenas, es posible extraer de la poblacion 1 todas las las muestra s aleatorias posibles de tamano n y calcular a partir cada co junto de datos de la muestra, la proporcion de la muestra PI' De la poblaci6n 2, puede extraerse independientemente todas las muestras aleatorias simples tamano Y calcular, para cada co junto de datos de la muestra, la proporci6n de la muestra P2 Es posible calcular las diferencias entre todos los pares posibles de proporciones muestrales, donde un miembro de cada pa tiene un valor PI> el otro un valor P2 As la distribuci6n muestral de la diferencia entr las dos proporcione de las muest ras consta d e toda s las las diferencias existentes acom panadas de sus frecuencias de ocurrencia (0 frecuencias relativas). Para poblaciones grandes finitas poblaciones infinitas, es po sible obtener un calculo aproximado de la distribuci6n muestral de la diferencia entre las proporciones de las muestras, simples independ ientes para pro tomando un gran numero de muestras aleatorias simples ceder de la forma descrita.
5.6
DISTRIBUCION DE LA DIFERENCIA ENTRE LAS PROPORCIONES
14
Para responder preguntas respecto la diferencia entre las proporcio nes de dos muestras, se utiliza la siguiente formula:
Z=-r==============
(5.6.1)
EJEMPLO 5.6.1
Suponga que la proporcion de consumidores modera dos a gran des consumidores de estupefacientes ilegales e de .50 para la poblacion 1, en tanto que en la poblaci6n 2 la proporci6n es de .33. ~ C u a l es la probabilidad de que muestras de tamaiio 100, extrafdas de cada una de las poblaciones, presente valor de PI P2 igual a .30? Solucion: Se supone qu
la distribuci6n muestral de PI
P2 es aproximadamente
normal, co un media de variancia . (}'2
p,-p,
(.33)(.67)
100 .004711
(.5)(.5)
100
probabilidad buscada es la qu se encuen EI area correspondiente .30. AI transformar en la tr bajo la curva de PI P2' a la derecha distribucion normal estandar se obtiene
(Pt -P2)-(PI-P2)
Z=-r============== !PI(l-PI) P2(I-P2) : + "-'---'--'' "-'---'-- ''
:30 -.17
=.189
~ . 0 0 4 7 1
AI consultar la tabla D, se encuentra qu el area bajo la curva normal estandar que esta la derecha de 1.89 es 1 .9706 .0294. Po 10 tanto, la probabilidad observar na diferencia igual a .3 es
.0294.
•
EJEMPLO 5.6.2
Se sabe qu en un poblacion de adolescentes 10 po ciento de los varones so obesos. Si la misma proporcion de mujeres en esa poblaci on son obesas ~ c u a l es la probabilidad de qu un muestra al azar de 250 varones 200 mujeres proporcione valor de PI P2 ;:: .06 ? la distribucion muestral de PI P2 es aproximadamente normal. Si la proporci6n de individuos obesos es la misma en ambas de la distribucion es igual a 0 la variancia es: poblaciones,
Solucion: Se supone qu
CAPITULO 5
14
ALGUNA ALGUNAS S DISTRI BUCION ESDE MTIEST MTIESTREO REO IMPORTANTES
.00081 El area de interes bajo la curva de PI P2 es la qu derecha de .06. El valor correspondiente de es: .06-0 ~ . 0 0 0 8 1
se encuentra
la
2.11
consultar la tabla D se encuentra que el area a la derecha de es 1 .9826 =.0174.
AI
2.11
EjERCICIOS 5.6.1 En una poblaci6n de ninos con retraso mental, se sabe que la proporci6n de los que so hiperactivos es de .40. Se extrajo un muestra aleatoria de tamano 120 de esa poblaci6n, y otra de tamano 100 a partir de otra pohlaci6n de ninos con el mismo problema. Si la prop or ci6n de ninos hiperactivos es la misma en ambas poblaciones, ~ c u a l es la probabilidad de qu la muestra presente comoresultado una diferencia PI P2de .160 mas? 5.6.2 5.6.2
e tienen tienen base base para suponer que 40 po ciento de las casas en cierta area de la ciudad estan en malas condiciones. Un muestra aleatoria de 75 casas de esa area y otra compuesta de 90 casas de otra secci6n dieron un diferencia'de PI P2 .09. Si no hay diferencia en la proporci6n de casas en malas condiciones entre estas dos areas, ~ c u a I es la probabilidad de observar un diferencia de esta magnitud mucho mayor?
5.6.3
resultado de un investigaci6n realizada po el National Center for Health Statistics (A-5) revela que 14 y 23.8 po ciento de los hombres y de las las mujeres, respecti vamente, co edades entre 20 y7 arros tienen un desviaci6n de 20 po ciento mas con respecto a su peso ideal. Suponga qu se extrae muestra aleatoria simple de 120 varones y muestra aleatoria simple independiente de 130 mujeres. mujeres. ~ C u a l es la probabilidad de que la diferencia entre las proporciones de las muestras PF PM este entre .04 y .20? EI
5.7 5.7
este capitulo son las distribuciones muestrales, po 10 que aqul se presenta el concepto, aSI como los los mas import antes tipos de distribuci6n muestral: EI tema principal de
1. Distribuci6n de la media de un muestra unica.
2. Distribuci6n de la diferencia entre las medias de do muestras. 3. Distribuci6n de la proporci6n de la muestra; 4. Distribuci6n de la diferenciaentre las proporciones dedos muestras. Se destaca la importancia de estos aspectos, se exhorta allector para que se asegure qu los ha comprendido antes de pasar al siguiente capitulo.
REGUNTAS Y EJERCICIOS DE REI'ASO
PHEGUNTAS 1.
. 3.
F-JERCICIOS DE REPASO ~ Q u e
es un distribucion muestral?
Expl Expliq ique ue como como se puede elaborar un distribucionmuestral a partir de un poblacion. Describa Describa la distr distribt ibtiCi iCion on muestral de la media de una muestra cuando el muestreo es co reemplazos a partir de un p ~ b l a c i o n que sigue un distribucion distribucion normal.
4. Expliqu Expliquee el teorema teorema del Hmi Hmite te centr central. al. 5.
que forma difiere la. distribucion muestraide la media <:ieuna muestra, cuando el muestreo es sin r e e m p l a z o ~ de lao distribucion distribucion muestral que se o b t i ~ n e de un muestreo con reemplazo?
.
De crib crib la distribucion muestral de la diferencia entre las medias de dos muestras.
.
Descri Describa ba la disttib disttibucio ucion n muestral d laproporcion deia muestra cuando se seleccionan muestras grandes
8. Describa Describa la dist distrib ribuc uci6r i6ri: i: muestral de la diferencia entre las medias de dos muestras cuando se seleccionan muestras grandes. grandes. .
la distribucion r o c e d se i i lsigue l i ~ n t o paraobtener Expl Expliq ique ue el p r o c e d i i l l i ~ n t o p que distribucion muestral de la diferen cia entr e las las propo'rciones de las muestras con base en muestras grandesextrafdas de pobla ciones f i n i t a s . · '.
. Supo Supong ngaa que que se sabe que el tiempo de respuesta a un estimulo en particular en individuos sanos es una variabie aleatoiii <;:dn distribucion normal,ccm un media de 15 segundos y 'una variancia de 16. (Coal' es la probabilidadde que un muestra al azar de 16 individuos p r o p o r ~ i o n e tiempo de respuesta de 12 segundos 0 J:Iills? 11. 11. Cierta empresatierie 2000 2000 emplea empleados. dos. DuranteuIl'ano ~ c i ~ n t e , el gasto'medio po emplea do debido a servicios medic()s personaJes fue de $31.50, $31.50, y la desvlaeion estandar de $6.00. ~ C u a l ~ es C u a lal probabilidad de que un muestra aleatoriasimple 3'6 empleados proporcione un media entre $30y $33? ' 2.
Supo Supong ngaa que que en cierta poblacion de adictos adictos la duraci6n me dia de abuso de drogas es de aiios la desviaci6n estandar es de 3 aiios. ~ C u a l es la probabilidad de que.una muestra aleatoria simple de 36 individuosproporcione'una media de abuso entre 4 y 6 aiios?
.
S up up on on ga ga q u elconsumomedio de protefnas de un pobiacion es de 125 gramos po dfa, mientras que para otra poblaci6n el consumo medio es de 100 g. Si los valores de consumo diario de protefnas de;ambas poblaciones poblaciones siguen un distribuci6n normal con un desvia cion estandar de 15 gramos, ~ c u a l es la probabilidad de que las muestras aleatorias e inde pendientes de tamaiio 25 a partir de cada PQblacion presenten una diferencia entre las medias de las muestras de 12 menos? . se supone para tiempode a cierto estlmulo son estudiados en un laboratorio. EI investigaclor investigaclor se inclina a creer que los tiempos de respues ta, de simes de administrar ambos medicamentos, siguen un distribu ci6n normal con variancias iguales de ,60. Como parte de la evalu,!ci6n evalu,!ci6n de los dos medica mentos, el medicamento A se aplica a 15individuos y el medicamento B se administra a otros 12. EI investigador esta interesado en saber entre que valores estaria 95 po ciento central de todas las diferencias entre-las medias de las muestras, si ambos medicamentos fueron igualmente eficaces y si el ~ x p e r i m e n t o se repitiera un gran mlmero de veces veces utilizan util izan do estos tamaiios de rn,uestras
15.
Suponga que la la concentraci6n concentraci6n de albumin albumin en el suero de cierta poblacion de individuos sigue un distrib1).f=iOn normal, con 1,lna media de 4.2 g!100 ml un desviacion estandar de .5. Un muestra at azar de nueve de esos individuos sometidos a un closis diaria de cierto
14
CAPITULOS
ALGUNAS DISTRIBUCIONES DE MUESTREO IMPORTANTES
esteroide oral produjo una concentraci6nmedia de .albumina en el suero de 3.8 g/100 m!. Co base en estos resultados, ~ e s probable queel'esteroide oral disminuya la concentracion de albumina en el suero? 16. Un encuesta llevada a cabo en un area grande de la ciudad revelil que, entre los estudiantes de preparatoria, 35 po ciento ha fumado marihuana en una otra ocasi6n. Si en un muestra aleatoria de 150 de esos estudiantes s610 40 de ellos admitieron haber fumado marihuana, ~ q u e es 10 qu se puede concluir? 17. Un investigaci6n en 1989 po el National Center for Health Statistics revel6 qu 7.1 po ciento de los pacientes dados de alta despues de un corta estanCia en hospitales de EUA tenian edadeseritre 20 24 aoos de edad, inclusive. Si se extrae un muestra aleatoria simple de tamaoo 150 de esa poblaci6n, ~ c u a l e s l a probabilidad de qu la proporci6n de pacientesentre las edades de 20 24 afios se encuentre entre .05 y .lO 18. Un trabaj adora social especiaIizada especiaIizada en problemas psiquiatricos piensa que, tanto en la co munidad A como en la B, la proporci6n de a d o l ~ s c e n t e s qu padecen algiin problema emo cional mental es de .20. En un muestra de 150 adolescentes de la comunidad A, 15 de ellos presentaron problemas emocionales mental.es En una muestra de 100 adolescentes de la comunidadB, se presentan If)casos. Si la trabajadora social estaen 10 correcto, ~ c u a l es la probabilidad de observar un diferencia ta grande como la qu se observa entre estas dos muestras? . 1'9. Un informe del NationalCenter for Health Statistics.(A-7) mostr6 que en Estados Unidos 5.7 po ciento de los varones 7 . 3 d e las mujeres co edades entre 20 y 74 afios tienen diabetes. Suponga que se toma un muestra aleatoria simple de 100 varones (V) un mues la tr independiente de 150 mujeres (M) partir Ia poblacion correspondiente. ~ C l ! a l probabilidad de qu la: diferencia entre las proporciones de las muestras con diabetes, PF PM sea mayor qu .0!5? . . '20.
tCuantas muestras aleato rias simples (sin reemplazos) de tamaoo 5 se pueden seleccionar a partir de un poblaci6n de lO?
2 1. 1.
e s b e qu 27 por cientode determinada poblaci6n de adultos nunea ha fumado. Consi dere la distribucion muestra de la proporcion de un muestra basada en muestras aleatorias simples de tamafio 110 extraidas de esa poblacion.(Cual es la forma funcional de la distri bucion muestral?
22. . Consulte.eI ejercicio 21, 3.
calcule la media
la variancia de la distribuci6n muestral.
C on on su su lt lt e el ejercicio 21. (Cilll es la probabilidad qu un muestra aleatoria simple de tamaoo 110, extraida de esta pobIacion,presente urtaproporci6n muestral menor que .18?
24. En una poblaci6n de individuos que murieron de cancer pulmonar provocadQ po exposi cion a asbesto, s encontr6 queIa media de los aoos transcurridos entre la exposici6n el fallecimiento fuede 25, la desviaci6n estandar de aocl!;;. Considere la distribuci6n muestral de las medias de las muestras co base en muestrasde tamaoo 35, Seleccionadas de esa pobla . ci6n. ~ C u a l sera la lorma de la distribuci6n muestral? 25. Consulte el ejercicio ejercicio 24. (Cual es la media
la variancia de la distribucion muestral?
26. Consulte el ejercicio ejercicio 24. 24. (CUi (CUiil il es la probabilidad de qu un muestra aleatoria simple de tamafio 35, extraida de esa poblaci6n, presenteuna media entre 22 29? 2 7. 7.
P ar ar a c ad ad a una de las siguientes poblaciones de mediciones, medici ones, establezca si la distribuci6n muestral de Ia media de la muestra sigue un disttibucion normal, aproximadamente nor mal, siquiera aproximadamente normal cuando se calrulaa partir de muestras de tama fio A) 10, B) 50 C) 200. .
BIBLIOGRAFiA
14
a) Ellogaritmo de los indices metab6licos. La poblaci6n sigue un distribuci6n normal. b) Tono vagal en reposo en adultos sanos. Lapoblaci6n sigue un distribuci6nnormal.
obesos. La poblaci6n nose distribuyenormalmente. c) La acci6n de la insulina en individuos obesos. distribuci6n muestr al 28. Para cada una de las siguientes situaciones de muestreo indique si la distribuci6n de la proporci6n de la muestra puede aproximarse a un po que sf po que no.
a) p= .50, n=:8 c)
e)
:=
b) P=.40,
.10,n
30
d)
.01,
.90, n
10
f)
.05, n
distribuci6n normal, y explique
30 1000 150
BmUOGRAFfA Bibliografia de metodologia .
J. Larsen y Morris L. Marx,An Introduction to Mathematical Statistics and Its Applicatims, segu nda ediei6n, Prentice-Hall , Englewood Cliffs, Cliffs, NJ.
2. John
Rice; Mathematical Statistics and Data Analysis, segunda edici6n, Duxbury, Belmont,
CA.
Bibliografia de aplicaciones A -I -I . N at at io io na na l Center for Health Statistics, R. Fulwood, W. Kalsbeck, R. Rifkind, etal., "Total Serum C h o l e s t ~ r o l Levels of Adults 20-74 years of Age: United States, 1976-80", Vital and Health Statistics, Serie 11, No. 236. DHHS Pub. No. (PHS) 86-1686, Public Health Service, U.S. Government Printing Office, Washington, DC. A.2. .
.
Dawson y G. B. Thomp son, "Breast "Breast Cancer Risk Risk Factors Factors an Screening: United States, D. 1987", 1987", National Center for Health Statistics, Vital and Health StatisticS, 10 (172). Nati Nation onal al Center for Health Statistics, S. Abraham, "Obese an Overweight Adults in th United States'" Vztaland Health Statistics, Serie 11, No. 230.DHHS Pub. No. 83-1680, Public Health Service, U.S. Government Printing Office, Washington, DC.
A-4.
Hardy, "AIDS Knowledge an Attitudes for October-December 1990"; Provisional data from th National Health Interview Inter view Survey. Survey. Advance data from vital an hea lth statistics; statistics; No. 204. National Center for Health Statistics, Hyattsville, MD
A ~ 5 . .
National Center for HealPl Statistics. Advance data from vital an health statistics: No. 51 60. 60. National Center for Health Statistics, Vital and Health Statistics, 16 (6).
A-6.
E.
M.
J. Graves y L. J. Kozak, "National Hospital Discharge Survey: Annual Summary, 1989". National Ce nter for Health Statist Statistics ics Vital and Health Statistics, 13(109).
. Nati Nation onal al Center for He alt h Statistics Statistics W. C. Hadden M. I. Harris, "Prevalence "Prevalence of Diagnosed Diabetes, U ndiagrios ed Diabetes, an Impai red Glucose Tolerance Tolerance in Adults 20-74 Years of Age, United States, 1976-80", Vital and Health Statistics, Serie 11, No. 237. DHHS Pub. No. (PHS) (PHS) 8.7-168 8.7-1687, 7, Public Hea lth Service, Service, U.S. U.S. Gove rnm ent Pr inti ng Office, Office, Washington, DC.