Muestreo Bietápico de Conglomerados Ejercicios Resueltos Anny Guilarte
Los siguientes ejercicios ejemplifican el muestreo bietápico por conglomerados, tomados de Scheaffer, R.; Mendenhall, W. Y Ott, L. (1986) Elementos de Muestreo . Grupo Editorial Iberoamérica, S.A. De C.V. “
”
9.4.
Una cadena de supermercados tiene tiendas en 32 ciudades. Un director de la compañía quiere estimar la proporción de tiendas en la cadena que no satisfacen un criterio de limpieza específico. Las tiendas dentro de cada ciudad al parecer poseen características similares; por lo tanto el director decide seleccionar una muestra por conglomerados en dos etapas conteniendo la mitad de las tiendas dentro de cada una de las 4 ciudades. El muestreo por conglomerados es conveniente en esta situación debido al costo de traslado. Los datos recolectados se presentan en la tabla adjunta. Estime la proporción de tiendas que no satisfacen el criterio de limpieza y establezca un límite para el error de estimación. Ejercicio 9.4
Aquí no se conoce M No. Tiendas que no No. Tiendas No. Tiendas
satisfacen
en la ciudad muestreada
el criterio
Ciudad
Mi2
Mi
s mi
de limpieza
pi
(Mipi)2
Mipi
1
25
13
3
0,2308
5,7692
33,2840
2
10
5
1
0,2000
2,0000
4,0000
3
18
9
4
0,4444
8,0000
64,0000
4
16
8
2
0,2500
4,0000
16,0000
69
35
19,7692
117,2840
Mi2pi Mi2((Mi-mi)/Mi)*piqi/(mi-1) p
625,0000
144,2308
4,4379
0,286511
100,0000
20,0000
2,0000
N= 32
324,0000
144,0000
5,0000
n= 4
256,0000
64,0000
3,4286
1305,0000
372,2308
14,8664
ˆ
m
17,25 t= 2
M m p q 1 N n 1 V p M i i i i i 0,00311356 Sr N n M nN M M i mi 1 ˆ
2
ˆ
2
2
ˆ
ˆ
B= 0,11159858
2
ˆ
p ˆ
Sr^2 3,70438809
Liminf
0,17491201 0,39810917
0,05579929
limsup
Por tanto, la proporción de tiendas que no satisfacen el criterio de limpieza es de 0,286511. Además, con un 75% de confianza se afirma que el verdadero valor de la proporción de tiendas se encuentra entre 0.17491201 y 0.39810917. 9.5.
Repita el ejercicio 9.4 dado que la cadena contiene 450 tiendas.
p ˆ
M Sb^2
M=
0,35145299
V p
14,0625
ˆ
ˆ
6,52613412
450
0,00780635 t= 2
B= 0,17670709 N= 32
Liminf
limsup
n= 4
0,109804
0,46321768
Por tanto, la proporción de tiendas que no satisfacen el criterio de limpieza es de 0,35145299. Además, con un 75% de confianza se afirma que el verdadero valor de la proporción de tiendas se encuentra entre 0.109804 y 0.46321768.
Un guardabosque quiere estimar el número total de árboles en un condado infestados por una enfermedad particular. En el condado hay 10 áreas bien definidas; estas pueden ser subdivididas en lotes de aproximadamente el mismo tamaño. Se dispone de 4 cuadrillas para realizar la encuesta, la cual debe ser completada en un día. Por lo tanto se utiliza un muestreo por conglomerado en 2 etapas. 4 áreas (conglomerados) son seleccionadas con 6 lotes (elementos) escogidos aleatoriamente de cada una. (Cada cuadrilla puede inspeccionar un área por día.) Los datos se presentan en la tabla adjunta. Estime el número total de árboles infestados en el condado y establezca un límite para el error de estimación. 9.8.
Área
Numero Numero de de lotes lotes (MI) muestreados mi
Numero de arboles infestados por lote
1 2
12 15
6 6
15 4
14 6
21 10
13 9
9 8
10 5
3 4
14 21
6 6
10 8
11 3
14 4
10 1
9 2
15 5
Total=
62
24
N=
10
Mmedia
15,5
n=
4
Ur
8,2339
Sb^2 varianza ˆ
p ˆ
B=
28354,9919 168,3894
336,7788
limite inferio Limite Superior 939,4712
1723,2292
1613,0288
π(est)
1276,2500
Por tanto, el número total de árboles infestados en el condado es de aproximadamente 1277. Además, con un 75% de confianza se afirma que el verdadero valor del número total de árboles infestados en el condado se encuentra entre 939,4712 y 1613,0288.
9.9.
Una compañía está probando una nueva embotelladora. Durante un ensayo la máquina llena 24 cajas, cada una con 12 botellas. La compañía desea estimar el número promedio de onzas de contenido por botella. Se emplea un muestreo por conglomerados en dos etapas usando 6 cajas (conglomerados) con 4 botellas (elementos) seleccionados aleatoriamente de cada caja. Los resultados se presentan en la tabla adjunta. Estime el número de onzas promedio por botella y establezca un límite para el error de estimación. Ejerci ci o 9.11 Caja
Aquí no se conoce Mi
mi
M
Yimed
Si^2
(MiYimed) 2
MiYimed
1
12
4
7,9
0,15
94,8000
8987,0400
2
12
4
8
0,12
96,0000
9216,0000
3
12
4
7,8
0,09
93,6000
8760,9600
4
12
4
7,9
0,11
94,8000
8987,0400
5
12
4
8,1
0,1
97,2000
9447,8400
6
12
4
7,9
0,12
94,8000
8987,0400
72
24
571,2000
54385,9200
M(est)
12 Umed 7,93333333 N= 24 n= 6
Mi2
Yimed*Mi 2 (Mi2((Mi-mi)/Mi)*Si^2)/(mi)
varianza
0,00187731
2,1600
Sb^2
1,536
1137,6000
2,6400
σ=
144,0000
1166,4000
2,4000
144,0000
1137,6000
2,8800
864,0000
6854,4000
11,2800
144,0000
1137,6000
3,6000
144,0000
1152,0000
2,8800
144,0000
1123,2000
144,0000
0,04332799
t= 2 B= 0,08665598 Liminf
limsup
7,84667735
8,01998932
Por tanto, la el número de onzas promedio por botella es de 7,93333. Además, con un 75% de confianza se afirma que el número de onzas promedio por botella se encuentra entre 7,84667735 y 8,01998932.
Cierta planta industrial tiene 40 máquinas y todas producen el mismo artículo (por ejemplo, cajas de cereal). Se desea estimar la proporción de productos defectuosos (por ejemplo, cajas con menor contenido) un día especifico. Analice los méritos relativos del muestreo por conglomerados en dos etapas (las máquinas como conglomerados de cajas) y el muestreo aleatorio estratificado (las máquinas como estratos) como diseños posibles para este estudio. 9.10.
Para aplicar muestreo por conglomerado bietápico existen dos supuestos importantes. Uno es que haya gran variabilidad entre los tamaños de los conglomerados y el otro es que el tamaño poblacional sea demasiado grande. En el ejemplo planteado, si el nivel de producción de cada máquina varía y si la producción de estas es muy grande, lo que hace que el tamaño poblacional sea muy grande, es adecuado aplicar un muestreo por conglomerados. Sin embargo, es preferible utilizar el muestreo por conglomerados en dos etapas cuando la proporción de artículos defectuosos varía en el tiempo para cada máquina y todas estas se comportan de forma similar entre sí. Por otra parte, en el ejemplo planteado sería conveniente aplicar muestreo estratificado si la producción de las distintas máquinas es diferente y se agruparían como estratos; recordemos que el muestreo estratificado se utiliza cuando la población se puede dividir en diferentes grupos. Y si la proporción de artículos defectuosos para cada máquina es aproximadamente constante en el tiempo y las proporciones varían significativamente entre las máquinas, lo mejor es aplicar el de muestreo aleatorio estratificado.
Una empresa de investigación de mercados ideó un plan de muestreo para estimar las ventas semanales de un cereal de la marca A en un área geográfica. La empresa decidió muestrear ciudades dentro del área y luego supermercados dentro de ciudades. La medición de interés es el número de cajas vendidas del cereal de la marca A en una semana específica. 5 ciudades son muestreadas de entre las 20 en el área. Usando los datos presentados en la tabla adjunta, estime las ventas promedio de todos los supermercados en el área para la semana específica. Establezca un límite para el error de estimación. 9.11.
Ejercicio 9.11
Mi
mi Nº de
Ciudad
Nº de
supermercados
Supermercados
mue streados
me di a
vari anza
Mi *yi
1
45
9
102
20
4590
2
36
7
90
16
3240
3
20
4
76
22
1520
4
18
4
94
26
1692
5
28
6
120
12
3360
147
30
482,000
96,000
14402,000
n
M
ˆ
r
i
y i
M
97,97278912
M
29,4000
i
(Miyi)2 Mi2((Mi-mi)/ Mi^2yi
Mi2
21068100
80
206550
2025
10497600
66,2857143
116640
1296
2310400
88
30400
400
2862864
91
30456
324
11289600
44
94080
784
48028564,000
369,286
478126,000
4829,000
varianza
30,10689
5,48697
σ=
t= 2 n
n
M i yi r
2
2
M i yi 2
ˆ
2
Sr
i 1
n 1
i 1
2
n
2
2 r M i yi r 2
i 1
n
M i
B= 10,97395
2
i 1
173463, 3429
n 1
Liminf
lims up
86,99884
108,94674
Por tanto, las ventas promedio en todos los supermercados son de 97,97278912. Además, con un 75% de confianza se afirma que las ventas promedio de todos los supermercados en el área para la semana específica se encuentran entre 86,99884 y 108,94674.
9.12.
En el ejercicio 9.11 ¿Se tiene suficiente información para estimar el número total de cajas de cereal vendida en todos los supermercados del área durante la semana? Si es así, explique cómo estimaría usted este total y establezca un límite para el error de estimación. Si, los cálculos apropiados están en la siguiente tabla
Ejercicio 9.12
Aquí no se conoce
M
N de secretarias Departame
N de
muestreada
nto
Secretarias Mi
s mi
Yimed
Si^2
(MiYimed) 2
MiYimed
1
45
9
102
20
4590,0000
21068100,0000
2
36
7
90
16
3240,0000
10497600,0000
3
20
4
76
22
1520,0000
2310400,0000
4
18
4
94
26
1692,0000
2862864,0000
5
28
6
120
12
3360,0000
11289600,0000
147
30
14402,0000
48028564,0000
EstTotal
57608,000000
Umed
97,97278912 N= 20
Varianza 10445338 σ=
3231,9248
n= 5
Mi2
Yimed*Mi 2 (Mi2((Mi-mi)/Mi)*Si^2)/(mi)
2025,0000
206550,0000
3600,0000
1296,0000
116640,0000
2386,2857
400,0000
30400,0000
1760,0000
324,0000
30456,0000
1638,0000
Liminf
limsup
784,0000
94080,0000
1232,0000
51144,15046
64071,8495
4829,0000
478126,0000
9384,2857
t= 2 B= 6463,84954
EstTotal
57608,000000
Por tanto, el número total de cajas de cereal vendidas en todos los supermercados del área durante la semana específica es de 57.608. Además, con un 75% de confianza se afirma que el número total de cajas de cereal vendidas en todos los supermercados del área durante la semana específica se encuentra entre 51144,1505 y 6471,8495.