UNIVERSIDAD PRIVADA ANTENOR ORREGO
MUESTREO ALEATORIO ESTRATIFICADO Descripción.- En este tipo de muestreo se divide la población de N unidades de muestreo en L capas o estratos, con Nh unidades de muestreo en cada estrato h. Para utilizar el muestreo estratificado, debemos conocer los tamaños de los estratos: N1, N2, …, NL. Así: L
N h 1
h
= N En el muestreo aleatorio estratificado, método más simple de muestreo estratificado, se elige una muestra aleatoria simple de nh unidades de cada estrato, de manera independiente. Podemos representar gráficamente la población dividida en L estratos, cada uno de tamaño Nh, de los cuales seleccionamos nh unidades para conformar la muestra estratificada de tamaño n. L
n h 1
h
= n Algunas razones para utilizar el muestreo estratificado son: 1.- Cuando se requiere información más precisa de los estratos que varían entre sí en tamaño y propiedades, pero que son homogéneas dentro de sí. Los estratos deben estar constituìdos por unidades homogéneas. 2.- Si se requiere una ganancia en precisión de las estimaciones en una población heterogénea. El uso adecuado del muestreo estratificado, al dividir la población en estratos homogéneos, al muestrear en cada estrato, los errores de estimación son menores que en el caso del muestreo sin estratificar. 3.- Por conveniencias de tipo administrativo. Organismos públicos o agencias que disponen de sucursales en distintos puntos, que pueden supervisar la encuesta en su correspondiente estrato poblacional, con la consiguiente reducción de costos en organización, desplazamientos, personal, etc. 4.- Cuando se dispone de una variable precisa de estratificación, que permite dividir la población en estratos homogéneos. Notación para el muestreo estratificado. yhj : es el valor de la variable asociada a la unidad j en el estrato h Nh
y j 1
h
hj
=
: es el total de la población en el estrato h. L Nh
L
=
h 1
y
h
h 1 j 1
=
hj
: es el total de la población
Facultad de Ciencias Económicas: Administración, Contabilidad y Economía y Finanzas
Estadística Aplicada para la Toma de Decisiones Docente: MSc. SELENE C. YENGLE DEL CASTILLO
UNIVERSIDAD PRIVADA ANTENOR ORREGO
Nh
h Nh
h
i 1
hi
h
=
= L
y N
es la media del estrato h
Nh
y h 1 i 1
hi
N
μ=
es la media de la población
Nh
( y hi h) N
2
i !
2 h
h
=
Nh
L
es la varianza del estrato h
( y hi )
2
h 1 i 1
2
N
=
es la varianza de la población
Las cantidades de la muestra, a ser utilizadas para estimar los parámetros, son: nh
y
h
y n i 1
h
=
hi
h
=
la media de la muestra del estrato h
nh
S h2
( y hi y h) n 1
2
i 1
h
la varianza de la muestra del estrato h
Veamos en seguida la estimación de los parámetros más utilizados. ESTIMACIÓN DE LA MEDIA POBLACIONAL Estimación Puntual: Un estimador insesgado de μ, la media de la población, es:
st
1 N
L
N y h 1
h
h
= La varianza estimada de este estimador es: Varianza estimada
Facultad de Ciencias Económicas: Administración, Contabilidad y Economía y Finanzas
Estadística Aplicada para la Toma de Decisiones Docente: MSc. SELENE C. YENGLE DEL CASTILLO
UNIVERSIDAD PRIVADA ANTENOR ORREGO
V
2
N S N n n N N 1
)
L
2
st
2
h
h
h
h
h 1
h
h
( = Su error estándar estimado
V ( st )
st
La estimación de μ con intervalo de confianza
z st
2
st
z
2
st
st
≤ μ ≤ + ESTIMACIÓN DEL TOTAL DE LA POBLACIÓN Estimación puntual Un estimador insesgado de st st =N
es:
La varianza estimada del estimador: 2 L 2 S h N h nh
V st ) ( =
N h 1
h
n
N
h
h
El error estándar estimado:
( st ) V ( st ) La estimación con intervalo:
z
2
st
( st )
-
≤
≤
z
2
st
( st )
+
ESTIMACIÓN DE LA PROPORCIÓN POBLACIONAL Estimación Puntual: Un estimador insesgado de la proporción poblacional:
p
1 N
st
=
L
N h 1
h
ph
Facultad de Ciencias Económicas: Administración, Contabilidad y Economía y Finanzas
Estadística Aplicada para la Toma de Decisiones Docente: MSc. SELENE C. YENGLE DEL CASTILLO
UNIVERSIDAD PRIVADA ANTENOR ORREGO
ph Donde
es la proporción de unidades en la muestra que tienen la característica de interés.
p
st
Varianza estimada de
V p (
) st
1
N
L
2
N h 1
2 h
st
2
st
h
h
h
h
El error estándar estimado ( ) p V ( p st st ) = La estimación con intervalo ( )
p z p
p q N n n 1 N
h
h
p
(
z p 2
st
) st
≤ p≤ + ESTIMACIÓN DEL NÚMERO DE UNIDADES QUE TIENEN LA CARACTERÍSTICA DE INTERÉS Estimación puntual Se realiza con el estimador:
A st N p st Estimación con intervalo de confianza
A st N
(
z p 2
)
st
≤ A ≤
A st N
(
z p 2
) st
EJEMPLO: Los salarios mensuales de los 600 trabajadores de la Empresa ABC, se clasifican, en bajos, medianos y altos. De los 80 trabajadores de altos ingresos se toma una muestra aleatoria de 20 trabajadores, de los 150 trabajadores de ingresos medianos una muestra de 32, y de los 370 trabajadores de bajos ingresos una muestra de 38 trabajadores, Los ingresos en miles de soles de los trabajadores de la muestra son: De ingresos altos 4.5 4.8 5.2 4.2 5.0 4.2 4.0 4.4
De ingresos Medianos 2.2 2.8 2.0 3.6 2.5 2.4 3.2 3.4
De ingresos bajos 0.8 0.72 0.8 0.66 1.2 0.90 0.72 0.84
Facultad de Ciencias Económicas: Administración, Contabilidad y Economía y Finanzas
Estadística Aplicada para la Toma de Decisiones Docente: MSc. SELENE C. YENGLE DEL CASTILLO
UNIVERSIDAD PRIVADA ANTENOR ORREGO
6.5 4.8 5.4
4.8 4.4 5.5
4.5 6.2 6.2
5.6 6.4 4.9
0.75 0.65 0.76 0.92 0.68 0.90 1.28 0.88 0.78 0.84 1.20 1.54 0.75 0.84 0.96 1.65 1.22 1.20 0.85 0.98 0.75 0.88 0.92 0.84 1.34 1.07 1.50 1.20 0.84 0.72 a) Considerando cada grupo como un estrato, estime puntualmente y mediante un intervalo de confianza del 95% el salario promedio de los trabajadores de la empresa. b) Estime puntualmente y por intervalos de confianza del 92% el total poblacional de los salarios de los trabajadores de la empresa.
Se tiene:
3.4 2.3 2.1 2.3 2.2 3.2
N1= 80
2.7 2.4 2.8 2.4 2.6 3.4
Y1
n1= 20
N2 = 150 n2 = 32
Y2 Y
N3 = 370 n3 = 38 N = 600 n = 90
2.5 2.3 2.6 3.1 2.7 3.0
= 5.075
3.1 2.5 2.6 3.2 3.5 2.8
S1= 0.7752
= 2.744 S2 = 0.4508 = 0.956 S3 = 0.2579
a) La estimación puntual del promedio: 1 L ( N h Yh ) N h 1
=
1 (80 x5.075 150 x 2.744 370 x0.956) 600 1 (1171.32) 600
= = 1.9522 La estimación por intervalo de confianza del 95%. La varianza estimada:
V
)
(
V ( )
=
L
2
st
=
2
N S N n n N N 1
h 1
2
h
h
h
h
h
h
1 0.600935 80 20 0.203221 150 32 (80 2 x x 150 2 x x 370 2 x 360000 20 80 32 150 0.066512 370 38 x ) 38 370
Facultad de Ciencias Económicas: Administración, Contabilidad y Economía y Finanzas
Estadística Aplicada para la Toma de Decisiones Docente: MSc. SELENE C. YENGLE DEL CASTILLO
UNIVERSIDAD PRIVADA ANTENOR ORREGO
V ( )
=
1 (144.2244 112.40666 215.00685) 360000
V ( )
= 0.0013101 El error estándar estimado:
V ( ) 0.0013101 = 0.0362 El intervalo de confianza es: 1.9522 – 1.96 (0.0362) ≤ μ ≤ 1.9522 + 1.96 (0.0362) 1.8812 ≤ μ ≤ 2.0232 El salario promedio de los trabajadores de la empresa ABC se encuentra entre 1881 y 2023 con una confianza del 95%.
PRACTICA DIRIGIDA N° 03 1.- Con los datos del ejemplo anterior, estime puntualmente y mediante un intervalo de confianza del 95% el salario promedio de los trabajadores que tienen salarios altos. 2.- En el ejemplo, estime puntualmente y mediante un intervalo de confianza del 95% el gasto total en salarios de la empresa ABC. 3.- Un Balneario está habitado por 320 familias. Estamos interesados en estimar el ingreso mensual promedio por familia y la proporción de familias que son dueñas de la vivienda que habitan. Se estratifica la población según los ingresos, en familias de ingresos bajos con 140 familias, de ingresos medianos con 110 y familias de ingresos altos integrado por 70 familias.
Facultad de Ciencias Económicas: Administración, Contabilidad y Economía y Finanzas
Estadística Aplicada para la Toma de Decisiones Docente: MSc. SELENE C. YENGLE DEL CASTILLO
UNIVERSIDAD PRIVADA ANTENOR ORREGO
De cada uno de estos estratos se extraen muestras aleatorias de tamaños 17, 14 y 9, respectivamente y, además, se cuenta en cada muestra cuántas familias son dueñas de la vivienda que habitan. Con los resultados siguientes: Ingresos de las familias del Primer Estrato: 92 78 79 126 106 162 83 114 104 108 163 96 145 80 79 79 83
Ingresos de las familias del Segundo Estrato 186 170 165 193 179 235 206 200 179 206 225 179 182 210
Ingresos de las familias del Tercer Estrato 384 282 306 342 313 260 386 262 395 En la muestra del primer estrato 9 familias tienen vivienda propia, en la segunda muestra 5 y en la tercera, 3 familias tienen vivienda propia. Se pide estimar puntualmente y mediante un intervalo de confianza del 95%: a) El ingreso mensual promedio por familia del primer estrato. b) El ingreso mensual promedio por familia del Balneario. c) La proporción de familias en el primer estrato que tienen vivienda propia. d) El número de familias en el Balneario que tienen vivienda propia. 4.- Se tomó una muestra aleatoria simple estratificada y se obtuvieron los siguientes resultados:
Y
h
Estrato (h) Nh nh Sh ph 1 200 20 138 30 0.50 2 250 30 103 25 0.78 3 100 25 210 50 0.21 a. Cuál es el tamaño del estrato 2? ¿Cuál es el tamaño de la población? b. Estime la media poblacional del estrato 2 puntualmente y mediante un intervalo de confianza del 95%. c. Estime puntualmente y mediante un intervalo de confianza del 95% la media de la población (media global) d. Estime puntualmente y mediante un intervalo de confianza del 95% el total poblacional del estrato 2. e. Estime puntualmente y mediante un intervalo de confianza del 95% el total de la población. f. Estime puntualmente y mediante un intervalo de confianza del 95% la proporción poblacional del estrato 2. Estime puntualmente y mediante intervalo de confianza la proporción poblacional 5.- Alguien ha realizado una pequeña encuesta, al emplear una muestra aleatoria simple, del uso de energía en las casas. Con base en la encuesta, cada casa está clasificada con Facultad de Ciencias Económicas: Administración, Contabilidad y Economía y Finanzas
Estadística Aplicada para la Toma de Decisiones Docente: MSc. SELENE C. YENGLE DEL CASTILLO
UNIVERSIDAD PRIVADA ANTENOR ORREGO
calefacción eléctrica o con algún otro tipo de calefacción. Se registra el consumo de energía, en enero, en kilovatios-hora para cada casa ( yi ) y los resultados aparecen a continuación: Tipo de calefacción Eléctrica No eléctrica
Número de casas 24 36
Media muestral 972 463
Varianza muestral . 202,396 96,721 .
Por los registros, se sabe que 16,450 de las 35,000 casas tienen calefacción eléctrica y 18,550 poseen calefacción no eléctrica. a) Use la muestra y dé una estimación y el error estándar de la proporción de casas con calefacción eléctrica. ¿Incluye el intervalo de confianza del 95% que acaba de construir, a la verdadera proporción? b) Dé una estimación y el error estándar del número promedio de kilovatios-hora utilizados por las casas de la ciudad. ¿Qué tipo de estimador empleó? ¿Por qué eligió dichos estimador?
Facultad de Ciencias Económicas: Administración, Contabilidad y Economía y Finanzas
Estadística Aplicada para la Toma de Decisiones Docente: MSc. SELENE C. YENGLE DEL CASTILLO