INTRODUCCIÓN
El presente trabajo de investigación tiene por objetivo hacer conocer el método o Afijación Neyman y se pretende tener un material didáctico que sirva de apoyo en el desarrollo el curso de Teoría de muestreo de la carrera de Administraci Administración. ón. En éste trabajo se encuentra el muestreo aleatorio, la afijación Neyman , su historia, así como el cálculo del tamaño de estratos, las ventajas y desventajas de hallar éste método, las formulas y ejercicios propuestos que darán mayor entendimiento al tema.
Página 1
MUESTREO ALEATORIO ESTRATIFICADO
Un muestreo aleatorio estratificado es aquel en el que se divide la población de N individuos, en k subpoblaciones o estratos, atendiendo a criterios que puedan ser importantes en el estudio (sexo, grupo de edad, nivel de estudios, lugar geográfico, tamaño del municipio, etc), de tamaños respectivos N1, ..., Nk, y realizando en cada una de estas subpoblaciones muestreos aleatorios simples de tamaño ni. AFIJACIÓN NEYMAN
En el año 1934, DersyNeyman investigo matemáticamente el problema de cal podría ser la distribución de la muestra en los estratos que diera el menor error de muestra posible. Encontró que la respuesta consistía en dejar que la tasa de muestreo en cada estrato variara con la cantidad de variabilidad de cada estrato, en otras palabras hacer la tasa de muestreo en un estrato dado proporcional a la desviación desviación estándar estándar en ese estrato. En En esa forma el número de elementos a extraer para la muestra en cada estrato dependería no solo del número total de elementos total del estrado sino también de la desviación estándar de la característica que se va a medir. Para esta afijación óptima el número de elementos que se selecciona en un estrato está dado por la fórmula:
Con una afijación óptima el error estándar de la media se reduce a:
̅ Para aplicar este tipo de afijación, es necesario conocer los valores de universo.
en en el
Página 2
MÉTODO DE NEYMAN
Para realizar un muestreo estratificado por primera vez, lo más práctico es diseñar un muestreo preliminar exploratorio que permita conocer el valor de los estimadores de la población y las varianzas de cada estrato. Este primer muestreo debe de planearse en tamaño de acuerdo a la situación real de la población (varianzas estimadas) para que no sea necesario incrementar el número de observaciones una vez que se conocen los datos. En el primer muestreo se debe calcular el valor n, que es el tamaño de la muestra necesaria para tener los límites de error preestablecidos. Si n es mayor que la muestra inicial, entonces es necesario recolectar nuevas observaciones y el método de Neyman va a ayudar para determinar de qué tamaño debe ser la muestra de cada estrato. El Método Neyman tiene la ventaja de que incorpora el factor costo, ya que uno de los objetivos del muestreo es recolectar la mayor cantidad de información, con mayor precisión y al menor costo. Levantar una encuesta vía telefónica es evidentemente más barato que levantar una encuesta en un poblado lejano donde es difícil establecer un medio de comunicación. Método de Neyman para el cálculo del tamaño de estratos.
FÓRMULA:
Siendo:
Notación.
El subíndice h indica el estrato, h=1,2,..., L
=
/N peso del estrato h-ésimo
= Varianza para cada estrato
= Estimador para el error = número de elementos en el estrato h de la población.
=número de elementos del estrato h en l a muestra.
N=
n
= Valor obtenido en la i-ésima unidad del h-ésimo estrato.
=
/
fracción de muestreo en el estrato h-ési
Página 3
MÉTODO DE NEYMAN PARA EL CÁLCULO DEL TAMAÑO DE ESTRATOS
En el método Neyman es necesario conocer para cada estrato: El tamaño total (o su estimador), la desviación estándar (que se obtiene de información previa o de la muestra exploratoria) y el costo de recolectar una encuesta en cada estrato. Notación:
=T amaño del estrato
=tamaño
de la muestra del estrato i
El subíndice i denota la unidad dentro del estrato. n= tamaño de la muestra
= Varianza muestral del estrato i
= Coste de una observación del estrato
= peso del estrato
L= número de estratos N =Tamaño
̂
de la población
= media poblacional del estrato
=total poblacional del estrato i =varianza poblacional del estrato i
= media muestral del estrato i =proporción muestral del estrato i
Página 4
VENTAJAS:
Es económico. Es rápido y controlable. Se obtiene una observación rápida y exacta con un mayor control. Sus resultados pueden ser precisos o amplios por utilizar personal especializado.
DEVENTAJAS:
Requiere de personal altamente calificado. No se permite hacer proyecciones sobre áreas muy pequeñas de la población o sobre poblaciones sujetas a muchos cambios en un lapso corto de tiempo. Los resultados están sujetos a los errores del muestreo. Se debe tener en cuenta siempre la población.
Página 5
MÉTODO DE NEYMAN PARA EL CÁLCULO DEL TAMAÑO DE ESTRATOS
En el método Neyman es necesario conocer para cada estrato: El tamaño total (o su estimador), la desviación estándar (que se obtiene de información previa o de la muestra exploratoria) y el costo de recolectar una encuesta en cada estrato. Los datos se pueden concentrar en una tabla.
El siguiente paso es calcular la ecuación que se muestra para cada estrato en una columna extra.
Ni
si
Ci
Nisi/√ci
Estrato 1
1170
8.2
3.00
5539.10
Estrato 2
980
8.0
2.80
4685.30
Estrato 3
920
8.2
3.00
4355.53
Estrato 4
1210
7.6
3.30
5062.23
∑
19642.16
Para continuar con los cálculos es necesario sumar la columna recién calculad
Para cada estrato se calcula el valor wi
Página 6
El último paso es multiplicar cada valor wi por n (tamaño de la muestra total) y se tendrá el tamaño de la muestra de cada estrato.
N
s
c
Ns/ c
wi
Estrato 1
1170
8.2
3.00
5539.10
0.282
Estrato 2
980
8.0
2.80
4685.30
0.239
Estrato 3
920
8.2
3.00
4355.53
0.222
Estrato 4
1210
7.6
3.30
5062.23
0.258
∑
19642.16
i
i
i
i
Nis /√c i i
i
i
Ni
Si
Estrato 1
1170
8.2
3.00
5539.10
0.282
18.33
Estrato 2
980
8.0
2.80
4685.30
0.239
15.50
Estrato 3
920
8.2
3.00
4355.53
0.222
14.41
Estrato 4
1210
7.6
3.30
5062.23
0.258
16.75
∑
19642.16
Ci
Wi
Si n=65
ni
Página 7
ERCICIOS PROPUESTOS En una población cuyas características son conocidas: Estrato
W
S
I
0,45
4
II
0,35
5
III
0,20
6
E1= 0,8
E2= 1,02 Z= 1,96
E3= 2 N= 200
Determinar el tamaño de la muestra, de acuerdo al Método de Asignación de Neyman. DESARROLLO: Para ello debemos tener en cuenta la siguiente fórmula:
Para el I ESTRATO:
1. Hallar
=43, 218
2. Hallar
= 200 (0,45) = 90
3. Hallar el tamaño de muestra corregido
Página 8
Para el II ESTRATO:
1. Hallar
2. Hallar
= 200 (0,35) = 70
3. Hallar el tamaño de muestra corregido
32, 31
22
Para el III ESTRATO:
1. Hallar
6, 91
2. Hallar
= 200 (0,20) = 40
3. Hallar el tamaño de muestra corregido
6
Página 9
MUESTREO ESTRATIFICADO CON ASIGNACIÓN DE NEYMAN Cuando existen marcadas diferencias en la variabilidad de las observaciones dentro de los estratos, es recomendable utilizar la asignación de Neyman, ya que además de tener en cuenta el tamaño de los estratos se tiene en cuenta la dispersión de los datos dentro de cada estrato. De esta manera se obtendrá una muestra más grande de aquellos estratos que sean más heterogéneos.
Tamaño de muestra para estimar la media con asignación de Neyman
(∑ ) ∑ Para repartir la muestra entre los estratos se utiliza la siguiente expresión:
∑
EJEMPLO: Se desea hacer un estudio sobre producción media de madera aserrada en los EE.UU. Todos los aserradores han sido agrupados en estratos, de acuerdo con la producción. Hace 5 años se hizo un estudio similar en donde se estimó la desviación estándar de la producción (en miles de pies de tabla). Por lo tanto, se dispone de la siguiente información:
Estrato
Producción anual
N° aserraderos
Desviación Estándar
1 2 3
5,000 Y + 1,000-4,999 Menos de 1,000
538 4,756 30,964
9,000 1,200 300
Determine el tamaño de muestra necesario para estimar la producción media de madera con un error máximo de 25,000 pies de tabla y una confiabilidad del 95%
Página 10
Solución:
⁄
N= 36,258
k=1.96
El error máximo es de 25,000 pies, pero se debe tener en cuenta que la producción está dada en miles, por lo tanto se divide por 1.000, es decir que
Considerando la diferencia en el tamaño de los estratos y en las desviaciones estándar se trabaja con muestreo estratificado con la asignación de Neyman. Para determinar el tamaño de la muestra se utiliza la ecuación 6.30 y para repartir la muestra en los estratos se usa la ecuación 6.31 Se debe tomar una muestra de 1,473 aserraderos, repartidos así: 360 en el estrato uno, 424 en el estrato dos y 690 en el estrato tres.
Tamaño de muestra para estimar el total con asignación de Neyman
∑ ( ) ∑
La muestra se reparte entre los estratos utilizando la expresión 6.31
Ejemplo: La fábrica de tapas, desea determinar el tamaño de muestra necesario para estimar la producción total, con un error máximo de 90,000 tapas y una confiabilidad del 95% Solución:
Página 11
Se considera que la información suministrada en el ejemplo 6.7 corresponde a una muestra piloto, de la cual se utilizan las varianzas obtenidas que son :
Teniendo en cuenta la gran diferencia presentada en las varianzas de los tres estratos y la diferencia en el tamaño de dichos estratos, el tipo de muestreo adecuado es el estratificado con asignación de Neyman. La formula para calcular el tamaño de la muestra es la 6.32 y para reapartirla en los estratos, se utiliza la ecuación 6.31
N= 400
k=1.96
[ ] [ ] [ ]
Por lo tanto, estimar la producción total con un error máximo de 90,000 tapas y una confiabilidad del 95%, se debe seleccionar una muestra de 69 máquinas, repartirlas asi: 15 manuales, 24 semiautomáticas y 30 automáticas
Tamaño de muestra para estimar la proporción con asignación de Neyman
∑ ( ) √ ∑
Para estimar la muestra entre los estratos se utiliza la expresión:
Página 12
( √ ) √
Muestreo estratificado con asignación óptima: Cuando además de tener marcadas diferencias en la dispersión o variabilidad dentro de los estratos, el costo para obtener la información de un estrato a otro varía, se recomienda utilizar la asignación óptima. Con ésta asignación se tiene en cuenta el tamaño de los estratos, la dispersión o variabilidad dentro de ellos y el costo para recopilar la información. Tamaño de muestra para obtener la media con asignación óptima
Dónde: ch = costo de hacer una observación individual en el estrato h. Una vez obtenido el tamaño de la muestra, se reparte entre los estratos utilizando la siguiente expresión
Tamaño de muestra para obtener el total con asignación óptima
Una vez obtenido el tamaño de la muestra, se reparte entre los estratos utilizando la siguiente expresión Página 13
Tamaño de muestra para estimar la proporción con asignación óptima
Dónde: ch = costo de hacer una observación individual en el estrato h. La muestra se reparte entre los distintos estratos, utilizando la expresión
TEOREMA [Asignación de Neyman] Sea E una población con N elementos, dividida en k
estratos, con Ni elementos cada uno de ellos,i=1,…,k
Sea n el número total de elementos al realizar el muestreo, y que se dividen en cada estrato como
Sea X la v.a. que representa el carácter que intentamos estudiar. Sobre cada estrato puede definirse entonces la v.a.
Página 14
Como el valor medio de X obtenida en una muestra de tamaño ni en el estrato Ei. Sea Var[Xi] la varianza de dicha v.a.; Entonces
Se minimiza cuando
Donde
ESTIMACIÓN DE PROMEDIOS Y TOTALES Estimador del promedio y del total de ingresos por familia. Las Medias aritméticas y Varianzas del Ingreso (en miles soles) por familia son: ¯ x 1= 1.041,18
¯ x 2= 2.011,54
2
2
2
¯ x 3= 3.181,67 s1 = 26.611,03s2 = 40.430,77s3 =
195.256,67n1 = 17n2 = 13 n3 = 6N=355 N1=162 N2=132 N3=61
Estrato I
Página 15
n° de orden
ingresos mensuales (miles soles)
1
1350
2
1240
3
1010
4
790
5
1130
6
850
7
890
8
1260
9
1060
10
950
11
1080
12
950
13
1080
14
860
15
1260
16
950
17
990
Σ
17700
Estrato II n° de orden
ingresos mensuales (miles soles)
1
2350
2
1830
3
2180
4
2020
5
1650
6
1920
7
2150
8
1960
9
2000
10
2260
11
1760
12
2140
13
1930
Σ
26150
Estrato III
Página 16
n° de orden 1 2 3 4 5 6 Σ
ingresos mensuales (miles soles) 3210 2960 3460 3870 2600 2990 19090
La estimación puntual: Xst=ΣWhXh=0,46(1.041,18)+0,37(2.011,54)+0,17(3.181,67) =1.764,10
El estimador de la varianza para el cálculo del de estimación:
Vxst= =1.545,76
Sxst=
√
= 39,32
Los límites del 95% para el promedio: Xstsi= Xst tSxst
Xstsi= 1.764,10
1.844,12
2,035 (39,32) 1.684,08
V= n1+n2+n3-3=17+13+6-3=33 Siendo:
=0,05, se tendrá que el valor de t=2,035
Para el total estimado:
Xstsi= NXst tNSxst 654.662,60 Xstsi= (355)1.764,10
2,035(355) (39,32) 597.848,40
Página 17
EJERCICIOS PROPUESTOS En una población cuyas características son las siguientes: Estrato
W
P
I
0,46
0.43
II
0,37
0.80
III
0,17
0.33
E1= 0.1
E2= 0.1 Z= 1,96
E3= 0.1 N= 352
Determinar el tamaño de la muestra, por medio de la estimación de una proporción. DESARROLLO: Para ello debemos tener en cuenta la siguiente fórmula:
Para el I ESTRATO:
1. Hallar
=43, 31
2. Hallar
= 352 (0,46) = 162
3. Hallar el tamaño de muestra corregido
Página 18
Para el II ESTRATO:
1. Hallar
2. Hallar
= 352(0,37) = 130
3. Hallar el tamaño de muestra corregido
22,74
19
Para el III ESTRATO:
2. Hallar
1. Hallar
= 352 (0,17) = 60
3. Hallar el tamaño de muestra corregido
14,44
12
n= 34+19+12
n=65
Página 19
CONCLUSIÓN
Proporcionar conocimientos básicos de inferencia estadística, regresión, series de tiempo y muestreo, necesarios para el desarrollo de una investigación o en el desempeño profesional.
Página 20
RECOMENDACIONES
Cuando existen marcadas diferencias en la variabilidad de las observaciones dentro de los estratos, es recomendable utilizar la asignación de Neyman, ya que además de tener en cuenta el tamaño de los estratos se tiene en cuenta la dispersión de los datos dentro de cada estrato. De ésta manera se obtendrá una muestra más grande de aquellos estratos que sean más heterogéneos.
Página 21
BIBLIOGRAFÍA Martínez Bencardino, Ciro Estadística y muestreo / Ciro Martínez Bencardino. -- 13ª. ed. -- Bogotá :Ecoe Ediciones, 2012. 900 p. – (Ciencias exactas. Matemáticas) Pag. 763
http://www.angelfire.com/sc/matasc/EyD/bioesta/muestreo.htm
Página 22