3ni4ersidad de Se4illa Este proyecto ha sido lle4ado a cabo cabo con ayuda parical de la ,omunidad ,omunidad Europea en el marco del program gramaa Socrates. El contenido del proyecto no refle5y necesariamente la p osici!on de la ,omunidad Europea6 Europea6 ni implica ninguna responsabilidad parte. responsabilidad por por su parte. $$
Poblaci!on y muestra. !ecnicas de muestreo ;amos a ampliar en este ca p!tulo lo "a respuesta es
..
Moti4os para la reali'aci!on de un muestreo. ,onsidera- ciones necesar ias
2magina
+
"a duracion media de una determinada marca de pilas. Para el primer caso6 la poblacion a la
sinceramente. Estos errores son6 en general6 dif !ciles de e4itar6 pero en el caso de la sincer i- dad6 se suelen incorporar cuestiones @preguntas filtroA para detectar si se est!a contestando sincer amente. /es pu!es de lo
.+.
!ecnicas de muestr eo
a hemos hecho referencia a la importancia de la correcta elecci!on de la muestra para Podemos decir =Gu!e proporcion de la poblacion estas entre4istando> a la hora de obtener conclusiones sobre la poblacion =a cuantos alumnos de la poblaci!on total representa cada uno de los de la muestr a> Para calcular la proporcion de alumnos
muestra: 79/+F H +6 lo
de la muestra
. Jactor de ele4acion: es el cociente entre el taman˜o de la poblacion y el taman˜o de 1 la muestra6 . Kepresenta el nu!mer o de elementos
.*.
Muestreo aleatorio con y sin reem pla'amiento
a hemos comentado "o mas sencillo ser !a hacer un sorteo para elegir +F6 es decir6 escogerlos al a'ar6 as! todos tendr !an las mismas posibilidades de estar en la muestra. Este proceso de seleccion corresponde a un muestreo aleatorio. /iremos
otal: n M
b H 1
iH-
Media:
n
b
b H P
n
.
M
H
i .n
iH-
Proporcion:
i
n M Pi
n
iH-
.
"a proporcion se r !a la media de una 4ariable
+
+S @ b A H 1
.
n
Para el muestreo sin re posici on: ; b
n+ @ b A H 1 + @ N A S . 1 n
Media: Para el muestreo con r e posicion: +
b S ; b @ A n . H
Para el muestreo sin re posici on:
S+ b @ b A H @ n N A . 1 n
;
Proporci!on: Para el muestreo con r e posicion: ; b
Para el muestreo sin re posici on:
@P b A
Pn bN G b .
H
9
n b @P b A H @ N
;
8
P bG b . A 1 n N
.).
Muestreo estratificado
2magina ahora "as 4emos a continuaci!on. ;enta 5as: Podemos tener informacion con mas precision dentro de las subpoblaciones sobre la caracter !stica ob 5eto del estudio. Podemos aumentar la precision de los estimadores de las car acter !sticas de toda la poblacion. 2ncon4enientes:
"a eleccion del taman˜o de las muestras dentro de cada estrato para
Para el caso del muestreo estratificado6 los principales estimadores 4endr !an dados por las sigu- ientes eCpr esiones: otal: b H
k M
1h h.
Media:
hH-
b H M
kM
k
1
wh h H
hH-
h
1 Ch .
hH-
Proporci !on: k M b wh P H b P h6 hHdonde h es la media muestral de la 4ariable en el estrato h. 1h es el taman˜o del estrato h. 1 es el taman˜o poblacional. nh es el taman˜o muestral en el estrato h. n es el taman˜o muestral. P bh es la proporcion muestral de la 4ariable en el estrato h. y la estimacion del error
k M + S + b b b ; @ A H 1 @ N f h A h h6 nh hH-
con Q
fh H
nh 1h
y
b S +h H
nh
nh N
nh
nh M
R + hi N Ch .
iH-
Media: k M + S b + b b ; @ A H w @ N f h A h 6 h nh hH-
donde wh 6 f h y Sh+ tienen los mismos significados
donde G bh H N P bh .
h hH-
nh N
.7.
Muestreo por conglomer ados
1os planteamos hacer un estudio de la altura de los alumnos de Secundaria de tu ciudad. En lugar de hacer un muestreo de todos los chicos de tu ciudad po dr !amos plantearnos elegir algunos barrios6 ya "a respuesta es
Pn b H M P n
i iH-
iH-
Mi
.
Media:
Pn
i . Mi iH-
b HPn
iH-
Proporci !on:
Pn
& P b H Pn iH- i 6 Mi iH-
donde bi es el total de la 4ariable en el conglomerado i. b i es la media muestral de la 4ariable en el conglomerado i. 1 es el nu!mero de conglomerados de la poblacion. M es el taman˜o poblacional. n es el nu!mero de conglomerados de la muestra. Mi es el taman˜o del conglomerado i.
&i es el total de una 4ariable &6
y la estimacion de los errores
1 @1 N nA M + ; b @ b A @i N Mi A . n nN H iHMedia: n
M b 1 @1 N nA + ; b @ A @i N Mi A . M +n n N iHH
Proporci !on: n
; b
1 @1 N nA M + @P b A H @Pi N P Mi A . + M n nN Hi
.9.
Muestreo sistem!atico
Se nos puede ocurrir otra manera de muestrear. 2maginemos
"os incon4enientes
. &umento de la 4arian'a si eCiste periodicidad en la numeracion de los elementos6 produci !endose sesgo por seleccion. +. Problemas a la hora de la estimacion de la 4arian'a. Puede considerarse un caso particular del muestreo por conglomerados6 estando cada uno de ellos formado por los siguientes elementos
nM
i .
iH-
Media: n
b M H i . iH-
Proporci !on:
n n M
P b H
Pi 6 iH-
n
donde P es una 4ariable
.8.
0tros tipos de muestreo
El muestreo bieta pico es un caso particular de muestreo por conglomerados en el
El muestreo polieta pico es una generali'aci!on del anterior6 de manera
En general6 para reali'ar estudios comple5os se utili'an los conceptos de estr atificaci!on6 conglom- erados y muestreo aleatorio. Por e5emplo6 la poblaci!on de un pa!s se podr !a di4idir en barriosA
,a p!tulo +
3n e5emplo de aplicacion de las t!ecnicas de muestr eo Demos decidido reali'ar un estudio en un ,entro de Ensen˜an'a Secundaria. Gueremos conoce r datos sobre el nu!mero de alumnos
+o *o )o o +o
ES0 ES0 ES0 ES0 #ach #ach
& ** + + +8 ** *
# + 7 7 +8 +F *)
,
* +9 +7 * *+
/
E
) * *
+*
otal
7* 97 87 8( )7 +8
"uego estamos traba5ando con una poblacion de 7)) alumnos de un 2nstituto de Ensen˜an'a Secundaria.
Partimos de una premisa6 4amos a utili'ar un taman˜o de muestra de alrededor de 9 alumnos6
n
1
H
9 H 6+6 77F
es decir6 4amos a muestrear aproCimadamente un I de la poblacion. Podemos calcular nuestr a factor de ele4acion6
7)) H (66 n 9 o lo
H
repr esentar a la altur a. E
a la paga.
repr esentar a!
a la 4ariable ?ser 'urdo? Es decir6 =podemos considerar "a respuesta a esta pregunta es Pues tam bi!en la edad es importante6 puesto Pues no6 cuando uno es 'urdo6 lo es desde
Estr ato o de ES0 @estrato A +o de ES0 @estrato +A *o de ES0 @estrato *A )o de ES0 @estrato )A o de #achillerato @estrato 7A +o de #achillerato @estrato 9A
aman˜o 1 H 7* 1+ H 97 1* H 87 1) H 8( 17 H )7 19 H +8
"o mas l!ogico en este caso es utili'ar afi 5aci!on proporcional6 es decir6 hacemos
P
1i
1
6
luego obtenemos los siguientes taman˜os muestrales: 7* n H 9 P 7)) H 76F) luego tomamos n H 96 97 n+ H 9 P 7)) H 869 luego tomamos n+ H F6 87 n* H 9 P 7)) H F6+8 luego tomamos n* H F6 8( n) H 9 P 7)) H F68 luego tomamos n) H F6 )7 n7 H 9 P 7)) H 76(( luego tomamos n7 H 96 +8 n9 H 9 P 7)) H )6 luego tomamos n9 H )6 donde los redondeos se han hecho para mantener el taman˜o muestral 9
+ * ) 7 9
97 78 9F 9) 87 (
9 9 97 8 8* 8F
7* 9F 87 88 9 ()
7 9+ 87 9* 7F F*
7 97 97 8 87 97
7* 8 9* 97 9) 8
9( 97 9 7F 89
9) 97 87 9 8*
7F 9F
8 F*
87 8*
8 F*
F8 8)
9F 88
para la paga: Estrato Estrato Estrato Estrato Estrato Estrato
+ * ) 7 9
7 + 7 +
7 F 9
*.7
F 7 + (
7 + 7 9
+ + F
* * 7 9 + (.)
+ * 7
+
* +
9 7
7
+
)
7
;amos ahora a proceder a hacer las estimaciones. "o primero
8
F7
del centro y la acompan˜ar emos de la estimaci!on del error cometido al reali'ar dicha estimacion. Dacemos el proceso independientemente para cada una de las dos 4ar iables: Para la altura tenemos: Media C H 7767 C+ H 9)69+7 C* H 9869+7 C) H 9F6+7 C7 H 9(6*+7 C9 H 8869)+F78
Estrat o
+ * ) 7 9
,uasi4arian'a + S C H *968 + S C+ H +6)8 S +C* H ++677*7 S +C) H *969(9) S +C7 H F69(7F S +C9 H 986)8F
& primera 4ista ya obser4amos un resultado curioso. "a media es creciente segu!n aumentamos de curso. Esto nos lle4a a pensar
+ * ) 7 9
Media y H +687 y+ H *6+7 y* H F6+7 y) H 969+7 y 7 H 76F87 y9 H F6FF78
,uasi4arian'a S +y H )6+9 S +y+ H +96)8 S +y* H **6*78 S +y) H +76)8 S +y7 H 6++( S +y9 H *76++(
&hora calculamos la media estimada a partir de la muestra completa y la estimacion del error en t!er minos de la estimacion de la 4arian'a para las dos 4ariables
9M
9
wh Ch H
hH-
1 h 7* 97 87 8( P 7767 O P 9)69+7 O P 9869+7 O P 9F6+7 Ch H 1 7)) 7)) 7)) 7))
hH-
)7 +8 P 9(6*+7 O P 8869)+F78 H 9F6()9*. 7)) 7)) "a eCpresi!on de la 4arian'a es O
k M + S b + b w @ f ; @ A H b N hA h . h nh hH-
Para nuestro caso Estrat o
+ * ) 7
wh 7* H 6(7 7)) 97 H 6() 7)) 87 H 6*)) 7)) 8( H 6)7 7)) )7 H 6+7(F 7))
+ wh .( .) .F
.+
.987
9 7* F 97 F 87 F 8( 9 )7
f h H 6*+ H 6+* H 699 H 6+ H 6*
N f h .FF9F .F89( .F(*) .F(FF .FF(8
9
+8 7))
H 6++89
.7F
) +8
H 6+
.FF(F
&hora sustituimos estas cantidades en la eCpresion de la estimaci!on de la 4arian'a y nos
M
b ; b @ A H 6FF9F P
+ S b + w @ N f h A h H 6( P
h
*968
O6+ P 6F(FF P
+6)8
9
nh
hH-
O 6) P 6F89( P
*969(9) F
O 6F P 6F(*) P
++677*7
F
O 6987 P 6FF(8 P
F69(7F 9
F
9)6)8F
O 67F P 6FF(F P
)
H 6 8+F.
"uego para el caso de la altura ya tenemos nuestras estimaciones. "a altura media estimada es 9F.()9* y calculamos
b
E
9
M
wh y h H
H hH-
M 1
hH-
1
O
7*
h
7))
yh H
P
+687 O
97 7))
P
*6+7 O
87 8( P F6+7 O P 969+7 7)) 7))
)7 +8 P 76F87 O P F6FF78 H F6F9**. 7)) 7))
"a estimaci!on de la 4arian'a la podemos calcular directamente ya
; b @E
k
M
AH
6FF9F P
+ S b + w @ N f h A h H 6( P
h hH-
O6+ P 6F(FF P
nh +76)8 F
)6+9
+96)8 **6*78 O 6) P 6F89( P O 6F P 6F(*) P