9.
DISTRIBUCIONES MUESTRALES Distribución de Medias Muestrales. Simbología que será utilizada:
Medidas Media Aritmética Varianza Desviación típica Tamaño µ x σ x
Población µ
Muestra x
σ 2 σ
S
2
Ν
η
S
= Media de todas las Medias Muestrales = Desviación típica de todas las medias Muestrales.
M = Número de muestras posibles. M
N = = n
M = N
n
N !
( N − n) ! n!
Cuando la selección se se hace sin sin reposición:
Cuando se hace la selección con reposición.
Si cons consid ider eram amos os una una pobla poblaci ción ón de N elem elemen ento tos, s, con con medi media a µ y desviación típica σ , si se obtienen M número número de Muestras posibles, de tamaño n, simbolizamos a cada media Muestral por, X 1 , X 2 ; ... X M . Y cada desviación típica Muestral por, S 1 , S 2 ,...S M
TEOREMA: Dada Dada una una pobl poblac ació ión, n, si extr extrae aemo moss toda todass las las mues muestr tras as posibles de un mismo tamaño, entonces la media de la distribución de todas las medias Muestrales posibles. Será igual a la media poblacional. Simbolizaremos la media de todas las medias Muestrales por µ x , la cual será igual a la media Poblacional. µ x
=
∑ X
µ = µ x
i
M
=
X 1
+ X 2 + .... + X M M
= µ
La varianza de todas las medias muestrales se simboliza por
σ x2
y
el error estándar por igual σ x .
∑ ( X
=
σ x
i
− µ ) 2
M
Siendo
σ x
=
σ n
σ
=
n
(para muestras grandes o sea n > 30 y se denomina
error estándar de la media). La media de todas las medias muestrales debe ser exactamente igua iguall a la medi media a pobl poblac acio iona nall ( µ ) debi debido do a que que la dist distri ribu buci ción ón de muestreo resulta de todas las muestras posibles que se pueden extraer de una población; por tal razón incluye a todos sus elementos. Expl Expliq ique uem mos lo ante anteri rior or medi media ante nte
un peque equeñ ño Eje Ejemplo mplo::
Supongamos una población de 5 elementos y los valores que toma la variable, arbitrarios, ya sean kilómetros, metros, valores, etc. N = 5; siendo: X1= 7 X2=3 X3=5 X4=8 X5=2 con los anteriores valores se puede calcular la media, la varianza y desviación típica poblacional. µ =
∑ X = 25 = 5 i
5
N
∑ X − N X σ = 2 i
2
5
σ
=
5,2
2
=
151 − 5(25) 5
= 5,2
= 2,28
Ahora determinaremos el número de muestras posibles (M) de esta población, población, si el tamaño de la muestra que fijamos arbitrariamente arbitrariamente es 2 y la selección se hace sin repetición.
N 5! M = = 2! 3! = 10 n
Las combinaciones que se pueden obtener: X1 X2
X2 X3
X3 X4
X1 X3
X2 X4
X3 X5
X1 X4
X2 X5
X4 X5
X1 X5 Calculemos la media aritmética para cada una de las posibles muestras. 5
4
6,5
6
5,5
3,5
7,5
2,5
5
4,5 La media de todas las medias muestrales será igual a:
µ x =
∑ X = 5 + 4 + .... + 4,5 = 5 i
10
M
Se podrá observar que se cumple el teorema de que la media de todas las medias muestrales es igual a la media poblacional. µ x
= µ = 5 En cuanto a la desviación típica de todas las medias muestrales,
encontramos que:
σ x =
σ x
=
∑ ( X − µ )
2
i
M
(5 − 5) 2
+ (4 − 5 ) 2 + ... + (4,5 − 5) 2 10
Pero sabemos que σ x =
σ n
•
N − n N −1
=
1,95
= 1,39
Luego:
σ X =
2,28 2
.
En el caso
5−2 5 −1
= 1,39
de una selección con repetición se tendrán los
siguientes casos posibles: M = N2 = 52 = 25 X1 X1 X1 X2 X1 X3 X1 X4 X1 X5 X1
X1 X2 X3 X4 X5 µ x
σ x
= =
7 + ... + 2 25 (7 − 5) 2
X2 X1 X2 X2 X2 X3 X2 X4 X2 X5 X2
X3 X1 X3 X2 X3 X3 X3 X4 X3 X5 X3
X4 X1 X4 X2 X4 X3 X4 X4 X4 X5 X4
X5 X1 X5 X2 X5 X3 X5 X4 X5 X5 X5
=5 + ... + (2 − 5) 2 25
= 1,39
Los resultados serán los mismos, es decir µ = 5, σ x = 1,39 . Es de anotar que, cuando se hace la selección sin reposición, la población se hace suficiente, ya que en cada extracción o selección, el elemento o unidad puede ser nuevamente seleccionado, y así sucesivamente.
TEOREMA CENTRAL DEL LÍMITE: A medida que n aumenta, la distribución muestral de medias muestrales se aproxima a una distribución normal con
x
=
µ
y
σ x
=
σ n
.
De acuerdo al teorema, la variante estadística para distribución de medias muestrales será: Z =
x − µ x − µ = σ σ x n
Variable tipificada de la distribución muestral.
Ejemplo 1: Supongo que de una población Normal se elige una muestra aleatoria de tamaño 9 con media µ = 25 y desviación típica σ = 6 ¿Cuál es la probabilidad de que la media muestral x sea mayor que 28?
Solución: µ
= 25
σ
=6
Véase la tabla de Z
n=9 0,4332
P ( x > 28) = ? Z =
x − µ
25 0
σ x
28 − 25 Z = 6 9
28 1,5
ff
=1,5
P (Z > 1,5) = 0,5000 – 0,4332 P (Z > 1,5)=0,0668
En consecuencia, la probabilidad de que una muestra aleatoria de tamaño 9 tenga una media mayor que 28 es P ( x > 28)= 0,00668.
DISTRIBUCIÓN DE MEDIAS MUESTRALES 1.
La altura media de 400 alumnos de un plantel de secundaria es de 1,50 mts. y su desviación típica es de 0,25 mts. Determinar la probabilidad de que una muestra de 36 alumnos, la media sea superior a 1,60 mts.
Solución: P ( X > 1,60) Z =
Z =
=?
1,60 − 1,50 0,25
=
0,10 0,25
=
0,60 0,25
X − µ
σ
n
= 2,40
6
36
0,5000 P (Z > 1,2) = 0.5-0.4918 = 0.0082
0,4918 0,0082
2.
Si en el 1,5 ejemplo (1) 1,6 se considera que dicho plantel de secundaria Z 0 tiene un total de N =1,2 400 alumnos, ¿Cuál es la probabilidad, en una muestra de 36 alumnos, de que la media sea superior a 1,60 mts.?
Solución Z =
X − µ N − n
σ n
N − 1
=
1,60 0,25 36
− 1,50 = 400 − 36 400 − 1
2,51
X
P ( Z > 2,51)
→ A (0,4940) P ( Z > 2,51) = 0,5000 − 0,4940 = 0,006 P ( Z > 2,51) = 0,5000 − 0,4940 = 0,006 0,5000
0,0060 0,4940
1,50
1,60
0
2,51
Z
X
3.
Las estaturas de cierto grupo de adultos tienen una media de 167,42 y una desviación estándar de 2,58 centímetros. Si las estaturas están normalmente distribuidas y se eligen aleatoriamente 25 personas del grupo, ¿Cuál es la probabilidad de que su media sea de 168,00 centímetros o más?
Solución: P ( x
µ = 167,42
Z =
x − µ σ n
Z = 1,12
Z =
168
−
167,42
2,58 /
25
> 168)
=
→ A (0,3686)
0,58 (5) 2,58
σ
=
2,90 2,58
P ( Z >1,12)
= 2,58
n = 25
= 1,12
= 0,5000 − 0,3686 = 0,1314
0,5000 0,3686
0,1314
1,68
167,42
0
4.
Z
1,12
Las estaturas de los estudiantes de una universidad se distribuyen normalmente con media de 170 centímetros y desviación típica de 10 centímetros. Si se toma una muestra de 81 estudiantes, ¿Cuál es la
X
probabilidad de que tengan una estatura superior a 175 centímetros? Solución: µ = 170
Z =
175
− 170
10
81
0,5000
σ
= 10
=
5 (9) 10
P ( X
=
45 10
> 175) =
?
n = 81
Z =
x − µ σ n
= 04,5
→ A (0,5000) P (175 Z = 4,5170 X > 175) Z= 0 0 4,5
X
5.
En un universidad el promedio de calificación, en exámenes de admisión, ha sido de 3,5 con una desviación típica de 1. ¿Cuál es la probabilidad, si el examen lo presentan 36 estudiantes, de que obtengan un promedio mayor de 3,7?
Solución: µ = 3,5
Z =
σ = 1
X − µ σ
Z C =
n
Z = 1,20
3,7 − 3,5 1 36
;
0,3849
0,1151
3,7
P ( X > 3.7 )
=?
= 1,20
→ A (0,3849)
3,5 0
n = 36
P ( z > 1,20 )
= 0,5000 − 0,3849 = 0,1151
Z
1,2 p ( z > 1,20) = 0,1151
DISTRIBUCIÓN MUESTRAL DE UNA PROPORCIÓN
X
1.
Se tiene que el 4% de las piezas producidas por cierta máquina son defectuosas. ¿cuál es la probabilidad de que en un grupo de 200 piezas, el 3% o más sean defectuosas?
Solución:
= P = 0,04
µ p
p
=
Z =
0,03
p − P P (1 − P ) n
µ p
= P
σ p =
P(1 − P ) n
=
(0, 04) (0,96)
= 0,014
200
Se desea determinar la P ( p ≥ 0,03) = ?
Z =
p − µ p P(1 − P )
=
0, 03
− 0, 04
(0, 04) (0,96
= − 0,71
200
n
0,26122 0,5000
P
Z
= − 0, 71 →
0,03
0,04
-0,71
0
A (0, 2612)
P ( Z >
− 0,71) = 0,7612
b.
Con corrección
;
P ( Z >
− 0, 71) = 0, 7612
Si se quiere obtener una buena aproximación a la distribución normal, debe hacerse la corrección en la variable discreta, siendo igual a
1 2n
.
Si se va a obtener un área hacia la
derecha, se restará este factor de corrección, en el caso de que sea a la izquierda, se sumará ese factor al valor de p. 1 2n
=
1
=
2 ( 200)
p − Z =
1 400
= 0,0025
− P 2n 1
PQ n
0,3133 0,5000
P 0
-0,89
Z =
Z =
(0,03 − 0,0025) 0,014
− 0,89 →
P ( Z >
2.
− 0,04
Z
9
0,8 Z
0,3133
= − 0,89
A (0,3133)
− 0,80) = 0,3133 + 0,5000 = 0,8133
Se desea estudiar una muestra de 49 personas para saber la
proporción de los mayores de 40 años, sabiendo que la proporción
en la población es 0,4. ¿Cuál es la probabilidad de que la proporción en la muestra sea menor de 0,5?
Solución: n
Z =
p − P PQ
=
= 49
P = 0,4
0,5 − 0,4 (0,4) (0,6
0,10
=
0,24
49
n
P ( p <
=
0,10 0,00489
=
0,5 )
0,10 0.07
=?
= 1, 43
49
Z = 1,43 → A (0,4236) 0,4236
0,5000
P 0,5
0,4
0 P ( Z < 1,43)
3.
1,43
= 0,5000 + 0,4236 = 0,9236
Para elegir presidente de un sindicato, un candidato obtuvo el
46% de los votos. Determinar la probabilidad de que entre 200, elegidos al azar, de un total de 1000 afiliados, se obtenga la mayoría de votos para dicho candidato.
P = 0,46
n = 200
(p > 0,50) = ?
a. Z =
Sin Corregir: p
− P
=
PQ
0,50 − 0,46 0,46 (0,54)
= 1,14
200
n
0,3729
0,1271
1,1 4
P (Z > 1,14) = 0,5 – 0,3724 = 0,1271
b.
Corregido
z =
( p
−
1
) 2n PQ
− P
=
(0,50
− 0,0025) − 0,46 0,46 ( 0,54) 200
n
Z = 1,07
0,3577
0,1423
0,46
0,50
0
1,07
P (z > 1,07) = 0,5 – 0,3577 = 0,1423 P ( Z > 1,07) = 0,1423
4.
Cuarenta y seis por ciento de los sindicatos del país están en
contra de comerciar con la China Continental; ¿Cuál es la probabilidad de que una encuesta a 100 sindicatos muestre que más del 52% tengan la misma posición?
Solución: P = 0,46
Z =
p
− P
PQ n
p
=
= 0,52
0,52
−
n
0,46
(0,46) (0,54)
= 100
=
100
P ( p > 0, 52 )
0,06 0,2484
=
=?
1,21
100
Z = 1,21 → A (0,3869)
0,3869 0,1131
P 0,52
0,46
1,21
0
P (Z > 1,21) = 0,5000
5.
Se
ha
-
Z
0,3869=0,1131
determinado que
el
65%
de
los
estudiantes
universitarios de Lima prefieren los cuadernos marca Profesional. ¿Cuál es la probabilidad de que en una muestra de 100 universitarios de dicha ciudad, encontremos que:
a. Como máximo el 68% sean usuarios de ese tipo de cuaderno? b. Exactamente 66% sean usuarios (utilizar medio punto de porcentaje para los límites)? Solución:
P = 65%
n = 100
a. P ( p < 68% ) = ?
Z =
p
− P
PQ
=
0,68 − 0,65 (0,65) (0,35)
=
100
n
0,03 0,2275
=
0,30 0,002275
100
0,2357
P
0,5000
0,63
0
Z = 0,63 → A (0,2357 )
P (Z < 0,63) = 0,5000 + 0,2357 = 0,7357
¿ P (65,5% < p < 66,5%) = ?
b.
Z =
p
− P
PQ n
=
0,655
−
0,65
0,002275
=
0,005 (0,0477 )
=
0,11
=
0,63
Z =
p
− P
PQ
=
0,665
0,65
−
0,002275
=
0,015 0,0477
=
0,32
n
Z = 0,32 → A (0,1255) ; Z = 0,11
→
A(0,0438)
P (0,11 ≤ Z ≤ 0,33) = 0,1255 – 0,0438 = 0,0817
0,1255
8 3 4 0 , 0
0,0817
P 0
0,11
0,32
ESTIMACIÓN • El objetivo principal de la estadística Inferencial es la estimación, esto es que mediante el estudio de una muestra de una población queremos generalizar nuestras conclusiones al total de la misma. Los estadísticos varían mucho dentro sus distribuciones muestrales y mientras menor sea el error estándar de un estadístico, más cercanos serán sus valores unos de otros. Como al estimar un parámetro de población desconocido se suele hacer una afirmación o juicio, el juicio da solamente una estimación. Es un valor particular obtenido de las observaciones de la muestra. No hay que confundir este concepto con el de estimador, que se refiere a la regla o método de estimar un parámetro de población. Por ejemplo, se dice que X es un estimador muestral de un método para estimar la media de población. El procedimiento de juzgar acerca de un parámetro de población se llama estimación estadística, que a su vez se divide en estimación puntual y estimación por intervalos. Se habla con frecuencia de límites de probabilidad siendo aquellos (superior e inferior) asignados a un valor estimado, con el objeto de indicar el intervalo dentro del cual se supone está comprendido el valor verdadero (parámetro) conforme a algún acuerdo de carácter probabilístico, generalmente denominado nivel de confianza. Los límites de confianza son los valores Z s y Z i (también ts y t i) que forman los extremos superior e inferior respectivamente de los intervalos de confianza. Recordemos que en alguna oportunidad se habló de dos tipos de estimación: puntual y por intervalos. El primero corresponde a un solo valor o punto que resulta de una investigación por muestreo, como por ejemplo, la media aritmética, una proporción, una razón, la varianza, etc. Al
realizar una muestra se van a obtener conclusiones sobre la población, mediante la utilización de alguna medida de posición o de dispersión, pero este valor puede ser igual o diferente al del parámetro. Veámoslo mediante un ejemplo. Nivel de confianza
99.73%
99%
98%
96%
95%
90%
zc
3.00
2.58
2.05
2.05
1.96
1.645
a
varios
Valores
de
Zc
correspondientes
niveles
de
confianza.
Ejemplo: 1. El propietario de una pequeña fábrica de artesanías, toma una muestra aleatoria de la producción semanal de 6 de los 35 empleados, obteniendo un promedio de 22,5 figuritas, con una desviación estándar de 3,1. Solución: Encontramos que el estimador es de 22,5 el cual puede ser igual o diferente del promedio (parámetro) si tomamos el total de los 35 empleados. Para muchos es más fácil y más representativo fijar los límites de confianza para ese estimativo, con la probabilidad que se considere conveniente, supongamos del 95%. Por lo tanto se tendrán, partiendo de la variante estadística, los límites de confianza para ese estimativo, con la probabilidad que sea la más indicada, decíamos anteriormente del 95%. Su fórmula será, partiendo de la variante estadística:
t =
x
− µ
s / n
despejando
µ = x
± t
s n
25,75 reemplazando: µ = 22,5 ± 2,571
3,1 6
=
22,5 ± 3,25
19,25
Se tendrán dos límites µ superior = 25,75 e inferior µ = 19,25. Con estos resultados se dirá que la producción real semanal por empleado debe estar entre 19 y 26 figuras, con una seguridad o confianza del 95%. Observamos que nos queda un 5% considerado como error, que el número promedio de figuras por empleado sea superior a 26 o inferior a 19. La media poblacional deberá estar incluida (en algún punto) dentro del intervalo. Podría preguntarse ¿por qué se toma 90%, 99% y no el 100% de confianza?. Se puede responder al interrogante con el anterior ejemplo, notando que a medida que se aumenta el nivel de confianza, más amplio va a ser el intervalo, con la cual se obtendría una información menos precisa y menos útil. Con los intervalos de confianza puede realizarse pruebas de hipótesis, teniendo en cuenta que la prueba debe ser siempre bilateral. Si la hipótesis nula (Ho) se ubica dentro de intervalo, se acepta; en caso contrario, se aceptará la alternativa (Ha).
FÓRMULAS PARA CADA CASO A) Distribución de medias muestrales Con las siguientes fórmulas se pueden determinar los límites de confianza para cada caso, dependiendo de la desviación típica y del tamaño de la muestra, son: a) µ
= x ± Z
σ
µ
= x ± Z
s
µ
= x ± t
µ
= x ± t
n
n s n
Cuando se da σ se tienen s y n > 30 se tiene s (corregida) y n≤ 30
sˆ n −1
se tiene sˆ (sin corregir) y n ≤ 30
Ejemplos: 1)
Una muestra de 50 observaciones tiene una media de 65 y una desviación estándar de 4,2. Se piden los límites de confianza del 95%.
0,9500 2
S
= 0,4750; A (0,4750) → 1,96 = Z µ = x ± Z
n
µ =
65 ± 1,96
4,2 50
;
66,16 µ s = 65 ±1,96 t
4,2 7,07
= 65 ± 1,96(0,59) = 65 ± 1,16 63,84
63,84 < µ < 66,16 0,4750 0,0250 -1,96
0
1,96
2) Una muestra de 26 observaciones tiene una media de 65 y una desviación de 4,2. Se piden los límites de confianza del 95%. Solución: x = 65 sˆ
= x ± t
µ
n
sˆ =
µ
−1
4,2
= 65 ± 2,0595
n = 26 4,2 25
66,73 µ
= 65 ± 2,0595 (0,84) = 65 ±1,73 63,27
63,27 < µ 95%< 66,73
63,27
65
66,73
-2,0595
0
2,0595
t
x
b)
Proporciones µ p = p ± Z
p (1 − p)
o IC ( P): p ± Z
n
p (1 − p ) n
Ejemplo: Una muestra de 100 votantes elegidos al azar entre todos los de un barrio, indicaba que el 45% de ellos estaban a favor de un candidato. Hallar los límite de confianza del 95%.
Solución: p
− Z
pq n
0.45 - 1,96
< P < p + Z 0.45(0,55) 100
pq n
< P < 0.45 + 1,96
0.45(0.55) 100
0,35 < P < 0,55
0,4750
-1,96
0,4750
0
1,96
RESÚMEN DEL CAPÍTULO INTERVALOS DE CONFIANZA PARA MEDIAS (n I.C.(u): x ± Z c
30)
σ n
En el caso de muestreo en una población infinita o si el muestreo es con reemplazamiento en una población finita.
I.C (u): x ± Z c
σ
N − n
n
N −1
Si el muestreo es sin reemplazamiento en una población finita de tamaño N. En general, la desviación típica poblacional σ es desconocida, de modo que para obtener los límites de confianza anteriores, se utiliza la estima muestra S ˆ o S. Intervalos de confianza para Medias. (n < 30)
I.C (u): x ± t c
S n
INTERVALOS DE CONFIANZA PARA PROPORCIONES
I.C. (P): p ± Z c
pq
p+q=1
n
Para el caso de muestreo en una población infinita o con reemplazamiento en la población finita.
I.C. (P): p ± Z c
pq
N − n
n
N −1
Si el muestreo es sin reemplazamiento en una población finita de tamaño N. Ejemplo: Supongamos que las alturas de 100 estudiantes varones de una universidad representan una muestra aleatoria de estudiantes de esa universidad. La media muestral es de 67.45 pulgadas y la desviación estándar muestral es de 2.93 pulgadas. Hallar los intervalos de confianza a) 95% y b)99% para estimar la altura media de los estudiantes.
a)
42 Esto significa que 66.88 < µ < 68.02 o en otras palabras podemos decir que la probabilidad de que la altura media de la población esté entre 66.88 y 68.02 pulgadas es del 95%. Equivale a decir que tenemos el 95% de confianza que la media de la población está entre 66.88 y 68.02.
b) Esto significa que 66.69 < µ < 68.21 o en otras palabras podemos decir que la probabilidad de que la altura media de la población esté entre 66.69 y 68.21 pulgadas es del 99%. Equivale a decir que tenemos el 99% de confianza que la media de la población está entre 66.69 y 68.21.
Ejemplo: Un sondeo de 100 votantes elegidos al azar en un distrito indica que el 55% de ellos estaban a favor de un cierto candidato. Hallar los límites de confianza a) 95% b) 99% y c) 99.73% para la proporción de todos los votantes favorables a ese candidato.
a)
b)
c)
7.4 DETERMINACION DEL TAMAÑO DE LA MUESTRA Cuando se necesita información para realizar estudios con datos estadísticos y no se puede contar un censo, porque es muy caro, o porque demora mucho o no se cuenta con el personal adecuado; entonces será necesario obtener una muestra, ahora. Pero viene la pregunta: ¿cuál será el número adecuado mínimo del tamaño de la muestra? En principio existe todo un proceso para obtener una muestra representativa de la población. Si el método es aleatorio o probabilistico, entonces el número adecuado de los elementos de la muestra, se pueden calcular usando las siguientes fórmulas. 1. CUANDO EL ESTUDIO ES DE CARÁCTER CUALITATIVO (PROPORCION)
a. Cuando se supone que N es muy grande o cuando el muestreo es con reposición: n=
2 Zα P θ 2
E
b. Cuando la población es finita (se conoce N) o el muestro es sin reposición. NZα P(1 − P ) 2
n=
( N − 1) E 2 + Zα 2 P(1 − P )
Donde: P=Proporción de éxito; que se conoce por estudios anteriores o similares. Q=(1-P). Proporción de fracaso. Zα=Valor que se obtiene de la distribución normal, para un nivel de significación a. Generalmente se toma: Z=1.96 para un nivel de confianza del 95%. Z=2.575 para un nivel de confianza del 99%. E=Error de estimación. Valor que lo determina el investigador. Se sugiere valores en torno al 5%. N= Número de los elementos de la población. Nota: Si no se conoce P, se puede adoptar las siguientes decisiones: i) Tomar una muestra piloto y calcular el valor de P. ii) Considerar el valor de P=0.5, lo cual dará el número de elementos de la muestra el mayor valor posible. 2. CUANDO EL ESTUDIO ES DE CARÁCTER CUANTITATIVO (MEDIA)
a) Cuando no se conoce el tamaño N de la población o éste es infinito: n=
Z α 2σ 2 E 2
b) Cuando el tamaño N de la población es finito: n=
NZ α 2σ 2
( N − 1) E 2 + Z α 2σ 2
Ejemplos Nº 004 Se van a realizar un gran y desconocido número de ensayos para calibrar la resistencia media a la rotura de un determinado azulejo en una partida de 10 2 000,000 unidades. Si deseamos cometer un error inferior a 10 kg/cm , y por ensayos anteriores conocemos que la varianza en la rotura ha sido de 40 (kg/cm 2)2, ¿Qué número de ensayos hemos de realizar si hemos decidido trabajar con un nivel de confianza del 95%? Si suponemos un gran número de ensayos, suponemos, también, que el tamaño muestral es grande, por lo que podemos establecer normalidad. Los datos serian los siguientes: α=95%, E2=10 kg/cm2 ,σ2=40(kg/cm2)2. Utilizando la fórmula siguiente: n = n=
(1.96 2 )(40) 10
Z α 2σ 2 E 2
, tenemos:
= 15.36 ≈ 15 muestras de azulejos.
Ejemplo Nº 005 Para conocer la valoración en forma de porcentaje de aceptación hacia un determinado profesor decidimos encuestar a un determinado número de sus 100 alumnos. Calcular dicho número, si el error que estamos dispuestos a admitir es del más menos 3% y trabajamos con un nivel de confianza del 95%. Tenemos los siguientes datos: N=100, E=3%, α=95%, p=0.5. q=1-p=0.5 Utilizando la fórmula tenemos: n=
NZ α 2 PQ
( N − 1) E 2
+ Z α 2 PQ
=
(100)(1.96) 2 (0.5)(0.5) (100 − 1)(0.03) 2
+ (1.96) 2 (0.5)(0.5)
= 91.51 ≡ 91 alumnos.
Ejemplo Nº 006 Para conocer la valoración en forma de porcentaje de aceptación hacia un determinado profesor decidimos encuestar a un determinado número de sus 100 alumnos. Calcular dicho número, si el error que estamos dispuestos a admitir es del más menos 3% y trabajamos con un nivel de confianza del 95%. El tamaño de la población es pequeño con Ν=100, Ε=3%, α =95%, p=0,5 p=0.5.
q=1-
Utilizando la fórmula tenemos: n=
NZ α 2 PQ
( N − 1) E 2
+ Z α 2 PQ
=
(100)(1.96) 2 (0.5)(0.5) (100 − 1)(0.03) 2
+ (1.96) 2 (0.5)(0.5)
= 91.51 ≡ 91 alumnos.
TAMAÑO DE MUESTRA EN POBLACIONES FINITAS 1.
Un auditor desea tener un nivel de confianza del 95%, para que la verdadera proporción de error no exceda del 2%. Si la población es muy grande, ¿Qué tamaño tendrá la muestra que va a tomarse, si el auditor estima que la proporción de error es del 5%? n=
Z 2 PQ E 2
=
1,962 (0,05) (0,95) 0,02 2
=
456,19
≅ 457 cuentas
2. ¿Qué tamaño deberá tener una muestra para estimar dentro del 3%, la proporción de mujeres casadas que van periódicamente a consulta ginecológica, en una población de 5000 mujeres y una seguridad del 95%?
solución: 3.
E = 0,03
n0
N = 5000
=
Z 2 . PQ E 2
α = 0,05 1 - α = 0,95 n
P = 0,50 Q = 0,50
n0
=
n0
=
n
=
(1,96) 2 . (0,5) (0,03)
0,9604 0,0009
no no
1+
n=
PQ 2
E + PQ Z N
(1)
(0,5)
2
= 1067
=
1067 1067
1+
N
=
1067 1 + 0,2134
=
5000
1067 1,2134
=
n = 879,35
n ≅ 880 mujeres casadas utilizando la fórmula (1) tendremos:
n
n
=
0,5 (0.5) 2
0,03 + 1 , 96
= 879
0,5 (0,5) 5000
=
0,25 0,00023428
+
0,00005
=
0,25 0,00028428
3.
El departamento de tránsito y transporte requiere estimar la proporción de conductores con experiencia de un año o menos, que puedan clasificarse como conductores descuidados. ¿De que tamaño deberá ser la muestra a fin de que los resultados estén dentro de un 2%, con una confianza del 95%? Se espera observar que aproximadamente ¼ del total de conductores sean descuidados.
Solución
n
=
2
Z PQ E 2
=
(1,96) 2 (0,25) (0,75) (0,02) 2
Datos: P = 0,25 Q = 0,75 E = 0,12 Z = 1,96
n = 1801 Conductores con experiencias de un año o menos. 4.
Si en el ejercicio anterior se dijera que el número de conductores a investigar es de 10000, ¿Cuál será el tamaño de la muestra?
Solución n
=
PQ 2
E + PQ Z N
=
(0,25) ( 0,75) 2
0,02 + 1 , 96
0,25 (0,75) 10000
n = 1526 Conductores con experiencia de un año o menos.