Ph.D. Profesor Profesor Titular. Titular. Universid Universidad ad de Granma, Granma, Cuba: Cuba: Bioestadíst Bioestadística ica Sencilla Sencilla
Intervalo de confianza La estimación confidencial consiste en determinar un posible rango de valores o intervalo, en los que pueda pueda precisarse precisarse con una determinada determinada probabilidad probabilidad que el valor de un parámetro se encuentra encuentra dentro de esos límites. Este parámetro parámetro será habitualmente, habitualmente, la media media o la varianz varianza a para distr distribuc ibucione iones s gaussian gaussianas as y una propo proporció rción n en el caso caso de variables dicotómicas A la probabilidad de que hayamos hayamos acertado al decir que el parámetro estaba estaba contenido contenido en dicho intervalo se le denomina nivel de confianza. confianza . a) Intervalo de confianza para la media si se conoce la varianza: b) Intervalo Intervalo de confianza confianza para la media si se se desconoce desconoce la varianza: varianza: c) Intervalo Intervalo de confianza para una proporción proporción d) Intervalo de confianza para la varianza: Estimación de tamaño muestral
a) Intervalo para la media si se conoce la varianza: Varianza conocida. conocida . n < 30
Figura 1. : Intervalo de confianza para una media.
1
Ph.D. Profesor Titular. Universidad de Granma, Cuba: Bioestadística Sencilla
Valores de Z para pruebas unilateral y bilateral a diferentes niveles de significación. Nivel de Significación 0.10 0.05 0.01 0.005 0.002 α
unilateral
-1.28 ó 1.28
-1.64 ó 1.64
-2.33 ó 2.33
-2.58 ó 2.58
-2.88 ó 2.88
biilateral
-1.64 y 1.645
-1.96 y 1.96
-2.58 y 2.58
-2.81 y 2.81
-3.08 y 3.08
Ejemplo Al analizar los valores de proteínas brutas (%) de nueve muestras de pasto natural se encontró que las misma tienen valores de: 6.18; 6.11; 6.11; 6.24; 6.37; 6.29; 6.21; 6.50; 6.37. a) Determine un intervalo de confianza del 95 %de certeza para el nivel medio del contenido de proteínas bruta, si se sabe que la desviación estándar de la población es igual a 0.18 %. b) Encuentre un intervalo de confianza del 99 %de certeza, para el nivel medio del contenido de proteína bruta, suponiendo que se desconoce la varianza de la población. Solución.
P I =
X
x
z
1
n
6 . 18 6 . 11 ..........
x
9
6 . 26
z
1
n
2
6 , 37
........
2
S = 0,1307
Para el 95 %, (α = 0,05)
Z
1
2
Z
1 0 . 025
z
0 . 975
1 . 96
Sustituyendo.
P I = 6 , 26
0 ,18 9
1 , 96
P =
6 , 26
6,16 6,36 2
0 ,18 9
1 , 96
95%
%
Ph.D. Profesor Titular. Universidad de Granma, Cuba: Bioestadística Sencilla
La media poblacional para el contenido de proteínas bruta en el pasto natural a la edad de 28 día con un 95 %de confianza esta entre 6.14 y 6.37%.
b) Intervalo para la media si se desconoce la varianza: 1) varianza desconocida. n < 30
P I = x
S=
t
1
P
2
x
s
t
n
( x )
353 , 3
n
2
t
=
I =
P ( I )
6,26 -
9
9
3 , 36
3 , 36
6.11 ≤ µ ≤ 6.40
t
1
99%
2
( 56 , 38 ) 2
t
0 , 995
0 ,13
n
0 ,13
9 1
8
0 , 995
s
x
2
2
n 1 0 , 01
1
6 , 26
gl = n – 1 = 9 – 1 = 8
0 ,13 9
3 , 36
99%
99%
Figura 2: La distribución de Student tiene las mismas propiedades de simetría que la normal tipificada.
3
Ph.D. Profesor Titular. Universidad de Granma, Cuba: Bioestadística Sencilla
Podemos afirmar que a un nivel de confianza del 99% el valor medio poblacional del contenido de proteína bruta está entre 6,11 y 6,40%.
2) varianza desconocida. n > 30 Se realizó un estudio de la medida altura de la cruz en ovino Pelibuey, para lo cual se __
tomó una muestra de 49 machos adultos obteniéndose que X = 64 cm. Y S = 8 cm. a) Realice una estimación por intervalo para la altura media de la cruz de esta raza de ovino con un 90 % de confiabilidad. Solución. Datos. Confiabilidad 90% (0.90). __
n = 49
z
1
1 0 , 90 0 ,10
2
z
0 ,1
1
P I = x
P=
64
2
z n
1
x
z n
1
2
1 , 64
49
S= 8
0 , 95 1 , 64
8
P(µεI)=
z
X = 64
64
8 49
62.12 ≤ µ ≤ 65.88
2
1 , 64
%
90%
90%
c) Intervalo de confianza para una proporción. En una muestra al azar de 400 agricultores, 260 resultaron propietarios. Determine los límites del 95% de confianza para el porcentaje verdadero de propietarios de granjas en la población muetreadas de agricultores.
p
x n
= p
260 400
=
65%
4
Ph.D. Profesor Titular. Universidad de Granma, Cuba: Bioestadística Sencilla
P P I
P P I
=
P P I
=
p
=
0,65
pq
z
1
n
(0,65)( 0,35) 400
O, 623 ≤ P
P p
2
1,96 P 0,65
≤ 0,674
pq n
z
1
%
2
( 0,65)( 0,35 ) 400
1,96
95%
95%
El porcentaje de propietarios de granja está entre 62,3% y 67,4%
Figura 3. : Intervalo de confianza para una proporción.
d) Intervalo de confianza para la varianza: Una muestra al azar de 23 observaciones extraídas de una población normal tuvo una media de 20 y una suma de cuadrados de las desviaciones respecto a la media, de 2400. Determine el intervalo a la varianza al 95% de confianza.
n = 25
X = 20
(
2
i
X ) = 2400
5
Ph.D. Profesor Titular. Universidad de Granma, Cuba: Bioestadística Sencilla
( xi x )
S=
P
2
2
2
I =
I =
I =
2400
S=
n 1
P
2
=
( n 1 ) S 2
x
≤
2 ( n 1) 1
10
25 1
2
σ
x
2 2
≤
36 , 8
≤
σ2
2
%
2 (n 1)
2
( 23 1 ) 10
59,7
≤
( n 1 ) S
≤
200
2
σ
≤
( 23
1 ) 10
2
11
95%
95%
Figura: 1. Intervalo de confianza para la varianza
Estimación del tamaño muestral Algo que inquieta frecuentemente al investigador, es el tamaño de la muestra que debe utilizar esta preocupación es obvia pues si la muestra es demasiado pequeña, los resultados pueden carecer de validez y si es demasiado grande, quizás represente un mal gasto de energía y recursos: La utilidad consiste en decidir cuál deberá ser el tamaño necesario de una muestra para obtener intervalos de confianza para una media, con precisión y significación dadas de antemano. Para que esto sea posible es necesario poseer cierta información previa, que se obtiene a partir de las denominadas muestras piloto. 6
Ph.D. Profesor Titular. Universidad de Granma, Cuba: Bioestadística Sencilla
El tamaño de la muestra depende de los siguientes factores: a) De la variabilidad del universo que se estudia, pues mientras más variable sea este, mayor a de ser el tamaño de la muestra. b) Precisión que se requiere de los resultados, es decir, magnitud del error que podemos tolerar. Se comprende que para afirmar que el de un grupo de cerdos está entre 45 y 55 kg., se necesitará una muestra más pequeña que si quisiéramos afirmar que dicho promedio está entre 50 y 51. Kg
c) Margen de certeza que se desee obtener ( 95% y 99%), pues para determinada precisión mientras mayor sea la certeza que se busca, mayor debe ser el tamaño de la muestra. Como la precisión que se aspire y la certeza que se desee depende del problema que se estudia, podemos decir que el tamaño de la muestra dependerá en parte de la aplicación de los resultados que se obtengan. Antes de realizar un estudio de inferencia estadística sobre una variable, lo primero es decidir el número de elementos,
n,
a elegir en la muestra aleatoria. Para ello
consideremos que el estudio se basara en una variable de distribución normal, y nos interesa obtener para un nivel de significación
dado, una precisión (error)
d .
S
z n
n 1 ,1
2
------Precisión (d) o error de estimación
Donde S es una estimación puntual a priori de la desviación típica de la muestra. Para obtenerla nos podemos basar en una cota superior conocida por nuestra experiencia previa, o simplemente, tomando una muestra piloto que sirve para dar una idea previa de los parámetros que describen una población. Ejemplo Una muestra del peso corporal de 25 terneros (que podemos considerar piloto), ofreció los siguientes resultados: considerando que ésta es una variable que se distribuye de modo gaussiana. 7
Ph.D. Profesor Titular. Universidad de Granma, Cuba: Bioestadística Sencilla
X = 102 kg
S = 5 kg.
Calcular el tamaño que debería tener una muestra para que se obtuviese un intervalo de confianza para la media poblacional con un nivel de significación
α = 0,01
(al 99%) y con una precisión de d = 1 kg. Solución: 2
2
Z S 1
n =
Z
=
2
2
2 0 , 995 2
2
S
=
d
d
(2,58) 2 (5) 2 12
= 166,4 ≈ 166
Por tanto, si queremos realizar un estudio con toda la precisión requerida en el enunciado se debería tomar una muestra de 166 terneros. Esto es una indicación de gran utilidad antes de comenzar el estudio. Elección del tamaño muestral para una proporción . Se desea conocer con una certeza del 95% y sin cometer un error mayor que el 3%, la proporción de aparición del síntoma A en la población compuesta por enfermos de una determinada parasitosis y el primer paso es determinar de que tamaño ha de ser la muestra. Una muestra piloto de 20 animales resultó que en el 20% de los enfermos se presentó el síntoma A.
n
z
2
2
1
2
p q
d
2
2
=
(2,58) 2 (0,2) 2 (0,8) 2 (0,03)2
Por tanto debe tomarse una muestra de 711 individuos.
8
= 711