PRUEBAS DE HIPÓTESIS
72
CAPÍTULO 4 PRUEBAS DE HIPÓTESIS 4.1 Introducción. Existe Existen n múltiple múltipless problemas problemas en los cuales, cuales, en vez de estima estimarr el valor valor de un pará parámet metro ro,, se debe deci decidir dir si si una afir afirma maci ción ón relat relativ iva a a un pará paráme metr tro o es verdadera o falsa; esto es, se debe probar una hipótesis relativa a un parámetro.
4.2 Errores tipo I y tipo II. Para ilustrar los conceptos generales relacionados con este tipo de problemas de decisión (pruebas de hipótesis), supóngase que una agencia de protección al consumidor desea probar la afirmación de un fabricante de pinturas según la cual el tiempo promedio promedio de secado de su nueva pintura pintura de secado rápido es de 20 20 minut minutos os.. Así Así que que gira gira ins instr trucc uccio ione ness a un miem miembr bro o de su equi equipo po de investigación investigación para para que pinte 36 36 tableros tableros con el contenid contenido o de 36 diferentes diferentes botes botes de 1 galón de la pintura, pintura, a fin de rechazar rechazar la afirmación, afirmación, cuando la media de los tiempos de secado sea mayor a 20.75 minutos; de otra manera, aceptará la afirmación y en cualquier caso tomara las medidas correspondientes. Lo ante anterio riorr proporc proporcion iona a un crit criteri erio o bien bien defi definido nido para para acept aceptar ar o rechaza rechazarr la afirmación, pero desafortunadamente no es infalible. Puesto que la decisión se basa en una muestra, existe la posibilidad de que: 1. La media media muestral muestral exceda exceda 20.75 20.75 y la la media media real de secado sea sea µ = 20 2. La media media muestr muestral al sea 20.75 20.75 o más pequeñ pequeña a y que la media media real real sea mayor, digamos µ = 21 Ambos casos generarían una decisión incorrecta. Se analizan estas posibilidades. Supóngase que por experiencia se sabe que σ = 2.4 minutos de secado. 1. Determinar P ( x > 20.75 ) , esto es, el procedimiento no logra detectar que µ = 20 σ = 2 .4 , n = 36 Datos: µ x
de donde: z =
=
20
σ x
=
(20.75 − 20) 0.4
2.4 36
=
0.4
= 1.875 y
P ( x
> 20.75 ) = P ( z > 1.875) ≈ 0.0304
PRUEBAS DE HIPÓTESIS
73
Gráficamente: se acepta la afirmación de que µ = 20
se rechaza la afirmación de que µ = 20 0.0304
µ = 20
x
20.75
Conclusión : la probabilidad de rechazar erróneamente la hipótesis de que el tiempo promedio de secado de la pintura está dado por: µ =20 minuto minutoss es aproximadamente 0.0304 2.- Determinar Determinar ahora la posibilidad de que el procedimiento no logre detectar que el tiempo promedio de secado sea diferente a 20 minutos; suponiendo que µ =21, calculamos P ( x < 20.75 ) Se estaría aceptando erróneamente la afirmación de que µ = 20 Con: σ = 2 . 4 µ x
z =
= 21
σ x
(20.75 − 21) 0.4
, =
n = 36 2.4 36
= 0.4
= − 0.625 y
P ( x < 20.75 ) = P ( z <
Gráficamente: Se acepta la afirmación de que µ =20
− 0.625) ≈ 0.2660
Se rechaza la afirmación de que µ =20
0.2660
x
µ = 21 20.75 Concl Conclus usió ión n : nos nos equiv equivoc ocam amos os al acep acepta tarr la hipó hipóte tesi siss de que que el tiem tiempo po promedio de secado de la pintura está dado por µ =20 con una probabilidad de 0.2660
PRUEBAS DE HIPÓTESIS
74
La descripción del ejercicio anterior caracteriza una prueba de una hipótesis estadística. Llamando H a las hipótesis que están siendo probadas. Se resume:
H es verdadera H es falsa
Se acepta H
Se rechaza H
Decisión Correcta Error Tipo II (β)
Error Tipo I (α) Decisión Correcta
Al error tipo I también se le llama nivel de significancia. De nuestro ejemplo tenemos que α = 0.0304 y β = 0.2660 cuando µ = 21 Resumiendo: el error tipo I es la probabilidad de rechazar la hipótesis cuando ésta es verdadera y el error tipo II es la probabilidad de aceptar la hipótesis cuando ésta es falsa. Se planteó una hipótesis simple del parámetro µ esto es, se formula de manera que µ fue especificada por completo; µ = 20 minutos, en nuestro ejemplo. Una hipótesis denominada compuesta acerca del parámetro µ podría ser de la forma ≤ 20 minutos, µ puede tomar más de un valor y no se podría calcular en este caso la probabilidad de cometer un error tipo I. Estudiaremos solamente hipótesis de tipo simple. Cuando, por ejemplo, queremos probar que un método de enseñanza es mejor que otro formulamos la hipótesis de que los dos métodos son iguales de buenos. A éste tipo de hipótesis se les denomina hipótesis nulas y se denotan por Ho. El término hipótesis nula se utiliza principalmente para designar cualquier hipótesis formulada para ver si puede ser rechazada. El rechazo de una hipótesis nula Ho conduce a aceptar una hipótesis alterna denotada por H1.
Estadísticamente, siempre se hará mas énfasis en el error tipo I que en el error tipo II. Es más, preferentemente se prefiere escribir “no se puede rechazar H o” en lugar de escribir “se acepta Ho”. También, no se debe hacer que la probabilidad de incurrir en un error tipo I sea demasiado pequeña, debido a que esto tendería a hacer demasiado grandes las probabilidades de cometer un error tipo II. Los conceptos que se han expuesto se aplican por igual a las hipótesis relativas a proporciones, desviaciones estándar, la aleatoridad de muestras y relaciones entre variables.
PRUEBAS DE HIPÓTESIS
75
A una prueba de cualquier hipótesis estadística, en la que la hipótesis alterna es unilateral, tal que: Ho : θ = θo Ho : θ = θ o θ.-parámetro poblaciónal H1 : θ > θ o o bien H1 : θ < θ o θo.- valor asignado a θ se le denomina prueba de una cola o unilateral. A una prueba de cualquier hipótesis estadística, en la que la hipótesis alterna es bilateral, tal que : Ho : θ = θ o H1 : θ ≠ θ o se le denomina prueba de dos colas o bilateral.
4.3 Potencia de la prueba . La potencia de la prueba se refiere a la probabilidad de rechazar una hipótesis nula (en forma correcta ) dado un valor alternativo específico para el parámetro. La potencia de una prueba estadística es la probabilidad de rechazar la hipótesis nula Ho cuando la hipótesis alternativa es verdadera. Por la tanto, el valor de la potencia está dado por la expresión 1 - β, y la potencia puede interpretarse como la probabilidad de rechazar de manera correcta una hipótesis nula falsa. La potencia es una medida descriptiva y concisa de la sensibilidad de una prueba estadística, donde por sensibilidad se entiende la capacidad de una prueba para detectar diferencias. Si se piensa que el valor de esta potencia es bajo, entonces el analista puede aumentar α o el tamaño de la muestra. Se anotan algunas observaciones importantes: - La probabilidad α de cometer un error tipo I, siempre puede reducirse mediante una selección apropiada de los valores críticos. - Los errores tipo I y II están relacionados. Una disminución en la probabilidad en un tipo de error siempre da como resultado un aumento en la probabilidad del otro, siempre que el tamaño de la muestra n no cambie. - En general, un aumento en el tamaño de la muestra reduce tanto a α como a β, siempre y cuando los valores críticos se mantengan constantes. En general, el analista controla la probabilidad α de error tipo I cuando escoge los valores críticos. Así usualmente es más fácil para el analista fijar la probabilidad del error tipo I en (casi) cualquier valor deseado. Puesto que el analista puede controlar de manera directa la probabilidad de rechazar de manera errónea Ho, siempre puede considerarse el rechazo de la hipótesis nula H o como una conclusión fuerte. Por otra parte, la probabilidad β del error tipo II es una función tanto del tamaño de la muestra que se haya seleccionado como del punto en el cual la hipótesis nula Ho es falsa, es costumbre considerar la decisión de aceptar H o como una
PRUEBAS DE HIPÓTESIS
76
conclusión débil, a menos que se sepa que β es aceptablemente pequeño. Por consiguiente, más que decir “se acepta Ho”, se prefiere la terminología “no se puede rechazar Ho”. La incapacidad de rechazar Ho implica que no se ha encontrado evidencia suficiente para rechazar Ho, esto es, para hacer una proposición fuerte.
4.4 Formulación de hipótesis estadística . Para probar hipótesis relativas al parámetro sistemática se anotan las siguientes etapas:
θ
de una población de manera
1.- Formular una hipótesis nula simple y una hipótesis alterna apropiada que aceptamos cuando la hipótesis nula debe ser rechazada. H0 : θ = θ o H1 : las alternativas pueden ser θ > θ o ; θ < θ o ; θ ≠ θ o 2.- Especificar la probabilidad de incurrir en un error tipo I o nivel significancia.
de
3.- Con base en la distribución muestral del estadístico apropiado, considerando H1 y el nivel de significancia α, construir gráficamente un criterio para probar la hipótesis nula contra la hipótesis alterna determinada. 4.- Calcular el valor del estadístico partiendo de una muestra aleatoria de tamaño n. Rechazar Ho si el estadístico tiene un valor en la región critica, si no es así, acepte Ho. 5.- Escribir la conclusión de acuerdo al planteamiento del problema. La aplicación de la formulación de una hipótesis estadística se describe en el siguiente apartado.
PRUEBAS DE HIPÓTESIS
77
4.5 Prueba de hipótesis para la media. Los capítulos anteriores nos dan las bases para determinar cuando utilizar cada uno de los siguientes estadísticos: Z =
t =
( x − µ ) σ
( x − µ ) s
⋅
⋅
(4.1)
n
(4.2)
n
La altura promedio de las mujeres en el grupo de primer año de una institución de enseñanza superior es de 162.5 cm. con una desviación estándar de 6.8 cm. Al nivel de significación de 0.05, ¿hay alguna razón para creer que existe un cambio en la altura promedio, si una muestra aleatoria de 50 mujeres del grupo actual tiene una altura promedio de 165.2 cm.? Ejemplo 4.5.1
Antes de la formulación de la prueba de hipótesis, por supuesto, se tiene que identificar sobre que parámetro poblacional se hará dicha formulación. En este ejemplo se pide probar si ha existido un cambio en la altura promedio de las mujeres que ha sido de 162.5 cm., es decir se trabajará sobre el parámetro µ. Además identificamos: σ = 6.8, n = 50, µ = 162.5, x = 165.2 , α = 0.05 Iniciemos: Etapa 1. H0: µ = 162.5 H1: µ ≠ 162.5 Etapa 2.
α = 0.05
Etapa 3. Por los datos dados en éste ejemplo se trabaja con el estadístico z, y H1 nos indica que el valor de µ puede ser mayor o menor a 162.5 por lo que el nivel de significancia para este ejemplo 0.05 se reparte en ambos extremos de la distribución de z, es decir 0.025 de área en cada extremo de la gráfica. Zona o región de rechazo de que µ = 162.5
- 1.96 Valor crítico
Etapa 4.
Zona o región de aceptación de que µ = 162.5
0
1.96
Zona o región de rechazo de que µ = 162.5
Z Valor crítico
PRUEBAS DE HIPÓTESIS
78
Cálculos. Utilizando (4.1) Z =
( x − µ ) σ
⋅
n
=
(165.2 − 162.5) 6.8
⋅
50
= 2.808
2.808 > 1.96 El valor calculado queda en la región crítica o región de rechazo. Entonces: H0 se rechaza y en consecuencia H1 se acepta. Etapa 5. Conclusión: Si existe razón para creer que se ha dado un cambio en la estatura promedio de las mujeres de primer año de esa institución de enseñanza superior. Ejemplo 4.5.2 El rendimiento promedio de cerezas en un huerto ha sido igual ha
4.35 toneladas por acre durante los últimos años. Se probó un fertilizante nuevo en 12 parcelas de un acre seleccionados aleatoriamente. Los rendimientos de las parcelas fueron: 5.00 4.88 4.93 4.92 4.25 4.45 5.35 4.81 3.48 4.45 4.72 4.79 ¿Se tiene evidencia suficiente al nivel de significación de 0.05 para afirmar que hubo un incremento significativo en la producción promedio? Datos del problema: x = 4.67 , n = 12,
s = 0.474,
µ = 4.35 , α = 0.05
Etapa 1. H0: µ = 43.5 H1: µ > 4.35 Etapa 2.
α = 0.05
Etapa 3. Por los datos dados en éste ejemplo se trabaja con el estadístico t , y H1 nos indica que el valor de µ sea mayor a 4.35 por lo que el nivel de significancia para este ejemplo 0.05 se dibuja solamente en el lado derecho de la distribución de t. Zona o región de rechazo de que µ = 4.35
Zona o región de aceptación de que µ = 4.35
Etapa 4.
0
1.796
t Valor crítico
PRUEBAS DE HIPÓTESIS
79
Cálculos. Utilizando (4.2) t =
( x − µ ) s
⋅
n
=
(4.67 − 4.35) 0.474
⋅
12
= 2.339
2.339 > 1.796 El valor calculado queda en la región crítica o región de rechazo. Entonces: H0 se rechaza y en consecuencia H1 se acepta. Etapa 5. Conclusión: Si se tiene evidencia suficiente al nivel de significación de 0.05 para afirmar que hubo un incremento significativo en la producción promedio de cerezas.
4.6 Prueba de hipótesis para la diferencia de medias. Se tienen los siguientes casos: 4.6.1 Prueba de Hipótesis Para Una Diferencia De Medias (muestras grandes).
Existen problemas en los que debemos decidir si una diferencia observada entre dos medias muestrales se puede atribuir al azar. El método que usamos para probar si una diferencia observada entre dos medias es estadísticamente importante se basa en si x1 y x 2 son las medias de dos muestras aleatorias independientes grandes de tamaños n1 y n2, la distribución de muestreo de la estadística x1 − x 2 se puede calcular muy aproximadamente con una curva normal que tenga: 2
como media
µ x
1 − x2
= µ 1 − µ 2
y desviación estándar
σ x − x 1 2
=
σ 1
n1
2
+
σ 2
n2
en donde µ 1 , µ 2 , σ 12 , σ 22 son, respectivamente, las medias y varianzas de las poblaciones de las cuales provienen las muestras. Para muestras grandes podemos basar la hipótesis nula H 0 : µ1 – µ2 = δ (δ delta, es el valor de la diferencia entre las medias) en el estadístico:
z =
[ ( x1 y x 2 ) − ( µ 1 − µ 2 )] 2
σ 1
n1
2
+
σ 2
(4.3)
n2
El cual es el valor de una variable aleatoria distribuida en forma aproximadamente normal
PRUEBAS DE HIPÓTESIS
80
Para realizar la prueba se siguen en forma semejante las etapas para la formulación de la prueba de hipótesis. El estroncio 90 es un elemento radioactivo que se produce en las pruebas nucleares y guarda relación estrecha con el calcio. En granjas lecheras, dicho elemento puede llegar a la leche de vaca por el pasto que comen estos animales. Luego, se concentra en los huesos de las personas que beben la leche. Se realizó un estudio de comparación de la concentración media de estroncio 90 en los huesos de niños y adultos. Se pensó que los valores en niños fueron más altos por la presencia del elemento durante sus años de formación. Suponiendo normalidad en las observaciones, con un nivel de significancia del 5% y los siguientes datos, prueba la hipótesis planteada. n x S 2 Niños 121 2.6 pico curies por gramo 1.44 Adultos 61 1.2 pico curies por gramo 0.021 Ejemplo 4.6.1.1
Etapa 1. H0: µn = µa H1: µn > µa Etapa 2.
α = 0.05 Etapa 3. Por los datos dados en éste ejemplo se trabaja con el estadístico z , y H1 nos indica que el valor de µn sea mayor que µa por lo que el nivel de significancia para este ejemplo 0.05 se dibuja solamente en el lado derecho de la distribución de z. Zona o región de rechazo de que
Zona o región de aceptación de que µn = µa
0
µn = µa
1.645
z Valor crítico
Etapa 4. Cálculos. Muchos investigadores concuerdan en que las varianzas de las muestras se pueden utilizar en la fórmula (4.3) en lugar de varianzas
PRUEBAS DE HIPÓTESIS
81
poblacionales, cuando se desconocen las varianzas poblacionales y los tamaños de muestra son grandes (n1,n2 ≥ 30), porque con tamaños de la muestra grandes las varianzas son buenas aproximaciones de las varianzas poblacionales.
z =
( x1
− x 2 ) − ( µ 1 − µ 2 ) 2
σ 1
n1
2
+
=
[ (2.6 − 1.2) − (0)]
σ 2
1.44
n2
121
+
0.021
= 12.65
61
12.65 > 1.645 El valor calculado queda en la región crítica o región de rechazo. Entonces: H0 se rechaza y en consecuencia H1 se acepta. Etapa 5. Conclusión: Se tiene evidencia al nivel de significación de 0.05 para afirmar que la presencia del elemento, estroncio 90, en niños es más alto que en los adultos. 4.6.2 Prueba de Hipótesis Para Una Diferencia De Medias (Muestras 2 2 pequeñas n1+ n2 – 2 < 30; σ 1 = σ 2 pero desconocidas).
Se tienen otros casos donde sólo se dispone de muestras pequeñas para comparar dos medias, entonces nos basamos en la estadística de t. Debemos suponer que extraemos dos muestras aleatorias independientes de dos poblaciones que aproximadamente tienen la forma de distribuciones normales, y en donde además σ1 = σ2 .Entonces podemos basar la hipótesis nula H0: µ1 – µ2 = δ en el estadístico
t =
( x1
− x 2 ) − ( µ 1 − µ 2 ) S p
1 n1
+
1
(4.4)
n2
Donde: S p
=
( n1
− 1) S 12 + (n2 − 1) S 22 n1 + n 2 − 2
(4.5)
con ν = n1 + n2 – 2 grados de libertad La prueba t de dos muestras se usa principalmente para probar la hipótesis nula de que no hay diferencia entre las medias Ho : µ 1 – µ 2 = δ = 0
PRUEBAS DE HIPÓTESIS
82
Para aplicar la prueba, se siguen pasos semejantes a los aplicados a una prueba de hipótesis para una muestra. Ejercicio 4.6.2.1 Durante un eclipse solar, la temperatura desciende rápidamente
conforme la Luna se interpone entre la Tierra y el Sol. Se obtienen los datos siguientes sobre la caída de temperatura, en grados Fahrenheit, en dos tipos de terrenos del sur de África durante el eclipse de junio de 2001: Terreno montañoso (TM) 15 12 16 16 13 15 11 19 15 Terreno ribereño (TR) 13 17 19 16 15 19 18 20 21 22 24 Suponiendo que las observaciones se distribuyen en forma aproximadamente normal y que las varianzas poblacionales son iguales pero desconocidas, ¿hay evidencia a un nivel de siginificancia de 2% de que existe diferencia en las temperaturas promedio de la caída de temperatura observada en esos dos terrenos? Etapa 1. H0: µTM = µTR H1: µTM ≠ µTR Etapa 2.
α = 0.02 Etapa 3. Por los datos dados en éste ejemplo se trabaja con el estadístico T de la fórmula (4.4) y H1 nos indica que el valor de µTM sea diferente que µTR por lo que el nivel de significancia 0.02 se dibuja y reparte a ambos lados de distribución de t. Zona o región de rechazo de que
Zona o región de aceptación de que
Zona o región de rechazo de que
µTM = µTR
µTM = µTR
µTM = µTR
- 2.552 Valor crítico
0
2.552
t Valor crítico
ν = n1 + n2 - 2= 9 + 11 – 2 = 18 t0.01,18 = 2.552
Etapa 4. Cálculos. Se ocupa (4.4), por los datos dados en el enunciado del problema. Procesando los datos se tiene:
PRUEBAS DE HIPÓTESIS
nTM = 9 nTR = 11
x = 14.67
S TM
=
2.398
2 S TM
=
5.75
x = 18.55
S TM
=
3.205
2 S TM
=
10.273
Utilizando (4.5) S p =
Así, entonces: t =
(n1 − 1) S 12
+ (n 2 − 1) S 22 = n1 + n2 − 2
(9 − 1)(5.75) + (11 − 1)(10.273) 9 + 11 − 2
83
= 2.875
[ ( x1 − x 2 ) − ( µ 1 − µ 2 )] [ (14.67 − 18.55) − (0)] = = −3.003 1 1 1 1 S p 2.875 + + n1
n2
9
11
-3.003 < -2.552 El valor calculado queda en la región crítica o región de rechazo. Entonces: H0 se rechaza y H1 se acepta. Etapa 5. Conclusión: Se tiene evidencia al nivel de significancia de 0.02 para afirmar que existe diferencia en las temperaturas promedio de la caída de temperatura observada en esos dos terrenos. 4.6.3 Prueba de Hipótesis Para Una Diferencia De Media (muestras pequeñas; 2 2 con σ 1 ≠ σ 2 y desconocidas).
El estadístico de prueba esta dado por: t =
[ ( x1 − x 2 ) − ( µ 1 − µ 2 )] s12 n1
+
s 22
(4.6)
n2
y los grados de libertad se calculan con la fórmula 2
s12 s 22 + n1 n2 ν = 2 2 s12 s 22 n1 + n2 (n1 − 1) (n2 − 1)
(4.7)
Un fabricante de componentes de direcciones hidráulicas compra sellos hidráulicos a dos proveedores. Se seleccionan muestras de los sellos de esos dos proveedores y cada una se prueba para determinar la presión que soporta. Los datos resultantes son los que siguen: Ejercicio 4.6.3.1
PRUEBAS DE HIPÓTESIS
Proveedor I Proveedor II
n1
=
10
x1
n2
= 12
x 2
1350 lb / p lg 2
S 12
= 1338 lb / p lg 2
S 12
=
=
84
100
= 29
Si se supone que los valores de presión que soportan los sellos hidráulicos son variables aleatorias independientes distribuidos normalmente con varianzas diferentes, ¿puede concluirse que existe alguna diferencia en las presiones promedio que soportan los sellos hidráulicos? Utilizar α = 0.05 Etapa 1. H0: µ1 = µ2 H1: µ1 ≠ µ2
α = 0.05
Etapa 2. Etapa 3.
Por el enunciado del problema se trabaja con el estadístico T de la fórmula (4.6) y H1 nos indica que el valor de µ1 sea diferente que µ2 por lo que el nivel de significancia 0.05 se dibuja y reparte a ambos lados de distribución de t. Se utiliza (4.7) para determinar los grados de libertad. 2
2 s12 s 22 100 29 + + n1 n 2 10 12 ν = = = 13.243 2 2 2 2 2 2 s1 s 2 100 29 n n 1 + 2 10 + 12 (10 − 1) (12 − 1) (n1 − 1) (n2 − 1)
se toma ν
Zona o región de rechazo de que
Zona o región de aceptación de que
Zona o región de rechazo de que
µ1 = µ2
µ1 = µ2
µ1 = µ2
- 2.16 Valor crítico
0
2.16
= 13
t Valor crítico
t0.025,13 = 2.16
Etapa 4. Cálculos. Se ocupa (4.6), por los datos dados en el enunciado del problema.
PRUEBAS DE HIPÓTESIS
Entonces: t =
[ ( x1 − x 2 ) − ( µ 1 − µ 2 )] [ (1350 − 1338) − (0)] 2 1
s
n1
+
s
=
2 2
100 10
n2
+
29
=
85
3.405
12
3.405 > 2.16 El valor calculado queda en la región crítica o región de rechazo. Entonces: H0 se rechaza y H1 se acepta. Etapa 5. Conclusión: Se tiene evidencia al nivel de significancia de 0.05 para concluir que existe diferencia en las presiones promedio que soportan los sellos hidráulicos comprados a los dos proveedores. 4.6.4 Prueba de Hipótesis Para Una Diferencia De Medias. (observaciones pareadas)
Esta prueba aparece cuando, por ejemplo, comparamos los pesos de las personas antes y después de un tratamiento para bajar de peso. La aplicación de esta prueba requiere que las unidades que formen la pareja tengan las mismas características como sucede en los casos siguientes: - Los mismos individuos reciben el tratamiento antes y después - Las parejas son gemelos que reciben tratamientos diferentes - Dos partes del mismo material son sometidos a tratamientos distintos Estadístico de prueba: t =
d − ( µ 1
− µ 2 )
S d
⋅
(4.8)
n
ν = n – 1 grados de libertad n .- número de observaciones pareadas; d y S d son el promedio y la desviación estándar de las diferencias de las observaciones pareadas. Las regiones críticas para las hipótesis alternativas apropiadas se establecen utilizando puntos críticos de la distribución t de Student
Ejemplo 4.6.4.1 Cinco personas con exceso de peso se pusieron a dieta durante
tres meses. Fueron observados sus pesos al comienzo y final de la dieta. Estos datos se muestran en la tabla que sigue: Individuo
1
2
3
4
5
PRUEBAS DE HIPÓTESIS
Peso inicial (I) Peso final (F)
295 251
305 259
323 267
299 265
86
310 263
¿Se puede concluir según estos datos que la dieta es efectiva? Tome α = 10% Etapa 1. H0: µI = µF H1: µI > µF Etapa 2.
α = 0.10 Etapa 3. Además de que los datos se presentan pareados observamos que cada dato, en cada par, depende del otro (el peso final depende del peso inicial). Por lo que ocupamos la fórmula (4.8). En esta fórmula tenemos d que es el promedio de las diferencias de los pares de datos, por lo que: Peso inicial (I) Peso final (F) Diferencia
295 251 44
305 259 46
323 267 52
299 265 34
310 263 47
y con estas diferencias se calcula d y S d
d = 44.6 y S d
= 6.618 Grados de libertad ν = n – 1 = 5 – 1 = 4 Zona o región de rechazo de que
Zona o región de aceptación de que µI = µF
0
µI = µF
1.533
t Valor crítico
Etapa 4. Cálculos. Utilizando (4.8)
t0.10,4 = 1.533
PRUEBAS DE HIPÓTESIS
t =
44.6 − (0) 6.618
⋅
5
87
= 15.069
15.069 > 1.533 El valor calculado queda en la región crítica o región de rechazo. Entonces: H0 se rechaza y en consecuencia H1 se acepta. Etapa 5. Conclusión: Según los datos recopilados, la dieta si es efectiva.
4.7 Prueba de hipótesis para la proporción. Para la formulación de una prueba de hipótesis cuando el parámetro a probar es la proporción p (o parámetro binomial), se puede ocupar como estadístico para dicha prueba, la siguiente fórmula: z =
donde:
( x − n. p)
(4.9)
n. p.q
n.- tamaño de la muestra x.- número de éxitos p.- proporción poblacional q = 1- p
Ejemplo 4.7.1 Si 6 de 20 pacientes sufrieron efectos secundarios a causa de un
nuevo medicamento, prueba la hipótesis nula P = 0.5 contra la alternativa P ≠ 0.5 en el nivel 0.01 de significancia. P es la proporción verdadera de pacientes que sufren efectos secundarios serios a causa del nuevo medicamento. Se tiene:
n = 20,
x=6
p = 0.5,
q = 0.5
α = 0.01
Etapa 1. H0: p = 0.5 H1: p ≠ 0.5 Etapa 2.
α = 0.01
Etapa 3. Por los datos dados en éste ejemplo se trabaja con el estadístico z, y H1 nos indica que el valor de p puede ser mayor o menor a 0.5 por lo que el
PRUEBAS DE HIPÓTESIS
88
nivel de significancia para este ejemplo 0.01 se reparte en ambos extremos de la distribución de z, es decir 0.005 de área en cada extremo de la gráfica. Zona o región de rechazo de que p = 0.5
Zona o región de aceptación de que p = 0.5
- 2.575
0
Zona o región de rechazo de que p = 0.5
2.575
Valor crítico
Z Valor crítico
Etapa 4. Cálculos z =
( x − n. p) n. p.q
=
6 − ( 20)(0.5) ( 20)(0.5)(0.5)
= −1.789
-1.789 > -2.575 El valor calculado queda en la región de aceptación. Entonces: H0 no se puede rechazar y en consecuencia H 1 se rechaza. Etapa 5. Conclusión: La proporción de pacientes que sufrieron efectos secundarios a causa de un nuevo medicamento no se puede indicar que no sea de 0.5.
4.8 Prueba de hipótesis para la diferencia de proporciones.
PRUEBAS DE HIPÓTESIS
89
Con frecuencia surgen situaciones en donde se desea probar la hipótesis de que dos proporciones son iguales. Por ejemplo, una persona puede dejar de fumar sólo si se convence de que la proporción de fumadores con cáncer pulmonar excede la proporción de no fumadores que padecen del mismo problema. En general, se desea probar la hipótesis nula de que dos proporciones, o parámetros binomiales, son iguales. Esto es, está probándose que p 1 = p2 en contraposición a las alternativas p 1 < p2, p1 > p2 ó p1 ≠ p2. El estadístico sobre el cual se basa la decisión es la variable aleatoria p 1 − p 2 , el cual se distribuye en forma aproximadamente normal. Se seleccionan al azar muestras independientes de tamaños n 1 y n 2 de dos poblaciones ∧
∧
binomiales y se calculan las proporciones de éxito
∧
p 1
=
x1 n1
∧
y p 2
=
x 2 n2
para ambas
muestras. También se calcula una estimación de la proporción combinada: P =
x1 + x2 n1 + n 2
y Q = 1 - P
(4.10)
Donde x1 y x2 son el número de “éxitos” en cada una de las dos muestras. El valor de z para probar Ho : P1 = P2 queda dado por: ∧
Z =
∧
( p1 − p 2 )
1 1 + n 1 n2
PQ
(4.11)
Las regiones críticas para las hipótesis alternativas apropiadas se establecen utilizando puntos críticos de la curva normal estándar
Ejemplo 4.8.1 En un estudio para estimar la proporción de residentes de una
ciudad y sus suburbios que están de acuerdo con la construcción de una planta de energía nuclear, se encontró que 38 de 100 residentes urbanos no favorecen la construcción mientras que 58 de 125 residentes suburbanos se oponen ¿ Existe alguna diferencia significativa entre las proporciones de residentes urbanos y suburbanos que favorecen la construcción de la planta nuclear? α = 0.05 Residentes urbanos RU;
residentes suburbanos SU
PRUEBAS DE HIPÓTESIS
90
Etapa 1. H0: PRU = PSU H1: PRU ≠ PSU Etapa 2.
α = 0.05 Etapa 3. Por los datos dados en éste ejemplo se trabaja con (4.11). H 1 nos indica que el valor de P RU puede ser mayor o menor que P SU por lo que el nivel de significancia 0.05 se reparte en ambos extremos de la distribución de z, es decir 0.025 de área en cada extremo de la gráfica. Zona o región de rechazo de que
Zona o región de aceptación de que
Zona o región de rechazo de que
PRU = PSU
PRU = PSU
PRU = PSU
0
- 1.96
Z
1.96
Valor crítico
Valor crítico
Etapa 4. Cálculos Determinamos las proporciones de éxito
∧
p1
=
x1 n1
∧
y p 2
=
x 2 n2
en las muestras.
Se define el éxito x como los residentes que favorecen la construcción de la planta nuclear. Así: n RU
= 100
x RU
= 62
∧
p RU
=
62 100
= 0.62
y
n SU
= 125
x SU
= 67
∧
p SU
También se requiere de la estimación de la proporción combinada: P =
x1
+
x 2
n1
+
n2
=
62 + 67 100 + 125
=
0.573
y Q = 1 – 0.573 = 0.427
Se puede aplicar ya la fórmula (4.11)
=
67 125
= 0.536
PRUEBAS DE HIPÓTESIS ∧
∧
( p1 − p 2 )
Z =
1 1 + n 1 n2
PQ
(0.62 − 0.536)
=
+ 100 125
(0.573)(0.427)
1
1
91
= 1.266
1.266 < 1.96 El valor calculado queda en la región de aceptación por lo que H 0 no se puede rechazar, se acepta, y entonces H1 se rechaza. Etapa 5. Conclusión: No se puede concluir que exista alguna diferencia significativa entre las proporciones de residentes urbanos y suburbanos que favorecen la construcción de la planta nuclear.
4.9 Prueba de hipótesis para la varianza. Para la formulación de una prueba de hipótesis cuando el parámetro a probar es la varianza σ2, se ocupa como estadístico para dicha prueba: χ
2
=
( n − 1) S 2 σ
2
(4.12)
Las regiones críticas para las hipótesis alternativas apropiadas se establecen utilizando puntos críticos de la distribución chi-cuadrada. Se sabe que el contenido de nicotina de una marca de cigarrillos tiene distribución normal con varianza de 1.3 miligramos. Pruebe la hipótesis de que σ 2 = 1.3 , si una muestra aleatoria de 8 de estos cigarrillos tiene una desviación estándar S = 1.8. Use α = 5% Ejemplo 4.9.1
Etapa 1. H0:
σ
H1:
σ
2 2
= 1.3 ≠ 1.3
Etapa 2.
α = 0.05
PRUEBAS DE HIPÓTESIS
92
Etapa 3. Por los datos dados en éste ejemplo se trabaja con el estadístico Se acepta que S
χ
2
Se rechaza que S
2
0
χ
3.28
Valor crítico
χ 0.05,7 = 2
14.1
Etapa 4. Cálculos. Utilizando (4.12) χ
2
=
( n − 1) S 2 σ
2
=
(8 − 1)(1.8 2 ) 1.3
= 17.446
17.446 > 14.1 El valor calculado queda en la región crítica o región de rechazo. Entonces: H0 se rechaza y en consecuencia H1 se acepta. Etapa 5. Conclusión: Se rechaza la hipótesis de que la varianza del contenido de nicotina de esos cigarrillos sea igual a 1.3
4.10 Prueba de hipótesis para la relación de varianzas. Consideremos el querer probar la igualdad de las varianzas σ 12 y σ 22 de dos poblaciones. Esto es, debe probarse la hipótesis nula H 0 de que σ 12 = σ 22 en contraposición de una de las alternativas conocidas. Para muestras aleatorias independientes de tamaños n 1 y n2, tomadas de dos poblaciones, el estadístico para la prueba es: f =
S 12 S 22
(4.13)
donde S 12 y S 22 son las varianzas calculadas a partir de las dos muestras, de las dos poblaciones en estudio.
PRUEBAS DE HIPÓTESIS
93
Se comparó la eficiencia de dos tipos de aceites para evitar el desgaste en ciertas piezas sometidas a intenso trabajo. En trece piezas se utilizó el aceite 1 y en otras trece el aceite 2. Las varianzas muestrales fueron S 12 = 64, S 22 = 16 . Pruebe la hipótesis nula según la cual las varianzas de las dos poblaciones son iguales. Considere α = 5% Ejemplo 4.10.1
Etapa 1. H0: H1:
2
σ 1
2
σ 1
= σ 22 ≠ σ 22
Etapa 2.
α = 0.05 Etapa 3. Por los datos dados en éste ejemplo se trabaja con el estadístico f S Se rechaza que
S Se acepta que
S Se rechaza que
f 0
0.3049
3.28
Valor crítico
Valor crítico
f 0.025(12,12)= 3.28 0.975(12,12)= 0.3049
Etapa 4. Cálculos. Utilizando (4.13) f =
S 12 2 2
S
=
64 16
=
4
4.0 > 3.28 El valor calculado queda en la región crítica o región de rechazo. Entonces: H0 se rechaza y en consecuencia H1 se acepta. Etapa 5. Conclusión: Se rechaza la hipótesis de que las varianzas de las dos poblaciones son iguales.