UNIDAD
3
Pruebas de Hipótesis
OBJETIVO EDUCACIONAL Al término de esta esta unidad el alumno:
Identificará y aplicará los conceptos básicos de una prueba de hipótesis. Identificará los diferentes fenómenos que se presentan en una prueba de hipótesis Identificará y analizará cuáles son los posibles fenómenos que se pueden analizar a través de una prueba de hipótesis
3.1 Introducción Como se expuso en el capítulo 9, a menudo el problema al que se enfrentan el científico o el ingeniero no es tanto la estimación de un parámetro de la población, sino la formación de un procedimiento de decisión que se base en los datos y que pueda producir una conclusión acerca de algún sistema científico. Por ejemplo, un investigador médico puede decidir con base en evidencia experimental si beber café incrementa el riesgo de cáncer en los seres humanos; un ingeniero quizá tenga que decidir con base en datos muestrales si hay una diferencia entre la precisión de un tipo de medidor y la de otro; o tal vez un sociólogo desee reunir los datos apropiados que le permitan decidir si el tipo de sangre y el color de ojos de un individuo son variables independientes. En cada uno de estos casos el científico o el ingeniero postulan o conjeturan algo acerca de un sistema. Además, cada uno debe utilizar da tos experimentales experimentales y tomar decisiones basadas en ellos. En cada caso la conjetura se puede expresar en forma de hipótesis estadística. estadística.
Los procedimientos procedimientos que conducen a la aceptación o al rechazo rechazo de
hipótesis estadísticas como éstas comprenden un área importante de la inferencia estadística. Empecemos por definir con precisión lo que entendemos por hipótesis estadística.
1
Estadística Inferencial I __________________________________________________________________
Hipótesis Estadística. Es una afirmación o conjetura respecto a una o más poblaciones. Hipótesis Nula. Establece que no hay diferencia significativa entre el valor supuesto y el valor verdadero del parámetro, se representa por H 0 :
0.
Hipótesis Alternativa. El rechazo de la hipótesis nula da como resultado la aceptación de una hipótesis alternativa, que se representa por H 1 y que admite la posibilidad de que el verdadero
valor del parámetro sea diferente, mayor que o menor que el valor supuesto
0.
3.2 Confiabilidad y significancia Confiabilidad o nivel de confianza (1- α). En estadística, la probabilidad que asociamos con una estimación de intervalo se conoce como nivel de confianza . Esta probabilidad indica qué tanta confianza tenemos de que la estimación de intervalo incluya al parámetro de población.
Interpretación del nivel de significancia (α). El propósito de la prueba de hipótesis no es cuestionar el valor calculado del estadístico de la muestra, sino hacer un juicio respecto a la diferencia entre ese estadístico y un parámetro hipotético de la población. El siguiente paso después de establecer las hipótesis nula y alternativa, entonces, consiste en decidir qué criterio utilizar para confirmar si se acepta o se rechaza la hipótesis nula.
3.3 Errores tipo I y tipo II Error tipo I.
Consiste en rechazar la hipótesis nula cuando es verdadera.
P(Error Tipo I ) = Error Tipo II.
Consiste en aceptar la hipótesis nula cuando en realidad es falsa.
P(Error Tipo II ) = 3.4 Potencia de la prueba La potencia de una prueba se define como la probabilidad de NO cometer Error Tipo II.
Potencia 1 P ( Error tipoI I ) 1
2
José Armando Rodríguez Romo
____________________________________________________________________ Pruebas de Hipótesis
Procedimiento general Para Pruebas de Hipótesis i. Establecer las Hipótesis Nula y Alternativa. ii. Seleccionar el Estadístico de Prueba adecuado. iii. Establecer la Regla de Decisión para el nivel de significancia seleccionado ( ). iv. Evaluar el estadístico de prueba para los valores observados en la muestra. v. Tomar una Decisión: Rechazar o No rechazar la hipótesis Nula. vi. Conclusión: escribir en lenguaje común la consecuencia del rechazo o no rechazo de la hipótesis nula.
3.5 Formulación de Hipótesis Estadísticas. Pruebas Bilaterales y Unilaterales i) Pruebas de dos Extremos: Región de
H 0
:
0
Región de Aceptación
vs
H 1
:
0
Regi ón de
rechazo
rechazo
Regla de Decisión
Regla de decisión: 1-
x R echazar H 0 si
Rechazar H
ó x
/ 2
C 2
/2
C 1
0
C 2
ii) Pruebas de Extremo Izquierdo: Región de
C 1
H 0
:
0
vs
H 1
:
0
Región de Aceptación
rechazo
Regla de Decisión
Regla de decisión: 1Rechazar H 0 si x
Rechazar H
C 1
José Armando Rodríguez Romo
C 1
0
3
Estadística Inferencial I __________________________________________________________________
H 0
iii) Pruebas de Extremo derecho: Región de Aceptación
:
vs
0
H 1
:
0
Regi ón de rechazo
Regla de decisión:
Regla de Decisión
1Rechazar H 0 si x C 2
Rechazar H / 2
C 2
0
Procedimientos de Pruebas de Hipótesis de un Parámetro 3.6 Prueba de hipótesis para la media 3.6.1 Pruebas Relacionadas con la Media. Con
Conocida
Ejemplo 3.2 Una empresa eléctrica fabrica focos que tienen una duración que está distribuida aproximadamente en forma normal con una media de 800 horas y una desviación estándar de 800 horas en contraposición de la alternativa de que
40 horas. Pruebe la hipótesis de que
800 horas, si una muestra aleatoria de 30 focos tiene una duración promedio de 788 horas.
Utilice un nivel de significancia de 0.04.
Solución
1) H ipótesis H 0 :
800
H 1 :
800
2) E stadístico de prueba: 3) Regla de decisión para
z 0
x
0.04 .
0
/ n De la Tabla 1, z / 2
Rechazar H 0 si z 0
2.05
ó
2.05 z 0
2.05
4) E valuar el estadístico de prueba:
4
José Armando Rodríguez Romo
____________________________________________________________________ Pruebas de Hipótesis
z 0
x
0
/ n
788
800
1.643
40 / 30
5) Tomar una decisión: como z 0
es mayor de
1.643
2.05
pero menor que 2.05
NO Se Rechaza H0 6) Conclusión: La evidencia de la muestra apoya la hipótesis de que la duración promedio de los focos producidos por este fabricante es de 800 horas.
3.6.2 Pruebas Relacionadas con la Media. Con
Desconocida
Ejemplo 3.3 Pruebe la hipótesis de que el contenido promedio en recipientes de un lubricante en particular es de 10 litros si los contenidos de una muestra aleatoria de 10 recipientes son
10.2, 9.7, 10.1, 10.3, 10.1, 9.8, 9.9. 10.4, 10.3 y 9.8 litros. Utilice un nivel de significancia de 0.01 y suponga que: la distribución de los contenidos es normal.
Solución
1) H ipótesis H0
:
H1
:
10
(El contenido promedio de los recipientes es de 10 litros)
10
(El contenido promedio de los recipientes NO es de 10 litros)
2) E stadístico de prueba:
t 0
3) Regla de decisión para
x
s /
0.01 y
0
n
con v = n -1 grados de libertad
v = 10 -1= 9 gl. De la Tabla 3,
Rechazar H 0 si t 0
3 25
.
ó
t 0
t 0 005 9 .
3 25 .
,
3 25
.
4) E valuar el estadístico de prueba para los valores de la muestra: n = 10, s
x
10.06
0. 2458
t 0
x
s /
10.06
0
n
5) Tomar una decisión: como t 0
José Armando Rodríguez Romo
0. 2458 /
0.7719
10 10
0.7719
No es mayor de 3.25 NO S e Rechaza H0
5
y
Estadística Inferencial I __________________________________________________________________
6) Conclusión: La evidencia de la muestra apoya la hipótesis de que el contenido promedio de los recipientes de este lubricante es de 10 litros.
3.10 Prueba de hipótesis para la varianza Ejemplo 3.4 Se sabe que el contenido de los recipientes de un determinado lubricante tiene 2
distribución normal con una varianza de 0.03 litros2. Pruebe la hipótesis de que 2
contraposición a la alternativa de que
0.03 en
0.03 litros2, si los contenidos de una muestra
aleatoria de 10 recipientes son 10.2, 9.7, 10.1, 10.3, 10.1, 9.8, 9.9. 10.4, 10.3 y 9.8 litros. Utilice un nivel de significancia de 0.01 y suponga que: la distribución de los contenidos es normal.
Solución
1) H ipótesis H0
:
H1
:
2
2
0.03
(la varianza del contenido de los recipientes es de 0.03 litros2)
0.03
(la varianza del contenido de los recipientes NO es de 0.03 litros2)
2) E stadístico de prueba: 3) Regla de decisión para 0 995 9 .
( n
2 0
1 ) S 2
con v = n -1 grados de libertad
2 0
0.01
y v = 10 -1= 9 gl . De la Tabla 2,
0 005 9 .
1 73
,
.
y
23 59 .
,
Rechazar H 0 si
0
1.73
ó
0
23 59
.
4) E valuar el estadístico de prueba para los valores de la muestra: n = 10, y s (n 1) S 2
0
9 * (0. 2458)
2
2
0.03
0
5) Tomar una decisión: como
0
0. 2458
2
18.1256
18.1253
No es mayor de 23.59, Ni menor de 1.73 NO
Se Rechaza H0 6) Conclusión: La evidencia de la muestra apoya la hipótesis de que la varianza del contenido de los recipientes es de 0.03 litros2.
6
José Armando Rodríguez Romo
____________________________________________________________________ Pruebas de Hipótesis
3.8 Prueba de hipótesis para la proporción Ejemplo 3.5 Suponga que, en el pasado, 40% de todos los adultos favorecía la pena capital. ¿Se tiene alguna razón para creer que la proporción de adultos que favorece la pena capital hoy en día ha aumentado si, en una muestra aleatoria de 150 adultos, 80 la favorecen? Utilice un nivel de significancia de 0.05.
Solución
2) H ipótesis H0
:
P
H1
:
P
0.40 (40% de todos los adultos favorecía la pena capital) 0.40 (más del
2) E stadístico de prueba:
40% de adultos favorece la pena capital hoy en día) z 0
x / n
P0
P0 ( 1
P0 )
n
3) Regla de decisión para
0.05 :
de la Tabla 1, z 0.05
Rechazar H 0 si z 0
1.645
1.645
4) E valuar el estadístico de prueba para los valores de la muestra: n = 150, y x = 80
z 0
x / n
P0 (1
80
P0 P0 )
150
0.4 * (1
0.40
0.4)
3. 3333
150
n
5) Tomar una decisión: como z 0
3. 3333
es mayor de 3.3333 S e Rechaza H0
6) Conclusión: La evidencia de la muestra apoya la hipótesis de que proporción de adultos que favorece la pena capital hoy en día ha aumentado, más del 40% de los adultos favorece la pena capital.
3.7 Prueba de hipótesis para la diferencia de medias Ejemplo 3.6. (
1
y
2 conocidas)
Un diseñador de productos está interesado en reducir el
tiempo de secado de una pintura tapaporos. Se prueban dos fórmulas de pintura; la fórmula 1
José Armando Rodríguez Romo
7
Estadística Inferencial I __________________________________________________________________
tiene el contenido químico estándar, y la fórmula 2 tienen un nuevo ingrediente secante que debe de reducir el tiempo de secado. De la experiencia se sabe que la desviación estándar del tiempo de secado es 8 minutos, y esta variabilidad inherente no debe verse afectada por la adición del nuevo ingrediente. Se pintan 10 especimenes con la fórmula 1, y otros 10 con la fórmula 2. Los dos tiempos promedio de secado son x 1
121 min
y x 2
112 min , respectivamente. ¿A
qué conclusiones puede llegar el diseñador del producto sobre la eficacia del nuevo ingrediente, utilizando
0 05 ? .
Solución 1)
2)
3)
H ipótesis H0 :
1
2
H1 :
1
2
0
(el tiempo promedio de secado es mismo para las dos fórmulas)
0
(el nuevo ingrediente disminuye el tiempo promedio de secado)
E stadístico de prueba:
Regla de decisión para Rechazar H 0 si z 0
4)
x 1
z 0
0 05 . .
x 2
d 0
2 1
2 2
n1
n 2
De la Tabla 1, z
/ 2
1.645
1 645 .
E valuar el estadístico de prueba: 121
z 0
112 2
( 8)
10
5) Tomar una decisión: como z 0
2 52 .
0 2
2. 52
(8)
10
es mayor de 1.645 Se Rechaza H 0
6) Conclusión: La evidencia de la muestra apoya la hipótesis de que el nuevo ingrediente disminuye el tiempo promedio de secado.
Ejemplo 3.7
(
1
y
2
desconocidas, n1 y n 2 < 30) Los siguientes datos representan los
tiempos de duración de las películas producidas por 2 compañías cinematográficas:
Compañía
8
Tiempo (minutos)
José Armando Rodríguez Romo
____________________________________________________________________ Pruebas de Hipótesis
1
102
86
98
109 92
2
81
165
97
134 92
Pruebe la hipótesis de que 2 1
suponiendo que
2 2
1
2
0
87
114
en contraposición a la alternativa
1
2
0,
. Utilice un nivel de significancia de 0.02.
Solución 1) H ipótesis H0 :
1
H1 :
1
0
2
2
0
(El tiempo promedio de duración es mismo para las dos compañías) (El tiempo promedio de duración es diferente para las dos compañías)
2) E stadístico de prueba:
( x 1 x 2 ) d 0
t 0
S p 3)
1 n1
1 n 2
con
v
n1
n 2
2 gl
donde ( n1 1 ) S 21 ( n 2 1 ) S 2 2 n1 n 2 2
S p 4) Regla de decisión para Rechazar H 0 si t 0
0.02 y v
2.76
o
t 0
n1
n 2
2 = 5 +7 - 2 = 10 de
7 ; x 2
S p
110.0 ; s 2
2.76 :
2.76
5) E valuar el estadístico de prueba para: n1 5 ; x 1 n 2
la Tabla 3, t / 2
97 .4 ; s1
8.8769 ; y
30. 2214
( 4 * 8.8769 2 6 * 30. 2214 2 ) 24.0732 10
5) Tomar una decisión: como t 0
0.8939
y
t 0
97 .4 110 0 24.0732*
1 5
1
0.8939
7
es mayor de -2.76 pero menor que + 2.76 NO se
Rechaza H 0. 6) Conclusión: La evidencia de las muestra apoya la hipótesis de que el tiempo promedio de duración es el mismo para las dos compañías. Ejemplo 3.8
(Observaciones pareadas) Los siguientes datos son las horas-hombre que
semanalmente se pierden en promedio por accidentes en 10 plantas industriales antes y después de que se implantará cierto programa de seguridad. Utilice un nivel de significancia,
0 05 .
para probar si el programa de seguridad es eficaz.
José Armando Rodríguez Romo
9
Estadística Inferencial I __________________________________________________________________
Planta Antes Después Diferencia, d i
1 45 36 9
2 73 60 13
3 46 44 2
4 124 119 5
5 33 35 -2
6 57 51 6
7 83 77 6
8 34 29 5
9 26 24 2
10 17 11 6
Solución 1) H ipótesis H0
:
d
0 (Las horas-hombre que se pierden en promedio por accidentes en plantas
industriales antes y después de cierto programa de seguridad son iguales) H1
:
d
0 (Las horas-hombre que se pierden en promedio por accidentes en plantas
industriales disminuyeron después de cierto programa de seguridad) 2) E stadístico de prueba:
d d 0
t 0
3) Regla de decisión para
S d / n
0 05 y .
v = 10 – 1 = 9 gl. De la Tabla 3,
Rechazar H 0 si t 0 4) E valuar el estadístico de prueba para: n = 10, t 0
d d 0
5. 2
S d /
5) Tomar una decisión: como t 0
n
0 10
.
1 83 .
,
1.83
d 5. 2
4.0770 /
4.0333
t 0 05 9
y Sd = 4.0770 4.0333
es mayor de 1.83 S e Rechaza H 0
6) Conclusión: La evidencia de la muestra apoya la hipótesis de que las horas-hombre que se pierden en promedio por accidentes en plantas industriales disminuyeron después de cierto programa de seguridad.
10
José Armando Rodríguez Romo
____________________________________________________________________ Pruebas de Hipótesis
3.9 Prueba de hipótesis para la diferencia de proporciones Ejemplo 3.9 Se evalúan dos tipos diferentes de soluciones para pulir, para su posible uso en una operación de pulido en la fabricación de lentes intraoculares utilizados en el ojo humano después de una cirugía de cataratas. Se pulen 300 lentes con la primera solución y, de estos, 253 no presentaron defectos inducidos por el pulido. Después se pulen otros 300 lentes con la segunda solución, de los cuales 196 resultan satisfactorios. ¿Existe alguna razón para creer que las dos soluciones son diferentes? Utilice un nivel de significancia,
0.01 .
Solución
2) H ipótesis H0
:
P1
P 2
H1
:
P1
P 2
0
(Las dos soluciones para pulir son iguales)
0
(Las dos soluciones para pulir son diferentes)
2) E stadístico de prueba:
p1 p 2 ˆ
z 0
pq [( 1 / n1 ) ( 1 / n 2 )] ˆ
donde p ( x 1 x 2 ) /(n1 n 2 )
ˆ
y
ˆ
3) Regla de decisión para
0.01 .
q
1 p
ˆ
ˆ
De la Tabla 1, z / 2
Rechazar H 0 si z 0
2 575
.
4) E valuar el estadístico de prueba para: p ˆ
z 0
d 0
ˆ
253 300
2. 575
ó z 0
2 575
.
253 196 q 1 0.7483 0. 2517 0.7483 y 300 300
ˆ
196 300 1 1 300 300
5. 3619
0.7483(0. 2517 )
5) Tomar una decisión: como z 0 5. 3619
es mayor de 2.575 Se Rechaza H 0
6) Conclusión: La evidencia de las muestras apoya la hipótesis de que las dos soluciones para pulir son diferentes. La primera solución produce una fracción significativamente mayor de lentes no defectuosos.
José Armando Rodríguez Romo
11
Estadística Inferencial I __________________________________________________________________
3.11 Prueba de hipótesis para la relación de varianzas. Ejemplo 3.10 Los siguientes datos representan los tiempos de duración de las películas producidas por 2 compañías cinematográficas:
Compañía 1
102
86
98
109 92
2
81
165
97
134 92
2
Pruebe la hipótesis de que 2 1
y
2 2
Tiempo (minutos)
1
2
2
87
114
en contraposición a la alternativa
2 1
2 2
, donde
son las variancias para los tiempos de duración de las películas producidas por las
compañías 1 y 2, respectivamente. Utilice un nivel de significancia de 0.02.
Solución
1) H ipótesis H0
2
:
1
2 2
(Las variancias para los tiempos de duración de las películas producidas por las compañías 1 y 2, son iguales)
H1
2
:
1
2 2
(Las variancias para los tiempos de duración de las películas producidas por las compañías 1 y 2, son diferentes)
2) E stadístico de prueba:
f 0 3) Regla de decisión para
f v v 21 ,
/ 2
1 6 4 , 0.99
f
S 21 S 2 2
0.02 .
1 15. 2
con v 1= n1 -1 y v 2= n 2 -1 grados de libertad
De la Tabla 5,
0.06579
Rechazar H0 si f 0
f 0 f v v 21 ,1
y
0.06579 ó si f 0
f 64 ,0.99 9.15
/ 2
9.15
4) E valuar el estadístico de prueba para: n1 = 5, S 1= 8.8769 y n 2 = 7, S 2= 30.2214
f 0 5) Tomar una decisión: como f 0
S 21 S 2 2
(8.8769) 2 ( 30. 2214) 2
0.0863
0.0863 es mayor de 0.06579 pero menor de 9.15 NO se
Rechaza H 0 6) Conclusión: La evidencia de las muestras apoya la hipótesis de que las variancias para los tiempos de duración de las películas producidas por las compañías 1 y 2, son iguales.
12
José Armando Rodríguez Romo