Unidad 3 Pruebas de Hipótesis.pdf

UNIDAD

3

Pruebas de Hipótesis

OBJETIVO EDUCACIONAL Al término de esta esta unidad el alumno: 





Identificará y aplicará los conceptos básicos de una prueba de hipótesis. Identificará los diferentes fenómenos que se presentan en una prueba de hipótesis Identificará y analizará cuáles son los posibles fenómenos que se pueden analizar a través de una prueba de hipótesis

3.1 Introducción Como se expuso en el capítulo 9, a menudo el problema al que se enfrentan el científico o el ingeniero no es tanto la estimación de un parámetro de la población, sino la formación de un procedimiento de decisión que se base en los datos y que pueda producir una conclusión acerca de algún sistema científico. Por ejemplo, un investigador médico puede decidir con base en evidencia experimental si beber café incrementa el riesgo de cáncer en los seres humanos; un ingeniero quizá tenga que decidir con base en datos muestrales si hay una diferencia entre la precisión de un tipo de medidor y la de otro; o tal vez un sociólogo desee reunir los datos apropiados que le permitan decidir si el tipo de sangre y el color de ojos de un individuo son variables independientes. En cada uno de estos casos el científico o el ingeniero postulan o conjeturan algo acerca de un sistema. Además, cada uno debe utilizar da tos experimentales experimentales y tomar decisiones basadas en ellos. En cada caso la conjetura se puede expresar en forma de hipótesis estadística. estadística.

Los procedimientos procedimientos que conducen a la aceptación o al rechazo rechazo de

hipótesis estadísticas como éstas comprenden un área importante de la inferencia estadística. Empecemos por definir con precisión lo que entendemos por hipótesis estadística.

1

Estadística Inferencial I __________________________________________________________________

Hipótesis Estadística. Es una afirmación o conjetura respecto a una o más poblaciones. Hipótesis Nula. Establece que no hay diferencia significativa entre el valor supuesto y el valor verdadero del parámetro, se representa por H 0 :

0.

Hipótesis Alternativa. El rechazo de la hipótesis nula da como resultado la aceptación de una hipótesis alternativa, que se representa por H 1 y que admite la posibilidad de que el verdadero

valor del parámetro sea diferente, mayor que o menor que el valor supuesto

0.

3.2 Confiabilidad y significancia Confiabilidad o nivel de confianza (1- α). En estadística, la probabilidad que asociamos con una estimación de intervalo se conoce como nivel de confianza . Esta probabilidad indica qué tanta confianza tenemos de que la estimación de intervalo incluya al parámetro de población.

Interpretación del nivel de significancia (α). El propósito de la prueba de hipótesis no es cuestionar el valor calculado del estadístico de la muestra, sino hacer un juicio respecto a la diferencia entre ese estadístico y un parámetro hipotético de la población. El siguiente paso después de establecer las hipótesis nula y alternativa, entonces, consiste en decidir qué criterio utilizar para confirmar si se acepta o se rechaza la hipótesis nula.

3.3 Errores tipo I y tipo II Error tipo I.

Consiste en rechazar la hipótesis nula cuando es verdadera.

P(Error Tipo I ) = Error Tipo II.

Consiste en aceptar la hipótesis nula cuando en realidad es falsa.

P(Error Tipo II ) = 3.4 Potencia de la prueba La potencia de una prueba se define como la probabilidad de NO cometer Error Tipo II.

Potencia 1 P ( Error tipoI I ) 1 

2







José Armando Rodríguez Romo

____________________________________________________________________ Pruebas de Hipótesis

Procedimiento general Para Pruebas de Hipótesis i. Establecer las Hipótesis Nula y Alternativa. ii. Seleccionar el Estadístico de Prueba adecuado. iii. Establecer la Regla de Decisión para el nivel de significancia seleccionado ( ). iv. Evaluar el estadístico de prueba para los valores observados en la muestra. v. Tomar una Decisión: Rechazar o No rechazar la hipótesis Nula. vi. Conclusión: escribir en lenguaje común la consecuencia del rechazo o no rechazo de la hipótesis nula.

3.5 Formulación de Hipótesis Estadísticas. Pruebas Bilaterales y Unilaterales i) Pruebas de dos Extremos: Región de

H 0

:

0

Región de Aceptación

vs

H 1

:

0

Regi ón de

rechazo

rechazo

Regla de Decisión

Regla de decisión: 1-

x R echazar H 0 si

Rechazar H

ó x

/ 2

C 2

/2

C 1

0

C 2

ii) Pruebas de Extremo Izquierdo: Región de

C 1

H 0

:

0

vs

H 1

:

0

Región de Aceptación

rechazo

Regla de Decisión

Regla de decisión: 1Rechazar H 0 si x

Rechazar H

C 1


C 1

0

3


H 0

iii) Pruebas de Extremo derecho: Región de Aceptación

:

vs

0

H 1

:

0

Regi ón de rechazo

Regla de decisión:

Regla de Decisión

1Rechazar H 0 si x C 2

Rechazar H / 2

C 2

0

Procedimientos de Pruebas de Hipótesis de un Parámetro 3.6 Prueba de hipótesis para la media 3.6.1 Pruebas Relacionadas con la Media. Con

Conocida

Ejemplo 3.2 Una empresa eléctrica fabrica focos que tienen una duración que está distribuida aproximadamente en forma normal con una media de 800 horas y una desviación estándar de 800 horas en contraposición de la alternativa de que

40 horas. Pruebe la hipótesis de que

800 horas, si una muestra aleatoria de 30 focos tiene una duración promedio de 788 horas.

Utilice un nivel de significancia de 0.04.

Solución

1) H ipótesis H 0 :

800

H 1 :

800

2) E stadístico de prueba: 3) Regla de decisión para

z 0

x

0.04 .

0

/ n De la Tabla 1, z / 2

Rechazar H 0 si z 0

2.05

ó

2.05 z 0

2.05

4) E valuar el estadístico de prueba:

4



z 0

x

0

/ n

788

800

1.643

40 / 30

5) Tomar una decisión: como z 0

es mayor de

1.643

2.05

pero menor que 2.05

NO Se Rechaza H0 6) Conclusión: La evidencia de la muestra apoya la hipótesis de que la duración promedio de los focos producidos por este fabricante es de 800 horas.

3.6.2 Pruebas Relacionadas con la Media. Con

Desconocida

Ejemplo 3.3 Pruebe la hipótesis de que el contenido promedio en recipientes de un lubricante en particular es de 10 litros si los contenidos de una muestra aleatoria de 10 recipientes son

10.2, 9.7, 10.1, 10.3, 10.1, 9.8, 9.9. 10.4, 10.3 y 9.8 litros. Utilice un nivel de significancia de 0.01 y suponga que: la distribución de los contenidos es normal.

Solución

1) H ipótesis H0

:



H1

:



10

(El contenido promedio de los recipientes es de 10 litros)

10

(El contenido promedio de los recipientes NO es de 10 litros)

2) E stadístico de prueba:

t 0

3) Regla de decisión para



x 



s /

0.01 y

0

n

con v = n -1 grados de libertad

v = 10 -1= 9 gl. De la Tabla 3,

Rechazar H 0 si t 0

  3 25

.

ó

t 0

t 0 005 9 .



3 25 .

,

 3 25

.

4) E valuar el estadístico de prueba para los valores de la muestra: n = 10, s



x



10.06

0. 2458

t 0

x 



s /

10.06

0

n



5) Tomar una decisión: como t 0




0. 2458 /



0.7719

10 10



0.7719

No es mayor de 3.25 NO S e Rechaza H0

5

y


6) Conclusión: La evidencia de la muestra apoya la hipótesis de que el contenido promedio de los recipientes de este lubricante es de 10 litros.

3.10 Prueba de hipótesis para la varianza Ejemplo 3.4 Se sabe que el contenido de los recipientes de un determinado lubricante tiene 2

distribución normal con una varianza de 0.03 litros2. Pruebe la hipótesis de que 2

contraposición a la alternativa de que





0.03 en

0.03 litros2, si los contenidos de una muestra

aleatoria de 10 recipientes son 10.2, 9.7, 10.1, 10.3, 10.1, 9.8, 9.9. 10.4, 10.3 y 9.8 litros. Utilice un nivel de significancia de 0.01 y suponga que: la distribución de los contenidos es normal.

Solución

1) H ipótesis H0

:

H1

:

2 

2



0.03

(la varianza del contenido de los recipientes es de 0.03 litros2)

0.03

(la varianza del contenido de los recipientes NO es de 0.03 litros2)

2) E stadístico de prueba: 3) Regla de decisión para 0 995 9 .



( n

2 0



1 ) S 2

con v = n -1 grados de libertad

2 0

0.01

y v = 10 -1= 9 gl . De la Tabla 2,

0 005 9 .



1 73

,

.

y

23 59 .

,

Rechazar H 0 si

0



1.73

ó

0

 23 59

.

4) E valuar el estadístico de prueba para los valores de la muestra: n = 10, y s (n 1) S 2

0

9 * (0. 2458)



2 

2



0.03

0

5) Tomar una decisión: como

0





0. 2458

2 

18.1256

18.1253

No es mayor de 23.59, Ni menor de 1.73 NO

Se Rechaza H0 6) Conclusión: La evidencia de la muestra apoya la hipótesis de que la varianza del contenido de los recipientes es de 0.03 litros2.

6



3.8 Prueba de hipótesis para la proporción Ejemplo 3.5 Suponga que, en el pasado, 40% de todos los adultos favorecía la pena capital. ¿Se tiene alguna razón para creer que la proporción de adultos que favorece la pena capital hoy en día ha aumentado si, en una muestra aleatoria de 150 adultos, 80 la favorecen? Utilice un nivel de significancia de 0.05.

Solución

2) H ipótesis H0

:

P

H1

:

P





0.40 (40% de todos los adultos favorecía la pena capital) 0.40 (más del


40% de adultos favorece la pena capital hoy en día) z 0

x / n

P0

P0 ( 1

P0 )

n




0.05 :

de la Tabla 1, z 0.05

Rechazar H 0 si z 0





1.645

1.645

4) E valuar el estadístico de prueba para los valores de la muestra: n = 150, y x = 80

z 0

x / n 



P0 (1



80

P0 P0 )

150 

0.4 * (1

0.40



0.4)



3. 3333

150

n






3. 3333

es mayor de 3.3333 S e Rechaza H0

6) Conclusión: La evidencia de la muestra apoya la hipótesis de que proporción de adultos que favorece la pena capital hoy en día ha aumentado, más del 40% de los adultos favorece la pena capital.

3.7 Prueba de hipótesis para la diferencia de medias Ejemplo 3.6. (

1

y

2 conocidas)

Un diseñador de productos está interesado en reducir el

tiempo de secado de una pintura tapaporos. Se prueban dos fórmulas de pintura; la fórmula 1


7


tiene el contenido químico estándar, y la fórmula 2 tienen un nuevo ingrediente secante que debe de reducir el tiempo de secado. De la experiencia se sabe que la desviación estándar del tiempo de secado es 8 minutos, y esta variabilidad inherente no debe verse afectada por la adición del nuevo ingrediente. Se pintan 10 especimenes con la fórmula 1, y otros 10 con la fórmula 2. Los dos tiempos promedio de secado son x 1

121 min

y x 2

112 min , respectivamente. ¿A

qué conclusiones puede llegar el diseñador del producto sobre la eficacia del nuevo ingrediente, utilizando

0 05 ? .

Solución 1)

2)

3)

H ipótesis H0 :

1

2

H1 :

1

2

0

(el tiempo promedio de secado es mismo para las dos fórmulas)

0

(el nuevo ingrediente disminuye el tiempo promedio de secado)

E stadístico de prueba:

Regla de decisión para Rechazar H 0 si z 0

4)

x 1

z 0

0 05 . .

x 2

d 0

2 1

2 2

n1

n 2

De la Tabla 1, z

/ 2

1.645

1 645 .

E valuar el estadístico de prueba: 121

z 0

112 2

( 8)

10


2 52 .

0 2

2. 52

(8)

10

es mayor de 1.645 Se Rechaza H 0

6) Conclusión: La evidencia de la muestra apoya la hipótesis de que el nuevo ingrediente disminuye el tiempo promedio de secado.

Ejemplo 3.7

(

1

y

2

desconocidas, n1 y n 2 < 30) Los siguientes datos representan los

tiempos de duración de las películas producidas por 2 compañías cinematográficas:

Compañía

8

Tiempo (minutos)



1

102

86

98

109 92

2

81

165

97

134 92

Pruebe la hipótesis de que 2 1

suponiendo que

2 2



1



2



0

87

114

en contraposición a la alternativa

1





2

0,

. Utilice un nivel de significancia de 0.02.

Solución 1) H ipótesis H0 :

1

H1 :

1

0

2



2



0

(El tiempo promedio de duración es mismo para las dos compañías) (El tiempo promedio de duración es diferente para las dos compañías)


( x 1 x 2 ) d 0

t 0

S p 3)

1 n1

1 n 2

con

v

n1

n 2

2 gl

donde ( n1 1 ) S 21 ( n 2 1 ) S 2 2 n1 n 2 2

S p 4) Regla de decisión para Rechazar H 0 si t 0



0.02 y v

  2.76

o

t 0

n1

n 2

2 = 5 +7 - 2 = 10 de





7 ; x 2

S p 



110.0 ; s 2





2.76 :

 2.76

5) E valuar el estadístico de prueba para: n1 5 ; x 1 n 2

la Tabla 3, t / 2



97 .4 ; s1



8.8769 ; y

30. 2214

( 4 * 8.8769 2  6 * 30. 2214 2 )  24.0732 10


0.8939

 

y

t 0



97 .4  110  0 24.0732*

1 5

1 

 0.8939

7

es mayor de -2.76 pero menor que + 2.76 NO se

Rechaza H 0. 6) Conclusión: La evidencia de las muestra apoya la hipótesis de que el tiempo promedio de duración es el mismo para las dos compañías. Ejemplo 3.8

(Observaciones pareadas) Los siguientes datos son las horas-hombre que

semanalmente se pierden en promedio por accidentes en 10 plantas industriales antes y después de que se implantará cierto programa de seguridad. Utilice un nivel de significancia,

0 05 .

para probar si el programa de seguridad es eficaz.


9


Planta Antes Después Diferencia, d i

1 45 36 9

2 73 60 13

3 46 44 2

4 124 119 5

5 33 35 -2

6 57 51 6

7 83 77 6

8 34 29 5

9 26 24 2

10 17 11 6

Solución 1) H ipótesis H0

:

d



0 (Las horas-hombre que se pierden en promedio por accidentes en plantas

industriales antes y después de cierto programa de seguridad son iguales) H1

:

d



0 (Las horas-hombre que se pierden en promedio por accidentes en plantas

industriales disminuyeron después de cierto programa de seguridad) 2) E stadístico de prueba:

d d 0

t 0


S d / n

0 05 y .

v = 10 – 1 = 9 gl. De la Tabla 3,

Rechazar H 0 si t 0 4) E valuar el estadístico de prueba para: n = 10, t 0

d d 0

5. 2





S d /




n







0 10

.



1 83 .

,

1.83

d 5. 2

4.0770 /

4.0333



t 0 05 9



y Sd = 4.0770 4.0333

es mayor de 1.83 S e Rechaza H 0

6) Conclusión: La evidencia de la muestra apoya la hipótesis de que las horas-hombre que se pierden en promedio por accidentes en plantas industriales disminuyeron después de cierto programa de seguridad.

10



3.9 Prueba de hipótesis para la diferencia de proporciones Ejemplo 3.9 Se evalúan dos tipos diferentes de soluciones para pulir, para su posible uso en una operación de pulido en la fabricación de lentes intraoculares utilizados en el ojo humano después de una cirugía de cataratas. Se pulen 300 lentes con la primera solución y, de estos, 253 no presentaron defectos inducidos por el pulido. Después se pulen otros 300 lentes con la segunda solución, de los cuales 196 resultan satisfactorios. ¿Existe alguna razón para creer que las dos soluciones son diferentes? Utilice un nivel de significancia,



0.01 .

Solución

2) H ipótesis H0

:

P1



P 2



H1

:

P1



P 2



0

(Las dos soluciones para pulir son iguales)

0

(Las dos soluciones para pulir son diferentes)


p1 p 2 ˆ

z 0

pq [( 1 / n1 ) ( 1 / n 2 )] ˆ

donde p  ( x 1  x 2 ) /(n1  n 2 ) 

ˆ

y

ˆ


0.01 .

q

1 p

ˆ

ˆ

De la Tabla 1, z / 2

Rechazar H 0 si z 0

  2 575

.

4) E valuar el estadístico de prueba para: p  ˆ

z 0



d 0

ˆ

253 300



2. 575

ó z 0

 2 575

.

253  196 q 1 0.7483 0. 2517  0.7483 y 300  300



ˆ

196 300 1   1    300 300 







 5. 3619

0.7483(0. 2517 )

5) Tomar una decisión: como z 0 5. 3619 

es mayor de 2.575 Se Rechaza H 0

6) Conclusión: La evidencia de las muestras apoya la hipótesis de que las dos soluciones para pulir son diferentes. La primera solución produce una fracción significativamente mayor de lentes no defectuosos.


11


3.11 Prueba de hipótesis para la relación de varianzas. Ejemplo 3.10 Los siguientes datos representan los tiempos de duración de las películas producidas por 2 compañías cinematográficas:

Compañía 1

102

86

98

109 92

2

81

165

97

134 92

2

Pruebe la hipótesis de que 2 1

y

2 2

Tiempo (minutos)

1

2



2

87

114

en contraposición a la alternativa

2 1



2 2

, donde

son las variancias para los tiempos de duración de las películas producidas por las

compañías 1 y 2, respectivamente. Utilice un nivel de significancia de 0.02.

Solución

1) H ipótesis H0

2

:

1



2 2

(Las variancias para los tiempos de duración de las películas producidas por las compañías 1 y 2, son iguales)

H1

2

:

1



2 2

(Las variancias para los tiempos de duración de las películas producidas por las compañías 1 y 2, son diferentes)


f 0 3) Regla de decisión para

f v v 21 ,

/ 2





1 6 4 , 0.99

f



S 21 S 2 2

0.02 .



1 15. 2

con v 1= n1 -1 y v 2= n 2 -1 grados de libertad

De la Tabla 5, 

0.06579

Rechazar H0 si f 0

f 0  f v v 21 ,1

y 



0.06579 ó si f 0

f 64 ,0.99  9.15

/ 2 



9.15

4) E valuar el estadístico de prueba para: n1 = 5, S 1= 8.8769 y n 2 = 7, S 2= 30.2214

f 0 5) Tomar una decisión: como f 0



S 21 S 2 2





(8.8769) 2 ( 30. 2214) 2



0.0863

0.0863 es mayor de 0.06579 pero menor de 9.15 NO se

Rechaza H 0 6) Conclusión: La evidencia de las muestras apoya la hipótesis de que las variancias para los tiempos de duración de las películas producidas por las compañías 1 y 2, son iguales.

12


Unidad 3 Pruebas de Hipótesis.pdf

Recommend Documents