Pruebas de Hipótesis.pdf

Pruebas de hipótesis Facultad de Ingeniería en Mecánica y Ciencias de la Producción FIMCP Mendenhall, W; Sincich, T; Probabilidad y Estadística para Ingeniería y Ciencias, 4ta edición, 2000 Walpole, R; Myers, R; Myers, S; Ye, K; Probabilidad y Estadística para Ingeniería y Ciencias, 9na ed ición, 2012 2012

Introducción 

Involucra una suposición elaborada sobre uno o más parámetros de una o más poblaciones.



Usando la información información muestral se verificará la suposición sobre sobre los parámetros parámetros estudiados.



La hipótesis que se contrasta se llama hipótesis nula (H0). Decisión

Conclusión

Se rechaza H0

Se puede afirmar que no existe suficiente evidencia estadística para aceptar H0. Se puede afirmar que H1 es verdadera

No se rechaza H0

Se puede afirmar que existe suficiente evidencia estadística para aceptar H0. No se puede afirmar que H1 es verdadera

Introducción 

Involucra una suposición elaborada sobre uno o más parámetros de una o más poblaciones.



Usando la información información muestral se verificará la suposición sobre sobre los parámetros parámetros estudiados.



La hipótesis que se contrasta se llama hipótesis nula (H0). Decisión

Conclusión

Se rechaza H0

Se puede afirmar que no existe suficiente evidencia estadística para aceptar H0. Se puede afirmar que H1 es verdadera

No se rechaza H0

Se puede afirmar que existe suficiente evidencia estadística para aceptar H0. No se puede afirmar que H1 es verdadera

Elementos de una prueba estadística 1. Hipótesis Nula, Nula, H0, acerca de uno o más parámetros de población. 2. Hipótesis alternativa, Ha , que aceptaremos si decidimos rechazar la hipótesis nula. 3. Estadística de prueba, calculada a partir de datos de muestra. 4.Región de rechazo, que indica los valores de la estadística de prueba que implicarán el rechazo de la hipótesis nula.

¿Cómo se eligen Ho y Ha? 

Con frecuencia Ho se plantea con signo de igualdad, controlando así la probabilidad de cometer error tipo I.



Sin embargo, hay situaciones en que “no rechazar Ho” implica que el parámetro parámetro θ podría ser cualquier valor definido por el complemento natural de la hipótesis alternativa.



Es evidente que en el caso de las pruebas de una cola la consideración más importante es el planteamiento de la alternativa.



La decisión de plantear una prueba de una cola o una de dos colas co las depende de la conclusión que se obtenga si se rechaza Ho. La ubicación de la región critica solo se puede determinar después de que se plantea Ha.

Tipos de errores 

Se pueden cometer dos tipos de errores:

Decisión

Población Ho es verdadera

Ho es falsa

No rechazar Ho

Decisión correcta.

Error tipo II

Rechazar Ho

Error tipo I

Decisión correcta.

La potencia de una prueba estadística (1- b ), es la probabilidad de rechazar la hipótesis nula H0 , cuando en realidad H0 es falsa

Tipos de errores = Pr(Error Tipo I) = Pr(Rechazar H0 / H0 es verdadera). También llamada nivel significancia. En ocasiones, el nivel de significancia se conoce como tamaño de prueba = Pr(Error Tipo II) = Pr(No rechazar H0 / H0 es falsa). Es imposible calcular al menos que tengamos una hipótesis alternativa especifica. 

La probabilidad de cometer ambos tipos de errores se puede reducir aumentando el tamaño de la muestra

Propiedades importantes de una Prueba de Hipótesis 1. Los errores tipo I y tipo II están relacionados. Por lo general, una disminución en la probabilidad de cometer uno da como resultado un incremento en la probabilidad de cometer el otro. 2. El tamaño de la región critica y, por lo tanto, la probabilidad de cometer un error tipo I, siempre se puede reducir ajustando el (los) valor(es) critico(s).

Propiedades importantes de una Prueba de Hipótesis 3. Un aumento en el tamaño de la muestra forma simultanea.

n

reducirá α y

de

4. Si la hipótesis nula es falsa, es un máximo cuando el valor verdadero de un parámetro se aproxima al valor hipotético. Cuanto mas grande sea la distancia entre el valor verdadero y el valor hipotético, más pequeña será .

Nivel de significancia observado en una prueba

El nivel de significancia observado en una prueba, o valor p, de una prueba estadística específica es la probabilidad (suponiendo que Ho es verdadera) de observar un valor de la estadística de prueba que contradice la hipótesis nula, y apoya la hipótesis alternativa, en por lo menos el mismo grado que lo hace el que se calcula a partir de los datos de la muestra.

Cálculo de valores p

Cálculo de valores p

¿Cómo interpretar los valores de p? 1. Escoja los valores de α que está dispuesto a tolerar 2. Si el nivel de significancia observado (valor p) es menor que el valor máximo de α, rechace la hipótesis nula.

Cálculo de β para una prueba Z con muestra grande/normal

Tipos de prueba de hipótesis 

Prueba bilateral o de dos colas:

H 0 : 

  0

H 1 : 



 0

Tipos de prueba de hipótesis 

Prueba unilateral derecha: H 0 :    0 H1 :    0



Prueba unilateral izquierda: H 0 :    0 H1 :    0

Prueba de hipótesis para m Caso 1:  2 conocida 

Hipótesis: Unilateral izquierda



Unilateral

Bilateral

derecha

H0: m = m 0

H0: m

m 0

H0: m = m 0

H1: m < m 0

H1: m ≠ m 0

H1: m > m 0

Estadístico de prueba: Z

c

X 





m 0

~ Z

n

Región de Rechazo  <  

 <     > 

Donde  es el valor de t tal que

  >  = 2

Supuestos: Ninguno

 > 

  >  = ; y  es el valor de t tal que

Prueba de hipótesis para m Caso 1.1:  2 desconocida, n≥30  Hipótesis: Unilateral izquierda



Unilateral

Bilateral

derecha

H0: m = m 0

H0: m

m 0

H0: m = m 0

H1: m < m 0

H1: m ≠ m 0

H1: m > m 0

Estadístico de prueba:

Z c

X 

s



m 0

~ Z

n


 <     > 


  >  = 2

 > 


Supuestos: Ninguno (teorema del límite central )

Ejemplo 1

Una empresa eléctrica fabrica focos cuya duración se distribuye de forma aproximadamente normal con media de 800 horas y desviación estándar de 40 horas. Pruebe la hipótesis que la duración promedio es diferente de las 800 horas si una muestra aleatoria de 28 focos tiene una duración promedio de 790 horas. Utilice un nivel de significación de 0.05.

Prueba de hipótesis para m Caso 2:  2 desconocida, muestra pequeña 




Unilateral

Bilateral

derecha

H0: m = m 0

H0: m

m 0

H0: m = m 0

H1: m < m 0

H1: m  m 0

H1: m > m 0


Tc

X 



m 0

S

n

~ t n

1



Región de Rechazo  <  

 <     > 

Donde  es el valor de t tal que

  >  = 2

 > 

  >  = ; y  es el valor de t tal que

Prueba de hipótesis para m Caso 2:  2 desconocida, muestra pequeña

Supuestos: La distribución de frecuencia relativa de la población



de la que se seleccionó la muestra es aproximadamente normal. Advertencia: Si los datos se apartan considerablemente de la



normalidad es posible que la prueba con muestra pequeña conduzca a inferencias erróneas. En este caso, utilice la prueba no paramétrica del signo.

Ejemplo 2 Se sabe que el rendimiento promedio de un proceso químico es 12. Sin embargo, últimamente se han observado muchos valores menores. Para probar que efectivamente el rendimiento promedio ha disminuido, se toma una muestra aleatoria de un lote de materia prima y se registran las siguientes observaciones:

9.7

12.8

8.7

13.4

8.3

11.7

10.7

8.1

9.1

10.5

Use un nivel de significación del 5%.

Prueba de hipótesis para  2 




Unilateral

Bilateral

derecha

H0:  2 =  20

H0:  2 =  20

H0:  2 =  20

H1:  2 <  20

H1:  2 ≠  20

H1:  2 >  20


2

 c



n





2

1 S 2

 0

2

~  n

1



Región de Rechazo   > −

 > 

 Donde  y − son los valores de  que se ubican un área de α a la derecha y α a la izquierda, respectivamente, de una distribución ji cuadrada basada en (n-1) grados de libertad

Supuestos: La población de la que se escogió la muestra aleatoria tiene una distribución

Ejemplo 3 En un proceso de fabricación de filamentos se desea verificar que la varianza del grosor de los filamentos es 4 milímetros2. Para ello se toma una muestra de 28 filamentos que arroja una varianza muestral de 3.5 milímetros2. Realice la prueba respectiva con 5% de nivel de significación. Asuma normalidad en el grosor de los filamentos.

Prueba de hipótesis de la proporción de una población (muestra grande) 




Bilateral

Unilateral derecha

H0: p = p0

H0: p = p0

H0: p = p0

H1: p< p0

H1: p ≠ p0

H1: p > p0

Estadístico de prueba: Región de Rechazo

 <  

 >   <     >  Donde  es el valor de t tal que   >  = ; y  es el valor de t tal que   >  = 2

Supuesto: El tamaño de la muestra n es lo bastante grande como para que la aproximación sea valida. Como regla practica, la condición de tamaño de muestra “suficientemente grande” se satisface si  ≥ 4    ≥ 4

Ejemplo 4 Un fabricante sostiene que más del 95% de los equipos que envió a una fábrica está acorde con las especificaciones técnicas. Una revisión de una muestra de 200 piezas enviadas a la fábrica reveló que 18 eran defectuosas pues no estaban acorde con las especificaciones técnicas. Pruebe la afirmación del fabricante al nivel de significación del 1%.

Prueba de hipótesis para dos medias Caso 1:  21 y  22 conocidas. 




Unilateral

Bilateral

derecha

H0: m 1 – m 2 = k

H0: m 1 – m 2 = k

H0: m 1 – m 2 = k

H1: m 1 – m 2 < k

H1: m 1 – m 2 ≠ k

H1: m 1 – m 2 > k


c



 X

1





X2

2 1

n1



 k 2

~ Z





2

n2


 <     > 


  >  = 2

 > 


Ejemplo 5 Para comparar dos métodos de enseñanza de las matemáticas, se aplicaron a 200 alumnos elegidos al azar el método tradicional y a otra muestra de 250 alumnos el método nuevo resultando las calificaciones promedio de 13 y 15 respectivamente. Suponga que las varianzas poblacionales respectivas son 9 y 16. Usando un nivel de significación del 5%, ¿podemos afirmar que el método nuevo es superior al método antiguo?

Prueba de hipótesis para dos medias Caso 1:  21 y  22 desconocidas. Muestras grandes 




Bilateral

Unilateral derecha

H0: m 1 – m 2 = k

H0: m 1 – m 2 = k

H0: m 1 – m 2 = k

H1: m 1 – m 2 < k

H1: m 1 – m 2 ≠ k

H1: m 1 – m 2 > k

Estadístico de prueba: Región de Rechazo  <  

 <     > 


  >  = 2

 > 


Prueba de hipótesis para dos medias Caso 1:  21 y  22 desconocidas. Muestras grandes 

Supuestos: 1. Los tamaños de muestra n1 , n2 son suficientemente grandes, digamos n1≥ 30 y n2 ≥ 30. 2. Las dos muestras se escogen al azar y de forma independiente de las poblaciones objetivo 

Nota: k es el un símbolo para el valor numérico en particular especificado para ( m1 – m 2 en la hipótesis nula. En muchas aplicaciones prácticas queremos hacer la hipótesis de que no hay diferencia entre las medias de la población; en tales casos, k=0

Prueba de hipótesis para dos medias Caso 2:  21 =  22 desconocidas. Muestra pequeña

Hipótesis:



Unilateral izquierda



Unilateral

Bilateral

derecha

H0: m 1 – m 2 = k

H0: m 1 – m 2 = k

H0: m 1 – m 2 = k

H1: m 1 – m 2 < k

H1: m 1 – m 2 ≠ k

H1: m 1 – m 2 > k


Tc

X  

1

X

2

  k ~ t

1 1 S p    n n 

n1  n2  2

2

1

2


 <     > 


  >  = 2

 > 


Prueba de hipótesis para dos medias Caso 2:  21 =  22 desconocidas. Muestra pequeña

donde:

2

S p



2 ( n1  1) S 1 

2 (n2  1) S 2

n1  n2



2

Supuestos: 1. Las poblaciones de las que se escogieron las muestras tienes distribuciones de frecuencia aproximadamente normal. 2. Las varianzas de las dos poblaciones son iguales. Las muestras se escogieron de forma aleatoria y son 3. independientes. Nota: Si se viola el supuesto de poblaciones normales, la prueba puede dar pie a inferencias erróneas. En este caso, utilice la prueba no paramétrica Wilcoxon.

Ejemplo 6 Se desea determinar si un proceso de fabricación, que se efectúa en un lugar antiguo se puede establecer localmente, a esta conclusión se llega si las lecturas de voltaje en ambos lugares son, en promedio, iguales. Se instalaron dispositivos de prueba en ambos lugares y se tomaron las lecturas de voltaje. Los datos resumidos se muestran a continuación: Lugar antiguo

Lugar nuevo

12

9

Media

9.931

9.634

Varianza

0.4776

0.3950

Muestra

Asuma que las lecturas de voltaje tienen comportamiento normal. Con 2% de nivel de significación, ¿se puede afirmar que las lecturas de voltaje, en promedio, presentan diferencias significativas en ambos lugares?

Prueba de hipótesis para dos medias Caso 3:  21 ≠  22 desconocidas. Muestras pequeñas

Hipótesis:






Unilateral

Bilateral

derecha

H0: m 1 – m 2 = k

H0: m 1 – m 2 = k

H0: m 1 – m 2 = k

H1: m 1 – m 2 < k

H1: m 1 – m 2 ≠ k

H1: m 1 – m 2 > k


Tc



 X

1



X2

2

S1

n1



 2



S 2

k ~ t 

n2


 <     > 


  >  = 2

 > 


Prueba de hipótesis para dos medias Caso 3:  21 ≠  22 desconocidas. Muestras pequeñas

1  ≠  

=

    +             +   

2  =  = :  =   2 = 2   1

Supuestos: 1.

2.

Las poblaciones de las que se escogieron las muestras tienen distribuciones de frecuencia aproximadamente normal. Las muestras se escogieron de forma aleatoria y son independientes.

Nota: Generalmente el valor de

 no es entero en (1). Redondee al entero menor más cercano para

Ejemplo 7 Los siguientes datos resumidos corresponden a la resistencia a la compresión a los 28 días (en kg/cm2 ) reportados por dos laboratorios: Laboratorio 1

Laboratorio 2

15

18

Media

317.41

324.25

Varianza

25.5937

10.9124

Muestra

Con 10% de nivel de significación, ¿se puede afirmar que el laboratorio 2 reporta en promedio 2 kg/cm2 más en sus resultados en comparación al laboratorio 1? Asuma poblaciones normales.

Prueba de hipótesis para Observaciones Pareadas. Muestra pequeña 




Bilateral

Unilateral derecha

H0: m D = k

H0: m D = k

H0: m D = k

H1: m D< k

H1: m D ≠ k

H1: m D > k

Estadístico de prueba: Región de Rechazo  <  

 <     > 


  >  = 2

 > 


Prueba de hipótesis para Observaciones Pareadas. Muestra pequeña

Supuestos: 1.

2.



Las poblaciones de las que se escogieron las muestras tienen distribuciones de frecuencia aproximadamente normal. Las diferencias pareadas se escogieron de forma aleatoria de la población de diferencias. Advertencia: Si se viola el supuesto de normalidad, la prueba t

puede dar pie a inferencias erróneas. En este caso, utilice la prueba no paramétrica suma de rangos de Wilcoxon

Ejemplo 8 En un estudio realizado por el Departamento de Nutrición Humana y Alimentos del Virginia Tech, se registraron los siguientes datos sobre los residuos de ácido sórbico en jamón, en partes por millón, inmediatamente después de sumergirlo en una solución de sorbato y después de 60 días de almacenamiento: Residuos de ácido sórbico en jamón Rebanada

1 2 3 4 5 6 7 8

Antes del almacenamiento

Después del almacenamiento

224 270 400 444 590 660 1400 680

116 96 239 329 437 597 689 576

Si se supone que las poblaciones se distribuyen normalmente, ¿ hay suficiente evidencia, a un nivel de significancia de 0,05, para decir que la duración del almacenamiento influye en las concentraciones residuales de ácido sórbico?

Prueba de hipótesis para Observaciones Pareadas. Muestra grande

Hipótesis:



Unilateral

Bilateral

izquierda



Unilateral derecha

H0: m D = k

H0: m D = k

H0: m D = k

H1: m D< k

H1: m D ≠ k

H1: m D > k

Estadístico de prueba: Región de Rechazo  <  

 <     > 


  >  = 2

 > 


Nota: k es un símbolo para el valor numérico en particular especificado para ( m 1 – m 2 ) en Ho. En muchas aplicaciones

Prueba de hipótesis para dos proporciones 

Hipótesis: Unilateral

Bilateral

izquierda



Unilateral derecha

H0: p1 – p2 = k

H0: p1 – p2 = k

H0: p1 – p2 = k

H1: p1 – p2 < k

H1: p1 – p2 ≠ k

H1: p1 – p2 > k


c

( p1  p2 )  k



 1

p1  p 

 n1

y y

1



y2



1 

 Z ,

donde

 n2 

p



n1 p1



n2 p2

n1



n2



y1

 y2

n1



es el número total de éxitos en la muestra combinada.


 <     > 


  >  = 2

 > 


n2

Ejemplo 9 Un estudio reciente, en la que participaron 15 empresas del sector industrial, reveló que 184 de 616 adultos trabajan utilizando con regularidad una computadora personal en su trabajo. Se seleccionó otra muestra de 450 adultos, de 10 empresas del sector salud, y se obtuvo que 105 adultos utilizan con regularidad una computadora personal. ¿Existen diferencias significativas entre los porcentajes de adultos de las empresas del sector industria y salud que utilizan con regularidad una computadora personal en su trabajo? Use un nivel de significación del 5%.

Prueba de hipótesis para dos varianzas Hipótesis: 


Unilateral

Bilateral

derecha

H0:  21   22

H0:  21 =  22

H0:  21 = 22

H1:  21 <  22

H1:  21 ≠  22

H1:  21 >  22 2




Fc



S 1

2 S 2

~ F n1

1, n2 1





Región Crítica

Supuestos: 1. Ambas poblaciones de lasque se seleccionaron las muestras tienen distribuciones de frecuencia relativa aproximadamente normales. 2. Las muestras aleatorias se escogieron de forma independiente

Pruebas de Hipótesis.pdf

Recommend Documents