Pruebas de hipótesis Facultad de Ingeniería en Mecánica y Ciencias de la Producción FIMCP Mendenhall, W; Sincich, T; Probabilidad y Estadística para Ingeniería y Ciencias, 4ta edición, 2000 Walpole, R; Myers, R; Myers, S; Ye, K; Probabilidad y Estadística para Ingeniería y Ciencias, 9na ed ición, 2012 2012
Introducción
Involucra una suposición elaborada sobre uno o más parámetros de una o más poblaciones.
Usando la información información muestral se verificará la suposición sobre sobre los parámetros parámetros estudiados.
La hipótesis que se contrasta se llama hipótesis nula (H0). Decisión
Conclusión
Se rechaza H0
Se puede afirmar que no existe suficiente evidencia estadística para aceptar H0. Se puede afirmar que H1 es verdadera
No se rechaza H0
Se puede afirmar que existe suficiente evidencia estadística para aceptar H0. No se puede afirmar que H1 es verdadera
Introducción
Involucra una suposición elaborada sobre uno o más parámetros de una o más poblaciones.
Usando la información información muestral se verificará la suposición sobre sobre los parámetros parámetros estudiados.
La hipótesis que se contrasta se llama hipótesis nula (H0). Decisión
Conclusión
Se rechaza H0
Se puede afirmar que no existe suficiente evidencia estadística para aceptar H0. Se puede afirmar que H1 es verdadera
No se rechaza H0
Se puede afirmar que existe suficiente evidencia estadística para aceptar H0. No se puede afirmar que H1 es verdadera
Elementos de una prueba estadística 1. Hipótesis Nula, Nula, H0, acerca de uno o más parámetros de población. 2. Hipótesis alternativa, Ha , que aceptaremos si decidimos rechazar la hipótesis nula. 3. Estadística de prueba, calculada a partir de datos de muestra. 4.Región de rechazo, que indica los valores de la estadística de prueba que implicarán el rechazo de la hipótesis nula.
¿Cómo se eligen Ho y Ha?
Con frecuencia Ho se plantea con signo de igualdad, controlando así la probabilidad de cometer error tipo I.
Sin embargo, hay situaciones en que “no rechazar Ho” implica que el parámetro parámetro θ podría ser cualquier valor definido por el complemento natural de la hipótesis alternativa.
Es evidente que en el caso de las pruebas de una cola la consideración más importante es el planteamiento de la alternativa.
La decisión de plantear una prueba de una cola o una de dos colas co las depende de la conclusión que se obtenga si se rechaza Ho. La ubicación de la región critica solo se puede determinar después de que se plantea Ha.
Tipos de errores
Se pueden cometer dos tipos de errores:
Decisión
Población Ho es verdadera
Ho es falsa
No rechazar Ho
Decisión correcta.
Error tipo II
Rechazar Ho
Error tipo I
Decisión correcta.
La potencia de una prueba estadística (1- b ), es la probabilidad de rechazar la hipótesis nula H0 , cuando en realidad H0 es falsa
Tipos de errores = Pr(Error Tipo I) = Pr(Rechazar H0 / H0 es verdadera). También llamada nivel significancia. En ocasiones, el nivel de significancia se conoce como tamaño de prueba = Pr(Error Tipo II) = Pr(No rechazar H0 / H0 es falsa). Es imposible calcular al menos que tengamos una hipótesis alternativa especifica.
La probabilidad de cometer ambos tipos de errores se puede reducir aumentando el tamaño de la muestra
Propiedades importantes de una Prueba de Hipótesis 1. Los errores tipo I y tipo II están relacionados. Por lo general, una disminución en la probabilidad de cometer uno da como resultado un incremento en la probabilidad de cometer el otro. 2. El tamaño de la región critica y, por lo tanto, la probabilidad de cometer un error tipo I, siempre se puede reducir ajustando el (los) valor(es) critico(s).
Propiedades importantes de una Prueba de Hipótesis 3. Un aumento en el tamaño de la muestra forma simultanea.
n
reducirá α y
de
4. Si la hipótesis nula es falsa, es un máximo cuando el valor verdadero de un parámetro se aproxima al valor hipotético. Cuanto mas grande sea la distancia entre el valor verdadero y el valor hipotético, más pequeña será .
Nivel de significancia observado en una prueba
El nivel de significancia observado en una prueba, o valor p, de una prueba estadística específica es la probabilidad (suponiendo que Ho es verdadera) de observar un valor de la estadística de prueba que contradice la hipótesis nula, y apoya la hipótesis alternativa, en por lo menos el mismo grado que lo hace el que se calcula a partir de los datos de la muestra.
Cálculo de valores p
Cálculo de valores p
¿Cómo interpretar los valores de p? 1. Escoja los valores de α que está dispuesto a tolerar 2. Si el nivel de significancia observado (valor p) es menor que el valor máximo de α, rechace la hipótesis nula.
Cálculo de β para una prueba Z con muestra grande/normal
Tipos de prueba de hipótesis
Prueba bilateral o de dos colas:
H 0 :
0
H 1 :
0
Tipos de prueba de hipótesis
Prueba unilateral derecha: H 0 : 0 H1 : 0
Prueba unilateral izquierda: H 0 : 0 H1 : 0
Prueba de hipótesis para m Caso 1: 2 conocida
Hipótesis: Unilateral izquierda
Unilateral
Bilateral
derecha
H0: m = m 0
H0: m
m 0
H0: m = m 0
H1: m < m 0
H1: m ≠ m 0
H1: m > m 0
Estadístico de prueba: Z
c
X
m 0
~ Z
n
Región de Rechazo <
< >
Donde es el valor de t tal que
> = 2
Supuestos: Ninguno
>
> = ; y es el valor de t tal que
Prueba de hipótesis para m Caso 1.1: 2 desconocida, n≥30 Hipótesis: Unilateral izquierda
Unilateral
Bilateral
derecha
H0: m = m 0
H0: m
m 0
H0: m = m 0
H1: m < m 0
H1: m ≠ m 0
H1: m > m 0
Estadístico de prueba:
Z c
X
s
m 0
~ Z
n
Región de Rechazo <
< >
Donde es el valor de t tal que
> = 2
>
> = ; y es el valor de t tal que
Supuestos: Ninguno (teorema del límite central )
Ejemplo 1
Una empresa eléctrica fabrica focos cuya duración se distribuye de forma aproximadamente normal con media de 800 horas y desviación estándar de 40 horas. Pruebe la hipótesis que la duración promedio es diferente de las 800 horas si una muestra aleatoria de 28 focos tiene una duración promedio de 790 horas. Utilice un nivel de significación de 0.05.
Prueba de hipótesis para m Caso 2: 2 desconocida, muestra pequeña
Hipótesis: Unilateral izquierda
Unilateral
Bilateral
derecha
H0: m = m 0
H0: m
m 0
H0: m = m 0
H1: m < m 0
H1: m m 0
H1: m > m 0
Estadístico de prueba:
Tc
X
m 0
S
n
~ t n
1
Región de Rechazo <
< >
Donde es el valor de t tal que
> = 2
>
> = ; y es el valor de t tal que
Prueba de hipótesis para m Caso 2: 2 desconocida, muestra pequeña
Supuestos: La distribución de frecuencia relativa de la población
de la que se seleccionó la muestra es aproximadamente normal. Advertencia: Si los datos se apartan considerablemente de la
normalidad es posible que la prueba con muestra pequeña conduzca a inferencias erróneas. En este caso, utilice la prueba no paramétrica del signo.
Ejemplo 2 Se sabe que el rendimiento promedio de un proceso químico es 12. Sin embargo, últimamente se han observado muchos valores menores. Para probar que efectivamente el rendimiento promedio ha disminuido, se toma una muestra aleatoria de un lote de materia prima y se registran las siguientes observaciones:
9.7
12.8
8.7
13.4
8.3
11.7
10.7
8.1
9.1
10.5
Use un nivel de significación del 5%.
Prueba de hipótesis para 2
Hipótesis: Unilateral izquierda
Unilateral
Bilateral
derecha
H0: 2 = 20
H0: 2 = 20
H0: 2 = 20
H1: 2 < 20
H1: 2 ≠ 20
H1: 2 > 20
Estadístico de prueba:
2
c
n
2
1 S 2
0
2
~ n
1
Región de Rechazo > −
>
Donde y − son los valores de que se ubican un área de α a la derecha y α a la izquierda, respectivamente, de una distribución ji cuadrada basada en (n-1) grados de libertad
Supuestos: La población de la que se escogió la muestra aleatoria tiene una distribución
Ejemplo 3 En un proceso de fabricación de filamentos se desea verificar que la varianza del grosor de los filamentos es 4 milímetros2. Para ello se toma una muestra de 28 filamentos que arroja una varianza muestral de 3.5 milímetros2. Realice la prueba respectiva con 5% de nivel de significación. Asuma normalidad en el grosor de los filamentos.
Prueba de hipótesis de la proporción de una población (muestra grande)
Hipótesis: Unilateral izquierda
Bilateral
Unilateral derecha
H0: p = p0
H0: p = p0
H0: p = p0
H1: p< p0
H1: p ≠ p0
H1: p > p0
Estadístico de prueba: Región de Rechazo
<
> < > Donde es el valor de t tal que > = ; y es el valor de t tal que > = 2
Supuesto: El tamaño de la muestra n es lo bastante grande como para que la aproximación sea valida. Como regla practica, la condición de tamaño de muestra “suficientemente grande” se satisface si ≥ 4 ≥ 4
Ejemplo 4 Un fabricante sostiene que más del 95% de los equipos que envió a una fábrica está acorde con las especificaciones técnicas. Una revisión de una muestra de 200 piezas enviadas a la fábrica reveló que 18 eran defectuosas pues no estaban acorde con las especificaciones técnicas. Pruebe la afirmación del fabricante al nivel de significación del 1%.
Prueba de hipótesis para dos medias Caso 1: 21 y 22 conocidas.
Hipótesis: Unilateral izquierda
Unilateral
Bilateral
derecha
H0: m 1 – m 2 = k
H0: m 1 – m 2 = k
H0: m 1 – m 2 = k
H1: m 1 – m 2 < k
H1: m 1 – m 2 ≠ k
H1: m 1 – m 2 > k
Estadístico de prueba: Z
c
X
1
X2
2 1
n1
k 2
~ Z
2
n2
Región de Rechazo <
< >
Donde es el valor de t tal que
> = 2
>
> = ; y es el valor de t tal que
Ejemplo 5 Para comparar dos métodos de enseñanza de las matemáticas, se aplicaron a 200 alumnos elegidos al azar el método tradicional y a otra muestra de 250 alumnos el método nuevo resultando las calificaciones promedio de 13 y 15 respectivamente. Suponga que las varianzas poblacionales respectivas son 9 y 16. Usando un nivel de significación del 5%, ¿podemos afirmar que el método nuevo es superior al método antiguo?
Prueba de hipótesis para dos medias Caso 1: 21 y 22 desconocidas. Muestras grandes
Hipótesis: Unilateral izquierda
Bilateral
Unilateral derecha
H0: m 1 – m 2 = k
H0: m 1 – m 2 = k
H0: m 1 – m 2 = k
H1: m 1 – m 2 < k
H1: m 1 – m 2 ≠ k
H1: m 1 – m 2 > k
Estadístico de prueba: Región de Rechazo <
< >
Donde es el valor de t tal que
> = 2
>
> = ; y es el valor de t tal que
Prueba de hipótesis para dos medias Caso 1: 21 y 22 desconocidas. Muestras grandes
Supuestos: 1. Los tamaños de muestra n1 , n2 son suficientemente grandes, digamos n1≥ 30 y n2 ≥ 30. 2. Las dos muestras se escogen al azar y de forma independiente de las poblaciones objetivo
Nota: k es el un símbolo para el valor numérico en particular especificado para ( m1 – m 2 en la hipótesis nula. En muchas aplicaciones prácticas queremos hacer la hipótesis de que no hay diferencia entre las medias de la población; en tales casos, k=0
Prueba de hipótesis para dos medias Caso 2: 21 = 22 desconocidas. Muestra pequeña
Hipótesis:
Unilateral izquierda
Unilateral
Bilateral
derecha
H0: m 1 – m 2 = k
H0: m 1 – m 2 = k
H0: m 1 – m 2 = k
H1: m 1 – m 2 < k
H1: m 1 – m 2 ≠ k
H1: m 1 – m 2 > k
Estadístico de prueba:
Tc
X
1
X
2
k ~ t
1 1 S p n n
n1 n2 2
2
1
2
Región de Rechazo <
< >
Donde es el valor de t tal que
> = 2
>
> = ; y es el valor de t tal que
Prueba de hipótesis para dos medias Caso 2: 21 = 22 desconocidas. Muestra pequeña
donde:
2
S p
2 ( n1 1) S 1
2 (n2 1) S 2
n1 n2
2
Supuestos: 1. Las poblaciones de las que se escogieron las muestras tienes distribuciones de frecuencia aproximadamente normal. 2. Las varianzas de las dos poblaciones son iguales. Las muestras se escogieron de forma aleatoria y son 3. independientes. Nota: Si se viola el supuesto de poblaciones normales, la prueba puede dar pie a inferencias erróneas. En este caso, utilice la prueba no paramétrica Wilcoxon.
Ejemplo 6 Se desea determinar si un proceso de fabricación, que se efectúa en un lugar antiguo se puede establecer localmente, a esta conclusión se llega si las lecturas de voltaje en ambos lugares son, en promedio, iguales. Se instalaron dispositivos de prueba en ambos lugares y se tomaron las lecturas de voltaje. Los datos resumidos se muestran a continuación: Lugar antiguo
Lugar nuevo
12
9
Media
9.931
9.634
Varianza
0.4776
0.3950
Muestra
Asuma que las lecturas de voltaje tienen comportamiento normal. Con 2% de nivel de significación, ¿se puede afirmar que las lecturas de voltaje, en promedio, presentan diferencias significativas en ambos lugares?
Prueba de hipótesis para dos medias Caso 3: 21 ≠ 22 desconocidas. Muestras pequeñas
Hipótesis:
Unilateral izquierda
Unilateral
Bilateral
derecha
H0: m 1 – m 2 = k
H0: m 1 – m 2 = k
H0: m 1 – m 2 = k
H1: m 1 – m 2 < k
H1: m 1 – m 2 ≠ k
H1: m 1 – m 2 > k
Estadístico de prueba:
Tc
X
1
X2
2
S1
n1
2
S 2
k ~ t
n2
Región de Rechazo <
< >
Donde es el valor de t tal que
> = 2
>
> = ; y es el valor de t tal que
Prueba de hipótesis para dos medias Caso 3: 21 ≠ 22 desconocidas. Muestras pequeñas
1 ≠
=
+ +
2 = = : = 2 = 2 1
Supuestos: 1.
2.
Las poblaciones de las que se escogieron las muestras tienen distribuciones de frecuencia aproximadamente normal. Las muestras se escogieron de forma aleatoria y son independientes.
Nota: Generalmente el valor de
no es entero en (1). Redondee al entero menor más cercano para
Ejemplo 7 Los siguientes datos resumidos corresponden a la resistencia a la compresión a los 28 días (en kg/cm2 ) reportados por dos laboratorios: Laboratorio 1
Laboratorio 2
15
18
Media
317.41
324.25
Varianza
25.5937
10.9124
Muestra
Con 10% de nivel de significación, ¿se puede afirmar que el laboratorio 2 reporta en promedio 2 kg/cm2 más en sus resultados en comparación al laboratorio 1? Asuma poblaciones normales.
Prueba de hipótesis para Observaciones Pareadas. Muestra pequeña
Hipótesis: Unilateral izquierda
Bilateral
Unilateral derecha
H0: m D = k
H0: m D = k
H0: m D = k
H1: m D< k
H1: m D ≠ k
H1: m D > k
Estadístico de prueba: Región de Rechazo <
< >
Donde es el valor de t tal que
> = 2
>
> = ; y es el valor de t tal que
Prueba de hipótesis para Observaciones Pareadas. Muestra pequeña
Supuestos: 1.
2.
Las poblaciones de las que se escogieron las muestras tienen distribuciones de frecuencia aproximadamente normal. Las diferencias pareadas se escogieron de forma aleatoria de la población de diferencias. Advertencia: Si se viola el supuesto de normalidad, la prueba t
puede dar pie a inferencias erróneas. En este caso, utilice la prueba no paramétrica suma de rangos de Wilcoxon
Ejemplo 8 En un estudio realizado por el Departamento de Nutrición Humana y Alimentos del Virginia Tech, se registraron los siguientes datos sobre los residuos de ácido sórbico en jamón, en partes por millón, inmediatamente después de sumergirlo en una solución de sorbato y después de 60 días de almacenamiento: Residuos de ácido sórbico en jamón Rebanada
1 2 3 4 5 6 7 8
Antes del almacenamiento
Después del almacenamiento
224 270 400 444 590 660 1400 680
116 96 239 329 437 597 689 576
Si se supone que las poblaciones se distribuyen normalmente, ¿ hay suficiente evidencia, a un nivel de significancia de 0,05, para decir que la duración del almacenamiento influye en las concentraciones residuales de ácido sórbico?
Prueba de hipótesis para Observaciones Pareadas. Muestra grande
Hipótesis:
Unilateral
Bilateral
izquierda
Unilateral derecha
H0: m D = k
H0: m D = k
H0: m D = k
H1: m D< k
H1: m D ≠ k
H1: m D > k
Estadístico de prueba: Región de Rechazo <
< >
Donde es el valor de t tal que
> = 2
>
> = ; y es el valor de t tal que
Nota: k es un símbolo para el valor numérico en particular especificado para ( m 1 – m 2 ) en Ho. En muchas aplicaciones
Prueba de hipótesis para dos proporciones
Hipótesis: Unilateral
Bilateral
izquierda
Unilateral derecha
H0: p1 – p2 = k
H0: p1 – p2 = k
H0: p1 – p2 = k
H1: p1 – p2 < k
H1: p1 – p2 ≠ k
H1: p1 – p2 > k
Estadístico de prueba: Z
c
( p1 p2 ) k
1
p1 p
n1
y y
1
y2
1
Z ,
donde
n2
p
n1 p1
n2 p2
n1
n2
y1
y2
n1
es el número total de éxitos en la muestra combinada.
Región de Rechazo <
< >
Donde es el valor de t tal que
> = 2
>
> = ; y es el valor de t tal que
n2
Ejemplo 9 Un estudio reciente, en la que participaron 15 empresas del sector industrial, reveló que 184 de 616 adultos trabajan utilizando con regularidad una computadora personal en su trabajo. Se seleccionó otra muestra de 450 adultos, de 10 empresas del sector salud, y se obtuvo que 105 adultos utilizan con regularidad una computadora personal. ¿Existen diferencias significativas entre los porcentajes de adultos de las empresas del sector industria y salud que utilizan con regularidad una computadora personal en su trabajo? Use un nivel de significación del 5%.
Prueba de hipótesis para dos varianzas Hipótesis:
Unilateral izquierda
Unilateral
Bilateral
derecha
H0: 21 22
H0: 21 = 22
H0: 21 = 22
H1: 21 < 22
H1: 21 ≠ 22
H1: 21 > 22 2
Estadístico de prueba:
Fc
S 1
2 S 2
~ F n1
1, n2 1
Región Crítica
Supuestos: 1. Ambas poblaciones de lasque se seleccionaron las muestras tienen distribuciones de frecuencia relativa aproximadamente normales. 2. Las muestras aleatorias se escogieron de forma independiente