Control estadístico de procesos usando MINITAB.
Intervalo de confianza para la diferencia de medias
Introducción En esta sección se verá el caso en donde se tienen dos poblaciones con medias y varianzas desconocidas, y se desea encontrar un intervalo de confianza para la diferencia de dos medias. Si los tamaños de muestras n1 y n2 son mayores que 30, entonces, puede emplearse el intervalo de confianza de la distribución normal. Sin embargo, cuando se toman muestras pequeñas se supone que las poblaciones de interés están distribuidas de manera normal, y los intervalos de confianza se basan en la distribución t. Para calcular el intervalo de confianza para la diferencia de dos medias se debe saber si las varianzas poblacionales son conocidas o desconocidas, y en caso de que sean desconocidas, se debe probar si son iguales o diferentes. Cada uno de esos tres casos se analizarán por separado
Varianzas conocidas pero diferentes Si las varianzas son conocidas y diferentes, los pasos a seguir para encontrar el intervalo de confianza son los siguientes: - El estadístico usado como estimador puntual de la diferencia de medias será T = x1-x2, que es un estimador suficiente - La variable aleatoria asociada con el estimador será la variable normal estándar dada por :
-Para calcular el intervalo de confianza se debe tener en cuenta el nivel de confianza que se quiere considerar.
Ejemplo Construya un intervalo de confianza del 94% para la diferencia real entre las duraciones de dos marcas de focos, si una muestra de 40 focos tomada al azar de la primera marca dio una duración media de 418 horas, y una muestra de 50 focos de otra marca dieron una duración media de 402 horas. Las desviaciones estándares s de las dos poblaciones son 26 horas y 22 horas, respectivamente
Varianzas desconocidas pero iguales Las situaciones que más prevalecen e implican pruebas sobre dos medias son las que tienen varianzas desconocidas. Si el científico prueba mediante una prueba F, que las varianzas de las dos poblaciones son iguales, se utiliza la siguiente fórmula:
Los grados de libertad están dados por::
Ejemplo La siguiente tabla presenta los resultados de dos muestras aleatorias para comparar el contenido de nicotina de dos marcas de cigarrillos. Suponiendo que los conjuntos de datos provienen de muestras tomadas al azar de poblaciones normales con varianzas desconocidas e iguales, construya un intervalo de confianza del 95% para la diferencia real de nicotina de las dos marcas.
Varianzas desconocidas pero diferentes Consideremos ahora el problema de encontrar una estimación por intervalos de 1-2 cuando no es probable que las varianzas poblacionales desconocidas sean iguales. La estadística que se usa con más frecuencia en este caso es:
que tiene aproximadamente una distribución t con v grados de libertad, donde:
Como v rara vez es número entero, lo redondeamos al número entero más cercano menor. Esto es si el valor de nu es de 15.9 se redondeará a 15. Al despejar la diferencia de medias poblacionales de la formula de t nos queda:
Ejemplo El departamento de zoología de la Universidad de Virginia llevó a cabo un estudio para estimar la diferencia en la cantidad de ortofósforo químico medido en dos estaciones diferentes del río James. El ortofósforo se mide en miligramos por litro. Se reunieron 15 muestras de la estación 1 y se obtuvo una media de 3.84 con una desviación estándar de 3.07 miligramos por litro, mientras que 12 muestras de la estación 2 tuvieron un contenido promedio de 1.49 con una desviación estándar 0.80 miligramos por litro. Encuentre un intervalo de confianza de 95% para la diferencia del contenido promedio real de ortofósforo en estas dos estaciones, suponga que las observaciones vienen de poblaciones normales con varianzas diferentes. Estación 1
Estación 2
n1 = 15
n2 = 12
S1= 3.07
S2 = 0.80
Primero se procederá a calcular los grados de libertad
Al usar alpha =0.05, encontramos en la tabla con 16 grados de libertad que el valor de t es 2.120, por lo tanto:
Lo que es igual a:
Por ello se tiene una confianza del 95% de que el intervalo de 0.60 a 4.10 miligramos por litro contiene la diferencia de los contenidos promedios reales de ortofósforo para estos dos lugares.
Conclusiones Si llevamos a cabo un calculo de intervalo de confianza para diferencia de medias, suponiendo que las varianzas no son iguales, en el dado cas que si lo fueran, perderíamos muy poco, y el intervalo obtenido seria un poco conservador. En el caso de que supongamos que las varianzas son iguales, siendo que no lo son, nos produce un error mayor que puede ser considerable por lo que una sugerencia es usar varianzas diferentes como regla general