TALLER I PRUEBA DE HIPOTESIS Y EXPERIMENTOS CON UN SOLO FACTOR
ANGIE SERRANO SEBASTIAN MEYER ANDREA BENAVIDEZ
RICK KEEVING ACOSTA
UNIVERSIDAD DEL MAGDALENA FACULTAD DE INGENIERIA ESTADISTICA III GRUPO 5 SANTA MARTA - MAGDALENA 2018 I
1. Explique en qué consiste y cuando se debe aplicar el diseño completamente al azar con un solo criterio de clasificación. R// Está centrado en comparar los tratamientos en cuanto a sus medias poblacionales y se utiliza cuando el objetivo es comparar más de dos tratamientos 2. Supongamos que se desea aprobar la igualdad entre sí de cinco medias. Una alternativa para hacer esto sería comparar de dos en dos las medias, utilizando la prueba T student y al final tomar una decisión. Explique porque esto aumenta el error tipo I. R// En este caso con cinco medias tenemos diez posibles pares de medias, y si la probabilidad de aceptar la H0 para cada prueba individual es de 1- α = 0.95, entonces la probabilidad de aceptar las diez H0 es de 0.95^10 = 0.5987, lo cual representa un aumento considerable del error tipo I. Aunque se utilice un nivel de confianza tal que (1-α )^10= 0.95, el procedimiento resulta inapropiado porque se pueden producir sesgos por parte del experimentador. 3. ¿Qué mide el cuadrado medio del error en el ANOVA de un experimento? R// Es la suma de cuadrados divididos entre sus respectivos grados de libertad 4. ¿Qué son los grados de libertad para una suma de cuadrados en un análisis de varianza? R// Representa el número de piezas de información independientes en la suma de cuadrados. En general, es el número de observaciones menos el número de parámetros estimados de los datos.
1.
a) ¿Cuáles son los tratamientos que se comparan en este estudio? La temperatura más confortante entre ambos sexos b) ¿Las muestras son dependientes o independientes? Explique Las muestras son independientes, no existe relación de otros factores que influyan en algún dato. Ningún dato depende de alguna relación a otra variable. c) ¿La temperatura promedio más confortable es igual para hombres que para mujeres? Pruebe la hipótesis adecuada.
0: 0:
Medias muestrales = 77,4 y 74,5 Desviaciones estándar muestrales = 1,0 y 1,0 Tamaños de muestra = 10 y 10 Intervalos de confianza del 95,0% para la diferencia entre medias: 2,9 +/- 0,939563 [1,96044,3,83956] Hipótesis Nula: diferencia entre medias = 0,0 Alternativa: no igual Estadístico t calculado = 6,4846 Valor-P = 0,00000424226 Rechazar la hipótesis nula para alfa = 0,05.
Como el promedio para mujeres es de 77,4 y para hombres es de 74,5 entonces se concluye que la temperatura promedio más confortable no es igual para hombres que para mujeres. Trabajando con un nivel de confianza del 95% también podemos decir que como el valorp<0,05 se debe rechazar la hipótesis nula, por lo tanto, de igual forma los promedios no son iguales, son diferentes.
2.
a) Describe un procedimiento de aleatorización para la obtención de estos datos.
Para obtener datos para una muestra de manera aleatoria podemos utilizar las combinaciones, una vez tomados los datos podemos comparar sus varianzas, medias y proporción de errores de las cuales las podemos comprobar con intervalos e hipótesis. b) Pruebe la hipótesis de igualdad de los diámetros de los proveedores en cuanto a sus medias
Para al menos un par de medias ij. Donde { 1,2,3,4… 1,2,3,4… Resumen Estadístico para diametros provedo Recuent Promedi Desviación r o o Estándar 1 14 20,1936 1,58347 2 14 21,8114 0,528552
Coeficiente Variación 7,84146% 2,42328%
de Mínimo Máxim Rango o 18,0 22,6 4,6 20,82 22,71 1,89
Total
28
21,0025 1,4214
6,76775%
Tabla ANOVA para diametros por provedor Fuente Suma de Gl Cuadrado Cuadrados Medio Entre 18,3222 1 18,3222 grupos Intra 36,2277 26 1,39337 grupos Total 54,5499 27 (Corr.)
18,0
Razón-F
Valor-P
13,15
0,0012
22,71
4,71
Como el Valor-p es mucho menor que 0,05 entonces no hay información suficiente para aceptar la hipótesis nula, por lo tanto, se rechaza, esto significa que si hay una diferencia significativa entre el promedio de diámetros de un proveedor y otro
c) Pruebe la hipótesis de igualdad de varianzas
= ≠
Ho: Ha:
Verificación de Varianza Prueba Valor-P de 1,6648 0,000353499 Bartlett 3 Comparació Sigma1 Sigma2 F-Ratio P-Valor n 1/2 1,5834 0,52855 8,9752 0,0003 7 2 1 Puesto que el valor-P es menor que 0,05, existe una diferencia estadísticamente significativa entre las desviaciones estándar, con un nivel del 95,0% de confianza, esto quiere decir que se rechaza la hipótesis nula por lo cual cuncluiriamos que las varianzas son diferentes
3. La prueba actual de un solo disco se tarda 2 minutos. Se propone un nuevo método de prueba que consiste en medir solamente los radios 24 y 57, donde casi es seguro que estará el valor mínimo buscado. Si el método nuevo resulta igual de efectivo que el método actual se podrá reducir en 60% el tiempo de prueba. Se plantea un experimento donde se mide la densidad mínima de metal en 18 discos usando tanto el método actual como el método nuevo. Los resultados están ordenados horizontalmente por disco. Así 1.88 y 1.87 es el resultado para el primer disco con ambos métodos.
a) Pruebe la igualdad de las medias usando la prueba pareada. ¿Cuál es el criterio de apareamiento? Ho: µa = µn Ha: µa ≠ µn P-value= 0.81 > α=0.05, No se rechaza la hipóte sis nula, es decir existe igualdad de las medias en cada uno de los métodos. b) Encuentre un intervalo para la diferencia de medias usando la desviación estándar de las diferencias. Interprete. Intervalos de Confianza para metodo nuevo - metodo actual Intervalos de confianza del 95.0% para la media: -0.00222222 +/- 0.0196381 [0.0218603; 0.0174158] Intervalos de confianza del 95.0% para la desviación estándar: [0.029633; 0.0592015] El intervalo de confianza de la diferencia de medias se encuentra entre (-0.02 – 0.02), se dice que los datos provienen de una distribución normal por lo que la media para ambos métodos se encuentra entre el intervalo con un 95% de confianza. c) Haga el análisis de los datos ignorando el apareamiento. Compare con los resultados del inciso a), ¿por qué ignorar el apareamiento es incorrecto? Ho: µa = µn Ha: µa ≠ µn
P-value=0.95 > α=0.05, es decir no se rechaza la hipótesis nula, se dice las medias no presentan diferencia estadísticamente significativa. En este caso se asume que las desviaciones estándar de los dos métodos son iguales, sin embargo es incorrecto ignorar el apareamiento debido a que no se tienen en cuenta los datos necesarios para la prueba.
d) Determine un intervalo de confianza para la diferencia de medias suponiendo muestras independientes. Compare con el inciso b). Comparación de Medias Intervalos de confianza del 95.0% para la media de método nuevo: 1.96056 +/0.0571971 [1.90336; 2.01775] Intervalos de confianza del 95.0% para la media de método actual: 1.96278 +/0.0558937 [1.90688; 2.01867] Intervalos de confianza del 95.0% intervalo de confianza para la diferencia de medias suponiendo varianzas iguales: -0.00222222 +/- 0.0770322 [-0.0792544; 0.07481] No se presenta diferencia significativa entre las medias de las dos muestras. e) ¿Qué se gana con el apareamiento de los datos en este caso? Se busca delimitar los errores que se presentan en el momento del análisis de dos muestras, porque el tomar datos en pares permite un análisis estadístico más detallado. f) ¿Recomendaría usted la adopción del método nuevo? Argumente su respuesta. El recomendar el nuevo método es irrelevante puesto que en comparación con el método actual no hay diferencia en densidad del metal míni ma que se requiere para cada disco, por lo tanto los discos pueden ser sometidos por cualquiera de los dos métodos y darán resultados iguales.
4.
a) las diferencias son significativas estadísticamente? Realizamos el análisis de varianza
Indica una diferencia estadísticamente significativa Como el valor P es mucho menor que 0.05 se puede concluir que hay diferencias estadísticamente significativas entre la media PRODUCTO DEFECTUOSOS para los niveles de la prueba con y sin tratamientos con un 95,0% de nivel de confianza.
b) cual es el porcentaje de defectos que se espera con el nuevo tratamiento?
Se espera que el promedio de productos actual que es de 9.272 se disminuya en 3.16 para que existan un total de 6.216 piezas defectuosas. c) Cuantifique el nivel de reducción que se logró con el tratamiento propuesto? La disminución es de 3.16 piezas defectuosas, por cada 25 piezas con tratamientos.
5. Para estudiar la confiabilidad de ciertos tableros electrónicos para carros, se someten a un envejecimiento acelerado durante 100 horas a determinada temperatura, y como variable de interés se mide la intensidad de corriente que circula entre dos puntos, cuyos valores aumentan con el deterioro. Se probaron 20 módulos repartidos de manera equitativamente en cinco temperaturas y los resultados obtenidos fueron los siguientes:
a) Formule la hipótesis y el modelo estadístico para el problema. Hipótesis:
Para al menos un par de medias ij. Donde { 1,2,3,4… 1,2,3,4… Modelo estadístico:
yij μ + εij { 1,2,3,4… 1,2,3,4…
yij Es la observación ij-ésima. μ Es la media del nivel del factor o tratamiento i-ésimo. εij Es un componente del error aleatorio que incorpora todas las demás fuentes de variabilidad del experimento
b) Realice el análisis de varianza para estos datos, a fin de estudiar si la temperatura afecta la intensidad de corriente promedio. Tabla ANOVA para Intensidad de corriente por Temperatura Fuente Suma de Gl Cuadrado Razón-F Cuadrados Medio Entre 3411,8 4 852,95 68,05 grupos Intra 188,0 15 12,5333 grupos
Valor-P 0,0000
Total (Corr.)
3599,8
19
Debido a que el P- valor es menor a 0,05 existe una diferencia significativa entre la media de intensidad de corriente entre los niveles de temperatura, por lo tanto, la temperatura si afecta a la intensidad de corriente promedio.
Método: 95,0 porcentaje LSD Temperatu Casos Media Grupos ra Homogéneos 20 4 14,5 X 40 4 16,25 X 60 4 22,25 X 80 4 31,25 X 100 4 50,25 X Contrast Sig. Diferenci +/e a Límites 20 – 40 -1,75 5,33574 20 – 60 * -7,75 5,33574 20 – 80 * -16,75 5,33574 20 - 100 * -35,75 5,33574 40 – 60 * -6,0 5,33574 40 – 80 * -15,0 5,33574 40 - 100 * -34,0 5,33574 60 – 80 * -9,0 5,33574 60 - 100 * -28,0 5,33574 80 - 100 * -19,0 5,33574 * indica una diferencia significativa.
Gráfico Caja y Bigotes
20 40
a r u t a r e 60 p m e T
80
100 0
10
20
30 40 Intensidad de corriente
50
60
Además al realizar el método LSD o pruebas de múltiples rangos para la intensidad de corriente de las medias y el grafico de caja y bigotes con respecto a los niveles de temperatura se puede concluir que no existe una diferencia significativa entre el rango de 20 a 40 grados de temperatura, pero si existe una diferencia significativa de 40 a 60, de 60 a 80 y de 80 a 100, por lo que se deducir que los niveles de temperatura a medida que van aumentando deterioran progresivamente a los tableros electrónicos. Por otra parte a temperatura ambiente (entre 20 y 40 grados) los tableros electrónicos se deterioran menos.
c) ¿La temperatura afecta la variabilidad de las intensidades? Es decir, verifique si hay igual varianza entre los diferentes tratamientos. Verificación de Varianza Prueba Valor-P de 1,2056 0,649156 Bartlett 1 Comparació Sigma1 Sigma2 n 20 / 40 2,6457 4,1129 5 9 20 / 60 2,6457 2,5 5 20 / 80 2,6457 2,5 5 20 / 100 2,6457 5,1234 5 8
F-Ratio
P-Valor
0,41379 0,4876 3 1,12 0,9280 1,12
0,9280
0,26666 0,3064 7
40 / 60
60 / 80 60 / 100
4,1129 9 4,1129 9 4,1129 9 2,5 2,5
80 / 100
2,5
40 / 80 40 / 100
2,5
2,70667 0,4352
2,5
2,70667 0,4352
5,1234 8 2,5 5,1234 8 5,1234 8
0,64444 4 1,0 0,23809 5 0,23809 5
0,7269 1,0000 0,2692 0,2692
Puesto que el valor-P es mayor o igual que 0,05, no existe una diferencia estadísticamente significativa entre las desviaciones estándar, por ende la temperatura no afecta a la variabilidad de la intensidad de corriente.
6. Se hace un estudio sobre la efectividad de tres marcas de atomizador para matar moscas. Para ello, cada producto se aplica a un grupo de 100 moscas, y se cuenta el número de moscas muertas expresado en porcentajes. Se hicieron seis réplicas, pero en días diferentes; por ello, se sospecha que puede haber algún efecto importante debido a esta fuente de variación. Los datos obtenidos se muestran a continuación:
a) Suponiendo un DBCA, formule las hipótesis adecuadas y el modelo estadístico.
5 6 Para al menos un par de medias ij. Donde { 1,2,3,4… 1,2,3,4… b) ¿Existe diferencia entre la efectividad promedio de los atomizadores? Análisis de Varianza para Promedio de moscas muertas - Suma de Cuadrados Tipo III Fuente Suma de Gl Cuadrado Razón-F Valor-P Cuadrados Medio EFECTOS PRINCIPALES A:Sprays 296,333 2 148,167 2,88 0,1028
B:BLOQUE 281,333 5 56,2667 1,09 RESIDUOS 514,333 10 51,4333 TOTAL (CORREGIDO) 1092,0 17 Todas las razones-F se basan en el cuadrado medio del error residual
0,4207
Como P-Valor es mayor a 0,05 se concluye que no hay suficiente evidencia estadística para afirmar que la media de la efectividad de los atomizadores es diferente, por lo que se infiere que no afecta significativamente el estudio realizado.
c) ¿Hay algún atomizador mejor? Argumente su respuesta. Pruebas de Múltiple Rangos para Promedio de moscas muertas por Sprays Método: 95,0 porcentaje LSD Sprays Casos Media LS Sigma LS Grupos Homogéneos 2 6 59,1667 2,92784 X 3 6 62,8333 2,92784 XX 1 6 69,0 2,92784 X Contrast Sig. Diferenci +/e a Límites 1-2 * 9,83333 9,22582 1-3 6,16667 9,22582 2-3 -3,66667 9,22582 * indica una diferencia significativa.
De acuerdo a la prueba LSD se puede concluir que hay diferencias significativas entre 1 y 2 lo que nos dice al mismo tiempo que las demás combinaciones son similares entre sí; también que el atomizador 3 es neutral en cuanto a los otros dos, siendo este mejor que el atomizador 2 pero no con respecto al 1. Por tal razón se dice que el atomizador 1 es el mejor con una media LSD de 69,0. Y se puede comprobar a través del siguiente gráfico.
Medias y 95,0% de Fisher LSD
74 s at r e
70 u m s a c
66 s o m e
62 d oi d e m
58 or P
54 1
2 Sprays
3
d) ¿Hay diferencias significativas en los resultados de diferentes días en que se realizó el experimento? Argumente su respuesta. Análisis de Varianza para Promedio de moscas muertas - Suma de Cuadrados Tipo III Fuente Suma de Gl Cuadrado Razón-F Valor-P Cuadrados Medio EFECTOS PRINCIPALES A:Sprays 296,333 2 148,167 2,88 0,1028 B:BLOQUE 281,333 5 56,2667 1,09 0,4207 RESIDUOS 514,333 10 51,4333 TOTAL (CORREGIDO) 1092,0 17
Como P- value > 0,05 se puede concluir que hay indicios de que no hay diferencias entre los días en que se hizo el estudio estadístico por lo que la formación de bloques no afectaba el experimento.
e) Verifique los supuestos de normalidad y de igual varianza entre las marcas. Pruebas de Normalidad para RESIDUOS Prueba Estadístic Valor-P o Estadístico W de Shapiro- 0,957418 0,547789 Wilk
Puesto que P- value es mayor que 0,05 los datos provienen de una distribución normal.
Verificación de Varianza
de Bartlett
Prueba Valor-P 1,2848 0,77376 6
Comparació Sigma1 Sigma2 n 1/2 3,7230 7,8863 5 4 1/3 3,7230 6,2070 5 8 1/4 3,7230 8,0225 5 3 1/5 3,7230 3,0595 5 9 1/6 3,7230 8,2982 5 6 2/3 7,8863 6,2070 4 8 2/4 7,8863 8,0225 4 3 2/5 7,8863 3,0595 4 9 2/6 7,8863 8,2982 4 6 3/4 6,2070 8,0225 8 3 3/5 6,2070 3,0595 8 9 3/6 6,2070 8,2982 8 6 4/5 8,0225 3,0595 3 9 4/6 8,0225 8,2982 3 6 5/6 3,0595 8,2982 9 6
F-Ratio
P-Valor
0,22286 8 0,35976 9 0,21536 5 1,48071
0,3645 0,5292 0,3544 0,8062
0,20129 0,3351 1 1,61427 0,7650 0,96633 0,9829 6 6,64391 0,2616 0,90318 0,9491 6 0,59862 0,7489 4,11573 0,3910 0,5595
0,7175
6,87536 0,2540 0,93465 0,9662 0,13594 0,2393 2
Como el P- value > 0,05 se cumple el supuesto de igualdad de varianza para el factor bloque.
Verificación de Varianza Prueba Valor-P
de Bartlett
1,0962 0,531069 4
Comparació Sigma1 Sigma2 n 1/2 4,0442 6,5819 6 1/3 4,0442 6,5718 2 2/3 6,5819 6,5718 6 2
F-Ratio
P-Valor
0,37753 0,3087 3 0,37869 0,3102 8 1,00309 0,9974
Dado que el p- valor > 0,05 se cumple el supuesto de igualdad de varianza para el factor tratamiento.