Dirección General de Educación Superior Tecnológica Instituto Tecnológico de Toluca
Ingeniería Industrial Estadística Inferencial II
Nombre: DAVID MARES CASAS, EMMANUEL HERNADEZ SOBERANES No. Control: 12280132, 12280290 Tarea 2. Diseño de Experimentos de un Factor Instrucciones:
Envía este archivo ya revisado y terminado al correo
[email protected]. correo
[email protected]. Indica en el asunto la materia y la actividad. Resuelve correctamente correctam ente en R los problemas siguientes, incluye el script, gráficas y en base a los resultados obtenidos justifica tus respuestas.
Texto: Gutiérrez P. H., De la Vara S. R. 2012. Análisis y Diseño de Experimentos. 3ª Edición. McGraw Hill
11. Se hace un estudio sobre la efectividad de tres marcas de spray para matar moscas. Para ello, cada producto se aplica a un grupo de 100 moscas, y se cuenta el número de moscas muertas expresado en porcentajes. Se hacen seis réplicas y los resultados obtenidos se muestran a continuación Réplica Spray A B C
1 72 55 64
2 65 59 74
3 67 68 61
4 75 70 58
a) Formule la hipótesis adecuada y el modelo estadístico
Hipótesis a contrastar:
Modelo estadístico: estadístico:
5 62 53 51
6 73 50 69
b) ¿Existe diferencia entre la efectividad promedio de los productos en spray? Respuesta:
Para contestar esta pregunta se calcula el estadístico datos que nos proporciona la tabla ANOVA:
con los
Y en base a las hipótesis:
Para confirmar que se rechaza la hipótesis nula se debe cumplir la siguiente inecuación: . Por el cual para probar esto se asigna que con el cual al hacer uso de R o uso de tablas F inferimos que .= 3.68 quedando así la inecuación. 2.79>3.68; dado que no se cumple podemos decir que no se rechaza la dado que la efectividad promedio de los tres productos de sprays son estadísticamente iguales y no diferentes con α=0.05, se hace la aclaración ya que como en este estudio prefijamos un α=0.05, también pudimos haber
prefijado un α=0.1 y en este caso sería todo lo contrario ya que aquí
se rechazaría la hipótesis nula.
c) ¿Hay algún spray mejor?
Respuesta:
Para responder esta pregunta solo basta con mirar la gráfica de cajas o con la prueba de hipótesis, pero antes de eso tenemos que tener bajo qué condiciones podríamos decidir cuál spray elegir, en este caso como podemos ver en la gráfica cajas cada spray está dado por las moscas muertas o eficiencia de cada spray; entonces podríamos elegir a conveniencia el SPRAY A ya que este puede alcanzar a matar un promedio mayor de moscas y con menor variabilidad; sin embargo esto es solo por conveniencia ya que todos los intervalos de los sprays con α=0.05 son estadísticamente iguales deduciendo que no hay un spray mejor . Aun que dado que el grafico de cajas muestra que las media del spray A es muy alejado, o diferente de los otros dos, el investigador tiene la decisión de concluir que en promedio son iguales o en verdad el spray A es diferente de los otros dos, para estar más seguro, proseguiremos a usar el METODO LSD para saber si hay un spray mejor. Estadísticamente se prosigue a formular aquellas igualdades de las medias de los spray para ello las hipótesis serian: 1. 2. 3. 4. 5. 6.
El estadístico está dado por:
| ̅ ̅ |
Y se rechaza hipótesis nula si:
Obteniendo:
√ ̅| ̅| ̅| ̅| ̅| ̅|
1. Para la diferencia entre el SPRAY A y el SPRAY B 9.8333 9.8333 > 8.96 Dado esto son diferentes. 2. Para la diferencia entre el SPRAY A y el SPRAY C 6.1667>8.96 Dado esto son iguales 3. Para la diferencia entre el SPRAY B y el SPRAY C 3.66663 3.6663>8.96 Dado esto son iguales
De tal manera podría ser elegido el SPRAY A como el mejor de entre los tres dado que este en promedio es igual al SPRAY C pero la única diferencia de entre estos dos es que el SPRAY A tiene menos variabilidad. Cabe mencionar que EL METODO LSD es uno de los más precisos y confiables todo depende de que tan fino sea el cálculo, ya que entre más potencia tenga el método, puede detectar diferencias más pequeñas, siempre y cuando estas reales.
d) Dé un intervalo al 95% de confianza para la efectividad promedio (porcentaje) de cada una de las marcas.
Respuesta: Para un intervalo de confianza de 100(1- α) por ciento para la media i-esimo se calcula con la fórmula:
del tratamiento
̅ √ ̅ √
quedando así los intervalos: PARA EL SPRAY A:
√ √
√ √ √ √
PARA EL SPRAY B:
PARA EL SPRAY C:
e) Dibuje el diagrama de caja simultáneos, e interprételos Gráfica
Interpretación Bueno en esta grafica de cajas podemos observar el valor mínimo, máximo, la mediana, los cuartiles, pero como notamos en el spray 3(C) existe mayor variabilidad que los otros dos, mas sin embargo; se puede observar que las medias del spray 3 ( C ) y del 2 (B) podrían ser iguales pero la del spray 1(A) no, pero para mayores conclusiones y mejor observación se realizara una prueba de hipótesis para la efectividad promedio de los tres sprays y también usando el METODO LSD para mayor seguridad , dado que el spray 1(A) podría ser el mejor candidato para usarse ya que tiene poca
variabilidad, mejor promedio de porcentaje de moscas muertas que los otros dos. f) Verifique los supuestos de normalidad y de igual varianza entre las marcas Respuesta: NORMALIDAD: Para comprobar que los datos fueron generados por un proceso normal se deben se deben generar las hipótesis a constatar, que son las siguientes.
Bueno en el software R se usa la función “shapiro.test()” para comprobar si hay
normalidad, del cual se obtuvo un p-valor general de los datos de 0.4149 el cual es mayor a 0.05 del cual no se rechaza la hipótesis nula e infiriendo que los datos fueron generados por un proceso normal. Sin embargo se puede observar la normalidad de los datos de cada marca utilizando en este caso la función “tapply(moscas,spray,shapiro.test)”del cual nos arroja t res pvalores de cada marca . Para el SPRAY A = 0.6471 Para el SPRAY B=0.4145 Para el SPRAY C=0.9975 Del cual en todas las marcas de spray al ser comparadas con el P-valor= 0.05, notamos que en todas no se rechaza la hipótesis nula, del cual podemos inferir que en cada marca de spray los datos fueron generados por un proceso normal. VARIANZA CONSTANTE(VARIANZAS IGUALES) Para comprobar este supuesto de varianza iguales solo basta en introducir la función Bartlett.test() el cual te arroja un p-valor en este caso 0.5519 del cual con respecto a las siguientes hipótesis:
Del cual dado que el p-valor es mayor al .05 podemos inferir que existe varianza constante. Estos se pueden comprobar en las gráficas que se muestran a continuación.
Script de R USO DE R: moscas=c(72,65,67,75,62,73,55,59,68,70,53,50,64,74,61,58,51,69) spray=c(1,1,1,1,1,1,2,2,2,2,2,2,3,3,3,3,3,3) datos=data.frame(moscas,spray) datos spray=factor(spray) spray is.factor(spray) ilm=lm(moscas~spray) ilm residuos=resid(ilm) residuos plot(fitted(ilm),residuos,xlab="fitted",ylab="Residuals",main="fitted vs residuals") hist(residuos) qqnorm(residuos) qqline(residuos) anova(ilm) shapiro.test(moscas) tapply(moscas,spray,shapiro.test) bartlett.test(moscas~spray,data=datos) USO DE (Rcmdr) Datos <- edit(as.data.frame(NULL)) library(abind, pos=4) library(e1071, pos=4) numSummary(Datos[,"MOSCAS"], groups=Datos$SPRAY, "IQR", "quantiles"), quantiles=c(0,.25,.5,.75,1))
statistics=c("mean",
"sd",
LinearModel.1 <- lm(MOSCAS ~ SPRAY, data=Datos) summary(LinearModel.1) anova(LinearModel.1) Boxplot(MOSCAS~SPRAY, data=Datos, id.method="y") plotMeans(Datos$MOSCAS, Datos$SPRAY, error.bars="conf.int", xlab="SPRAY", ylab="MOSCAS", main="GRAFICA DE MEDIAS") #SE COMPRUEBA LA NORMALIDAD CON EL TEST DE shapiro wilks shapiro.test(Datos$MOSCAS) #SE COMPRUEBA LA VARIANZA CONSTANTE tapply(Datos$MOSCAS, Datos$SPRAY, var, na.rm=TRUE) bartlett.test(MOSCAS ~ SPRAY, data=Datos)
level=0.95,
14. En una empresa de manufactura se propone un tratamiento para reducir el porcentaje de productos defectuosos. Para validar esta propuesta se diseñó un experimento en el que se producía con o sin la propuesta de mejora. Cada corrida experimental consistió en producir un lote y la variable de respuesta es el porcentaje de producto defectuoso. Se hicieron 25 réplicas para cada tratamiento. Los datos obtenidos se muestran a continuación. Porcentaje de producto defectuoso Con 5.3 4.0 4.0 4.0 2.6 2.1 5.1 4.1 4.1 3.2 tratamiento 2.2 1.1 2.0 3.0 3.1 2.1 1.2 3.3 2.1 4.0 Sin 8.0 13.2 7.2 8.2 9.1 6.7 12.2 16.3 9.2 6.4 tratamiento 8.7 11.3 4.5 6.6 9.2 10.2 10.6 13.3 5.2 6.2
5.1 2.2 4.1 2.0 3.0 7.2 17.2 12.3 8.0 4.8
a) ¿Las diferencias son significativas estadísticamente? Respuesta: Respuesta: summary(lm(defectuoso~tratamiento))
Call: lm(formula = defectuoso ~ tratamiento)
Residuals: Min 1Q -4.772 -1.244
Median -0.160
3Q 0.940
Max 7.928
Coefficients: Estimate
Std. Error t value
Pr(>|t|)
(Intercept) tratamientosintratamiento --Signif. codes:
3.1600 0.5054 6.253 6.1120 0.7147 8.552
1.03e-07 *** 3.27e-11 ***
0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Residual standard error: 2.527 on 48 degrees of freedom Multiple R-squared: 0.6038, Adjusted R-squared: 0.5955 F-statistic: 73.14 on 1 and 48 DF, p-value: 3.269e-11 anova(lm(defectuoso~tratamiento)) Analysis of Variance Table
Response: defectuoso Df tratamiento 1 Residuals 48 --Signif. codes:
Sum Sq 466.96 306.47
Mean Sq 466.96 6.38
F value 73.136
Pr(>F) 3.269e-11 ***
0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Como p-value<0.05 en ambos análisis, hace que exista una significativa diferencia entre ambos tratamientos. a) ¿Cuál es el porcentaje de defectos que se espera con el nuevo tratamiento? Respuesta: #MODELO LINEAL > summary(lm(defectuoso~tratamiento)) Call: lm(formula = defectuoso ~ tratamiento) Residuals: Min 1Q -4.772 -1.244
Median -0.160
3Q 0.940
Max 7.928
Coefficients: (Intercept) tratamientosintratamiento --Signif. codes:
Estimate Std. Error t value 3.1600 0.5054 6.253 0.7147 8.552 6.1120
Pr(>|t|) 1.03e-07 *** 3.27e-11 ***
0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Residual standard error: 2.527 on 48 degrees of freedom Multiple R-squared: 0.6038, Adjusted R-squared: 0.5955 F-statistic: 73.14 on 1 and 48 DF, p-value: 3.269e-11 El porcentaje esperado con el nuevo tratamiento es de 6.1120% b) Cuantifique el nivel de reducción que se logró con el tratamiento propuesto
Respuesta: #MODELO LINEAL > summary(lm(defectuoso~tratamiento)) Call: lm(formula = defectuoso ~ tratamiento) Residuals: Min 1Q -4.772 -1.244
Median -0.160
3Q 0.940
Max 7.928
Coefficients: Estimate Std. (Intercept) tratamientosintratamiento --Signif. codes:
3.1600
6.1120
Error t value 0.5054 6.253 0.7147 8.552
Pr(>|t|) 1.03e-07 *** 3.27e-11 ***
0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Residual standard error: 2.527 on 48 degrees of freedom Multiple R-squared: 0.6038, Adjusted R-squared: 0.5955 F-statistic: 73.14 on 1 and 48 DF, p-value: 3.269e-11 El nivel de reducción logrado con el tratamiento propuesto es de 3.16% Script de R: #EJERCICIO 14 U2 #CAPTURACIÓN DE DATOS defectuoso=c(5.3,4.0,4.0,4.0,2.6,2.1,5.1,4.1,4.1,3.2,5.1,2.2,4.1,2.2,1.1,2.0,3.0,3.1,2.1,1.2,3.3 ,2.1,4.0,2.0,3.0,8.0,13.2,7.2,8.2,9.1,6.7,12.2,16.3,9.2,6.4,7.2,17.2,12.3,8.7,11.3,4.5,6.6,9.2,1 0.2,10.6,13.3,5.2,6.2,8.0,4.8) contratamiento=c(5.3,4.0,4.0,4.0,2.6,2.1,5.1,4.1,4.1,3.2,5.1,2.2,4.1,2.2,1.1,2.0,3.0,3.1,2.1,1. 2,3.3,2.1,4.0,2.0,3.0) sintratamiento=c(8.0,13.2,7.2,8.2,9.1,6.7,12.2,16.3,9.2,6.4,7.2,17.2,12.3,8.7,11.3,4.5,6.6,9.2 ,10.2,10.6,13.3,5.2,6.2,8.0,4.8) tratamiento=factor(rep(c("contratamiento","sintratamiento"),c(25,25))) tratamiento #MODELO LINEAL summary(lm(defectuoso~tratamiento)) #TABLA ANOVA anova(lm(defectuoso~tratamiento))
REFERENCIAS Gutiérrez P. H., De la Vara S. R. 2012. Análisis y Diseño de Experimentos. 3ª Edición. McGraw Hil
EVALUACIÓN 11
14
Total
Dr. Manuel González De La Rosa
[email protected] Julio de 2014