Diseño de Bloques Completos Randomizado Un diseño de Bloques Completos Randomizado es aquel cumple con las siguientes condiciones: 1) Las unidades experimentales se distribuyen en grupos o bloques, de manera tal que las unidades experimentales dentro de cada bloque sean relativamente homogéneas y que el número de unidades experimentales dentro de un bloque sea igual al número de tratamientos por investigar; y 2) Los tratamientos se asignan al azar a las unidades experimentales dentro de cada bloque.
Ejemplo En los experimentos agrícolas, los bloques puede estar constituido por grupos de parcelas relativamente homogéneas que puede ser agrupados de acuerdo a gradiente de fertilidad, otro porque se encuentra en una pendiente.
Ventajas Este diseño tiene muchas ventajas, tales como 1.- En general es posible agrupar las unidades u nidades experimentales de modo que se logre mayor precisión con respecto a un Diseño completamente al azar 2.- La única restricción sobre el número de tratamiento por bloque y tratamiento es la disponibilidad de unidades experimentales 3.- Si se pierde información de todo un bloque o por contratiempo los datos de un bloque completo es inutilizable estos datos puede omitirse, porque el resto mantiene la misma estructura de un diseño de bloques completos al azar. 4.- Si se pierde información de algunas de las unidades estas estas puede estimarse.
Modelo Aditivo Lineal El modelo aditivo Lineal del Diseño de Bloques Completo al Azar con una observación por unidad experimental, La observación Y ij puede representarse por el modelo siguiente: Y ij i j ij ; i 1, 2,
, t y j 1, 2,
,b
donde: Y ij : es la respuesta obtenida de la unidad experimental del j -ésimo bloque sujeta al tratamiento i .
: El efecto de la media común. i : El verdadero efecto del i -ésimo tratamiento.
j : El verdadero efecto del j -ésimo bloque. ij : Es una variable aleatoria no observable llama do error
Para el proceso de inferencia se asume que ij es una variable aleatoria independiente que se distribuye normalmente con media cero y variancia común 2 .
Modelo I (efectos fijos) Se asume que los niveles de los factores son fijados por el investigador y estos efectos son desviaciones con respecto a la media. Entonces se cumple: b
t
0 ,
j
i
0
j 1
i 1
Modelo II (efectos aleatorios) Los niveles de los factores son elegidos aleatoriamente de poblaciones grandes. Entonces los i son variables aleatorias independientes distribuidas normalmente con media cero y variancia 2 , los j son variables aleatorias independientes distribuidas normalmente con media cero y variancia 2 ,
Modelo III (Modelo mixto) Los niveles de los tratamientos son fijados por el investigador y los niveles de los bloques son elegidos al azar en este caso se cumple que t
0 ; i
i 1
y los j son variables aleatorias independientes distribuidas normalmente con media cero y variancia 2 ,
Cuadro de Datos Bloques
tratamientos 1
1 Y 11
2 Y 12
b Y 1b
Total Y 1
2
Y 21
Y 22
Y 2b
Y 2
t
Y t 1
Y t 2
Y tb
Y t
Total
Y 1
Y 2
Y 2
Y
Yi
Donde :
b
, t ; Y j
j 1
Y
Y , para i 1, 2, ij
t
Y , para j 1, 2, ij
, b;
i 1
t
b
Y
ij
i 1 j 1
Estimación de Parámetro para el Modelo I Los estimadores de los parámetros pueden ser encontrados aplicando el método de los mínimos cuadrados. Con este método se obtiene: Y
Y
ˆ
tb
1 tb
t
b
Y ;
i Yi Y , para i 1, 2,
, t ;
ˆ
ij
i 1 j 1
j Y j Y , para j 1, 2, ˆ
,b
Siendo: b
Y i
Y i
b
t
Y ij
j 1
, Y j
b
Y j t
Y
ij
i 1
t
Residual o residuo eij Yij Yi Y j Y
ANÁLISIS DE VARIANCIA La variación total puede ser descompuesta de la siguiente forma: t
b
(Y
ij
i 1 j 1
t
b
t
b
t
b
Y ) (Yi Y ) (Y j Y ) (Yij Yi Y j Y ) 2 2
2
i1 j1
2
i 1 j 1
i 1 j 1
donde: SCTotal
t
b
(Y
ij
t
Y ) Y
i 1 j 1
SCTrat
t
b
2
2
ij
i 1 j 1
b
t
(Y
Y ) 2
i
i 1 j 1
Y i2
i 1
b
Y 2
es la medida de la variación total.
bt
Y 2 bt
es una medida de la variación entre tratamientos.
SCBloq
t
b
(Y
j
b
Y 2 j
j 1
t
Y ) 2
i 1 j 1
Y 2 tb
es una medida de la variación existente entre bloques
SCE
t
b
(Y
ij
Yi Y j Y )2 SCTotal SCTrat SCBloq , es la variación
i 1 j 1
debido a otros factores no considerados en el modelo.
Cuadrados Medios Los cuadrados Medios se definen como el cociente entre la suma de los cuadrados y sus respectivos grados de libertad: CMBloq
SCBloq b 1
,
CMTrat
SCTrat t 1
, CME
SCE
b 1 t 1
Luego, se tiene el siguiente cuadro de ANVA Fuente de Variación Bloques
SC
GL
CM
SCBloq
b-1
CMBloq
t-1
CMTrat
Tratamientos SCTrat Error Total
SCE SCTotal
(b-1)(t-1) bt-1
CME
Cuadrados Medios Esperados Modelo I Modelo II b t 2 t 2 2 2 j b 1 j 1
2
b
t
t 1 i 1
2 i
2
2 b 2 2
Prueba de Hipótesis (Modelo I) H p : 1 2
t 0
H a : i 0 , para al menos un i Nivel de Significación
El cual es equivalente H p : 1 2
t
H a : al menos dos i son diferentes
Fc
CMTrat CME
~ F t 1, b1t 1 / si la Hp es cierta
Nota: Como los bloques son fijados y no cumple con el principio de aleatorización no se puede realizar pruebas de hipótesis sobre los efectos de bloques. En lugar de esto se puede encontrar eficiencia relativa respecto a un diseño completamente al azar, el cual se define: SCBloq b(t 1)CME tb 1 CME
ER
Si ER 1 entonces el Diseño de Bloques Completos al Azar es más eficiente que un Diseño Completamente al azar.
Ejemplo: Se llevó a cabo un experimento para señalar los méritos de 5 gasolinas. Debido a que es inevitable la variación en eficiencia de vehículo a vehículo, la prueba se realizó un experimento con 5 automóviles, que de aquí en adelante llamaremos bloques. Se dispone de las siguientes descripciones de las 5 gasolinas: A: Control B: Control + aditivo X elaborado por la compañía I C: Control + aditivo Y elaborado por la compañía I D: Control + aditivo U elaborado por la compañía II E: Control + aditivo V elaborado por la compañía II Los tipos de gasolinas fueron probadas en cada carro en orden aleatorio. Los datos, en Km/litros, se dan continuación:
Tratamiento Gasolina A B C D E Total
1
Bloques (vehículo) 2 3 4 5
Total
8 10 8 9 10 45
7 9 8 8 9 41
34 43 44 40 43 204
6 8 9 8 8 39
6 7 9 8 7 37
7 9 10 7 9 42
Modelo Aditivo Lineal: Y ij i j ij ; i 1, 2, 3, 4 y5 y j 1, 2, 3, 4 y 5 Donde: Y ij : es rendimiento en Km/litro obtenido del j -ésimo vehículo con el i -ésimo tipo de de gasolina.
: El efecto de la media común. i : El verdadero efecto del i -ésimo tipo de gasólina
j : El verdadero efecto del j -ésimo vehículo. ij : Son los efectos no observado del j-ésimo vehículo con el i-ésimo tipo de
gasolina llamado error Ejemplo de cálculo de algunos efectos estimado y residual 34 204 1 Y1 Y 1.36 5 25 41 204 2 Y2 Y 0.04 5 25 e12 Y12 Y1 Y2 Y 7 6.8 8.2 8.16 0.16 ˆ
ˆ
Cuadro de ANVA 5
5
Y ij2 82 72
5
Y
92 1696 ,
2 i
i 1 j 1 5
Y
2
j
342 432
i 1
452 412
422 8360
j 1
SCBloq SCTrat
b
Y 2 j
j 1
t
Y i2
t
b
SCTotal
tb
Y 2 bt
i 1
t
Y 2
b
8360
8390
5
5
204
i 1 j 1
7.36
25
204 25
Y 2
Y bt 1696 2
2
2
13.36
204
ij
25
2
31.36
SCE SCTotal SCTrat SCBloq 31.36 7.36 13.36 10.64 Fuente de Variación Carros Gasolinas Error Total
SC
GL
CM
Fc
7.36 13.36 10.64 31.36
4 4 16 24
1.84 3.34 0.665
5.0226
H p : 1 2 3 4 5 H a : al menos dos i son diferentes 0.05
432 8390 ,
F c
CMTrat CME
3.34 0.665
5.0226
F 0.95,4,4 3.01 , como Fc F 0.95,4,4 , se rechaza la H p . gasolina<-read.table("gasolina.txt",T) rendimiento<-gasolina[,1] vehiculo<-factor(gasolina[,2]) tipos<-gasolina[,3] modeg<-lm(rendimiento~vehiculo+tipos) anva<-anova(modeg) anva Analysis of Variance Table Response: rendimiento Df Sum Sq Mean Sq F value Pr(>F) vehiculo 4 7.360 1.840 2.7669 0.063664 . tipos 4 13.360 3.340 5.0226 0.008138 ** Residuals 16 10.640 0.665 --Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
cm<-anva$Mean sc<-anva$Sum nt<-tapply(rendimiento,vehiculo,length) t<-nt[1] nb<-tapply(rendimiento,tipos,length) b<-nb[1] ER<-((sc[1]+b*(t-1)*cm[3])/(t*b-1))/cm[3] ER 1 1.294486
Como ER>1 el uso de bloques ha sido efectivo para reducir el error experimental
Comparaciones Múltiples (Modelo I) Si se define que i i entonces un estimador de i esta dado por i Yi
1
ˆ
la variancia de Y i , para i 1, 2,
var Y i
2 b
b
b
Y , ij
j 1
, t está dado por: , y su estimado está dado por: S Y 2 i
CME b
la variancia de Yi Y l , para i l y i, l 1, 2, 2 2
var Yi Y l
b
, t , está dado por:
y su estimado está dado por S Y2 Y i
l
2CME b
Prueba de t Hipótesis Caso A Bilateral
Caso B Unilateral a la Derecha
Caso C Unilateral a La Izquierda
H p : i l k
H p : i l k
H p : i l k
H a : i l k
H a : i l k
H a : i l k
Para i l ; i, l 1, 2,
, t
Nivel de significación Estadística de prueba: Yi Yl k
tc
S Y
~ t gle / H p es verdadera
i Y l
Decisión Se Acepta
Caso A
H p
Se Rechaza
t
2 , gle
tc t
tc t
H p
2 , gle
1 2 , gle
ó tc t
1 2 , gle
Caso B
Caso C
tc t 1 ; gle
tc t ; gle
tc t 1 ; gle
tc t ; gle
Diferencia Mínima de Significación (DMS), también se le conoce con el nombre de diferencia límite de significación H p : i l H a : i l Para i l , i, l 1, 2,
, t
Nivel de significación Entonces si definimos DMS i, l t
S
Yi Y l 1 ,GLE 2
Luego, un criterio para examinar si existe diferencia significativa entre medias de tratamiento se puede usar este criterio de la diferencia mínima significante DMS i, l . Esto es, se rechaza H 0 si Yi Yl DMS i, l
Para i l , i, l 1, 2,
, t
Ejemplo: Con los datos del ejemplo de gasolina, suponga que fue planeado realizar la comparación entre la gasolina D y E. Realice la prueba de t aun nivel de significación 0.05 , para realizar esta comparación Las medias de los rendimientos está dado por: Y A 6.8 ,
Y B 8.6 , Y C 8.8 , Y D 8.0 , Y E 8.6
H p : D E o H p : D E 0 H a : D E o H a : D E 0 0.05
t c
2 T 0.975,16 2.22 , S Y D Y E
Y D YE k S Y
D Y E
8 8.6 0 0.266
2CME b
2 0.665 5
0.266
-1.16335 . Se acepta H p
Con lenguaje R > gasolina<-read.table("gasolina.txt",T) > str(gasolina) 'data.frame': 25 obs. of 3 variables: $ rendimiento: int 8 10 8 9 10 7 9 8 8 9 ... $ bloques : int 1 1 1 1 1 2 2 2 2 2 ... $ aditivo : Factor w/ 5 levels "a","b","c","d",..: 1 2 3 4 5 1 2 3 4 5 ... > rendimiento<-gasolina[,1] > vehiculo<-as.factor(gasolina[,2]) > tipos<-gasolina[,3] modeg<-lm(rendimiento~vehiculo+tipos) modeg Call: lm(formula = rendimiento ~ vehiculo + tipos) Coefficients: (Intercept) 7.64 tiposc 2.00
vehiculo2 -0.80 tiposd 1.20
vehiculo3 -1.20 tipose 1.80
vehiculo4 -1.60
vehiculo5 -0.60
tiposb 1.80
El lenguaje R da unos estimados de efectos para los dos factores. Para el caso de gasolina viene hacer la diferencia de la medias de tratamientos de B, C, D y E con respecto a la media de tratamiento de A, respectivamente. > mediat<-tapply(rendimiento,tipos,mean) > mediat a b c d e 6.8 8.6 8.8 8.0 8.6 > mediaD<-mediat[4]
> mediaE<-mediat[5] > esdmedia<-sqrt(2*(deviance(modeg)/df.residual(modeg))/5) > esdmedia a 0.5157519 > tc<-(mediaD-mediaE-0)/esdmedia > tc d -1.16335 > pvalue<-2*pt(tc,df.residual(modeg)) > pvalue d 0.2617441 Se acepta Hp
Prueba de Tukey-Cramer (Tukey HSD) Planteamiento de hipótesis H p : i l H a : i l
Para i l , i, l 1, 2,
, t
Nivel de significación Cálculo del Valor Crítico: w q t , GLE
1 2
SY Y i
l
donde: q t , GLE =amplitud estudiantizada para la prueba de Tukey t = número de tratamiento a comparar GLE = Grados de libertad del error Se rechaza H 0 aun nivel de significación , si Yi Yl w
Ejemplo: Con los datos del ejemplo de gasolina, realice la prueba de Tukey a un nivel de significación 0.05 , para realizar esta comparación H p : i i H a : i i para i, i A, B, C , D, E , i i 0.05 , q 0.95,5,16 4.33 CME 0.665 w q 0.95,5,16
CME 5
4.33
0.665 5
1.5791
Comparación
> > > >
Yi Y i
Significancia
S Y
i Y l
w
B-A
1.8
0.5157519
1.579115
significativo
C-A
2
0.5157519
1.579115
significativo
D-A
1.2
0.5157519
1.579115
No significativo
E-A
1.8
0.5157519
1.579115
significativo
C-B
0.2
0.5157519
1.579115
No significativo
D-B
0.6
0.5157519
1.579115
No significativo
E-B
0
0.5157519
1.579115
No significativo
D-C
0.8
0.5157519
1.579115
No significativo
E-C
0.2
0.5157519
1.579115
No significativo
E-D
0.6
0.5157519
1.579115
No significativo
library(multcomp) amod<-aov(rendimiento~vehiculo+tipos) comptipos<-glht(amod,linfct=mcp(tipos="Tukey")) confint(comptipos) Simultaneous Confidence Intervals
Multiple Comparisons of Means: Tukey Contrasts
Fit: aov(formula = rendimiento ~ vehiculo + tipos) Estimated Quantile = 3.0637 95% family-wise confidence level
Linear Hypotheses: Estimate b - a == 0 1.8000 c - a == 0 2.0000 d - a == 0 1.2000 e - a == 0 1.8000 c - b == 0 0.2000 d - b == 0 -0.6000 e - b == 0 0.0000 d - c == 0 -0.8000 e - c == 0 -0.2000 e - d == 0 0.6000
lwr upr 0.2199 3.3801 0.4199 3.5801 -0.3801 2.7801 0.2199 3.3801 -1.3801 1.7801 -2.1801 0.9801 -1.5801 1.5801 -2.3801 0.7801 -1.7801 1.3801 -0.9801 2.1801
> summary(comptipos) Simultaneous Tests for General Linear Hypotheses Multiple Comparisons of Means: Tukey Contrasts
Fit: aov(formula = rendimiento ~ vehiculo + tipos) Linear Hypotheses: Estimate Std. Error t value Pr(>|t|)
b - a == 0 1.8000 0.5158 3.490 0.0219 * c - a == 0 2.0000 0.5158 3.878 0.0100 * d - a == 0 1.2000 0.5158 2.327 0.1871 e - a == 0 1.8000 0.5158 3.490 0.0217 * c - b == 0 0.2000 0.5158 0.388 0.9947 d - b == 0 -0.6000 0.5158 -1.163 0.7712 e - b == 0 0.0000 0.5158 0.000 1.0000 d - c == 0 -0.8000 0.5158 -1.551 0.5467 e - c == 0 -0.2000 0.5158 -0.388 0.9947 e - d == 0 0.6000 0.5158 1.163 0.7712 --Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1 (Adjusted p values reported -- single-step method)
Se ha encontrados diferencias significativas entre las siguientes comparaciones de medias de rendimientos: - Entre la media de los rendimientos obtenidos con la gasolina tipo B y A - Entre la media de los rendimientos obtenidos con la gasolina tipo C y A - Entre la media de los rendimientos obtenidos con la gasolina tipo E y A Entre las otras comparaciones no se ha encontrados diferencias significativas a un nivel de significación del 10º%
A 6.8
D 8.0
B 8.6
E 8.6
C 8.8
De acuerdo a estos resultados se puede recomendar las gasolina tipo B, E y C por tener los mayores rendimientos Prueba de Dunnett (comparaciones de todas las medias de tratamientos con un control o testigo) H p : i 1 H a : i 1 , para i 2,
, t
Donde: 1 = es la media del tratamiento testigo o de control Nivel de significación Valor Crítico: d t Dunnet , p, GLE SYi Y 1 , para i 2,
, t
donde : t Dunnet , t , GLE = t de Dunnett con un nivel de significación .
p = número de tratamiento a comparar con el control GLE = Grados de libertad del error
Se rechaza H 0 aun nivel de significación , si Yi Y1 d , para i 2,
, t
Ejemplo: En el ejemplo de la gasolina suponga que A es el tratamiento Control. Realice la prueba de Dunnett a un nivel 0.05 H p : i A H a : i A , para i B, C , D, E Y A 6.8 , S Y2 Y i
A
Y B 8.6 , Y C 8.8 , Y D 8.0 , Y E 8.6 ;
2CME b
2 0.665 5
d t Dunnet 0.5,4,16 S Y
i
Y A
0.266
(2.34)( 0.266) 1.206859
Comparación
Yi Y A
d t Dunnet 0.5, 4,16 S Yi Y A
B-A C-A D-A E-A
1.8 2.0 1.2 1.8
1.206859 1.206859 1.206859 1.206859
> amod<-aov(rendimiento~vehiculo+tipos) > comptipos<-glht(amod,linfct=mcp(tipos="Dunnett")) > confint(comptipos) Simultaneous Confidence Intervals Multiple Comparisons of Means: Dunnett Contrasts
Fit: aov(formula = rendimiento ~ vehiculo + tipos) Estimated Quantile = 2.7086 95% family-wise confidence level
Linear Hypotheses: Estimate lwr upr b - a == 0 1.8000 0.4030 3.1970 c - a == 0 2.0000 0.6030 3.3970 d - a == 0 1.2000 -0.1970 2.5970 e - a == 0 1.8000 0.4030 3.1970 > summary(comptipos)
significativo significativo No significativo significativo
Simultaneous Tests for General Linear Hypotheses Multiple Comparisons of Means: Dunnett Contrasts
Fit: aov(formula = rendimiento ~ vehiculo + tipos) Linear Hypotheses: Estimate Std. Error t value Pr(>|t|) b - a == 0 1.8000 0.5158 3.490 0.01017 * c - a == 0 2.0000 0.5158 3.878 0.00465 ** d - a == 0 1.2000 0.5158 2.327 0.10292 e - a == 0 1.8000 0.5158 3.490 0.01026 * --Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1 (Adjusted p values reported -- single-step method)
Prueba de t con contraste: Suponga que se desea probar la Hipótesis t
H p :
C 0 i
i
i 1 t
H a :
C 0 i
i
i 1
a un nivel de significación Estadística de Prueba Q
t
t
bCME
C
~ t GLE / H 0 es verdadera, siendo Q
2 i
t
t
C Y bC Y i i.
i 1
i i.
i 1
i 1
Luego se acepta H 0 si t
2 ,GLE
Prueba de Scheffé t
H 0 :
C 0 contra i
i
i 1 t
H a :
C 0 i
i
i 1
Nivel de significación Valor Crítico de la prueba
tc t
, caso contrario se rechaza.
1 2 ,GLE
VCS S L ˆ
GLTrat F1 ,GLTrat ,GLE
donde: L ˆ
t
C Y
i i.
i 1
S L ˆ
1 b
t
CME
C 2 i
i 1
Se acepta H 0 , si L VCS ˆ
Se rechaza H 0 , si L VCS ˆ
El Método de Bonferroni Hipótesis: H 0 : i l H a : i l , para i l , y i, l 1, 2,
. t
VCB i, l t
S
Yi . Y l . ,GLE 1 2 nc
donde: S Y
i . Y l .
Se rechaza H 0 para i l , y i, l 1, 2,
2CME b
. t , si
Yi. Yl . VCB i, l
Ejemplo: Con los datos del ejemplo de gasolina, use la prueba de t para probar el siguiente contraste a un nivel de significación 0.05 : ( B, C, D, E ) versus A. H p : B C D E 4 A H a : B C D E 4 A 0.05 T 0.975,16 2.11 , se acepta H p si: 2.12 t c 2.12 caso contrario se rechaza.
Qb
5
C Y 5 4 6.8 1 8.6 1 8.8 1 8.0 1 8.6 34 i i
i 1
Q
t c
t
bCME
34
5 0.665 4 1 1 1 1 2
C
2 i
2
2
2
2
4.16934
i 1
Como t c
2.12 , se rechaza H p .
Con lenguaje R > > > > >
vmedia<-tapply(rendimiento,tipos,mean) ci<-c(-4,1,1,1,1) q<-5*ci%*%vmedia tc<-q/sqrt(5*(deviance(modeg)/16)*sum(ci^2)) tc [,1] [1,] 4.169348 > pvalue<-2*(1-pt(tc,16)) > pvalue [,1] [1,] 0.000723429
Ejemplo: Con los datos del ejemplo de gasolina, use la prueba de Scheffé para probar el siguiente contraste a un nivel de significación 0.05 : ( B, C, D, E ) versus A H p : B C D E 4 A 0 H a : B C D E 4 A 0 0.05 F 0.95,4,16 3.01 L ˆ
t
C Y 4 6.8 1 8.6 1 8.8 1 8.0 1 8.6 6.8 i i.
i 1
L 6.8 ˆ
S L ˆ
1 b
t
CME
ˆ
ˆ
2 i
i 1
VCS S L Como L
C
1 5
2 0.665 4 12 12 12 12 1.630951
GLTrat F1 ,GLTrat ,GLE 1.630951 4 3.01 5.659188
VCS , se rechaza H p .
Con Lenguaje R
> absl<-abs(ci%*%vmedia) > absl [,1] [1,] 6.8 > sl<-sqrt((1/5)*(deviance(modeg)/16)*sum(ci^2)) > sl [1] 1.630951 > vcs<-sl*sqrt(4*qf(0.95,4,16)) > vcs [1] 5.656289
Análisis de residuales gasolina<-read.table("c:/datos1/gasolina.txt",T) rendimiento<-gasolina[,1] vehiculo<-factor(gasolina[,2]) tipos<-gasolina[,3] modeg<-lm(rendimiento~vehiculo+tipos) par(mfrow=c(2,2)) plot(modeg)
Residuals vs Fitted s l a u d i s e R
23
5 . 0 5 . 1 -
24
6.0
7.5
3
9.0
s l a u d i s e r d e z i d r a d n a t S
Normal Q-Q 23
0 2 -
-2
Fitted values
s l a u d i s e r d e z i d r a d n a t S
24 23
3
0 . 0
6.0
7.5
-1
0
1
2
Theoretical Quantiles
Scale-Location 0 . 1
24
3
9.0
s l a u d i s e r d e z i d r a d n a t S
Fitted values
Constant Leverage: Residuals vs Factor Level 23
1 1 3 -
vehiculo : 4
3
2
5
1
Factor Level Combinations
ri<-rstandard(modeg) shapiro.test(ri) Shapiro-Wilk normality test data: ri W = 0.9362, p-value = 0.1207
24
3
> library(car) > ncvTest(modeg) Non-constant Variance Score Test Variance formula: ~ fitted.values Chisquare = 3.160140 Df = 1
p = 0.07545673
De acuerdo al gráfico de los valores predicho (o valores ajustado) versus los residuos, se puede observar que conforme los valores predichos aumenta la variabilidad de los residuos también aumenta (en forma de embudo), y también se puede observar que el lowes de la raíz cuadrada de valores absolutos de residuales estandarizados (estudentizados internamente) en función de los valores predichos tiene una tendencia sistemática creciente. Por último, en el cuarto gráfico se puede observar que el único residuo estandarizado que sobrepasa los límites 2 es el de la observación 3, siendo este el único valor extremo Todo esto indica que es probable que no se cumpla con el supuesto de homogeneidad de variancia. También, el gráfico de probabilidad normal de los residuos estandarizado en da evidencia de que posiblemente el supuesto de normalidad no se cumpla causado posiblemente por los valor extremo o de las observaciones con residuos estandarizados cercanos al límite 2 , pero al realizar la prueba de Shapiro Wild esta se acepta para niveles de significación menores a 0.1207. También al realizar la prueba de Homogeneidad de variancia esta resulta significativa a un nivel de significación del 10%, esto es que se encontrado suficiente evidencia para afirmar que no se cumple con este supuesto. Una alternativa es realizar transformaciones para estabilizar la variancia y realizar el análisis con los datos transformados, ya que el incumplimiento de este supuesto hace que las pruebas de hipótesis realizadas en el ANVA y pruebas de comparación no tengan validez.