2. Diseño de experimentos Curso 2011-2012 Estadística
2.1 Diseños Factoriales (dos factores)
Ejemplo A V E N E N O S
0.31 0.45 0.46 0.43 0.36 0.29 0.40 0.23 0.22 0.21 0.18 0.23
I
II
III
ANTÍDOTO B C 0.82 1.10 0.88 0.72 0.92 0.61 0.49 1.24 0.30 0.37 0.38 0.29
0.43 0.45 0.63 0.72 0.44 0.35 0.31 0.40 0.23 0.25 0.24 0.22
D 0.45 0.71 0.66 0.62 0.56 1.02 0.71 0.38 0.30 0.36 0.31 0.33
Se analiza el efecto de tres venenos y cuatro antídotos
en el tiempo de supervivencia de unas ratas. Diseño Experimentos
3
Modelo Factor 1
1 2 r o t c a F
2
J
1 y111
2 y 211
I y I 11
y112
y 212
y I 12
yijk ijk
i
j
ij
uijk ijk
Normalidad y11m y121
y 21m y 221
y I 1m y I 21
Independencia
y122
y 222
y I 22
Homocedasticidad
y12 m
y 22 m
y I 2 m
I J tra trattami amientos tos
y1 J 1
y 2 J 1
y IJ 1
m replicaciones
y1 J 2
y 2 J 2
y IJ 2
n = m I J y1 Jm
y 2 Jm
Diseño Experimentos
y IJm 4
Ejemplo A V E N E N O S
0.31 0.45 0.46 0.43 0.36 0.29 0.40 0.23 0.22 0.21 0.18 0.23
I
II
III
ANTÍDOTO B C 0.82 1.10 0.88 0.72 0.92 0.61 0.49 1.24 0.30 0.37 0.38 0.29
0.43 0.45 0.63 0.72 0.44 0.35 0.31 0.40 0.23 0.25 0.24 0.22
D 0.45 0.71 0.66 0.62 0.56 1.02 0.71 0.38 0.30 0.36 0.31 0.33
Se analiza el efecto de tres venenos y cuatro antídotos
en el tiempo de supervivencia de unas ratas. Diseño Experimentos
3
Modelo Factor 1
1 2 r o t c a F
2
J
1 y111
2 y 211
I y I 11
y112
y 212
y I 12
yijk ijk
i
j
ij
uijk ijk
Normalidad y11m y121
y 21m y 221
y I 1m y I 21
Independencia
y122
y 222
y I 22
Homocedasticidad
y12 m
y 22 m
y I 2 m
I J tra trattami amientos tos
y1 J 1
y 2 J 1
y IJ 1
m replicaciones
y1 J 2
y 2 J 2
y IJ 2
n = m I J y1 Jm
y 2 Jm
Diseño Experimentos
y IJm 4
Factor 1
1
...
2
I
...
1 1
2 r 2 o t c a F
1
2
11
1
21
I
1
I 1
I
2
I 2
... 1
2
12
2
2
22
...
J 1
J
1
2
I
2
J
IJ
Modelo
yijk
i I i 1 i
0
j J j
1
j
ij 0
: Media global
I i 1
ij
J j 1
ij
i:
Efecto del Factor 1 i , i=1,..., I I
j :
Efecto del Factor 2 j , j=1,...,J
ij :
uijk 0, 0,
j i
Interacción de niveles ij
uijk : Componente aleatoria N(0, Diseño Experimentos
2),
6
Estimación del modelo : 1 I 1 i : J 1 j : ( I 1)( J 1) ij : 2 : 1 J
m
k
1
m
i
y i
j
y
y i
j
2
I
mJ
j
y y i
y
j
y
2
m
1 k 1
y
y ij
ij
s R2
eijk IJ ( m 1)
I
m
yijk
yijk y ij
y
i j
1 k 1
y
mI
m
yijk
yijk y
J
i
1 j 1 k 1
n
Diseño Experimentos
7
Estimación del modelo yijk yijk eijk yijk (
Diseño Experimentos
i
j
ij
uijk
i
j
ij
eijk
i
j
ij
) yijk yij
8
Estimación ANTÍDOTO B C
A V
I
E N II
E N O
III
S
D
0.31 0.45 0.46 0.43
0.82 1.10 0.88 0.72
0.43 0.45 0.63 0.72
0.45 0.71 0.66 0.62
0.41
0.88
0.56
0.61
0.36 0.29 0.40 0.23
0.92 0.61 0.49 1.24
0.44 0.35 0.31 0.40
0.56 1.02 0.71 0.38
0.32
0.82
0.38
0.67
0.22 0.21 0.18 0.23
0.30 0.37 0.38 0.29
0.23 0.25 0.24 0.22
0.30 0.36 0.31 0.33
0.21
0.34
0.24
0.33
Diseño Experimentos
9
Estimación A
ANTÍDOTO B C
0,45 0,71 0,66 0,62
0,88
0,56
0,61
-0,038
0,067
0,032
-0,061
0,36 0,29 0,40 0,23
0,92 0,61 0,49 1,24
0,44 0,35 0,31 0,40
0,56 1,02 0,71 0,38
0,32
0,82
0,38
0,67
-0,060
0,073
-0,080
0,068
III
0,22 0,21 0,18 0,23
0,30 0,37 0,38 0,29
0,23 0,25 0,24 0,22
0,30 0,36 0,31 0,33
Medias
0,21
0,34
0,24
0,33
0,098
-0,139
0,048
-0,007
0,314
0,677
0,389
0,534
-0,164
0,198
-0,089
0,056
E Medias ij
II N Medias ij
ij
Medias
j
0,82 1,10 0,88 0,72
0,41
D
0,43 0,45 0,63 0,72
I
0,31 0,45 0,46 0,43
Diseño Experimentos
Medias
i
0,615 0,136
0,544 0,066
0,276 -0,202
0,479
10
Residuos RESIDUOS ANTÍDOTO B C
A V
I
E N II
E
-0.103 0.038 0.048 0.018
-0.060 0.220 0.000 -0.160
-0.128 -0.108 0.073 0.163
-0.160 0.100 0.050 0.010
0.00
0.00
0.00
0.00
0.040 -0.030 0.080 -0.090
0.105 -0.205 -0.325 0.425
0.065 -0.025 -0.065 0.025
-0.108 0.353 0.043 -0.288
0.00
0.00
0.00
0.00
0.010 0.000 -0.030 0.020
-0.035 0.035 0.045 -0.045
-0.005 0.015 0.005 -0.015
-0.025 0.035 -0.015 0.005
0.00
0.00
0.00
0.00
N O
III
S
D 2
2 eijk
s R2
IJ (m
Diseño Experimentos
1)
0,022
11
Análisis de la varianza yijk
i
j
uijk
ij
yijk
i
j
eijk
ij
yijk y
( y i
y
) ( y
j
y
) ( y ij
y i
y
j
y
) ( yijk y ij )
yijk y
( y i
y
) ( y
j
y
) ( y ij
y i
y
j
y
) eijk
I
J
m
I
( yijk y
)
J
m
I
2
( y i
i 1 j 1 k 1
y
)
J
m
( y
i 1 j 1 k 1 I
J
2
m
i
m
( yijk y )
2
I
I
mJ
1 j 1 k 1
y i
y
j
y
)
I
( y i
Diseño Experimentos
y
)
2
J
mI j
J
m i
J
m 2
eijk i 1 j 1 k 1
1
i
2
2
i 1 j 1 k 1
J
)
i 1 j 1 k 1
( y ij
I
y
j
1 j 1
( y ij
y i
y
j
( y j
)2
y
1
y
)
2
I
i
J
m
2 eijk
1 j 1 k 1
12
Variabilidades I
J
m
( yijk
y
)2
( y i
y
)2
( y
y
)2
VT i 1 j 1 k 1 I
VE ( A)
mJ i 1 J
VE ( B )
mI
j
j 1 I
VE ( A B )
J
( y ij
m i 1 j 1 I J
y i
m
( y ijk
VNE
y
j
y
)2
y ij ) 2
i 1 j 1 k 1
VT VE ( ) VE ( B) VE ( A B)
VNE
(n 1) ( I 1) ( J 1) ( I 1)( J 1) IJ (m 1) Diseño Experimentos
13
Contraste de Hipótesis Si el Veneno no influye, los I niveles son iguales a efectos de tiempo de supervivencia, entonces 1
H 0 :
2
I
I i 1 i
0
0 H 1 : Algún i es distinto de 0 Diseño Experimentos
1
2
I
14
Contraste efecto principal de factor A H 0 :
0 H 1 : Algún i es distinto de 0 1
2
VNE
2
s R
IJ (m
2
E [ s R ]
1) VE (
2
Si Ho es cierto, s A 2
F A
I
s A
mJ
I
1
i
I
( y i
y
2
)
E [ s A2 ]
1
F I 1; IJ ( m
s R
Si F A
2
) 2 I 1
2
s R
2
1)
Se rechaza Ho
F
Diseño Experimentos
15
Contraste efecto principal de factor B H 0 :
0 H 1 : Algún j es distinto de 0 1
2
J
VE ( B)
2
Si Ho es cierto, s B 2
F B
s B
mI
J
j
( y
1
j
2
Diseño Experimentos
y 2
s R
Si F B
1
s R
F
E [ s B2 ]
2
) 2 J 1 F J 1; IJ ( m
1)
Se rechaza Ho 16
Contraste interacción AxB
: 11 H 1 : Algún 0
12 ij
Si Ho es cierto, s AB
s AB
Si F AB
s
B)
2
F ( I 1)( J 1); IJ ( m
2
2
E [ s AB ]
( I 1)( J 1)
2
0
es distinto de 0
VE (
2
F AB
IJ
1)
Se rechaza Ho A y B interaccio nan
F
Diseño Experimentos
17
Tabla de análisis de la varianza Fuentes Variabilid ad
Suma de Cuadrados
Grados de Libertad.
Varianza
p valor
F 2
mJ
A
( y i
)2
y
I
2
s A
1
s A 2 s R
p A
2
mI
B
( y j
)2
y
J
2
s B
s B
1
2
s R
p B
s AB 2 s R
p AB
2
A B
m
( yij
y i
y
j
y
2
Residual
eijk
Total
( yijk y ) 2
Diseño Experimentos
) 2 ( I 1)( J 1)
s AB
IJ (m
s R
n
1)
2
2
1
18
Tabla de análisis de la varianza Fuentes
Suma de
Grados
Variabilid ad Cuadrados.
Libertad. Varianza
1.033 0.921 0.250 0.801 3.005
Veneno Antídoto Ven Ant Residual Total
0.516 0.307 0.041 0.022
2 3 6 36
F
p valor
23.2 13.8 1.87
.0000 .0000 .1123
47
Diseño Experimentos
19
Contrastes múltiples: Factor A
i j
H 0 :
i
j
H 1 :
i
j
y i y j
1/2
y i
y
j
2 i
j
yi s R
R.R
R.R.
N (
i
j
,
y i
/2
R. Acept. H 0
y j
-t
2
t IJ(m-1)
t
/2
/2
)
mJ mJ
y j
2 mJ
Diseño Experimentos
t IJ ( m
yi
y j
t / 2 s R
1)
2 mJ
LSD
Se rechaza Ho 20
Contrastes múltiples: Factor B
i j
0 :
i
j
H 1 :
i
j
y
i
y
j
/2
y i
y N (
j
y
i
s R
t IJ(m-1)
1 y
j
2 i
R.R
R.R.
y
i
j
,
j
2
y
i
R. Acept. H 0
j
-t
2
/2
t
/2
/2
)
mI mI
t IJ ( m
y
1)
i
y j
t / 2 s R
2 mI
LSD
Se rechaza Ho
mI
Diseño Experimentos
21
Intervalos de confianza (interacción nula)
i
i
Diseño Experimentos
y i
y
t / 2
j
t / 2
s R mJ s R mI
22
Intervalos de confianza 0.72
0.75
0.62
0.65
o0.52 p m e i t 0.42
o0.55 p m e i t 0.45
0.32
0.35
0.22
0.25
1
2
3
A
eneno
B
C
D
antidoto
Diseño Experimentos
23
Diagnosis: homocedasticidad 0.6
0.6
0.3
0.3
s o u d 0 i s e r
0
-0.3
-0.3
-0.6
-0.6
A B C D
antidoto Diseño Experimentos
1
2
3
veneno 24
Heterocedasticidad 0.6 0.4
s o u s e r
0.2 0 -0.2 -0.4 -0.6 0
0.2
0.4
0.6
0.8
1
valores previstos Diseño Experimentos
25
Normalidad 99.9 99 d 95 a d 80 i l i b 50 a b 20 o r 5 p 1 0.1 -0.5
-0.25
0
0.25
0.5
Residuos Diseño Experimentos
26
Diagnosis: homocedasticidad datos transformados z=1/y 1.3
1.3
0.9
0.9
0.5
0.5
0.1
0.1
-0.3
-0.3
-0.7
-0.7
-1.1
-1.1
1
2
3
A B C D
veneno
antidoto
Diseño Experimentos
27
Datos transformados 1.2 0.8 s o u s e r
0.4 0 -0.4 -0.8 -1.2 0
1
2
3
4
5
6
valores previstos Diseño Experimentos
28
Normalidad (datos transformados) 99.9 99 d 95 a d i 80 l i b 50 a b 20 o r 5 p 1 0.1 -1.2 -0.8 -0.4
0
0.4
0.8
1.2
Residuos Diseño Experimentos
29
Tabla de análisis de la varianza datos transformados 1/y Fuentes
Suma de
Variabilid ad Cuadrados. Veneno Antídoto Ven Ant Residual Total
34.87 20.41 1.57 8.68 65.50
Diseño Experimentos
Grados Libertad. Varianza
2 3 6 36
17.4 6.80 0.26 0.24
F
p valor
72.6 28.3 1.09
.0000 .0000 .3867
47
30
Comparaciones múltiples intervalos de confianza 4
4
3.6
3.6
o3.2 p m e2.8 i t / 12.4 2
o3.2 p m e2.8 i t / 12.4 2
1.6
1.6 1
2
3
1
eneno
2
3
4
antidoto
Diseño Experimentos
31
Comandos en R ARCHIVO TEXTO: venenos.txt
Diseño Experimentos
32
Dos factores con interacción
Diseño Experimentos
33
Intervalos de Confianza
7 . 0 7 . 0
6 . 0
s a i d e m
6 . 0
5 . 0
s a i d e m
4 . 0
5 . 0 4 . 0
3 . 0
3 . 0
2 . 0
I
II VEN
Diseño Experimentos
III
A
B
C
D
ANT
34
Tabla ANOVA
Diseño Experimentos
35
Comparaciones Múltiples
Diseño Experimentos
36
Comparaciones Múltiples
Diseño Experimentos
37
Interacciones
Diseño Experimentos
38
Diagnosis
Diseño Experimentos
39
Diagnosis (Transformación)
Diseño Experimentos
40
2.2 Bloques Aleatorizados
Ejemplo de introducción Fluorita M e z c l a
0% 1 15.02 2 8.42 3 18.31 4 10.49 5 9.78 6 9.28
1%
2%
3%
4%
11.86 10.15 16.84 10.52 9.59 8.84
9.94 8.54 15.86 8.04 6.96 7.04
12.45 6.98 14.64 10.50 8.15 6.66
13.23 8.93 15.96 10.34 9.24 9.46
Se desea estudiar el efecto de la Fluorita en la reducción del coste energético en la fabricación de cemento. Se emplean 6 mezclas distintas de materias primas. Diseño Experimentos
42
Modelo Tratamientos 1 2 I s e u q o l B
1 y11 y21 2 y12 y22
y I 2
J y1 J y2 J
y IJ
y I 1
yij
i Normalidad
Independencia Homocedasticidad
: Media global i : Efecto del tratamiento i, i=1,...,I j : Efecto del bloque j, j=1,2,...,J uij : Componente aleatoria N(0, 2)
I i 1 i J j 1 j
Diseño Experimentos
43
Tratamientos ... 2
1
I
...
1 1
s e2 u q o l B
uij
j
2
1
1
I
1
I
2
... 1
2
2
2
...
J 1
J
2
J
I
0 0
Estimación del modelo y
: 1 i : I 1 j : J 1 2 : 1
Parámetros :
Estimadore s : 2
J
y i
y
J
j
yij
i
j
uij
yij
i
j
eij
i
j
y
y j
y eij2
2
s R
( I 1)( J 1) yij
yij
1
j
y i
I J
I
yij
i
1
i
y
eij
1 j 1
n
yij
i
yij y i
y
j j
y
Diseño Experimentos
45
Estimación 1
2
I
j
1 2
y11
y 21
y I 1
y
1
y
1
y
y12
y 22
y I 2
y
2
y
2
y
J
y1 J
y 2 J
y IJ
y J y J y
y 1
y 2
y I
y
i
y 1
y
y 2
Diseño Experimentos
y
y I
y
46
Estimación (ejemplo)
Fluorita 0%
M e z c l a
1 2 3 4 5 6
15.02 8.42 18.31 10.49 9.78 9.28 11.88 1.15
1%
2%
3%
4%
11.86 10.15 16.84 10.52 9.59 8.84 11.30 0.57
9.94 8.54 15.86 8.04 6.96 7.04 9.40 -1.34
12.45 6.98 14.64 10.50 8.15 6.66 9.90 -0.84
13.23 8.93 15.96 10.34 9.24 9.46 11.19 0.46
12.50 8.60 16.32 9.98 8.74 8.26
1.77 -2.13 5.59 -0.76 -1.99 -2.48
j
10.73
i
Diseño Experimentos
47
Residuos: Varianza residual eij
yij
i
j
yij y i
y
j
y
Fluorita M e z c l a
1 2 3 4 5 6
0%
1%
2%
3%
4%
1.37
-1.21
-1.22
0.79
0.27
-1.33
0.98
1.27
-0.79
-0.13
0.84
-0.05
0.88
-0.84
-0.82
-0.64
-0.02
-0.60
1.36
-0.10
-0.11
0.28
-0.45
0.24
0.04
-0.13
0.02
0.12
-0.76
0.74
s R2
Diseño Experimentos
eij2
17.51 0.88 ( I 1)( J 1) 20 48
Contraste de Hipótesis Si la Fluorita no influye, los I tratamientos son iguales a efectos de coste, entonces 1
2
H 0 :
I i 1 i
I
0
0 H 1 : Algún i es distinto de 0 1
2
I
Diseño Experimentos
49
Análisis de la varianza yij
i
i
j
eij
( y i
y
) ( y j y ) ( yij y i
y
j
y
)
yij y
( y i
y
) ( y j y ) ( yij y i
y
j
y
)
I
J
( yij y ) i
i
yij
y
yij
I
uij
j
2
1 j 1
J
I
J
( y i i
1 j 1
Diseño Experimentos
i
1
)
I
J
( y j y ) i
I
( yij y ) 2 J ( y i
1 j 1
y
2
1 j 1
J
y
2
) 2 I ( y j y ) 2 j
1
I
J
2
eij i
1 j 1
I
i
J
eij2
1 j 1
50
Variabilidades I
J
( yij y ) 2
VT i
1 j 1 I
VE (T ) J VE ( B) I
( y i
i 1 J
j
)2
y
VT VE (T) VE (B) VNE
( y j y ) 2
1 I
J
(n 1) ( I 1) ( J 1) ( I 1)(
2
VNE
1)
eij i
1 j 1
Diseño Experimentos
51
Contraste sobre tratamientos H 0 :
0 H 1 : Algún i es distinto de 0 2
VNE
2
s R
1
E [ s R2 ]
( I 1)( J 1)
VE (Tratamient
Si Ho es cierto, sT 2
I
I
F T
2 sT
J
2
i
( yi
1
s R
Si F T F Diseño Experimentos
I
y 2
s R
2
os)
1
2 E [ sT ]
2
) 2 I 1 F I 1; ( I 1)( J 1)
Se rechaza Ho 52
Explicación del contraste Si Ho es cierto
0
i
yi1 yi 2 J
y i
N (
yij
yiJ
j , J j
J
, E [ y i ]
1
2
)
j
J 2
y1 , y 2
,..., y I
N (
I
y
y1
y 2
y I
2
J
) I
2
J ( y i - y ) i
sT
I
,
1
E
1
I
2
J ( y i - y ) i
1
I
2
1
Cuando Ho es cierto, sT 2 y s R2 serán parecidas. Cuando Ho es falso, sT 2 será mayor que s 2 . Diseño Experimentos
53
Contraste de bloques H 0 :
0 H 1 : Algún j es distinto de 0 1
1
J
2
F B
s B
j
( y
1
j
2
Diseño Experimentos
y 2
s R
Si F B
J
VE (Bloques )
Si Ho es cierto, s B2
I
2
s R
F
E [ sB2 ]
2
) 2 J 1 F J 1; ( I 1)( J 1)
Se rechaza Ho 54
Tabla de análisis de la varianza Fuentes
Suma de
Grados de
Variabilidad
Cuadrados
Libertad.
Tratamient o J
( y i
y
)2
Varianza
F
p valor
sT
2
2 sT 2 s R
pT
J 1
s B2
s B s R2
s R
I
1
2
Bloque
I
( y
j
y
)2
Residual
eij2
( I 1)( J 1)
Total
( yij y ) 2
n -1
Diseño Experimentos
p B
2
55
Tabla de análisis de la varianza
Diseño Experimentos
56
Sin bloques
Diseño Experimentos
57
Intervalos de confianza (ejemplo) i
Fluorita 0% 1% 2% 3% 4%
Diseño Experimentos
s R
y i
t / 2
Medias
L.inf.
L.Sup.
11.09 10.50 8.60 9.10 10.40
12.68 12.10 10.19 10.69 11.99
11.88 11.30 9.40 9.90 11.19
58
Intervalos de Confianza
(% Fluorita)
2 1 s 1 a 1 i d e m 0 1 9
0
1
2
3
4
FLUO Diseño Experimentos
59
Intervalos de Confianza
(Mezcla)
6 1 4 1
s a i d 2 e 1 m 0 1 8
1
2
3
4
5
6
MEZ Diseño Experimentos
60
Contraste multiples: tratamientos
i j
H 0 :
i
j
H 1 :
i
j
y i
/2 i
y
j
N (
yi
y j
i
i
j
,
j
y i
2
2
J
/2
R. Acept. H 0
y j
-t
t
/2
/2
)
J
t ( I 1)( J 1) y i
2
s R
t (I-1)(J-1)
1-
y
y j
R.R
R.R.
2
t / 2 s R J
y j
S e rechaza H 0
SD
Diseño Experimentos
61
Contraste multiples: bloques H 0 :
i
j
H 1 :
i
j
i
y
j
y
i
y
j
y
i
1 j
2 i
j
y
i
s R
N (
y
2
j
i
j
,
I
y
i
Diseño Experimentos
y
/2
I
t (I-1)(J-1) /2
R. Acept. H 0
j
-t
2
t ( I 1)( J 1)
I
R.R
R.R.
t
/2
/2
)
y
i
y j
t / 2 s R
2 I
S e rechaza H 0
SD 62
Comparación de medias Fluorita LSD
t / 2 s R
0%
2 J
2.085 0.93
2 6
0% 0 1% 2% 3% 4%
1.13
Mezcla LSD
t / 2 s R
2 I
2.085 0.93
2 5
1 2 3 4 5 6
LSD = 1.13 1% 2% 3% 4% 0,58 2,49 1,99 0,69 1,90 1,40 0,11 0 0 -0,50 -1,80 0 -1,30 0
LSD=1.24 1 2 3 4 2,52 0,00 3,90 -3,82 0 6,60 -1,37 0 6,34 0
5 3,76
6 4,24
-0,14
-0,35
7,58
8,07 1,23 1,72 0
0,49 0
1.24 Diseño Experimentos
63
Comparación de medias (Tukey) 95% family-wise confidence level 0 1 0 2 0 3 0 4 1 2 1 3 1 4 2 3 2 4 3 4
-4
-2
0
2
Differences in mean levels of FLUO
Diseño Experimentos
64
Comparación de medias (Tukey) 95% family-wise confidence level 1 2
1 4
1 6
2 4
2 6
3 5
4 5
5 6
-10
-5
0
5
10
Differences in mean levels of MEZ
Diseño Experimentos
65
Diagnosis: Homocedasticidad Gráfico de residuos 2 1.5 1 0.5 0 -0.5 -1 -1.5 -2
2 1.5 1 0.5 0 -0.5 -1 -1.5 -2 0
1
2
3
4
5
6
Mezcla
0
1
2
Fluorita
3
4
s o u d i s e r
1.6 1.2 0.8 0.4 0 -0.4 -0.8 -1.2 -1.6 5
10
15
Valores revistos
20
Diagnosis
Diseño Experimentos
2.3 Diseños Factoriales (tres factores)
67
Diseño con tres factores Factor A A1 A2 A3 A4 A5 A6 B1
Factores A, B y C con N A, NB, Nc niveles. Nº de Tratamientos T=N AxNBxNc
B B2
r o t c a F
B3
Efectos principales 3 A, B , C
B4
Interacciones de orden dos 3 AxB, AxC, AxC, BxC
B5 C1 C2 C3
Interacción de orden tres 1. AxBxC
Tratamiento: Cada combinación de niveles de los factores
6 x 5 x 3 = 90 Diseño Experimentos
69
K factores con N1, N2, ..., NK niveles K efectos principale s con N i 1 grados de libertad cada uno K 2
interaccio nes de orden 2, con (N i 1 )(N j
1 ) grados
de libertad K 3
interaccio nes de orden 3, con (N i 1 )(N j
1 )(N k 1 )
grados de libertad ... .. . K K
1 interacció n de orden k, con (N 1 1 )(N 2 1 )
(N K 1 )
grados de libertad Diseño Experimentos
70
Datos 11
1 1
11 22
Factor 1
......
K K
11
22
22
......
1 ...
K K
11
22
2
II
...
......
K K
y1111
y1121
y11 K 1
y 2111
y 2121
y11 K 1
y I 111 111
y I 121 121
y I 1 K 1
y1112
y1122
y11 K 2
y2112
y 2122
y11 K 2
y I 112 112
y I 122 122
y I 1 K 2
y111 111 M y112 112 M
2 11 r y1211 o t 2 y1212 c 2 a F
y1221
y11 KM ...... K K y12 K 1
y1222
y12 K 2
y2212
y12 KM
y221 221 M y 222 222 M
22
y121 121 M y122 122 M
...
Factor 3
11
22
y1 J 11
JJ y1 J 12
......
y 211 211 M y 212 212 M
11
22
y2211
y 2221
y11 KM ...... K K y 22 K 1
y2222
K K
11
22
y1 J 21
y1 JK 1
y2 J 11
y1 J 22
y1 JK 2
y 2 J 12
y1 J 1 M y1 J 2 M
... ...
y I 11 M y I 12 M
11
22
y I 211 211
y I 221 221
y I 1 KM ... K ... K y I 2 K 1
y 22 K 2
y I 212 212
y I 222 222
y I 2 K 2
y 22 KM
y I 21 M y I 22 M
y I 2 KM
K K
11
22
y 2 J 21
y2 JK 1
y IJ 11
y IJ 21
y IJK 1
y 2 J 22
y 2 JK 2
y IJ 12
y IJ 22
y IJK 2
y2 JKM
y IJ 1 M y IJ 2 M
y1 JKM y2 J 1 M y 2 J 2 M
......
K K
y IJKM
Diseño Experimentos
71
Ejemplo: Proceso químico Concentración 1 4% 2 6% 3 8% 4 10%
Tres factores:
Temperatuta
Catalizador C-1 Ag C-2 Ag+Zn C-3 Zn
T-1 T-2
300º C 320º C
químico. Variable respuesta: Rendimiento del proceso químico. CONCENTRACIÓN 1 C-1 R O D A Z I L A T A C
C-2
C-3
2
3
4
T -1
T -2
T -1
T -2
T -1
T -2
T -1
T -2
72. 2 74. 4 64. 3
65. 0 71. 6 61. 9
74. 4 66. 3 66. 5
69. 2 71. 8 64. 6
75. 0 78. 9 64. 3
70. 7 80. 6 73. 4
80. 0 65. 0 82. 1
73.0 74.4 78.8
T -1
T -2
T -1
T -2
T -1
T -2
T -1
T -2
62. 5 65. 8 71. 2
75. 9 72. 9 77. 8
70. 8 63. 9 76. 6
79. 2 80. 1 75. 3
76. 3 79. 1 89. 0
83. 3 88. 0 84. 7
72. 3 72. 4 75. 6
80.3 86.9 86.3
T -1
T -2
T -1
T -2
T -1
T -2
T -1
T -2
69. 0 70. 3 68. 8
73. 8 59. 2 80. 8
69. 0 68. 2 78. 7
84. 5 93. 7 80. 1
72. 8 73. 7 80. 7
94. 1 87. 3 89. 0
78. 4 79. 9 80. 3
87.5 79.7 79.5
Diseño Experimentos
72
K
Modelo yijkm
i I i 1 J j 1
i j
K k 1 k I i
j
k
0
J j
0
K k 1
0
J j
0,
ijk
1
ij
ik
1
ij
i
I i 1
ij
0,
j
0,
i
I i 1
ik
0,
k
0, J j
K k 1
k
0,
ijk
I
0,
jk
J
ijk
uijkm
0,
i , j.
j
K k
i, k ;
Normalidad
uijkm
jk
0,
jk
j , k , ;
ik
ijk
K tratamientos
M replicaciones
Independencia
Homocedasticidad
n = I
J
K
M
Diseño Experimentos
73
Medias yijkm
i
j
k
ij
ik
jk
ijk
uijkm
I J K M
yijk
y
i
1 j 1k 1m 1
IJKM J K M
yijkm
y i
j
1k 1m 1
JKM
k 1m
y
i j
KM
1 k 1m 1
IKM
y i
k
1m 1
JM
k
1 j 1m 1
IJM
I K
yijkm
j
i
y
J M
yijkm
1
yijkm
yijkm
K M
y ij
I J M
I K M
yijkm
y
i jk
1 k 1
IM
M
yijkm
y ijk
m
1
Diseño Experimentos
74
Medias: Proceso químico Concentración 2 3
1 C-1 C-2 C-3
Catalizador
T-1 T-2
Temperatura
68.8 74.3 79.0
73.8 83.4 82.9
75.6 79.0 80.9
69.9
74.1
80.1
78.5
1
2
3
4
68.72 70.99
70.49 77.61
76.64 83.46
76.22 80.71
69.9
74.1
80.1
78.5
T-1
T-2
71.95 72.96 74.15
71.25 80.89 82.43
73.02
78.19
C-1 C-2 C-3
1 C-1 C-2 C-3
4
68.2 71.0 70.3
71.6 76.9 78.3 75.6
73.02 78.19 75.6
71.6 76.9 78.3 75.6
2
3
4
T-1
T-2
T-1
T-2
T-1
T-2
T-1
T-2
70.30 66.50 69.37
66.17 75.53 71.27
69.07 70.43 71.97
68.53 78.20 86.10
72.73 81.47 75.73
74.90 85.33 90.13
75.70 73.43 79.53
75.40 84.50 82.23
Diseño Experimentos
75
Estimación del modelo y
j
y i y
k
y
i
j
y
k
y ij
y i
ik
y i
k
y i
jk
y
jk
y
y ijk
y
j
y ij
( I 1)( J 1)
y
j
y
k
( I 1)( K 1)
y
y
k
y
y i
k
y
( J 1)( K 1) jk
y i
y
j
y
k
y
( I 1)( J 1)( K 1)
2
eijkm
2
s R
1
K
ij
ijk
2
I 1 J 1
y y
IJK ( M
1)
Diseño Experimentos
;
eijkm
yijkm y ijk
76
Modelo estimado yijkm
i
yijkm
j
y
k
y i y ij
y
y
y i
y y
y i
k
y i
y
jk
y
y ijk
ij
y ij
y
j
y
ijk
uijkm
y
k
y
k
y i
jk
y
j
y
j
ik
y
k
y
k
y i
jk
y
y
j
k
y
yijkm y ijk
Diseño Experimentos
77
Descomposición de la variabilidad I J K M
2
yijkm y
i
1 j 1k 1m 1
JKM
y i
2
y
IKM
i
i
y ij
y i
y
y i
y i
y
k
y
y
k
y
k
y
y
k
jk
y
y ijk
j
j
y ij
2
y
2 2 2
y i
jk
y i
y
j
y
k
y
2
k
yijkm y ijk j
k
k
y
j
y
k
M
i
IJM
k
IM
i
2
j
JM
j
y
j
j
KM i
y
2
k m
Diseño Experimentos
78
Variabilidades I J K M
VT
2
yijkm y
VE ( A) JKM
i 1 j 1k 1m 1
VE ( B) IKM
y
2
y
j
VE (C ) IJM
y
k
2
y
k
VE ( A B) KM i
i
y ij
y i
y
y i
y i
y
y
y
y
k
k
y
k
y
2
jk
j
2
k
VE ( A B C ) M
y ijk i
VNE
j
k
VE ( B C ) IM j
2
y
j
VE ( A C ) JM
j
y ij
y i
k
y
jk
y i
y
j
y
k
2
y
k
yijkm y ijk j
2
y
i
j
i
y i
2
k m
Diseño Experimentos
79
Grados de libertad DESCOMPOSI CIÓN DE LA VARIABILID AD VT VE ( A) VE ( B) VE (C ) VE ( A B) VE ( A C ) VE ( B C ) VE ( A B C ) VNE GRADOS DE LIBERTAD (n 1) ( I 1) ( J 1) ( K 1) ( I 1)( J 1) ( I 1)( K 1) ( J 1)( K 1) ( I 1)( J 1)( K 1) IJK ( M 1) Diseño Experimentos
80
Tabla ANOVA Gr . de Lib.
FUENTE VARIABILID AD A
JKM
y i
y
y
y
2
Varianzas F s A 2 s R
2
s B 2 s R
2
sC 2 s R
2
s AB 2 s R
2
s AC 2 s R
2
s BC 2 s R
1
s A
J
1
s B
K
1
sC
i
B
IKM
j
2
j
C
IJM
y
2
y
k
k
A B
KM i
A C B C
y i
y
y i
y i
y
y
y
j
2
( I 1)( J 1)
s AB
2
( I 1)( K 1)
s AC
2
( J 1)( K 1)
s BC
j
JM i
y ij k
k
y
y
k
y
y i
k
y
k
IM
y
jk
j
j k
( y ijk y ij
M i
A B C
j k
... y i Residual
y
y
j
yijkm y ijk
i
1 j 1k 1m 1
k
)2
y
2
2 ( I 1)( J 1)( K 1) s ABC
IJK ( M
i j k m I J K M
Total
...
jk
2
yijkm y
IJKM
1)
2
2
I
2
2 2
2 2
2
s ABC 2 s R
2
s R
1
Diseño Experimentos
81
Contraste efecto principal de factor A H 0 :
0 H 1 : Algún i es distinto de 0 1
I
2
F A
s A
JKM i 1
2
I
( y i
2
y
) 2 I 1 F I 1; IJK ( M 1)
2
s R
s R
F I 1; IJK ( M 1)
Si F
F
No se rechaza Ho
RR
Si F A
F
Se rechaza Ho
F Diseño Experimentos
82
Contraste interacción AxB
: 11 H 1 : Algún H 0
12 ij
es distinto de 0 VE (
2
Si Ho es cierto, s AB
F AB
F ( I 1)( J 1); IJK ( M 1)
2
s R
Si F AB
B)
( I 1)( J 1)
2
s AB
0
IJ
Se rechaza Ho A y B interaccio nan
F
Diseño Experimentos
83
Contraste interacción AxBxC H 0 :
111
H 1 :
Algún
112 ijk
IJK
0
es distinto de 0
Si Ho es cierto 2
F ABC
s ABC s
2
Si F BC F Diseño Experimentos
F ( I 1)( J 1)( K 1); IJK ( M 1)
Se rechaza Ho 84
Análisis de la varianza
Diseño Experimentos
85
Interpretación El efecto principal del factor concentración influye significativamente (p-valor =0.0000) en el rendimiento. Más adelante se compararán las medias de los cuatro niveles de este factor. Este factor no interacciona con ningún otro. Los efectos principales de catalizador y de la temperatura son significativos, además es muy significativa la interacción de los dos factores (p-valor 0.0064). La comparación de medias de estos factores debe ser conjunta. Diseño Experimentos
86
Contrastes múltiples: Factor A
i j
H 0 :
i
j
H 1 :
i
j
y i
i
y
j
2 i
j
N (
yi
i
j
,
1 y i
-t
2
/2
R. Acept. H 0
y j
)
t
/2
/2
KM JKM
y j
t IJK ( M 1)
2
s R
t IJK(M-1)
/2
y
y j
R.R
R.R.
Si yi
y j
t / 2 s R
2 JKM
,
se rechaza Ho
KM
Diseño Experimentos
87
Intervalos de Confianza
0 8
0 8
s a i d e m
0 8
8 7
s a i d e m
5 7
8 7
s a i d e m
6 7
6 7
4 7
4 7 2 7
0 7 2 7
k1
k2
k3
k4
con
Diseño Experimentos
0 7
t1
t2 temp
c1
c2
c3
cat
88
Interacción: Cat. x Temp. C-1 C-2 C-3
T-1
T-2
71.95 72.96 74.15 73.02
71.25 80.89 82.43 78.19
71.6 76.9 78.3 75.6
Interacción Cat x T emp 84.00 82.00 80.00 s a i 78.00 d e 76.00 M 74.00 72.00 70.00
Temp - 1 Temp - 2
0
1
2
3
4
Catalizador
Diseño Experimentos
89
Selección de temperatura y catalizador.
Las mejores combinaciones corresponden a la temperatura 2, con el catalizador 2 o el 3. Diseño Experimentos
90
Diagnosis del modelo
0 1 ) i u q _ d o m ( s l a u d i s e r
0 1 ) i u q _ d o m ( s l a u d i s e r
5 0 5 0 1 -
1.0
2.0
3.0 con
4.0
0 1 ) i u q _ d o m ( s l a u d i s e r
5 0 5 0 1 -
1.0
1.4
5 0 5 0 1 -
1.8
temp
1.0
1.5
2.0
2.5
cat
Diseño Experimentos
91
Instrucciones de R utilizadas ARCHIVO TEXTO: quimico.txt
Diseño Experimentos
92
3.0
Análisis de 3 factores con menos observaciones Cuando no existe interacción de orden tres. No es necesario replicar para analizar el experimento. La variabilidad explicada por el término A B C se convierte en Variabilidad Residual con (I-1)(J-1)(K-1) grados de libertad. Las expresiones anteriores siguen siendo válidas, sustituyendo M=1 (sin replicación) y con (I-1)(J-1)(K-1) como grados de libertad de la varianza residual.
Cuando no existe ninguna interacción Se puede reducir considerablemente el número de observaciones si el número de niveles de los tres factores es el mismo: CUADRADO LATINO
Diseño Experimentos
93
Tabla ANOVA tres factores (sin replicación) Gr . de Lib.
FUENTE VARIABILID AD A
JK
y i
y
y
y
2
Varianzas F s A 2 s R
2
s B 2 s R
2
sC 2 s R
1
s A
J
1
s B
K
1
sC
i
B
IK
j
2
j
C
IJ
y
2
y
k
k
A B
K i
A C B C
y i
y
y i
y i
y
y
y
j
k
k
y
y
y
k
y
jk
j
( yijk y ij
y i
k
y
Residual
2
s AB 2 s R
2
( I 1)( K 1)
2 s AC
s AC 2 s R
2
( J 1)( K 1)
s BC
2
s BC 2 s R
Total
jk
I J K i 1 j 1k 1
yijk y
Diseño Experimentos
y
j
2
y
k
y
2 2
...
j k
... y i
2
s AB
j k i
2
( I 1)( J 1)
k
I
2
2
j
J i
y ij
2
2
I
)2
( I 1)( J 1)( K 1) s R2
IJK
1
94
Ejemplo: Obleas Horno AS 1 1 2 1 2 2 1 3 2 1 4 2
1
Temperatura 2
3
122.2 138.4 131.0 147.4 120.5 140.6 100.0 117.0
103.2 144.3 133.4 138.0 102.8 126.6 105.8 134.4
115.8 159.8 121.8 147.5 120.0 141.9 114.7 131.7
Se ha realizado un experimento para analizar la influencia de la temperatura y el acabado superficial (AS) en el espesor de óxido conseguido en obleas de silicio. El experimento se repitió en cuatro hornos diferentes. ( Cada uno de los datos del cuadro representa la media de los espesores medidos en el centro de cada una de las 30 obleas que caben en un horno)
Diseño Experimentos
95
ANOVA: Obleas
Diseño Experimentos
96
Comparación de medias
El AS que produce mayor espesor es el 2
El horno que produce media mayor es el 2, aunque no es significativamente distinto del 1. Diseño Experimentos
97
Cuadrado latino Permite analizar tres factores con K niveles cada uno, utilizando sólo K 2 observaciones. Deben ser nulas las interacciones de orden 2 y orden 3.
Diseño Experimentos
1
2
3
4
5
1
C
A
D
B
E
2
D
C
B
E
A
3
E
B
A
D
C
4
B
E
C
A
D
5
A
D
E
C
B
98
Ejemplo: Aditivos gasolina Una organización de consumidores estudió la eficacia de cinco aditivos que según los fabricantes reducían el consumo de combustible. Se realiza un diseño experimental con cinco conductores, cinco vehículos y cinco aditivos, eligiendo las 25 combinaciones que se muestran en la tabla, junto con una medida del consumo . 1 1 r o t c u d n o C
2 3 4 5
Vehículo 3
2
C
A
71
D
64
D
C
65
B
B
63 B
E
66 D
73
82 D
C
77
85 D
79
70
82 C
A
E
82 A
74
77
A
78 E
A
Aditivo A B C D E
E
81
68
5
B
68
64
E
4
88 C
74 B
78
80
88
Diseño Experimentos
99
Modelo: Cuadrado Latino yij ( k ) 1 2 3 4 5
i
j
k
uij ( k )
1
2
3
4
5
y11(3)
y21(1)
y31( 4)
y41( 2)
y51(5)
y12( 4)
y22(3)
y32( 2)
y42(5)
y52(1)
y13(5)
y23( 2)
y33(1)
y43( 4)
y53(3)
y14( 2)
y24(5)
y34(3)
y 44(1)
y54( 4)
y15(1)
y25( 4)
y35(5)
y45(3)
y55( 2)
K i 1 i
0
K j 1
0
j
K k 1 k
Normalidad
uij ( k )
Independencia
K 2 Observaciones
Homocedasticidad Diseño Experimentos
100
0
Estimación yij ( k )
i
K K i
K
yij ( k )
1 j 1
y i ( )
2
K
y
i
y j ( )
K
yij ( k )
1
y ( k )
K
k
1
K
( )
i
y i
( )
j
y
j ( )
y
( )
1 K 1
k
y
( k )
y
( )
K
eij ( k )
K
yij ( k )
1
j
uij ( k )
k
K
yij ( k )
y ( )
j
y
K
( )
yij ( k ) y i
( )
y
j ( )
1 y
( k )
2 y
( )
2
2
eij ( k )
s R2
( K 1)( K 2)
;
Diseño Experimentos
101
Descomposición de la variabilidad yij ( k ) yij ( k )
y ( )
( y i
K K i
1 j 1
K
yij ( k ) y ( ) y i ( ) y ( )
( )
i
y ( ) )
( y
j
j ( )
k
y ( ) )
uij ( k ) ( y
( k )
y ( ) ) eij ( k )
2 2
K
i
y j ( ) y ( ) j
2
K
y (k ) y ( )
2
k
eij ( k ) i
2
j
Grados de Libertad
( K 2 1) ( K 1) ( K 1) ( K 1) ( K 1)( K 2)
Diseño Experimentos
102
Tabla ANOVA Gr . de Lib.
FUENTE VARIABILID AD A
K
y i
( )
y
2 ( )
K
1
i
B
K
y
j (
)
y
2 ( )
K
Varianzas F 2 s A 2 s A s R2 2
1
2
s B
s B
1
2
sC s R2
j
C
K
y k
Residual Total
( k )
y
2 ( )
eij2( k )
i
sC
2
( K 1)( K 2) s R2
i j K K
yij ( k ) y
K
s R2
2 ( )
K 2
1
1 j 1
Diseño Experimentos
103
Tabla análisis de la varianza
Diseño Experimentos
104
Comparación: vehículos
5 8 0 8
s a i d 5 e 7 m 0 7 5 6
1
2
3
4
5
VEH
Diseño Experimentos
105
Dise˜ no de experimentos 1. En una planta piloto se obtiene un nuevo producto mediante un proceso qu´ımico. Con el fin de mejorar el rendimiento se emplean dos catalizadores distintos y se trabaja con tres temperaturas diferentes. Los resultados del experimento son Temperatura Catalizador 20 300 400 A 115 125 130 140 110 120 B 115 105 135 145 100 110 0
(a) Contrastar si los factores Temperatura y Catalizador tienen efectos significativos. (α = 0.05) (b) ¿Qu´e tratamiento se debe utilizar para obtener el mayor rendimiento, si se desea garantizar una probabilidad de error tipo I total, αT = 0.03? 2. Se pretende estudiar el efecto que produce los factores (1) Porcentaje de algod´ on (10%, 20% y 30%) (2) Tipo de confecci´ on (A y B) en la resistencia al desgaste de ciertos tejidos de fibra sint´etica. Se ha realizado el siguiente dise˜ no con tres replicaciones 10% 20% 30% 115 120 126 A 112 135 118 133 139 142 107 110 132 B 114 102 114 108 117 125 (a) Construir la tabla de An´ alisis de la Varianza y contrastar la influencia de los dos factores y la presencia de la interacci´on. (b) Hacer un contraste de diferencia de medias y decidir el tratamiento m´ as adecuado para conseguir la mayor resistencia al desgaste. 3. Cierto Organismo P´ ublico (O.P.) encargado de certificar la composici´ on de aleaciones de metales preciosos, debe seleccionar entre dos Laboratorios al m´ as capacitado para la realizaci´on de futuros an´ alisis de gran precisi´on. Para tomar la decisi´ on les somete a la siguiente prueba: Prepara tres aleaciones A, B y C que contienen proporciones distintas de oro. De cada una de ellas env´ıa cuatro muestras a cada uno de los dos laboratorios. As´ı pues, cada laboratorio recibe un lote de 12 muestras (codificadas) ordenadas aleatoriamente sin conocer como han sido obtenidas. Los resultados recibidos por el O.P. son (entre par´entesis las medias de las casillas):
1
Aleac. A Aleac. B 10.96 11.03 10.95 11.00 Lab. I 11.08 11.01 11.04 10.97 (11.02) (10.99) 10.97 10.96 10.97 10.96 Lab. II 10.94 10.95 10.97 10.98 (10.955) (10.97)
Aleac. C 11.07 11.01 10.97 11.03 (11.02) 11.02 11.00 11.01 11.01 (11.01)
(a) Determinar si existen diferencias entre los resultados de los laboratorios y si ´estos han encontrado diferencias entre las aleaciones. (b) Aceptando que los datos cumplen la hip´ otesis de normalidad, indicar si podemos aceptar que verifican el resto de las hip´ otesis del modelo y en caso negativo que medidas se deben adoptar para analizar los datos. (c) Realizar un test de raz´ on de varianzas para contrastar que las varianzas de los dos laboratorios son iguales, sabiendo que las tres aleaciones tienen composici´ on distinta. Interpretar el resultado. (d) El O.P. conoce ex´ actamente el porcentaje en oro de la aleaci´ on A (11 %), de la B (11.02 %) y de la C (11.04 %). Con esta informaci´ on comparar los resultados de los laboratorios. 4. Complete la tabla ADEVA siguiente y diga de que dise˜ no se trata.
Suma de Cuad. G.L. Varianzas 20 2 5 1.25 10
Factor 1 Factor 2 Factor 3 Int. Segundo orden Int. Tercer orden TOTAL 44
0.25 29
5. Se ha realizado un dise˜ no factorial sin replicaci´ on con tres factores A, B , C con 5, 5 y 4 niveles respectivamente. Si la interacci´on de tercer orden es nula, obtener la descomposici´ on de la variabilidad e indicar los grados de libertad de cada t´ermino. 6. Para estudiar el efecto de tres factores (A,B,C) en el tiempo de fraguado del hormig´ on se ha realizado un experimento factorial completo a dos niveles con tres replicaciones (24 datos en total). Los resultados de la estimaci´ on han sido: Media 92.5
A 2.4
B AB 3.3 8.5
C 15.0
AC -1.4
BC ABC 2.65 0.72
Teniendo en cuenta que la varianza residual obtenida es sˆ2R = 18.8, indicar qu´e efectos son significativos para un nivel de significaci´ on α = 0.05. 2
7. Una caracter´ıstica de la calidad de la gasolina es su ´ındice de octanos. Una refiner´ıa de petr´ oleo tiene cinco f´ormulas que pueden emplearse para la obtenci´ on de gasolina con plomo o sin plomo. (a) Para determinar que f´ ormula proporciona mayor ´ındice de octanos, con cada una de ellas se ha repetido 10 veces en el laboratorio el proceso de fabricaci´ on de gasolina con plomo. Si el coeficiente de determinaci´ on del an´ alisis de la varianza de los resultados es igual a 0.20, contrastar con α = 0.05 si existen diferencias entre las cinco f´ormulas para este tipo de gasolina. yi ) para cada f´ (b) Los valores medios (¯ ormula son: •
F´ormula Media
1 89.2
2 90.1
3 4 90.7 90.5
5 89.5
Contrastar con α = 0.05 que f´ormulas proporcionan ´ındices de octanos significativamente distintos y cuales no. (c) Debido a los problemas medio-ambientales gran parte de la producci´ on futura debe estar libre de plomo. Para determinar que f´ ormula de las anteriores produce mejores resultados en cuanto al ´ındice de octanos , se realizo un dise˜ no experimental similar al anterior (cinco f´ormulas, 10 observaciones en cada f´ ormula) para la obtenci´ o n de gasolina sin plomo. El coeficiente de determinaci´ o n en este caso es igual a 0.25 y el ´ındice medio para cada f´ ormula es,
F´ormula 1 Media 88.0
2 89.5
3 4 5 88.5 90.2 89.8
Contrastar (α = 0.05) si existe interacci´ on entre los factores tipo de gasolina (con y sin plomo) y f´ormula. 8. Para comprobar las propiedades de rigidez de dos materiales A y B a tres temperaturas se ha realizado un experimento con 4 replicaciones. Las medias se proporcionan en la tabla. Teniendo en cuenta que la varianza residual ha sido 1.69 y que el an´ alisis de la varianza ha indicado: (1) que existen diferencias significativas entre los dos materiales, (2) que no existen diferencias entre las tres temperaturas y (3) que la interacci´ on de los dos factores es muy significativa, calcula y dibuja los intervalos de confianza (α = 0.01) para la comparaci´ on de los dos materiales, de las tres temperaturas y de la interacci´ on. Interpretar los resultados.
3
(c) Cada tratamiento tiene dos observaciones, llamando Dij = |Y ij 1 − Y ij 2| , al valor absoluto de la diferencia de estas observaciones, demuestra que 2 Dij
2σ 2
y que S D =
2
i=1
4
2
j =1 Dij
16
2
→ χ21
es un estimador centrado de la varianza del modelo factorial.
(d) Sup´ on que la varianza de las observaciones a velocidad baja es σ 21 y de las observaciones a velocidad alta es σ22 . Utilizando el resultado del apartado 3, realiza el siguiente contraste con nivel de significaci´ on 0.05, H 0 : σ 21 = σ 22
= σ 22 H 1 : σ 21
11. Cuando un lenguaje de alto nivel es compilado, el tiempo de ejecuci´ on depende del compilador. Un ingeniero de software desea comparar tres compiladores (A, B y C), para ello ha seleccionado 5 programas muy distintos, cada uno de los cuales ha sido compilado por los tres compiladores. Los tiempos de CPU se proporcionan a continuaci´ on: 1 A B C
Medias
2
3
4
5 Medias
122.9 147.4 189.6 200.9 307.3 113.8 135.1 173.8 199.3 296.6 131.2 152.8 192.7 219.8 318.9 122.7 145.1 185.3 206.7 307.6
193.6 183.7 203.1
La variabilidad total es 62899.2, y las variabilidades explicadas por el tipo de compilador y tipo de programa son 937.2 y 61868.9, respectivamente. Da un intervalo de confianza (95%) para la diferencia de las medias entre los dos compiladores m´ as r´apidos. 12. Se ha realizado el an´ alisis de la varianza de un dise˜ no con un u ´ nico factor a 10 niveles con 6 observaciones para cada nivel. El nivel cr´ıtico que muestra la tabla ADEVA es p = 0.5832. Los niveles cr´ıticos de los contrastes individuales de igualdad de medias son mayores de 0.05 para todas las parejas excepto para la comparaci´ on entre los niveles 3 y 7 que ha sido igual a 0.0405. ¿Es posible este resultado? ¿Qu´e se puede concluir del an´ alisis? ¿Qu´e procedimiento sugiere para realizar los contrastes individuales? 13. Se ha realizado un dise˜ no factorial sin replicaci´ on con tres factores A, B , C con 5, 5 y 4 niveles respectivamente. Si la interacci´on de tercer orden es nula, obtener la descomposici´ on de la variabilidad e indicar los grados de libertad de cada t´ermino. 14. Sea un dise˜ no factorial con 4 factores a 3, 4, 2 y 5 niveles. Calcular el n´ umero de par´ ametros totales correspondientes a efectos principales e interacciones de orden 2, 3 y 4. 5
15. Un ingeniero ha estudiado el efecto que tienen 5 niveles de iluminaci´ on en una operaci´ on de ensamblado. El departamento en el que se ha experimentado tiene cuatro estaciones de trabajo, que representan una fuente potencial de variabilidad. Para cada estaci´ on de trabajo y nivel de iluminaci´on se ejecut´ o la operaci´ on de ensamblado, midiendo la holgura en micras. Los resultados fueron: ESTAC.
ILUMINACION 1 2 3 4 5 y¯i 131 116 88 75 104 102.8 92 96 97 70 75 86.0 128 129 99 94 105 111.0 121 107 84 89 86 97.4 118 112 92 82 92.5 y¯ = 99.3 •
1 2 3 4 y¯ j •
••
(a) Contrastar (α = 0.05) si la iluminaci´on o la estaci´ on de trabajo influye en los resultados del ensamblado. (b) Comparar los niveles de iluminaci´ on y los niveles de las estaciones de trabajo. Indicar en cada caso cuales se pueden considerar distintos y cuales no. (c) Calcular la varianza te´ orica del valor medio previsto para cada observaci´ on. (d) Explicar por qu´ e no se debe contrastar la hip´ otesis H 0 : µ 1 = µ 2 = ... = µ m
del modelo b´ asico de an´ alisis de la varianza (un factor), mediante contrastes de la t de Student a cada uno de los
m
2
pares de muestras.
16. Se realiza un experimento para estudiar la influencia de 2 factores en el rendimiento de un proceso, donde el factor que se encuentra a 3 niveles (Alto, medio y bajo) es la temperatura , el otro factor, catalizador , tiene dos niveles: catalizador I y II . Los datos del experimento se muestran en la siguiente tabla:
CI CII
Alto 279 172 176 (215.6) 253 238 387 (292.6)
Medio 174 277 130 (193.6) 252 367 323 (314)
Bajo 397 348 434 (393) 417 427 423 (422.3)
(Nota: Los n´ umeros entre parentesis son las medias de las casillas) (a) Contrastar con α = 0.05 que efectos son significativos. Interprete el resultado. (b) Determinar el intervalo con el 99% de confianza para la varianza del error experimental.
6
(c) Dar un intervalo para una observaci´ on realizada en condiciones o´ptimas. Si se realizan 10 experimentos en estas condiciones, determinar el intervalo que con probabilidad igual al 95% contiene a todas ellas. Utilice la aproximaci´on tαg = z α (1 −
z α + 1 ) 4g
1
−
donde g son los grados de libertad de la t y z α el valor de la normal est´ andar, tal que P (Z ≥ z α ) = α 17. Un laboratorio de An´alisis Cl´ınicos ha adquirido un nuevo equipo (B ) para medir el colesterol en la sangre de los enfermos. Para evaluar si el nuevo equipo est´ a ajustado se decide analizar muestras de 5 enfermos que previamente han sido analizadas con otro equipo (A), dando como resultado Enfermo 1 2 3 4 5 Media Equipo A 215 305 247 221 286 254.8 Equipo B 224 312 251 232 295 262.8 Contrastar con α = 0.05 existen diferencias entre los dos equipos. 18. Para estudiar el consumo de aceite de un motor se prueban 4 motores distintos con 3 tipos de aceites obteniendo 12 medidas de consumo. Se ha obtenido: Variabilidad explicada por aceite = 100 Variabilidad explicada por motor = 80 Variabilidad Total = 220 Se pide escribir la tabla ADEVA correspondiente, y obtener conclusiones. 19. Para determinar el consumo de energ´ıa el´ectrica para usos dom´esticos se ha medido el consumo medio por persona en las distintas estaciones del a˜ no en siete comunidades aut´ onomas para 1989, habi´endose obtenido los siguientes resultados: ˜ COMUNIDAD INVIERNO PRIMAVERA VERANO OTO NO MEDIAS 1 13.1 11.4 10.6 11.5 11.65 2 13.4 12.1 11.1 12.0 12.15 3 13.8 12.1 11.4 12.9 12.55 4 14.0 12.8 11.7 12.6 12.77 5 14.4 12.6 12.5 13.4 13.22 6 14.8 13.4 13.0 14.0 13.80 7 15.6 14.2 14.1 14.4 14.57 MEDIAS 14.16 12.66 12.06 12.97 12.96 (a) Analizar si el factor estaci´ o n del a˜ no es influyente, sabiendo que sˆ2y = 1.53.(No considerar el factor Comunidad). 7
(b) Razonar estad´ısticamente cu´ a l es la estaci´on de mayor consumo y la de menor, utilizando el an´alisis anterior. Calcular los intervalos de confianza para el consumo medio de cada estaci´ o n del a˜ no. (c) Sabiendo que la variabilidad explicada por el factor comunidad es 23.62, construir una nueva tabla de la varianza, con dos factores, y decidir qu´e factor es significativo. (d) Utilizar los resultados del apartado anterior para realizar un contraste de igualdad de medias del efecto estaci´ on y comparar los resultados con los del apartado 2, justificando las diferencias encontradas. ( NOTA: Utilizar α = 0.05 en todos los contrastes ) 20. Se realiza un experimento para estudiar si la presencia de fluorita reduce el coste de fabricaci´on de clinker de cemento en tres tipos diferentes de mezcla. Los resultados del mismo (en miles de pesetas por Tm) se muestran en la siguiente tabla: FLUORITA 0% 1% 2% 3% 4% y 5
MI 15.4 10.3 7.4 10.7 13.5 11.4
MII MIII 10.6 17.8 5.5 10.9 1.2 8.1 6.5 9.6 11.6 15.5 7.1 12.4
yi
•
14.6 8.9 5.5 8.9 13.5
3
e2ij = 10.2 y¯
••
= 10.3
i=1 j =1
(a) Determinar si el tipo de mezcla y el nivel de fluorita a˜ nadido influyen significativamente en el coste de fabricaci´ on. Se supone que no existe interacci´ on entre los dos factores. (b) Contrastar que porcentaje de fluorita produce el menor coste del clinker. 21. El an´alisis de la varianza de un dise˜ no en bloques aleatorizados proporciona los siguientes resultados: V T = 232, V E (factor) = 156, V E (bloque) = 15 y V N E = 61. El n´ umero de niveles del factor es 5 y el n´umero de bloques 8. Construir la tabla ADEVA. ¿ Cu´ al ser´ıa el resultado del an´ alisis si no se tiene en cuenta el efecto de los bloques ? Indicar en qu´e circunstancias es preferible cada uno de los modelos. 22. Se ha realizado un experimento con tres factores, (A, B y C), con 4, 3, y 5 niveles, sin replicaciones. El modelo propuesto no incluye las interacciones de orden 3, por lo que la variabilidad explicada por estas interacciones se pretende utilizar para estimar la varianza residual. Los resultados proporcionan para la variabilidad explicada por las interacciones de orden 3 un valor igual a 234.5; que es muy superior a lo esperado. Debido a ´esto se repiti´ o por completo el experimento, obteni´endose para este segundo experimento un valor de 158.7 8
(para la variabilidad explicada por la interacciones de orden 3). Proponer un procedimiento para contrastar si se ha producido un cambio significativo en esta variabilidad de uno a otro experimento, indicando las hip´otesis en las que se basa el contraste. (Dejar el resultado del contraste indicado en funci´ on de los valores cr´ıticos de la tabla correspondiente.) 23. 8.25. (2-96) En un modelo de an´ alisis de la varianza se ha observado que la desviaci´on t´ıpica (ˆsi ) y la media (y i ) de las observaciones de cada tratamiento est´ an relacionadas linealmente, al de las siguientes transformaciones es la m´ as sˆi = ky i , donde k es una constante. ¿ Cu´ 2 adecuada para corregir la heterocedasticidad ? z = log y , z = y o z = ky 24. La oxidaci´ o n es una etapa de la fabricaci´ o n de chips y consiste en a˜ n adir una capa de ´oxido sobre la placa silicio (oblea). Se est´ a experimentando con 6 tratamientos (T i ) para seleccionar el que proporciona un mayor espesor de o´xido en un mismo tiempo de proceso. Una caracter´ıstica que influye en el espesor es el acabado superficial de la oblea, por lo que se tomaron 5 tipos distintos de acabado (O j ). De cada tipo (O j ) se tomaron 6 obleas y se asignaron aleatoriamente a los tratamientos. En la tabla se proporciona el espesor obtenido en cada oblea y las medias por filas y columnas.
O1 O2 O3 O4 O5
T 1
T 2
T 3
T 4
T 5
T 6
85.60 89.30 84.70 87.60 87.30 86.90
90.90 91.50 87.50 90.50 93.10 90.70
93.00 93.60 90.90 95.60 94.90 93.60
80.50 83.20 81.00 84.60 82.70 82.40
85.20 87.80 83.20 87.60 86.70 86.10
88.90 91.00 86.30 91.10 88.70 89.20
87.35 89.40 85.60 89.50 88.90 88.15
VT = 465.1
(a) Contrastar si el tipo de oblea y el tratamiento influyen en el espesor del oxido. ´ Elegir el tipo de oblea y tratamiento m´ as adecuado, indicando si son significativamente distintos del resto. (b) Para fijar los seis tratamientos, se seleccionaron dos temperaturas (t1 , t2) y tres presiones ( p1 , p2 , p3 ) y se combinaron de forma que T 1 = (t1 , p1 ), T 2 = (t1, p2), T 3 = (t1 , p3) T 4 = (t2, p1), T 5 = (t2 , p2) y T 6 = (t2 , p3 ). Calcular las variabilidades explicadas por la temperatura, la presi´ on y su interacci´on (t × p). (c) Indicar si sus efectos son significativos, suponiendo nulas las interacciones de los factores O × t, O × p y O × t × p. ˆ j son independientes. 25. Demostrar que en un modelo de bloques aleatorizados, µˆ, α ˆ i y β 26. Un centro ha realizado un experimento para mejorar la resistencia a la tensi´ on de ciertos muelles de acero. En una etapa del proceso el muelle caliente se sumerge en aceite templado. Se han estudiado tres factores, A (temperatura del acero antes de la inmersi´ o n, con tres niveles), B (temperatura del ba˜ no de aceite, dos niveles) y C (concentraci´ on de carbono en el acero, dos niveles). El experimento se ha replicado tres veces. En la tabla se muestra la media y la varianza (corregida) para los tres datos de cada tratamiento.
9
A 1 1 1 1 2 2 2 2 3 3 3 3
B C 1 1 1 2 2 1 2 2 1 1 1 2 2 1 2 2 1 1 1 2 2 1 2 2
yi
sˆ2i
40.2 0.25 61.1 2.68 35.9 2.43 57.1 4.44 49.0 3.49 70.3 7.77 46.7 5.08 67.6 1.03 41.9 4.27 62.7 11.41 37.1 1.33 60.3 6.13
(a) Dar un intervalo del 95 % de confianza para la varianza del error experimental, σ 2. (b) Indicar si los efectos principales de A, B y C son significativamente distintos de cero. (c) Dado σ 2 , construir un intervalo que cumpla que la probabilidad de que sˆ2i (la varianza muestral corregida de un tratamiento) est´e contenido en ´el sea igual a 0.95. Sustituir σ 2 por su estimador y con ayuda de este intervalo, discutir si se puede rechazar la hip´otesis de homocedasticidad de las observaciones. 27. Estimar por m´ axima verosimilitud los par´ametros µ, αi y β j del modelo de bloques aleatorizados. Obtener la distribuci´ on de estos estimadores, indicando su media y varianza. 28. Explicar por qu´e en un modelo de dos factores con interacci´ on es necesario poner las condiciones I
i=1
J
α i = 0,
j =1
I
β j = 0,
J
(αβ )ij = 0 para todo j ,
i=1
y
(αβ )ij = 0 para todo i.
j =1
¿Se podr´ıan haber puesto otras condiciones distintas a las anteriores? Justificar la respuesta. 29. La calidad de un producto qu´ımico despues de un largo periodo de almacenamiento depende del conservante empleado y de las caracter´ısticas de almacenamiento. Se ha estudiado el efecto de cuatro conservantes distintos (columnas) y cinco almacenamientos (filas) sobre la degradaci´on del producto:
1 2 3 4 5 Medias
1 2 3 4 Medias 15.1 11.0 18.8 10.3 13.8 8.1 4.3 11.8 3.8 7.0 15.3 11.5 15.6 9.2 12.9 8.0 4.4 11.0 5.8 7.3 13.5 9.3 15.8 18.2 14.2 12.0 8.1 14.6 9.46 11.04 10
La tabla de an´ alisis de la varianza para los datos anteriores es:
Almacen. Conserv. Residuos Total
Suma de Cuadrados 205.488 123.676 61.484 390.648
Grados de Libertad
S. Cuadrados Nivel F Medios Cr´ıtico 51.372 10.03 0.0008 41.225 8.05 0.0033 5.123
4 3 12 19
(a) Elegir con α = 0.05 el conservante y el almacenamiento que producen menor degradaci´ on. (b) El an´alisis de los residuos muestra como at´ıpica la observaci´ on y54 = 18.2. Un examen qu´ımico confirma el resultado an´ omalo por lo que se recomienda eliminar la observaci´ on. Seg´ un el modelo de dos factores sin interacci´on, la predicci´on de la observaci´ on yIJ (eliminada) es: yIJ =
S I S J S + − (J − 1) (I − 1) (I − 1)(J − 1) ∗
∗
∗∗
donde I = 5, J = 4, S I es la suma de las observaciones de la fila I (sin incluir la eliminada), S J es la suma de las observaciones de la columna J (sin incluir la eliminada), y S es la suma de las observaciones restantes no incluidas en la fila I ni en la columna J. Obtener la distribuci´on (media y varianza) del error de predicci´ on eIJ = y IJ − yIJ . ∗
∗
∗∗
(c) Cuando, como en el caso anterior, falta una observaci´ on se recomienda el siguiente procedimiento: sustituir la observaci´ on faltante por su predicci´ on y aplicar los contrastes habituales teniendo en cuenta que los residuos tienen un grado de libertad menos. La nueva descomposici´ on de la variabilidad es: VT=339.63, VE(Conservantes)=166.02, VE(Almacenamiento)=164.02 y VNE=9.59. Contestar al apartado 1 con esta modificaci´on e interpretar las diferencias. 30. Una instalaci´ on t´ıpica de almacenamiento de combustible en una Estaci´ on de Servicio (gasolinera) est´ a formada por un tanque enterrado de gran capacidad, al que se encuentran conectados distintos surtidores. La cantidad total de gasolina suministrada en un d´ıa se puede determinar midiendo directamente la variaci´ on que se ha producido en el tanque de almacenamiento (Y 1 j ) o por la suma de los suministros de los distintos surtidores (Y 2 j ). La comparaci´on de ambas medidas permite determinar p´erdidas en la instalaci´ on enterrada y otras anomal´ıas. En el proceso de comparaci´ on es necesario tener en cuenta que las medidas est´an afectadas por errores aleatorios. Durante 20 d´ıas se han tomado los valores anteriores en un gasolinera: D´ ıa→ Y 1 j Y 2 j
D´ ıa→ Y 1 j Y 2 j
1
2
3
4
5
6
7
8
9
4116,2 4143,6
5627,0 5632,0
2820,4 2868,1
2521,8 2477,7
2973,5 2955,4
2834,9 2851,9
2335,7 2312,7
2590,8 2630,6
2182,7 2208,9
11
12
13
14
15
16
17
18
19
4323,6 4305,4
1880,7 1877,9
2131,4 2159,2
3349,6 3366,7
2545,0 2566,1
2247,3 2281,4
1817,5 1854,6
1461,3 1461,5
1646,5 1607,3
11
10
2621,4 2635,9 20
1955,4 1956,4
(a) Llamando D j = Y 1 j − Y 2 j a la diferencia en las medidas de un mismo d´ıa, contrastar con α = 0.05 H 0 : µD = 0 0 H 1 : µD = donde D j tiene distribuci´ o n N(µD , σ D ). Calcular el nivel cr´ıtico del contraste aproximando la distribuci´on t de Student por la normal. (b) Los datos anteriores pueden ser analizados mediante un modelo de bloques aleatorizados tomando el tipo de medida (tanque, surtidores) como un factor y los d´ıas como bloques. Demostrar con caracter general que en el modelo de bloques aleatorizados si el factor tiene dos niveles la varianza residual cumple: s2R =
1 2 s 2 D
donde s2D es la estimaci´on de σ2D del apartado 1.
(c) Teniendo en cuenta lo anterior, demostrar que el contraste correspondiente al factor en el modelo de bloques aleatorizados es equivalente al contraste del apartado 1. 31. Una forma alternativa de la ecuaci´ on del modelo para comparar I tratamientos es yij = µ + τ i + uij ,
i = 1, 2,...,I ;
j = 1, 2,...,m
donde µ es la media global τ 1 , τ 2 ,...,τ I son los par´ ametros que determinan los efectos de cada tratamiento, cumplen I que i=1 τ i = 0
entica distribuci´ on normal de media cero y uij son variables aleatorias independientes con id´ 2 varianza σ . (a) Obtener el estimador m´ aximo veros´ımil de τ i , indicar su distribuci´on de probabilidad, media y varianza. (b) Calcular la esperanza de la variabilidad explicada (V E = m par´ametros τ i no son todos nulos.
I i=1
τ 2i ) cuando los
(c) Calcular la correlaci´ on entre τ i y un residuo eij cualquiera (del mismo o diferente tratamiento). Que implicaci´ o n tiene este resultado en el contraste de an´ alisis de la varianza.
32. Un ingeniero est´ a estudiando m´ etodos para mejorar ciertas propiedades mec´ anicas de una aleaci´on met´ alica. Los dos factores que considera m´ as importantes son la cantidad de Manganeso y la temperatura de templado. Se dise˜ na un experimento empleando tres niveles para el factor manganeso y dos para la temperatura, en total 3×2 = 6 tratamientos. Se dispone de 6 hornos diferentes para realizar la fundici´ on. Cada horno requiere un operador y se disponen de seis operadores cada uno de los cuales es capaz de manejar los seis hornos. Dise˜ nar un experimento que con 36 observaciones permita estudiar las diferencias entre los 12
seis tratamientos y que tenga en cuenta el tipo de horno y el operador como variables bloques. Construir la tabla de an´ alisis de la varianza, indicando los grados de libertadad de cada variabilidad, separando en ella el factor manganeso, el factor temperatura y su interacci´on. (Los bloques y los factores no interaccionan). (Nota: no es necesario indicar en la tabla como se obtienen las distintas variabilidades). 33. Una asociaci´ on de consumidores para comprobar la utilidad de ciertos compuestos que seg´ un sus fabricantes reducen el consumo de gasolina de los autom´ oviles realiz´o el siguiente experimento: eligi´o al azar 9 veh´ıculos nuevos de distintas marcas con cilindrada similar y con cada uno de ellos recorri´ o tres veces un mismo trayecto con conductores distintos. Adem´ as en cada uno de estos tres trayectos emple´ o un tratamiento diferente para la gasolina:
Tratamiento
Gasolina con Cyber-Gas Gasolina con Consumin Gasolina sin aditivo
A: B: C:
En la tabla siguiente se muestra el consumo en litros de gasolina en cada uno de los recorridos y el tipo de tratamiento (letra latina). N´ umero Veh´ıculo 1 2 3 4 5 6 7 8 9 Media Columna
Conductores 2
1
15,5 13,0 11,8 14,4 12,4 15,6 12,7 14,2 12,6
(A) 15,6 (B) (B) 13,3 (A) (B) 13,1 (C) (A) 14,8 (C) (B) 14,3 (A) (C) 15,3 (A) (C) 12,0 (B) (C) 14,0 (B) (A) 13,5 (C)
Media fila
3
16,6 13,0 12,5 15,0 14,1 14,7 12,0 15,1 12,3
(C) (C) (A) (B) (C) (B) (A) (A) (B)
15,90 13,10 12,47 14,73 13,60 15,20 12,23 14,43 12,80
Media de Tratam.
A:13,89 B:13,42 C:14,18
Media Total
13,58
13,99
13,92
13,83
El an´alisis de los datos se realiza con el siguiente modelo yijk = µ + αi + β j + γ k + uijk
d´onde yijk representa el consumo en litros, µ la media global; αi , i = 1, 2, ..., 9 y β j , j = 1, 2, 3 los efectos correspondientes a los veh´ıculos (filas) y los conductores (columnas). La estimaci´ on e interpretaci´ on de estos par´ ametros es similar al modelo de bloques aleatorizados. Adem´as se incluye los par´ametros γ k , k = 1, 2, 3 que miden el efecto de los tratamientos (tipo de aditivo) y cumplen 3k=1 γ k = 0. Por u ´ ltimo, uijk la componente aleatoria son variables aleatorias independientes con distribuci´ on normal de media cero y varianza σ2 para todas las observaciones.
(a) Obtener razonadamente los estimadores m´ aximo veros´ımiles de γ k . 13
(b) La tabla del an´ alisis de la varianza del modelo anterior es
Suma de Cuadrados Tratamiento 2,67 Veh´ıculo 40,2 Conductor 0,876 Residual Total
Grados de Libertad Varianza F 2 1,31 6,7 8 5,02 25,7 2 0,438 2,2
2,73 46,4
14 26
p-Valor 0,0091 0,0000 0,1428
0,195
¿Reducen los aditivos el consumo de gasolina? ¿ Existen diferencias significativas entre Cyber-gas (A) y Consumin (B)? (Realizar los contrastes con nivel de significaci´on 0.05). (c) Demostrar que el dise˜ no anterior, independientemente de los valores num´ericos (yijk ) obtenidos, es un dise˜ no ortogonal, es decir que cumple: VT = VE(Veh´ıculos) + VE(Conductores) + VE(Tratamientos) + VNE (Nota.- Es suficiente con demostrar la ortogonalidad del vector correspondiente a los tratamientos con respecto a los otros tres). 34. Un inform´ atico quiere comparar los tiempos de ejecuci´ on de tres programas realizados en lenguajes diferentes que realizan el mismo proceso. Para hacer la comparaci´ on utilizan 4 ordenadores con microprocesadores distintos. Los tiempos requeridos por cada programa en cada ordenador han sido: ORDENADOR ↓ 1 2 3 4 y¯ j •
PROGRAMA A B C 1,36 2,23 1,54 0,97 0,70 0,76 1,79 1,74 1,84 0,64 0,69 0,74 1,19 1,34 1,22
y¯i
•
1,71 0,81 1,79 0,69 1,25
¿Existen diferencias significativas en los tiempos requeridos por los 3 programas? 35. Se ha realizado un experimento con dos factores cada uno de ellos con 3 niveles. El 20% de la variabilidad total est´a explicada por la interacci´ o n de los dos factores y el 40% de la variabilidad total es debida a la variabilidad residual. Determinar el n´ umero de replicaciones necesarias en cada tratamiento para que la interacci´ on sea significativa con α = 0.01. (Explicar el procedimiento de c´ alculo, dejando el resultado indicado en funci´ on de las tablas).
14
36. Un investigador quiere estudiar el efecto de sexo (hombre, mujer) y tipo de formaci´ on (ciencias, letras) en el dominio del ingl´es escrito en profesores universitarios. Para ello analiza el n´umero de incorrecciones gramaticales en art´ıculos cient´ıficos enviados a publicaci´ on. Para cada combinaci´ on de niveles de los factores se han elegido al azar tres profesores. En la tabla se proporciona el n´ umero de fallos detectados en art´ıculos de 15 p´ aginas
Hombre Mujer
Letras Ciencias 8, 6, 13 22, 28, 33 5, 10, 6 12, 14, 9
Contrastar con nivel de significaci´ on 0.05 si los efectos principales y la interacci´on son significativos. Tener en cuenta que P (F 1,8 ≤ 5.32) = 0.95, siendo F 1,8 la distribuci´on F con grados de libertad 1 y 8. Interpretar los resultados. 37. Un alumno, como trabajo de la asignatura de estad´ıstica, ha comparado tres marcas distintas (A,B,C) de palomitas de ma´ız precocinadas. Cada marca puede prepararse friendolas en una sart´en (m´etodo 1) o en el horno microondas (m´etodo 2). El alumno ha realizado un dise˜ no factorial completo 3×2 con cinco replicaciones en cada uno de los seis tratamientos. La variable respuesta medida es el porcentaje de granos de ma´ız que no se han inflado adecuadamente. Los resultados del experimento se muestran en la tabla, en cada tratamiento se proporciona la media y entre par´ entesis la desviaci´ on t´ıpica corregida para las cinco replicaciones. Contrastar si la interacci´ on entre los dos factores es significativa.
Sart´en Horno
A
B
C
5.5 (1,4) 3.8 (1,3)
3.6 (1,8) 3.4 (0,9)
7.5 (2,5) 4.3 (1,3)
38. Se ha realizado un experimento con dos factores, A (temperatura con tres niveles), B (concentraci´ o n con cuatro niveles). El experimento se ha replicado 5 veces. En la tabla se
15
muestra la media y la varianza (corregida) para los 5 datos de cada tratamiento. A 1 1 1 1 2 2 2 2 3 3 3 3
B 1 2 3 4 1 2 3 4 1 2 3 4
yi
sˆ2i
240 261 235 257 249 270 246 267 241 262 237 260
1.2 1.6 1.4 2.4 1.4 5.7 5.8 1.7 4.2 9.4 1.3 6.1
Escribir la tabla de an´alisis de la varianza. 39. Se desea estudiar la influencia de 2 factores en el error de medida de un equipo de visi´ on artificial. Un factor F es la distancia focal, para el que se han fijado 4 niveles y el otro factor L es el nivel de iluminaci´on con 2 niveles. Adem´ as se dispone de 2 equipos diferentes para realizar las medidas. Se ha tomado un patr´ on y se ha medido en las combinaciones indicadas en la tabla, donde yijk es el error obtenido al situar la distancia focal i, con iluminaci´on j y el equipo k. F −→ L −→
1 1
Equipo 1 y111 Equipo 2 y112
2 1
3 1
4 1
1 2
2 2
3 2
4 2
y211 y212
y311 y312
y411 y412
y121 y122
y221 y222
y321 y322
y421 y422
Construir la tabla de an´alisis de la varianza, que incluya los efectos principales debidos a la distancia focal (F ), la iluminaci´on (L) y el equipo, y adem´as la interacci´on F × L, suponiendo que son nulas el resto de interacciones. 40. Cierta industria de lentes para gafas desea comparar dos tipos de recubrimiento antireflectante A, B. Los dos tipos tienen id´entico aspecto y prestaciones, pero antes de decidirse por uno u otro desean comprobar si el tipo de recubrimiento influye en el desgaste que sufre la lente. Para ello construyen gafas con una lente de cada tipo que distribuyen entre 10 personas seleccionadas al azar que habitualmente utilizan gafas. Al cabo de seis meses miden el desgaste y se obtienen los valores que se indican en la tabla.
16
Persona 1 2 3 4 5 6 7 8 9 10
Lente A Lente B 6.7 6.9 5.0 5.8 3.6 4.1 6.2 7.0 5.9 7.0 4.0 4.6 5.2 5.5 4.5 5.0 4.4 4.3 4.1 4.8
¿Qu´e tipo de recubrimiento recomendar´ıa a los fabricantes con el criterio de m´ınimo desgaste?. 41. Demuestre que en un modelo en bloques aleatorizados, con I niveles para el factor y J niveles para el bloque, con modelo yij = µ + αi+ β j + uij ,el valor esperado de la variabilidad explicada por el factor es: E [V E (α)] = 2 2 (I − 1)σ2 + J J i=1 αi ,siendo σ la varianza del error experimental.
42. Se desea comprobar si el orden en el que aparecen las preguntas de un examen test influye en resultado obtenido por el alumno. Se han preparado dos examenes, el Test A tiene las preguntas en orden de dificultad creciente y el Test B a la inversa. Se ha elegido una muestra aleatoria de 20 alumnos y se han emparejado seg´ un su habilidad, de forma que los dos alumnos de cada pareja han demostrado durante el curso una habilidad similar. De cada pareja, un alumno se ha asignado aleatoriamente al Test A y el otro al Test B. Los resultados finales del ejercicio han sido (cada pareja es una columna) Test A: Test B:
83 82 95 92 91 60 89 69 70 72 76 62 70 74 52 63 48 80 76 74
¿Es evidente que las puntuaciones del Test B son mas bajas que las del Test A? 43. El an´alisis de la varianza de un dise˜ no en bloques aleatorizados proporciona los si-guientes resultados: V T = 129, V E (factor) = 38, 5 y V E (bloque) = 82, 5. El n´umero de niveles del factor es 4 y el n´umero de bloques 4. Construir la tabla de an´ alisis de la varianza y hacer los contrastes correspondientes con nivel de significaci´ on 0,05. 44. Se ha estudiado la influencia de la cantidad de cierto aditivo en la opacidad de un material pl´astico que se puede fabricar por tres m´etodos de extrusi´ on. El objetivo es conseguir el tratamiento con opacidad m´ınima. Cada tratamiento se ha replicado 5 veces, los valores medios y las desviaciones t´ıpicas corregidas para cada caso se proporcionan en la tabla 1. La tabla 2 corresponde al an´ alisis de la varianza. Se ha comprobado que se verifican las condiciones de normalidad y homocedasticidad. 17
M´etodo 1 1 2 2 3 3
Extrus. Aditivo Interac. Residual Total
Aditivo Medias Desv. T´ıp. 1 9.5 0.83 2 9.3 0.67 1 10.0 1.53 (TABLA 1) 2 8.1 0.77 1 11.5 0.78 2 6.0 1.23
Suma de cuadrad.
g.l.
2.210 47.636 37.572 24.728 112.146
2 1 2 24 29
Var.
F
1.105 1.072 47.636 46.2 18.786 18.2 1.030
p-valor
0.358 0.000 0.000
(TABLA 2)
(a) A la vista de los resultados de las dos tablas indica qu´e m´etodo de extrusi´ on es aconsejable para conseguir la opacidad m´ınima. (b) Da un intervalo del 95% de confianza para la opacidad media en las condiciones optimas. ´ (c) Sea di = y i1 − y i2
la diferencia entre las medias observadas en los dos niveles del factor aditivos para el m´etodo de extrusi´ on i. Calcula el valor esperado y la varianza de d i en t´erminos de los par´ametros del modelo factorial. (d) Si E (di) = 0 para los tres m´etodos, obt´en la distribuci´ on de probabilidad de 5 d21 + d22 + d23 × . 2 σ2 45. Se ha estudiado el efecto de tres hornos diferentes y dos temperaturas (290 o C y 320 o C) en la duraci´on de cierto componente. Para cada combinaci´ on de horno y temperatura se ha replicado el experimento 3 veces. En la tabla siguiente se proporcionan las medias y desviaciones t´ıpicas de los datos de cada tratamiento. Temperatura oC 290 o C 320 o C Media Desv. T. Media Desv. T. Horno 1 245.6 8.50 180.0 2.65 Horno 2 191.0 15.39 144.0 2.65 Horno 3 187.0 4.58 134.3 8.62
18
Fuente Horno Temp. HxT Residual Total
Suma Cuadrado 9646.3 13667.6 274.8 837.3 24426
Grados Libertad 2 1 2 12 17
Varianza 4823.2 13667.6 137.4 69.8
F 69.1 195.9 1.97
p-valor 0.000 0.000 0.182
Seleccionar el horno y la temperatura que proporcionan m´ axima duraci´on, haciendo los contrastes de igualdad de medias con nivel de significaci´ on 0.01.
19