Diseño de bloques completos al azar 1. Introducción En muchos problemas experimentales, es necesario diseñar el experimento de tal manera que la variabilidad proveniente de otras fuentes pueda ser sistemáticamente controlada. Si esta variabilidad no es controlada, el error experimental (variabilidad entre unidades experimentales 2
que son tratadas igual o ) reflejará tanto el error experimental como la variación adicional de otras fuentes. Lo que queremos es que el error experimental sea tan pequeño como sea posible. Un diseño que nos ayuda a contabilizar y remover esta fuente adicional de variación es el diseño de bloques completamente al azar (DBCA). En el DBCA, las unidades experimentales están agrupadas primero en grupos homogéneos llamados bloques y los tratamientos están asignados al azar dentro de los bloques. Es llamado completo debido a que cada bloque recibe todos los tratamientos. La variabilidad no controlada por las fuentes extrañas es ahora controlada por el bloqueo. Esta estrategia de diseño puede mejorar la exactitud de las comparaciones entre tratamientos reduciendo la variabilidad entre las unidades experimentales. experimentales. Note que los bloques proveen de una replicación del experimento. Factores de bloqueo comunes: localidad, tiempo, individuos. 2. Diseño
Bloqueo El objetivo primario de organizar las unidades experimentales dentro de bloques es el de reducir la variación residual. Esta reducción se logra haciendo a la unidades experimentales experimentales lo mas parecido posible dentro de un bloque y los mas diferente posible entre bloques. Al asignar a los tratamientos dentro de cada bloque, las diferencias entre tratamientos son observadas usando la variación dentro de bloque, la cual es mas pequeña. En un DBCA las unidades experimentales son divididas en r bloques cada uno consistiendo de t unidades experimentales. Los bloques son construidos de tal manera que, las t unidades experimentales dentro de un bloque son similares y las unidades experimentales en bloques diferentes no lo son. El criterio final para juzgar un DBCA será su habilidad para reducir la varianza residual. Asignación de tratamientos tratamientos Tomando cada bloque, los t tratamientos son aleatoriamente asignados a los t unidades experimentales dentro de un bloque. En esencia, cada bloque es un diseño completamente aleatorio no replicado. Debido a que el DBCA describe como los tratamientos serán asignados al material experimental es otro ejemplo de un diseño experimental. 3. Modelo
Formula Estadística:
yij
B j
i
eij
i = 1, 2, ..., t , j = 1, 2, ..., r
Donde:
y ij es la observación en el j-ésimo bloque recibiendo el i-ésimo tratamiento, es la media general, i
es el efecto del i-ésimo i -ésimo tratamiento
B j es el efecto del j-ésimo bloque y e ij es el efecto residual en el j-ésimo bloque recibiendo el i-ésimo tratamiento. La adición del efecto del termino bloque en la formula es un reflejo de la aleatorización restringida. Esto es, a diferencia del diseño completamente al azar, cada tratamiento esta presente exactamente una vez en cada bloque. En este punto diferiremos la discusión de efectos fijos o aleatorios para mas tarde. 1. Valor esperado
E y ij
i
La media de la variable dependiente será diferente para cada tratamiento. Esto asume que los bloques son aleatorios. Si los bloques son tratados como fijos, entonces debe añadirse él termino B j al valor esperado. Además debemos tenemos que asumir que las diferencias entre tratamientos permanecen constantes a través de bloques, esto es: E yij yi j' i i '
2. Varianzas y covarianzas
Var yij
2
2
B 2
La covarianza entre observaciones en el mismo bloque es
B
. La covarianza entre
observaciones en diferentes bloques es cero. Esto es, observaciones en el mismo bloque son más similares que observaciones en diferentes bloques. Si los bloques son fijos, la varianza sería todas las covarianzas sería cero.
2
3. Distribución Normal Se han hecho un numero importante de supuestos. En el caso de que el efecto de bloque sea fijo, se asume que los efectos de bloques y tratamiento son aditivos. También se asume que la variabilidad es constante a través de bloques y tratamientos. 4. Estimación No existen diferencias en nuestros estimadores de diferencias entre tratamientos o sus
errores estándar. Existirá diferencia en el estimador de
2
y los grados de libertad.
5. Cuadro de análisis de varianza
Fuente Bloques
gl r-1
SC SCBloque
CM CMBloque
Tratamiento
t -1
SCTrt
CMTrt
Error
(r-1)(t-1)
SCerror
j
1
t
y .2j
2
2
rk t2
2
B
2
2
y .. rt
F
t
CMerror r
SCBloques =
E(CM)
F
CMTrt CMerror
y
t
i
SCTrt =
t
SCerror =
2
1
y i .
2
r
t
i
r
y ij
2
rt
r
2
y i . 1
r
i 1 j 1
y ..
j
2
y. j 1
t
2
y.. rt
Las media y varianza de un tratamiento pueden obtenerse de la siguiente manera:
E y1. y 2. E E
1
B. e1.
1
Var y1. y 2. Var
B. e 2.
2 1
2
2
e1. e 2.
2
1
2
e1. e 2.
2
r r Lo importante aquí es que al comparar medias de tratamiento el efecto del bloque se elimina. 6. Eficiencia del bloqueo
La efectividad del bloqueo puede ser juzgado usando la tasa de la varianza residual usando bloques (
2
BA
) con la varianza residual sin bloqueo (
2
CA
), esto es:
2
BA 2
CA
La cual es llamada eficiencia relativa y es el numero de replicas de un diseño completamente al azar necesarios para obtener el mismo error estándar como una replicación única de un DBCA. Por ejemplo, una eficiencia relativa de 1.2 indicaría que por cada 5 replicaciones de un DBCA se necesitarían 6 = 1.2 x 5 replicas de un diseño completamente aleatorio para obtener el mismo error estándar. Un estimador de la eficiencia relativa puede obtenerse utilizando la siguiente ecuación:
re
r 1CMBloque r t 1CMerror rt 1CMerror
7. Ejemplo Objetivo: Comparar la tasa de emergencia de semillas de soya, 3 tratamientos (2 tratamientos y un control sin tratamiento). El siguiente arreglo fue usado:
Rep 1
Diseño de tratamiento:
Rep 2
Rep 3
-
Factor tratamiento: Semillas tratadas
-
Niveles de tratamiento:Tres (Control, Arasan y Aspergon)
Diseño Experimental: - El terreno esta localizado en una pendiente - Los bloques se forman basándose en la elevación - 3 parcelas por cada elevación - 3 replicas de un DBCA Los datos consisten del numero de plantas que emergen de un total de 100 que fueron plantadas. Note que quizá una distribución Binomial podría ser una selección más adecuada. Formula estadística
yij
B j
i
eij
Donde:
y ij es la tasa de emergencia de las semillas tratadas con el i-ésimo tratamiento en el jésimo bloque, es la media general de la tasa de emergencia, es el incremento en la tasa de emergencia de la semillas tratadas con el i-ésimo tratamiento, B j es el incremento en la tasa de emergencia para las semillas en el j-ésimo bloque y e ij es el incremento en la tasa de emergencia por usar el i-ésimo tratamiento en el j-ésimo bloque. i
Datos: Bloque 1 1 1 2 2 2 3 3 3
Trartamiento 1 2 3 1 2 3 1 2 3
Resp 2.9 2.5 2.1 1.7 1.4 1.1 2.0 1.5 1.0
Codificación para el análisis: Proc glm ; Classes blk trt; Model resp=blk trt; lsmeans trt;
run;
Resultados: The GLM Procedure Class Level Information Class blk
Levels 3
Values 1 2 3
trt 3 1 2 3 Number of observations 9
The GLM Procedure Dependent Variable: resp Source Model Error Corrected Total
DF 4
Sum of Squares 3.18000000
4 8
0.04000000 3.22000000
R-Square 0.987578 Source
Coeff Var 5.555556
Mean Square 0.79500000
F Value 79.50
Pr > F 0.0005
0.01000000
Root MSE 0.100000
resp Mean 1.800000
DF
Type I SS
Mean Square
F Value
Pr > F
blk
2
2.22000000
1.11000000
111.00
0.0003
trt
2
0.96000000
0.48000000
48.00
0.0016
DF 2
Type III SS 2.22000000
Mean Square 1.11000000
F Value 111.00
Pr > F 0.0003
2
0.96000000
0.48000000
48.00
0.0016
Source blk trt
The GLM Procedure Least Squares Means trt 1 2 3
resp LSMEAN 2.20000000 1.80000000 1.40000000
The GLM Procedure Dependent Variable: resp Contrast t1 vs t2
DF 1
Contrast SS 0.24000000
Mean Square 0.24000000
F Value 24.00
Pr > F 0.0080
t2 vs t3
1
0.24000000
0.24000000
24.00
0.0080
Resumen
-
DCA vs DBCA La mayor ventaja del DCA es su simplicidad Si los bloques se construyen adecuadamente, la ventaja del DBCA es que obtenemos mayor precisión Con un numero grande de tratamientos puede resultar difícil formar bloques efectivos En paso de análisis es la aleatorización usada la que conduce a que análisis usar. En algunas ocasiones del DCA es un mejor diseño: o El formar bloques únicamente por hacerlos no es una buena idea o Bloquear incorrectamente empeora las cosas.