Metodología del diseño experimental de bloques al azar.
En muchos problemas de diseño experimental es necesario diseñar el experimento de modo que sea posible controlar la variabilidad generada por un factor indeseable. El procedimiento general para el diseño aleatorizado por bloques completos consiste en seleccionar b bloques y realizar una réplica completa del experimento en cada uno de ellos. En la tabla 4.1 aparecen los datos que se obtienen al aplicar un diseño aleatorizado por bloques completos para investigar un solo factor con a niveles y b bloques. En cada bloque existen a observaciones (una por cada nivel del factor), y el orden en que se toman estas observaciones se asigna de manera aleatoria dentro del bloque. Suponga que tiene interés en un solo factor que tiene a niveles, y que el experimento se efectúa en b bloques. Las observaciones pueden presentarse con el modelo estadístico lineal. Donde μ es la media global, iτ es el efecto del i -ésimo tratamiento, jβ es el efecto del j-ésimo bloque y jiε es el término de error aleatorio, el cual se supone que tiene una distribución normal e independiente con media cero y varianza ().En principio, los efectos de los tratamientos y de bloques son considerados como factores fijos. Por otro lado, los efectos de los tratamientos y de los bloques son definidos como desviaciones de la media global. Diseño de experimentos factoriales. En cualquier experimento diseñado, es siempre importante examinar los residuos y verificar si se violan las suposiciones básicas (Normalidad, Independencia, Aditivita e Igualdad de varianzas) que pueden invalidar los resultados. Los valores de los residuos del diseño aleatorizado por bloques completos se obtienen, como es usual, por la diferencia entre los valores observados y los estimados El análisis de varianza del modelo supone que las observaciones están distribuidas de manera normal e independiente, con la misma varianza para cada tratamiento o nivel del factor. Estas suposiciones deben verificarse mediante el análisis de los residuos. La suposición de normalidad puede verificarse mediante la construcción de una gráfica de probabilidad normal de los residuos. Para esto, los residuos se agrupan
en una tabla de distribución de frecuencias, se calcula la frecuencia relativa acumulada para cada valor y se grafican en una hoja de papel de probabilidad normal. Si la suposición es válida los puntos tenderán a agruparse sobre una línea recta que pasa por el punto medio.
Diseño factorial.
En ocasiones, cuando se utiliza un diseño aleatorizado por bloques completos, alguna de las observaciones en uno de los bloques puede faltar. Esto sucede debido algún descuido o error, o por razones fuera del control del experimentador, como sería el caso de la pérdida de alguna unidad experimental. Una observación faltante introduce un nuevo problema en el análisis, ya que los tratamientos dejan de ser ortogonales a los bloques.
En otras palabras, cada tratamiento no ocurre en cada bloque. Existen dos formas generales de resolver el problema de los valores faltantes. La primera es un análisis aproximado en el que se estima la observación faltante. A continuación se efectúa el análisis de varianza usual como si la observación estimada fuera un dato real, disminuyendo los grados de libertad del error en uno. La segunda es un análisis exacto usando la prueba de significancia de regresión general. Suponga que falta la observación correspondiente al tratamiento i y al bloque j. Esta observación se representa mediante x el gran total con una observación faltante se representará mediante y los totales del tratamiento y del bloque con un dato faltante como y, respectivamente. Supongamos, además, que para estimar la observación faltante se elige x, de manera que tenga una contribución mínima a la suma de cuadrados del error. Como la suma de cuadrados del error está dada en donde R incluye todos los términos que no contienen a x. Al derivar la SCE con respecto a x e igualar a cero se obtiene Como un estimador para la observación faltante. Diseño de cuadros latinos. Un diseño cuadrado latino para p factores, o un cuadrado latino p x p, es un cuadrado que contiene p renglones y p columnas. Cada una de las p2 celdas contiene una de las p letras que corresponde a un tratamiento, y cada letra aparece una sola vez en cada renglón y columna. El diseño cuadrado latino se usa para eliminar dos fuentes de variabilidad problemáticas; en otras palabras, permite
analizar sistemáticamente por bloques en dos direcciones. A continuación se presentan algunos ejemplos de cuadrados latinos. En donde: Kjiy= observación correspondiente al i-ésimo renglón, la k-ésima columna y el jésimo tratamiento Μ= la media general Iα= es el i-ésimo efecto de renglón Jτ= es el j-ésimo efecto de tratamiento Kβ= es el k-ésimo efecto de la columna Kjiε= es el error aleatorio
El modelo es completamente aditivo, en otras palabras, no existe interacción entre los renglones, las columnas y los tratamientos. Sólo dos de los subíndices i, j y k se requieren para especificar una observación en particular porque únicamente hay una observación en cada celda. El análisis de varianza consiste en descomponer la suma total de cuadrados de las observaciones en sus componentes de renglón, columna, tratamiento y error Cuyos grados de libertad. Bajo la suposición de que el error aleatorio se distribuye en forma normal e independiente, cada una de las sumas de cuadrados es al dividir entre, variables aleatorias independientes con distribución ji-cuadrada. Diseño de cuadros grecolatinos. Consideremos un cuadrado latino p × p al que se le sobrepone un segundo cuadrado latino cuyos tratamientos se designan por letras griegas. Se dice que los dos son ortogonales si al sobreponerse poseen la propiedad de que cada letra griega aparece solamente una vez con cada letra latina. El diseño cuadrado greco-latino puede utilizarse para controlar sistemáticamente tres fuentes extrañas de variabilidad. En otras palabras, se usa para hacer un análisis por bloques en tres direcciones. El diseño permite analizar cuatro factores (renglón columna, letra griega y letra latina), cada uno con p niveles, usando solamente p2 ensayos. Los cuadrados grecolatinos existen para toda excepto para p = 6. En donde: lkjiy la observación que corresponde al renglón i, la columna k, la letra latina j y la letra griega k. μ= La media general
iθ= Es el efecto del i-ésimo renglón jτ= Es el j-ésimo efecto de tratamiento de las letras latinas kω= Es el k-ésimo efecto de tratamiento de las letras griegas lψ= Es el efecto de la column a l lkjiε= Es la componente del error aleatorio Sólo dos de los cuatro subíndices son necesarios para identificar completamente cualquier observación.
El análisis de varianza es muy similar al de un cuadrado latino. El factor representado por las letras griegas es ortogonal a los renglones, las columnas y los tratamientos de la letra latina porque cada letra griega ocurre una sola vez en cada renglón, en cada columna y para cada letra latina. Por lo tanto la suma de cuadrados debida al factor letra griega puede calcularse usando los totales de la letra griega. El error experimental se reduce en esta cantidad. Las hipótesis nulas de igualdad entre los renglones, entre las columnas, entre los tratamientos de la letra latina y entre los tratamientos de la letra griega pueden probarse dividiendo la media de cuadrados correspondiente entre la media de cuadrados del error.