ANÁLISIS DE LA VARIANZA ANOVA DEFINICIÓN El análisis de la varianza (o Anova: Analysis of variance) es un método para comparar dos o más medias. Es necesario porque cuando se quiere comparar más de dos medias es incorrecto utilizar repetidamente el contraste basado en la t de Student. En resumen, el análisis de varianza sirve para comparar si los valores de un conjunto de datos numéricos son significativamente distintos a los valores de otro o más conjuntos de datos. El método para comparar estos valores está basado en la varianza global observada en los grupos de datos numéricos a comparar. Típicamente, el análisis de varianza se utiliza para asociar una probabilidad a la conclusión de que la media de un grupo de puntuaciones es distinta de la media de otro grupo de puntuaciones. El ANOVA parte de algunos supuestos que han de cumplirse:
La variable dependiente debe medirse al menos a nivel de intervalo.
Independencia de las observaciones.
La distribución de la variable dependiente debe ser normal.
Homocedasticidad: homogeneidad de las varianzas.
Existen tres tipos de modelos:
El modelo de efectos fijos asume que el experimentador ha considerado para el factor todos los posibles valores que éste puede tomar. Ejemplo: Si el género del individuo es un factor, y el experimentador
ha
incluido
tantos
individuos
masculinos
como
femeninos, el género es un factor fijo en el experimento.
Los modelos de efectos aleatorios asumen que en un factor se ha considerado tan sólo una muestra de los posibles valores que éste puede tomar. Ejemplo: Si el método de enseñanza es analizado como un factor que puede influir sobre el nivel de aprendizaje y se ha
considerado en el experimento sólo tres de los muchos más métodos posibles, el método de enseñanza es un factor aleatorio en el experimento.
Los modelos mixtos describen situaciones donde están presentes ambos tipos de factores: fijos y aleatorios.
La técnica fundamental consiste en la separación de la suma de cuadrados (SS, 'sum of squares') en componentes relativos a los factores contemplados en el modelo. Como ejemplo, mostramos el modelo para un ANOVA simplificado con un tipo de factores en diferentes niveles. (Si los niveles son cuantitativos y los efectos son lineales, puede resultar apropiado un análisis de regresión lineal).
SSTotal = SSError + SSFactores El número de grados de libertad (gl) puede separarse de forma similar y se corresponde con la forma en que la distribución chi-cuadrado describe la suma de cuadrados asociada.
glTotal = glError + glFactores Nota:
Por grados de libertad "degrees of freedom" entendemos el número
efectivo de observaciones que contribuyen a la suma de cuadrados en un ANOVA, es decir, el número total de observaciones menos el número de datos que sean combinación lineal de otros. Del mismo modo que la t de Student, la prueba ANOVA es una prueba paramétrica y como tal requiere una serie de supuestos para poder ser aplicada correctamente. Denominada ANOVA o análisis de la varianza, en realidad nos va a servir no solo para estudiar las dispersiones o varianzas de los grupos, sino para estudiar sus medias y la posibilidad de crear subconjuntos de grupos con medias iguales. Se puede decir que la prueba ANOVA es la generalización de la t de Student, ya que si realizamos una prueba ANOVA en la comparación de solo dos grupos, obtenemos los mismos resultados. Al igual que la t de Student, se requiere que cada uno de los grupos a comparar tenga distribuciones normales, o lo que es más exacto, que lo sean
sus residuales. Los residuales son las diferencias entre cada valor y la media de su grupo. Además debemos estudiar la dispersión o varianzas de los grupos, es decir estudiar su homogeneidad. Cuando mayor sean los tamaños de los grupos, menos importante es asegurar estos dos supuestos, ya que el ANOVA suele ser una técnica bastante “robusta” comportándose bien respecto
a transgresiones de la normalidad. No obstante, si tenemos grupos de tamaño inferior a 30, es importante estudiar la normalidad de los residuos para ver la conveniencia o no de utilizar el análisis de la varianza. Si no fuera posible utilizar directamente el ANOVA, podemos recurrir al uso de pruebas no paramétricas, como la de Kruskal-Wallis. Como ya hemos dicho, el ANOVA es la generalización de la t de Student, y sus hipótesis nula y alternativa se pueden formular del siguiente modo:
Hipótesis nula (Ho): µ1= µ2=…= µk
Las medias de los k grupos son iguales y por tanto las diferencias encontradas pueden explicarse por el azar. Dicho de otro modo, los grupos proceden de poblaciones con medias iguales.
Hipótesis alternativa (H1): al menos uno de los grupos tiene una media distinta del resto de grupos.
En la prueba ANOVA las comparaciones son siempre bilaterales (a dos colas) ya que estudiamos globalmente si los grupos tienen medias distintas, y no si un grupo tiene una media menor o mayor que otro por separado. Si se rechaza la hipótesis nula, no sabremos entre qué grupos están las diferencias.
EJEMPLOS: 1. Los miembros de un equipo ciclista se dividen al azar en tres grupos que entrenan con métodos diferentes. El primer grupo realiza largos recorridos a ritmo pausado, el segundo grupo realiza series cortas de alta intensidad y el tercero trabaja en el gimnasio con pesas y se ejercita en el pedaleo de alta frecuencia. Después de un mes de entrenamiento se realiza un test de rendimiento consistente en un recorrido cronometrado de 9 Km. Los tiempos empleados fueron los siguientes:
A un nivel de confianza del 95% ¿Puede considerarse que los tres métodos producen resultados equivalentes? O por el contrario ¿Hay algún método superior a los demás?
Solución: Comenzamos calculando los totales y los cuadrados de los totales divididos por el número de observaciones:
A continuación calculamos los cuadrados de las observaciones y su total:
A partir de estas cantidades básicas calculamos las Sumas de Cuadrados: SC(total) = 2984 - 2940 = 44 SC(intra) = 2984 – 2966,8 = 17,2 SC(entre) = 2966,8 – 2940 = 26,8
Los cuadrados medios serán: CM(entre) = 26,8/2 = 13,4 CM(intra) = 17,2/12 = 1,43 Por consiguiente el estadístico de contraste vale:
F = 13,4/ 1,43 = 9,37
El valor de la F teórica con 2 y 12 grados de libertad, a un nivel de confianza del 95% es 3,89. Por consiguiente se rechaza la hipótesis nula y se concluye que los tres métodos de entrenamiento producen diferencias significativas.
2. Una lista de palabras sin sentido se presenta en la pantalla del ordenador con cuatro procedimientos diferentes, asignados al azar a un grupo de sujetos. Posteriormente se les realiza una prueba de recuerdo de dichas palabras, obteniéndose los siguientes resultados:
¿Qué conclusiones pueden sacarse acerca de las cuatro formas de presentación, con un nivel de significación del 5%?
Solución: Comenzamos calculando los totales y los cuadrados de los totales divididos por el número de observaciones:
A continuación calculamos los cuadrados de las observaciones y su total:
A partir de estas cantidades básicas calculamos las Sumas de Cuadrados:
SC(total) = 988 – 819,8 = 168,2 SC(intra) = 988 – 902 = 86 SC(entre) = 902 – 819,8 = 82,2
Los cuadrados medios serán: CM(entre) = 82,2/3 = 27,4 CM(intra) = 86/22 = 3,9
Por consiguiente el estadístico de contraste vale: F = 27,4/ 3,9 = 7,03
El valor de la F teórica con 3 y 22 grados de libertad, a un nivel de confianza del 95% es 3,05. Por consiguiente se rechaza la hipótesis nula y se concluye que los cuatro procedimientos de presentación producen diferencias significativas.