EJEMPLO RESUELTO DE ANOVA DE DOS FACTORES COMPLETAMENTE ALEATORIZADO, MEDIDAS INDEPENDIENTES Y EFECTOS FIJOS.
[NOTA: Más adelante (en las respuestas a las preguntas) veréis parte del texto en rojo, esta zona roja no formaría parte de la respuesta del examen. Se ha introducido en el ejemplo como explicación y repaso de teoría]. En un estudio diseñado para evaluar la relación entre el nivel de ansiedad y el nivel de ejecución en una tarea de rendimiento se ha incluido una nueva variable: la dificultad de dificultad de la tarea. tarea. Se ha utilizado una m.a.s. de 30 sujetos repartidos, también aleatoriamente, en grupos del mismo tamaño. Cada grupo ha realizado la prueba de rendimiento bajo una de las condiciones resultantes de combinar 2 niveles de dificultad (fácil, difícil) con 3 de ansiedad (bajo, ansiedad (bajo, medio, alto). El rendimiento se ha medido en una escala de 0 a 20 puntos. El objetivo del estudio es valorar qué impacto tiene sobre el rendimiento la dificultad de la tarea, tarea, el nivel de ansiedad y ver si el efecto de la dificultad de la tarea sobre el rendimiento no es el mismo en todos los niveles de ansiedad (alfa=0,05). ansiedad (alfa=0,05). Los resultados del análisis son los siguientes:
Responda a las siguientes cuestiones:
1. ¿Qué análisis estadístico se realizó y por qué? Indique las variables que intervienen en el análisis y su función dentro del mismo. Se trata de un diseño 2x3 completamente aleatorizado. Es decir, un diseño de dos factores (A: dificultad de la tarea (primera variable independiente), con 2 niveles y B: nivel de ansiedad (segunda variable independiente) con 3 niveles) en el que se ha asignado una muestra aleatoria del mismo número de sujetos a cada una de las condiciones experimentales. La variable dependiente es el rendimiento, variable cuantitativa. Las variables independientes son cualitativas. El ANOVA de II factores completamente aleatorizado, de medidas independientes y efectos fijos es el modelo apropiado para analizar estos datos.
2. Reconstruya la Tabla Pruebas de efectos inter-sujetos completando todos los datos que faltan. El número de niveles del factor dificultad es 2 por lo tanto los grados de libertad asociados a la Suma Cuadrática inter-grupos del factor dificultad es (f-1)=2-1=1. Por otro lado el número de niveles del factor nivel de ansiedad son 3 por lo tanto los grados de libertad as ociados a la Suma Cuadrática intergrupos del factor nivel de ansiedad es (c-1)=3-1=2. Los grados de libertad asociados a la Suma Cuadrática de la Interacción (dificultad*nivel de ansiedad) es (f-1)*(c-1)=2. Los grados de libertad asociados a la Suma Cuadrática Error son N-f*c=30-6=24. Por último los grados de libertad asociados a la Suma Cuadrática Total es N-1=29. A partir de aquí, sacaríamos el resto de los datos con las fórmulas de las Medias Cuadráticas y de los Estadísticos de Contraste F. La tabla quedaría:
3. Indique el número de sujetos totales, el número de sujetos por nivel y el número de sujetos en las casillas. El número de sujetos totales sería 30. En la variable dificultad tendríamos 15 sujetos para el nivel fácil y otros 15 para el nivel difícil. En la variable nivel de ansiedad tendríamos 10 sujetos en el nivel bajo, otros 10 en el nivel medio y otros 10 en el nivel alto. Como tenemos 2 variables, el número de casillas distintas serían 2*3=6, entonces el número de sujetos en cada casilla sería 5.
4. Indique cuáles son los supuestos del análisis estadístico utilizado y cuáles se han comprobado. Para poder trabajar con los estadísticos F consideramos que trabajamos con muestras aleatorias procedentes de poblaciones normales con la misma varianza. Es decir, independencia, normalidad y homocedasticidad. La diferencia con el modelo de ANOVA de un factor, es que ahora no tenemos f poblaciones sino f*c, en nuestro caso 6 poblaciones. Entonces asumimos que esas 6 poblaciones son normales y tienen la misma varianza. También asumimos que de esas poblaciones tenemos una muestra aleatoria de observaciones independientes entre si e independientes de las observaciones del resto de las muestras. Por otro lado, el único supuesto que se ha comprobado es el de homocedasticidad con la prueba de Levene. Esta prueba no ha dado significativa por lo tanto nuestra muestra cumple el supuesto de homocedasticidad. Los supuestos de independencia y normalidad no se han comprobado, para comprobarlos tendría que haberse realizado el Test de rachas para el supuesto de independencia y la prueba de Kolmogorov-Smirnov para el supuesto de normalidad. 5. Indique qué hipótesis se contrastan en este análisis y las conclusiones a las que llega el investigador. Tenemos tres hipótesis nulas y tres hipótesis alternativas: a) Las relativas al primer factor, dificultad :
H 0 : 1
H 0 : 1
2
2
, o lo que es lo mismo
0
H 0 : fácil
H 0 : fácil
difícil
difícil
0
Es decir, H 0 : No existe diferencia entre las medias poblacionales de dificultad en rendimiento. El rendimiento medio es el mismo con tareas fáciles y con tareas difíciles. La dificultad en la tarea no afecta al rendimiento. La H 1 : El rendimiento medio no es el mismo con tareas fáciles y con tareas difíciles, es decir, la dificultad de la tarea afecta al rendimiento. Puesto que el nivel crítico es 0,038 y es menor que alfa, rechazamos H 0 . Podemos concluir que el rendimiento medio no es el mismo con tareas fáciles y con tareas difíciles. Por tanto, la dificultad de la tarea afecta al rendimiento. b) Las relativas al segundo factor: nivel de ansiedad :
H 0 : 1
H 0 : 1
2 3
2
3
0
, o lo que es lo mismo
H 0 : bajo
H 0 : bajo
medio alto
medio
alto
0
Es decir, H 0 : No existe diferencia entre las medias poblacionales de nivel de ansiedad en rendimiento. El rendimiento medio es el mismo en los distintos niveles de ansiedad. nivel de ansiedad no afecta al rendimiento.
El
La H 1 : El rendimiento medio no es el mismo en los distintos niveles de ansiedad, es decir, el nivel de ansiedad afecta al rendimiento. Puesto que el nivel crítico es 0,000 y es menor que alfa, rechazamos H 0 . Podemos concluir que el rendimiento medio no es el mismo en los tres niveles de ansiedad. Por tanto, el nivel de ansiedad afecta al rendimiento. c) Las relativas a la interacción entre los dos factores anteriores:
H 0 : rs H 1 : rs
0
0
Es decir, H 0 : La interacción entre la dificultad de la tarea y el nivel de ansiedad no afecta al rendimiento. La H 1 : La interacción entre la dificultad de la tarea y el nivel de ansiedad afecta al rendimiento. Puesto que el nivel crítico es 0,006 y es menor que alfa, rechazamos H 0 . Podemos concluir que el efecto de cada factor sobre el rendimiento está condicionado o modulado por la presencia del otro factor. El efecto de la interacción dificultad*nivel de ansiedad es estadísticamente significativo. Las tres hipótesis son independientes, pero si se rechaza la hipótesis nula de la interacción es la que tiene el mayor peso en la explicación. 6. ¿Qué información aporta la tabla Comparaciones por pares y la tabla Comparaciones múltiples post hoc?. Comente los resultados que aparecen en las mismas y la información que aparece en la gráfica. Si el estadístico de contraste F en las tres hipótesis sale significativo, indica que los promedios comparados no son iguales, pero no permite concretar qué promedio difiere de qué otro. Para esto es necesario llevar a cabo comparaciones múltiples.
Comenzamos con el primer factor, ya que rechazamos la H 0 referida a la dificultad . En este caso, no sería necesario hallar comparaciones múltiples a posteriori, puesto que esta variable tiene sólo dos niveles. Aquí está claro que las medias que difieren son las del grupo difícil con las del grupo fácil.
En el caso del segundo factor, nivel de ansiedad también rechazamos H 0 . Aquí si necesitamos hallar comparaciones múltiples porque esta variable tiene tres niveles y no sabemos cuales difieren entre si. A estas comparaciones se refiere la tabla Comparaciones múltiples post hoc. En ella se realizan las comparaciones dos a dos de los tres niveles de ansiedad. Podemos ver cómo las medias que difieren entre sí son las de los grupos nivel de ansiedad bajo y medio (con un nivel crítico de 0,004, menor que alfa) y los grupos de nivel de
ansiedad medio y alto (con un nivel crítico de 0,000, menor que alfa). En cambio las medias de los grupos de nivel de ansiedad bajo y alto no difieren entre sí (nivel crítico de 0,649 mayor que alfa). Utilizamos los datos referidos a Scheffé porque la prueba de Levene no ha dado significativa.
Por último, recordemos que también hemos rechazado la H 0 referida a la interacción entre las dos variables independientes. Esto significa que también tendremos que analizar las comparaciones a posteriori de los niveles de uno de los factores ( dificultad ) dentro de cada uno de los niveles del otro factor ( nivel de ansiedad ), a esto se refiere la tabla Comparaciones por pares. Es muy importante tener en cuenta que el significado de rechazar la hipótesis referida al efecto de la variable dificultad y el significado de rechazar la hipótesis referida al efecto de la variable nivel de ansiedad , están condicionados por el efecto de la interacción (si este sale significativo, como es el caso). Cuando no existe interacción significativa, los efectos de las variables independientes por separado, agotan toda la información del diseño. Pero una interacción significativa acapara todo el protagonismo del diseño relegando los efectos de las variables independientes por separado a un segundo plano. Lo que indican los resultados es que el efecto de la interacción es significativo y esto hace que ya no sea posible afirmar que el rendimiento con las tareas fáciles es mejor que con las tareas difíciles, pues esto depende del nivel de ansiedad de los sujetos. Y tampoco es posible afirmar que el rendimiento es mejor cuando el nivel de ansiedad es medio que cuando es bajo o alto, pues esto depende de la dificultad de la tarea. Si nos fijamos en la tabla Comparaciones por pares, vemos que sólo es significativa una comparación. Por tanto, puede concluirse que la dificultad de la tarea únicamente afecta al rendimiento cuando el nivel de ansiedad de los sujetos es bajo. Cuando el nivel de ansiedad de los sujetos es medio o alto, no puede afirmarse que el rendimiento se vea afectado por la dificultad de la tarea. Si nos fijamos en el gráfico basado en las medias de las casillas, parece que lo que ocurre cuando el nivel de ansiedad es bajo (se rinde mucho mejor en las tareas fáciles) no es lo mismo que lo que ocurre cuando el nivel de ansiedad es medio (se rinde un poco mejor en las tareas fáciles) o alto (se rinde un poco mejor en las tareas difíciles). También parece que lo que ocurre cuando el nivel de ansiedad es medio no es lo mismo que lo que ocurre cuando el nivel de ansiedad es alto. Pero todo esto no es más que una impresión visual basada en las diferencias observadas. Los contrastes de la tabla Comparaciones por pares son los que indican que la única diferencia significativa se da en el nivel de ansiedad bajo. Por tanto, podemos concluir que el significado de los efectos de las variables independientes por separado quedan matizados y alterados por la presencia de una interacción significativa.
7. Indique el tamaño del efecto e interprételo en aquellos contrastes en los que proceda. Sabemos que el valor de un estadístico F no depende únicamente de la magnitud real del efecto analizado (es decir, de la verdadera diferencia entre las medias que compara), sino del tamaño de las muestras y del grado de variabilidad de las puntuaciones. Por tanto, una F significativa no
necesariamente se corresponde con un efecto importante o un resultado relevante desde el punto de vista teórico o práctico. Para ello se utilizan medidas del tamaño del efecto. Una forma de cuantificar el tamaño del efecto consiste en estimar la proporción de varianza compartida. Esto puede hacerse, con la medida de asociación eta cuadrado. En la tabla Resumen del ANOVA. Contrastes de los efectos inter-sujetos la columna eta cuadrado parcial contiene los datos para interpretar el tamaño del efecto. En el caso de la variable independiente dificultad , esta comparte el 17% de la varianza del rendimiento. Y en el caso de la variable independiente nivel de ansiedad , esta comparte el 48% de la varianza del rendimiento. Lo que significa que saber cuál es el nivel de ansiedad de los sujetos permite mejorar un 48% nuestro conocimiento del rendimiento. En el caso de la interacción dificultad*nivel de ansiedad , el 35% de la variabilidad de la variable dependiente rendimiento se debe a la interacción. 8. Indique la probabilidad de rechazar la hipótesis nula siendo falsa en cada uno de los contrastes. La potencia del contraste sobre el primer factor (variable dificultad ) es de 0,56 lo que indica una potencia moderada. La potencia del contraste del segundo factor (variable nivel de ansiedad ) es de 0,98 lo que indica una potencia alta. Y por último la potencia del contraste sobre la interacción (efecto dificultad*nivel de ansiedad ) es de 0,86, lo que indica una potencia alta.