MAESTRIA EN RADIOLOGIA BUCAL Y MAXILOFACIAL
PRUEBA DE KRUSKAL – WALLIS Y PRUEBA DE FRIEDMAN MAESTRANDO: YALIL RODRIGUEZ
Cuando la distribución de los datos no presenta normalidad, y se requiere comparar más de 3 grupos, se pueden realizar varios tipos de pruebas: - Si los grupos son independientes:
Prueba de Kruskal Wallis Mediana - Si los grupos están relacionados: Prueba de Friedman W de Kendall Q de Cochran
Prueba de Kruskal Wallis También es llamada prueba H Es el equivalente a un ANOVA de una sola vía
Es la prueba más adecuada para comparar poblaciones cuyas distribuciones no son normales Es una prueba no paramétrica, que utiliza rangos de datos muestrales de tres o más grupos independientes Se utiliza para probar la hipótesis nula (Ho) de que las muestras independientes provienen de poblaciones con medianas iguales. La hipótesis alterna (H1) es la afirmación de que las poblaciones tienen medianas que no son iguales
Los valores de la muestra invariablemente difieren de alguna manera, y la pregunta es si las diferencias entre las muestras significan diferencias genuinas en la población o si solo representan la clase de variaciones que pueden esperarse en muestras que se obtienen al azar de la misma población.
Requiere que las mediciones de las variable se encuentre al menos en escala ordinal
Fue propuesta por William Henry Kruskal (1919- 2005) y W. Allen Wallis (1912-1998), en el artículo ¨Use of ranks in onecriterion varience analysis¨, publicado en en ¨Journal of American Statistics Association¨, en 1952
Requisitos Al menos 3 muestras independientes, las cuales se seleccionan al azar Cada muestra debe tener al menos 5 observaciones La distribución de los datos no deber normal
Fórmula
N= número total de observaciones en todas las muestras combinadas K= número de muestras R1= suma de los rangos de la muestra 1 N1= número de observaciones de la muestra 1
Gl (grados de libertad)= k-1
Pasos 1. Planteamiento de las hipótesis 2. Se ordenan las observaciones de menor a mayor, y se les asignan rangos desde 1 hasta n 3. Se obtiene la suma de los rangos correspondientes a los elementos de cada muestra, y se halla el rango promedio
4. Se calcula el estadístico de prueba 5. Se busca H en la Tabla de Chi cuadrado 6. Se extraen las conclusiones
Para aplicar la prueba, se calcula el estadístico de prueba H, el cual tiene una distribución que puede aproximarse por medio de la distribución Chi ², siempre y cuando cada muestra tenga al menos 5 observaciones. Cuando se utiliza Chi ² en este contexto, el número de grados de libertad es k-1 Si las muestras tiene menos de 5 observaciones, hay que remitirse a tablas de valores críticos Se trabaja generalmente con un nivel de significancia de 0.05 Si el resultado que arroja H es mayor que 0.05, se acepta Ho.
Al aplicarse la prueba de Kruskal Wallis, existe un factor de corrección que debe aplicarse siempre que existan muchos empates:
T= L³- L. Donde L es el número de observaciones que está empatada. Se calcula T para cada grupo, y luego se realiza la sumatoria N= Número de todas las observaciones
Ejemplo Utilizaremos algunos datos de mi artículo titulado: “ ANALISIS DE BJÖRK Y JARABAK EN SUJETOS CON DIFERENTE RELACIÓN ESQUELÉTICA, SOBRE CEFALOGRAMAS DERIVADOS DE TOMOGRAFÍA COMPUTARIZADA CONE BEAM”. El tamaño de la muestra fué de 15 sujetos para Clase I, 15 sujetos para Clase II, y 16 sujetos para Clase III. A los 46 sujetos se les realizaron los trazos correspondientes al análisis de Björk y Jarabak, más el ANB y el FMA (ángulo mandibular)
Primero, aplico la prueba de normalidad de los datos. En este caso, con SPSS. Los datos no tienen distribución normal o paramétrica, si son < 0.05
En este caso, según la prueba de S-W, los ángulos NSAr, o ángulo de la silla, para Clase II, el MeGoN, o ángulo goniaco inferior para Clase II, y laAltura Facial Anterior, o NMe, para Clase III, fueron menores a 0.05, es decir, no tienen normalidad en su distribución . Para estas medidas, usaremos la prueba de Kruskal Wallis.
Para la explicación del uso de la prueba de Kruskal Wallis, usaremos los valores del ángulo NSAr, para los 3 grupos Angulo SNAr Clase I Clase II 121 128 130 115 127 128 134 121 114 117 125 116 117 116 125
Clase III 124 122 125 124 123 121 116 124 135 126 118 133 102 126 122
133 114 119 113 114 128 127 123 119 122 114 123 127 119 123 128
En este caso, compararemos el comportamiento del ángulo SNAr en las 3 clases esqueléticas. Es decir, haremos la comparación en 3 grupos.
Para el caso, plantearemos las siguientes hipótesis: - Hipótesis nula (Ho): el comportamiento del ángulo SNAr en las 3 clases esqueléticas, no difiere significativamente entre si. - Hipótesis alterna(H1): el comportamiento del ángulo SNAr en las 3 clases esqueléticas, difiere significativamente entre sí.
Va l or de Ang. SNAr en des cendente
Orden
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33
102 113 114 114 114 114 115 116 116 116 117 117 118 119 119 119 121 121 121 122 122 122 123 123 123 123 124 124 124 125 125 125 126
Calculo de rango en caso
Ra ngo de empate
1 2 4,5 3+4+5+6/4=4,5 4,5 4,5 4,5 7 9 8+9+10/3=9 9 9 11,5 11+12/2=11,5 11,5 13 15 14+15+16/3=15 15 15 18 17+18+19/3=18 18 18 21 20+21+22/3=21 21 21 24,5 23+24+25+26/4=24,5 24,5 24,5 24,5 28 27+28+29/3=28 28 28 31 30+31+32/3=31 31 31 33,5 33+34/2=33,5
Explicación en la diapositiva siguiente
# de ligas
4
3
2
3
3
Se inicia con el ordenamiento de todas las observaciones de los 3 grupos, uniéndolas en uno solo, a partir del valor más pequeño hasta el mayor, y la detección de las ligas o empates. Si se producen empates en los valores, se aplica un factor de corrección, el cual se observa en la columna “Cálculo de rango en caso de empate””.
3
4
3
3
2
34 35 36 37 38 39 40 41 42 43 44 45 46
126 127 127 127 128 128 128 128 130 133 133 134 135
33,5 36 35+36+37/3=36 36 36 39,5 38+39+40+41/4=39,5 39,5 39,5 39,5 42 43,5 43+44/2=43,5 43,5 45 46
3
4
2
Para el valor del ángulo 114, hay 4 empates: el 3, 4, 5, y 6. Para obtener el valor corregido, se suman y se dividen entre el # de valores. 3+4+5+6=18. Dividido entre 4= 4.5. Este valor se usa para los 4 empates Así sucesivamente en todos los casos de empate Se presentan 13 empates en valores El número de ligas es el número de valores empatados para cada rango. En este caso, es de 4, pues hay 4 valores empatados en 114. Va l or de Ang. SNAr en des cendente
Orden
1 2 3 4 5 6 7
102 113 114 114 114 114 115
Calculo de rango en caso
Ra ngo de empate
1 2 4,5 3+4+5+6/4=4,5 4,5 4,5 4,5 7
# de ligas
4
Una vez efectuado el ordenamiento en rangos, volvemos a la primera tabla para organizar cada observación con su correspondiente rango, y realizar la sumatoria de rangos. Cada sumatoria, la elevamos al cuadrado 121 128 130 115 127 128 134 121 114 117 125 116 117 116 125 ∑R R²
18 39,5 42 7 36 39,5 45 18 4,5 11,5 31 9 11,5 9 31 352,5 124256,25
124 122 125 124 123 121 116 124 135 126 118 133 102 126 122
Rangos
Clase III
Rangos
Clase II
Rangos
Clase I
28 21 31 28 24,5 18 9 28 46 33,5 13 43,5 1 33,5 21 379 143641
133 114 119 113 114 128 127 123 119 122 114 123 127 119 123 128
43,5 4,5 15 2 4,5 39,5 36 24,5 15 21 4,5 24,5 36 15 24,5 39,5 349,5 122150,25
Ahora se calcula el valor de ajuste de ligas con la siguiente fórmula: L= 1- ∑(Li³-Li) N³-N
=
∑ (3³-3) + (4³-4)……… 46³ - 46
=1- 306/97290
= 0.99 Donde Li corresponde al valor de cada liga, y N corresponde al número total de observaciones entre los 3 grupos.
Con el ajuste L, procedemos a calcular el valor estadístico de prueba de Kruskal Wallis
12
H=
124256,25
X 46(46+1)
143641
+ 15
122150,25
+ 15
- 3 (46 + 1) 16
= 0,00555042 X (8283,75+9576,06667+7634,39063) - 141 = 0,00555042 X (25494,2073) – 141 = 141,503463 – 141 = 0,503. Al dividirlo con el ajuste L, que corresponde a 0,99 nos da = 0,50. Este valor se compara con los valores de chi ², pues cada muestra tuvo al menos 5 observaciones, en este caso, 15 o 16. Teniendo en cuenta que los grados de libertad son k – 1, quiere decir que k=2 (fueron 3 grupos)
Tabla de Chi 2
La prueba H nos arroja un resultado de 0.50, el cual es menor a 5.99 de la tabla de Chi ², con 2 grados de libertad , con un nivel de significancia de 0.05. 0.50 se encuentra entre el 0.8 y el 0.7 de probabilidad, lo cual no es significativo Este resultado de H es mayor de 0.05, lo cual quiere decir que no hay diferencias significativas en las medianas de las 3 clases esqueléticas para el ángulo SNAr.
Se acepta la hipótesis nula (Ho).
En SPSS
Nos arroja el mismo resultado
Este valor es mayor a 0.05, lo cual significa que no hay diferencias significativas entre las 3 clases esqueléticas para el ángulo NSAr. Se acepta la hipótesis nula (Ho).
Prueba de Friedman Esta prueba puede considerarse como una extensión de la prueba de Wilcoxon para el caso de más de 2 muestras relacionadas. Es la prueba no paramétrica paralela al ANOVA de medidas repetidas, y al igual que éste, contrasta la hipótesis nula de igualdad de tres o más muestras relacionadas Existen 2 situaciones en las que se aplica esta prueba: - Para una misma muestra medida más de 2 veces. En este caso, k es el número de tratamientos, o las diferentes situaciones o tiempos en los que se mide al sujeto
- En una sola medición de más de 2 muestras relacionadas. En este caso, k es el número de muestras o grupos relacionados
En estadística la prueba de Friedman es una prueba no paramétrica desarrollado por el economista Milton Friedman. Esta prueba puede utilizarse en aquellas situaciones en las que se seleccionan n grupos de k elementos de forma que los elementos de cada grupo sean lo más parecidos posible entre sí, el método consiste en ordenar los datos por filas o bloques, reemplazándolos por su respectivo orden.
Hipótesis
H0: No existen diferencias entre los grupos.
Ha: Existen diferencias entre los grupos.
Para resolver este contraste de hipótesis, Friedman propuso un estadístico que se distribuye como una Chi-cuadrado con K - 1 grados de libertad, siendo K el número de variables relacionadas; se calcula mediante la siguiente expresión.
Estadístico de Prueba
En la expresión anterior: • X2r = estadístico calculado del análisis de varianza por rangos de Friedman.
• H = representa el número de elementos o de bloques (numero de hileras) • K = el número de variables relacionadas
• ∑ Rc2 = es la suma de rangos por columnas al cuadrado.
Pasos 1.
2.
3. 4. 5.
Hacer una tabla en la que las K variables, es decir, las K medidas estén en las columnas y los n elementos en las filas, de esta manera la tabla tendrá K columnas y n filas. A los valores de cada fila se les asigna un número del 1 a K, según el orden de magnitud de menor a mayor; a este número se le denomina rango. Se suman los respectivos rangos en función de las columnas. Aplicar la fórmula de análisis de varianza de doble entrada por rangos de Friedman. Comparar el valor de X2r de Friedman con tablas de valores críticos de Chi-cuadrada.
Ejemplo Se escogen al azar 8 Maestrandos de la Maestría de Radiología Bucal y Maxilofacial de la UPC, para evaluar su criterio con respecto al grado de incomodidad que podria presentar un paciente con respecto a la toma de 3 tipos de radiografías intraorales: Periapical de zona molar posterior inferior, Oclusal inferior, y Bite wing de zona molar posterior. Este criterio se evalúa de acuerdo a una escala de 1 a 10, donde 1 es MUY INCÓMODO, y 10 corresponde a una MUY BUENA RESPUESTA DEL PACIENTE. Ho, o Hipótesis nula: No hay diferencia entre las 3 técnicas. H1, o Hipótesis alterna: Existe diferencia entre las 3 técnicas con respecto al grado de incomodidad en el paciente.
Primer paso: Hacer una tabla en la que las K variables estén en las columnas y los n elementos en las filas, de esta manera la tabla tendrá K (3) columnas y n (8) filas. Maestrandos
A B C D E F G H
Periapical
Oclusal 6 9 6 5 7 5 6 6
BW 5 9 9 8 8 7 7 7
3 4 3 6 8 5 5 7
Segundo paso: A los valores de cada fila se les asigna un número del 1 a K (3), según el orden de magnitud de menor a mayor; a este número se le denomina rango.
Maestrandos A B C D E F G H
Periapical 6(3) 9(2.5) 6(2) 5(1) 7(1) 5(1.5) 6(2) 6(1)
Oclusal 5(2) 9(2.5) 9(3) 8(3) 8(2.5) 7(3) 7(3) 7(2.5)
BW 3(1) 4(1) 3(1) 6(2) 8(2.5) 5(1.5) 5(1) 7(2.5)
Tercer paso: Se suman los respectivos rangos en función de las columnas.
Las sumas de rangos correspondientes a cada aparato, variable o columna son:
R1 = 14
R2 =21.5
R3 =12.5
A cada valor se le saca el cuadrado.
R1 = 196
R2 = 462.25
R3 = 156.25
Cuarto paso: Aplicar la fórmula de análisis de varianza de doble entrada por rangos de Friedman.
= 12/ 8x3 (4) (14)² + (21.5)² + (12.5)² - 3 (8) (3+1) = 12/ 96
196 + 462.25 + 156.25 - 96
= 0.125 (814.15) - 96 = 101.76 - 96 = 5.81
Debido a que se presentaron varios empates, hay que dividir este valor por un factor de corrección. Su fórmula es la siguiente:
Donde: T ih = número de observaciones empatadas para un rango dado en una fila, o bloque h = numero de empates en cada bloque. Por ejemplo, en el bloque 2 hay un solo empate (h=1), y hay 2 datos empatados (t 2h=2). Entonces T 2= 2³-2=6. Igual para los bloques o filas 5, 6, y 8. Entonces, ∑ T I = 24 k = número de variables, es decir, 3. b=H = Número de filas o bloques, es decir , 8.
C = 1 – 24/24 X 8 = 0.875 Con la corrección, quedaría: 5.81 x 0.875 = 6.64
Este valor se compara con la tabla de Chi ². Los grados de libertad corresponden a k -1, osea 3-1= 2 Para este caso, el valor de Chi ² es de 5.99. Nuestro resultado es mayor a este valor, lo que significa que si hay diferencias significativas en el grado de incomodidad para el paciente, entre las 3 técnicas. Se rechaza la hipótesis nula
En SPSS
El mísmo valor
Este valor es menor a 0.05, lo cual nos confirma las diferencias significativas encontradas. Se rechaza la Hipótesis nula
GRACIAZZZZZZZZZZ ZZZZZZZZZZZZZZZZ ZZZZZZZZZ……