Test Exacto de Fisher El contra contraste ste de homogen homogenei eidad dad median mediante te la prueba prueba Chi-C Chi-Cuad uadrad rado o entre entre dos vari variab able les s cual cualit itat ativ ivas as (o tamb tambié ién n llam llamad ado o cont contra rast ste e de inde indepe pend nden enci cia a entre ntre dos dos variables cualitativas) se basa en la comparación de las frecuencias obtenidas con las frecuencias frecuencias esperadas. esperadas. La prueba exacta de Fisher está está basad basada a en la distr distrib ibuc ución ión exact exacta a de los los datos y no en aproximaciones asintóticas, y presupone que los marginales de la tabla de contingencia están fijos. En general, cuando las frecuencias absolutas esperadas, en la gran mayoría de casillas o celdas son relativamente grandes (más de 5), se utiliza el estadístico ChiCuadrado Cuadrado para realizar realizar el contraste contraste mencionado. mencionado.
Cuando en un 20% de las casillas el valor esperado no es superior a 5, el estadístico anterior no es válido y generalmente se utiliza la prueba exacta de Fisher. Habitualmente, la prueba exacta de Fisher es más conservadora que la prueba Chi-Cuadrado. La prueba exacta de Fisher se aplica a variables dicotómicas
Test Exacto de Fisher Para calcular el estadístico de contraste, se construye en primer lugar la tabla de contingencia de dimensiones 2x2 con las frecuencias absolutas observadas, con la notación siguiente: A
B
+
-
+ -
a c
b d
c1
c2
A continuación,
f1 f 2 n
se construyen todas las tablas de contingencia 2x2 posibles con celdas a¶, b¶, c¶, d¶, siendo 0 < a¶ < mín{c1 , f1}, b¶ = f1 ±a¶, c¶ = c1 ± a¶ y d¶ = f 2 ± c¶. A partir de dichas tablas se calcula:
pa ' ! Donde
X! indica el factorial de X que se calcula como x·(x-1)·(x-2)·«·2·1, por ejemplo, 5!=5·4·3·2·1=120.
El p-valor unilateral-izquierda es =
§ pa ' § p ' a
a 'u a
n!a '!b'!c'! d '!
y el p-valor bilateral resultante es:
a 'e a
el p-valor unilateral-derecha es =
f 1! f 2 !c1!c2!
§ p ' a
p a ' e p a
Ejemplo: A partir de la tabla F1 F2 C1 4 1 21 C2 16 20
5 37 42
22
Calcular el valor p correspondiente al Test de Fisher: F1 F2 0 5 1º Calculamos la tabla para a=0 C1 20 C2 17 20
entonces
2ºº
pa0 ' !
5!37!20!22! 42!0!1!16!21!
Calculamos la tabla para a=1
entonces
pa1 '
!
5!37!20!22! 42!1!4!19!18!
22
5 37 42
! 0,0310
C1 C2 !
F1 1 19
F2 4 18
20
22
0,1720
5 37 42
F1 3º Calculamos la tabla para a=2 C1 C2 entonces
pa2 ' !
5!37!20!22! 42!2!3!18!19!
4º Calculamos la tabla para a=3
Entonces p
5!37!20!22!
18
F2 3 19
20
22
2
5 37 42
! 0,3440
C1 C2
F1 3 17
F2 2
20
22
20
5 37 42
0,3096
Los valores de P para cada a¶ a¶ Pa¶ 42!3!2!17!20! 0 0.0310 Para a=4 pa4=0,1253 1 0.1720 2 0.3440 Para a=5 pa5=0,0182 3 0.3096 4 0.1253 pa ' ! 0,1253 0,0182 0,0310 ! 0,1745 El valor p bilateral es 5 0.0182 pa ' e pa a3 '
!
!
§
El valor p unil-izq.es:
§ p ' ! 0,0310 0,1720 0,3440 0,3096 0,1253 ! 0,9818 a
a 'e a
El valor p unil-der.es:
§ p ' ! 0,1253 0,0182 ! 0,1435 a
a 'u a
C oeficiente
de contingencia
Una
forma de cuantificar el grado de asociación entre dos variables es calcular los coeficientes de asociación, particularmente aprenderemos el coeficiente de contingencia. Es un valor que se encuentra entre cero y uno ,donde la cercanía a cero indica independencia entre las variables.
G 2
Matemáticamente el coeficiente de contingencia se define por : C !
G 2 m
Donde k
2
es la cantidad de celdas de la tabla de contingencia y G !
§ i !1
K
(oi ei ) 2 ei
m = el número de filas por columnas oi = frecuencia absoluta observada en la celda i, ei = frecuencia absoluta esperada en la celda i ,si es que las variables fueran independientes.
Ejemplo: En el caso de los fumadores en la tabla siguiente
Mujeres
Hombres
Fumadores
65 (58)
80 (87)
No Fumadores
35 (42)
70 (63)
Los valores que aparecen sin paréntesis son las frecuencias absolutas observadas y los que aparecen con paréntesis son las frecuencias absolutas esperadas, según estos valores el coeficiente de contingencia es: C !
ya que
3,35 3,35 4 2
G !
!
0,675
( 65 58 ) 2 58
(35 42 ) 2 42
(80 87 ) 2 87
( 70 63 ) 2 63
! 3,35
Este valor del coeficiente de contingencia refleja que existe cierto grado de asociación entre las variables, es decir que fumar depende del sexo de los individuos. ( El porcentaje de fumadores en el grupo del mujeres es mayor )
P rueba
Test de Mc Nemar
Prueba no paramétrica para dos variables dicotómicas relacionadas. Contrasta los cambios en las respuestas utilizando la distribución de chi-cuadrado. Es útil para detectar cambios en las respuestas debidas a la intervención experimental en los diseños del tipo "antes-después³ o para comparar dos tipos de tratamiento. Típicamente, un valor de significación menor que 0,05 se considera significativo, pero podemos establecer un nivel de significación distinto (0,01; 0,1«.) En una tabla de contingencia: A
B
+
-
+ -
a c
b d
Matemáticamente el Estadístico de Mc Nemar se define por : G 2
MN !
Nota:
2
(bc
bc
Para el valor p, se utiliza la Tabla de G con 1 grado de libertad
1) 2
Ejemplo 1 Se ejecutó la intervención educativa ³Salud bucal´ para modificar los conocimientos sobre higiene bucal en alumnos de tercer grado durante el primer semestre de 1998. La tabla muestra los resultados obtenidos en conocimientos generales: Despues Adecuado Inadecuado Antes Inadecuado 14 102 Adecuado 0 7 2 MN !
G
2 G MN
!
(bc
bc
1) 2
!
( 102 0 1) 2 120 0
85 " 10,83 p 0,001
!
10201 120
!
85
Ejemplo 2 En la tabla se muestra el Grado de variación de las respuestas subjetivas de dolor en el raquis entre test previo y test posterior a una intervención en grupos experimentales de primaria y secundaria GRUPOS EXPERIMENTALES CONTRASTE DE ASOCIACIÓN DE RESPUESTAS TEST PREVIO No dolor Si dolor TOTA LES TEST POSTERIOR
2 MN !
G
2 G MN
!
(b c
No
dolor Si dolor Totales
bc
1) 2
!
4 5 9
( 0 5 1) 2 05
3,2 3,84 p " 0,05
0
14 14
!
16 5
!
3,2
4 19 23
Ejemplo 2 En la tabla se muestra el Grado de variación de las respuestas subjetivas de dolor en el raquis entre test previo y test posterior a una intervención en grupos experimentales de Bachillerato GRUPOS EXPERIMENTALES CONTRASTE DE ASOCIACIÓN DE RESPUESTAS TEST PREVIO No dolor Si dolor TOTALES TEST POSTERIOR
2 G MN
!
(bc
No
dolor Si dolor Totales
bc
1) 2
!
13 10 23
( 2 10
2 10
2 ! 4,08 " 3,84 p 0,05 G MN
1) 2
2
9 11
!
49 12
!
4,08
15 19 34
RIESGO Se
denomina riesgo a la probabilidad de ocurrencia de un
evento, típicamente enfermar, aunque también morir, curar, etc.(en la terminología anglosajona se usan los términos
risk
y
hazard ,
este
último especialmente si el evento es morir). Se
define el riesgo como la probabilidad de que un individuo,
libre de enfermedad y susceptible de ella, la desarrolle en un periodo determinado, condicionada a que el individuo no muera a causa de otra enfermedad durante el periodo. Se
usa el cociente entre el riesgo en el grupo con el factor y
el riesgo en el grupo de referencia como índice de asociación y se denomina riesgo
relativo (RR) o razón de proporciones.
En la tabla se representan esquemáticamente los resultados de un estudio que permita evaluar el RR, en la columna NR figuran los eventos (³casos o enfermos´: a) y los ³no casos o controles´ (c) en la categoría que no tiene el factor de Riesgo y en la columna R los de la categoría que sí tiene el factor. NR
Casos a No
casos c Total
C0
A partir de
R b
f0
d
f1
RÖ1 Ö R R ! RÖ
la tabla
b !
0
C1
c1
a
c0
C aracterísticas
no tiene dimensiones rango de 0 a RR=1 no hay asociación entre la presencia del factor y el evento. RR >1 la asociación es positiva, es decir si la presencia del factor se asocia a mayor ocurrencia del evento RR<1 la asociación es negativa.
Ejemplo Placebo
Tratamiento
420
307
2634
2744
Casos No casos Total
3054
Ö !
3051
Y a partir de la tabla:
Ö !
Ö Ö
b 1 0
!
a
c1 c0
!
307 3051 420 3054
!
0,101 0,138
! 0,73
Ö Ö
b 1 0
!
a
c1 c0
OR Existe otra manera, proveniente del mundo del juego, de representar la probabilidad de ocurrencia de un evento y es mediante el cociente entre la probabilidad de que ocurra el evento y la probabilidad de que no ocurra. Este cociente, que en inglés se denomina odds y para el que no hay una traducción española comúnmente aceptada, indica cuanto más probable es la ocurrencia del evento que su no ocurrencia. El odds ratio (OR) o razón de ventajas es el cociente entre el odds en el grupo con el factor y el odds en el grupo sin el factor .
NR
R
Casos
a
b
No
c
d
C0
C1
casos
Total
El OR se calcula
b RÖ1 O RÖ
!
Öds o d 1 Öds o d
0
!
1 RÖ1 RÖ
d !
c1 a
!
0
1 RÖ 0 C aracterísticas
c1 bvc a v d
c0 c c0
no tiene dimensiones rango de 0 a . OR=1 si no hay asociación entre la presencia del factor y el evento OR>1 si la asociación es positiva, es decir si la presencia del factor se asocia a mayor ocurrencia del evento y OR<1 si la asociación es negativa.
Ejemplo Placebo
Tratamiento
420
307
No casos
2634
2744
Total
3054
3051
Casos
El OR se calcula:
O RÖ
!
bvc a v d
!
307 v 2634 420 v 2744
!
0,70