Mg. Raúl Alberto Ruiz Arias Asociación de variables cualitativas: test de Chicuadrado 2
La prueba χ permite determinar si dos variables cualitativas están o no asociadas. Si al final del estudio concluimos que las variables no están relacionadas podremos decir con un determinado nivel de confianza, previamente fijado, que ambas son independientes.
r
χ
2
=
k
∑∑
(O
i =1 j =1
ij −
E ij )
2
(1)
E ij
donde: •
•
Oij
denota a las frecuencias observadas. Es el número de casos observados clasificados clasificados en la fila i de la columna j. E ij
denota a las frecuencias esperadas o teóricas. Es el número de casos esperados correspondientes correspondientes a cada fila y columna. Se puede definir como aquella frecuencia que se observaría si ambas variables fuesen independientes. Tabla 1 variable 2
Nivel 1 Nivel 2 Total
Variable 1
Nivel 1 a c a+c
Nivel 2 total b a+b d c+d b+d n=a+b+c+d
Para obtener los valores esperados Eij, estos se calculan a través del producto de los totales de la filas con las columnas dividido por el número total de casos (n). Para el caso más sencillo de una tabla 2x2 como la Tabla 1, se tiene que: E 11
=
E 12
=
(a + b ) × (a + c ) n
(a + b ) × (b + d ) n
E 21
E 22
=
=
(c + d ) × (a + c ) n
(c + d ) × (b + d ) n
Mg. Raúl Alberto Ruiz Arias
Ejemplo.- Para probar la aplicación de la prueba chi-cuadrado se analizará la relación entre el peso y genero de los pacientes, según la siguiente codificación: - Peso de los pacientes, clasificado como: (1) bajo peso, (2) peso adecuado y (3) sobre peso. - Género, clasificado como: (1) masculino y (2) femenino.
luego:
Mg. Raúl Alberto Ruiz Arias En “vista de datos” ingresar:
Dando clic en “Ver” y luego “etiqueta de valor”
Tenemos:
Mg. Raúl Alberto Ruiz Arias Se plantea las siguientes hipótesis: Hipótesis nula
H0: No existe relación entre el peso y genero de los pacientes Hipótesis nula
HA: Si existe relación entre el peso y genero de los pacientes Para ello se utiliza el SPSS:
Se encuentre la siguiente ventana:
Al ingresar a “Estadísticos”, se encuentra la siguiente ventana:
Mg. Raúl Alberto Ruiz Arias
Dar clic en “chi-cuadrado” , luego “continuar” y finalmente “Aceptar”, encontramos las siguientes tablas:
Tabla de contingencia Peso * G enero
Recuento Genero Masculino Peso
Total
Femenino
Bajo peso
2
2
4
Peso adecuado
2
3
5
Sobrepeso
3
3
6
7
8
15
Total
Pruebas de chi-cuadrado
Valor
gl
Sig. asintótica (bilateral)
Chi-cuadrado de Pearson
,134a
2
,935
Razón de verosimilitudes
,135
2
,935
Asociación lineal por lineal
,002
1
,967
N de casos válidos
15
a. 6 casillas (100,0%) tienen una frecuencia esperada inferior a 5. La frecuencia mínima esperada es 1,87.
Como el valor de Sig=0.935 > 0.05 se acepta la hipótesis nula y se concluye que no existe relación entre el género y peso de los pacientes.
Mg. Raúl Alberto Ruiz Arias Ejemplo.- Supongamos que se quiere estudiar la posible asociación entre el hecho de que una gestante fume durante el embarazo y que el niño presente bajo peso al nacer. Por lo tanto, se trata de ver si la probabilidad de tener bajo peso es diferente en gestantes que fumen o en gestantes que no fumen durante la gestación. Para responder a esta pregunta se realiza un estudio de seguimiento sobre una cohorte de 2000 gestantes, a las que se interroga sobre su hábito tabáquico durante la gestación y se determina además el peso del recién nacido. Los resultados de este estudio se muestran en la Tabla 2. Tabla 2. Tabla de contingencia para estudiar la asociación entre fumar durante la gestación y el bajo peso del niño al nacer. Estudio de seguimiento de 2000 gestantes. Recién nacido de bajo peso
Sí
No
Total
Fumadora
O11=43
O12=207
250
No fumadora
O21=105
O22=1645
1750
148
1852
2000
Gestante
Total
Los valores esperados se calcularían como sigue:
El valor del estadístico chi-cuadrado, para este ejemplo en concreto, vendría dado entonces como:
χ
2
=
(43 − 18,5)2 18,5
+
(207 − 231,5)2 231,5
+
(105 − 129,5) 2 129,5
+
(1645 − 1620,5) 2 1620,5
=
40,04
Lo que tenemos que hacer ahora es plantear un contraste de hipótesis entre la hipótesis nula:
Mg. Raúl Alberto Ruiz Arias
H0: No hay asociación entre las variables (en el ejemplo, el bajo peso del niño y el hecho de fumar durante la gestación son independientes). Y la hipótesis alternativa: Ha: Sí hay asociación entre las variables, es decir, el bajo peso y el fumar durante la gestación están asociados.
2
p=P(X
( 1) >
40.04)= 0.00000000025
Observación: Si el valor-p es muy pequeño (usualmente se considera p<0.05) es poco probable que se cumpla la hipótesis nula y se 2
debería de rechazar, es decir, si el estadístico χ que se obtiene toma un valor mayor se dirá que la diferencia es significativa. Como p < 0.05 se debe rechazar la hipótesis nula de independencia entre el peso del niño y el hecho de fumar durante la gestación.
Mg. Raúl Alberto Ruiz Arias Otra forma de aplicar la prueba chi-cuadrado, cuando los datos están resumidos en una tabla de frecuencias:
Ingresar los datos, primero las filas y luego las columnas
Ponderar casos
Mg. Raúl Alberto Ruiz Arias
Realizando la prueba
encontramos:
al dar continuar y aceptar encontramos:
Mg. Raúl Alberto Ruiz Arias
Tabla de contingencia Madre fuma * Bajo peso del bebe
Recuento Bajo peso del bebe Bajo peso Madre fuma
Fuma No fuma
Total
Total
Peso normal
43
207
250
105
1645
1750
148
1852
2000
Pruebas de chi-cuadrado
Valor
gl
Sig. asintótica
Sig. exacta
Sig. exacta
(bilateral)
(bilateral)
(unilateral)
40,044a
1
,000
Corrección por continuidadb
38,427
1
,000
Razón de verosimilitudes
31,552
1
,000
Chi-cuadrado de Pearson
Estadístico exacto de Fisher Asociación lineal por lineal N de casos válidos
,000 40,024
1
,000
,000
2000
a. 0 casillas (0,0%) tienen una frecuencia esperada inferior a 5. La fr ecuencia mínima esperada es 18,50. b. Calculado sólo para una tabla de 2x2.
Como sig=0.00 < 0.05 se rechaza la hipótesis nula y se acepta la hipótesis alterna, al 95% de confianza se concluye que existe relación significativa entre las variables estudiadas.
Mg. Raúl Alberto Ruiz Arias Practica 1.- Estado civil y síntomas depresivos Sobre la base de los resultados de un estudio, se ha afirmado que las madres casadas presentan menos síntomas de depresión que las solteras. En una muestra de mujeres de 18-19 años con 1 hijo, se recabó la siguiente información, en número de casos, desagregadas por estado civil: SÍNTOMAS DEPRESIVOS
Total
ESTADO CIVIL Sí
No
Casadas
45
131
Solteras
83
127
Contraste, con estos datos y un 5% de significación, la hipótesis de que el síntoma depresivo de las mujeres está asociado a su estado civil. 2.- La empresa de publicidad Pacific investiga la relación entre el tipo de comercial favorito y el nivel de ingresos para una muestra de consumidores. Los datos son: Ingreso
Comercial favorito A B 25 40 30 30 45 20
C 70 30 10
Total
Bajo Medio Alto Total ¿es posible concluir que existe relación entre el nivel de ingreso y el tipo de comercial favorito? 4.- Un estudio de niveles educativos de los votantes y su afiliación política tuvo los siguientes resultados: Afiliación al partido
Nivel educativo APRA
No terminó 20 secundaria Secundaria 30 completa 30 Licenciatura
PPC
UPP
30
20
35
15
45
25
Al 95% de confianza determine si la afiliación política es independiente del nivel educativo de los votantes. 5.-En el hospital Rebagliati se realizo un estudio sobre los factores de riesgo del cáncer cervical invasivo, y se encontró que de 420 pacientes con cáncer 125 eran fumadores, mientras que de 324 que no tenían cáncer 160 eran fumadores, en base a estos resultados se puede concluir que el hecho de fumar era un factor de riesgo para el cáncer cervical invasivo. Formule la hipótesis correspondiente y la prueba estadística que le corresponda.