Estadística II-Estadística Inferencial Dra. Rosa María García Almada Análisis de tablas de contingencia o Prueba de independencia 2
Se puede utilizar la χ para probar de manera formal una relación entre dos variables con escala nominal. En otras palabras, ¿una variable es independiente de la otra? Los siguientes son algunos ejemplos en los que nos interesa probar si dos variables se relaciona n. •
•
•
Ford Motor Company opera una planta de ensamble en Hermosillo, Sonora. La planta trabaja tres turnos por día, 5 días a la semana. El gerente de control de calidad quiere comparar el nivel de calidad del ensamblado en cada uno de los turnos. Los vehículos se clasifican por el nivel de calidad en (aceptable, inaceptable) y el turno en (mañana, tarde, noche). ¿Existe una diferencia en el nivel de calidad del producto de los tres turnos? Es decir, ¿la calidad del producto se relaciona con el turno en que se fabricó? O, ¿la calidad del producto es independiente del turno en el que se fabricó? Una muestra de 100 conductores detenidos por el operativo “alcoholímetro” se clasificó por genero y sí llevaban puesto el cinturón de seguridad o no. Para esta muestra, ¿el uso del cinturón de seguridad se relaciona con el género del conductor? ¿Un hombre que sale libre de una prisión federal provoca un ajuste diferente en la vida civil si regresa a su ciudad natal o si se va a vivir a otra parte? Las dos variables son un ajuste a la vida civil y el lugar de residencia. Observe que ambas variables se miden en escala nominal.
Ejercicio: La Dirección General de Prevención y Readaptación Social (DGPRS) investiga la pregunta antes mencionada: ¿Un hombre que sale libre de una prisión federal provoca un ajuste diferente en su vida civil si regresa a su ciudad natal o se va a vivir a otra parte? En otras palabras, ¿existe una relación entre el ajuste de su vida civil y el lugar de residencia después de salir de prisión? Al igual que antes, el primer paso de la prueba de hipótesis es establecer las hipótesis nula y alternativa. H 0 : No existe una relación entre el ajuste de su vida civil y el lugar donde vive el individuo después de salir de prisión.
H 1 : Existe una relación entre el ajuste de su vida civil y el lugar donde vive el individuo después de salir de prisión. Se utilizará un nivel de significancia de 0.01 para la prueba de hipótesis. Los psicólogos de la dependencia entrevistaron a 200 prisioneros seleccionados de manera aleatoria. Mediante una serie de preguntas, los psicólogos clasificaron el ajuste de cada individuo a su vida civil como sobresaliente, bueno, regular o no satisfactorio. Las clasificaciones de los 200 prisioneros se ordenaron de la siguiente manera. Por ejemplo, Pedro Ramírez regresó a su ciudad natal y demostró tener un ajuste sobresaliente a su vida civil; así a la DGPRS le interesa determinar si el ajuste a la vida civil es contingente o dependiente al lugar donde vaya el prisionero al ponerlo en libertad.
Residencia al salir de prisión Ciudad natal Fuera de la ciudad natal Total
Ajuste a la vida civil Sobresaliente 27 13 40
Bueno 35 15 50
Regular 33 27 60
Total
No satisfactorio 25 25 50
120 80 200
En cuanto sepamos cuántos renglones (2) y cuántas columnas (4) hay en la tabla de contingencia, podemos determinar el valor crítico y la regla de decisión. Para la prueba de 2 significancia de χ donde los rasgos se clasifican en una tabla de contingencia, los grados de libertad se obtienen por medio de: gl=(número de renglones-1)*(número de columnas-1)=(r-1)*(c-1)
En este problema: gl=(r-1)*(c-1) = (2-1)*(4-1) = (1)*(3) = 3 Para encontrar el valor crítico para tres grados de libertad y un nivel de significancia de 1% 2 2 el valor de χ es 11.345. Si el valor calculado de χ es mayor al de la tabla, la regla de decisión es rechazar la hipótesis nula.
d a d i l i b a b o r P
gl = 3 Región de rechazo Región de aceptación =0.01
α
H0
11.345 Valor Crítico
2
Escala de χ
2
Después encontramos el valor calculado de
χ ,
las frecuencias observadas f o , son
determinadas por la tabla de contingencia, las frecuencias esperadas f e se determinan a partir de: f e =
(Total de renglones)*(Total renglones)*(Total de columnas) Gran Total
Ajuste a la vida civil Residencia al salir de prisión
Sobresaliente
Ciudad natal Fuera de la ciudad natal Total
Bueno fo
fe
fo
fe
fo
fe
27
24
35
30
33
36
25
30 120 120
13
16
15
20
27
24
25
20
40
40
50
50 {(80)(50)}/200
60
60
50
50 200 200 Debe ser igual
2
2
χ
80
fe
80
⎡ ( f o − f e )2 ⎤ = ∑⎢ ⎥ f ⎢⎣ ⎥⎦ e
(15 − 20 ) 20
2
+
( 27 − 24 ) 24
2
2
+
( 25 − 20 ) 20
2
= 0.37 0.375 5 + 0.83 0.833 3 + 0.25 0.250 0 + 0.83 0.833 3 + 0.56 0.563 3 +1.25 1.250 0 + 0.37 0.375 5 +1.25 1.250 0
2
= 5.729
χ
Fo
⎡ ( f o − f e )2 ⎤ ( 27 − 24 )2 (35 − 30 )2 (33 − 36 )2 (25 −30 )2 (13 −16 )2 = ∑⎢ + + + + + ... ⎥; f 2 4 3 0 3 6 3 0 1 6 ⎢⎣ ⎥⎦ e
... + χ
Total
fe
Para el cálculo de la χ , aplicamos la fórmula:
χ
No satisfactorio
fo
Debe ser igual
2
Regular
2
Debido a que el valor calculado de la χ (5.729) queda en la región a la izquierda de 11.345, se acepta la H 0 con un nivel de significancia de 0.01. Llegamos a la conclusión de que no hay evidencias de una relación entre el ajuste a una vida civil y el lugar donde vive el prisionero al salir en libertad. Para el programa de recomendaciones de la DGPRS, el ajuste a la vida civil no se relaciona con el lugar donde viva el exprisionero.
Tarea para entregar el jueves 24 de Marzo de 2011. 1. La directora de publicidad del periódico “El Diario”, estudia la relación entre el tipo de comunidad en la que vive un suscriptor y la sección del periódico que lee primero, por lo que recopiló la información se presenta a continuación para una muestra de lectores.
Ciudad Periferia Rural
Noticias Noticias nacional nacionales es Deportes Deportes Tiras Tiras cómicas cómicas 170 124 90 120 112 100 130 90 88
Con un nivel de significancia de 0.05 ¿podemos llegar a la conclusión de que existe una relación entre el tipo de comunidad en la vive la persona y la sección del diario que lee primero?
2. El Departamento de Calidad de “SMART”, una cadena de supermercados de Ciudad Juárez Chihuahua, lleva a cabo una revisión mensual sobre la comparación de los precios registrados con los precios anunciados. La siguiente tabla presenta el resumen de los resultados de una muestra de 500 artículos el mes pasado. La gerencia de la compañía quiere saber si existe una relación entre las tasas de error en los artículos con precio regular y los artículos con precios especiales. Use un nivel de significancia de 0.01.
Precio bajo Precio alto Precio correcto
Precio normal Precio especial anunciado anunciado 20 10 15 30 200 225
3. Durante los últimos años, el uso de teléfonos celulares en automóviles aumentó de manera considerable. El interés de los agentes expertos en tránsito, así como de los fabricantes de teléfonos celulares, es el efecto que tiene el uso de esto en los índices de accidentes. ¿Es más probable que quien usa un teléfono celular, mientras va manejando, se vea involucrado en un accidente de tránsito? ¿Cuál es su conclusión respecto a la siguiente información de la muestra? Use el nivel de 0.05 de significancia.
Teléfono celular en uso Teléfono celular NO en uso
Tuvo accidente el año pasado 25
No tuvo accidente el año pasado 300
50
400