Estad´ Est ad´ıstica ıst ica Infer In ferenc encial ial
PRUEBAS DE CHI-CUADRADO Coordinadora de curso: Mg. Luz Ramos Las pruebas que consisten en sacar conclusiones directamente de las observaciones muestrales, sin requerir supuestos acerca del tipo de distribuci´on on de la poblaci´on on de la que proviene, se denominan denominan pruebas no param´ param´etricas etricas y son empleados con datos medidos en escala nominal u ordinal. Se utiliza la distribuci´on on Chi-cuadrado para contrastar este tipo de pruebas.
1.
Prueb rueba a de de bon bondad dad de de ajust ajuste e
Esta prueba consiste en determinar si una muestra aleatoria procede de una poblaci´ on con una determinada determinada distribuci´ distribuci´ on de probabilidad (puede referirse a la distribuci´ on on on Uniforme, a la Binomial, a la Poisson o a la Normal, etc) 1. Hip´ otesis: otesis: otesis: otesis: Plantear las siguientes hip´ on de frecuencias de la muestra concuerda con la distribuci´ on on on te´ orica orica H 0 : La distribuci´ propuesta.(No hay diferencias entre valores observados y esperados) on de frecuencias de la muestra no concuerda con la distribuci´ on on on te´ orica orica H 1 : La distribuci´ propuesta. (Si hay diferencias entre valores observados y esperados) 2. Nivel de significaci´ on on α. on: on: Seleccionar un nivel de significaci´ 3. E Estad´ stad´ ıstica ısti ca de prueba: prue ba: 2
χc =
n ( Oi i=1
−
ei
2
ei )
∼
χ2(k
−
1)
Donde: umero ume ro de catego cat egorr´ıas. ıas . k : N´ Oi : Frecuencias observadas. ei : Frecuencias esperadas. 4. Re Regi´ on cr´ ıtica:
5. Calculo Ca lculo del estad´ estad´ıstica de prueba: Calcular el valor de χc2 . 6. Conclusi´ on on de aceptar o rechazar H 0 . on: on: Tomar la decisi´
UTP sede Arequipa
Gu´ıa N 17 ◦
Estad´ıstica Inferencial
2.
Prueba de independencia
La Prueba de independencia consiste en determinar si existe alguna relaci´ on entre dos variables cualitativas, cuyos resultados son presentados en tablas de contingencia. Una tabla de contingencia de r filas y c columnas, contiene en cada entrada o celda la frecuencia observada de la muestra que corresponde a dos variables clasificadas por categor´ıas.
A1 A2
O11 O21
...
Variable B . . . Bc B2 O12 . . . O1c O22 . . . O2c ... ... ...
Ar
Or 1 O ,1
Or2 O,2
Categor´ıas B1 Variable A
.. .
Totales
...
Orc O.c
Totales O1. O2.
...
Or. n
Cuadro 1: Tabla de contingencia. 1. Hip´ otesis: otesis: Plantear las siguientes hip´ H 0 : Existe independencia entre dos variables cualitativas. H 1 : No existe independencia entre dos variables cualitativas. 2. Nivel de significaci´ on α. on: Seleccionar un nivel de significaci´ 3. Estad´ıstica de prueba: Dada la tabla de contingencia
Categor´ıas B1 Variable A
Variable B . . . Bc (e12 ) . . . O1c (e1c ) (e22 ) . . . O2c (e2c ) ... ...
A1 A2
O11 (e11 ) O21 (e21 )
B2 O12 O22
Ar
O r 1 ( er 1 ) O ,1
Or2 (er2 ) O ,2
.. .
...
Totales
...
...
Orc (erc ) O.c
Totales O1. O2.
...
Or. n
Entonces la estad´ıstica de prueba es dada por: 2
χc =
n (Oi i=1
−
ei
ei )
2 ∼
χ2((r
−
1)(c−1))
Donde: Oi : Frecuencias observadas. ei : Frecuencias esperadas. ei =
(Total de fila) (Total de columna) Gran total
4. Regi´ on cr´ ıtica:
UTP sede Arequipa
Gu´ıa N 17 ◦
Estad´ıstica Inferencial
5. Calculo del estad´ıstica de prueba: Calcular el valor de χ2c . 6. Conclusi´ on de aceptar o rechazar H 0 . on: Tomar la decisi´
Ejercicios explicativos 1. El gerente de una planta industrial pretende determinar si el n´ umero de empleados que asisten al consultorio m´edico de la planta se encuentra distribuido, en forma equitativa, durante los cinco d´ıas de trabajo de la semana. Con base en una muestra aleatoria de cuatro semanas completas de trabajo, se observ´ o el siguiente n´ umero de consultas: D´ıas N´ umero de consultas Lunes 49 Martes 35 Mi´ercoles 32 Jueves 39 Viernes 45 A un nivel de significaci´on del 5 %, ¿existe alguna raz´ on para creer que el n´ umero de empleados que asisten al consultorio m´edico, no se encuentra distribuido en forma equitativa durante los d´ıas de trabajo de la semana? Soluci´ on:
UTP sede Arequipa
Gu´ıa N 17 ◦
Estad´ıstica Inferencial
2. Una agencia de publicidad desea saber si el g´enero de los consumidores es independiente de sus preferencias de cuatro marcas de caf´e. La respuesta determinar´ a si se debe dise˜ nar diferentes anuncios dirigidos a los hombres y otros diferentes para las mujeres. Los resultados obtenidos de la encuesta realizada a 139 personas fue: Marca A Hombre 18 Mujer 32
Marca B Marca C Marca D 25 15 12 15 10 12
¿Cu´al ser´a la decisi´on que tomar´ a la agencia?, realice la prueba con un nivel de significancia del 5 %. Soluci´ on:
UTP sede Arequipa
Gu´ıa N 17 ◦
Estad´ıstica Inferencial
Ejercicios propuestos 1. Se lanza 180 veces un dado obteni´endose los siguientes resultados: Resultado Frecuencia 1 28 2 36 3 36 4 30 5 27 6 23 A un nivel de significaci´on del 1 %, ¿es posible concluir que el dado no esta cargado? 2. En un hospital, el n´ umero de nacimientos observados para cada mes de cierto a˜ no, fueron los siguientes: Ene 95
Feb Mar 105 95
Abr 105
May Jun 90 95
Jul Ago Sept 105 110 105
Oct 100
Nov 95
Dic 100
A un nivel de significaci´o n del 1 %, ¿existe alguna raz´ o n para creer que el n´ umero de nacimientos no se encuentra distribuido en forma uniforme durante todos los meses de a˜no? 3. Bubba’s Fish and Pasta es una cadena de restaurantes ubicados a lo largo de la costa del Golfo de Florida. Bubba, el propietario, desea a˜ nadir filete a su men´ u. Antes de hacerlo, decide contratar a Magnolia Research, para que lleve a cabo una encuesta entre personas adultas para saber cu´ al es su platillo favorito cuando comen fuera de casa. Magnolia seleccion´o una muestra de 120 adultos y les pidi´ o que indicaran su comida favorita cuando salen a cenar. Los resultados se reportan en la siguiente tabla. ¿Es razonable concluir que no hay preferencia entre los cuatro platillos? Use un nivel de significancia del 5 %. Plato favorito Frecuencia Pollo 32 Pescado 24 Carne 35 Pasta 29 Total 120 4. En un experimento para estudiar la dependencia de la hipertensi´ o n de los h´ abitos de fumar, se tomaron los siguientes datos de 180 individuos: No fumadores Fumadores moderados Fumadores empedernidos Con hipertensi´ on 21 36 30 Sin hipertensi´ on 48 26 19 Pruebe la hip´otesis de que la presencia o ausencia de hipertensi´ on es independiente de los h´abitos de fumar. Utilice un nivel de significancia de 0.05.
UTP sede Arequipa
Gu´ıa N 17 ◦
Estad´ıstica Inferencial
5. A una muestra de empleados en una planta qu´ımica grande se le pidi´ o indicar una preferencia por uno de tres planes de pensi´ on. Los resultados aparecen en la siguiente tabla. ¿Existe una relaci´on entre el plan de pensi´on seleccionado y la clasificaci´on del trabajo de los empleados? Clase de trabajo Plan A Plan B Plan C Supervisor 10 13 29 De oficina 19 80 19 Obrero 81 57 22
UTP sede Arequipa
Gu´ıa N 17 ◦