Oficina de Investigación I nvestigación
Ejercicios Propuestos – Sesión Sesión Nº 14
1.
Star Perú desea determinar si existe alguna relación entre el número de vuelos que las personas toman y sus ingresos anuales. ¿A qué conclusión se llega al nivel del 1% con base en los datos para 100 viajeros en la tabla de contingencia?
Valores observados
Frecuencia de vuelos
Valores esperados
Ingreso (U$$)
Nunca
Rara vez
Con frecuencia
Total
Menos de 30000
(37x37)/ 100=13.69
(33x37)/100=12.21
(30x37)/100=11.1
37
30000-50000
(37x14)/100=5.18
(33x14)/100=4.62
(30x14)/100=4.2
14
50000-70000
(37x27)/100=9.99
(33x27)/100=8.91
(30x27)/100=8.1
27
Más de 70000
(37x22)/100=8.14
(33x22)/100=7.26
(30x22)/100=6.6
22
Total
37
33
30
100
(6.31) + (2.79) + (−9.1) + (2.82) 82) + (0.38) 38) + (−3.2) + (−2.99) + (−0.91) + (3.9 (3.9)) + (−6.14) + (−2.26) + (8.4) 100 = 2.87 H0= El número de vuelos que las personas toman no tiene relación con los ingresos anuales H1= El número de vuelos que las personas toman tiene relación con los ingresos anuales Grado de libertad: (4-1) x (3-1)=6
∝= 0.01 El valor en la tabla es de 16,812. La zona de aceptación será hasta el punto 16,812, a partir de ese punto en adelante será la zona de rechazo. El valor que nos sale en el resultado del estadístico de prueba es 2.87. Podemos concluir que se acepta la hipótesis nula. El número de vuelos que las personas toman no tiene relación con los ingresos anuales.
1 Cultura Estadística para la Investigación
Oficina de Investigación I nvestigación
2.
La tienda por departamentos “Reyes” realizó un estudio para determinar si el estado civil de sus clientes tienen
relación con el volumen de compras que realizan. Los resultados se presentan en la siguiente tabla:
Valores observados
Con un nivel de significación del 0,1 determine si existe relación entre las variables en estudio. Valores
Ventas
esperad os
Estado
Menos de 100
De 100 a 200
De 200 a 300
De 300 a 400
Más de 400
(122x96)/416=28.
(74x96)/416=17.
(73x96)/416=16.
(72x96)/416=16.
(75x95)/416=17.
15
08
85
62
13
Divorcia
(122x106)/416=3
(74x106)/416=18
(73x106)/416=18
(72x106)/416=18
(75x106)/416=19
do
1.09
.86
.60
.35
.11
(122x143)/416=4
(74x143)/416=25
(73x143)/416=25
(72x143)/416=24
(75x143)/416=25
1.94
.44
.09
.75
.78
(122x71)/416=20.
(74x71)/416=12.
(73x71)/416=12.
(72x71)/416=12.
(75x71)/416=12.
82
63
46
29
80
122
74
73
72
75
civil Casado
Soltero
Viudo Total
3.852
-3.132
5.922
19.912
-1.852
-1.862
-4.622
-8.62
-3.352
-6.112
Tot al 96
106
143
71 416
-20.942 -6.442 3.912
10.252
13.222
-2.822
2.372
6.542
-2.292
-3.82
/416
=3.50
H0= El estado civil de los clientes no tiene relación con el volumen de compras H1= El estado civil de los clientes tiene relación con el volumen de compras
2 Cultura Estadística para la Investigación
Oficina de Investigación I nvestigación
Grado de libertad: (4-1)x(5-1)=12
∝= 0.1 El valor en la tabla es de 18,55. La zona de aceptación será hasta el punto 18.55, a partir de ese punto en adelante será la zona de rechazo. El valor que nos sale en el resultado del estadístico de prueba es 3.50. Podemos concluir que se acepta la hipótesis nula. El estado civil de los clientes no tiene relación con el volumen de compras.
3.
Una empresa minera hizo un estudio para verificar si el lugar donde se realiza el trabajo se relaciona con el grado de silicosis (enfermedad ocasionada al depositarse partículas de sílice en los pulmones) de los trabajadores. Para lo cual se elige una muestra aleatoria de 300 trabajadores y se clasifican en la tabla siguiente:
Probar con un nivel del 5% que el lugar en donde se realiza el trabajo afecta el grado d e silicosis del trabajador.
Valores esperados
Lugar
I
II
III
Total
Oficina
(66x96)/270=23.47
(102x96)/270=36.27
(102x96)/270=36.27
96
Terreno
(66x174)/270=42.53
(102x174)/270=65.73
(102x174)/270=65.73
174
Total
66
102
102
270
(18.53) + (−12.27) +(−6.27) + (−18.5 (−18.53) 3) + (12.27) + (6.27) 27) = 3.95 270 H0= El lugar donde se realiza el trabajo no tiene relación con el grado de silicosis H1= El lugar donde se realiza el trabajo tiene relación con el grado de silicosis
Grado de libertad: (2-1) x (3-1)=2
∝= 0.05 El valor en la tabla es de 5.9915. La zona de aceptación será hasta el punto 5.9915, a partir de ese punto en adelante será la zona de rechazo. El valor que nos sale en el resultado del estadístico de prueba es 3.95. Podemos concluir que se acepta la hipótesis nula. El lugar donde se realiza el trabajo no tiene relación con el grado de silicosis
4.
La empresa embotelladora “Canteña” está evaluando la eficiencia de tres métodos que utilizan para la profilaxis
de los contenedores de vidrio. Después de aplicar una encuesta a sus consumidores se desea determinar si la
3 Cultura Estadística para la Investigación
Oficina de Investigación I nvestigación
higiene es independiente del método utilizado. Al nivel de significancia del 10%, ¿cuál es su conclusión con base en los datos de la tabla?
Valores
Higiene
esperados Método
Aceptable
No aceptable
Total
A
(333x203)/490=137.96
(157x203)/490=65.04
203
B
(333x133)/490=90.39
(157x133)/490=42.61
133
C
(333x154)/490=104.66
Total
333
(157x154)/
154
490=49.34
157
490
(2.04) +(−2.04) +(−1.39) + (1.39) + (−0.66) + (0.66) = 0.027 490 H0= La higiene es independiente del método utilizado H1= La higiene es dependiente del método utilizado
Grado de libertad: (3-1) x (2-1)=2
∝= 0.10 El valor en la tabla es de 4.6052. La zona de aceptación será hasta el punto 4.6052, a partir de ese punto en adelante será la zona de rechazo. El valor que nos sale en el resultado del estadístico de prueba es 0.027. Podemos concluir que se rechaza la hipótesis nula. La higiene es dependiente del método utilizado
5.
El Ministerio de Producción está realizando un estudio sobre los lugares en donde se puede encontrar y pescar los mejores ejemplares de trucha arcoiris, para ello ha escogido la provincia de Yauyos y en una muestra de 400 truchas se recogieron los datos correspondientes al tamaño y lugar en la que fueron encontradas.
=156 =174
=70 119
163
118
400
Comprobar la hipótesis de que existe algún tipo de relación entre la longitud de la trucha y el lugar donde fueron extraídas, con un nivel de significación de 0,05
4 Cultura Estadística para la Investigación
Oficina de Investigación I nvestigación
2
(67 46.41) 2 46.41
(76 70.91) 2 70.91 41.02
(42 51.77) 2 51.77
(23 28.53) 2 28.53
(10 20.83) 2 20.83
(25 46.02) 2
46.02
(64 63.57) 2 63.57
(56 51.33) 2 51.33
(37 20.65) 2 20.65
El valor obtenido debemos de compararlo con un valor crítico tomado de la tabla C, para ello debemos de calcular los grados de libertad teniendo en cuenta la expresión:
. . = ( − )( − ) 1
1
Donde: f :
Número de filas
c:
Número de columnas
Luego obtenemos:
. = (3 − )(3− ) = 4 1
El valor crítico o teórico es:
1
≥ 9.488
Regla de decisión: No rechazar la hipótesis nula si
≤ 9.488Rechazar si 9.488 se obtiene que si rechaza.
6. En un estudio se seleccionan al azar 212 trabajadores de una empresa e mpresa y se les clasifica de acuerdo a sus hábitos de beber licor. Se obtienen los siguientes resultados: Hábito de beber licor
Rendimiento Laboral Medio 29 14 8 19 70
Alto 24 24 17 27 92
Bebedor en exceso Bebedor promedio Poco bebedor No bebedor Total
Total
Bajo 12 10 19 9 50
65 48 44 55 212
En este estudio se quiere probar que el rendimiento laboral de un trabajador es independiente del hábito que tiene de beber licor, para una significancia α=0.05 α=0.05
2
(24 28.21) 2 28.21
(29 21.46) 2 21.46 (19 10.38) 2 10.38 16.12
(24 20.83) 2 20.83
(14 15.85) 2 15.85
(17 19.09) 2 19.09
(8 14.53) 2 14.53
(27 23.87) 2 23.87
(19 18.16) 2 18.16
(12 15.33) 2 15.33
(10 11.32) 2 11.32
(9 12.97) 2 12.97
El valor obtenido debemos de compararlo con un valor crítico tomado de la tabla C, para ello debemos de calcular los grados de libertad teniendo en cuenta la expresión:
. . = ( − )( − ) 1
1
Donde:
5 Cultura Estadística para la Investigación
Oficina de Investigación I nvestigación
f :
Número de filas
c:
Número de columnas
Luego obtenemos:
. = (4 − )(3− ) = 6 1
1
≥ 12.592
El valor crítico o teórico es:
Regla de decisión: No rechazar la hipótesis nula si
≤ 12.592 Rechazar si 12.592. se obtiene que si rechaza.
7. En un estudio realizado por el Instituto de Investigación de una universidad acerca grado de prejuicio étnico (racismo) en los estudiantes universitarios de Lima, se le s aplico una encuesta según su lugar de residencia, obteniéndose los resultados que se presentan en la siguiente t abla: Grado de prejuicio étnico Alto Bajo 32 28 225 290 50 79 307 397
Lugar de residencia Asentamiento Humano Urbanización Zona residencial Total
Total 60 515 129 704
A un nivel de significación del 5%, probar si las variables del estudio son independientes.
2
(32 26.16) 2 26.16
( 290 290.42) 2
290.42 3.54
( 225 224.58) 2 224.58
(50 56.25) 2 56.25
( 28 33.83) 2 33.83
(79 72.75) 2 72.75
El valor obtenido debemos de compararlo con un valor crítico tomado de la tabla C, para ello debemos de calcular los grados de libertad teniendo en cuenta la expresión:
. . = ( − )( − ) 1
1
Donde: f :
Número de filas
c:
Número de columnas
Luego obtenemos:
. = (3 − )( − ) = 2 1
El valor crítico o teórico es:
2
1
≤ 5.991
Regla de decisión: No rechazar la hipótesis nula si
≤ 5.991 Rechazar si 5.991
6 Cultura Estadística para la Investigación
Oficina de Investigación I nvestigación
8. Supongamos que se quiere estudiar la posible asociación entre el hecho de que una gestante fume durante el embarazo al nacer. Para responder a esta pregunta se realiza un estudio a 2000 gestantes, a las que se interroga sobre su hábito tabáquico durante la gestión y se determina además el peso del recién nacido. Los resultados se muestran en la siguiente tabla: Hábito tabáquico Fumadora No fumadora Total
Recién nacido de bajo peso Si No 43 207 105 1645 148 1852
Total 250 1750 2000
Se quiere probar si hay relación entre que una gestante fume durante el embarazo y que el niño presente bajo niño presente bajo peso al nacer, a un nivel de significación del 5%. Solución: Se desea comprobar si el consumo de alimentos de alto contenido de fibra está relacionado al índice de pacientes con diabetes, por lo tanto nuestras hipótesis serían: H0 : fumadora y que el niño niño presente presente bajo bajo peso peso H1 :
no fumadora y que el niño niño presente bajo peso
Esta vez no podemos suponer que la población se distribuye de manera uniforme para determinar las frecuencias esperadas (Ei) como en el caso anterior, pero podemos realizar el cálculo teniendo en cuenta las siguientes operaciones:
Observa que para calcular las frecuencias esperadas (Ei) como intervienen las cantidades totales (filas y columnas) y el tamaño de la muestra. Finalmente la tabla quedaría de la siguiente manera:
VALORES ESPERADOS 18.5 231.5 129.5 1620.5 148 1852
Ahora procederemos a calcular el estadístico Ji-Cuadrado empleando la siguiente expresión:
= ∑ ∑ ( −)
7 Cultura Estadística para la Investigación
Oficina de Investigación I nvestigación
Reemplazando los valores de las frecuencias observadas y esperadas de forma correspondiente, obtenemos:
2
(43 18.5) 2 18.5
(105 129.5) 2 129.5
(207 231.5) 2
231.5
(1645 1620.5) 2 1620.5
39.9
El valor obtenido debemos de compararlo con un valor crítico tomado de la tabla C, para ello debemos de calcular los grados de libertad teniendo en cuenta la expresión:
. . = ( − )( − ) 1
1
Donde: f :
Número de filas
c:
Número de columnas
Luego obtenemos:
. = ( − )( − ) = 2
El valor crítico o teórico es:
1
2
1
1
≤ .706 .706 2
Regla de decisión: No rechazar la hipótesis nula si
≤ 3.841 Rechazar si > 3.841
9. Supongamos que se ha tomado una muestra aleatoria simple de 25 trabajadores. Se hace un diagnóstico sobre el estrés y la condición de los trabajadores. La tabulación cruzada de la siguiente tabla resume las respuestas obtenidas: Nivel de estrés Bajo Medio Alto Total
Condición Nombrado 2 3 6 11
Contratado 3 6 5 14
Total 5 9 11 25
Determine si el nivel de estrés y la condición del trabajador están relacionados a un nivel de significancia del 5%. Solución: Se desea comprobar si el consumo de alimentos de alto contenido de fibra está relacionado al índice de pacientes con diabetes, por lo tanto nuestras hipótesis serían: H0 :
El consumo consumo de fibra y el padecimiento padecimiento de diabetes son independientes.
H1 :
El consumo consumo de fibra y el padecimiento padecimiento de diabetes son dependientes.
Esta vez no podemos suponer que la población se distribuye de manera unifor me para determinar las frecuencias esperadas (Ei) como en el caso anterior, pero podemos realizar el cálculo teniendo en cuenta las siguientes operaciones:
8 Cultura Estadística para la Investigación
Oficina de Investigación I nvestigación
Observa que para calcular las frecuencias esperadas (Ei) como intervienen las cantidades totales (filas y columnas) y el tamaño de la muestra. Finalmente la tabla quedaría de la siguiente manera:
VALORES ESPERADOS 2.2
2.8
3.96
5.04
4.84
6.16
11
14
Ahora procederemos a calcular el estadístico Ji-Cuadrado empleando la siguiente expresión:
( ) − = ∑ ∑ Reemplazando los valores de las frecuencias observadas y esperadas de forma corr espondiente, obtenemos:
2
(2 2.2) 2 2.2
(6 5.04) 2 5.04 0.94
(3 3.96) 2 3.96
(6 4.84) 2 4.84
(3 2.8) 2 2.8
(5 6.16) 2 6.16
El valor obtenido debemos de compararlo con un valor crítico tomado de la tabla C, para ello debemos de calcular los grados de libertad teniendo en cuenta la expresión:
. . = ( − 1)( 1)( −1) − 1) Donde: f : Número de filas c : Número de columnas Luego obtenemos:
. . = (3 − 1)(2 − 1) = 2 El valor crítico o teórico es:
≤ 4.605
Regla de decisión: No rechazar la hipótesis nula si
≤ 5.991 Rechazar si > 5.991
9 Cultura Estadística para la Investigación
Oficina de Investigación I nvestigación
10. En la Escuela de Psicología de la UCV se desea determinar si existe asociación entre el ciclo de estudios del estudiante y el nivel de nerviosismo frente a una exposición medido por una prueba estándar de nerviosismo y ansiedad. Se eligen aleatoriamente a 400 estudiantes de dicha escuela distribuidos en los tres turnos, obteniéndose los siguientes resultados : Ciclo de estudios
No nervioso
I ciclo II ciclo III ciclo IV ciclo total
20 10 40 40 110
Nivel de nerviosismo y ansiedad Ligeramente Moderadamente Extremadamente nervioso nervioso nervioso 20 40 80 30 30 30 20 10 10 20 0 0 90 80 120
Total 160 100 80 60 400
Se realiza la prueba con nivel de significación del 5%. Solución: Se desea comprobar si el consumo de alimentos de alto contenido de fibra está relacionado al índice de pacientes con diabetes, por lo tanto nuestras hipótesis serían: H0 :
El consumo consumo de fibra fibra y el padecimiento de diabetes diabetes son independientes.
H1 :
El consumo consumo de fibra fibra y el padecimiento de diabetes diabetes son dependientes.
Esta vez no podemos suponer que la población se distribuye de manera uniforme para determinar las frecuencias esperadas (Ei) como en el caso anterior, pero podemos realizar el cálculo teniendo en cuenta las siguientes operaciones:
Observa que para calcular las frecuencias esperadas (Ei) como intervienen las cantidades totales (filas y columnas) y el tamaño de la muestra. Finalmente la tabla quedaría de la siguiente manera:
VALORES ESPERADOS 44
36
32
48
27.5
22.5
20
30
22
18
16
24
16.5
13.5
0
0
110
90
68
102
Ahora procederemos a calcular el estadístico Ji-Cuadrado empleando la siguiente expresión:
= ∑ ∑ ( − )
10 Cultura Estadística para la Investigación
Oficina de Investigación I nvestigación
Reemplazando los valores de las frecuencias observadas y esperadas de forma correspondiente, obtenemos:
2
(20 44) 2 44
(20 36) 2 36 (40 32) 2 32
(10 27.5) 2 27.5
(30 22.5) 2 22.5 (30 20) 2 20
(40 22) 2 22
(20 18) 2 18
(10 16) 2 16
(40 16.5) 2 16.5
(20 13.5) 2 13.5
(80 48) 2 48
(10 24) 2 24
124.14
El valor obtenido debemos de compararlo con un valor crítico tomado de d e la tabla C, para ello debemos de calcular los grados de libertad teniendo en cuenta la expresión: e xpresión:
. . = ( − 1)( 1)( −1) − 1) Donde: f :
Número de filas
c:
Número de columnas
Luego obtenemos:
. . = (4 − 1)(4 1)(4 − 1)1) = 9 El valor crítico o teórico es:
≤ 14.684
Regla de decisión: No rechazar la hipótesis nula si
≤ 16.919 Rechazar si > 16.919
11 Cultura Estadística para la Investigación