Casos y problemas
resueltos Inf nfe er enc ncii a en la l a medi media a Int nte erv rva alo de confi con fia anza Con ontr tra ast ste e de la media IIIe: de Cor orrelació relación n a de medi Con ontr tra ast ste la diferenci di ferencia media as
Estadística Aplicada a las Ciencias Sociales-Casos y problemas resueltos Inferencia en la media: Intervalos de confianza, contraste de la media, contraste de la diferencia de medias Patricio Alcaíno Martínez – Derechos Reservados
2
Palabras ini i ni ci ales Estimados usuari@s: Este material, que pongo a su disposición, está creado a partir de casos e investigaciones reales realizadas en distintos ámbitos de las Ciencias Sociales. Los datos han sido modificados para ajustarlos a situaciones de enseñanza aprendizaje. aprendizaje. P or ello, fuera del contexto contexto de este document documento, o, la información información y conclusiones no son necesariamente válidas como conclusiones respaldadas. Los casos y problemas aquí presentados constituyen una muestra representativa de las situaciones más frecuentes a resolver en investigación social. A saber: • Cálculo del intervalo de confianza confianza de la media poblac poblacional ional en una población con muestra chica y varianza poblacional desconocida. • Contraste, tes testt o dócima de la media media poblacional con muestra chica y varianza poblacional desconocida. • Contraste, tes testt o dócima de la diferencia diferencia de proporciones con con dos muestras chicas, independientes y varianza poblacional desconocida. • Contraste, tes testt o dócima de la diferenci diferencia a de proporciones con m muestras uestras chicas pareadas y varianza poblacional desconocida. • Cálculo del tamaño tamaño de la mues muestra tra para investigación investigación de la media media en poblaciones con muestra chica.
Estadística Aplicada a las Ciencias Sociales-Casos y problemas resueltos Inferencia en la media: Intervalos de confianza, contraste de la media, contraste de la diferencia de medias Patricio Alcaíno Martínez – Derechos Reservados
1. Tiempo de uso de la Web social Una empresa investiga con una muestra aleatoria de tamaño 19 el tiempo que sus funcionarios administrativos administrativos emplean en las redes sociales en horas de trabajo, encontrando una media de 4,6 horas con una desviación estándar de 1,2 horas a la semana y una distribución aproximadamente aproximadamente normal. Con estos datos, la empresa desea estimar, con un 95% de confianza un intervalo para el tiempo promedio que sus funcionarios administrativos emplean en las redes sociales en horas de trabajo. 1.2. Si la empresa desea un intervalo del 95% de confianza para el tiempo promedio que sus funcionarios administrativos emplean en las redes sociales en horas de trabajo, con un error de no más de 30 minutos, calcule el tamaño de muestra adecuado. 1.1.
Solución: 1.1. Con estos datos, la empresa desea estimar, con un 95% de confianza un intervalo para el tiempo promedio que sus funcionarios administrativos emplean en las redes sociales en horas de trabajo.
Se trata de la construcción construcción de un intervalo de confianza para la media poblacional con una muestra chica y varianza poblacional desconocida. Por esta razón se usará un modelo con el estadístico t de Student. Un intervalo de confianza requiere los siguientes datos: x = 4,6 horas/sem; s = 1,2 horas/sem. n = 19 ; Se calcula el error estándar de la media:
3
Estadística Aplicada a las Ciencias Sociales-Casos y problemas resueltos Inferencia en la media: Intervalos de confianza, contraste de la media, contraste de la diferencia de medias Patricio Alcaíno Martínez – Derechos Reservados
Si la empresa desea un intervalo del 95% de confianza para el tiempo promedio que sus funcionarios administrativos emplean en las redes sociales en horas de trabajo, con un error de no más de 30 minutos, calcule el tamaño de muestra adecuado.
1.2.
Transformado 30 minutos a horas horas y tomando el mismo valor valor de t = 2,101: 1,2 2,101 = 0,5 n −1 Despejando: n −1 =
1,2 ⋅ 2,101 0,5
n − 1 = 5,0424
n − 1 = 25,43 n = 26,43 Entonces: n = 27. El cálculo del tamaño de la muestra presenta la dificultad de que usa un percentil de t, que también va cambiando con el tamaño de la muestra. Por lo tanto este cálculo es siempre tentativo. Verificando: t0,95; 26 ≈ 1,708 (este valor es con 25 gl). n = 27 s = 1,2 horas/sem.
4
Estadística Aplicada a las Ciencias Sociales-Casos y problemas resueltos Inferencia en la media: Intervalos de confianza, contraste de la media, contraste de la diferencia de medias Patricio Alcaíno Martínez – Derechos Reservados
5
2. Edad del conductor Una municipalidad realiza un estudio con una muestra aleatoria de accidentes de tránsito con resultado de daños y lesiones ocurridos en la comuna durante el último año. El interés es estudiar la edad de los conductores protagonistas de dichos accidentes. accidentes. La muestra entregó las siguientes edades, en años cumplidos: Edad: 22, 53, 36, 19, 24, 48, 17 años A partir de estos datos, se desea: 2.1. Hacer una estimación por intervalo de confianza del 90%, de la edad promedio de los conductores conductores protagonistas de accidentes de tránsito con resultado de daños y lesiones ocurridos en la comuna. 2.2. Calcular la probabilidad de que el promedio de edad de los conductores protagonistas de accidentes de tránsito con resultado de daños y lesiones ocurridos en la comuna sea menos de 25 años. 2.3. Calcular el tamaño de la muestra para un intervalo del 95% de la edad promedio de los conductores protagonistas de accidentes de tránsito con resultado de daños y lesiones ocurridos en la comuna, con un error de no más de 8 años.
Solución:
Se trata de una situación donde está involucrada la media poblacional, con datos de una muestra chica, con varianza poblacional desconocida. Por esta razón se usará un modelo con el estadístico t de Student. 2.1. Hacer una estimación por intervalo de confianza del 90%, de la edad promedio de los conductores conductores protagonistas de accidentes de tránsito con resultado de daños y lesiones ocurridos en la comuna.
Estadística Aplicada a las Ciencias Sociales-Casos y problemas resueltos Inferencia en la media: Intervalos de confianza, contraste de la media, contraste de la diferencia de medias Patricio Alcaíno Martínez – Derechos Reservados
6
La edad promedio de los conductores protagonistas protagonistas de accidentes de tránsito con resultado de daños y lesiones ocurridos en la comuna fluctúa entre 20,6 y 42 años, con un 90% de probabilidades.
Calcular la probabilidad de que el promedio de edad de los conductores protagonistas de accidentes de tránsito con resultado de daños y lesiones ocurridos en la comuna sea menos de 25 años. Se tiene lo siguiente, ya calculado:
2.2.
x = 31,3 años, y;
σ x = 5,5 años.
Estandarizando el valor de x i = 25 años, mediante la distribución t: t=
25 − 31,3 = -1,15, que es una t con 7 – 1 = 6 gl. 5,5
La probabilidad pedida es igual a: P(t p; 6 ≤ −1,15) ≈ 0,175.
Entonces, la probabilidad de que el promedio de edad de los conductores protagonistas protagonistas de accidentes de tránsito con resultado de daños y lesiones ocurridos en la comuna sea de menos de 25 años es, aproximadamente 0,175, lo que corresponde a un 17,5%.
2.3.
Calcular el tamaño de la muestra para un intervalo del 95% de la edad promedio de
Estadística Aplicada a las Ciencias Sociales-Casos y problemas resueltos Inferencia en la media: Intervalos de confianza, contraste de la media, contraste de la diferencia de medias Patricio Alcaíno Martínez – Derechos Reservados
7
3. Tiempo de comunicación Se ha establecido empíricamente que el tiempo, en segundos, que dura la comunicación telefónica de los pobladores de una pequeña ciudad con una central de ambulancias se distribuye normalmente. normalmente. Una muestra de llamadas recibidas dio los siguientes tiempos de duración de las llamadas, en segundos: Tiempo: 66, 78, 55, 62, 70, 51, 72, 62 segundos. segundos. Con estos datos: 3.1. ¿Cuál es la probabilidad de que el tiempo medio de duración de la comunicación sea menos de un minuto? 3.2. Construya un intervalo confidencial del 99% para la duración media de estas comunicaciones. 3.3. Con un nivel de significación del 1% docime la hipótesis de que el tiempo medio que duran las llamadas a este servicio es de 65 segundos.
Solución:
¿Cuál es la probabilidad de que el tiempo medio de duración de la comunicación sea menos de un minuto?
3.1.
Con los datos numéricos se calculan los estadígrafos muestrales necesarios. Estos son: n = 8 ; x = 64,5 seg; s = 8,34 seg. Se calcula el error muestral de la media. Se debe utilizar la varianza insesgada, ya que se desconoce el valor de esta en la población:
Estadística Aplicada a las Ciencias Sociales-Casos y problemas resueltos Inferencia en la media: Intervalos de confianza, contraste de la media, contraste de la diferencia de medias Patricio Alcaíno Martínez – Derechos Reservados
Construya un intervalo confidencial del 99% para la duración media de estas comunicaciones. Los datos numéricos son: n = 8 ; x = 64,5 seg; s = 8,34 seg y σ x = 3,15 seg. 3.2.
Para un IC del 99% el valor de t con 7 gl es 2,998. El intervalo de confianza está dado por:
μ = 64,5 ± 2,998 · 3,15 μ = 64,5 ± 9,44; con un 99% de confianza. 55,1seg ≤ tiempo ≤ 73,9 seg ; con 99% de probabilidades. Esto es, que la media del tiempo de duración de las llamadas telefónicas fluctúa entre 55,1 segundos y 73,9 segundos, con un 99% de confianza.
Con un nivel de significación del 1% docime la hipótesis de que el tiempo medio que duran las llamadas a este servicio es de 65 segundos.
3.3.
Se plantean las hipótesis: H 0 : μ = 65 seg H1 : μ ≠ 65 seg
8
Estadística Aplicada a las Ciencias Sociales-Casos y problemas resueltos Inferencia en la media: Intervalos de confianza, contraste de la media, contraste de la diferencia de medias Patricio Alcaíno Martínez – Derechos Reservados
9
4. Lluvia ácida Se ha afirmado que la acidez de la lluvia en cierta ciudad llega a un peligroso promedio de pH = 4. Para estudiar el caso, se han obtenido 8 muestras de lluvia de distintas partes de la ciudad. Estas son llevadas al laboratorio en donde se les determinó su pH, dando las siguientes medidas: muestra
1
2
3
4
5
6
7
8
pH
4,8
3,7
5,1
4,2
3,8
5,4
3,8
4,0
Con un nivel de significación del 1%, y suponiendo distribución aproximadamente normal, contraste la hipótesis necesaria para validar la a afirmación de que el pH en la ciudad es, en promedio, 4.
4.1.
Solución:
Planteando las hipótesis: H0: μ = 4 H1: μ ≠ 4
(ensayo de dos colas)
Los datos muestrales son: x = 4,35 S = 0,6164414 Error muestral: σ x =
0,6164414 = 0,233 8 −1
Estadística Aplicada a las Ciencias Sociales-Casos y problemas resueltos Inferencia en la media: Intervalos de confianza, contraste de la media, contraste de la diferencia de medias Patricio Alcaíno Martínez – Derechos Reservados
10
5. Tiempo de operación Se toma el tiempo en que una muestra de 16 operarios del sector servicios eléctricos empleó individualmente en realizar una tarea que requiere seguir un protocolo específico. La conclusión del estudio fue que: “El tiempo medio de ejecución de la tarea es menor a 20 minutos (p = 0,0314) ” ¿Cuál fue hipótesis nula en el contraste que llevó a estas conclusión? 5.2. ¿Qué tipo de ensayo se realizó? 5.3. Respecto del contraste, ¿cuál fue la decisión? 5.4. De las significaciones usuales, ¿cuál podría ser la utilizada en el contraste que llevó a esa conclusión? 5.5. En el contraste, ¿cuál fue el valor del estadístico de prueba? 5.6. En este contraste de hipótesis, ¿en qué consiste el error de tipo II? 5.1.
Solución:
¿Cuál fue la hipótesis nula y la hipótesis alternativa en el contraste que llevó a esta conclusión? La conclusión, de inmediato sugiere la hipótesis alternativa: Hipótesis nula: μ = 20 5.1.
Hipótesis alternativa: μ < 20 ¿Qué tipo de ensayo se realizó? La conclusión, de inmediato revela que el ensayo fue de cola izquierda.
5.2.
Estadística Aplicada a las Ciencias Sociales-Casos y problemas resueltos Inferencia en la media: Intervalos de confianza, contraste de la media, contraste de la diferencia de medias Patricio Alcaíno Martínez – Derechos Reservados
11
6. Ingreso y género Un estudio de los sueldos de mujeres y hombres seleccionados al azar desde una población de trabajadores del sector frutícola, con similares condiciones de trabajo, jerarquía, edad, edad, ciudad y estado estado civil, llegó a la siguiente conclusión, conclusión, a un un nivel de significación del 1%: “En este sector laboral, los hombres, en promedio, ganan más que las mujeres”. 6.1. 6.2. 6.3. 6.4.
Exprese, en lenguaje corriente, corriente, cuál es la hipótesis nula en este caso. Identifique el tipo de ensayo en este contraste. ¿Cuál es la probabilidad de cometer error de tipo I en este estudio? ¿En qué consiste el error de tipo II en el contexto de este caso?
Solución:
Exprese, en lenguaje corriente, corriente, cuál es la hipótesis nula en este caso. En estos casos, la hipótesis nula se reconoce por el signo igual. Por lo tanto, es:
6.1.
H0: “En este sector laboral, los hombres, en promedio, ganan igual que las mujeres”.
6.2.
Identifique el tipo de ensayo en este contraste. Si H representa a los hombres y M a las mujeres y se plantea la hipótesis nula como μ H − μ M = 0, entonces el ensayo debe ser de cola derecha, ya que: H1: μ H − μ M > 0. Si H representa a los hombres y M a las mujeres y se plantea la hipótesis nula
Estadística Aplicada a las Ciencias Sociales-Casos y problemas resueltos Inferencia en la media: Intervalos de confianza, contraste de la media, contraste de la diferencia de medias Patricio Alcaíno Martínez – Derechos Reservados
12
7. Talla de bebés de madres fumadoras En un programa de investigación de la salud, una muestra aleatoria de mujeres embarazadas es controlada durante su embarazo y parto, para determinar algunas características importantes, importantes, tales como la talla y peso del recién nacido, si la madre fumó o no durante el embarazo, etc. Uno de los aspectos investigados fue la talla de los recién nacidos varones, hijos de madres comparables en su estado general de salud y contextura física, encontrándose los siguientes estadísticos, estadísticos, según si la madre fumó o no durante el embarazo. Madre
n
Talla promedio (cm.)
Desviación estándar (cm.)
Fumadora
9
48,1
2,5
13
50,4
2,2
No fumadora
Con el supuesto de independencia de la muestra, normalidad de la talla e igualdad de varianzas, al 5% de significación, se desea contrastar la hipótesis de que la talla media de los niños de madres fumadoras es menor a la de los niños de madres no fumadoras.
Solución:
Se usarán los siguientes subíndices: N = madre no fumadora durante el embarazo F = madre fumadora durante el embarazo En consecuencia, las medias serán: μ N y μ F , respectivamente. respectivamente.
Estadística Aplicada a las Ciencias Sociales-Casos y problemas resueltos Inferencia en la media: Intervalos de confianza, contraste de la media, contraste de la diferencia de medias Patricio Alcaíno Martínez – Derechos Reservados
Calculando el valor p: α* = P(t p; 20 > 2,17 ) = 0,021 Decisión: Como α* < 0,05 , se rechaza la hipótesis nula, al 5%. Conclusión: Se puede afirmar, con un 5% de significación, que la talla media de los niños de madres fumadoras es menor a la de los niños de madres no fumadoras (p = 0,021).
13
Estadística Aplicada a las Ciencias Sociales-Casos y problemas resueltos Inferencia en la media: Intervalos de confianza, contraste de la media, contraste de la diferencia de medias Patricio Alcaíno Martínez – Derechos Reservados
14
8. Sexo e ingreso mensual Se realiza un estudio de los sueldos de mujeres y hombres seleccionados seleccionados al azar desde una población de trabajadores dependientes de distintas empresas pero de igual sector económico, trabajo, jerarquía, edad, ciudad y estado civil. Las interrogantes que el estudio desea esclarecer, esclarecer, con un 1% de significación, tienen que ver con las siguientes afirmaciones y conjeturas que se plantearon inicialmente, antes de la toma de datos: P: Las mujeres de esta población ganan, en promedio, $2.100 por hora de trabajo. Q: El sueldo promedio de los hombres de esta población es mayor a $450.000 al mes. R: En este sector laboral, en promedio, los hombres ganan más que las mujeres. En los contrastes de las respectivas hipótesis, los cálculos dieron los siguientes valores p del estadístico de prueba: *
*
*
αP = 0,021; α Q = 0,036; α R = 0,007. 8.1. 8.2.
Indique, en lenguaje corriente, las hipótesis nulas en cada uno de los casos. Construya una conclusión para cada una de las afirmaciones dadas.
Solución: 8.1.
Indique, en lenguaje corriente, las hipótesis nulas en cada uno de los casos. Para la conjetura P: H0: Las mujeres de esta población ganan, en promedio, $2.100 por hora de trabajo. Para la conjetura Q:
Estadística Aplicada a las Ciencias Sociales-Casos y problemas resueltos Inferencia en la media: Intervalos de confianza, contraste de la media, contraste de la diferencia de medias Patricio Alcaíno Martínez – Derechos Reservados
15
9. Prevalencia de plomo en la sangre Se estudia una muestra de 15 recién nacidos en la ciudad de Santiago y 9 de San Felipe, determinado el contenido de plomo en muestras de sangre. Los niños de Santiago obtuvieron un promedio de 3,4 μ g/dl con una desviación estándar de 1,4 μ g/dl; mientras que los de San Felipe obtuvieron un promedio de 2,7 μ g/dl con una desviación estándar de 1,2 μ g/dl. Con estos datos, y el supuesto de independencia, normalidad e igual de varianzas, se pide lo siguiente: 9.1. Calcule un intervalo de confianza del 95% para el promedio de contenido de plomo en la sangre de los recién nacidos en Santiago.
Con un 5% de significación, se desea validar l a afirmación de que el contenido de plomo en la sangre de los recién nacidos en San Felipe es, en promedio, menos de 3 μ g/dl.
9.2.
Se desea validar, con un 5% de significación, la hipótesis de que los recién nacidos de Santiago tienen, en promedio, una mayor concentración de plomo en la sangre que los recién nacidos de San Felipe.
9.3.
Solución:
Calcule un intervalo de confianza del 95% para el promedio de contenido de plomo en la sangre de los recién nacidos en Santiago. Se trata del cálculo de un intervalo de confianza de la media, con muestra chica y varianza desconocida. desconocida. Por esta razón se empleará el modelo de la distribución t de Student. Los datos muestrales son los siguientes: 15 3 4 g/dl, y 1 4 g/dl. 9.1.
Estadística Aplicada a las Ciencias Sociales-Casos y problemas resueltos Inferencia en la media: Intervalos de confianza, contraste de la media, contraste de la diferencia de medias Patricio Alcaíno Martínez – Derechos Reservados
Con un 5% de significación, se desea validar l a afirmación de que el contenido de plomo en la sangre de los recién nacidos en San Felipe es, en promedio, menos de 3 μ g/dl.
9.2.
Con α = 0,05 , se plantea las hipótesis del caso: H0: μ = 3 μ g/dl. H1: μ < 3 μ g/dl. La hipótesis alternativa conduce a una prueba de cola izquierda. Calculando el estadístico de prueba: Previamente se calcula el error estándar de la media: n = 9 ; x = 2,7 μ g/dl, y s = 1,2 μ g/dl.
σx =
1,2 = 0,4243 μ g/dl. 9 −1
Ahora: t=
2,7 − 3 = -0,71 0,4243
Si la hipótesis nula es verdadera, este es un t con 9 – 1 = 8 grados de libertad. Calculando el valor p: p = P(t p; 8 ≤ −0,71) = 0,252 (según tabla t)
16
Estadística Aplicada a las Ciencias Sociales-Casos y problemas resueltos Inferencia en la media: Intervalos de confianza, contraste de la media, contraste de la diferencia de medias Patricio Alcaíno Martínez – Derechos Reservados
17
La hipótesis alternativa conduce a un ensayo de cola derecha. Datos muestrales: n A = 15;
x A = 3,4 μ g/dl;
s A = 1,4 μ g/dl
n B = 9;
x B = 2,7 μ g/dl;
s B = 1,2 μ g/dl
El error estándar de la diferencia de medias es igual a:
σ x A −xB =
15 · 1,42 + 9 · 1,22 ⎛ 1 1 ⎞ ⎜ + ⎟ = 0,5851 15 + 9 − 2 ⎝ 15 9 ⎠
μ g/dl.
Calculando el estadístico de prueba: 3,4 − 2,7 t= = 1,20 0,5851 Si la hipótesis nula es verdadera, este estadístico se distribuye como una t con 15 + 9 – 2 = 22 grados de libertad. Se calcula el valor p de la prueba, considerando que se trata de un ensayo de cola derecha:
α* = P(t p; 22 > 1,20) = 0,121 (según tabla t) Como 0,121 > 0,05, no se rechaza la hipótesis nula al 5%.
Estadística Aplicada a las Ciencias Sociales-Casos y problemas resueltos Inferencia en la media: Intervalos de confianza, contraste de la media, contraste de la diferencia de medias Patricio Alcaíno Martínez – Derechos Reservados
10. Edad de inicio de la actividad sexual Ciertas investigaciones apuntan a concluir que el inicio de la actividad sexual en los jóvenes es cada cada vez más temprana. Un estudio con muestras muestras aleatoria aleatoria de hombres y mujeres de una localidad rural cercana a la capital, que ya han iniciado la actividad sexual, arrojó las siguientes edades de inicio de la actividad sexual: Edad de inicio hombres (años): 17 – 15 – 18 – 21 – 14 – 16 – 15 – 20 – 17 – 13 Edad de inicio mujeres (años): 16 – 22 – 19 – 24 – 15 – 19 – 17 – 20
Asumiendo los supuestos de independencia, normalidad e igualdad de varianzas en las edades, con estos datos se requiere lo siguiente: Calcular un intervalo de confianza del 95%, para la edad media de inicio de la actividad sexual en la población de varones. 10.2. Contrastar, al 5% de significación, que la edad promedio de inicio de la actividad sexual en los hombres es de 18 años. 10.3. Docimar, al 5%, que la edad promedio de inicio de la actividad sexual en las mujeres es antes de los 18 años. 10.4. Contrastar, al 5%, que la edad promedio de inicio de la actividad sexual en las mujeres es mayor que la de los hombres. 10.5. Contraste, al 5%, que la edad promedio de inicio de la actividad sexual en los hombres es dos años más tarde que las mujeres. 10.1.
Solución:
Se trata de una situación de dos muestras chicas independientes, independientes, con varianza poblacional desconocida.
18
Estadística Aplicada a las Ciencias Sociales-Casos y problemas resueltos Inferencia en la media: Intervalos de confianza, contraste de la media, contraste de la diferencia de medias Patricio Alcaíno Martínez – Derechos Reservados
Calcular un intervalo de confianza del 95%, para la edad media de inicio de la actividad sexual en la población de varones.
10.1.
Para los efectos, se requiere la media muestral, el percentil 97,5 de la distribución t con 10 – 1 = 9 gl, y el error estándar de la media. x = 16,6 años; t 0,975; 9 = 2,262 y σ x = 0,81 años. El intervalo de confianza está dado por:
μ = 16,6 ± 2,262 · 0,81 μ = 16,6 ± 1,8; con un 99% de confianza. 14,8 años ≤ edad ≤ 18,4 años ; con un 99% de probabilidades. Finalmente: La edad media de inicio de la actividad sexual en la población de varones fluctúa entre 14,8 y 18,4 años, con un 95% de probabilidades.
Contrastar, al 5% de significación, que la edad promedio de inicio de la actividad sexual en los hombres es de 18 años.
10.2.
Con α = 0,05 , se contrasta: H0: μ = 18 H1: μ ≠ 18
19
Estadística Aplicada a las Ciencias Sociales-Casos y problemas resueltos Inferencia en la media: Intervalos de confianza, contraste de la media, contraste de la diferencia de medias Patricio Alcaíno Martínez – Derechos Reservados
Docimar, al 5%, que la edad promedio de inicio de la actividad sexual en las mujeres es antes de los 18 años.
10.3.
Con α = 0,05 , se contrasta: H0: μ = 18 H1: μ < 18 La hipótesis nula lleva a una prueba de cola izquierda. Calculando el estadístico de prueba: 19 − 18 t= = 0,93 1,07 Calculando el valor p para una situación de cola izquierda: α* = P(t p; 7 ≥ 0,93) = 0,192 Como α* > 0,05 , no se rechaza H0, al 5%. Conclusión: La edad promedio de inicio de la actividad sexual en las mujeres no es antes de los 18 años de edad (p = 0,192).
Contrastar, al 5%, que la edad promedio de inicio de la actividad sexual en las mujeres es mayor que la de los hombres.
10.4.
20
Estadística Aplicada a las Ciencias Sociales-Casos y problemas resueltos Inferencia en la media: Intervalos de confianza, contraste de la media, contraste de la diferencia de medias Patricio Alcaíno Martínez – Derechos Reservados
Conclusión: La edad promedio de inicio de la actividad sexual en las mujeres es mayor que la de los hombres (p = 0,043).
Contraste, al 5%, que la edad promedio de inicio de la actividad sexual en los hombres es dos años más tarde que las mujeres.
10.5.
Con α = 0,05 , se contrasta: H0: μ M − μ H = 2 H1: μ M − μ H ≠ 2 Así planteadas, la hipótesis nula lleva a una prueba de dos colas. Calculando el estadístico de prueba: 19 − 16,6 − 2 t= = 0,31 1,31 Si H0 es verdadera, este estadístico se se comporta como una t con 10 + 8 - 2 = 16 gl, Calculando el valor p para una situación de dos colas: α* = 2 ⋅ P(t p;16 ≥ 0,31) = 0,76 Como α* > 0,05 , se rechaza H0, al 5%.
21
Estadística Aplicada a las Ciencias Sociales-Casos y problemas resueltos Inferencia en la media: Intervalos de confianza, contraste de la media, contraste de la diferencia de medias Patricio Alcaíno Martínez – Derechos Reservados
22
11. Capacitación y eficiencia Una empresa realiza una medición en una muestra de nueve trabajadores al azar, del tiempo que emplean individualmente en realizar el armado de un electrodoméstico propio de su línea de producción. Luego de ello se realiza a los mismos trabajadores una capacitación en métodos de trabajo, realizándose una prueba final consistente en el armado del mismo tipo de electrodoméstico anterior. La gerencia de Recursos Humanos espera que la capacitación no sea solo efectiva en disminuir el tiempo de armado sino que, además, el tiempo medio de armado se reduzca en más de 3 minutos. Los datos de los tiempos en ambas pruebas por l os nueve operarios son los siguientes. muestra
1
2
3
4
5
6
7
8
9
Antes (min)
29
35
27
45
26
35
37
38
30
Después (min)
25
26
23
37
32
30
38
30
30
Contrastar, al 5% de significación, si la capacitación fue efectiva en disminuir el tiempo medio de armado. 11.2. Contrastar, al 5% de significación, si la capacitación logró disminuir el tiempo medio de armado en más de 3 minutos. 11.1.
Solución:
Se trata de una situación de dos muestras chicas pareadas, con varianza poblacional poblacional desconocida. Previamente se calcularán las diferencias di = Tiempo Antes – Tiempo Después y se calcularán las estadísticas de esas diferencias: muestra
1
2
3
4
5
6
7
8
9
Antes (min)
29
35
27
45
26
35
37
38
30
Después (min)
25
26
23
37
32
30
38
30
30
Estadística Aplicada a las Ciencias Sociales-Casos y problemas resueltos Inferencia en la media: Intervalos de confianza, contraste de la media, contraste de la diferencia de medias Patricio Alcaíno Martínez – Derechos Reservados
H0: μd = 0 H1: μ d > 0 La hipótesis nula lleva a una prueba de cola derecha. Calculando el estadístico de prueba: t=
3,44 − 0 = 2,1 1,65
Si la hipótesis nula es verdadera, este es un t con 9 – 1 = 8 grados de libertad. Calculando el valor p para una prueba de cola derecha: α* = P(t p; 8 ≥ 2,1) = 0,034 (según tabla t) Decisión: Como α* < 0,05 , se rechaza H0, al 5%. Conclusión: El tiempo medio de armado después de la capacitación es significativamente significativamente menor al tiempo antes de la capacitación (p = 0,034). En este sentido la capacitación habría sido efectiva en disminuir el tiempo de armado.
Contrastar, al 5% de significación, si la capacitación logró disminuir el tiempo medio de armado en más de 3 minutos. Ya se tienen los siguientes resultados muestrales: 11.2.
n = 9;
d = 3,44 min; sd = 4,67 min;
y
σ d = 1,65 min.
23
ν
Distribución t (Student) Probabilidad superior superior de valores de t con
p
grados de libertad 0
t
t
ti
GRADOS DE LIBERTADν 1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
0,1 0,2 0,3 0,4 0,5
0,468 0,437 0,407 0,379 0,352
0,465 0,430 0,396 0,364 0,333
0,463 0,427 0,392 0,358 0,326
0,463 0,426 0,390 0,355 0,322
0,462 0,425 0,388 0,353 0,319
0,462 0,424 0,387 0,352 0,317
0,462 0,424 0,386 0,351 0,316
0,461 0,423 0,386 0,350 0,315
0,461 0,423 0,385 0,349 0,315
0,461 0,423 0,385 0,349 0,314
0,461 0,423 0,385 0,348 0,313
0,461 0,422 0,385 0,348 0,313
0,461 0,422 0,384 0,348 0,313
0,461 0,422 0,384 0,348 0,312
0,461 0,422 0,384 0,347 0,312
0,6 0,7 0,8 0,9 1,0
0,328 0,306 0,285 0,267 0,250
0,305 0,278 0,254 0,232 0,211
0,295 0,267 0,241 0,217 0,196
0,290 0,261 0,234 0,210 0,187
0,287 0,258 0,230 0,205 0,182
0,285 0,255 0,227 0,201 0,178
0,284 0,253 0,225 0,199 0,175
0,283 0,252 0,223 0,197 0,173
0,282 0,251 0,222 0,196 0,172
0,281 0,250 0,221 0,195 0,170
0,280 0,249 0,220 0,194 0,169
0,280 0,249 0,220 0,193 0,169
0,279 0,248 0,219 0,192 0,168
0,279 0,248 0,219 0,192 0,167
0,279 0,247 0,218 0,191 0,167
1,1 1,2 1,3 1,4 1,5
0,235 0,221 0,209 0,197 0,187
0,193 0,177 0,162 0,148 0,136
0,176 0,158 0,142 0,128 0,115
0,167 0,148 0,132 0,117 0,104
0,161 0,142 0,125 0,110 0,097
0,157 0,138 0,121 0,106 0,092
0,154 0,135 0,117 0,102 0,089
0,152 0,132 0,115 0,100 0,086
0,150 0,130 0,113 0,098 0,084
0,149 0,129 0,111 0,096 0,082
0,147 0,128 0,110 0,095 0,081
0,146 0,127 0,109 0,093 0,080
0,146 0,126 0,108 0,092 0,079
0,145 0,125 0,107 0,092 0,078
0,144 0,124 0,107 0,091 0,077
1,6 1,7 1,8 1,9 2,0
0,178 0,169 0,161 0,154 0,148
0,125 0,116 0,107 0,099 0,092
0,104 0,094 0,085 0,077 0,070
0,092 0,082 0,073 0,065 0,058
0,085 0,075 0,066 0,058 0,051
0,080 0,070 0,061 0,053 0,046
0,077 0,066 0,057 0,050 0,043
0,074 0,064 0,055 0,047 0,040
0,072 0,062 0,053 0,045 0,038
0,070 0,060 0,051 0,043 0,037
0,069 0,059 0,050 0,042 0,035
0,068 0,057 0,049 0,041 0,034
0,067 0,056 0,048 0,040 0,033
0,066 0,056 0,047 0,039 0,033
0,065 0,055 0,046 0,038 0,032
2,1 2,2 2,3 2,4 2,5
0,141 0,136 0,131 0,126 0,121
0,085 0,079 0,074 0,069 0,065
0,063 0,058 0,052 0,048 0,044
0,052 0,046 0,041 0,037 0,033
0,045 0,040 0,035 0,031 0,027
0,040 0,035 0,031 0,027 0,023
0,037 0,032 0,027 0,024 0,020
0,034 0,029 0,025 0,022 0,018
0,033 0,028 0,023 0,020 0,017
0,031 0,026 0,022 0,019 0,016
0,030 0,025 0,021 0,018 0,015
0,029 0,024 0,020 0,017 0,014
0,028 0,023 0,019 0,016 0,013
0,027 0,023 0,019 0,015 0,013
0,027 0,022 0,018 0,015 0,012
2,6 2,7
0,117 0,113
0,061 0,057
0,040 0,037
0,030 0,027
0,024 0,021
0,020 0,018
0,018 0,015
0,016 0,014
0,014 0,012
0,013 0,011
0,012 0,010
0,012 0,010
0,011 0,009
0,010 0,009
0,010 0,008
ν
Distribución t (Student) Probabilidad superior superior de valores de t con
p
grados de libertad 0
t
t
ti
GRADOS DE LIBERTADν 16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
0,1 0,2 0,3 0,4 0,5
0,461 0,422 0,384 0,347 0,312
0,461 0,422 0,384 0,347 0,312
0,461 0,422 0,384 0,347 0,312
0,461 0,422 0,384 0,347 0,311
0,461 0,422 0,384 0,347 0,311
0,461 0,422 0,384 0,347 0,311
0,461 0,422 0,383 0,347 0,311
0,461 0,422 0,383 0,346 0,311
0,461 0,422 0,383 0,346 0,311
0,461 0,422 0,383 0,346 0,311
0,461 0,422 0,383 0,346 0,311
0,461 0,421 0,383 0,346 0,311
0,461 0,421 0,383 0,346 0,310
0,461 0,421 0,383 0,346 0,310
0,461 0,421 0,383 0,346 0,310
0,6 0,7 0,8 0,9 1,0
0,278 0,247 0,218 0,191 0,166
0,278 0,247 0,217 0,190 0,166
0,278 0,246 0,217 0,190 0,165
0,278 0,246 0,217 0,190 0,165
0,278 0,246 0,217 0,189 0,165
0,277 0,246 0,216 0,189 0,164
0,277 0,246 0,216 0,189 0,164
0,277 0,245 0,216 0,189 0,164
0,277 0,245 0,216 0,189 0,164
0,277 0,245 0,216 0,188 0,163
0,277 0,245 0,215 0,188 0,163
0,277 0,245 0,215 0,188 0,163
0,277 0,245 0,215 0,188 0,163
0,277 0,245 0,215 0,188 0,163
0,277 0,245 0,215 0,188 0,163
1,1 1,2 1,3 1,4 1,5
0,144 0,124 0,106 0,090 0,077
0,143 0,123 0,105 0,090 0,076
0,143 0,123 0,105 0,089 0,075
0,143 0,122 0,105 0,089 0,075
0,142 0,122 0,104 0,088 0,075
0,142 0,122 0,104 0,088 0,074
0,142 0,121 0,104 0,088 0,074
0,141 0,121 0,103 0,087 0,074
0,141 0,121 0,103 0,087 0,073
0,141 0,121 0,103 0,087 0,073
0,141 0,120 0,103 0,087 0,073
0,141 0,120 0,102 0,086 0,073
0,140 0,120 0,102 0,086 0,072
0,140 0,120 0,102 0,086 0,072
0,140 0,120 0,102 0,086 0,072
1,6 1,7 1,8 1,9 2,0
0,065 0,054 0,045 0,038 0,031
0,064 0,054 0,045 0,037 0,031
0,064 0,053 0,044 0,037 0,030
0,063 0,053 0,044 0,036 0,030
0,063 0,052 0,043 0,036 0,030
0,062 0,052 0,043 0,036 0,029
0,062 0,052 0,043 0,035 0,029
0,062 0,051 0,042 0,035 0,029
0,061 0,051 0,042 0,035 0,028
0,061 0,051 0,042 0,035 0,028
0,061 0,051 0,042 0,034 0,028
0,061 0,050 0,042 0,034 0,028
0,060 0,050 0,041 0,034 0,028
0,060 0,050 0,041 0,034 0,027
0,060 0,050 0,041 0,034 0,027
2,1 2,2 2,3 2,4 2,5
0,026 0,021 0,018 0,014 0,012
0,025 0,021 0,017 0,014 0,011
0,025 0,021 0,017 0,014 0,011
0,025 0,020 0,016 0,013 0,011
0,024 0,020 0,016 0,013 0,011
0,024 0,020 0,016 0,013 0,010
0,024 0,019 0,016 0,013 0,010
0,023 0,019 0,015 0,012 0,010
0,023 0,019 0,015 0,012 0,010
0,023 0,019 0,015 0,012 0,010
0,023 0,018 0,015 0,012 0,010
0,023 0,018 0,015 0,012 0,009
0,022 0,018 0,015 0,012 0,009
0,022 0,018 0,014 0,012 0,009
0,022 0,018 0,014 0,011 0,009
2,6 2,7 2,8 2,9 3,0
0,010 0,008 0,006 0,005 0,004
0,009 0,008 0,006 0,005 0,004
0,009 0,007 0,006 0,005 0,004
0,009 0,007 0,006 0,005 0,004
0,009 0,007 0,006 0,004 0,004
0,008 0,007 0,005 0,004 0,003
0,008 0,007 0,005 0,004 0,003
0,008 0,006 0,005 0,004 0,003
0,008 0,006 0,005 0,004 0,003
0,008 0,006 0,005 0,004 0,003
0,008 0,006 0,005 0,004 0,003
0,007 0,006 0,005 0,004 0,003
0,007 0,006 0,005 0,004 0,003
0,007 0,006 0,004 0,004 0,003
0,007 0,006 0,004 0,003 0,003