Ejercicios intervalos de confianza y pruebas de hipótesis Segunda parte Docente: José Fernando Zea
1. Ejercicios impares sección 6.3 y sección 6.4 2. Un economista de una entidad oficial desea determinar si la frecuencia de desempleo en dos grandes áreas urbanas del estado son diferentes, con base en muestras aleatorias de cada ciudad de 500 personas, el economista encuentra 35 personas desempleadas en una ciudad y 25 en la otra. Bajo las suposiciones adecuadas y con un nivel de confianza = 005, ¿existe alguna razón para creer que las frecuencais de desempleo en las dos áreas son diferentes? ¿cuál es el p- valor?
3. En un proceso de llenado, la tolerancia para el peso de los recipientes es de 8 gramos, para reunir este requisito la desviación estándar en el peso debe ser de dos gramos. Los pesos de 25 recipientes seleccionados al azar dieron como resultado una desviación estándar de 2.8 gramos. a) Si los pesos se encuentran normalmente distribuidos, determinar si la varianzas de estos difiere del valor necesario. Emplea = 0.002. b) ¿Para que valores la varianza muestral no puede rechazarse la hipótesis nula del inciso a) Se encuentran estos valores equidistantes del valor de la valores de la varianza
4. Se llevó a cabo un estudio para determinar el grado en el cuál el alcohol entorpece la habilidad de pensamiento para llevar a cabo determinada tarea. Se seleccionaron al azar diez personas de distintas características y se les pidió que participaran en el experimento. Después de proporcionarles la información pertinente, cada persona llevó a cabo la tarea sin nada de alcohol en su organismo. Entonces, la tarea volvió a llevarse a cabo, después de que cada persona había consumido una cantidad suficiente de alcohol para tener un contenido en su organismo de 0.1%. a) ¿Qué aspectos importantes el experimentador debe tener en cuenta para llevar a cabo el experimento? b) Suponga que los tiempos “antes” y “después” (en minutos) de los diez participantes son:
Participante
Antes
Después
1
28
39
2
22
45
3
55
67
4
45
61
5
32
46
6
35
58
7
40
51
8
25
34
9
37
48
10
20
30
¿Puede concluirse a un nivel de significancia de α = 0.05 que el tiempo promedio “antes” es menor que el tiempo promedio “después” por más de diez minutos? 5. Recientemente existe mayor interés de evaluar el efecto del ruido sobre la habilidad de las personas para llevar a cabo una determinada tarea. Un investigador diseña un experimento en el que se le pedirá a un determinado número de sujetos que lleven a cabo una tarea específica en un medio controlado y bajo dos niveles de ruido de fondo. El investigador selecciona a 32 personas que son capaces de realizar la misma tarea y de manera práctica en el mismo tiempo. Del total de personas, 16 seleccionados al azar llevarán a cabo la misma tarea bajo un nivel modesto de ruido de fondo (nivel 1). Los restantes 16 llevarán a cabo la misma tarea bajo un ruido de nivel 2, el cual es más severo que el ruido de nivel 1. Los siguientes datos representa los tiempos observados (en minutos) que fueron necesarios para completar la tarea para cada una de las 16 personas de cada nivel.
Nivel 1
14 12 15 15 11 16 17 12 14 13 18 13 18 15 16 11
Nivel 2
20 22 18 18 19 15 18 15 22 18 19 15 21 22 18 16
Asumiendo que estos datos constituyen muestras aleatorias independientes de dos distribuciones normales e independientes con varianzas iguales pero no conocidas, ¿existe alguna razón para creer que el tiempo promedio para el nivel 2 es mayor por más de dos minutos que para el nivel 1 con α = 0.01? 6. Se cree que el promedio verbal para el número de respuestas correctas en la prueba SAT para las mujeres es mayor que el de los hombres por más de diez puntos. Las muestras aleatorias para ambos sexos arrojaron los siguientes resultados:
Hombres
Mujeres
N
125
100
Promedio muestral Σ
480
460
60
52
a) Si se muestrearon dos poblaciones independientes de manera independiente, ¿se mantiene la creencia apoyada por la evidencia muestral con α = 0.05? ¿Cuál es el valor de p? b) Supóngase que la verdadera diferencia es de 15 puntos. ¿Cuál es la potencia de la prueba anterior? Asumiendo que estos datos constituyen muestras aleatorias de dos distribuciones normales e independientes con varianzas iguales pero no conocidas, ¿existe alguna razón
que el tiempo promedio para el nivel 2 de ruido es mayor por más de dos minutos que para el nivel 1? 7. En cierto supermercado una muestra de 60 clientes que utilizan una caja de autoservicio demoran un promedio de 5.2 minutos en cancelar sus productos, para estos clientes la desviación estándar de 3.1 minutos. Por otro lado una muestra de 72 clientes que utilizan una caja con cajero se demoran en promedio 6.1 minutos, para estos clientes se obtiene una desviación estándar de 2.8 minutos. a. ¿Puede concluirse que el tiempo que se demoran en pagar los clientes es menor para los que utilizan la caja de autoservicio? (Use el p-valor para respaldar su conclusión) 8. En una prueba para comparar la efectividad de dos drogas diseñada para bajar los niveles de colesterol, 75 pacientes seleccionados aleatoriamente se les dieron la droga A y 100 pacientes seleccionados aleatoriamente se les dio la droga B. A los que se les dio la droga A se les redujo los niveles los niveles de colesterol en un promedio de 40 unidades con una desviación estándar de 12 unidades, y a las personas que se les asignó la droga B redujeron sus niveles de colesterol en un promedio de 42 con una desviación estándar de 15. Las unidades utilizadas son miligramos de colesterol por cada decilitro de sangre serum. ¿Puede usted concluir que la reducción media en los niveles de colesterol es más grande cuando se utiliza la droga B con respecto a la droga A?
9. Para probar la efectividad de un proceso de empaque una firma realiza 1200 envíos en una empaque ligero el cual es el utilizado normalmente utilizado por la empresa para empacar, por otro lado realiza 1500 envíos en una nueva clase de empaque el cual es de un material más resistente. De las órdenes empacadas con el material ligero, 20 llegan con daño, por otro lado de envíos con el material resistente 15 llegan con daños ¿Puede usted concluir que el empaque con material resistente reduce la proporción de envíos con daños? Realice la prueba con niveles de significancia del 10%, 5% y 1%.
10. La empresa de investigación de mercados Nielsen, reportan que los varones jóvenes en los Estados Unidos ven un promedio de 56.2 minutos de televisión en horario prime time (8 a 10 pm). Otra empresa de investigación de mercados cree que los varones jóvenes de Alemania gastan más tiempo durante este tiempo. La empresa Asample de Alemania selecciona una muestra y registra el tiempo que gastan los jóvenes viendo televisión. La muestra resultante será utilizada para probar las siguientes hipótesis nula y alterna. ¿Cuál es el error tipo I cometido en esta situación? ¿Cuáles son las consecuencias de cometer dicho error? b) ¿Cuál es el error tipo II cometido en esta situación? ¿Cuáles son las consecuencias de cometer dicho error? a)
11. Considere la siguiente prueba de hipótesis:
Por medio de una muestra de tamaño 40 se obtiene una media muestral de 26.4 y una desviación estándar poblacional es 6. a) b) c) d)
Calcule el valor del estadístico de prueba. Calcule el p-valor A un nivel de significancia α de 0.01 ¿Cuál es la conclusión? ¿Cuál es la regla de rechazo utilizando un valor crítico. ¿Cuál es su conclusión?
12. Considere la siguiente prueba de hipótesis:
El tamaño de muestral con la cual se realiza esta prueba es 120 y la desviación estándar poblacional se asume conocida, σ = 0.5. Utilice α = 0.05. Si la verdadera media poblacional es 9 y la probabilidad de error tipo II es 0.2912. Suponga que el investigador quiere reducir la probabilidad de error tipo II a 0.1 cuando la media poblacional verdadera es 0.9. ¿Qué tamaño de muestra recomendaría?
13. Considere la siguiente prueba de hipótesis: Una muestral de 200 ítems será seleccionada con una desviación estándar poblacional de 10. Calcule la probabilidad de cometer error tipo II si la media poblacionales son:
14. Considere la siguiente prueba de hipótesis:
La desviación estándar poblacional es de 10. Utilice α = 0.05. ¿Qué tan grande debe tomarse la muestra si el investigador esta dispuesto a aceptar una probabilidad de cometer error tipo II de 0.05 cuando la media poblacional verdadera sea 22. Realice la curva de potencia para este problema
15. La varianza en el peso de una droga es fundamental en la industria farmacéutica. Para una droga específica con pesos medidos en gramos, una muestra de 18 unidades da una 2 varianza muestra S = 0.36. a. Construya un intervalo de confianza para estimar la varianza poblacional para el peso de esta droga.
b. Construya in intervalo de confianza para estimar la desviación estándar poblacional para el peso de esta droga. Intervalos de confianza para varianza 16. Para analizar el riesgo o la volatilidad asociada con invertir en la bolsa en las acciones de Chevron una muestra muestral de retornos mensuales para 12 meses fueron tomadas, Los retornos para los 12 meses de 2005 son mostrados acá. El retorno total es el precio de apreciación más cualquier dividendo pagado. Mes
Retorno
Mes
Retorno
Enero
3.6
Julio
3.74
Febrero
14.86
Agosto
6.62
Marzo
-6.07
Septiembre
5.42
Abril
-10.82
Octubre
-11.83
Mayo
4.29
Noviembre
1.21
Junio
3.98
Diciembre
-0.94
a) Calcule la varianza muestral y la desviación estándar muestral como una medida de volatilidad del retorno mensual total para Chevron. b) Construya un intervalo de confianza para la varianza poblacional c) Construya un intervalo de confianza para la desviación estándar poblacional 17. Una compañía de neumáticos afirma que los tiempos de vida de los neumáticos tienen un promedio de duración de 50.000 millas. La desviación estándar del tiempo de vida de los neumáticos es conocido de antemano (5.000 millas). Se extrae una muestra de 100 neumáticos y se realiza una prueba de hipótesis de que el tiempo de vida de los neumáticos sea de al menos 50.000 millas contra la alternativa de que sea menor a 50.000. Asuma que en realidad que el tiempo medio de vida de los neumáticos es de 49500. a) Construya la hipótesis nula y la hipótesis alterna. ¿Qué hipótesis es la verdadera? b) Si se decide rechazar H0 si la media muestral es 49400, Encuentre el nivel de significancia y la potencia de esta prueba. c) Si esta prueba se realiza con un nivel de significancia del 5%, ¿cual es la potencia de la prueba? d) ¿A que nivel de significancia debe realizarse esta prueba para que la potencia sea de 0.8? e) A usted se le da la opción de muestrear más neumáticos. ¿Cuántos neumáticos debe seleccionar para obtener una potencia de 0.8 y un nivel de significancia de 0.05. 18. Un nuevo proceso de producción de placas de circuitos integrados se cree logra una proporción de artículos defectuosos menor al 10%. Para comprobarlo se extrae una muestra de 250 placas. Sea X la variable aleatoria que representa el número de defectos en la muestra y p la proporción poblacional de artículos defectuosos producidos por el nuevo proceso. Realice la prueba de hipótesis Ho: p≥0.1 vs H1: p< 0.1 Asuma que el verdadero valor de p es 0.06.
a. Si se decide rechazar Ho cuando x≤18. Encuentre el nivel de significancia del test. b. Si se decide rechazar Ho cuando x≤18 calcule la potencia del test. c. ¿Cuantas placas deben seleccionarse para que la potencia sea de 0.9 a un nivel de significancia es de 0.05? 19. La desviación estándar de las ganancias por acción en un año para 10 compañías de la industria aeronáutica fue de 4.27 y la desviación estándar para las ganancias anuales en 7 compañías en la industria automovilística fue de 2.27. Realice una prueba de hipótesis para igualdad de varianzas de alfa = 0.05. ¿Cuál es su conclusión acerca de la variabilidad en ganancias por acción para la industria aeronáutica y automotriz. 20. La varianza en un proceso de producción es una medida importante de la calidad del proceso. Una varianza grande usualmente señala una oportunidad de mejoramiento del proceso encontrando maneras de reducir la varianza del proceso. Desarrolle una prueba de hipótesis estadística para determinar si existen diferencias significativas entre las varianzas en el peso de las maletas para las dos maletas. Use un nivel de significancia de 0.05. ¿Cuál es su conclusión? ¿Cuál maquina debe ser sometida a un proceso de arreglo?
2.95 3.45 3.5 3.75 3.48 3.26 3.33 3.2 3.12 Maquina 1 3.16 3.2 3.22 3.38 3.9 3.36 3.25 3.28 3.2 3.22 2.98 3.45 3.22
3.7 3.34 3.18 3.35
3.3 3.34 3.28 3.29 3.25
3.3 3.27
Maquina 2 3.38 3.34 3.35 3.19 3.35 3.05 3.36 3.28 3.3 3.28
3.3
3.2 3.16 3.33