Para uso exclusivo de los estudiantes del Prof. Víctor Gómez
ESTIMACIÓN Y PRUEBA DE HIPÓTESIS 1) Dada una muestra aleatoria de tamaño n tomada de una población con la media conocida µ y la
1 n 2 varianza finita σ , demuestre que • ∑ ( x i − µ ) es un estimador insesgado de σ2. n i =1 2
Circulación restringida
Respuesta: El insesgamiento implica que el valor esperado del estimador es igual al parámetro a
⎡1
estimar, por tanto: E ⎢ • ⎣n
n
∑ (x i =1
i
1 n 1 2 2⎤ − µ ) ⎥ = • ∑ E ( x i − µ ) = • (nσ 2 ) = σ 2 n ⎦ n i =1
2) Si θ´ es un estimador de θ y su sesgo está dado por b = E(θ´)-θ. Demuestre que E((θ´θ)2) = Var(θ´) +b2. Respuesta:
E((θ´-θ)2) = E{((θ´- E(θ´)) + (E(θ´) -θ))2} = E{(θ´-E(θ´))2 –2(θ´-E(θ´))(E(θ´) -θ) + (E(θ´) -θ)2} = Var(θ´) +E{–2(θ´-E(θ´))(E(θ´) -θ) + (E(θ´) -θ)2} = Var(θ´) +E{–2(θ´E(θ´) - θ´θ - (E(θ´))2 + E(θ´) θ )+ (E(θ´))2 -2E(θ´)θ + θ2} = Var(θ´) +E{-2θ´E(θ´)+ 2θ´θ + 2(E(θ´))2 -2 E(θ´) θ +(E(θ´))2 -2E(θ´)θ + θ2 } = Var(θ´) +E{-2θ´E(θ´)+ 2θ´θ + 3(E(θ´))2 -4E(θ´) θ + θ2 } = Introducimos operador E. Var(θ´) +-2E(θ´)E(θ´)+ 2E(θ´)θ + 3(E(θ´))2 -4E(θ´) θ + θ2 } = Var(θ´) +-2(E(θ´))2 + 2E(θ´)θ + 3(E(θ´))2 -4E(θ´) θ + θ2 } = Var(θ´) +(E(θ´))2 -2E(θ´) θ + θ2 } = Var(θ´) +(E(θ´)- θ)2 = Var(θ´) +b2 3) Mediciones de la presión sanguínea de 25 mujeres de edad avanzada tienen una media de x =140 mm de mercurio. Si estos datos se pueden considerar como una muestra tomada al azar de una población normal con σ = 10 mm de mercurio, construya un intervalo de confianza del 95% de la media de la población µ.
Respuesta: El intervalo se construye de forma tal que: x - zα/2.
σ n
< µ< x + zα/2.
σ n
.
Si
observamos la tabla para un nivel de confianza del 95% para una prueba de dos colas, esto implica que la región de rechazo contendrá 2.5% del área a cada lado de la región de aceptación. Así que si P(Z
Respuesta: 1
Para uso exclusivo de los estudiantes del Prof. Víctor Gómez
Circulación restringida
El intervalo se construye de forma tal que: x - Zα/2 .
s s < µ< x + Zα/2. . Se usa la n n
distribución Z, pues aunque no se conoce la desviación poblacional, la muestra es lo suficientemente grande para aproximarla con Z. Si se utilizara la distribución t, que utilizaría 63 gl. Y 99% de confianza tendríamos una t de2.656, los límites serían 27.4875 y 29.5125. . Si observamos la tabla (o en este caso por un computador) para un nivel de confianza del 99% para una prueba de dos colas, esto implica que la región de rechazo contendrá 0.5% del área a cada lado de la región de aceptación ⇒ Z = 2.575. Así: Límite inferior es 28.5-2.656*(0.3812) = 27.51841. El límite superior vendría dado por 28.5+2.656*(0.3812) = 29.48159.
5) La longitud de los cráneos de 10 esqueletos fósiles de una especie de aves extinta tiene una media de 5.68 cm y una desviación estándar de 0.29 cm. Suponiendo que estas mediciones son normalmente distribuidas, obtenga un intervalo de confianza del 95% de la longitud media de los cráneos de esta especie de aves. Respuesta: El intervalo se construye de forma tal que: x - tα/2(9gl) .
s s < µ< x + tα/2(9gl). . Se usa n n
la distribución t dado que no conocemos la varianza de la población y estamos utilizando la de la muestra, que es menor que 30. Si observamos la tabla para un nivel de confianza del 95% para una prueba de dos colas, esto implica que la región de rechazo contendrá 2.5% del área a cada lado de la región de aceptación ⇒ t = 2.62. Así: Límite inferior es 5.68-2.62*(0.29/ 10 ) = 5.47256091. El límite superior vendría dado por 5.68+2.62*(0.29/ 10 ) = 5.88743909
6) Un inspector de alimentos, que examina 12 frascos de cierta marca de mantequilla de cacahuate, obtuvo los siguientes porcentajes de impurezas: 2.3, 1.9, 2.1, 2.8, 2.3, 3.6, 1.4, 1.8, 2.1, 3.2, 2.0, y 1.9. Suponiendo que estas determinaciones están normalmente distribuidas, construya un intervalo de confianza del 99% del porcentaje promedio de impurezas que hay en esta marca de mantequilla de cacahuate. Respuesta: Si sacamos la media muestral del problema obtendremos que es igual a 2.28333. La desviación estándar es igual a 0.62498 s s El intervalo es: x - tα/2(11gl) . < µ< x + tα/2(11gl). . Si observamos la tabla para un nivel de n n confianza del 99% para una prueba de dos colas, esto implica que la región de rechazo contendrá 0.5% del área a cada lado de la región de aceptación ⇒ t = 3.106. Así: El límite inferior es
2.28333-3.106*(0.62498/ 12 ) = 1.72295733. El límite superior vendría dado por 2.28333 + 3.106*(0.62498/ 12 ) = 2.84370267. 7) Una muestra tomada al azar de una población de normal de tamaño n1 = 16 con σ1 = 4.8 tiene la media x 1 = 18 y una muestra aleatoria de tamaño n2 =25 tomada de una población normal diferente con σ2 = 3.5 tiene la media x 2 =23. Determine un intervalo de confianza del 90% para µ1- µ2. 2
Para uso exclusivo de los estudiantes del Prof. Víctor Gómez
Respuesta: El intervalo solicitado es:
Circulación restringida
σ 12
σ 22
σ 12
σ 22
+ + n1 n2 n1 n2 Sustituyendo para Zα/2 = 1.645: 23.04 12.25 23.04 12.25 (18-23) –1.645 + < µ1- µ2 < (18-23) –1.645 + 16 25 16 25 -5-1.645(1.3892444) < µ1- µ2 <-5+1.645(1.3892444) =,-7.28530704< µ1- µ2 <-2.71469296
( x 1- x 2) - Zα/2
< µ1- µ2 < ( x 1- x 2) - Zα/2
8) Doce árboles de frutos cítricos maduros, seleccionados al azar de una variedad de ejemplares, tienen una altura media de 13.8 pies con una desviación estándar de 1.2 pies y 15 árboles de frutos cítricos maduros seleccionados al también al azar de otra variedad, tienen una altura media de 12.9 pies con una desviación estándar de 1.5 pies. Suponiendo que las muestras aleatorias se seleccionan de poblaciones normales con varianzas iguales, construya un intervalo de confianza del 95% de la diferencia entre las alturas promedio reales de los dos tipos de árboles de frutos cítricos. Respuesta: El intervalo es: x 1- x 2 - tα/2 (n1+ n2-2gl). s p ( n1 − 1) s1 + ( n 2 − 1) s 2 . n1 + n 2 − 2 2
Siendo sp =
1 1 1 1 + < µ1- µ2 < x 1- x 2 - tα/2 (n1+ n2-2gl) . s p + . n1 n 2 n1 n 2
2
Si observamos la tabla para un nivel de confianza del 95% para una prueba de dos colas, esto implica que la región de rechazo contendrá 2.5% del área a cada lado de la región de aceptación, para n1 + n 2 − 2 = 25 grados de libertad ⇒ t = 2.06
11(1.2) 2 + 14(1.5) 2 11(1.44) + 14( 2.25) 47.34 = = = 1.37608 . 25 25 25 1 1 + < µ1- µ2 < (13.8 - 12.9) + El intervalo sería: (13.8 - 12.9) – (2.06)( 1.37608 ) 12 15 1 1 3 3 + . = (0.9) – (2.83473) < µ1- µ2 <(0.9) + (2.83473) = (0.9) – (2.06)( 1.37608 ) 12 15 20 20 Así: sp =
(3.44365)< µ1- µ2 <(0.9) + (3.44365) ⇒ -0.19789< µ1- µ2 < 1.99789.
9) Las siguientes son las capacidades de producción de calor del carbón extraído de dos minas (en millones de calorías por tonelada): Mina A: 8500 8330 8480 7960 8030 Mina B: 7710 7890 7920 8270 7860 Suponiendo que los datos constituyen muestras aleatorias independientes tomadas de poblaciones normales con varianzas iguales, construya un intervalo de confianza del 99% de la diferencia entre el promedio real de las capacidades de producción de calor del carbón extraído de ambas minas. 3
Para uso exclusivo de los estudiantes del Prof. Víctor Gómez
Respuesta: Si sacamos la media muestral del problema obtendremos que es igual a 8260 para la mina A y 7930 para la mina B. Las desviaciones estándar son de 251.892834 y 206.518764 para las minas A y B respectivamente.
Circulación restringida
Si observamos la tabla para un nivel de confianza del 99% para una prueba de dos colas, esto implica que la región de rechazo contendrá 0.5% del área a cada lado de la región de aceptación, para n1 + n 2 − 2 = 8 grados de libertad ⇒ t = 3.355
4(( 251.8928) 2 + ( 206.5187) 2 ) 4(106100) 424400 = = = 230.325856 . 8 8 8 1 < µ1- µ2 < (8260 - 7930) + El intervalo vendría dado por: (8260 - 7930) – (3.355)(230.325856) 10 1 1 1 = (330) – (772.743247) < µ1- µ2 <(330) + (772.743247) = (3.355)(230.325856) 10 10 10 Así: sp =
(330) – (244.362871)< µ1- µ2 <(330) + (244.362871) ⇒ 85.637129< µ1- µ2 < 574.362871.
10) Un estudio de muestra realizada en un supermercado demostró que 204 de 300 compradores utilizan con regularidad cupones de los centavos suprimidos. Utilice el intervalo de confianza de muestra grande del teorema 11.5 para obtener un intervalo de confianza del 99% para la proporción verdadera correspondiente. Respuesta: Teorema 11.5 (Intervalo de confianza de muestra grande (ver bibliografía) para θ). Para el parámetro binomial dado el intervalo viene dado por: θ ´(1 − θ ´) θ ´(1 − θ ´) θ´-Zα/2 p θ p θ´+Zα/2 donde θ´= x/n n n Tenemos que para un α/2 = 0.005 si buscamos en la tabla obtenemos Z = 2.575. Puesto que θ´ = 204/300 = 0.68 y n es igual a 300 tenemos: 0.68(0.32) 0.68(0.32) 0.68 - 2.575 p θ p 0.68 + 2.575 = 0.68 - 0.06934993 p θ p 0.68 + 300 300 0.06934993 = 0.61065007 p θ p 0.74934993 11) En una muestra aleatoria de 250 televidentes de cierta zona, 190 habían presenciado cierto programa de debate. Construya un intervalo de confianza del 95% para la proporción verdadera correspondiente, mediante el uso de: a) El intervalo de confianza para muestras grandes (ej anterior) b) Los límites generales de pivoteo. Respuesta: a) Tenemos que para un α/2 = 0.025 si buscamos en la tabla obtenemos Z = 1.96. Puesto que θ´ = 190/250 = 0.76 y n es igual a 250 tenemos:
4
Para uso exclusivo de los estudiantes del Prof. Víctor Gómez
0.76(0.24) 0.76(0.24) p θ p 0.76 + 1.96 = 0.68 - 0.05294177 p θ p 0.68 + 250 250 0.05294177 = 0.70705823 p θ p 0.81294177. b) Los límites generales para θ vienen dados por : Z 2α / 2 x(n − x ) Z 2 α / 2 x+ ± Zα / 2 + 2 4 n Así que si sustituimos: 2 n + Z α /2 190( 250 − 190) 3.8416 3.8416 - 1.96 190 + + 250 4 2 = 0.70337842 250 + 3.8416 3.8416 190( 250 − 190) 3.8416 190 + + 1.96 + 2 250 4 = 0.80875198 250 + 3.8416
Circulación restringida
0.76 1.96
12) En una muestra aleatoria de personas que visitan un famoso centro turístico, 84 de 250 hombres y 156 de 250 mujeres compraron recuerdos. Construya un intervalo de confianza del 95% para la diferencia entre las proporciones verdaderas de hombres y mujeres que compran recuerdos en este sitio turístico Respuesta: Para las diferencias entre medias el intervalo viene dado por: θ ´(1 − θ1´) θ 2 ´(1 − θ 2 ´) θ ´(1 − θ1´) θ 2 ´(1 − θ 2 ´) + + p θ1 − θ 2 p θ1´-θ2´+ Zα/2 1 θ1´-θ2´-Zα/2 1 n1 n2 n1 n2 Sustituyendo: (0.336-0.624) - 1.96
0.336(0.664) 0.624(0.376) + p θ1 −θ 2 p (0.336-0.624) + 250 250
0.336(0.664) 0.624(0.376) + = 250 250 (-0.288) - 1.96 0.00183091p θ1 −θ 2 p (-0.288) + 1.96 0.00183091= (-0.288) - 0.083866751 p θ1 −θ 2 p (-0.288) + 0.08386675 = -0.37186675 p θ1 −θ 2 p -0.20413325 1.96
13) Entre 500 solicitudes de matrimonio, elegidas al azar en 1971, hubo 48 en las cuales las mujeres eran cuando menos un año mayor que los hombres y entre 400 solicitudes de matrimonio, elegidas al azar en 1977, hubo 68 en las cuales las mujeres eran cuando menos un año mayor que los hombres. Construya un intervalo de confianza de 99% para la diferencia entre las proporciones verdaderas correspondientes de solicitudes de matrimonio en las cuales las mujeres fueron cuando menos un año mayores que los hombres. Respuesta:
5
Para uso exclusivo de los estudiantes del Prof. Víctor Gómez
Sustituyendo: (0.096-0.17) - 2.575
0.096(0.904) 0.17(0.83) + 500 400
p θ1 −θ 2 p (0.096-0.17) +
0.096(0.904) 0.17(0.83) + = 500 400 (-0.074) - 2.575 0.00052632p θ1 −θ 2 p (-0.074) + 2.575 0.00052632= (-0.074) - 0.05907468 p θ1 −θ 2 p (-0.074) + 0.05907468 = -0.13307468 p θ1 −θ 2 p -0.01492532.
Circulación restringida
2.575
14) Con referencia al ejercicio 5, construya un intervalo de confianza del 95% para la varianza verdadera en la longitud de los cráneos de la especie de aves dada. Respuesta: El intervalo de confianza para varianzas viene dado por: (n − 1)s 2 p σ 2 p (n − 1)s 2 2 2 X α / 2 ( n −1gl ) X 1−α / 2 ( n −1gl ) Tenemos que para α = 0.05, la ji-cuadrada nos da: 19.023 y 2.7. Si sustituimos: (9)0.08410 p σ 2 p (9 )0.08410 19.023 2.7 2 Los límites son: 0.03979 p σ p 0.28033
15) Con referencia al ejercicio 8, construya un intervalo de confianza del 98% para la razón de las dos varianzas de la población. Respuesta: s12 σ 12 s12 1 ⋅ p p ⋅ Fα / 2 ( n2 −1,n1 −1) s 22 Fα / 2 ( n1 −1,n2 −1) σ 22 s 22 Si sustituimos en esta ecuación los datos: σ 2 1.44 σ2 1.44 1 ⋅ p 12 p ⋅ 4.29 = 0.1658 p 12 p 2.7456. 2.25 3.86 σ 2 2.25 σ2 16) Con referencia al ejercicio 9, construya un intervalo de confianza del 98% para la razón de las dos varianzas de la población. Respuesta: Como vimos en este ejercicio anteriormente las desviaciones estándar son: Mina B: 206.518764 Mina A: 251.892834 La razón de varianzas muestrales de A con respecto a B = 1.21970919 Dado que tenemos 4 gds. de lib. tanto en el denominador como en el numerador, aquí se ofrecen varios intervalos para determinados niveles de confianza: σ σ 1 1.48769 ⋅ p 1 p 1.48769 ⋅ (15.95) = 0.30540487 p 1 p 4.87120761 . α =2% 15.95 σ 2 σ2
6
Circulación restringida
Para uso exclusivo de los estudiantes del Prof. Víctor Gómez
1.48769 ⋅
σ σ 1 p 1 p 1.48769 ⋅ (9.6) = 0.39365945 p 1 p 3.7791307. α =5% 9.6 σ 2 σ2
1.48769 ⋅
σ σ 1 p 1 p 1.48769 ⋅ (6.39) = 0.4825095 p 1 p 3.08323569. α =10% 6.39 σ 2 σ2
17) Un recipiente contiene siete canicas de las cuales θ son rojas y las otras son azules. Para demostrar la hipótesis nula θ = 2 contra la alternativa θ = 4, se sacan del recipiente al azar dos de las canicas sin reemplazo y se rechaza la hipótesis nula si y solo si ambas son rojas. Determine las probabilidades de cometer errores tipo I y II con este criterio. Respuesta: Tenemos que en el recipiente hay siete canicas. Por tanto, la probabilidad de 7 −θ θ . Por tanto, obtener 1 canica roja es de y la probabilidad de obtener una azul es de 7 7 θ ⎛θ − 1⎞ ⎛θ 2 − θ ⎞ ⎟. la probabilidad de obtener dos rojas es: ⎜ ⎟ =⎜ 7 ⎝ 6 ⎠ ⎜⎝ 42 ⎟⎠ 7 − θ ⎛ (7 − θ ) − 1 ⎞ ⎛ 42 − 13θ + θ 2 ⎞ ⎟⎟ . ⎜ ⎟ = ⎜⎜ 6 42 7 ⎝ ⎠ ⎝ ⎠ θ ⎛ 7 − θ ⎞ ⎛ 7 − θ ⎞ ⎛ θ ⎞ ⎛ 7θ − θ 2 ⎞ ⎟. la probabilidad de obtener 1 roja y 1 azul es: ⎜ ⎟ +⎜ ⎟⎜ ⎟ =⎜ 7 ⎝ 6 ⎠ ⎝ 7 ⎠ ⎝ 6 ⎠ ⎜⎝ 21 ⎟⎠ La probabilidad de cometer error tipo 1 según el criterio es la que corresponde a nuestra primera posibilidad, dos rojas. Para θ = 2 esto implica: 1/21. La probabilidad de cometer error tipo II vendría dada por el hecho de aceptar la hipótesis nula siendo esta falsa. O sea, aceptar que θ = 2 cuando en este caso, θ = 4. Y dado que aceptamos la hipótesis nula en el caso 2 y 3, tenemos: β = 3/21+12/21=15/21=5/7.
la probabilidad de obtener cero rojas es:
18) Se utiliza una sola observación de una variable aleatoria con una distribución exponencial para probar la hipótesis nula de que la media de la distribución es λ = 2 contra la alternativa de que λ = 5. Si se acepta la hipótesis nula si y solo si el valor observado de la variable aleatoria es menor que 3, determine las probabilidades de cometer errores de tipo I y II. Exp media = 2 Respuesta:
Exp media = 5 β α 3
7
Para uso exclusivo de los estudiantes del Prof. Víctor Gómez
Hay que averiguar las áreas de β y α. En el caso de el error tipo 1 solo se procede a evaluar la función exponencial acumulada con media 2 y restar su resultado de 1: 3
α = 1- ∫ 2e − 2 x dx = 0.22313 El error tipo II se puede obtener si evaluamos la exponencial acumulada con media 5. 3
β=
∫ 5e
−5 x
dx = 0.45119
Circulación restringida
0
19) Sea que x1 y x2 constituyan una muestra aleatoria de tamaño 2 tomada de una población dada por: ⎧θx θ −1 0 ≤ x ≤1 ⎪ f(x;θ) = ⎨ ⎪0 otro caso ⎩ Si se utiliza la región crítica x1x2 ≥3/4 para probar la hipótesis nula θ =1 contra la hipótesis alternativa θ =2, ¿cuál es la potencia de esta prueba en θ =2? Respuesta: Tenemos que la decisión se toma sobre si x1 o x2 son mayores a ¾. Sabemos que la integral de esa distribución es igual a Xθ. El error tipo 1, para una media verdadera de 1 sería igual a un cuarto, pues para θ = 1 se tendría la función identidad. El error tipo dos se daría si aceptáramos como media a 2 en lugar de 1. probando, esto sería (3/4)2 = 9/16. La potencia de la prueba vendría dada por 5/16 =0.3125. 20). Una línea aérea desea probar la hipótesis nula de que el 60% de sus pasajeros desaprueba que se fume dentro de los aviones. Explique en qué condiciones se cometerían un error tipo 1 y en que condiciones se cometería un error tipo II. Respuesta: La hipótesis correspondiente al problema vendría dada de la siguiente forma: H0: µ = 0.60 H1: µ ≠ 0.60 En este caso se puede cometer un error tipo I si concluimos que la hipótesis nula debe ser rechazada siendo esta verdadera, o sea, si rechazamos que el 60% de los pasajeros desaprueba el que se fume dentro de los aviones. Este valor depende del nivel de confianza que hayamos utilizado en la prueba. Un error tipo II se comete cuando se acepta una hipótesis nula cuando esta es falsa. Así, si concluimos que la hipótesis nula es correcta y que el 60% de los pasajeros desaprueba el que se fume dentro de los aviones cuando este porcentaje es diferente, sea mayor o menor. Para evaluar la probabilidad de cometer este error debe postularse un valor específico diferente al de la hipótesis nula. 21) Un recipiente contiene siete canicas de las cuales θ son rojas y las otras son azules. Con el fin de demostrar la hipótesis nula θ ≤ 2 contra la alternativa θ >2, se extraen al azar 8
Para uso exclusivo de los estudiantes del Prof. Víctor Gómez
Circulación restringida
dos de las canicas sin sustitución y se rechaza la hipótesis nula si y solo si ambas son de color rojo. a) Determine las probabilidades de cometer errores tipo I cuando θ = 0, 1, y 2. b) Obtenga las probabilidades de cometer errores de tipo II cunado θ = 3, 4, 5, 6, y 7. Respuesta: Tenemos que en el recipiente hay de nuevo siete canicas. Por tanto, la probabilidad 7 −θ θ . de obtener 1 canica roja es de y la probabilidad de obtener una azul es de 7 7 θ ⎛θ − 1⎞ ⎛θ 2 − θ ⎞ ⎟. A) Por tanto, la probabilidad de obtener dos rojas es: ⎜ ⎟ =⎜ 7 ⎝ 6 ⎠ ⎜⎝ 42 ⎟⎠ 7 − θ ⎛ (7 − θ ) − 1 ⎞ ⎛ 42 − 13θ + θ 2 ⎞ ⎟⎟ . B) La probabilidad de obtener cero rojas es: ⎜ ⎟ = ⎜⎜ 6 42 7 ⎝ ⎠ ⎝ ⎠ θ ⎛ 7 − θ ⎞ ⎛ 7 − θ ⎞ ⎛ θ ⎞ ⎛ 7θ − θ 2 ⎞ ⎟. C) La probabilidad de obtener 1 roja y 1 azul es: ⎜ ⎟ +⎜ ⎟⎜ ⎟ =⎜ 7 ⎝ 6 ⎠ ⎝ 7 ⎠ ⎝ 6 ⎠ ⎜⎝ 21 ⎟⎠ La probabilidad de cometer error tipo 1 según el criterio es la que corresponde a nuestra primera posibilidad, dos rojas. Para θ = 0 esto implica: 0. Para θ = 1 esto implica: 0. Para θ = 2 esto implica: 1/21. La probabilidad de cometer error tipo II vendría dada por el hecho de aceptar la hipótesis nula siendo esta falsa. O sea, aceptar que θ ≤ 2 cuando esto es falso. Y dado que aceptamos la hipótesis nula en el caso 2 y 3, tenemos: Para θ = 3 esto implica: β = 6/21+12/21=18/21=6/7. Para θ = 4 esto implica: β = 3/21+12/21=15/21=5/7. Para θ = 5 esto implica: β = 1/21+10/21=11/21. Para θ = 6 esto implica: β = 0 +6/21=6/21=2/7. Para θ = 7 esto implica: β = 0 +0=0. 22) Se usará una sola observación para probar la hipótesis nula de que el parámetro de una distribución exponencial es igual a 10 contra la hipótesis alternativa de que no es igual a 10. Si se va a rechazar la hipótesis nula si y solo si el valor observado es menor que 8 o mayor que 12, determine: a) Determine la probabilidad de cometer1 error tipo I. b) Obtenga las probabilidades de cometer errores de tipo II cuando θ = 2, 4, 8, 16, y 20. Respuesta: a) Tenemos que la probabilidad de que 8≤θ≤12 (error tipo 1) es igual a 1 12 1 − x 1 − ∫ e 10 dx .=1-(0.69880579-0.55067104) = 0.85186525 10 8
9
Para uso exclusivo de los estudiantes del Prof. Víctor Gómez 12
b) Para el error tipo II solo hay que sacar las probabilidades dadas por:
1
∫θ e
−
x
θ
dx . Para
8
cada valor de θ.
Circulación restringida
Para θ = 2:
12
1
12
1
12
1
1 − x ∫8 2 e 2 dx = (0.99752125-0.98168436) = 0.01583689
1 − x Para θ = 4: ∫ e 4 dx = (0.95021293-0.86466472) = 0.08554821 4 8
Para θ = 8:
1 − x ∫8 8 e 8 dx = (0.77686984-0.63212056) = 0.14474928 12
1
12
1
1 − x Para θ = 16: ∫ e 16 dx = (0.52763345-0.39346934) = 0.13416411 16 8
Para θ = 20:
1 − x ∫8 20 e 20 dx = (0.45118836-0.32967995) = 0.12150841
23) El departamento de seguridad de una fábrica desea saber si el tiempo promedio real que requiere el velador para ralizar su ronda nocturna es de 30 minutos. Si, en una muestra tomada al azar de 32 rondas, el velador promedió 30.8 minutos con una desviación estándar de 1.5 minutos, determine en α = 0.01 si esta es evidencia suficiente para rechazar la hipótesis nula µ 0 30 minutos a favor de la alternativa µ≠30 minutos. Respuesta: Aplicando el criterio de desición de la z tabulada contra la z calculada obtenemos: H0: µ = 30 H1: µ ≠ 30 Hay que rechazar la hipótesis nula si Z calculada es Zc ≥ 2.575 0 Zc ≤ -2.575. x − µ 30.8 − 30 Zc = = = 3.0169. Por tanto se rechaza la hipótesis nula. ⎛ 1.5 ⎞ ⎛ σ ⎞ ⎟ ⎟ ⎜ ⎜ ⎝ 32 ⎠ ⎝ n⎠ 24) Cinco mediciones del contenido de alquitrán de cierto tipo de cigarrillo arrojaron los siguientes datos: 14.5, 14.2, 14.4, 14.3, 14.6 mg/cig.. Demuestre que para α = 0.05. se debe rechazar la hipótesis nula µ=14.0 a favor de la hipótesis alternativa µ≠14.0. Supóngase que los datos son una muestra tomada al azar de una población normal. Respuesta: La media muestral es igual a (14.5+14.2+14.4+14.3+14.6)/5 =14.4. La desviación estándar es igual a: 0.158114 H0: µ = 14.0 H1: µ ≠ 14.0 Hay que rechazar la hipótesis nula si t calculada es tc ≥ 2.776 0 tc ≤ -2.776. 10
Para uso exclusivo de los estudiantes del Prof. Víctor Gómez
tc =
x−µ 14.4 − 14.0 = = 5.6568. Por tanto se rechaza la hipótesis nula. ⎛ s ⎞ ⎛ 0.158114 ⎞ ⎟ ⎟ ⎜ ⎜ 5 ⎠ ⎝ n⎠ ⎝
Circulación restringida
25) Supóngase que en el ejercicio anterior la primera medición se anota incorrectamente como 16.0 en vez de 14.5. demuestre que esta equivocación invertirá el resultado y explique la aparente paradoja que aunque haya aumentado la diferencia entre la media de la muestra y µ0 , ya no es significativa. Respuesta: La media muestral ahora es igual a (16+14.2+14.4+14.3+14.6)/5 =14.7. La desviación estándar es igual a: 0.74161985 H0: µ = 14.0 H1: µ ≠ 14.0 Hay que rechazar la hipótesis nula si t calculada es tc ≥ 2.776 0 tc ≤ -2.776. x−µ 14.7 − 14.0 = tc = = 2.1105. Por tanto no puede se rechazar la hipótesis nula. ⎛ s ⎞ ⎛ 0.74161985 ⎞ ⎟ ⎟ ⎜ ⎜ 5 ⎠ ⎝ n⎠ ⎝ La intromisión de 16.0 en lugar de 14.5 implica que la diferencia entre la media muestral y la poblacional según la hipótesis nula ha aumentado, pero también aumentó la desviación estándar, lo que produce que los límites de la zona de aceptación hayan aumentado y que se revierta el resultado. 26) Estudios de muestra hechos en un condado grande en 1950 y de nuevo en 1970 demostraron que en 1950 la estatura promedio de 400 niños de 10 años de edad era 53.2 pulgadas con una desviación estándar de 2.4 pulgadas mientras que en 1970 la estatura media de 500 niños de 10 años de edad era 54.5 pulgadas con una desviación estándar de 2.5 pulgadas. Pruebe la hipótesis nula µ1-µ2 = -0.5 contra la hipótesis alternativa µ1 - µ2 < -0.5 en α = 0.05. Repuesta: H0: µ1-µ2 = 0 H1: µ1-µ2 ≠ 0 Hay que rechazar la hipótesis nula si Z calculada: Zc ≤ -1.96. 53.2 − 54.5 + 0.5 x1 − x 2 − δ = Zc = = -4.8776861. Por tanto se rechaza la hipótesis ⎛ σ 12 σ 22 ⎞ ⎛ ( 2.4) 2 ( 2.5) 2 ⎞ ⎜ ⎟ ⎜ ⎟ + + ⎜ 400 ⎟ ⎜ n1 ⎟ 500 n 2 ⎠ ⎝ ⎠ ⎝ nula. 27) Si 8 proyectiles de corto alcance de algún tipo tienen un error de blanco medio de x 1 = 98 pies con una varianza de s21 =18 pies mientras que 10 proyectiles de corto alcance de otro tipo tienen un error de blanco medio de x 2 = 76 con una desviación estándar de s22 =15 pies, pruebe la hipótesis nula µ1-µ2 = 15 contra la hipótesis alternativa µ1-µ2 > 15. Sea α = 11
Para uso exclusivo de los estudiantes del Prof. Víctor Gómez
Circulación restringida
0.05 el tamaño de la región crítica y supóngase que las poblaciones son normales y tienen la misma varianza. Respuesta: H0: µ1-µ2 = 15 H1: µ1-µ2 > 15 Como la muestra es muy pequeña, debe utilizarse la t student, que con 7 grados de libertad nos dice que hay que rechazar la hipótesis nula si t calculada: tc ≥ 2.365 x1 − x 2 − δ x1 − x 2 − δ 98 − 76 − 15 = = tc = = 2 2 2 2 ⎞ ⎛ ⎛ ⎛ ⎞ 1 1 ⎞ ( n1 − 1) s1 + ( n 2 − 1) s 2 ⎟ 1 1 1 1 ⎜ (7)18 + (9)15 ⎟ ⎜sp ⎟ + + ⎜ + ⎜ ⎟ ⎜ ⎟ n1 n 2 ⎠ ⎟ n1 n 2 ⎝ n1 + n 2 − 2 8 10 ⎜ 16 ⎝ ⎠ ⎝ ⎠ = 0.9046618. Por tanto no se rechaza la hipótesis nula. 28) Para determinar la efectividad de un programa de seguridad industrial, en un período de un año se recolectaron los siguientes datos acerca de la pérdida semanal en promedio en horas hombre debidas a accidentes en 12 plantas “antes y después” de que se pusiera en operación el programa: 50 y 41, 87 y 75, 37 y 35, 141 y 129, 59 y 60, 65 y 53, 24 y 26, 88 y 85, 25 y 29, 36 y 31, 50 y 48, 35 y 37. Utilice α = 0.01 para probar la hipótesis nula de que el programa de seguridad no es efectivo contra una alternativa unilateral adecuada. Supóngase que las diferencias tienen una distribución normal. Repuesta: a) Antes 50 87 37 141 59 65 24 88 25 36 50 35 Suma:
Después 41 75 35 129 60 53 26 85 29 31 48 37
Diferencia 9 12 2 12 -1 12 -2 3 -4 5 2 -2
La diferencia promedio es de 4, y la desviación estándar de la diferencia es igual a: 5.93908472
Así: H0: d = 0 H1: d > 0 12
Para uso exclusivo de los estudiantes del Prof. Víctor Gómez tc =
d
=
4
Circulación restringida
= = 2.33308786 ⎛ s 2 ⎞ ⎛ (5.93908472) 2 ⎞ ⎜ d ⎟ ⎜ ⎟ ⎟ ⎜ 12 ⎟ ⎜⎝ 12 ⎠ ⎠ ⎝ La t student, que con 11 grados de libertad nos dice que hay que rechazar la hipótesis nula si t calculada: tc ≥ 2.718 Por tanto no se rechaza la hipótesis nula.
29) La media y la desviación estándar típica de las cargas máximas soportadas por 60 cables están dadas por 11.09 ton y 0.73 ton., respectivamente. Hallar los límites de confianza del 95% y 99% para las medias de las cargas máximas de todos los cables producidos por las compañías. Respuesta: El intervalo se construye de forma tal que: x - zα/2.
σ n
< µ< x + zα/2.
σ n
.
Si
observamos la tabla para un nivel de confianza del 95% para una prueba de dos colas, esto implica que la región de rechazo contendrá 2.5% del área a cada lado de la región de aceptación. Así que si P(Z
Así: 11.09 - 1.96(0.73/ 60 ) = 10.9052845.
Y 11.09 +
Así: 11.09 – 2.575(0.73/ 60 ) = 10.8473253.
Y 11.09 +
1.96(0.73/ 60 ) = 11.2747155 P(Z
30) La media y la desviación estándar típica de los diámetros de una muestra de 250 remaches fabricados por una compañía son 0.72642 pulgadas y 0.00058 pulgadas, respectivamente. Hallar los límites de confianza del 99%, 98%, 95%, y 90% para el diámetro medio de todos los remaches fabricados por la compañía. El intervalo se construye de forma tal que: x - zα/2.
σ n
< µ< x + zα/2.
σ n
. Si observamos la
tabla para un nivel de confianza del 99% para una prueba de dos colas, esto implica que la región de rechazo contendrá 0.5% del área a cada lado de la región de aceptación. Así que si P(Z
13
Para uso exclusivo de los estudiantes del Prof. Víctor Gómez
Circulación restringida
31) Si la desviación típica de la duración de los tubos (!?) de televisión se estima en 100 horas, ¿qué tamaño de muestra deberá tomarse para que sea del 95%, 90%, 99%, y 99.73% la confianza de que el error en la media de la duración estimada no exceda las 20 horas? Respuesta: Tenemos: Z*s/ n = Error en la media estimada. ⇒ n = (( Z * s ) / errorenlamedia ) 2 Para 95% n = (1.96 * 100 /(20)) 2 = Al menos 96. Para 90% n = (1.645 * 100 /(20)) 2 = Al menos 68. Para 99% n = ( 2.575 * 100 /(20)) 2 = Al menos 166. Para 99.73% n = (3 * 100 /(20)) 2 = Al menos 225. 32) Cinco medidas de tiempo de reacción de un individuo a un cierto estímulo fueron registradas como 0.28, 0.3, 0.27, 0.33, 0.31 segundos. Hallar los límites de confianza del (a)95% y (b)99% para el tiempo real de reacción. Respuesta: Si sacamos la media muestral del problema obtendremos que es igual a 0.298. La desviación estándar es igual a 0.02387467. s s < µ< x + tα/2(11gl). . El intervalo es: x - tα/2(11gl) . n n Si observamos la tabla para un nivel de confianza del 99% para una prueba de dos colas, esto implica que la región de rechazo contendrá 0.5% del área a cada lado de la región de aceptación, para 4 grados de libertad esto es: ⇒ t = 4.604. Así: El límite inferior es 0.2984.604*(0.02387467/ 5 ) = 0.24884274. El límite superior vendría dado por 0.2984.604*(0.02387467/ 5 ) = 0.34715726. Para una confianza del 95% tenemos: t = 2.776. El límite inferior es 0.2982.776*(0.02387467/ 5 ) = 0.26836043. El límite superior vendría dado por 0.2982.776*(0.02387467/ 5 ) = 0.32763957. 33) Una urna contiene una proporción desconocida de bolas rojas y blancas. Una muestra aleatoria de 60 bolas extraídas con remplazamiento de la urna, dio el 70% de bolas rojas. Hallar los límites de confianza del 95%, 99% y 99.73% para la proporción de bolas rojas en la urna. Dar el resultado utilizando la fórmula exacta y la aproximada. Respuesta: Tenemos que para un α/2 = 0.025 si buscamos en la tabla obtenemos Z = 1.96. Puesto que θ´ = 70/100 = 0.7 y n es igual a 60 tenemos: 0.7(0.3) 0.7(0.3) 0.7 -1.96 p θ p 0.7 + 1.96 = 0.7 - 0.11595516 p θ p 0.7 + 0.11595516 = 60 60 0.58404484 p θ p 0.81595516 Tenemos que para un α/2 = 0.005 si buscamos en la tabla obtenemos Z = 3.0 14
Para uso exclusivo de los estudiantes del Prof. Víctor Gómez
0.7(0.3) 0.7(0.3) p θ p 0.7 + 2.575 = 0.7 - 0.15233905 p θ p 0.7 + 0.15233905 60 60 = 0.54766095 p θ p 0.85233905. Tenemos que para un α/2 = 0.00135 si buscamos en la tabla obtenemos Z = 3.0 0.7(0.3) 0.7(0.3) p θ p 0.7 + 3 = 0.7 - 0.17748239 p θ p 0.7 + 0.17748239 = 0.7 –3 60 60 0.52251761 p θ p 0.87748239.
Circulación restringida
0.7 –2.575
b) Los límites generales para θ vienen dados por : Z 2α / 2 x(n − x ) Z 2 α / 2 x+ ± Zα / 2 + 2 n 4 Así que si sustituimos: 2 n + Z α /2 Para α/2 = 0.025 3.8416 42(60 − 42) 3.8416 42 + ± 1.96 + 2 60 4 = (0.57491053, 0.8010199) 60 + 3.8416 Para α/2 = 0.005 6.6306 42(60 − 42) 6.6306 42 + ± 2.575 + 2 60 4 = (0.53417313, 0.8260216) 60 + 6.6306 Para α/2 = 0.00135 9 42(60 − 42) 9 42 + ± 3 + 2 60 4 = (0.50636653, 0.84145956) 60 + 9 34) De dos grupos análogos de enfermos A y B formados de 50 y 100 individuos, respectivamente, al primero le fue dado un nuevo tipo de somnífero y al segundo un tipo convencional. Para los pacientes del primer grupo el número medio de horas sueño fue de 7.82 con una desviación típica de 0.24 horas. Para los del grupo B fueron 6.75 y 0.30 horas respectivamente. Hallar los límites de confianza del 95% y 99% para la diferencia del número medio de horas de sueño inducidas por los dos tipos de somnífero.
Respuesta: El intervalo solicitado es: ( x 1- x 2) - Zα/2
σ 12
+
σ 22
< µ1- µ2 < ( x 1- x 2) - Zα/2
n1 n2 Sustituyendo para Zα/2 = 1.96:
(7.82-6.75) –1.96
σ 12 n1
+
σ 22 n2
(0.24) 2 (0.3) 2 (0.24) 2 (0.3) 2 + < µ1- µ2 <(7.82-6.75) +1.96 + 50 100 50 100 15
Para uso exclusivo de los estudiantes del Prof. Víctor Gómez
1.07-0.08878605< µ1- µ2 <1.07+0.08878605 = 0.98121395< µ1- µ2 <1.15878605 Sustituyendo para Zα/2 = 2.575 (7.82-6.75) –2.575
(0.24) 2 (0.3) 2 (0.24) 2 (0.3) 2 + < µ1- µ2 <(7.82-6.75) +2.575 + 50 100 50 100
Circulación restringida
1.07-0.11664494< µ1- µ2 <1.07+0.11664494 = 0.95335506< µ1- µ2 <1.18664494 35) Una muestra de doscientos cerrojos producidos por una máquina mostró que 15 eran defectuosos, mientras que de 100 cerrojos de otra máquina 12 eran defectuosos. Hallar los límites de confianza del 95%, 99% y 99.73% para la diferencia de proporciones de cerrojos defectuosos de las dos máquinas. Estudiar los resultados obtenidos. Respuesta: El intervalo solicitado es: p1 q1 p 2 q 2 p1 q1 p 2 q 2 < µ1- µ2 < (p1-p2) - Zα/2 (p1-p2) - Zα/2 + + n1 n2 n1 n2 Sustituyendo para Zα/2 = 1.96: (0.12 * 0.88) (0.075 * 0.925) (0.12-0.075) – 1.96 < µ1 - µ2 < (0.12-0.075) + + 100 200 (0.12 * 0.88) (0.075 * 0.925) + 1.96 100 200 0.045-0.07341175< µ1- µ2 <0.045+0.07341175 = -0.02841175< µ1- µ2 <0.11841175 Sustituyendo para Zα/2 = 2.575 (0.12 * 0.88) (0.075 * 0.925) (0.12-0.075) – 2.575 < µ1 - µ2 < (0.12-0.075) + + 100 200 (0.12 * 0.88) (0.075 * 0.925) = + 2.575 100 200 0.045-0.09644656< µ1- µ2 <0.045+0.09644656 = -0.05144656< µ1- µ2 <0.14144656 Sustituyendo para Zα/2 = 3 (0.12 * 0.88) (0.075 * 0.925) (0.12-0.075) – 3 < µ1 - µ2 < (0.12-0.075) + 100 200 (0.12 * 0.88) (0.075 * 0.925) = + 3 100 200 0.045-0.11236492< µ1- µ2 <0.045+0.11236492 = -0.06736492< µ1- µ2 <0.15736492
+
36) La desviación típica de resistencia a rotura de 100 cables producidos por una compañía fue de 180 libras. Hallar los límites de confianza del 95%, 99% y 99.73% para la desviación típica de todos los cables producidos por la compañía Respuesta: El intervalo de confianza para varianzas con grandes muestras viene dado por: 16
Para uso exclusivo de los estudiantes del Prof. Víctor Gómez
s s p σ p s + zc 2n 2n Si sustituimos para α/2 = 0.025 : 180 180 180 − 1.96 p σ p 180 + 1.96 200 200 Los límites son: 155.053273 p σ p 204.946727
Circulación restringida
s − zc
Si sustituimos para α/2 = 0.025 : 180 180 180 − 1.96 p σ p 180 + 1.96 200 200 Los límites son: 147.2256 p σ p 212.7744 Si sustituimos para α/2 = 0.00135 : 180 180 180 − 3 p σ p 180 + 3 200 200 Los límites son: 141.816234 p σ p 218.183766 37) Las desviaciones típicas de los diámetros de los cojinetes de bolas producidos por dos máquinas son 0.042 cm y 0.035 cm respectivamente, basados en muestras de tamaño 10 cada una. Hallar los intervalos de confianza del 98% y 90% para la relación de las varianzas.
Respuesta: s12 σ 12 s12 1 ⋅ p p ⋅ Fα / 2 ( n2 −1,n1 −1) s 22 Fα / 2 ( n1 −1,n2 −1) σ 22 s 22 Si sustituimos en esta ecuación los datos para α/2 =0.01: σ 12 (0.042) 2 σ 12 (0.042) 2 1 ⋅ p p ⋅ 5 . 35 = 0.22429907 p p 7.704 (0.035) 2 5.35 σ 22 (0.035) 2 σ 22 Si sustituimos en esta ecuación los datos para α/2 =0.05: σ 12 (0.042) 2 σ 12 (0.042) 2 1 ⋅ p p ⋅ 3 . 18 = 0.26916 p p 4.5792 (0.035) 2 3.18 σ 22 (0.035) 2 σ 22 38) Una compañía tiene 500 cables. En una prueba de 40 cables seleccionados aleatoriamente resulta una media de la resistencia de rotura de 2400 libras y una desviación típica de 150 libras. a) ¿Cuáles son los límites de confianza del 95% y 99% para estimar la media de la resistencia de la rotura de los 460 cables restantes? b) ¿Con que grado de confianza podríamos decir que la media de la resistencia de la rotura de los 460 cables restantes es de 2400±35 libras? Respuesta: a) El intervalo se construye de forma tal que: x - zα/2.
σ n
< µ< x + zα/2.
σ n
. Si observamos la
tabla para un nivel de confianza del 95% para una prueba de dos colas, esto implica que la región de
17
Para uso exclusivo de los estudiantes del Prof. Víctor Gómez rechazo contendrá 2.5% del área a cada lado de la región de aceptación. Así que si P(Z
Así: 2400- 2.575(150/ 40 ) = 2338.92851.
Y 2400 + 2.575(150/ 40 ) =
2461.0715.
Circulación restringida
b) Es obvio que 35 = Zα/2(150/ 40 ) = (35 40 )/150 = 1.475729575 En un computador, este Zα/2 corresponde a 0.93 del área. Dado que α/2 = 0.7, esto implica que α = 14. Se está utilizando un nivel de confianza del 86%. 39) Una urna contiene bolas rojas y azules. Para ensayar la hipótesis de proporciones iguales de estos colores, se acuerda en tomar una muestra de 64 bolas con remplazamiento, anotando los colores extraídos y adoptando la siguiente regla de decisión: 1) se acepta la hipótesis si se extraen entre 28 y 36 bolas rojas, 2) se rechaza en caso contrario. Hallar la probabilidad de rechazar la hipótesis cuando en realidad es correcta Respuesta: Se nos está solicitando la probabilidad de cometer el error tipo I, o sea, el nivel de confianza para la prueba: Sabemos que los límites de confianza para la prueba son: 0.4375 y 0.5625 dado que se evalúa el que estén en la misma proporción (cada color está en proporción de 0.5 con respecto al total), tenemos que 0.0625 = Zα/2* 0.5(0.5) / 8 ⇒0.0625*(8)/0.5 = 1. Dado que en z=1 se tiene el α/2 = 0.15865526 ⇒ α = 0.31731052
40) Con respecto al problema anterior, ¿que regla de decisión se adoptaría si se quisiera que la probabilidad de rechazar la hipótesis nula siendo verdadera fuese a lo sumo de 0.01? ¿a que nivel de confianza se aceptaría la hipótesis? ¿Cuál es la regla de decisión si se adoptara un nivel de significación de 0.05? Respuesta: Se está indicando que el nivel de confianza, error tipo I, tiene que ser igual a 0.01 ⇒ Los límites serían: 0.5 ± 2.575* 0.5(0.5) / 8 = 0.5± 0.1609375. El nivel de Z para α/2 = 0.005. que corresponde a 2.575. la regla vendría dada por el rechazo de la hipótesis nula para una proporción de bolas rojas mayor o menor que los límites. La hipótesis se aceptaría aquí con un nivel del 99% de confianza. (1-α). Se está indicando que el nivel de confianza, error tipo I, tiene que ser igual a 0.05 ⇒ Los límites serían: 0.5 ± 1.96* 0.5(0.5) / 8 = 0.5± 0.1225. El nivel de Z para α/2 = 0.025. que corresponde a 1.96 la regla vendría dada por el rechazo de la hipótesis nula para una proporción de bolas rojas mayor o menor que los límites. 41) Un fabricante sostiene que al menos un 95% de los equipos que suministra a una fábrica está de acuerdo con las especificaciones necesarias. Un examen sobre una muestra de 200 de tales equipos reveló que 18 eran defectuosos. Ensayar la afirmación del fabricante al nivel de significación de a) 0.01, (b) 0.05. Respuesta: 18
Circulación restringida
Para uso exclusivo de los estudiantes del Prof. Víctor Gómez
Aplicando el criterio de decisión de la z tabulada contra la z calculada obtenemos: H0: p = 0.95 H1: p < 0.95 Hay que rechazar la hipótesis nula si Z calculada es Zc > 2.33, para 0.01 de significancia. 0.95 − 0.91 0.04 2.33 p = = 1.97666484 . Por tanto no se rechaza la hipótesis ⎛ 0.28618176 ⎞ (0.02023611) ⎟⎟ ⎜⎜ 200 ⎠ ⎝ nula. Hay que rechazar la hipótesis nula si Z calculada es Zc > 1.65, para 0.05 de significancia. 0.95 − 0.91 0.04 1.65 p = = 1.97666484 . Por tanto se rechaza la hipótesis ⎛ 0.28618176 ⎞ (0.02023611) ⎟⎟ ⎜⎜ 200 ⎠ ⎝ nula 42) La experiencia ha demostrado que la media de resistencia a la rotura de una determinada clase de hilo es de 9.72 onzas con una desviación típica de 1.4 onzas. Recientemente, una muestra de 36 piezas de hilo dieron una resistencia media de 8.93 onzas. ¿Se puede deducir al nivel de significación de 0.05 y 0.01 que el hilo ahora es peor? Respuesta: H0: µ = 9.72 H1: µ < 9.72 Hay que rechazar la hipótesis nula si Z calculada es Zc > 1.65, para 0.01 de significación. 9.27 − 8.93 0.79 1.65 tiene que ser f = = 3.38571429 . Por tanto se rechaza la (0.23333) ⎛ 1.4 ⎞ ⎜ ⎟ ⎝ 6 ⎠ hipótesis nula. Hay que rechazar la hipótesis nula si Z calculada es Zc > 2.33, para 0.05 de significación. 9.27 − 8.93 0.79 Por tanto se 2.33 tiene que ser f = = 3.38571429 . (0.23333) ⎛ 1.4 ⎞ ⎜ ⎟ ⎝ 6 ⎠ rechaza la hipótesis nula. Se puede concluir de aquí, que el hilo ahora es peor. 43) Una muestra de 100 bombillas de un fabricante A dio una duración media de 1190 horas y unas desviación típica de 90 horas. Una muestra de 75 bombillas de otro fabricante B dio una duración media de 1230 horas con una desviación típica de 120 horas. ¿Hay diferencias entre las duraciones medias de las bombillas de los dos fabricantes al nivel de significación del 0.05 y 0.01? Respuesta: H0: µ2-µ1 =0
H1: µ2- µ1 ≠0
19
Para uso exclusivo de los estudiantes del Prof. Víctor Gómez
El intervalo solicitado es:
σ 22
σ 12
+ < µ1- µ2 < ( x 2- x 1) + Zα/2 n2 n1 Sustituyendo para Zα/2 = 1.96:
( x 2- x 1) - Zα/2
(1230-1190) –1.96
σ 22 n2
+
σ 12 n1
(120) 2 (90) 2 (120) 2 (90) 2 + < µ1- µ2 <(1230-1190) +1.96 + 75 100 75 100
Circulación restringida
40-32.3845148< µ1- µ2 <40+32.3845148 = 7.61548518< µ1- µ2 <72.3845148. Se rechaza H0 Sustituyendo para Zα/2 = 2.575 (120) 2 (90) 2 (120) 2 (90) 2 (1230-1190) –2.575 + < µ1- µ2 <(1230-1190) +2.575 + 75 100 75 100 40-42.5459825< µ1- µ2 <40+42.5459825 = -2.54598248< µ1- µ2 <82.5459825 No ser puede rechazar H0 44) En el problema anterior, ensayar la hipótesis de que las bombillas del fabricante B sean mejores a las del fabricante A utilizando un nivel de significación del 0.05 y 0.01. Explique las diferencias entre esto y el ejercicio anterior. Se contradicen estos resultados con los del problema anterior. Respuesta: H0: µ2-µ1 > 0
H1: µ2- µ1≤ 0
El intervalo solicitado es:
σ 22
σ 12
+ < µ1- µ2 n2 n1 Sustituyendo para Zα = 1.65:
( x 2- x 1) - Z α
(1230-1190) –1.65
(120) 2 (90) 2 + < µ2- µ1 75 100
40-27.2624742< µ1- µ2 <40+27.2624742 = 12.7375258< µ1- µ2 No se puede rechazar H0 Sustituyendo para Zα = 2.33 (120) 2 (90) 2 (1230-1190) –2.33 + < µ1- µ2 75 100 40-38.4979181< µ1- µ2 = 1.50208187< µ1- µ2 No se puede rechazar H0 En este ejercicio se realiza una prueba unilateral para comprobar si hay suficiente evidencia estadística para afirmar que las bombillas del fabricante B son mejores que las de A. La respuesta nos dice que en el límite encontrado en ambas pruebas con las muestras, B 20
Para uso exclusivo de los estudiantes del Prof. Víctor Gómez
Circulación restringida
dura más en promedio que A. A otro nivel de significación más bajo es probable que la hipótesis deba ser rechazada. Para el ejercicio anterior se nos pedía por evidencia de que no había gran diferencia entre las medias. En el segundo caso, esta hipótesis apareció plausible, puesto que estaba dentro de la región de aceptación, no obstante a niveles más altos de significación, se comienza a rechazar la hipótesis. Ambas hipótesis tratan de problemas diferentes, y utilizan niveles de significación iguales, pero con diferentes tipos de pruebas (bilateral, unilateral). A demás, el haber utilizado otros niveles de significación hubiera modificado los resultados de diversas formas. 45) La duración media de las bombillas producidas por una compañía ha sido en el pasado de 1120 horas con una desviación típica de 125 horas. Una muestra de 8 bombillas de la producción actual dio una duración media de 1070 horas. Ensayar la hipótesis de que la duración media de las bombillas no ha cambiado, con los niveles de significación del 0.05% y 0.01%. Respuesta: H0: µ1-µ2 =0
H1: µ1-µ2 ≠0
Hay que rechazar la hipótesis nula si t calculada es tc > 2.365, o -tc < -2.365 para 0.05 de significación y 7 grados de libertad. 1120 − 1070 50 2.365 tiene que ser f = = 1.13137085 . Por tanto no se (44.19417) ⎛ 125 ⎞ ⎟ ⎜ ⎝ 8⎠ rechaza la hipótesis nula. Hay que rechazar la hipótesis nula si t calculada es ⎪tc⎪ > 3.499, para 0.01 de significación. 1120 − 1070 50 3.499 tiene que ser f = = 1.13137085. (44.19417) ⎛ 125 ⎞ ⎟ ⎜ ⎝ 8⎠ Por tanto no se puede rechazar la hipótesis nula. Hay suficiente evidencia estadística para aceptar que no ha existido un cambio en la calidad de las bombillas producidas. 46) Un experto en eficiencia mantiene que introduciendo un nuevo tipo de maquinaria en un proceso de producción se puede disminuir sustancialmente el tiempo de este. A causa de los costoso de el mantenimiento de estas máquinas resulta que a menos que el tiempo de producción se disminuya en un 8.0% la introducción de tales máquinas en el proceso de producción resulta antieconómico. En seis pruebas de este tipo se obtuvo un decrecimiento en el tiempo de producción de 8.4% con una desviación típica de 0.32%. Utilizando un nivel de significación del 0.01 y 0.05 ensayar la hipótesis de que las máquinas deben ser introducidas. Respuesta: Respuesta: H0: µ ≥ 8% 21
Para uso exclusivo de los estudiantes del Prof. Víctor Gómez H1: µ < 8%
Circulación restringida
a) Hay que rechazar la hipótesis nula si t calculada es ⎪tc⎪> 2.015, para 0.05 de significación y 5 grados de libertad. 8.4 − 8 0.4 2.015 tiene que ser f = = 3.06186218 . ⎛ 0.32 ⎞ (0.130639 ) ⎟ ⎜ ⎝ 6 ⎠ Por tanto no se puede rechazar la hipótesis nula. b) Hay que rechazar la hipótesis nula si t calculada es ⎪tc⎪ > 3.365, para 0.01 de significación. 8.4 − 8 0.4 3.365 tiene que ser f = = 3.06186218. ⎛ 0.32 ⎞ (0.130639 ) ⎟ ⎜ ⎝ 6 ⎠ Por tanto se rechaza la hipótesis nula. A este nivel de significación no deben introducirse la nueva maquinaria. 47) La desviación típica de resistencia a la rotura de ciertos cables producidos por una compañía viene dada por 240 libras. Después de introducir un cambio en el proceso de producción de estos cables, la resistencia a la rotura de una muestra de 8 cables dio una desviación típica de 300 libras. Investigar la significación del aparente incremento en la variabilidad, mediante un nivel de significación del 0.05 y 0.01. Respuesta: H0: σ = 240 H1: σ >240 El límite para varianzas en este caso, con una media muestral de 300 viene dado por:
(n − 1)s 2
Xα
2
= límite menor
( n −1 gl )
Tenemos que para α = 0.05, con 7 grados de libertad la ji-cuadrada nos da: 14.067. Si sustituimos: (7 )90000 = 211.626247 14.067 como podemos ver, 240 está dentro de la zona de aceptación. Por tanto no se puede rechazar la hipótesis nula.
Tenemos que para α = 0.01, con 7 grados de libertad la ji-cuadrada nos da: 18.475. Si sustituimos: (7 )90000 = 184.662 18.475 como podemos ver, 240 está dentro de la zona de aceptación. Por tanto no se puede rechazar la hipótesis nula. Podemos ver que según la muestra no existe significancia estadística para el cambio en la variabilidad.
22
Para uso exclusivo de los estudiantes del Prof. Víctor Gómez
48) En el problema 45 una muestra de 20 bombillas reveló una desviación típica en la duración de 150 horas. ¿concluiría que esto no es común? Explicar.
Circulación restringida
Respuesta: H0: σ = 125 H1: σ ≠ 125 El intervalo de confianza para varianzas viene dado por: (n − 1)s 2 p σ 2 p (n − 1)s 2 2 2 X α / 2 ( n −1gl ) X 1−α / 2 ( n −1gl ) Tenemos que para α = 0.05, con 19 gl, la ji-cuadrada nos da: 8.907 y 32.852. sustituimos: (19)(125) 2 p σ 2 p (19)(125) 2 32.852 8.907 2 Los límites son: 95.0617722 p σ p 182.566499
Si
Tenemos que para α = 0.01, con 19gl, la ji-cuadrada nos da: 6.844 y 38.582. Si sustituimos: (19)(125) 2 p σ 2 p (19 )(125) 2 38.582 6.844 2 Los límites son: 87.7191562 p σ p 208.272444 Como se pude observar, en ambos casos la desviación de la muestra cabe dentro de los límites, aún aunque se hicieran pruebas unilaterales. De aquí que se acepta la hipótesis nula. 49) Dos muestras consisten en 21 y 9 observaciones, tienen varianzas dadas por s12 =16 y s22 = 8 respectivamente. Ensayar la hipótesis de que la primera varianza poblacional es mayor que la de la segunda a un nivel de significación del 0.05 y 0.01. Respuesta: H0: σ12 - σ22 = 0 2 2 H1: σ1 - σ2 > 0 n1 S12 = s12 ( n − 1) 1
;
n2 21 S22 = s22 ( n − 1) = S12 = 16 ( 20 ) 2
;
9 S22 = 8 ( 8 ) ⇒ S12 = 5.25 ; S22 = 9
Así, tenemos que la F tiene 20 y 8 grados de libertad en el numerador y en el denominador Para α = 0.05 esto implica que nuestra Fα ( n1 −1,n2 −1) = 3.15 S12 5.25 = = 0.58.333 que es menor que la F tabulada, por tanto no se puede rechazar la 9 S 22 hipótesis nula. Para α = 0.01 esto implica que nuestra Fα ( n1 −1,n2 −1) = 5.36 F=
S12 5.25 F= 2 = = 0.58.333 que es menor que la F tabulada, por tanto no se puede rechazar la 9 S2 23
Para uso exclusivo de los estudiantes del Prof. Víctor Gómez
hipótesis nula.
Circulación restringida
50) Solucionar el problema anterior si las dos muestras consisten de 60 y 120 observaciones respectivamente. Respuesta: H0: σ12 - σ22 = 0 2 2 H1: σ1 - σ2 > 0 n1 n2 60 120 2 2 ( 2 2 ( ) ; S1 = s1 n − 1 S2 = s2 n − 1) = S12 = 16 ( 59 ) ; S22 = 8 ( 119 ) ⇒ S12 = 5.25 ; S22 = 9 1 2 Así, tenemos que la F tiene 59 y 119 grados de libertad en el numerador y en el denominador Para α = 0.05 esto implica que nuestra Fα ( n1 −1,n2 −1) = 1.753 mediante el computador. S12 = 2.01694915 que es mayor que la F tabulada, por tanto se rechaza la hipótesis nula. S 22 Para α = 0.01 esto implica que nuestra Fα ( n1 −1,n2 −1) = 1.958 mediante el computador. F=
S12 = 2.01694915 que es mayor que la F tabulada, por tanto se rechaza la S 22 hipótesis nula. F=
24