7.- Intervalo confidencial, Test de Hipótesis y Bondad de Ajuste
– Ejercicios Resueltos – Estimación por Intervalos Pruebas de Hipotesis Muestras Pareadas Bondad de ajuste de distribuciones discretas y continuas
7. Intervalo confidencial, Test de Hipótesis y Bondad de Ajuste – Ejercicios Resueltos ANÁLISIS ESTADÍSTICO
1. La Oficina de Planificación Familiar de la Municipalidad A desea determinar la proporción de familias con un ingreso familiar inferior a $ 200.000. En una muestra aleatoria de 90 familias 18 presentaron un ingreso familiar inferior a $ 200.000. 1.1) Estime con 98% de confianza la proporción de familias con un ingreso familiar inferior a $ 200.000 en la Municipalidad A. 1.2) ¿Qué tamaño muestral se requiere para asegurar con una confianza del 95% que el error en la estimación de la proporción de familias con ingreso inferior a $200.000 no excederá de 0,05? 1.1) Solución: Sean: 𝑥 = “Cantidad de familias con un ingreso familiar inferior a $200.000 en Municipalidad A” 𝑥 ~ 𝑁(𝜇; 𝜎 2 ) Debido a que el problema habla de proporción, debemos utilizar la siguiente fórmula para determinar el intervalo confidencial: 𝑝̂ 𝑞̂ 𝐼𝐶(𝑝)1−𝛼 = (𝑝̂ ± 𝑍1− 𝛼 √ ) 𝑛 2 18
Con: 1 − 𝛼 = 0,98 ; 𝑛 = 90 ; 𝑝̂ = 90 = 0,2 ; 𝑞̂ = 0,8 Nota: El valor de 𝑝̂ se calcula dividiendo la número de datos de la muestra que cumplen la característica que nos da el problema, en este caso, las familias con ingreso familiar inferior a $200.000, dividido por el tamaño de la muestra. Reemplazando, obtenemos: 0,2 ∙ 0,8 𝐼𝐶(𝑝)0,98 = (0,2 ± 𝑍0,99 √ ); 90
𝐶𝑜𝑛 𝑍0,99 = 2,33
0,2 ∙ 0,8 𝐼𝐶(𝑝)0,98 = 0,2 ± 2,33√ 90 Finalmente, el intervalo de confidencialidad queda dado por: 𝐼𝐶(𝑝)0,98 = [0,102; 0,298] Respuesta: El intervalo [0,102; 0,298] tiene un 98% de contener a la proporción de familias con un ingreso familiar inferior a $ 200.000 en la Municipalidad A. 1.2) Solución: El ejercicio nos otorga los siguientes datos: 1 − 𝛼 = 0,95; 𝑒 ≤ 0,05; 𝑛 = 90; 𝑝̂ =
18 90
= 0,2; 𝑞̂ = 0,8
Ya que estamos tratando con proporciones, utilizamos la fórmula de error está dada por: 𝑝̂ 𝑞̂ 𝑒 = 𝑍1− 𝛼 √ 𝑛 2
Página 134
Alejandro González Tapia – Ingeniería Civil en Minas
7. Intervalo confidencial, Test de Hipótesis y Bondad de Ajuste – Ejercicios Resueltos ANÁLISIS ESTADÍSTICO
Reemplazando: 0,2 ∙ 0,8 0,05 ≥ 𝑍0,975 √ 𝑛
→
√𝑛 ≥
1,96 √0,2 ∙ 0,8 → 𝑛 ≥ 245,86 ≈ 246 0,05
Respuesta: Para asegurar que el error en la estimación de la proporción de familias con ingreso inferior a $200.000, no exceda a 0,05, el tamaño de la muestra debe ser igual a 246, considerando una confianza del 95%. 2.- Se realizan estudios sobre la contaminación producida por descargas de aguas residuales, en cuerpos fluviales cordilleranos, para medir si estos cumplen con la norma establecida por el decreto 90/2000, que establece niveles de concentración de Plomo de a lo más 0.02 mg/l. En una muestra aleatoria de tamaño 20, de volúmenes de agua de 50 ml. cada uno, obtenidas en días distintos, se encontró un nivel medio de concentración de plomo de 0,28 mg/l, con una desviación estándar de 0,01 mg/l. Bajo el supuesto de que las observaciones provienen de una población normal, estime el nivel medio de concentración de plomo en estas aguas, con una confianza del 90%. Analice los valores estimados en función de la norma. 2) Solución: Sea: 𝑥 = “Concentración de Plomo en cuerpos fluviales cordilleranos”; 𝑥 ~ 𝑁(𝜇 ; 𝜎 2 ) Del enunciado del ejercicio se desprenden los siguientes datos: 𝑛 = 20
𝑥̅ = 0,28
𝑆𝑥 = 0,01
1 − 𝛼 = 0,90
Debido a que desconocemos la varianza de la distribución, utilizaremos la siguiente fórmula para obtener el intervalo de confianza: 𝑠 𝐼𝐶 (𝜇)1− 𝛼 = (𝑥̅ ± 𝑡(𝑛− 1;1− 𝛼) ∙ ) 2 √𝑛 Reemplazando: 0,01 𝐼𝐶 (𝜇)0,90 = (0,28 ± 𝑡(19; 0,95) ∙ ) ; 𝐶𝑜𝑛 𝑡(19; 0,95) = 1,7291 √20 0,01 𝐼𝐶 (𝜇)0,90 = (0,28 ± 1,7291 ∙ ) √20 Finalmente, el intervalo de confidencialidad queda dado por: 𝐼𝐶 (𝜇)0,90 = [0,2761; 0,2839] Respuesta: El intervalo [0,2761; 0,2839] tiene un 90% de contener el nivel medio de concentración de plomo en las aguas residuales, en cuerpos fluviales cordilleranos.
Alejandro González Tapia – Ingeniería Civil en Minas
Página 135
7. Intervalo confidencial, Test de Hipótesis y Bondad de Ajuste – Ejercicios Resueltos ANÁLISIS ESTADÍSTICO
3.- Se está estudiando la duración de ciertos procesos productivos y se toma una muestra aleatoria, de tamaño 10. Se define como "Proceso Corto” cuando su duración es menor que 5 minutos, los datos obtenidos, en minutos, fueron: 3
5
8
6
10
5,5
4
4,2
4,5
2
3.1) Se pide estimar por intervalo de confianza del 98% la proporción de Procesos Cortos. 3.2) ¿Cuál debería ser el tamaño de la muestra si la proporción estimada disminuyen en un 10% y utilizamos un 95% de confianza manteniendo el mismo error probable antes de la modificación? 3.3) Estimar la varianza de dichos tiempos con un nivel de confianza del 99%. 3.4) Si se realiza un ajuste tecnológico en el proceso de fabricación, el que reduce los tiempos en un 15% ¿Cuál sería la estimación de la varianza con un 97% de confianza? 3.1) Solución: Sea:
𝑥 = “Muestra del tiempo de duración de ciertos procesos productivos” 𝑥 ~ 𝑁(𝜇; 𝜎 2 )
Debido a que el problema nos habla de proporción, debemos utilizar la siguiente fórmula para determinar el intervalo confidencial: 𝑝̂ 𝑞̂ 𝐼𝐶(𝑝)1−𝛼 = (𝑝̂ ± 𝑍1− 𝛼 √ ) 𝑛 2 Con: 1 − 𝛼 = 0,98 ; 𝑛 = 10 ; 𝑝̂ =
5 10
= 0,5 ; 𝑞̂ = 0,5
Reemplazando, obtenemos: 0,5 ∙ 0,5 𝐼𝐶(𝑝)0,98 = (0,5 ± 𝑍0,99 √ ); 10
𝐶𝑜𝑛 𝑍0,99 = 2,33
0,5 ∙ 0,5 𝐼𝐶(𝑝)0,98 = 0,5 ± 2,33√ 10 Finalmente, el intervalo de confidencialidad queda dado por: 𝐼𝐶(𝑝)0,98 = [0,1316; 0,86848] Respuesta: Este intervalo tiene un 98% de contener a la verdadera proporción de “Procesos cortos” 3.2) Solución: Lo primero que debemos hacer en este ítem es determinar una nueva variable, como se ve a continuación: 𝑝′ = "Proporción con Procesos Cortos disminuida en un 10%” 𝑝̂′ = 0,9 ∙ 𝑝̂ = 0,9 ∙ 0,5 = 0,45 En seguida, calculamos el error probable de p que se mantiene, con la siguiente fórmula: 𝑝̂ 𝑞̂ 0,5 ∙ 0,5 0,5 ∙ 0,5 𝑒 = 𝑍1− 𝛼 ∙ √ = 𝑍0,99 ∙ √ = 2,33 ∙ √ = 0,3684 𝑛 10 10 2
Página 136
Alejandro González Tapia – Ingeniería Civil en Minas
7. Intervalo confidencial, Test de Hipótesis y Bondad de Ajuste – Ejercicios Resueltos ANÁLISIS ESTADÍSTICO
Luego de esto, ya tenemos lo necesario para determinar el tamaño de la muestra, lo que se realiza despejando la fórmula que sigue: 𝑒=𝑍
𝛼 1− 2
̂ ̂ √𝑝′ 𝑞′ 𝑛
(1,96)2 (0,45)(0,55) 0,45 ∙ 0,55 √ → 0,3684 = 1,96 → 𝑛= = 7,005 ≈ 8 (0,3684)2 𝑛
̂ = 0,45; 𝑞′ ̂ = 0,55; 𝑍0,975 = 1,96 𝐶𝑜𝑛: 1 − 𝛼 = 0,95; 𝑒 = 0,3684 ; 𝑝′ Respuesta: El tamaño de la muestra debe ser 8, si la proporción disminuye en un 10% y se mantiene el error probable antes de la modificación, con un 95% de confianza. 3.3) Solución: Para empezar calculamos la varianza muestral, la que determina con la siguiente fórmula: (∑ 𝑥 )2
2
(52,2) 𝑖 ∑ 𝑥𝑖2 − 322,14 − 𝑛 𝑥 √ 10 𝑆𝑥 = √ = = 2,3489 𝑛𝑥 − 1 9
Debido a que el problema hace referencia a la varianza, el intervalo confidencial está dado de la siguiente forma: 𝐼𝐶 (𝜎 2 )1−𝛼 = (
(𝑛 − 1)𝑆𝑥 2 2
,
𝛼 (𝑛−1; 1− ) 2
(𝑛 − 1)𝑆𝑥 2 2
)
𝛼 (𝑛−1; ) 2
Con: 𝑛 = 10; 𝑆𝑥 = 2,3489; 1 − 𝛼 = 0,99 Reemplazando: 9 ∙ (2,3489)2 9 ∙ (2,3489)2 9 ∙ (2,3489)2 9 ∙ (2,3489)2 𝐼𝐶 (𝜎 2 )0,99 = ( 2 , 2 )=( , ) 23,589 1,735 (9; 0,995) (9; 0,005) 𝐼𝐶 (𝜎 2 )0,99 = [2,1050; 28,6202] Respuesta: Existe un 99% de que el intervalo [2,1050; 28,6202] contenga a la varianza poblacional de los procesos productivos. 3.4) Solución: Sea:
𝑦 = “Muestra 𝑥 reducida en un 15%”
→
𝑦 = 0,85𝑥
Por propiedades determinamos el valor de la desviación estándar de y, la que se encuentra dada por: 𝑆𝑦 = 0,85 𝑆𝑥
→
𝑆𝑦 = 0,85 ∙ 2,3489 = 1,9966
Después procedemos a definir el intervalo confidencial como se ve a continuación: 𝐼𝐶 (𝜎 2 )1−𝛼 = (
(𝑛 − 1)𝑆𝑦 2 2
𝛼 (𝑛−1; 1− ) 2
,
(𝑛 − 1)𝑆𝑦 2 2
)
𝛼 (𝑛−1; ) 2
Con: 𝑛 = 10; 𝑆𝑦 = 1,9966; 1 − 𝛼 = 0,97
Alejandro González Tapia – Ingeniería Civil en Minas
Página 137
7. Intervalo confidencial, Test de Hipótesis y Bondad de Ajuste – Ejercicios Resueltos ANÁLISIS ESTADÍSTICO
Ya que no poseemos los valores de la distribución determinarlos:
2
, tenemos que interpolar para poder
0,99 − 0,975 21,666 − 19,023 = 0,985 − 0,975 𝑥 − 19,023 0,015 2,643 = 0,01 𝑥 − 19,023 2,643 ∙ 0,01 𝑥= + 19,023 0,015 𝑥 = 20,785 2
(9; 0,985)
= 20,785
0,025 − 0,01 2,700 − 2,088 = 0,015 − 0,01 𝑥 − 2,088 0,015 0,612 = 0,005 𝑥 − 2,088 0,612 ∙ 0,005 𝑥= + 2,088 0,015 𝑥 = 2,292 2
(9; 0,015)
= 2,292
Finalmente, reemplazando obtenemos el intervalo confidencial: 9 ∙ (1,9966)2 9 ∙ (1,9966)2 9 ∙ (1,9966)2 9 ∙ (1,9966)2 𝐼𝐶 (𝜎 2 )0,97 = ( 2 , 2 )=( , ) 20,785 2,292 (9; 0,985) (9; 0,015) 𝐼𝐶 (𝜎 2 )0,97 = [1,7261; 15,6534] Respuesta: Existe una probabilidad del 97% de que el intervalo [1,7261; 15,6534] contenga a la varianza poblacional de los procesos productivos luego de reducir sus tiempos en un 15%. 4.- En cualquier proceso de enlatado, el fabricante pierde dinero si las latas contienen más o menos de la cantidad que se especifica en la etiqueta. Por esta razón se vigila constantemente la cantidad de producto enlatado. Considere una compañía que produce un cemento de hule de secado rápido en latas de aluminio etiquetadas con un peso de 32 onzas. Se toma una muestra de 34 latas, las cuales se pesan, obteniendo un peso promedio de 31,18 onzas y una desviación estándar de 0,645 onzas. Considere que el peso de las latas se distribuye normal. 4.1) A un inspector de control de calidad le interesa probar si la varianza del peso de las latas es superior a 0,4 (onzas)2. Utilice una significación de 5%. 4.2) ¿Cuál debe ser el mínimo tamaño de muestra que se debe utilizar si se desea estimar el peso real promedio de las latas de cemento de hule? Se está dispuesto a cometer un error máximo de 0,2 onzas con una confianza del 95%. Sabiendo por estudios anteriores que la varianza del peso de las latas es 0,4096 (onzas) 2
Página 138
Alejandro González Tapia – Ingeniería Civil en Minas
7. Intervalo confidencial, Test de Hipótesis y Bondad de Ajuste – Ejercicios Resueltos ANÁLISIS ESTADÍSTICO
𝑥 = “Cantidad de cemento en una lata, en onzas” 𝑥 ~ 𝑁(𝜇; 𝜎 2 ) Con: 𝑛 = 34; 𝑠 = 0,645; 𝛼 = 0,05; 𝑛 − 1
4.1) Solución: Sea:
Las hipótesis que nos interesan contrastar son: 𝐻0 : 𝜎 2 = 0,4 𝐻1 : 𝜎 2 > 0,4 Entonces, el estadístico de prueba es: 𝑇=
(𝑛 − 1)𝑠 2 𝜎0 2
→
𝑇=
(34 − 1)(0,645)2 = 34,3221 0,4
El Punto Crítico, se determina de la siguiente forma: 2
(𝑛−1; 1− 𝛼)
=
2
(33; 0,95)
= 47,400
La Región Crítica: 𝑅𝐶 = {𝑥 | 𝑇 >
2
(𝑛−1; 1− 𝛼) }
→ 𝑅𝐶 = {𝑥 | 𝑇 > 47,400}
Respuesta: Como 𝑇 ∈ 𝑅𝐶, no se rechaza la hipótesis nula, es decir, la varianza de la cantidad de cemento en una lata no es superior a 0,4 (onzas) 2. 4.2) Solución: El problema nos otorga la siguiente información: 𝑒𝑚á𝑥 = 0,2;
1 − 𝛼 = 0,95;
𝜎 2 = 0,4096 ;
𝜎 = √0,4096 = 0,64
Debido a que estamos trabajando con el peso real promedio de las latas de cemento de hule, y que conocemos la varianza (𝜎 2 ), la fórmula del error está dada por: 𝐸𝑟𝑟𝑜𝑟 = 𝑒 = 𝑧1− 𝛼 2
𝜎 √𝑛
Reemplazando: 0,2 ≥ 𝑧1− 0,25
0,64 √𝑛
→
√𝑛 ≥
1,96 ∙ 0,64 0,2
→
𝑛 ≥ 39,33 ≈ 40
Respuesta: El mínimo tamaño de la muestra que se debe utilizar si se desea estimar el peso real promedio de las latas de cemento de hule, es igual a 40. 5.- Se requiere que la resistencia a la ruptura de una fibra sea menos de 150 psi. Se sabe que la desviación estándar de la resistencia a la ruptura es 3 psi. En una muestra aleatoria de 25 trozos de fibra se obtiene una resistencia media a la ruptura de 148 psi y una desviación estándar de 2,8 psi. 5.1) ¿Puede considerarse aceptable este tipo de fibra? Use α = 0,05. 5.2) Determine el tamaño de la muestra necesario para estimar la resistencia media de este tipo de fibra con un nivel de confianza del 95% y un error de estimación de 0,5 psi.
Alejandro González Tapia – Ingeniería Civil en Minas
Página 139
7. Intervalo confidencial, Test de Hipótesis y Bondad de Ajuste – Ejercicios Resueltos ANÁLISIS ESTADÍSTICO
5.1) Solución: Sea:
𝑥 = “Resistencia a la ruptura de una fibra” 𝑥 ~ 𝑁(𝜇; 𝜎 2 = 32 ) Con: 𝑛 = 25; 𝑥̅ = 148; 𝑠 = 2,8; 𝛼 = 0,05; 𝜇0 = 150
Las hipótesis que nos interesan contrastar son: 𝐻0 : 𝜇 = 150 𝐻1 : 𝜇 < 150 Entonces, como conocemos la varianza, el estadístico de prueba es: 𝑥̅ − 𝜇0 148 − 150 ̅̅̅̅ 𝑇= 𝜎 → 𝑇= = −3, 33 3 √𝑛
√25
El Punto Crítico, se determina de la siguiente forma: 𝑧(1− 𝛼) = 𝑧0,95 = 1,645 La Región Crítica: 𝑅𝐶 = {𝑥 | 𝑇 < −𝑍(1− 𝛼) } → 𝑅𝐶 = {𝑥 | 𝑇 < −1,645} Respuesta: Debido a que 𝑇 ∈ 𝑅𝐶, hay suficiente información para rechazar la hipótesis nula, es decir, es aceptable este tipo de fibra, con un 5% de significación. 5.2) Solución: El ejercicio proporciona los siguientes datos: 𝑒 = 0,5;
1 − 𝛼 = 0,95;
𝜎=3
Como consecuencia que estamos trabajando con la resistencia media de este tipo de fibra, y que conocemos la varianza (𝜎 2 ), la fórmula del error está dada por: 𝐸𝑟𝑟𝑜𝑟 = 𝑒 = 𝑍(1− 𝛼) ∙ 2
𝜎 √𝑛
Reemplazando: 0,5 = 𝑍(0,975) ∙
3 √𝑛
→
√𝑛 =
1,96 ∙ 3 0,5
→
𝑛 = 138,3 ≈ 139
Respuesta: El tamaño de la muestra necesario para estimar la resistencia media de este tipo de fibra con un nivel de confianza del 95% y un error de estimación de 0,5 psi, es 139. 6.- La velocidad de transmisión de un modem se mide en baudios que se define como el número de bits por segundo que puede transmitir. Debido a factores técnicos, la rapidez de transmisión real varía de un archivo a otro. Una empresa está en proceso de adquirir un modem, el cual fue ofrecido por dos proveedores (A y B). Para decidir la compra se transmiten seis archivos, elegidos al azar, utilizando ambos modem y registrando las velocidades de transmisión (en miles de baudios) Archivo Proveedor A Proveedor B
1 10,75 10,31
2 10,86 10,95
3 11,18 10,33
4 10,47 9,20
5 11,36 11,36
6 10,47 9,74
Suponiendo que la velocidad de transmisión se distribuye Normal Página 140
Alejandro González Tapia – Ingeniería Civil en Minas
7. Intervalo confidencial, Test de Hipótesis y Bondad de Ajuste – Ejercicios Resueltos ANÁLISIS ESTADÍSTICO
6.1.- La revista PC Reports, afirma que en pruebas hechas por su equipo se ha encontrado que el modem del proveedor A es significativamente más rápido que el del proveedor B, Con = 0,01, ¿Los resultados obtenidos por la empresa confirman lo planteado por la revista? 6.2.- Pruebe si la varianza de la velocidad de transmisión del modem del proveedor A es de 0,52 (miles de baudios)2 con nivel de significación 0,05. 𝐷 ~ 𝑁(𝜇; 𝜎 2 )
6.1) Solución: Sea: 𝐷 = 𝑃𝑟𝑜𝑣𝑒𝑒𝑑𝑜𝑟𝐴 − 𝑃𝑟𝑜𝑣𝑒𝑒𝑑𝑜𝑟𝐵 Archivo Proveedor A Proveedor B D
1 10,75 10,31 0,44
2 10,86 10,95 -0,09 𝑛=6
3 11,18 10,33 0,85
̅ = 0,5333 𝐷
4 10,47 9,20 1,27
5 11,36 11,36 0
6 10,47 9,74 0,73
𝑆𝐷 = 0,5221
Las hipótesis que nos interesan contrastar son: 𝐻0 : 𝜇𝐷 = 0 𝐻1 : 𝜇𝐷 > 0 Entonces, como desconocemos la varianza, el estadístico de prueba es: 𝑇=
̅ − 𝜇0 𝐷 𝑆𝐷
→
𝑇=
0,5333 − 0
√𝑛
0,5221
= 2,502
√6
La Región Crítica (𝛼 = 0,01) 𝑅𝐶 = {𝑥 | 𝑇 > 𝑡(𝑛−1; 1− 𝛼) } → 𝑅𝐶 = {𝑥 | 𝑇 > 𝑡(5; 0,99) } → 𝑅𝐶 = {𝑥 | 𝑇 > 3,3649} Respuesta: Debido a que 𝑇 ∈ 𝑅𝐶, no existe suficiente información para rechazar la hipótesis nula, es decir, los resultados obtenidos por empresa no confirman lo planteado por la revista, con 𝛼 = 0,01.
6.2) Solución: Las hipótesis que nos interesa contrastar son: H0 : σ2 = 0,52 𝐻1 : 𝜎 2 ≠ 0,52 Con:
𝑛=6
𝑆𝐴 = 0,3654
Entonces como conocemos la desviación estándar, el estadístico de prueba es: 𝑇=
(𝑛 − 1) 𝑆𝐴 2 𝜎2
→
𝑇=
(6 − 1) ∙ 0,36542 = 1,2838 0,52
Región crítica (𝛼 = 0,05): 𝑅𝐶 = {𝑥 | 𝑇 < 𝜒2 (𝑛−1; 𝛼) ó 𝑇 > 𝜒2 (𝑛−1; 1− 𝛼) } → 𝑅𝐶 = {𝑥 | 𝑇 < 𝜒2 (5; 0,025) ó 𝑇 > 𝜒2 (5; 0,975) } 2
2
𝑅𝐶 = {𝑥 | 𝑇 < 0,830 ó 𝑇 > 12,833}
Alejandro González Tapia – Ingeniería Civil en Minas
Página 141
7. Intervalo confidencial, Test de Hipótesis y Bondad de Ajuste – Ejercicios Resueltos ANÁLISIS ESTADÍSTICO
Respuesta: Debido a que 𝑇 ∈ 𝑅𝐶, no existe suficiente información para rechazar la hipótesis nula, es decir, la varianza de la velocidad de transmisión del modem del proveedor A es de 0,52 (miles de baudios)2, con un 5% de significación. 7.- En un estudio realizado en el Departamento de Silvicultura y Fauna de una universidad del extremo sur del país, se examinó la influencia de un fármaco sobre los niveles de andrógenos en la sangre de huemules salvajes. Se capturaron 15 ejemplares y se les inyectó el fármaco, extrayéndoles una muestra de sangre cinco minutos después de la captura, y luego se les extrajo una segunda muestra después de 30 minutos, posteriormente se liberaron los ejemplares. Se midieron los niveles de andrógenos en la sangre de cada muestra y los datos aparecen en la siguiente tabla (Suponga distribución normal) 7.1) Se pide ensayar con 6% de significación si el nivel de andrógenos se altera después de 30 minutos de encierro. 7.2) Ensayar con un 5% de significación si la proporción de animales que presentaron nivel de andrógenos superior a 15,00 después del encierro, supera al 25% Número de ejemplares 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
Nivel Primero (5 minutos) 2,76 5,18 2,68 3,05 4,10 7,05 6,60 4,79 7,39 7,30 11,78 3,90 26,00 67,48 17,04
Nivel Segundo (30 minutos) 7,02 3,10 5,44 3,99 5,21 10,26 13,91 18,53 7,91 4,85 11,10 3,74 94,03 94,03 41,70
7.1) Solución: Lo primero será definir la variable a utilizar, la cual se muestra a continuación: 𝐷 = “Diferencia entre el Nivel Primero y Nivel Segundo”
𝐷 ~ 𝑁(𝜇; 𝜎 2 )
Ya que nos preguntan si el nivel de andrógenos se altera, nuestras hipótesis a contrastar son: 𝐻0 : 𝜇𝐷 = 0 𝐻1 : 𝜇𝐷 ≠ 0 En seguida calculamos 𝐷, como se muestra a continuación:
Página 142
Alejandro González Tapia – Ingeniería Civil en Minas
7. Intervalo confidencial, Test de Hipótesis y Bondad de Ajuste – Ejercicios Resueltos ANÁLISIS ESTADÍSTICO
Número de ejemplares 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
Nivel Primero (5 minutos) 2,76 5,18 2,68 3,05 4,10 7,05 6,60 4,79 7,39 7,30 11,78 3,90 26,00 67,48 17,04
Nivel Segundo (30 minutos) 7,02 3,10 5,44 3,99 5,21 10,26 13,91 18,53 7,91 4,85 11,10 3,74 94,03 94,03 41,70
El punto crítico está dado por:
𝐷 (Diferencia) - 4,26 2,08 - 2,76 - 0,94 - 1,11 - 3,21 - 7,31 - 13,74 - 0,52 2,45 0,68 0,16 - 68,03 - 26,55 - 24,66
Luego, de la cuarta columna se calcula la media y desviación estándar de 𝐷: ̅ = −9,848 𝐷 𝑆𝐷 = 18,4736 En seguida, como desconocemos la varianza, el estadístico de prueba es: 𝑇=
̅ − 𝜇0 𝐷 𝑆𝐷 √𝑛
Reemplazando: 𝑇=
−9,848 − 0 18,4736
= −2,065
√15
𝑡(𝑛−1;1− 𝛼) = 𝑡(14;0,97) 2
Ya que este valor no se encuentra explícitamente en la tabla, tenemos que interpolar: 0,975 − 0,95 2,1448 − 1,7613 = 0,97 − 0,95 𝑥 − 1,7613 0,025 0,3835 = 0,02 𝑥 − 1,7613 𝑥=
0,3835 ∙ 0,02 + 1,7613 0,025 𝑥 = 2,068 𝑡(14;0,97) = 2,068
La Región Crítica: 𝑅𝐶 = { 𝑥 | 𝑇 < −𝑡(14;0,97) ó 𝑇 > 𝑡(14;0,97) }
→ 𝑅𝐶 = { 𝑥 | 𝑇 < −2,068 ó 𝑇 > 2,068}
Respuesta: Debido a que 𝑇 ∈ 𝑅𝐶, no hay suficiente información para rechazar la hipótesis nula, es decir, el nivel de andrógenos no se altera después de 30 minutos de encierro, con un 6% de significación. 7.2) Solución: De la muestra que nos expone el ejercicio, podemos calcular el estimador 𝑝̂ , ya que cuatro de los quince ejemplares presentan niveles de andrógenos superiores a 15,00 después del encierro. Las hipótesis que interesan contraponer son: 𝐻0 : 𝑝 = 0,25 𝐻1 : 𝑝 > 0,25
Alejandro González Tapia – Ingeniería Civil en Minas
Página 143
7. Intervalo confidencial, Test de Hipótesis y Bondad de Ajuste – Ejercicios Resueltos ANÁLISIS ESTADÍSTICO
Luego, para determinar el estadístico de prueba, tenemos:
𝑇=
𝑝̂ − 𝑝0 √
𝑝0 𝑞0
4
→
𝑇=
√
𝑛
La Región Crítica (Con 𝛼 = 0,05): 𝑅𝐶 = { 𝑥 | 𝑇 > 𝑍1− 𝛼 } →
15
− 0,25
= 0,1491
0,25∙0,75 15
𝑅𝐶 = { 𝑥 | 𝑇 > 𝑍0,95 }
→
𝑅𝐶 = { 𝑥 | 𝑇 > 1,645}
Respuesta: Debido a que 𝑇 ∈ 𝑅𝐶, no hay suficiente información para rechazar la hipótesis nula, es decir, la proporción de animales que presentaron nivel de andrógenos superior a 15,00 después de encierro, no supera al 25%, con un 5% de significación. 8.- En la manufactura de semiconductores, es común el uso de un proceso de grabado por remojo químico para eliminar el silicio de la parte posterior de las obleas antes de la metalización. La rapidez de grabado es una característica importante en este proceso y se sabe que es una variable aleatoria con distribución normal. Se compararon dos soluciones de grabado diferentes, usando dos muestras aleatorias de obleas, una para cada solución. La rapidez de grabado (milipulgadas/minuto), observada fue la siguiente: Solución 1 Solución 2
9,9 9,4 9,3 9,6 10,2 10,6 10,3 10,0 10,3 10,1 10,2 10,6 10,7 10,4 10,5 10,0 10,2 10,7 10,4 10,3
8.1) Apoyan los datos la afirmación de que la rapidez media de grabados es la misma para ambas soluciones, use α = 0,05 8.2) Estime con un nivel de confianza del 90% la rapidez media de grabado para la solución 1. 8.1) Solución: Sea: 𝑥 = “Rapidez de grabado de la Solución 1, en milipulgadas/minuto”; 𝑥 ~ 𝑁(𝜇; 𝜎 2 ) 𝑦 = “Rapidez de grabado de la Solución 2, en milipulgadas/minuto”; 𝑦 ~ 𝑁(𝜇; 𝜎 2 ) Lo primero será determinar el tamaño de la muestra, la media y desviación estándar de ambas muestras: 𝑛𝑥 = 10 𝑥̅ = 9,97 𝑆𝑥 = 0,4218 𝑛𝑦 = 10 𝑦̅ = 10,4 𝑆𝑦 = 0,2309 En seguida, debemos contrastar las siguientes hipótesis, para determinar si estas muestras poseen varianzas poblacionales iguales o diferentes: 𝐻0 : 𝜎𝑥2 = 𝜎𝑦2 𝐻1 : 𝜎𝑥2 ≠ 𝜎𝑦2 Luego, para determinar el estadístico de prueba, tenemos: 𝑇=
Página 144
𝑆𝑥2 𝑆𝑦2
→
𝑇=
0,42182 = 3,3371 0,23092
Alejandro González Tapia – Ingeniería Civil en Minas
7. Intervalo confidencial, Test de Hipótesis y Bondad de Ajuste – Ejercicios Resueltos ANÁLISIS ESTADÍSTICO
Los puntos críticos están dados por (𝛼 = 0,05): 𝐹(𝑛
𝛼 2
𝑥 − 1; 𝑛𝑦 − 1; )
1
1 = 0,248 𝐹(9; 9; 0,975) 4,026 = 𝐹(9; 9; 0,975) = 4,026
= 𝐹(9; 9; 0,05) =
𝐹(𝑛
𝑥 −1; 𝑛𝑦 −1;
𝛼 2
1− )
La Región Crítica: 𝑅𝐶 = { 𝑥 | 𝑇 < 𝐹(9; 9; 0,05) ó 𝑇 > 𝐹(9; 9; 0,95) }
=
𝑅𝐶 = { 𝑥 | 𝑇 < 0,248 ó 𝑇 > 4,026 }
→
Resultado: Debido a que 𝑇 ∈ 𝑅𝐶, no hay información suficiente para rechazar la hipótesis nula, es decir, las varianzas poblacionales de ambas soluciones son iguales. Continuando con el desarrollo del ejercicio, procedemos a contrastar las siguientes hipótesis: 𝐻0 : 𝜇𝑥 = 𝜇𝑦 𝐻1 : 𝜇𝑥 ≠ 𝜇𝑦 Luego, para determinar el estadístico de prueba, tenemos: 𝑦̅ − 𝑥̅
𝑇=
𝑆𝑝 √
1 𝑛𝑦
+
1
(𝑛𝑥 − 1)𝑆𝑥 2 + (𝑛𝑦 − 1)𝑆𝑦 2 𝐶𝑜𝑛 𝑆𝑝 = √ 𝑛𝑥 + 𝑛𝑦 − 2
𝑛𝑥
Reemplazando, obtenemos: (10 − 1) ∙ 0,42182 + (10 − 1) ∙ 0,23092 𝑆𝑝 = √ = 0,34 10 + 10 − 2 10,4 − 9,97
𝑇=
1
= 2,83 1
0,34 ∙ √10 + 10 Finalmente, la Región Crítica: 𝑅𝐶 = { 𝑥 | 𝑇 > 𝑡(𝑛
𝛼 𝑝 ; 1− 2 )
}
𝑅𝐶 = { 𝑥 | 𝑇 > 𝑡(18; 0,975) }
𝐶𝑜𝑛 𝑛𝑝 = 𝑛𝑥 + 𝑛𝑦 − 2 →
𝑅𝐶 = { 𝑥 | 𝑇 > 2,1009}
Respuesta: Como 𝑇 ∈ 𝑅𝐶, en conclusión hay información suficiente para rechazar la hipótesis nula, es decir, la rapidez media de grabado es la misma, con α = 0,05. 8.2) Solución: Debido a que el problema nos pregunta por la media de grabado para la Solución 1, debemos utilizar la siguiente fórmula para determinar el intervalo confidencial: 𝐼𝐶(𝜇)1−𝛼 = (𝑥̅ ± 𝑡(𝑛−1; 1− 𝛼) ∙
𝑠𝑥
) √𝑛 Con: 1 − 𝛼 = 0,90; 𝑛 = 10 ; 𝑠𝑥 = 0,4218 ; 𝑥̅ = 9,97 2
Reemplazando, obtenemos: 𝐼𝐶(𝜇)0,90 = (9,97 ± 𝑡(9; 0,95) ∙
0,4218 √10
);
𝐶𝑜𝑛 𝑡(9; 0,95) = 1,8331
𝐼𝐶(𝜇)0,90 = (9,97 ± 𝑡(9; 0,95) ∙
Alejandro González Tapia – Ingeniería Civil en Minas
0,4218 √10
)
Página 145
7. Intervalo confidencial, Test de Hipótesis y Bondad de Ajuste – Ejercicios Resueltos ANÁLISIS ESTADÍSTICO
Finalmente, el intervalo de confidencialidad queda dado por: 𝐼𝐶(𝜇)0,90 = [9,7255; 10,2145] Respuesta: El intervalo [9,7255; 10,2145] tiene un 90% de contener la rapidez media de grabado para la solución 1. 9.- La resistencia mínima especificada, transcurridos 28 días, de un hormigón para pavimento de 20 cm de espesor es de 250 kg/cm². En dosificaciones con materiales provenientes de la cantera A y B, las resistencias se distribuyen aproximadamente normal. Se realizan 16 ensayos con materiales de la cantera A y 32 ensayos de la cantera B, obteniendo al término del tiempo especificado, en pruebas de roturas a la compresión, las siguientes resistencias: Resistencia Cantera A 𝒏𝒊
200 - 218 2
218 - 236 4
236 - 254 5
254 - 272 4
272 - 290 1
Resistencias Cantera B 218 220 225 230 235 237 241 245 269 270 270 272 272 274 276 278 250 254 255 258 260 262 264 268 280 285 289 290 290 290 295 300 Ayuda: ∑ 𝒙 = 𝟖𝟒𝟐𝟐; ∑ 𝒙𝟐 = 𝟐𝟐𝟑𝟐𝟒𝟓𝟒 9.1) El ingeniero sospecha que la resistencia media de las dosificaciones proveniente de la cantera A está muy por debajo de la resistencia media de aquellas dosificaciones provenientes de la cantera B. ¿Qué concluiría usted respecto a la sospecha del Ingeniero, con α = 0,01? 9.2) Con nivel de significación del 2,5%, ¿Puede usted afirmar que las dosificaciones cuyo material proviene de la cantera B que está bajo la resistencia mínima especificada es de un 20%? 9.1) Solución: Sea:
𝐴 = “Resistencia de los Materiales provenientes de la cantera A”; 𝐴 ~ 𝑁(𝜇 ; 𝜎 2 ) 𝐵 = “Resistencia de los Materiales provenientes de la cantera B”; 𝐵 ~ 𝑁(𝜇 ; 𝜎 2 )
Lo primero será determinar el tamaño de la muestra, la media y desviación estándar de ambas muestras: Para A:
Para B:
[𝑥𝑖−1 − 𝑥𝑖 ] [200 − 218] [218 − 236] [236 − 254] [254 − 272] [272 − 290] 𝐴̅ = 242,75 ; Página 146
𝑥𝑖 209 227 245 263 281
𝑛𝑖 2 4 5 4 1 𝑛𝐴 = 16
𝐵̅ =
∑𝑥 𝑛𝐵
=
8422 = 263,1875 32 (∑ 𝑥 )2
𝑖 2 ∑ 𝑥𝑖2 − 𝑛𝐵 𝑥̅ 2 √∑ 𝑥𝑖 − 𝑛𝐵 𝑆𝐵 = √ = 𝑛𝐵 − 1 𝑛𝐵 − 1
2232454 − 𝑆𝐵 = √ 31
84222 32
= 22,6394
𝑆𝐴 = 20,6543 Alejandro González Tapia – Ingeniería Civil en Minas
7. Intervalo confidencial, Test de Hipótesis y Bondad de Ajuste – Ejercicios Resueltos ANÁLISIS ESTADÍSTICO
En seguida, debemos contrastar las siguientes hipótesis, para determinar si estas muestras poseen varianzas poblacionales iguales o diferentes: 𝐻0 : 𝜎𝐴2 = 𝜎𝐵2 𝐻1 : 𝜎𝐴2 ≠ 𝜎𝐵2 Luego, para determinar el estadístico de prueba, tenemos: 𝑇=
𝑆𝐵2 𝑆𝐴2
→
𝑇=
22,63942 = 1,2015 20,65432
Los puntos críticos están dados por (𝛼 = 0,01): 𝐹(𝑛
𝐵 − 1;
𝛼 𝑛𝐴 − 1; ) 2
1 = 0,3327 𝐹(15; 31; 0,995) 𝐹(15; 30; 0,995) 3,0057 = 𝐹(31; 15; 0,995) ≈ 𝐹(30; 15; 0,995) = 3,6867
= 𝐹(31; 15; 0,005) =
𝐹(𝑛
𝐵 − 1;
𝛼 2
𝑛𝐴 − 1; 1− )
1
≈
La Región Crítica: 𝑅𝐶 = { 𝑥 | 𝑇 < 𝐹(31; 15; 0,005) ó 𝑇 > 𝐹(31; 15; 0,995) }
→
1
=
𝑅𝐶 = { 𝑥 | 𝑇 < 0,3327 ó 𝑇 > 3,6867 }
Resultado: Debido a que 𝑇 ∈ 𝑅𝐶, no hay información suficiente para rechazar la hipótesis nula, es decir, las varianzas poblacionales de ambas muestras son iguales. Continuando con el desarrollo del ejercicio, procedemos a contrastar las siguientes hipótesis: 𝐻0 : 𝜇𝐴 = 𝜇𝐵 𝐻1 : 𝜇𝐴 < 𝜇𝐵 Luego, para determinar el estadístico de prueba, tenemos: 𝐴̅ − 𝐵̅
𝑇=
1
1
𝑆𝑝 √𝑛 + 𝑛 𝐴
(𝑛𝐴 − 1)𝑆𝐴 2 + (𝑛𝐵 − 1)𝑆𝐵 2 𝐶𝑜𝑛 𝑆𝑝 = √ 𝑛𝐴 + 𝑛𝐵 − 2
𝐵
Reemplazando, obtenemos: (16 − 1) ∙ 20,65432 + (32 − 1) ∙ 22,63942 𝑆𝑝 = √ = 22,0118 16 + 32 − 2 𝑇=
242,75 − 263,1875 1
= −3,0324
1
22,0118 ∙ √16 + 32 Finalmente, la Región Crítica: 𝑅𝐶 = { 𝑥 | 𝑇 < 𝑡(𝑛𝑝 ; 1− 𝛼) } 𝑅𝐶 = { 𝑥 | 𝑇 < −𝑡(46; 0,99) }
𝐶𝑜𝑛 𝑛𝑝 = 𝑛𝐴 + 𝑛𝐵 − 2 = 46 →
𝑅𝐶 = { 𝑥 | 𝑇 < −2,4102}
Respuesta: Como 𝑇 ∈ 𝑅𝐶, en conclusión hay información suficiente para rechazar la hipótesis nula, es decir, se concluye que lo sospechado por el Ingeniero es real, o sea, la resistencia media de A está muy debajo de la resistencia media de B.
Alejandro González Tapia – Ingeniería Civil en Minas
Página 147
7. Intervalo confidencial, Test de Hipótesis y Bondad de Ajuste – Ejercicios Resueltos ANÁLISIS ESTADÍSTICO
9.2) Solución: Sabemos que la resistencia mínima especificada es 250 kg/cm², por ende, podemos calcular el estimador 𝑝̂ , o sea, la proporción de la muestra de los materiales provenientes de la cantera B, que cumplen la condición de ser inferiores a la resistencia mínima especificada. Lo que llevándolo a números es igual a 𝑝̂ = 8/32 Las hipótesis a contrastar son: 𝐻0 : 𝑃𝐵 = 0,20 𝐻1 : 𝑃𝐵 ≠ 0,20 Luego, para determinar el estadístico de prueba, tenemos: 𝑝̂ − 𝑝0 8 𝑇= 𝐶𝑜𝑛: 𝑝̂ = = 0,25; 𝑛 = 32 → 32 𝑝0 𝑞0 √ 𝑛
𝑇=
0,25 − 0,20 √
= 0,7071
0,20∙0,80 32
La Región Crítica (Con 𝛼 = 0,025): 𝑅𝐶 = { 𝑥 | 𝑇 < −𝑍1− 𝛼 } 2
→
𝑅𝐶 = { 𝑥 | 𝑇 < −𝑍0,9875 }
→
𝑅𝐶 = { 𝑥 | 𝑇 < −2,24}
Respuesta: Debido a que 𝑇 ∈ 𝑅𝐶, no hay suficiente información para rechazar la hipótesis nula, es decir, las dosificaciones que están bajo la resistencia mínima, en la cantera B, representan el 20%. 10.- La utilización de materiales sintéticos tales como nylon, poliéster y látex en la producción de telas, ha provocado debates acerca de la calidad y resistencia de estas fibras comparadas con las fibras naturales. Un fabricante de una nueva fibra sintética asegura que en promedio su producto (Y) posee una mayor resistencia a la tracción que las fibras naturales (X). Para tal efecto se seleccionan al azar 10 fibras sintéticas y 12 fibras naturales, a cada una de las cuales se les midió la resistencia a la tracción. Los resultados muestrales obtenidos se dan a continuación: ̅ = 𝟐𝟕𝟐 𝑲𝒈 ̅ = 𝟑𝟑𝟓 𝑲𝒈 𝒙 ; 𝑺𝟐𝒙 = 𝟏𝟔𝟑𝟔 𝑲𝒈𝟐 ; 𝒚 ; 𝑺𝟐𝒚 = 𝟏𝟖𝟗𝟐 𝑲𝒈𝟐 ¿Confirman estos datos lo asegurado por el fabricante? Fundamente adecuadamente su respuesta y use 𝜶 = 𝟎, 𝟎𝟓? 10) Solución: Sean: 𝑥 = “Resistencia a la tracción de las fibras naturales, en Kg”; 𝑛𝒙 = 12 𝑦 = “Resistencia a la tracción de la nueva fibra sintética, en Kg”; 𝑛𝒚 = 10 𝑥 ~ 𝑁(𝜇 ; 𝜎 2 )
𝑦 ~ 𝑁 (𝜇 ; 𝜎 2 )
En seguida, debemos contrastar las siguientes hipótesis, para determinar si estas muestras poseen varianzas poblacionales iguales o diferentes: 𝐻0 : 𝜎𝑥2 = 𝜎𝑦2 𝐻1 : 𝜎𝑥2 ≠ 𝜎𝑦2 Luego, para determinar el estadístico de prueba, tenemos: 𝑆𝑦2 𝑇= 2 𝑆𝑥
Página 148
→
𝑇=
1892 = 1,1565 1636
Alejandro González Tapia – Ingeniería Civil en Minas
7. Intervalo confidencial, Test de Hipótesis y Bondad de Ajuste – Ejercicios Resueltos ANÁLISIS ESTADÍSTICO
Los puntos críticos están dados por (𝛼 = 0,05): 𝐹(𝑛
𝛼 2
𝑦 − 1; 𝑛𝑥 − 1; )
1
1 = 0,255 𝐹(11; 9; 0,975) 3,9117 = 𝐹(9; 11; 0,975) = 3,9639
= 𝐹(9; 11; 0,025) =
𝐹(𝑛
𝛼 𝑦 − 1; 𝑛𝑥 − 1; 1− 2 )
La Región Crítica: 𝑅𝐶 = { 𝑥 | 𝑇 < 𝐹(9; 11; 0,025) ó 𝑇 > 𝐹(9; 11; 0,975) }
→
=
𝑅𝐶 = { 𝑥 | 𝑇 < 0,255 ó 𝑇 > 3,9639 }
Resultado: Debido a que 𝑇 ∈ 𝑅𝐶, no hay información suficiente para rechazar la hipótesis nula, es decir, las varianzas poblacionales de ambas soluciones son iguales. Continuando con el desarrollo del ejercicio, procedemos a contrastar las siguientes hipótesis: 𝐻0 : 𝜇𝑥 = 𝜇𝑦 𝐻1 : 𝜇𝑥 < 𝜇𝑦 Luego, para determinar el estadístico de prueba, tenemos la siguiente expresión: 𝑥̅ − 𝑦̅
𝑇=
1
1
𝑆𝑝 √𝑛 + 𝑛 𝑥
(𝑛𝑥 − 1)𝑆𝑥 2 + (𝑛𝑦 − 1)𝑆𝑦 2 √ 𝐶𝑜𝑛 𝑆𝑝 = 𝑛𝑥 + 𝑛𝑦 − 2
𝑦
Reemplazando, obtenemos: (12 − 1) ∙ 1636 + (10 − 1) ∙ 1892 𝑆𝑝 = √ = 41,8473 12 + 10 − 2 𝑇=
272 − 335 41,8473 ∙ √
1 12
+
= −3,5460 1 10
Finalmente, la Región Crítica (Con 𝛼 = 0,05): 𝑅𝐶 = { 𝑥 | 𝑇 < 𝑡(𝑛𝑝 ; 1− 𝛼) } 𝑅𝐶 = { 𝑥 | 𝑇 < −𝑡(20; 0,95) }
𝐶𝑜𝑛 𝑛𝑝 = 𝑛𝑥 + 𝑛𝑦 − 2 = 20 →
𝑅𝐶 = { 𝑥 | 𝑇 < −1,7247}
Respuesta: Como 𝑇 ∈ 𝑅𝐶, en conclusión existe suficiente información para rechazar la hipótesis nula con un 10% de significación, es decir, podríamos concluir que el fabricante estaría en lo cierto, ya que la nueva fibra sintética posee mayor resistencia a la tracción que las fibras naturales. 11.- En una planta industrial se quiere determinar cuál de dos tipos de fuentes de energía, gas o electricidad, produce más energía útil a menor costo. Una medida de la producción económica de energía, llamada “inversión de planta por quad suministrado”, se calcula dividiendo la cantidad de dinero (en dólares) invertida por la planta en la fuente de energía en cuestión y la cantidad suministrada de energía (en quads, miles de billones de unidades térmicas británicas [BTU]). Cuanto menor sea este cuociente, menos pagará una planta
Alejandro González Tapia – Ingeniería Civil en Minas
Página 149
7. Intervalo confidencial, Test de Hipótesis y Bondad de Ajuste – Ejercicios Resueltos ANÁLISIS ESTADÍSTICO
industrial por la energía suministrada. Se seleccionaron muestras aleatorias de 11 plantas que utilizan electricidad y 16 plantas que utilizan gas y se calculó la inversión de la planta por quad para cada una. Los datos se presentan en la tabla:
ELECTRICIDAD
GAS
14,15
9,57
7,76
9,72
5,35
8,46
7,78
4,38
9,28
8,60
17,13
16,66
10,14
9,18
10,11
8,45
7,91
11,03
10,70
15,05
18,22
12,50
9,40
9,67
9,21
15,3
12,1
Asumiendo normalidad en la inversión por quad suministrado 11.1) ¿Se podría afirmar que existe diferencia significativa entre los promedios de inversión de planta por quad suministrado para estos dos tipos de fuentes de energía, con un nivel de significación de 0,10? 11.2) Estime con una confianza del 99% la proporción de plantas de gas que invierten más de 10 [BTU]. 11.1) Solución: Sean: 𝑥 = “Inversión de una planta eléctrica por quad suministrado”; 𝑥 ~ 𝑁(𝜇; 𝜎 2 ) 𝑦 = “Inversión de una planta a gas por quad suministrado”; 𝑦 ~ 𝑁(𝜇; 𝜎 2 ) Lo primero será determinar el tamaño de la muestra, la media y desviación estándar de cada muestra: 𝑛𝑥 = 11 𝑥̅ = 9,289 𝑆𝑥 = 3,616 𝑛𝑦 = 16 𝑦̅ = 11,602 𝑆𝑦 = 3,112 En seguida, debemos contrastar las siguientes hipótesis, para determinar si estas muestras poseen varianzas poblacionales iguales o diferentes: 𝐻0 : 𝜎𝑥2 = 𝜎𝑦2 𝐻1 : 𝜎𝑥2 ≠ 𝜎𝑦2 Luego, para determinar el estadístico de prueba, tenemos: 𝑇=
𝑆𝑥2 𝑆𝑦2
→
𝑇=
3,6162 = 1,35 3,1122
Los puntos críticos están dados por (𝛼 = 0,10): 𝐹(𝑛
𝛼 2
𝑥 −1; 𝑛𝑦 −1; )
𝐹(𝑛
1 = 0,351 𝐹(15; 10; 0,95) 2,8450 = 𝐹(10; 15; 0,95) = 2,5437
= 𝐹(10; 15; 0,05) =
𝛼 𝑥 −1; 𝑛𝑦 −1; 1− 2 )
La Región Crítica: 𝑅𝐶 = { 𝑥 | 𝑇 < 𝐹(10; 15; 0,05) ó 𝑇 > 𝐹(10; 15; 0,95) }
1
→
=
𝑅𝐶 = { 𝑥 | 𝑇 < 0,351 ó 𝑇 > 2,5437 }
Resultado: Debido a que 𝑇 ∈ 𝑅𝐶, no hay información suficiente para rechazar la hipótesis nula, es decir, las varianzas poblacionales de ambas soluciones son iguales.
Página 150
Alejandro González Tapia – Ingeniería Civil en Minas
7. Intervalo confidencial, Test de Hipótesis y Bondad de Ajuste – Ejercicios Resueltos ANÁLISIS ESTADÍSTICO
Continuando con el desarrollo del ejercicio, tenemos que contrastar las siguientes hipótesis: 𝐻0 : 𝜇𝑥 = 𝜇𝑦 𝐻1 : 𝜇𝑥 ≠ 𝜇𝑦 Luego, para determinar el estadístico de prueba, tenemos la siguiente expresión: 𝑥̅ − 𝑦̅
𝑇=
1
1
𝑆𝑝 √𝑛 + 𝑛 𝑥
(𝑛𝑥 − 1)𝑆𝑥 2 + (𝑛𝑦 − 1)𝑆𝑦 2 𝐶𝑜𝑛 𝑆𝑝 = √ 𝑛𝑥 + 𝑛𝑦 − 2
𝑦
Reemplazando, obtenemos: (11 − 1) ∙ 3,6162 + (16 − 1) ∙ 3,1122 𝑆𝑝 = √ = 3,323 11 + 16 − 2 𝑇=
9,289 − 11,602 1
= −1,777
1
3,323 ∙ √11 + 16 Finalmente, la Región Crítica (Con 𝛼 = 0,10): 𝑅𝐶 = { 𝑥 | 𝑇 < −𝑡(𝑛𝑝 ; 1− 𝛼) }
𝐶𝑜𝑛 𝑛𝑝 = 𝑛𝑥 + 𝑛𝑦 − 2 = 25
2
𝑅𝐶 = { 𝑥 | 𝑇 < −𝑡(25; 0,95) }
→
𝑅𝐶 = { 𝑥 | 𝑇 < −1,7081}
Respuesta: Como 𝑇 ∈ 𝑅𝐶, en conclusión existe suficiente información para rechazar la hipótesis nula con un 10% de significación, es decir, se puede afirmar que existe una diferencia significativa en el promedio de inversión de planta por quad suministrado por estos dos tipos de energía. 11.2) Solución: Lo primero, será determinar el estimador 𝑝̂ , el que corresponde al número de plantas a gas que invierten más de 10 quad, en la muestra, dividido en el tamaño de la muestra, que llevado a los números es igual a 10⁄16. Luego, el intervalo confidencial está dado por: 𝑝̂ 𝑞̂ 𝐼𝐶(𝑝)1−𝛼 = (𝑝̂ ± 𝑍1− 𝛼 √ ) 𝑛𝑦 2 10
Con: 1 − 𝛼 = 0,99; 𝑛𝑦 = 16 ; 𝑝̂ = 16 = 0,625; 𝑞̂ = 0,375 Reemplazando, obtenemos: 𝐼𝐶(𝑝)0,99 = (0,625 ± 𝑍0,995 √
0,625 ∙ 0,375 ); 16
𝐶𝑜𝑛 𝑍0,995 = 2,575
0,625 ∙ 0,375 𝐼𝐶(𝑝)0,99 = (0,625 ± 2,575 √ ) 16 Finalmente, el intervalo de confidencialidad queda dado por: 𝐼𝐶 (𝑝)0,90 = [0,313; 0,937] Respuesta: El intervalo [0,313; 0,937] tiene un 90% de probabilidad de contener a la proporción de plantas de gas que invierten más de 10 [BTU]. Alejandro González Tapia – Ingeniería Civil en Minas
Página 151
7. Intervalo confidencial, Test de Hipótesis y Bondad de Ajuste – Ejercicios Resueltos ANÁLISIS ESTADÍSTICO
12.- El PM10 (material particulado respirable), son partículas de diámetro menor o igual a 10 micrones. Por su tamaño, el PM10 es capaz de ingresar al sistema respiratorio del ser humano; mientras menor es el diámetro de estas partículas mayor es el potencial daño en la salud; es por esta razón, que diariamente se monitorea la calidad del aire, 3 C M AQI (μg/m ) calculando un Índice de calidad de Aire (AQI por sus siglas en 0 – 50 2 5 Inglés). Un AQI de 100 para PM10, corresponde a un nivel de 150 50 – 100 9 5 PM10 en microgramos por metro cúbico (promediado en 24 100 – 150 11 11 horas). 150 – 200 15 13 Se toman muestras aleatorias independientes del AQI, de tamaño 40, correspondientes a dos comunas C y M, del Gran Santiago, en 200 – 300 3 4 meses de invierno, obteniendo la siguiente información: 300 – 550 0 2 Suponiendo válidos los supuestos necesarios: 12.1) Estime el mínimo tamaño de muestra que se debe considerar para estimar el AQI 3
promedio en la comuna M, considerando un error de estimación de a lo más 18 μg/m y una confianza de 95%, si de estudios previos se sabe que la desviación estándar del 3
AQI es de 110 μg/m . 12.2) ¿Es posible asegurar que el porcentaje de episodios en que el AQI es de al menos 200 (episodio dañino para la salud) es superior al 4% en la comuna C, con 5% nivel de significación? 12.3) ¿Es posible, afirmar que no existen diferencias significativas en el índice de calidad medio del aire en ambas comunas en estudio, con un nivel de significación del 1%? 12.1) Solución: Sean: 𝐶 = “Cantidad de material particulado en la comuna C”; 𝐶 ~ 𝑁 (𝜇; 𝜎 2 ) 𝑀 = “Cantidad de material particulado en la comuna M”; 𝑀 ~ 𝑁(𝜇; 𝜎 2 ) El enunciado del problema nos otorga la siguiente información: 𝑒 ≤ 18;
1 − 𝛼 = 0,95;
𝜎𝑀 = 110
Ya que el conocemos la varianza, y estamos estimando el AQI promedio en la comuna, la fórmula del error está dada por: 𝜎𝑀 𝑒 = 𝑍1− 𝛼 ∙ 2 √𝑛 Reemplazando: 110 110 18 ≥ 𝑍0,975 ∙ → → 𝑛 ≥ 143,46 ≈ 144 √𝑛 ≥ 1,96 ∙ 18 √𝑛 Respuesta: El tamaño de la muestra debe ser como mínimo de 144. 12.2) Solución: Con los datos entregados por la tabla, podemos determinar el estimador 𝑝̂ , que corresponde a la cantidad de episodios de la muestra, en que el AQI es de al menos 200, dividido en el tamaño de la muestra, lo que llevado a los números es igual a 3⁄40 .
Página 152
Alejandro González Tapia – Ingeniería Civil en Minas
7. Intervalo confidencial, Test de Hipótesis y Bondad de Ajuste – Ejercicios Resueltos ANÁLISIS ESTADÍSTICO
Luego, las hipótesis a contrastar son: 𝐻0 : 𝑝 = 0,04 𝐻1 : 𝑝 > 0,04 El estimador de prueba a utilizar es: 𝑝̂ − 𝑝0 3 0,075 − 0,04 𝑇= 𝐶𝑜𝑛: 𝑝̂ = = 0,075; 𝑛 = 40 → 𝑇 = = 1,1296 40 𝑝0 𝑞0 0,04∙0,96 √ √ 𝑛 40 La Región Crítica (Con 𝛼 = 0,05): 𝑅𝐶 = { 𝑥 | 𝑇 < −𝑍1− 𝛼 } →
𝑅𝐶 = { 𝑥 | 𝑇 < −𝑍0,95 }
→
𝑅𝐶 = { 𝑥 | 𝑇 < −1,645}
Respuesta: Como 𝑇 ∈ 𝑅𝐶, en conclusión no existe suficiente información para rechazar la hipótesis nula con un 5% de significación, es decir, se puede afirmar que el porcentaje o proporción de episodios en que el AQI es de al menos 200, es equivalente o menor al 4% en la Comuna C. 12.3) Solución: Para este ítem lo primero que debemos hacer es calcular el tamaño de la muestra, la media y desviación estándar, de cada muestra: 3
AQI (μg/m ) 0 – 50 50 – 100 100 – 150 150 – 200 200 – 300 300 – 550
𝑥𝑖
C
M
25 75 125 175 250 425
2 9 11 15 3 0 𝑛𝐶 = 40
5 5 11 13 4 2 𝑛𝑀 = 40
𝑛𝐶 = 40 ̅ 𝐶 = 136,875 𝑆𝐶 = 55,7546 𝑛𝑀 = 40 ̅ = 150 𝑀 𝑆𝑀 = 89,5144
En seguida, debemos contrastar las siguientes hipótesis, para determinar si estas muestras poseen varianzas poblacionales iguales o diferentes: 2 𝐻0 : 𝜎𝐶2 = 𝜎𝑀 2 𝐻1 : 𝜎𝐶2 ≠ 𝜎𝑀 Luego, para determinar el estadístico de prueba, tenemos: 2 𝑆𝑀 𝑇= 2 𝑆𝐶
→
𝑇=
89,51442 = 2,5777 55,75462
Los puntos críticos están dados por (𝛼 = 0,01): 𝐹(𝑛
𝛼 𝑀 − 1; 𝑛𝐶 − 1; 2 )
𝐹(𝑛
1 = 0,435 𝐹(39; 39; 0,995) 𝐹(40; 40; 0,995) 2,2958 = 𝐹(39; 39; 0,995) ≈ 𝐹(40; 40; 0,995) = 2,2958
= 𝐹(39; 39; 0,005) =
𝑀 − 1; 𝑛𝐶 −
𝛼 2
1; 1− )
1
≈
1
=
La Región Crítica: 𝑅𝐶 = { 𝑥 | 𝑇 < 𝐹(39; 39; 0,005) ó 𝑇 > 𝐹(39; 39; 0,995) }
Alejandro González Tapia – Ingeniería Civil en Minas
→
𝑅𝐶 = { 𝑥 | 𝑇 < 0,435 ó 𝑇 > 2,2958 }
Página 153
7. Intervalo confidencial, Test de Hipótesis y Bondad de Ajuste – Ejercicios Resueltos ANÁLISIS ESTADÍSTICO
Resultado: Debido a que 𝑇 ∈ 𝑅𝐶, hay información suficiente para rechazar la hipótesis nula, es decir, las varianzas poblacionales de ambas soluciones son diferentes. Continuando con el desarrollo del ejercicio, tenemos que contrastar las siguientes hipótesis: 𝐻0 : 𝜇𝑀 = 𝜇𝐶 𝐻1 : 𝜇𝑀 ≠ 𝜇𝐶 Luego, para determinar el estadístico de prueba, tenemos la siguiente expresión: ̅ − 𝐶̅ 𝑀
𝑇= √
𝑆𝑀 2 𝑛𝑀
+
→
𝑆𝑐 2
150 − 136,875
𝑇= √
𝑛𝐶
55,75462 40
+
89,51442
= 0,7871
40
Después para calcular los grados de libertad tenemos la siguiente fórmula: ( 𝑣=
𝑆𝑀 2 𝑛𝑀
+
2 𝑆 2 ( 𝑀 ) 𝑛𝑀
𝑛𝑀 −1
𝑆𝑐 2 𝑛𝐶
+
2
)
(
2 𝑆 2 ( 𝑐 ) 𝑛𝐶
=
55,75462
+
40
2 55,75462 ( ) 40
𝑛𝐶 −1
40−1
89,51442
+
40
2
)
89,51442 ( ) 40
2
= 65,3016 ≈ 65
40−1
Finalmente, la Región Crítica (Con 𝛼 = 0,01): 𝑅𝐶 = { 𝑥 | 𝑇 < −𝑡(𝑣; 1− 𝛼) }
→
2
𝑅𝐶 = { 𝑥 | 𝑇 < −𝑡(65; 0,995) }
→
𝑅𝐶 = { 𝑥 | 𝑇 < −2,6536}
Respuesta: Como 𝑇 ∈ 𝑅𝐶, en conclusión no existe suficiente información para rechazar la hipótesis nula con un 1% de significación, es decir, se puede afirmar que no existen diferencias significativas en el índice de calidad medio del aire en ambas comunas en estudio. 13.- Para comparar la capacidad de producción de calor del carbón proveniente de dos minas, se obtuvo una muestra aleatoria de 35 especímenes de carbón de la mina 1 y otra muestra de 25 especímenes de carbón de la mina 2, obteniendo los siguientes resultados de la capacidad de producción de calor, en miles de millones de calorías por tonelada: Mina 1 Capacidad calórica promedio
8,23
Desviación estándar capacidad calórica
0,1255
Especímenes con capacidad mayor a 8,3 mM de cal/ton.
10
Mina 2 𝟐𝟓
𝟐𝟓
∑ 𝒙𝒊 𝟐 = 𝟏𝟔𝟖𝟎, 𝟕𝟔
∑ 𝒙𝒊 = 𝟐𝟎𝟒, 𝟖𝟓
𝒊=𝟏
𝒊=𝟏
5
Suponiendo que las poblaciones muestreadas tienen distribución normal: 13.1) Estime con 95% de confianza la proporción de carbón con capacidad calórica de a lo más 8,3 miles de millones de calorías en la mina 1. 13.2) Que tamaño de muestra sería necesario para estimar la capacidad calórica promedio del carbón de la mina 2 con 98% de confianza y un error en la estimación que no supere
Página 154
Alejandro González Tapia – Ingeniería Civil en Minas
7. Intervalo confidencial, Test de Hipótesis y Bondad de Ajuste – Ejercicios Resueltos ANÁLISIS ESTADÍSTICO
los 0,1 miles de millones de calorías por tonelada, si en estudios anteriores se obtuvo una varianza de la capacidad calórica igual a 0,09 (miles de millones de calorías por tonelada)2? 13.3) Verifique, con 5% de significación, si la capacidad calórica promedio del carbón de la mina 1 es superior a la capacidad calórica promedio del carbón de la mina 2. 13.4) Se afirma que la capacidad calórica del carbón de la mina 1 es de a lo menos 8,3 miles de millones de calorías por tonelada. ¿Qué opina usted con 5% nivel de significación? 13.1) Solución: Sea: 𝑥 = “Capacidad de producción de calor del carbón proveniente de la mina 1” 𝑦 = “Capacidad de producción de calor del carbón proveniente de la mina 2” 𝑥 ~ 𝑁(𝜇; 𝜎 2 )
𝑦 ~ 𝑁(𝜇; 𝜎 2 )
Ya que el problema habla de proporción, debemos utilizar la siguiente fórmula para determinar el intervalo confidencial: 𝑝̂ 𝑞̂ 𝐼𝐶(𝑝)1−𝛼 = (𝑝̂ ± 𝑍1− 𝛼 √ ) 𝑛𝑥 2 Con: 1 − 𝛼 = 0,95 ; 𝑛𝑥 = 35 ; 𝑝̂ =
25 35
; 𝑞̂ =
10 35
Reemplazando, obtenemos: 25 10
𝐼𝐶(𝑝)0,95
∙ 25 = ( ± 𝑍0,975 √35 35) ; 35 35
𝐶𝑜𝑛 𝑍0,975 = 1,96 25 10
𝐼𝐶(𝑝)0,95
∙ 25 = ( ± 1,96√35 35) 35 35
Finalmente, el intervalo de confidencialidad queda dado por: 𝐼𝐶(𝑝)0,98 = [0,5846; 0,840] Respuesta: El intervalo [0,5846; 0,840] tiene un 98% de probabilidad de contener a la proporción de carbón con capacidad calórica de a lo más 8,3 miles de millones de calorías en la mina 1. 13.2) Solución: El problema nos proporciona la siguiente información: 1 − 𝛼 = 0,98; 𝑒 ≤ 0,1; 𝜎 2 = 0,09; 𝜎 = 0,3 Ya que estamos tratando con proporciones, utilizamos la fórmula de error está dada por: 𝑒 = 𝑍1− 𝛼 2
𝜎 √𝑛
Reemplazando, tenemos: 0,1 ≥ 𝑍0,99 ∙
0,3 √𝑛
→ √𝑛 ≥ 2,33 ∙
0,3 → 𝑛 ≥ 48,86 ≈ 49 0,1
Respuesta: El tamaño necesario para el problema es como mínimo 49.
Alejandro González Tapia – Ingeniería Civil en Minas
Página 155
7. Intervalo confidencial, Test de Hipótesis y Bondad de Ajuste – Ejercicios Resueltos ANÁLISIS ESTADÍSTICO
13.3) Solución: Procedemos a determinar el tamaño de la muestra, la media y desviación estándar de ambas muestras: Para Mina I:
𝑛𝑥 = 35;
Para Mina II:
𝑛𝑦 = 25;
𝑥̅ = 8,23 ; 𝑦̅ =
∑𝑥 𝑛𝑦
=
𝑆𝑥 = 0,12553
204,85 25
= 8,194
(∑ 𝑥 )2
2
𝑖 2 204,85 1680,76 − 25 ∑ 𝑥𝑖2 − 𝑛𝑦 𝑦̅ 2 √∑ 𝑥𝑖 − 𝑛𝑦 √ 𝑆𝑦 = √ = = = 0,304 𝑛𝑦 − 1 𝑛𝑦 − 1 24
En seguida, debemos contrastar las siguientes hipótesis, para determinar si estas muestras poseen varianzas poblacionales iguales o diferentes: 𝐻0 : 𝜎𝑥2 = 𝜎𝑦2 𝐻1 : 𝜎𝑥2 ≠ 𝜎𝑦2 Luego, para determinar el estadístico de prueba, tenemos: 𝑇=
𝑆𝑦2
→
𝑆𝑥2
𝑇=
0,3042 = 5,8648 0,125532
Los puntos críticos están dados por (𝛼 = 0,05): 𝐹(𝑛
𝛼 𝑦 − 1; 𝑛𝑥 − 1; 2 )
1
1 = 0,452 𝐹(34; 24; 0,975) 𝐹(30; 24; 0,975) 2,2090 = 𝐹(24; 34; 0,975) ≈ 𝐹(24; 30; 0,975) = 2,1359
= 𝐹(24; 34; 0,025) =
𝐹(𝑛
𝑦 − 1; 𝑛𝑥 −
𝛼 2
1; 1− )
1
≈
=
La Región Crítica: 𝑅𝐶 = { 𝑥 | 𝑇 < 𝐹(24; 34; 0,025) ó 𝑇 > 𝐹(24; 34; 0,975) }
𝑅𝐶 = { 𝑥 | 𝑇 < 0,452 ó 𝑇 > 2,1359 }
→
Resultado: Debido a que 𝑇 ∈ 𝑅𝐶, hay información suficiente para rechazar la hipótesis nula, es decir, las varianzas poblacionales de ambas muestras son diferentes. Continuando con el desarrollo del ejercicio, contrastamos las siguientes hipótesis: 𝐻0 : 𝜇𝑥 = 𝜇𝑦 𝐻1 : 𝜇𝑥 > 𝜇𝑦 Luego, para determinar el estadístico de prueba, tenemos: 𝑇=
𝑥̅ − 𝑦̅ − (𝜇𝑥 − 𝜇𝑦 ) 𝑆
𝑆𝑦
𝑥
𝑛𝑦
√ 𝑛𝑥 +
Página 156
2
2
→
𝑇=
8,23 − 8,194 − 0 √
0,125532 35
+
0,3042
= 0,5590
25
Alejandro González Tapia – Ingeniería Civil en Minas
7. Intervalo confidencial, Test de Hipótesis y Bondad de Ajuste – Ejercicios Resueltos ANÁLISIS ESTADÍSTICO
Después para calcular los grados de libertad tenemos la siguiente fórmula:
𝑣=
𝑆 2
𝑆𝑦 2
𝑥
𝑛𝑦
( 𝑛𝑥 + 2 𝑆 2 ( 𝑥 ) 𝑛𝑥
𝑛𝑥 −1
(
+
2
)
𝑆𝑦 2 𝑛𝑦
( 2
=
)
0,125532 35
2 0,125532 ( ) 35
35−1
𝑛𝑦 −1
+ +
0,3042 25
2
)
2 0,3042 ( ) 25
= 29,89 ≈ 29
25−1
Finalmente, la Región Crítica (Con 𝛼 = 0,05): 𝑅𝐶 = { 𝑥 | 𝑇 > 𝑡(𝑣; 1− 𝛼) }
𝑅𝐶 = { 𝑥 | 𝑇 > 𝑡(29; 0,95) }
→
𝑅𝐶 = { 𝑥 | 𝑇 > 1,6991}
→
Respuesta: Como 𝑇 ∈ 𝑅𝐶, en conclusión no existe suficiente información para rechazar la hipótesis nula con un 5% de significación, es decir, se puede afirmar que la capacidad calórica del carbón de la mina 1 no supera a la capacidad calórica del carbón de la mina 2. 13.4) Solución: Las hipótesis a contrastar son: 𝐻0 : 𝜇 ≥ 8,3 𝐻1 : 𝜇 < 8,3 Luego, como desconocemos la varianza el estadístico de prueba se determina de la siguiente forma: 𝑇=
𝑥̅ − 𝜇0 𝑠
𝐶𝑜𝑛: 𝑛𝑥 = 35; 𝑥̅ = 8,23 ; 𝑆𝑥 = 0,12553
→
𝑇=
√𝑛
8,23 − 8,3 0,1255
= −3,3
√35
La Región Crítica (Con 𝛼 = 0,05): 𝑅𝐶 = { 𝑥 | 𝑇 < −𝑡(𝑛𝑥 −1; 1 − 𝛼) }
→
𝑅𝐶 = { 𝑥 | 𝑇 < −𝑡(34; 0,95) }
→
𝑅𝐶 = { 𝑥 | 𝑇 < −1,6909}
Respuesta: Debido a que 𝑇 ∈ 𝑅𝐶, existe suficiente información para rechazar la hipótesis nula, con un 5% de significación, es decir, la capacidad calórica del carbón de la mina 1 es inferior a 8,3 mil millones de calorías por tonelada. 14.- Una empresa de telecomunicaciones realizó un estudio a fin de comparar el tráfico mensual de los clientes que han tomado los planes A ó B y conocer la opinión de éstos respecto de los servicios prestados por la empresa. Para este efecto, tomó de cada plan, una muestra aleatoria de 121 clientes. La información recolectada, se presenta a continuación: Plan A Tiempo (min) 60 a 100 100 a 140 140 a 180 180 a 220 220 a 260 N° de clientes 13 32 30 27 19 Tiempo (min) N° de clientes
120 a 156 20
Plan B 156 a 192 192 a 228 26 33
228 a 264 30
264 a 300 12
Además 98 clientes del plan A y 80 del plan B evaluaron satisfactoriamente los servicios prestados por la empresa.
Alejandro González Tapia – Ingeniería Civil en Minas
Página 157
7. Intervalo confidencial, Test de Hipótesis y Bondad de Ajuste – Ejercicios Resueltos ANÁLISIS ESTADÍSTICO
14.1) Estime, con un nivel de confianza del 95% el tiempo medio de tráfico de los clientes del plan B. 14.2) Con un nivel de significación del 5%, ¿Aceptaría Ud. La hipótesis que la diferencia de los tiempos medios de tráfico, de los clientes del plan B con respecto a los clientes del plan A, supere los 30 minutos? 14.3) Si el Gerente de la empresa se planteó la hipótesis: “el porcentaje de clientes que evalúa satisfactoriamente los servicios prestados por la empresa es igual en ambos planes”, ¿Qué concluye, si utilizó un nivel de significación del 1%? 14.4) Docime la hipótesis de que el tiempo de tráfico de los clientes del plan A, es una v.a. con distribución normal de varianza 2500 (min2). 14.1) Solución: Sea:
𝐴 = “Tiempo tráfico mensual de los clientes que han tomado el plan A, en minutos” 𝐵 = “Tiempo tráfico mensual de los clientes que han tomado el plan B, en minutos” 𝐴 ~ 𝑁(𝜇; 𝜎 2 )
𝐵 ~ 𝑁(𝜇; 𝜎 2 )
Lo primero será calcular el tamaño, media y desviación estándar de cada muestra dada: 𝐴𝑖 80 120 160 200 240
60 − 100 100 − 140 140 − 180 180 − 220 220 − 260 Para A 𝐴̅ = 162,3140
𝑛𝐴𝑖 13 32 30 27 19 𝑛𝐴 = 121
𝐵𝑖 138 174 210 246 282
120 − 156 156 − 192 192 − 228 228 − 264 264 − 300 Para B ̅ 𝐵 = 206,4296
𝑆𝐴 = 49,8792
𝑛𝐵𝑖 20 26 33 30 12 𝑛𝐵 = 121
𝑆𝐵 = 44,4336
Dado que el problema nos pide estimar el tiempo medio de tráfico de los clientes del plan B, utilizaremos la siguiente fórmula para poder determinarlo 𝐼𝐶(𝜇𝐵 )1−𝛼 = (𝐵̅ ± 𝑡(𝑛
𝛼 2
𝐵 −1;1− )
∙
𝑆𝐵 ) √𝑛𝐵
𝐶𝑜𝑛: 1 − 𝛼 = 0,95
Evaluando: 𝐼𝐶(𝜇𝐵 )0,95 = (206,4296 ± 𝑡(120;0,975) ∙
44,4336 √121
)
𝐼𝐶(𝜇𝐵 )0,95 = (206,4296 ± 1,9799 ∙
𝐶𝑜𝑛: 𝑡(120;0,975) = 1,9799 44,4336 √121
)
𝐼𝐶 (𝜇𝐵 )0,95 = [198,4319; 214,4272] Respuesta: El intervalo [198,4319; 214,4272] tiene un 95% de probabilidad de contener el tiempo medio de tráfico de los clientes del plan B.
Página 158
Alejandro González Tapia – Ingeniería Civil en Minas
7. Intervalo confidencial, Test de Hipótesis y Bondad de Ajuste – Ejercicios Resueltos ANÁLISIS ESTADÍSTICO
14.2) Solución: En seguida, debemos contrastar las siguientes hipótesis, para determinar si estas muestras poseen varianzas poblacionales iguales o diferentes: 𝐻0 : 𝜎𝐴2 = 𝜎𝐵2 𝐻1 : 𝜎𝐴2 ≠ 𝜎𝐵2 Luego, para determinar el estadístico de prueba, tenemos: 𝑇=
𝑆𝐴2 𝑆𝐵2
→
𝑇=
49,87922 = 1,2601 44,43362
Los puntos críticos están dados por (𝛼 = 0,05): 𝐹(𝑛
1
1 = 0,697 𝐹(120; 120; 0,975) 1,4327 = 𝐹(120; 120; 0,975) = 1,4327
= 𝐹(120; 120; 0,025) =
𝛼 𝐴 −1; 𝑛𝐵 −1; 2 )
𝐹(𝑛
𝐴 −1;
𝛼 2
𝑛𝐵 −1; 1− )
La Región Crítica: 𝑅𝐶 = { 𝑥 | 𝑇 < 𝐹(120; 120; 0,025) ó 𝑇 > 𝐹(120; 120; 0,975) }
=
𝑅𝐶 = { 𝑥 | 𝑇 < 0,697 ó 𝑇 > 1,4327 }
→
Resultado: Debido a que 𝑇 ∈ 𝑅𝐶, no hay información suficiente para rechazar la hipótesis nula, es decir, las varianzas poblacionales de ambas muestras son iguales. Continuando con el desarrollo del ejercicio, contrastamos las siguientes hipótesis: 𝐻0 : 𝜇𝐵 − 𝜇𝐴 ≤ 30 𝐻1 : 𝜇𝐵 − 𝜇𝐴 > 30 Luego, para determinar el estadístico de prueba, tenemos la siguiente expresión:
𝑇=
𝐵̅ − 𝐴̅ − (𝜇𝐵 − 𝜇𝐴 ) 𝑆𝑝 √
1 𝑛𝐵
+
1
(𝑛𝐵 − 1)𝑆𝐵 2 + (𝑛𝐴 − 1)𝑆𝐴 2 𝐶𝑜𝑛 𝑆𝑝 = √ 𝑛𝐵 + 𝑛𝐴 − 2
𝑛𝐴
Reemplazando, obtenemos: (120) ∙ 44,43362 + (120) ∙ 49,87922 𝑆𝑝 = √ = 47,235 121 + 121 − 2 𝑇=
206,4296 − 162,3140 − 30 47,235√
1 121
+
= 2,3244
1 121
Finalmente, la Región Crítica (Con 𝛼 = 0,05): 𝑅𝐶 = { 𝑥 | 𝑇 > 𝑡(𝑛𝑝 ; 1− 𝛼) }
𝐶𝑜𝑛 𝑛𝑝 = 𝑛𝐴 + 𝑛𝐵 − 2 = 240
𝑅𝐶 = { 𝑥 | 𝑇 > 𝑡(240; 0,95) }
Alejandro González Tapia – Ingeniería Civil en Minas
Página 159
7. Intervalo confidencial, Test de Hipótesis y Bondad de Ajuste – Ejercicios Resueltos ANÁLISIS ESTADÍSTICO
Ya que este valor no se encuentra explícitamente en la tabla, tenemos que interpolar: 1,6499 − 1,6525 𝑥 − 1,6525 = 300 − 200 240 − 200 −0,0026 𝑥 − 1,6525 = 100 40 −0,0026 ∙ 40 𝑥= + 1,6525 100 𝑥 = 1,6515 𝑡(240; 0,95) = 1,6515 𝑅𝐶 = { 𝑥 | 𝑇 > 𝑡(240; 0,95) }
𝑅𝐶 = { 𝑥 | 𝑇 > 1,6515}
→
Respuesta: Como 𝑇 ∈ 𝑅𝐶, en conclusión existe suficiente información para rechazar la hipótesis nula con un 5% de significación, es decir, se puede afirmar que la diferencia media de los tiempos de tráfico de los clientes del plan B con respecto a los clientes del plan A, supera los 30 minutos. 14.3) Solución: Ya que el ejercicio nos entrega la cantidad de clientes, de cada plan, que evalúa satisfactoriamente los servicios prestados por la empresa, podemos determinar las proporciones respectivas de las muestras: 𝑝̂𝐴 =
98 121
𝑝̂𝐵 =
80 98 + 80 178 → 𝑝̂ = = = 0,7355 121 121 + 121 242
Definimos las hipótesis a contrastar 𝐻0 : 𝑝𝐴 = 𝑝𝐵 𝐻1 : 𝑝𝐴 ≠ 𝑝𝐵 El estadístico de prueba está dado por: 𝑇=
98
𝑝̂𝐴 − 𝑝̂𝐵 √𝑝̂ 𝑞̂ (
1 𝑛𝐴
+
1 𝑛𝐴
121
= )
80
− 121
√(0,7355)(0,2645) (
= 2,6234 1 121
1
+ 121)
𝑧1− 𝛼 = 𝑧0,995 = 2,575
El Punto Crítico corresponde a:
2
La Región Crítica (Con 𝛼 = 0,01): 𝑅𝐶 = { 𝑥 | 𝑇 < −𝑍1− 𝛼 ó 𝑇 > 𝑍1− 𝛼 } 2
→
𝑅𝐶 = { 𝑥 | 𝑇 < −2,575 ó 𝑇 > 2,575}
2
Respuesta: Como 𝑇 ∈ 𝑅𝐶, se llega a la conclusión que existe suficiente información para rechazar la hipótesis nula con un 1% de significación, o sea, el gerente de la empresa no se encontraba en lo correcto cuando planteaba que el porcentaje de clientes que evalúa satisfactoriamente los servicios prestados por la empresa es igual en ambos casos. 14.4) Solución: Sea: 𝐴 = “Tiempo tráfico mensual de los clientes que han tomado el plan A, en min.” Con: 𝐴̅ = 162,31 ;
Página 160
𝜎𝐴 2 = 2500; 𝜎𝐴 = 50
Alejandro González Tapia – Ingeniería Civil en Minas
7. Intervalo confidencial, Test de Hipótesis y Bondad de Ajuste – Ejercicios Resueltos ANÁLISIS ESTADÍSTICO
𝐻0 : 𝐴 ~ 𝑁(𝜇; 𝜎𝐴 2 = 2500) 𝐻1 : 𝐴 ~ 𝑁(𝜇; 𝜎𝐴 2 = 2500) Nota: Debido a que el ejercicio no nos entrega los grados de libertad se 𝛼 = 0,05
Las hipótesis a contrastar son:
Luego, se crea una tabla con los intervalos que abarcan todos los números del conjutno de los reales, es decir, desde el −∞ al +∞, donde también se adiciona la frecuencia absoluta y la probabilidad de cada uno de ellos: 𝑥′𝑖−1 − 𝑥′𝑖
𝐿í𝑚𝑖𝑡𝑒𝑠 𝑡𝑖𝑝𝑖𝑓𝑖𝑐𝑎𝑑𝑜𝑠 𝑍𝑥′𝑖−1 − 𝑍𝑥′𝑖
𝑛𝑖
<
𝑀𝑒𝑛𝑜𝑟 𝑎 60 60 − 100
13
100 − 140
32
140 − 180
30
180 − 220
27
220 − 260
19
60−162,31
>
f(−2,05) = 0,0202 f(−1,25) − f(−2,05) = 0,1056 − 0,0202 f(−0,45) − f(−1,25) = 0,3264 − 0,1056 f(0,35) − f(−0,45) = 0,6368 − 0,3264 f(1,15) − f(0,35) = 0,8749 − 0,6368 f(1,95) − f(1,15) = 0,9744 − 0,8749 1 − f(1,95) = 1 − 0,9744
< −2,05
50
60 − 162,31 100 − 162,31 ; 50 50 100 − 162,31 140 − 162,31 ; 50 50 140 − 162,31 180 − 162,31 ; 50 50 180 − 162,31 220 − 162,31 ; 50 50 220 − 162,31 260 − 162,31 ; 50 50
𝑀𝑎𝑦𝑜𝑟 𝑎 260
𝑝(𝑥)
−2,05; −1,25 −1,25; −0,45 −0,45; 0,35 0,35; 1,15 1,15; 1,95
260−162,31
> 1,95
50
𝑛 = 121
𝑒𝑖 = 𝑛 ∙ 𝑝(𝑥) 0,0202
2,44
0,0854
10,33
0,2208
26,72
0,3104
37,56
0,2381
28,81
0,0995
12,04
0,0256
3,1
1
121
En seguida, como se debe cumplir que 𝑒𝑖 > 5, se procede a modificar la tabla, lo que se lleva a cabo sumando las dos primeras filas y las dos últimas filas, quedando expresado de la siguiente forma: 𝑛𝑖 13 32 30 27 19 𝑛 = 121
𝑝(𝑥) 0,3062 0,2208 0,3104 0,2381 0,1251 ∑ 𝑝(𝑥) = 1
𝑒𝑖 = 𝑛 ∙ 𝑝(𝑥) 12,77 26,72 37,56 28,81 15,14 ∑ 𝑒𝑖 = 121
Posteriormente, se aplica la fórmula para calcular el estadístico de prueba: 2 𝑜𝑏𝑠
=∑
(𝑛𝑖 − 𝑒𝑖 )2 (13 − 12,77)2 (32 − 26,72)2 (30 − 37,56)2 (27 − 28,81)2 (19 − 15,14)2 = + + + + 𝑒𝑖 12,77 26,72 37,56 28,81 15,14 2 𝑜𝑏𝑠
= 3,667
Además, la región crítica está definida de la siguiente forma: 𝑅𝐶 = { 𝑥 |
2 𝑜𝑏𝑠
>
2 1−𝛼;
}
Con:
= 𝑘−−1
𝑘 = 𝑛ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝑠𝑢𝑐𝑒𝑠𝑜𝑠 𝑜 𝑓𝑖𝑙𝑎𝑠 = 𝑛ú𝑚𝑒𝑟𝑜𝑠 𝑑𝑒 𝑒𝑠𝑡𝑖𝑚𝑎𝑑𝑜𝑟𝑒𝑠
Debido a que ocupamos el estimador de la media, el valor de es igual a uno y el número de filas después de la modificación es cinco, por lo tanto, reemplazando tenemos: 𝑅𝐶 = { 𝑥 |
Alejandro González Tapia – Ingeniería Civil en Minas
2 𝑜𝑏𝑠
>
2 1− 𝛼; 3 }
Página 161
7. Intervalo confidencial, Test de Hipótesis y Bondad de Ajuste – Ejercicios Resueltos ANÁLISIS ESTADÍSTICO
Ya que el valor del nivel de confianza no es entregado por el ejercicio, tenemos que interpolar para determinarlo: 0,75 − 0,25 4,108 − 1,213 = 𝑥 − 0,25 3,667 − 1,213 0,50 2,895 = 𝑥 − 0,25 2,454 𝑥=
0,50 ∙ 2,454 + 0,25 2,895 𝑥 = 0,69 1 − 𝛼 = 0,69
Resultados: 2 𝑜𝑏𝑠
Caso 1:
La hipotesis nula se rechaza si
Caso 2:
La hipotesis nula no se rechaza si
∈ 𝑅𝐶 ⇔ 1 − 𝛼 < 0,69 ó 𝛼 > 0,31
2 𝑜𝑏𝑠
∈ 𝑅𝐶 ⇔ 1 − 𝛼 > 0,69 ó 𝛼 < 0,31
Considerando que el nivel de significación debe ser el menor posible para que la estimación sea adecuada, por lo que es correcto elegir el caso 2, ya que así se cumple lo antes expuesto. 2
Respuesta: Ya que 𝑜𝑏𝑠 ∈ 𝑅𝐶 ⇔ 1 − 𝛼 > 0,69, es decir, no existe información suficiente para rechazar la hipotesis nula, por lo tanto, el tiempo de tráfico de los clientes del plan A se distribuye normalmente con varianza igual a 2500 min 2. 15.- En el mercado existen dos tipos de plásticos (A y B), los que son utilizados en la fabricación de diversos artículos. Una variable importante que se maneja es su tensión de ruptura (en psi) y por lo tanto se ha diseñado un experimento para medir la variable en ambos tipos. Los resultados en 41 ensayos de plástico A fueron los siguientes: Tensión de Ruptura 𝒏𝑨
144 a 150 5
150 a 156 12
156 a 162 16
162 a 168 8
Por otro lado, en 25 ensayos realizados para registrar la tensión a la ruptura en el plástico B, se obtuvo un promedio de 154 psi con desviación estándar de 5,2 psi. 15.1) Considerando un nivel de significación del 5% y la información que entregan los datos. ¿Hay evidencia suficiente para cuestionar lo especificado por el fabricante, quién señala que el valor medio de la tensión a la ruptura del plástico A es de 155,5 psi? 15.2) El ingeniero de procesos tiene la sospecha que el plástico A tiene una tensión media a la ruptura más alta de lo que se observa para el plástico B. Admitiendo como válidos los supuestos de normalidad de las variables en estudio y considerando un niel de significación del 5% ¿Qué puede concluir usted respecto de la sospecha del ingeniero de procesos? 15.3) Con un nivel de significación del 2,5% ¿Muestran los datos la evidencia suficiente para corroborar que efectivamente la distribución de probabilidad de la tensión a la ruptura del plástico tipo A es de tipo normal con media 155,5 psi y varianza 25 (psi) 2. 15.4) Con un 5% de nivel de significación, ¿es posible corroborar que más de un 30% de las unidades del plástico A presentan una tensión a la ruptura superior a 160 psi?
Página 162
Alejandro González Tapia – Ingeniería Civil en Minas
7. Intervalo confidencial, Test de Hipótesis y Bondad de Ajuste – Ejercicios Resueltos ANÁLISIS ESTADÍSTICO
15.1) Solución: Sea: 𝑥 = “Tensión de ruptura del tipo de plásticos A, en psi”; 𝑥 ~ 𝑁(𝜇; 𝜎 2 ) 𝑦 = “Tensión de ruptura del tipo de plásticos B, en psi”; 𝑦 ~ 𝑁(𝜇; 𝜎 2 ) 𝑥′𝑖−1 − 𝑥′𝑖 144 – 150 150 – 156 156 – 162 162 – 168
𝑥𝑖 147 153 159 165
𝑛𝑖 5 12 16 8 𝑛𝑥 = 41
Para 𝑥: 𝑥̅ = 156,95
𝑆𝑥 = 5,63
𝑛𝑥 = 41
Para 𝑦: 𝑦̅ = 154
𝑆𝑦 = 5,2
𝑛𝑦 = 25
Las hipótesis a contrastar son: 𝐻0 : 𝜇𝐴 = 155,5 𝐻1 : 𝜇𝐴 ≠ 155,5 Luego, como desconocemos la varianza el estadístico de prueba se determina de la siguiente forma: 𝑇=
𝑥̅ − 𝜇0 𝑠𝑥
𝐶𝑜𝑛: 𝑛𝑥 = 41; 𝑥̅ = 156,95 ; 𝑆𝑥 = 5,63 →
𝑇=
√𝑛𝑥
156,95 − 155,5 5,63
= 1,65
√41
La Región Crítica (Con 𝛼 = 0,05): 𝑅𝐶 = { 𝑥 | 𝑇 < −𝑡(𝑛
𝛼 𝑥 −1; 1 − 2 )
}
→
𝑅𝐶 = { 𝑥 | 𝑇 < −𝑡(40; 0,975) }
→ 𝑅𝐶 = { 𝑥 | 𝑇 < −2,0211}
Respuesta: Debido a que 𝑇 ∈ 𝑅𝐶, no existe suficiente información para rechazar la hipótesis nula, es decir, no hay evidencia suficiente para cuestionar lo especificado por el fabricante, el que señaló que el valor medio de la tensión a la ruptura del plástico A es de 155,5 psi, con un 5% de significación. 15.2) Solución: Debemos contrastar las siguientes hipótesis, para determinar si estas muestras poseen varianzas poblacionales iguales o diferentes: 𝐻0 : 𝜎𝑥 2 = 𝜎𝑦 2 𝐻1 : 𝜎𝑥 2 ≠ 𝜎𝑦 2 Luego, para determinar el estadístico de prueba, tenemos: 𝑇=
𝑆𝑥 2 𝑆𝑦 2
5,632 𝑇= = 1,1722 5,22
→
Los puntos críticos están dados por (𝛼 = 0,05): 𝐹(𝑛
1 = 0,4928 𝐹(24; 40; 0,975) 2,0069 = 𝐹(40; 24; 0,975) = 2,1460
= 𝐹(40; 24; 0,025) =
𝛼 𝑥 −1; 𝑛𝑦 −1; 2 )
𝐹(𝑛
𝛼 𝑥 −1; 𝑛𝑦 −1; 1− 2 )
La Región Crítica: 𝑅𝐶 = { 𝑥 | 𝑇 < 𝐹(40; 24; 0,025) ó 𝑇 > 𝐹(40; 24; 0,975) }
1
→
=
𝑅𝐶 = { 𝑥 | 𝑇 < 0,4928 ó 𝑇 > 2,1460 }
Resultado: Debido a que 𝑇 ∈ 𝑅𝐶, no hay información suficiente para rechazar la hipótesis nula, es decir, las varianzas poblacionales de ambas muestras son iguales.
Alejandro González Tapia – Ingeniería Civil en Minas
Página 163
7. Intervalo confidencial, Test de Hipótesis y Bondad de Ajuste – Ejercicios Resueltos ANÁLISIS ESTADÍSTICO
Continuando con el desarrollo del ejercicio, procedemos a contrastar las siguientes hipótesis: 𝐻0 : 𝜇𝑥 = 𝜇𝑦 𝐻1 : 𝜇𝑥 > 𝜇𝑦 Luego, para determinar el estadístico de prueba, tenemos: 𝑥̅ − 𝑦̅
𝑇=
1
1
𝑆𝑝 √𝑛 + 𝑛 𝑥
(𝑛𝑥 − 1)𝑆𝑥 2 + (𝑛𝑦 − 1)𝑆𝑦 2 𝐶𝑜𝑛 𝑆𝑝 = √ 𝑛𝑥 + 𝑛𝑦 − 2
𝑦
Reemplazando, obtenemos: (41 − 1) ∙ 5,632 + (25 − 1) ∙ 5,22 156,95 − 154 𝑆𝑝 = √ = 5,4727 ; 𝑇 = = 2,1243 41 + 25 − 2 1 1 5,4727 ∙ √ + 41
25
Finalmente, la Región Crítica: 𝑅𝐶 = { 𝑥 | 𝑇 > 𝑡(𝑛𝑝 ; 1− 𝛼) } 𝑅𝐶 = { 𝑥 | 𝑇 > 𝑡(64; 0,95) }
𝐶𝑜𝑛 𝑛𝑝 = 𝑛𝐴 + 𝑛𝐵 − 2 = 64 →
𝑅𝐶 = { 𝑥 | 𝑇 > 1,6690}
Respuesta: Como 𝑇 ∈ 𝑅𝐶, en conclusión hay información suficiente para rechazar la hipótesis nula, es decir, las sospechas del ingeniero de proceso están en lo correcto, ya que por los resultados obtenidos el plástico A tiene una tensión media a la ruptura más alta de lo que se observa para el plástico B. 15.3) Solución: Las hipótesis a contrastar son (Con 𝛼 = 0,025): 𝐻0 : 𝑥 ~ 𝑁(𝜇 = 155,5; 𝜎𝐴 2 = 25) 𝐻1 : 𝑥 ~ 𝑁(𝜇 = 155,5; 𝜎𝐴 2 = 25) Luego, como queremos probar que se distribuye normalmente, se crea una tabla con los intervalos que abarcan todos los números del conjunto de los reales, es decir, desde el −∞ al +∞, donde también se adiciona la frecuencia absoluta y la probabilidad de cada uno de ellos: 𝑥′𝑖−1 − 𝑥′𝑖
𝑛𝑖
𝑀𝑒𝑛𝑜𝑟 𝑎 144 144 − 150
5
150 − 156
12
156 − 162
16
162 − 168
8
𝑀𝑎𝑦𝑜𝑟 𝑎 168 𝑛 = 41
Página 164
𝐿í𝑚𝑖𝑡𝑒𝑠 𝑡𝑖𝑝𝑖𝑓𝑖𝑐𝑎𝑑𝑜𝑠 𝑍𝑥′𝑖−1 − 𝑍𝑥′𝑖 144 − 155,5 < −2,3 < 5 144 − 155,5 150 − 155,5 −2,3; −1,1 ; 5 5 150 − 155,5 156 − 155,5 −1,1; 0,1 ; 5 5 156 − 155,5 162 − 155,5 0,1; 1,3 ; 5 5 162 − 155,5 168 − 155,5 1,3; 2,5 ; 5 5 168 − 155,5 > 2,5 > 5
𝑝(𝑥) f(−2,3) = 0,0107 f(−1,1) − f(−2,3) = 0,1357 − 0,0107 f(0,1) − f(−1,1) = 0,5398 − 0,1357 f(1,3) − f(0,1) = 0,9032 − 0,5398 f(2,5) − f(1,3) = 0,9938 − 0,9032 1 − f(2,5) = 1 − 0,9938
𝑒𝑖 = 𝑛 ∙ 𝑝(𝑥) 0,011
0,45
0,125
5,13
0,404
16,56
0,363
14,88
0,091
3,73
0,006
0,25
1
41
Alejandro González Tapia – Ingeniería Civil en Minas
7. Intervalo confidencial, Test de Hipótesis y Bondad de Ajuste – Ejercicios Resueltos ANÁLISIS ESTADÍSTICO
En seguida, se sabe que cuando estamos haciendo bondad de ajuste se debe cumplir que 𝑒𝑖 > 5, por lo tanto, se procede a modificar la tabla, lo que se lleva a cabo sumando las dos primeras filas y las tres últimas filas, quedando expresado de la siguiente forma: 𝑝(𝑥) 0,136 0,368 0,496 ∑ 𝑝(𝑥) = 1
𝑛𝑖 5 12 24 𝑛 = 41
𝑒𝑖 = 𝑛 ∙ 𝑝(𝑥) 5,58 16,56 18,86 ∑ 𝑒𝑖 = 41
Posteriormente, se aplica la fórmula para calcular el estadístico de prueba: 2 𝑜𝑏𝑠
=∑
(𝑛𝑖 − 𝑒𝑖 )2 (5 − 5,58)2 (12 − 16,56)2 (24 − 18,86)2 = + + = 2,717 𝑒𝑖 5,58 16,56 18,86
Además, la región crítica está definida de la siguiente forma: 𝑅𝐶 = { 𝑥 |
2 𝑜𝑏𝑠
>
2 1−𝛼;
}
Con:
= 𝑘−−1
𝑘 = 𝑛ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝑠𝑢𝑐𝑒𝑠𝑜𝑠 𝑜 𝑓𝑖𝑙𝑎𝑠 = 𝑛ú𝑚𝑒𝑟𝑜𝑠 𝑑𝑒 𝑒𝑠𝑡𝑖𝑚𝑎𝑑𝑜𝑟𝑒𝑠
Debido a que no se utiliza ningún estimador, el valor de es igual a cero y el número de filas después de la modificación corresponde a tres, por lo tanto, reemplazando tenemos: 𝑅𝐶 = { 𝑥 |
2 𝑜𝑏𝑠
>
2 0,975;2 }
𝑅𝐶 = { 𝑥 |
2 𝑜𝑏𝑠
> 7,378}
2
Respuesta: Como 𝑜𝑏𝑠 ∈ 𝑅𝐶, se concluye que no existe evidencia suficiente para rechazar que la tensión a la ruptura del plástico tipo A se distribuye normalmente con una media de 155,5 psi y una varianza de 25 psi2, con un nivel de significación de 0,025. 15.4) Solución: Sea: 𝑝 = “Proporción de las unidades del plástico A que presentan una tensión a la ruptura superior a 160 psi” Estimaremos el valor de 𝑝̂ , lo que lo llevamos a cabo por medio de fórmula de percentil, como se ve a continuación: 𝑝∙𝑛
𝑥′𝑖−1 − 𝑥′𝑖 144 – 150 150 – 156 156 – 162 162 – 168
𝑛𝑖 5 12 16 8 𝑛𝑥 = 41
100
𝑝 = 𝑥′𝑖−1 + 𝐶𝑖 (
𝑁𝑖 5 17 33 41
− 𝑁𝑖−1 𝑛𝑖
)
𝑝∙41
− 17 160 = 156 + 6 ( 100 ) → 16 𝑝̂ =
𝑝 = 67,48%
100 − 67,48 = 0,3252 100
Luego, las hipótesis a contrastar son: 𝐻0 : 𝑝 = 0,3 𝐻1 : 𝑝 > 0,3
Alejandro González Tapia – Ingeniería Civil en Minas
Página 165
7. Intervalo confidencial, Test de Hipótesis y Bondad de Ajuste – Ejercicios Resueltos ANÁLISIS ESTADÍSTICO
El estadístico de prueba está dado por: 𝑝̂ − 𝑝0 𝑇= 𝑝 𝑞 √ 0𝑛 0 La Región Crítica (Con 𝛼 = 0,05): 𝑅𝐶 = { 𝑥 | 𝑇 > 𝑍1− 𝛼 } →
→ 𝑇=
0,3252 − 0,3 √
= 0,7266
0,3∙0,7 41
𝑅𝐶 = { 𝑥 | 𝑇 > 𝑍0,95 }
→
𝑅𝐶 = { 𝑥 | 𝑇 > 1,645}
Respuesta: Como 𝑇 ∈ 𝑅𝐶, no existe suficiente información para rechazar la hipótesis nula con un 5% de significación, es decir, no se puede corroborar que más de un 30% de las unidades del plástico tipo A presentan una tensión a la ruptura superior a 160 psi. 16.- En un hospital, el número de nacimientos observados para cada mes de cierto año, fueron los siguientes: Enero 95
Febrero 105
Julio 105
Agosto 110
Marzo 95 Septiembre 105
Abril 105
Mayo 90
Junio 95
Octubre 100
Noviembre 95
Diciembre 100
Si 𝜶 = 𝟎, 𝟎𝟏, ¿Existe alguna razón para creer que el número de nacimietnos no se encuentra distribuido en forma uniforme durante todo los meses del año? 16) Solución: Sea: 𝑥 = “Mes en que ocurre el nacimiento en un hospital” Las hipotesis a contrastar son:
𝐻0 : 𝑥 ~ 𝑈𝑛𝑖𝑓𝑜𝑟𝑚𝑒 𝑑𝑖𝑠𝑐𝑟𝑒𝑡𝑎 [1; 12] 𝐻1 : 𝑥 ~ 𝑈𝑛𝑖𝑓𝑜𝑟𝑚𝑒 𝑑𝑖𝑠𝑐𝑟𝑒𝑡𝑎 [1; 12]
La frecuencia esperada se calcula con la siguiente fórmula: 1 1 𝑒𝑖 = 𝑛 ∙ 𝑝𝑖 𝐶𝑜𝑛 𝑛 = 1200 ; 𝑝𝑖 = = 𝑘 12
→
𝑒𝑖 = 100
Posteriormente, se aplica la fórmula para calcular el estadístico de prueba: 2 𝑜𝑏𝑠
(𝑛𝑖 − 𝑒𝑖 )2 (95 − 100)2 (105 − 100)2 (95 − 100)2 (105 − 100)2 (90 − 100)2 (95 − 100)2 = + + + + + 𝑒𝑖 100 100 100 100 100 100 2 2 2 2 2 (105 − 100) (110 − 100) (105 − 100) (100 − 100) (95 − 100) (100 − 100)2 + + + + + + =4 100 100 100 100 100 100
=∑
Además, la región crítica está definida de la siguiente forma: 2 } 𝑅𝐶 = { 𝑥 | 2𝑜𝑏𝑠 > 1−𝛼; Con: 1 − 𝛼 = 0,99;
= 𝑘−−1
𝑘 = 𝑛ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝑠𝑢𝑐𝑒𝑠𝑜𝑠 𝑜 𝑓𝑖𝑙𝑎𝑠 = 𝑛ú𝑚𝑒𝑟𝑜𝑠 𝑑𝑒 𝑒𝑠𝑡𝑖𝑚𝑎𝑑𝑜𝑟𝑒𝑠
Debido a que no ocupamos algún estimador, el valor de es igual a cero, por lo tanto, reemplazando tenemos: 𝑅𝐶 = { 𝑥 | 2𝑜𝑏𝑠 > 20,99; 11 } 𝑅𝐶 = { 𝑥 | 2𝑜𝑏𝑠 > 24,725}
Página 166
Alejandro González Tapia – Ingeniería Civil en Minas
7. Intervalo confidencial, Test de Hipótesis y Bondad de Ajuste – Ejercicios Resueltos ANÁLISIS ESTADÍSTICO
Respuesta: Como 2𝑜𝑏𝑠 ∈ 𝑅𝐶, por lo tanto no existe evidencia suficiente para rechazar la hipotesis nula, es decir, se concluye que no existe razón para rechazar que el número de nacimientos se encuentra distribuido en forma uniforme durante todo los meses del año. 17.- El encargado de control de calidad de una empresa exportadora revisó al azar un conjunto de 700 cajas, registrando el número de unidades defectuosas encontradas en cada caja, obteniendo la siguiente información: N° de defectuosos N° de cajas
0
1
2
3
542
140
10
8
Si históricamente la cantidad de defectuosos por caja, se ha comportado de acuerdo a un modelo binomial de parámetros 𝒏 = 𝟑 y 𝒑 = 𝟎, 𝟎𝟖. Evalúe usted si la evidencia muestral permite corroborar que la variable en cuestión persiste en comportarse de acuerdo al modelo histórico, con nivel de significación igual a 0,05. 17) Solución: Sea: 𝑥 = “Número de unidades defectuosas por caja” Las hipótesis que nos interesan contrastar son: 𝐻0 : 𝑥 ~ 𝐵(𝑛 = 3; 𝑝 = 0,08) 𝐻1 : 𝑥 ~ 𝐵(𝑛 = 3; 𝑝 = 0,08)
Con 𝛼 = 0,05
Luego, la probabilidad se determina de la siguiente manera, ya que se quiere probar si 𝑥 se distribuye de forma binomial, como se ve a continuación: 𝑛 3 )𝑥 (0,92)3−𝑥 ; 𝑥 = 0,1,2,3 ( ) 𝑥 𝑛−𝑥 ; 𝑥 = 0,1,2,3 ( )( 𝑝(𝑥) = { 𝑥 𝑝 𝑞 𝑝(𝑥) = { 𝑥 0,08 0 𝑒𝑛 𝑜𝑡𝑟𝑜 𝑐𝑎𝑠𝑜 0 𝑒𝑛 𝑜𝑡𝑟𝑜 𝑐𝑎𝑠𝑜 𝑥 𝑛𝑖 𝑝(𝑥) 𝑒𝑖 = 𝑛 ∙ 𝑝(𝑥) 3 ( ) (0,08)0 (0,92)3 = 0,7787 0 542 545,09 0 3 ( ) (0,08)1 (0,92)2 = 0,2031 1 140 142,17 1 3 ( ) (0,08)2 (0,92)1 = 0,0177 2 10 12,39 2 3 ( ) (0,08)3 (0,92)0 = 0,0005 3 8 0,35 3 𝑛 = 700 1 700 En seguida, como se debe cumplir que 𝑒𝑖 > 5, se procede a modificar la tabla, lo que se hace sumando las dos últimas filas, como se muestra ahora: 𝑛𝑖 542 140 18 𝑛 = 700
𝑝(𝑥) 0,7787 0,2031 0,0182 ∑ 𝑝(𝑥) = 1
Alejandro González Tapia – Ingeniería Civil en Minas
𝑒𝑖 = 𝑛 ∙ 𝑝(𝑥) 545,09 142,17 12,74 ∑ 𝑒𝑖 = 700
Página 167
7. Intervalo confidencial, Test de Hipótesis y Bondad de Ajuste – Ejercicios Resueltos ANÁLISIS ESTADÍSTICO
Posteriormente, se aplica la fórmula para calcular el estadístico de prueba: 2 𝑜𝑏𝑠
=∑
(𝑛𝑖 − 𝑒𝑖 )2 (542 − 545,09)2 (140 − 142,17)2 (18 − 12,74)2 = + + = 2,2223 𝑒𝑖 545,09 142,17 12,74
Además, la región crítica está definida de la siguiente forma: 𝑅𝐶 = { 𝑥 |
2 𝑜𝑏𝑠
Con: 1 − 𝛼 = 0,95;
>
2 1−𝛼;
}
= 𝑘−−1
𝑘 = 𝑛ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝑠𝑢𝑐𝑒𝑠𝑜𝑠 𝑜 𝑓𝑖𝑙𝑎𝑠 = 𝑛ú𝑚𝑒𝑟𝑜𝑠 𝑑𝑒 𝑒𝑠𝑡𝑖𝑚𝑎𝑑𝑜𝑟𝑒𝑠
Debido a que no ocupamos ningún estimador, el valor de es igual a cero, y el número de filas después de la modificación es tres, por lo tanto, reemplazando tenemos: 𝑅𝐶 = { 𝑥 |
2 𝑜𝑏𝑠
>
2 0,95;2 }
𝑅𝐶 = { 𝑥 |
2 𝑜𝑏𝑠
> 5,991}
Respuesta: Como 2𝑜𝑏𝑠 ∈ 𝑅𝐶, en consecuencia no existe evidencia suficiente para rechazar que la cantidad de defectuosos por caja sigue el modelo histórico, o sea, distribución binomial con tamaño de la muestra 3, y probabilidad de éxito igual a 0,08, con un nivel de significación de 0,05. 18.- En una empresa de acuicultura se quiere hacer un estudio sobre el nivel de parásitos en la producción de doradas. Para ello, se tomó una muestra de 5 individuos cada día, repitiendo el experimento durante 550 días. De cada muestra se analizaron los peces determinando cuantos de ellos contenían parásitos. ¿Se ajusta a un modelo de distribución Binomial con 5% de significación? 𝒙 = Nº de individuos con parásitos Frecuencia Observada 18) Solución: Sea:
0 17
1 81
2 152
3 180
4 104
5 16
𝑥 = “Número de individuos con parásitos”
Luego, como el ejercicio no nos entrega el valor de 𝑝, procedemos estimar el valor: 𝑥̅ =
∑ 𝑥𝑖 ∙ 𝑛𝑖 0 ∙ 27 + 1 ∙ 81 + 2 ∙ 152 + 3 ∙ 180 + 4 ∙ 104 + 5 ∙ 16 1421 = = = 2,584 ∑ 𝑛𝑖 550 550
Además, de la tabla de distribuciones discretas sabemos que la media de la distribución binomial está dada por la siguiente fórmula, teniendo cuidado con el 𝑛 es el número de veces que se repite el experimento, es decir, en este caso toma el valor de 5: 𝑥̅ = 𝑛𝑝 → 𝑝 =
𝑥̅ 2,584 = = 0,517 𝑛 5
Las hipótesis que nos interesan contrastar son: 𝐻0 : 𝑥 ~ 𝐵(𝑛 = 5; 𝑝 = 0,517) 𝐻1 : 𝑥 ~ 𝐵(𝑛 = 5; 𝑝 = 0,517) Con 𝛼 = 0,05
Página 168
Alejandro González Tapia – Ingeniería Civil en Minas
7. Intervalo confidencial, Test de Hipótesis y Bondad de Ajuste – Ejercicios Resueltos ANÁLISIS ESTADÍSTICO
Luego, la probabilidad se determina de la siguiente manera, ya que se quiere probar si 𝑥 se distribuye de forma binomial, como se ve a continuación: 𝑛 ( ) 𝑥 𝑛−𝑥 ; 𝑥 = 0,1,2, … ,5 𝑝(𝑥) = { 𝑥 𝑝 𝑞 0 𝑒𝑛 𝑜𝑡𝑟𝑜 𝑐𝑎𝑠𝑜 𝑥
𝑛𝑖
0
17
1
81
2
152
3
180
4
104
5
16 𝑛 = 550
) 𝑥 (0,483)5−𝑥 ; 𝑥 = 0,1,2, … ,5 (5) ( 𝑝(𝑥) = { 𝑥 0,517 0 𝑒𝑛 𝑜𝑡𝑟𝑜 𝑐𝑎𝑠𝑜 𝑝(𝑥)
5 ( ) 0 (5) 1 (5) 2 (5) 3 (5) 4 5 ( ) 5
)0
(0,517
(0,483
𝑒𝑖 = 𝑛 ∙ 𝑝(𝑥) )5
= 0,026
14,3
(0,517)1 (0,483)4 = 0,141
77,55
(0,517)2 (0,483)3 = 0,301
165,55
(0,517)3 (0,483)2 = 0,322
177,1
(0,517)4 (0,483)1 = 0,173
95,15
(0,517)5 (0,483)0 = 0,037
20,35
∑ 𝑝(𝑥) = 1
∑ 𝑒𝑖 = 550
Ya que todos los sucesos cumplen con 𝑒𝑖 > 5, la tabla no se modifica. Posteriormente, se aplica la fórmula para calcular el estadístico de prueba: 2 𝑜𝑏𝑠
=∑
(𝑛𝑖 − 𝑒𝑖 )2 (17 − 14,3)2 (81 − 77,55)2 (152 − 165,55)2 (180 − 177,1)2 (104 − 95,15)2 (16 − 20,35)2 = + + + + + 𝑒𝑖 14,3 77,55 165,55 177,1 95,15 20,35 2 𝑜𝑏𝑠
= 3,573
Además, la región crítica está definida de la siguiente forma: 2 } 𝑅𝐶 = { 𝑥 | 2𝑜𝑏𝑠 > 1−𝛼; Con: 1 − 𝛼 = 0,95;
= 𝑘−−1
𝑘 = 𝑛ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝑠𝑢𝑐𝑒𝑠𝑜𝑠 𝑜 𝑓𝑖𝑙𝑎𝑠 = 𝑛ú𝑚𝑒𝑟𝑜𝑠 𝑑𝑒 𝑒𝑠𝑡𝑖𝑚𝑎𝑑𝑜𝑟𝑒𝑠
Debido a que utilizamos el estimador de 𝑝̂ , el valor de es igual a uno, y el número de filas es seis, por lo tanto, reemplazando tenemos: 𝑅𝐶 = { 𝑥 |
2 𝑜𝑏𝑠
>
2 0,95; 4 }
𝑅𝐶 = { 𝑥 |
2 𝑜𝑏𝑠
> 9,488}
Respuesta: Como 2𝑜𝑏𝑠 ∈ 𝑅𝐶, en consecuencia no existe evidencia suficiente para rechazar la hipotesis nula, es decir, el número de individuos con parásitos se distribuye en forma binomial, con un nivel de significación de 0,05.
Alejandro González Tapia – Ingeniería Civil en Minas
Página 169
7. Intervalo confidencial, Test de Hipótesis y Bondad de Ajuste – Ejercicios Resueltos ANÁLISIS ESTADÍSTICO
19.- Se propone que el número de defectos en las tarjetas de circuito impreso sigue una distribución Poisson. Se reúne una muestra aleatoria de 60 tarjetas de circuito impreso y se observa el número de defectos. Los resultados obtenidos son los siguientes: Frecuencias observadas 𝒙 = Número de defectos 0 32 1 15 2 9 3 o más 4 Evalúe si estos datos muestran suficiente evidencia para decir que provienen de una distribución Poisson, con un nivel de significación igual a 0,05. 19) Solución: Sea: 𝑥 = “Número de defectos en las tarjetas de circuito impreso” Las hipótesis a contrastar son: 𝐻0 : 𝑥 ~ 𝑃𝑜𝑖𝑠𝑠𝑜𝑛 () 𝐻1 : 𝑥 ~ 𝑃𝑜𝑖𝑠𝑠𝑜𝑛 () Ya que el ejercicio no nos entrega el valor de lambda, procedemos a estimarlo a partir de los datos tabulados: ∑ 𝑥𝑖 ∙ 𝑛𝑖 0 ∙ 32 + 1 ∙ 15 + 2 ∙ 9 + 3 ∙ 4 3 ̂ = 𝑥̅ = = = = 0,75 𝑛 60 4 Luego, la probabilidad se determina de la siguiente manera, ya que se quiere probar si 𝑥 tiene una distribución Poisson, como se ve a continuación: 𝑒 − ∙ 𝑥 ; 𝑥 = 0,1,2, … 𝑝(𝑥) = { 𝑥! 0 𝑒𝑛 𝑜𝑡𝑟𝑜 𝑐𝑎𝑠𝑜 𝑥
𝑝(𝑥)
𝑛𝑖
0
32
1
15
2
9
3 ó 𝑚á𝑠
4 𝑛 = 60
𝑒 −0,75 ∙ (0,75)𝑥 ; 𝑥 = 0,1,2, … 𝑝(𝑥) = { 𝑥! 0 𝑒𝑛 𝑜𝑡𝑟𝑜 𝑐𝑎𝑠𝑜
𝑒
−0,75
𝑒𝑖 = 𝑛 ∙ 𝑝(𝑥)
0
∙ (0,75) = 0,4724 0! 𝑒 −0,75 ∙ (0,75)1 = 0,3543 1! 𝑒 −0,75 ∙ (0,75)2 = 0,1329 2! 1 − 𝑃 (𝑥 < 3) = 0,0404 ∑ 𝑝(𝑥) = 1
28,344 21,258 7,974 2,424 ∑ 𝑒𝑖 = 60
Puesto que la frecuencia esperada en la última celda es menor que 5, se combinan las dos últimas filas. 𝑥 𝑛𝑖 𝑒𝑖 = 𝑛 ∙ 𝑝(𝑥) 0 32 28,344 1 15 21,258 2 ó 𝑚á𝑠 13 10,398 ∑ 𝑒𝑖 = 60 𝑛 = 60
Página 170
Alejandro González Tapia – Ingeniería Civil en Minas
7. Intervalo confidencial, Test de Hipótesis y Bondad de Ajuste – Ejercicios Resueltos ANÁLISIS ESTADÍSTICO
Posteriormente, se aplica la fórmula para calcular el estadístico de prueba: 2 𝑜𝑏𝑠
=∑
(𝑛𝑖 − 𝑒𝑖 )2 (32 − 28,344)2 (15 − 21,258)2 (13 − 10,398)2 = + + = 2,965 𝑒𝑖 28,344 21,258 10,398
Además, la región crítica está definida de la siguiente forma: 𝑅𝐶 = { 𝑥 |
2 𝑜𝑏𝑠
Con: 1 − 𝛼 = 0,95;
>
2 1−𝛼;
}
= 𝑘−−1
𝑘 = 𝑛ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝑠𝑢𝑐𝑒𝑠𝑜𝑠 𝑜 𝑓𝑖𝑙𝑎𝑠 = 𝑛ú𝑚𝑒𝑟𝑜𝑠 𝑑𝑒 𝑒𝑠𝑡𝑖𝑚𝑎𝑑𝑜𝑟𝑒𝑠
Debido a que ocupamos el estimador ̂ , el valor de es igual a uno, y el número de filas después de la modificación es tres, por lo tanto, reemplazando tenemos: 𝑅𝐶 = { 𝑥 |
2 𝑜𝑏𝑠
>
2 0,95;1 }
𝑅𝐶 = { 𝑥 |
2 𝑜𝑏𝑠
> 3,841}
Respuesta: Como 2𝑜𝑏𝑠 ∈ 𝑅𝐶, se concluye que no existe evidencia suficiente para rechazar que el número de defectos en las tarjetas de circuito impreso sigue una distribución Poisson.
Alejandro González Tapia – Ingeniería Civil en Minas
Página 171