INSTITUTO TECNOLÓGICO DE ZACATECAS INGENIERIA INDUSTRIAL
OPCION VII
Gestión de los Sistemas de Calidad Trabajo prueba de hipotesis 7º. Semetre grupo “C” PRESENTA: MISAEL CARDONA ESQUIVEL Docente ING. OSWALDO LÓPEZ
Zacatecas, Zac. Octubre 2017
22. Se desea comprar una gran cantidad de bombillas y se tiene que elegir entre las marcas A y B. Para ello, se compraron 100 focos de cada marca, y se encontró que las bombillas probadas de la marca A tuvieron un tiempo de vida medio de 1 1120 horas, con una desviación estándar de 75 hor as; mientras que las de la marca B tuvieron un tiempo de vida medio de 1 064 horas, con una u na desviación estándar de 82 horas.
a) ¿Es significativa la diferencia entre los tiempos medios de vida? Use a = 0.05. Datos muestra =
100
media =
1120 hrs
varianza =
5625 hrs
Valor t
1.98
significancia
0.05
Datos muestra =
100
media =
1064 hrs
varianza =
6724 hrs
− 1064 = 5.04 = 1120 6 724 5625 + 100 100 5625 6 724 ( + ) 100 100 = 5625 6724 − 2 = 198 ( 100 ) + ( 100 ) 100 + 1 100 + 1 Toma de decisión No se puede aceptar la hipótesis nula ya que con un 95% de confianza podemos decir que las medias de los tiempos de vida de las bombillas son diferentes
b) ¿Con qué tamaño de muestra se aceptaría que las marcas son iguales, utilizando a = 0.05? Con una muestra de 16 23. En un laboratorio bajo condiciones controladas, se evaluó, para 10 hombres y 10 mujeres, la temperatura que cada persona encontró más confortable. Los resultados en grados Fahrenheit fueron los siguientes: Mujer 75 77 78 79 77 73 78 79 78 80 Hombre 74 72 77 76 76 73 75 73 74 75
a) ¿Cuáles son en realidad los tratamientos que se comparan en este estudio? Las temperaturas de 10 mujeres y 10 hombres entre si
b) ¿Las muestras son dependientes o independientes? Explique. Independiente al comparar la temperatura a cada temperatura
c) ¿La temperatura promedio más confortable es igual para hombres que para mujeres? Pruebe la hipótesis adecuada Datos muestra =
10
media =
77.4
varianza =
4.26666667
valor t =
2.10092204
significancia =
0.05
Datos muestra =
10
media =
74.5
varianza=
2.5
valor tabla t = 2.10092204 significancia =
0.05
Para este caso propuse un intervalo de confianza de 95% y una significancia de 0.05.
74.5 = 3.52 = 77.4− 4.1026 + 210.10 4.1026 + 210.10) ( = 4.26 2.10 − 2 = 18 ( 10 ) + ( 10 ) 10 +1 10 + 1 Toma de decisión No se puede aceptar la hipótesis nula ya que con un 95% de confianza podemos decir que las temperaturas promedias de hombre y mujer son diferentes. 24. Se prueban 10 partes diferentes en cada nivel de temperatura y se mide el encogimiento sufrido en unidades de porcentaje multiplicado por 10. Los resultados son:
a) ¿La temperatura tiene algún efecto en el encogimiento? Plantee las hipótesis estadísticas correspondientes a esta interrogante. La temperatura si tiene efecto en el encogimiento ya que a mayor temperatura mayor es el nivel de encogimiento.
b) Dé un intervalo de confianza para la diferencia de medias. Datos muestra =
10
media =
17.24
varianza =
0.70933333
valor t =
2.10092204
significancia =
0.05
Datos muestra =
10
media =
20.62
varianza=
0.27066667
valor tabla t =
2.10092204
significancia =
0.05
20.62 = −10.78 = 17.24− 0.1071 + 010.27 + (10 − 1)(0.27) (10 − 1)(0. 7 1) = √ 10 + 10 − 2 Toma de decisión No se puede aceptar la hipótesis nula y se puede decir que con un 95% de confianza el encogimiento medio de la temperatura alta es mayor que el encogimiento de la temperatura baja.
c) ¿Cuál temperatura provoca un encogimiento menor? La temperatura baja provoca un encogimiento menor.
d) Compare las varianzas en cada temperatura.
Datos muestra =
10
varianza 1 =
0.70933333
varianza 2 =
0.27066667
valor F CD =
4.02599416
valor F CI =
0.24838585
significancia =
0.05
= 0.0.7217 = 2.62 Toma de decisión Se acepta la hipótesis nula y se puede decir que con un 95% de confianza la varianza de las temperaturas es igual. e) Dibuje los diagramas de cajas simultáneos e interprete.
25. Una compañía de transporte de carga desea es coger la mejor ruta para llevar la mercancía de un depósito a otro. La mayor preocupación es el tiempo de viaje. En
el estudio se seleccionaron al azar cinco choferes de un grupo de 10 y se asignaron a la ruta A; los cinco restantes se asignaron a la ruta B. Los datos obtenidos fueron: Ruta Tiempo de viaje A 18 24 30 21 32 B 22 29 34 25 35
a) ¿Existen diferencias significativas entre las rutas? Plantee y pruebe las hipótesis estadísticas correspondientes. Datos muestra =
5
media =
25
varianza =
35
valor t =
2.26215716
significancia =
0.05
Datos
29 = −1.09 = 2535− 31. 5 + 5 5 355 + 31.5 5) ( = 35 35 − 2 = 9 ( 5 ) + ( 5 ) 5+ 1 5 + 1
muestra =
5
media =
29
varianza=
31.5
valor tabla t =
2.26215716
significancia =
0.05
Toma de decisión se puede aceptar la hipótesis nula ya que con un 95% de confianza podemos decir que los tiempos promedios de viaje no tienen diferencias significativas y no hay diferencia entre ellos.
b) En caso de rechazar la hipótesis del inciso a), dibuje los diagramas de cajas simultáneos para determinar cuál ruta es mejor.
c) Sugiera otra manera de obtener los datos (diseño alternativo), de manera que se pueda lograr una comparación más efectiva de las rutas. Se podría obtener una muestra más significativa para cada ruta y calcular su desviación estándar y sus respectivos coeficientes de variación, con esto podríamos
escoger la ruta con el menor coeficiente de variación ya que sus datos serían más homogéneos. 26. Se tienen dos proveedores de una pieza metálica, cuyo diámetro ideal o valor objetivo es igual a 20.25 cm. Se toman dos muestras de 14 piezas a cada proveedor y los datos obtenidos se muestran a continuación: Proveedor Diámetros de las piezas de cada proveedor 1. 21.38, 20.13, 19.12, 19.85, 20.54, 18.00, 22.24, 21.94, 19.07, 18.60, 21.89, 22.60, 18.10, 19.25 2. 21.51, 22.22, 21.49, 21.91, 21.52, 22.06, 21.51, 21.29, 22.71, 22.65, 21.53, 22.22, 21.92, 20.82
a) Describa un procedimiento de aleatorización para la obtención de estos datos. Para obtener datos para una muestra de manera aleatoria podemos utilizar las combinaciones, una vez tomados los datos podemos comparar sus varianzas, medias y proporción de errores de las cuales las podemos comprobar con intervalos e hipótesis.
b) Pruebe la hipótesis de igualdad de los diámetros de los proveedores en cuanto a sus medias. Datos muestra =
14
media =
20.1935714
varianza =
2.50737857
valor t =
2.1199053
significancia =
0.05
Datos muestra =
14
media =
21.8114286
varianza=
0.27936703
valor tabla t =
2.1199053
significancia =
0.05
21.81 = −3.63 = 20.19− 2.1451 + 014.28 2.1451 + 014.28) ( = 2.51 0.28 − 2 = 16 ( 14 ) + ( 14 ) 14 +1 14 + 1 Toma de decisión No se puede aceptar la hipótesis nula ya que con un 95% de confianza podemos decir que las medias de los diámetros son distintas. c) Pruebe la hipótesis de igualdad de varianzas. Datos muestra =
14
varianza 1 =
2.50737857
varianza 2 =
0.27936704
valor F CD =
3.11503569
valor F CI =
0.321023609
significancia =
0.05
= 2.0.5218 = 8.96 No se acepta la hipótesis nula y se puede decir que con un 95% de confianza las varianzas de los diámetros son diferentes.
d) Si las especificaciones para el diámetro son 20.25 mm ± 2.25 mm, ¿cuál proveedor produce menos piezas defectuosas? El proveedor 1 tiene una defectuosa y el proveedor dos tiene dos.
e) ¿Con cuál proveedor se quedaría usted? Con el proveedor 1.
27. En Kocaoz, S. Samaranayake, V. A. Nanni A. (2005) se presenta un estudio donde se analizan dos tipos de barras de polímero, cuya tensión se refuerza con fibra de vidrio (FRP). Estas barras, en sustitución de las vigas de acero, son utilizadas para reforzar concreto, por lo que su caracterización es importante para fines de diseño, control y optimización para los ingenieros estructurales. Las barras se sometieron a tensión hasta registrarse su ruptura (en Mpa). Los datos para dos tipos de barras se muestran a continuación: Tipo de barra Resistencia 1
939 976 1025 1034 1015 1015 1022 815
2
1025 938 1015 983 843 1053 1038 938
a) Formule la hipótesis para probar la igualdad de medias de los tratamientos. Datos muestra =
8
media =
980.125
varianza =
5439.55357
valor t =
2.13144955
significancia =
0.05
Datos muestra =
8
media =
979.125
varianza=
4891.83929
valor tabla t =
2.13144955
significancia =
0.05
125 − 979.125 = 0.027 = 980. 5439.8 55 + 4891.8 83
5439.8 55 + 4891.8 83) ( = 5439.55 4891.83 − 2 = 15 ( 8 ) + ( 8 ) 8+ 1 8+1 b) Anote la fórmula del estadístico de prueba para demostrar la hipótesis.
c) Pruebe la hipótesis a un nivel de significancia de 5%. Para rechazar o no la hipótesis, apóyese tanto en el criterio del valor-p como en el del valor crítico de tablas. Toma de decisión Se puede aceptar la hipótesis nula ya que con un 95% de confianza podemos decir que las medias de las resistencias en los tratamientos son iguales ya que la significancia obtenida en el valor p es muy alta, es decir .97
d) Explique cómo se obtiene el valor-p del inciso anterior. Con e valor de x es decir del estadístico de prueba.
e) Pruebe la hipótesis de igualdad de varianzas entre tratamientos. Datos muestra =
8
varianza 1 =
5439.55357
varianza 2 =
4891.83929
valor F CD =
4.99490922
valor F CI =
0.200203839
significancia =
0.05
55 = 1.11 = 5439. 4891.83 Se puede aceptar la hipótesis nula ya que con un 95% de confianza podemos decir que la desviación los tratamientos son iguales.
f) ¿Existe algún tratamiento mejor? Entre ellos no, ya que no hay diferencias significativas. 28. Se realiza un estudio para comparar dos tratamientos que se aplicarán a frijoles crudos, con el objetivo de reducir el tiempo de cocción. Un tratamiento (T1) es a base de bicarbonato de sodio; el otro, T2, es a base de cloruro de sodio o sal común. La variable de respuesta es el tiempo de cocción en minutos. Se hacen siete réplicas. Los datos se muestran en la siguiente tabla: Tratamiento Tiempo T1 76 85 74 78 82 75 82 T2 57 67 55 64 61 63 63
a) Formule la hipótesis para probar la igualdad de medias de los tratamientos. Datos muestra =
7
media =
78.8571429
varianza =
17.4761905
valor t =
2.160368656
significancia =
0.05
Datos muestra =
7
media =
61.4285714
varianza=
17.2857143
valor tabla t = 2.160368656 significancia =
0.05
61.43 = 7.82 = 78.86− 17.748 + 17.729 17.748 + 17.729) ( = 17.48 17.29 − 2 = 13 ( 7 ) + ( 7 ) 7+1 7+1 b) Anote la fórmula del estadístico de prueba para probar la hipótesis.
c) Pruebe la hipótesis a un nivel de significancia de 5%. Para rechazar o no la hipótesis, apóyese tanto en el criterio del valor-p como en el valor crítico de tablas.
Toma de decisión No se puede aceptar la hipótesis nula ya que con un 95% de confianza podemos decir que las medias de las resistencias en los tratamientos son diferentes ya que la significancia obtenida en el valor p es muy baja es de .0000028. d) Pruebe la hipótesis de igualdad de varianzas entre tratamientos. Datos muestra =
7
varianza 1 =
17.4761905
varianza 2 =
17.2857143
valor F CD =
5.81975658
valor F CI =
0.171828493
significancia =
0.05
48 = 1.01 = 17. 17.29 Toma de decisión Se acepta la hipótesis nula ya que con un 95% de confianza podemos decir que las desviaciones en los tratamientos son semejantes.
e) De acuerdo con el análisis hecho hasta aquí, ¿hay algún tratamiento mejor? No ya que los datos no presentan grandes diferencias. 29. Se comparan dos métodos para inocular o contagiar una cepa del hongo del maíz conocido como huitlacoche. En una primera etapa del estudio, el experimentador quiere determinar cuál de los métodos genera mayor porcentaje de infección. El método A consiste en cortar la punta de la mazorca para aplicar la cepa, y en el método B se inyecta la cepa de forma transversal. De 41 mazorcas inoculadas con el método A, 20 se infectaron, es decir, generaron huitlacoche; en tanto, de 38 mazorcas inoculadas con el método B se infectaron 27.
a) ¿Hay evidencia estadística suficiente para afirmar que el método B genera una mayor infección de huitlacoche? Plantee y pruebe la hipótesis correspondiente. Datos proporción 1 =
0.48780488
proporción 2 =
0.71052632
proporción g. =
0.59493671
muestra 1 =
41
muestra 2 =
38
valor tabla z =
1.95996395
significancia =
0.05
= 0.49 −0.71 = −2.01 1 1 0.60(0.60)(41 + 38) Toma de decisión No puede aceptar la hipótesis alternativa ya qu e con un 95% de confianza podemos afirmar que el método B genera una mayor infección huitlacoche.
30. El mejor método de inoculación del problema anterior se aplicó a dos variedades de maíz en dos localidades. Una vez infectada la mazorca, interesa medir el porcentaje final de la superficie de ésta que fue cubierta por el hongo y el peso en gramos del huitlacoche. Los resultados para la variedad 2 de maíz, obtenidos en 15 mazorcas de Texcoco y en 15 mazorcas de Cela ya son los siguientes:
a) ¿Se puede afirmar que el porcentaje de cobertura del hongo es mayor en Celaya que en Texcoco? Datos muestra =
15
media =
38
varianza =
613.571429
valor t =
2.055529439
significancia =
0.05
Datos muestra =
15
media =
62.6666667
varianza=
1281.66667
valor tabla t = 2.055529439 significancia =
0.05
7 = −2.19 = 613.385−7 62. 16281. 15 + 15 67 613.1557 + 1281. 6 7 ( ) 15 − 2 = 26 = 613.57 1281. ( 15 ) + ( 15 67) 15 + 1 15 + 1 Toma de decisión Se puede aceptar la hipótesis nula ya que con un 95% de confianza podemos afirmar que el método B genera una mayor infección huitlacoche. b) Utilice un diagrama de dispersión (gráfica tipo X-Y) para ver si existe una relación lineal entre el porcentaje de cobertura de la mazorca con los gramos de huitlacoche. CELAYA 400 300 200 100 0 0
20
40
60
80
100
120
TEXCOCO 300 200 100 0 0
20
40
60
80
100
Se refleja una ligera relación entre la cobertura y el peso del huitlacoche.
c) Ignore la cobertura y pruebe la igualdad de la producción promedio de huitlacoche en las dos localidades. Datos muestra =
15
media =
93.4626667
varianza =
3423.16662
valor t =
2.16036866
significancia =
0.05
Datos muestra =
8
media =
143.65
varianza=
10051.4505
valor tabla t =
2.16036866
significancia =
0.05
93.46 − 143.65 = −1.67 = 3423. 4 5 15 16 + 10051. 15 3423. 1 6 1 0051. 4 5 ( + ) 15 15 = 3423.16 10051.45 − 2 = 23 ( 15 ) + ( 15 ) 15 + 1 15 + 1 Toma de decisión Se acepta la hipótesis nula ya que con un 95% de confianza podemos afirmar que hay una producción promedio semejante de huitlacoche.
d) Es evidente que a mayor cobertura hay una mayor producción de huitlacoche, ¿habría forma de saber con estos datos si a igual cobertura corresponde una producción de huitlacoche semejante en ambas localidades? Argumente su respuesta. No porque varia de la localidad y también no hay datos suficientes 31. Con respecto al problema del ejercicio 18, se desea comparar dos tratamientos para hacer que germine cierta semilla. Los datos del tratamiento A son los del ejercicio 18, es decir, de 60 semillas puestas a germinar se observó que 37 de ellas germinaron. Mientras que para el tratamiento B, de 70 semillas se observó que 30 germinaron.
a) ¿Hay una diferencia significativa entre los dos tratamientos? Pruebe la hipótesis correspondiente a 95% de confianza. Datos proporción 1 =
0.61666667
proporción 2 =
0.42857143
proporción g. =
0.51538462
muestra 1 =
60
valor tabla z =
1.95996398
muestra 2 =
70
significancia =
0.05
= 0.62 −0.43 = 2.14 1 1 0.52(0.52)(60 + 70) b) Estime, con una confianza de 95%, la proporción de germinación que se logrará con cada tratamiento. Toma de decisión No se puede aceptar la hipótesis nula ya que con un 95% de confianza podemos afirmar que no hay diferencias significativas entre los dos tratamientos.
32. Se desea comparar dos proveedores; para ello, se toma una muestra aleatoria de la producción de cada uno de n = 150 piezas, y se les hace en orden aleatorio una prueba. En el caso del primer proveedor se obtuvieron x1 = 11 piezas que no pasaron la prueba, mientras que para el segundo fueron x2 = 22.
a) ¿Qué proveedor parece mejor? Ha simple vista parece mejor el proveedor 1 ya que tiene menos piezas defectuosas.
b) ¿Hay una diferencia significativa entre los dos proveedores? Pruebe la hipótesis correspondiente a 95% de confianza. Datos
=
proporción 1 =
0.07333333
proporción 2 =
0.14666667
proporción g. =
0.11
muestra 1 =
60
valor tabla z =
1.95996398
muestra 2 =
70
significancia =
0.05
0.73 − 0.15 = −2.03 1 + 1501 ) 0.11(0.11)(150
Toma de decisión Toma de decisión No se puede aceptar la hipótesis nula ya que con un 95% de confianza podemos afirmar que no hay diferencias significativas entre los proveedores.