Laboratorio Laboratorio de Estadística Industrial
UNIVERSIDAD NACIONAL MAYOR DE SAN MARCOS FACULTAD DE INGENIERÍA INDUSTRIAL
INFORME FINAL DE LABORATORIO PROFESOR: ING. PÉREZ QUISPE, VÍCTOR CURSO: ESTADÍSTICA INDUSTRIAL INTEGRANTES:
CASTILLO CHUMACERO DIEGO YOEL
1
12170092
Laboratorio Laboratorio de Estadística Industrial
INDICE:
PRUEBA DE HIPOTESIS HIPOTESIS DE LA MEDIA DE LA POBLACION: POBLACION: ............................................................................................3 PRUEBA DE HIPOTESIS DE DOS MEDIAS POBLACIONALES: ..........................................................................................5 PRUEBA DE HIPOTESIS PARA PROPORCIONES ............................................................................................................6 PRUEBA DE HIPOTESIS PARA PROPORCIONEDS CON OBSERVACIONES INDEPENDIENTES ..........................................7 PRUEBA DE HIPOTESIS T STUDENT ..............................................................................................................................9 PRUEBA DE HIPOTESIS PARA DIFERENCIA ENTRE DOS MEDIAS ................................................................................. 11 PRUEBA DE HIPOTESIS DE MUESTRA PAREADA .........................................................................................................14 COMPARACION DE DOS VARIANZAS POBLACIONALES ...............................................................................................17 ANOVA UNA DIRECCION: ............................................................................................................................................ 19
PROBLEMAS 1.-................................................................................................................................................................. 19 PROBLEMA 2.- .................................................................................................................................................................. 21 ANOVA DOS DIRECCIONES: ........................................................................................................................................ 24
PROBLEMA 1.- .................................................................................................................................................................. 24 PROBLEMA 2.- .................................................................................................................................................................. 27 REGRESION SIMPLE: .................................................................................................................................................. 31
PROBLEMA 1.- .................................................................................................................................................................. 31 PROBLEMA 2.- .................................................................................................................................................................. 32 PROBLEMA 3.- .................................................................................................................................................................. 35 PROBLEMA 4.- .................................................................................................................................................................. 38 REGRESION MULTIPLE ............................................................................................................................................... 39 METODOS NO PARAMETRICOS: ..................................................................................................................................53
SERIE DE TIEMPO:
2
………………………………………………………………………… …………………………………………………………………………………………………………… …………………………………………………… …………………75
Laboratorio Laboratorio de Estadística Industrial
INDICE:
PRUEBA DE HIPOTESIS HIPOTESIS DE LA MEDIA DE LA POBLACION: POBLACION: ............................................................................................3 PRUEBA DE HIPOTESIS DE DOS MEDIAS POBLACIONALES: ..........................................................................................5 PRUEBA DE HIPOTESIS PARA PROPORCIONES ............................................................................................................6 PRUEBA DE HIPOTESIS PARA PROPORCIONEDS CON OBSERVACIONES INDEPENDIENTES ..........................................7 PRUEBA DE HIPOTESIS T STUDENT ..............................................................................................................................9 PRUEBA DE HIPOTESIS PARA DIFERENCIA ENTRE DOS MEDIAS ................................................................................. 11 PRUEBA DE HIPOTESIS DE MUESTRA PAREADA .........................................................................................................14 COMPARACION DE DOS VARIANZAS POBLACIONALES ...............................................................................................17 ANOVA UNA DIRECCION: ............................................................................................................................................ 19
PROBLEMAS 1.-................................................................................................................................................................. 19 PROBLEMA 2.- .................................................................................................................................................................. 21 ANOVA DOS DIRECCIONES: ........................................................................................................................................ 24
PROBLEMA 1.- .................................................................................................................................................................. 24 PROBLEMA 2.- .................................................................................................................................................................. 27 REGRESION SIMPLE: .................................................................................................................................................. 31
PROBLEMA 1.- .................................................................................................................................................................. 31 PROBLEMA 2.- .................................................................................................................................................................. 32 PROBLEMA 3.- .................................................................................................................................................................. 35 PROBLEMA 4.- .................................................................................................................................................................. 38 REGRESION MULTIPLE ............................................................................................................................................... 39 METODOS NO PARAMETRICOS: ..................................................................................................................................53
SERIE DE TIEMPO:
2
………………………………………………………………………… …………………………………………………………………………………………………………… …………………………………………………… …………………75
Laboratorio Laboratorio de Estadística Industrial
LABORATORIO DE ESTADISTICA INDUSTRIAL PRUEBA DE HIPOTESIS DE LA MEDIA DE LA POBLACION:
PRUEBA BILATERAL DE DOS COLAS: Problema 1.En Western University, la media histórica en las puntuaciones de los solicitantes de una beca es 900. La desviación estándar poblacional histórica que se considera conocida es s=180. Cada año, el decano asistente utiliza una muestra de las solicitudes para determinar si la puntuación media ha cambiado entre los solicitantes de becas. a) Establezca la hipótesis. b) ¿Cuál es el intervalo de 95% de confianza para la estimación de la media poblacional de las puntuaciones en el examen si en una muestra de 200 de estudiantes la media muestral es 935? c) Use el intervalo de confianza para realizar una prueba de hipótesis. Manejando α = 0.05, ¿a que conclusión llega? d) ¿Cuál es el valor p? SOLUCION: 1) Ho: µ = 900 Ha: µ ≠ 900
2) α =0.05 3) Z, n≥30 4) El valor crítico es -1.96 Intervalos: R.C = <-∞, -1.96> U <1.96, ∞> R.A = [-1.96 , 1.96] Zk ɛ R.C : Rechazo Ho , acepto Ha. 5)
Interpretación:
La puntuación media de los solicitantes de becas ha cambiado.
Calculando el valor de p Para z = -2.75 → 0.003 P= 2 x 0.003 = 0.006 P < α → Rechazo Ho, Ho, acepto Ha.
3
= 900935 180√ √ 200200 = 2.75
Laboratorio de Estadística Industrial
Solución Minitab:
Pasos a seguir en Minitab:
En la opción de la barra de menu selecciona las opciones estadísticas. Luego la opción z de una muestra. Opción datos resumidos (tamaño de la muestra, media). Luego escogemos si es una prueba de una cola o dos colas.
PRUEBA UNILATERAL DERECHA Problema 2.Una empresa de venta de bienes raíces a nivel estatal, Farm Associates, se especializa en ventas de propiedades rurales en el estado de Nebraska. Sus registros indican que el tiempo medio de venta de una granja es de 90 días. Debido a sus recientes condiciones de sequía, estima que el tiempo de venta será superior a 90 días. Un estudio a nivel estatal de 100 granjas vendidas recientemente revelo que el tiempo medio de venta era 94 días, con una desviación estándar de 22 días. Al nivel de significancia de 0.10, ¿se puede concluir que el tiempo de venta ha aumentado? SOLUCION: 1) Ho: µ = 90 Ha: µ > 90 2) α = 0.10 3) Z , n≥30 4) Intervalos: R.C : <1.282 , ∞> R.A : < -∞ , 1.282] Zk ɛ R.C. Rechazo Ho, acepto Ha. 5)
= 9√ 490 22100 = 1.82
Interpretación: El tiempo promedio de venta de bienes raíces a nivel estatal de la empresa Farm Associates especialista en ventas de propiedades rurales en el estado de Nebraska aumento.
4
Laboratorio de Estadística Industrial
Solución Minitab.
Pasos a seguir en Minitab:
En la opción de la barra de menu selecciona las opciones estadísticas. Luego la opción z de una muestra. Opción datos resumidos (tamaño de la muestra, media). Luego escogemos si es una prueba de una cola o dos colas.
PRUEBA DE HIPOTESIS DE DOS MEDIAS POBLACIONALES: PRUEBA BILATERAL DOS COLAS ProblemaSe esperaba que el día de san Valentín el gasto promedio fuera de 100.89 (USA Today, 13 de febrero de 2006). Hay diferencia en las cantidades que desembolsan los hombres y las mujeres? el gasto promedio en una muestra de 40 hombres fue de 135.67 y en una muestra de 30 mujeres fue de 68.64. Por estudios anteriores se sabe que la desviación estándar poblacional en el consumo de los hombres es 35 y en el de las mujeres es 20. a) ¿Cuál es la estimación puntual de la diferencia entre el gasto medio poblacional de los hombres y el gasto medio poblacional de las mujeres? b) Elabore un intervalo de confianza de 99% para la diferencia entre las dos medias poblacionales. SOLUCION: 1) Ho: µ1 = µ2 Ha: µ1 ≠ µ2 2) α = 0.01 3) Z , n ≥ 30 4) Para α = 0.01 → Z = 2.575 5)
5
620 4 = 10.1 = 135. 34056768. 30
Laboratorio de Estadística Industrial
Intervalos: R.C : ˂-∞,-2.575˃U<2.575,∞˃ RA:[-2.575,2.575] Zk ɛ R.C, Acepto Ha, rechazo Ho. Interpretación: No hay diferencia en el gasto promedio en el día de San Valentín de hombres y mujeres.
PRUEBA DE HIPOTESIS PARA PROPORCIONES PRUEBA UNILATERAL DERECHA Problema 1.Un artículo reciente, publicado en el diario USA Today, indica que solo a uno de cada tres egresados recientes de una universidad les espera un puesto de trabajo. En una investigación a 100 egresados recientes de su universidad, se encontró que 80 tenían un puesto de trabajo. ¿Puede concluirse, en el nivel de significancia 0.02, que en su universidad la proporción de estudiantes que tienen trabajo es mayor? SOLUCION: 1) Ho: P= 0.333 Ha: P > 0.333 2) α = 0.02 3) Z 4) Para α = 0.02 → Z = 2.05 5)
Intervalos: R.C: < -∞ , 2.05>
80.333333) = 9.91 = 0 .30.33∗(10. 100
R.A: [2.05 , ∞> Zk ɛ RC → Rechazo Ho, acepto Ha.
Interpretación: Podemos concluir que la proporción de egresados de dicha universidad es mayor a 0.333. Utilizando Minitab:
Prueba e IC para una proporción
Prueba de p = 0.333 vs. p no = 0.333
Muestra X 1
N Muestra p
80 100
0.800000 (0.721601, 0.878399)
Uso de la aproximación normal.
6
IC de 95%
Valor Z Valor P 9.91
0.000
Laboratorio de Estadística Industrial
Pasos en Minitab:
En la opción de la barra de menu selecciona las opciones estadísticas y luego estadísticas básicas. Luego la opción 1proporcion de una muestra. Opción datos resumidos (número de eventos y numero de ensayos). Escogemos también una proporción hipotética. Luego escogemos si es una prueba de una cola o dos colas.
PRUEBA DE HIPOTESIS PARA PROPORCIONEDS CON OBSERVACIONES INDEPENDIENTES PRUEBA BILATERAL: Problema 1.En una prueba de calidad de dos comerciales de televisión, cada anuncio se transmitió, en áreas separadas de prueba, seis veces en una semana. A la semana siguiente se realizó una encuesta telefónica para identificar individuos que vieron los comerciales. A estas personas se les pidió su opinión sobre cuál era el principal mensaje de los anuncios. Se obtuvieron los siguientes resultados. Comercial A Comercial B Número de personas que vio el comercial 150 200 Número de personas que recordaba el mensaje 63 60 a) Use α=0.05 y pruebe la hipótesis de que entre los dos comerciales no hay diferencia en las proporciones poblacionales de personas que recordaron el mensaje. b) Calcule un intervalo de 95% de confianza para la diferencia entre las proporciones de personas que recordaron el mensaje en las dos poblaciones. SOLUCION: 1) Ho: p1=p2 Ha: p1≠p2 2) α
3) Z, n>30 4) Para α=0.05: Z=1.64 5)
= . (.−.−.)( + ) = 2.174
Intervalos: RC: <-∞;-1.64>U<1.64; ∞> RA: [-1.64;1.64] Zk ɛ RC → Rechazo Ho, acepto Ha. Interpretación: Se concluye que hay diferencia en la proporción de personas que recordaron el mensaje del comercial A y la proporción de personas que recordaron el mensaje del comercial B. Utilizando con Minitab: Prueba e IC para dos proporciones Muestra X N Muestra p 1 63 150 0.420000 2 60 200 0.300000
7
Laboratorio de Estadística Industrial
Diferencia = p (1) - p (2) Estimado de la diferencia: 0.12 IC de 95% para la diferencia: (0.0186488, 0.221351) Prueba para la diferencia = 0 vs. No = 0: Z = 2.33 Valor P = 0.020
Como el valor de p=0.02<0.05 rechazamos la hipótesis nula y concluimos que hay diferencia en la proporción de personas que recordaron el mensaje del comercial A y la proporción de personas que recordaron el mensaje del comercial B. Pasos para Minitab:
En la opción de la barra de menu selecciona las opciones estadísticas y luego estadísticas básicas. Luego la opción 1proporcion de una muestra. Opción datos resumidos (número de eventos y numero de ensayos). Escogemos también una proporción hipotética. Luego escogemos si es una prueba de una cola o dos colas.
PRUEBA BILATERAL: Problema 2.Una muestra aleatoria de 1000 ciudadanos nacidos en EUA, revelo que 198 estuvieron a favor de la reanudación de las relaciones diplomáticas con cuba. Análogamente 117 ciudadanos de una muestra de 500 estadounidenses no nacidos en EUA, estuvieron a favor. Al nivel de significancia de 0.05, ¿hay diferencia en la proporción de ciudadanos de EUA nacidos ahí que estén a favor de la reanudación de las relaciones diplomáticas con Cuba, y la proporción de los estadounidenses no nacidos en el país que están a favor de tales relaciones? SOLUCION: Nacidos EUA X1=198 N1=1000
+ +
P1= Pc=
No Nacidos en EUA X2=177 N2=500
=0.198
P2=
=0.25
=0.354
1) Ho: P1=P2 Ha:P1 ≠P2 2) α = 0.05 3) Z , n ≥ 30 4) Para α=0.05 (dos colas) →Z=1.96
5)
3541 1 = 6.28 = 0.25×(10.0.198. 25)×(1000 500)
Zk ɛ R.C, Rechazo Ho, Acepto Ha.
8
Laboratorio de Estadística Industrial
Pasos para Minitab:
En la opción de la barra de menu selecciona las opciones estadísticas y luego estadísticas básicas. Luego la opción 1proporcion de una muestra. Opción datos resumidos (número de eventos y numero de ensayos). Escogemos también una proporción hipotética. Luego escogemos si es una prueba de una cola o dos colas.
Interpretación: Hay diferencia en la proporción de ciudadanos de EUA nacidos ahí que estén a favor de la reanudación de las relaciones diplomáticas con Cuba, y la proporción de los estadounidenses no nacidos en el país que están a favor de tales relaciones. PRUEBA DE HIPOTESIS T STUDENT PRUEBA UNILATERAL IZQUIERDA Problema 1.El fabricante de las motocicletas Ososki asegura q éstas dan un rendimiento promedio de 87 millas por galón de gasolina. En una muestra de ocho motocicletas los rendimientos fueron: 88 82 81 87 80 78 79 89 En el nivel de significancia 0.05, ¿el rendimiento es inferior a 87 millas por galón? SOLUCION: 1) Ho: µ1=µ2 Ha: µ1 < µ2 2) α= 0.05 3) t Para α=0.05 → t=-1.89 GL=7 4) Intervalos: R.C: < - ∞, -1.89> R.A: [ -1.89 , ∞> Tk ɛ R.C → Rechazo Ho , acepto Ha. 5)
9
Laboratorio de Estadística Industrial
= 8783 4.√ 374 = 2.61 Interpretación: El rendimiento promedio de las motocicletas Ososki es menor de 87 millas por galón de gasolina. Pasos para Minitab:
En la barra de menú seleccionamos la opción de estadísticos, luego estadísticos básicos. Luego seleccionamos la opción de seleccionamos t de una muestra. Seleccionamos datos en columnas. Ponemos como dato una media hipotética.
PRUEBA UNITALERAL IZQUIERDA: Problema 2.El consumo anual per cápita de leche en Estados Unidos es de 21.6 galones. Usted cree que en el oeste medio el consumo de leche es mayor y desea fundamentar su opinión. En una muestra de 16 persona en Webster City, pueblo del oeste medio, la media muestral del consumo anual es de 21.4 galones y la desviación estándar es s=4.8 a) Elabore una prueba de hipótesis que se pueda usar para determinar si el consumo medio anual en webster city es mayor que la media nacional. b) t ¿Cuál sería una estimación puntual de la diferencia entre el consumo medio anual en webster city y la media nacional?
10
Laboratorio de Estadística Industrial
SOLUCION: 1) Ho:µ=21.6 Ha: µ˂21.6 2) α= 0.05 3) t 4) G.L=16-1=15 R.A:[-1.75,∞> R.C:˂∞,-1.75> Tk ɛ R.A → Rechazo Ha, acepto Ho.
5)
t=
..−. √
=-0.17
Interpretacion: El promedio de consumo de leche en el oeste medio es igual al consumo de leche anual per capita de leche en Estados Unidos. Pasos para Minitab:
En la barra de menú seleccionamos la opción de estadísticos, luego estadísticos básicos. Luego seleccionamos la opción de seleccionamos t de una muestra. Seleccionamos datos en columnas.
PRUEBA DE HIPOTESIS PARA DIFERENCIA ENTRE DOS MEDIAS Problema 1.Con cierta periodicidad, Merrill Lynch solicita a sus clientes evaluaciones sobre los consultores y los servicios financieros que les proporciona. Las puntuaciones más altas en la encuesta de satisfacción del cliente indican mejor servicio con 7 como la puntuación más alta. A continuación se presentan en forma resumida las puntuaciones otorgadas a dos consultores financieros por los miembros de dos muestras aleatorias independientes. El consultor A tiene10 años de experiencia, mientras que el consultor B tiene solo 1 año. Use α=0.05 y realice una prueba para determinar si el consultor con más experiencia tiene la media poblacional más alta en la evaluación del servicio. Consultor A N1=16
11
n2=10
Consultor B
Laboratorio de Estadística Industrial
X1(media muestral 1)=6.82 x2(media muestral 2)=6.25 S1=0.64 s2=0.75 SOLUCION: 1) Ho: µA = µB Ha: µA > µB 2) α= 0.05 3) t 4) Para α=0.05 → t=1.711 GL=16 +10 – 2= 24 5)
Intervalos: R.A: <-∞, 1.711]
6. 8 26. 7 5 = 15∗0. 16102 64 9∗0.75 ∗(16 1 101 ) = 2.07
R.C:<1.711 , ∞> Tk ɛ R.C → Rechazo Ho, acepto Ha.
Interpretación: El consultor con más experiencia tiene la media poblacional más alta en la evaluación del servicio. Pasos para Minitab:
En la barra de menú seleccionamos la opción de estadísticos, luego estadísticos básicos. Luego seleccionamos la opción de seleccionamos t de dos muestra. Seleccionamos datos resumidos (tamaño de una muestra, desviación, etc.).
PRUEBA UNILATERAL IZQUIERDA: Problema 2.El gerente de una empresa de servicios de mensajería considera que los paquetes enviados al final del mes son más pesados que los enviados al principio del mes. Como un experimento, pesó una muestra aleatoria de 20 paquetes remitidos a principio de un mes. Encontró que el peso medio era de 20.25 libras, y la desviación estándar, 5.84 libras. Al final del mes se seleccionaron al azar diez paquetes y se encontró que su peso medio era 24.80 libras, y la desviación estándar, 5.67 lb. Al nivel de significancia de 0.05 lb, ¿puede concluirse que los paquetes enviados al final del mes son más pesados? SOLUCION:
12
Laboratorio de Estadística Industrial
INICIO DEL MES S1=5.84 N1=20 X1=20.25 1) Ho: µ1 = µ2 Ha: µ1 ˂ µ2 2) α = 0.05 3) t, n ˂ 30
FINAL DEL MES S2=5.67 N2=10 X2=24.80
4) GL=20+10-2=28 T(0.05,28)=-1.701 Gráfica de distribución T, df=28 0.4
0.3 d a d i s n 0.2 e D
0.1
0.05
0.0 -1.701
0
X
×.+×. . .×(−. + ) 5)
t=
Sp2=
=33.48
=-2.03
tk ɛ R.C, Rechazo Ho, Acepto Ha. Interpretación: El peso medio de los paquetes enviados al final del mes es más pesado que los enviados al principio del mes.
13
Laboratorio de Estadística Industrial
Minitab:
Pasos para Minitab:
En la barra de menú seleccionamos la opción de estadísticos, luego estadísticos básicos. Luego seleccionamos la opción de seleccionamos t de dos muestra. Seleccionamos datos resumidos (tamaño de una muestra, desviación, etc.).
PRUEBA DE HIPOTESIS DE MUESTRA PAREADA PRUEBA UNILATERAL IZQUIERDA PROBLEMA 1.Scott Seggity, propietario de Seggity Software, Inc., adquirió recientemente un circuito integrado especial, un coprocesador matemático que reduciría de modo significativo el tiempo de procesamiento para probar el circuito, seleccionó una muestra de 12 programas, los cuales fueron utilizados en 2 computadoras idénticas, una con el circuito y la otra sin él. A continuación se reportan los tiempos de procesamiento, en segundos. Al nivel de significancia de 0.05, ¿puede concluir el señor Seggity que el nuevo coprocesador matemático reducirá el tiempo de procesamiento? Determine el valor p. PROGRAMA 1 2 3 4 5 6 7 8 9 10 11 12
SOLUCION: 1) Ho: µd = 0 Ha: µd < 0 2) Para α= 0.05 3) T
14
SIN COPROCESADOR CON PROCESADOR 1.23 0.60 0.69 0.93 1.28 0.95 1.19 1.37 0.78 0.62 1.02 0.99 1.30 0.60 1.37 1.35 1.29 0.67 1.17 0.89 1.14 1.29 1.09 1.00
DIFERENCIA -0.63 0.24 -0.33 0.18 -0.16 -0.03 -0.7 -0.02 -0.62 -0.28 0.15 -0.9
Laboratorio de Estadística Industrial
4) Para α= 0.05, G.L = 12-1=11 → t=- 1.796 5)
= −..√ =
2.03
Intervalos:
En minitab:
̅ = 3.121 =3.0.1258 ̅ = 2.40811 12 = 0.38
R.C:˂-∞,-1.796 > R.A :<-1.796, ∞> Tk Ɛ R.C → Rechazo Ho, acepto Ha. Interpretación: Puede concluir el señor Seggity que el nuevo coprocesador matemático reducirá el tiempo de procesamiento.
Pasos en minitab:
Seleccionamos de la barra de menú la opción estadísticas. Luego estadísticas básicas, la opción de t de muestra pareada. Colocamos los datos de la primera muestra y la segunda muestra.
PRUEBA UNILATERAL DERECHA: Problema 2.Una firma de investigación de mercados usa una muestra de individuos para calificar el potencial de compra de un determinado producto antes y después de que los individuos vean un comercial de televisión que lo promociona. La calificación del potencial de compra se efectúa con una escala del al 10, con los valores más altos indicando un mayor potencial. En la hipótesis nula se establece que la media de las calificaciones de “después” será menor o igual a la media de las calificaciones de “antes”. El rechazo de esta hipótesis indica que el comercial mejora la media de la calificación del potencial de compra. Use α=0.05 y los datos de la siguiente tabla para probar esta hipótesis y exprese
un comentario sobre la utilidad del comercial.
15
Laboratorio de Estadística Industrial
CALIFICACION DE COMPRA DESPUES ANTES 6 5 6 4 7 7 4 3 3 5 9 8 7 5 6 6
INDIVIDUOS 1 2 3 4 5 6 7 8
d 1 2 0 1 -2 1 2 0
SOLUCION: Después (µ2) Antes (µ1) 1) Ho: µd=0 Ha: µd>0 2) α = 0.05 3) t, n ˂ 30 4) GL=8-1=7 T(0.05,7)=1.895 5)
∑∑= 5 (∑ ) =15
∑− − ..
Sd=
T=
√
=
=1.30
=1.36
Tk ɛ R.A, Rechazo Ha, Acepto Ho. Interpretación: La media de las calificaciones de potencial de compra de un determinado producto después de ver el comercial en la televisión será igual a la media de las calificaciones antes de ver el comercial. Solución con minitab:
16
Laboratorio de Estadística Industrial Pasos en minitab:
Seleccionamos de la barra de menú la opción estadística. Luego estadísticas básicas, la opción de t de muestra pareada. Colocamos los datos de la primera muestra y la segunda muestra.
COMPARACION DE DOS VARIANZAS POBLACIONALES Problema 1.La mayoría de los conductores sabe que el gasto anual medio en reparaciones de un automóvil depende de la antigüedad del vehículo. Un investigador desea saber si la varianza de los gastos anuales que se aplican en reparación también aumenta con la antigüedad del vehículo. En una muestra de 26 automóviles de 4 años de antigüedad, la desviación estándar muestral para los gastos anuales en reparación fue de $170, y en una muestra de 25 automóviles de 2 años de antigüedad fue de $100. a) Establezca las versiones nula y alternativa de la hipótesis de investigación de que la varianza en los gastos anuales por reparación es mayor entre más viejos son los automóviles. b) Empleando 0.01 como nivel de significancia SOLUCION: 1) Ho: σ1 =σ2 Ha: σ1 >σ2 2) α= 0.01
3) F 4) F = 2.59
5)
= = 2.89
Intervalos: R.C: ˂2.59 , ∞> R.A: ˂-∞, 2.59] Fk Ɛ R.C → Rechazo Ho, acepto Ha. Solución en minitab:
17
Laboratorio de Estadística Industrial
Interpretación: La varianza en los gastos anuales por reparación es mayor entre más viejos son los automóviles. Pasos en minitab: En la barra de menú opción estadísticas. Opción estadísticas básicas. Luego la opción de dos varianzas. Como tenemos de dato la desviación estándar y el tamaño de la muestra en datos seleccionamos esa opción. Luego en el cuadro de dialogo opciones escogemos el n.s. luego aceptar, aceptar.
PRUEBA BILATERAL: Problema 2.La compañía Stargell Research Associates realizó un estudio acerca de los hábitos de los radioescuchas, tanto de hombres como de mujeres. Un aspecto del estudio comprendió el tiempo promedio de audición. Se descubrió que el tiempo promedio para los varones es de 35 minutos al día. La desviación estándar en la muestra de los 10 hombres que se estudiaron fue 10 minutos por día. El tiempo promedio de audición para las 12 mujeres estudiadas fue también 35 minutos, pero la desviación estándar fue 12 minutos. Al nivel de significancia 0.10, ¿es posible concluir que existe diferencia éntre la variación de los tiempos de audición de hombres y mujeres? SOLUCION: VARONES X1=35 N1=10 S1=10
MUJERES X2=35 N2=12 S2=12
1) Ho: Ϭ12=Ϭ22 Ha :Ϭ12 ≠Ϭ22 2) α = 0.10 3) Para: F(0.05,11,9)=3.11 F(0.05,9,11)=2.90 =0.48
.
RA:[0.48,3.11]
18
Laboratorio de Estadística Industrial
Fk=
=1.44
Fk ɛ R.A, Rechazo Ha, Acepto Ho Interpretación: La variación del hábito del tiempo promedio de audición entre hombres y mujeres es igual.
Minitab: Pasos en minitab: En la barra de menú opción estadísticas. Opción estadísticas básicas. Luego la opción de dos varianzas. Como tenemos de dato la desviación estándar y el tamaño de la muestra en datos seleccionamos esa opción. Luego en el cuadro de dialogo opciones escogemos el n.s. luego aceptar, aceptar.
ANOVA UNA DIRECCION: Problemas 1.El director de personal de Cander Machine Products está investigando el “perfeccionismo” en el trabajo .Se aplicó una prueba diseñada para medir tal acción a una muestra aleatoria de 18 empleados .Las puntuaciones fueron de 20 a casi 40 .Una de las facetas del estudio incluyo los antecedentes de cada empleado ¿Proviene el laborante de una región rural, de una ciudad pequeña o de una metrópoli? Las puntuaciones son: a) Al nivel de significancia de 0.05 ¿Se puede concluir que hay diferencia en las tres puntuaciones medias? b) Si se rechaza la hipótesis nula .¿Se puede decir que la puntuación media de los empleados que provienen de zonas rurales es diferente de la puntuación de los que vienen de una ciudad grande? REGION RURAL
19
∑
35 30 36 38 29 34 31 233 7823
CIUDAD PEQUEÑA 28 24 25 30 32 28
METROPOLI 24 28 26 30 34
167 4693
142 4092
Laboratorio de Estadística Industrial
∑ (∑)
a) SSTOTAL=
-
=16608-
SST=116.3
=287.8
FV
GRADO.LIBERTAD
SUMA DE CUADRADO
MEDIAS DE CUADRADO
F
TRATAMIENTO
2
116.3
58.2
5.09
ERROR
18-3
171.5
11.4
TOTAL
18-1
287.8
SSE=171.5 1) Ho:µ1=µ2=µ3 Ha: Al menos una de las tres puntuaciones medias es diferente 2) α= 0.05 3) F 4) F(0.05,3-1,18-3) =F(0.05,2,15)=3.68ç
5) De la tabla anova F =5.09 Fk ε R.C: Rechazo Ho, Acepto Ha. Al menos una puntuación media de una de las tres regiones es diferente de los empleados para investigar su perfeccionismo.
20
Laboratorio de Estadística Industrial
b)
×( 11.4∗(
(X1-X3)±
(33.56-26.66)±
+ ) =8.87 ˄4.92
Intervalo: (4.92, 8.87)
El intervalo son signos iguales por lo tanto las medias son diferentes: X1≠X3 Pasos en minitab:
Seleccionamos las opciones estadísticas. Luego escogemos ANOVA. Luego anova de un solo factor. Luego escogemos nuestro factor y respuesta, luego aceptar.
Problema 2.En un estudio publicado en el Journal of Small Business Management se concluyó que los individuos que se auto emplean no experimentan tanta satisfacción en el trabajo como los que no se auto emplean. En este estudio, la satisfacción en el trabajo se midió empleando 18 puntos, cada uno de los cuales se evaluaban con una escala de Liker con 1-5 opciones de respuesta que iban de totalmente de acuerdo a totalmente en desacuerdo. En esta escala con una puntuación mayor corresponde a mayor satisfacción con el trabajo. La suma de las puntuaciones de los 18 puntos, que iba de 18-90, se empleó para medir la satisfacción con el trabajo. Suponga que se emplea este método para medir la satisfacción con el trabajo. Suponga que se emplea este método para medir la satisfacción en el trabajo de abogados, terapeutas físicos, carpinteros y analistas de sistemas. A continuación se encuentra los resultados obtenidos en una muestra de 10 individuos de cada profesión. Para α=0.05
21
Laboratorio de Estadística Industrial Abogados Terapeutas físicos Carpinteros Analistas de sistemas (1) (2) (3) (4) 44 55 54 44 78 65 73 42 80 79 71 74 42 86 69 60 60 79 64 53 59 64 66 50 45 62 59 41 52 78 55 48 55 84 76 64 38 50 60 62
SOLUCION: TRATAMIENTO: 1) Ho: m1= m2 =m3= m4. Ha: Al menos es diferente. 2) α=0.05 3) F 4)
22
Laboratorio de Estadística Industrial
F= 2.866
5)
Intervalos: R.C: <2.866, ∞> R.A: <-∞, 2.866] Fk ԑ R.C → Rechazamos Ho, aceptamos Ha.
Interpretación: El nivel de satisfacción en el trabajo de abogados, terapeutas físicos, carpinteros y analistas de sistemas, al menos uno es diferente. Pasos en minitab:
Seleccionamos las opciones estadísticas. Luego escogemos ANOVA. Luego anova de un solo factor. Luego escogemos nuestro factor y respuesta, luego aceptar.
23
Laboratorio de Estadística Industrial
ANOVA DOS DIRECCIONES: Problema 1.En un estudio publicado en el Journal of the American Medical Association se investigaba la demanda cardiaca al apalear grandes cantidades de nieve. Diez hombres saludables se sometieron a pruebas de ejercicio empleando una corredora y una bicicleta ergonómica para brazos. Después estos mismos hombres limpiaron dos tramos de nieve mojada y pesada con una pala ligera para nieve y una máquina eléctrica para despejar nieve. Se midió el ritmo cardiaco, la presión sanguínea y el consumo de oxigeno de cada uno de los participantes en las pruebas, durante la remoción de nieve, y estos valores se compararon con los valores durante la prueba de ejercicio. En la tabla siguiente se presentan los valores de ritmo cardiaco, dados en pulsaciones por minuto, de cada uno de los 10 individuos. Sujeto Corredora Bici ergonómica Pala para nieve Máquina eléctrica Para brazos 177 205 180 98 1 151 177 164 120 2 184 166 167 111 3 4 161 152 173 122 192 142 179 151 5 193 172 205 158 6 7 164 191 156 117 207 170 160 123 8 177 181 175 127 9 10 174 154 191 109 Con α=0.05, como nivel de significancia, realice una prueba para determinar si existe diferencia significativa entre los
diversos tratamientos. SOLUCION: TRATAMIENTO: 1) Ho: m1 =m2 =m3 =m4 Ha: AL menos uno es diferente 2) Para α = 0.05 3) F 4)
24
Laboratorio de Estadística Industrial
25
Laboratorio de Estadística Industrial
F= 2.96
5)
Intervalos: R.C: <2.96, ∞> R.A: < -∞, 2.96] Fk ɛ R.C → Rechazo Ho, acepto Ha.
Interpretación: Existe diferencias en los valores de ritmo cardiaco, dados en pulsaciones por minuto, según las maquinas. BLOQUE: 1) Ho: m1= m2=m3=m4=…m10. Ha: Al menos una es diferente. 2) Para α=0.05 3) F 4)
26
Laboratorio de Estadística Industrial
F= 2.25 5) Intervalos: R.C: <2.25, ∞> R.A: <-∞, 2.25] Fk= 1.06 ɛ R.A →Acepto Ho, rechazo Ha.
Interpretación: No existen diferencias en los valores de ritmo cardiaco, dados en pulsaciones por minuto, según los sujetos. Problema 2.Wegman’s Food Markets y Top Friendly Markets son cadenas grandes de tiendas de abarrotes en una zona de Nueva
York. Cuando Wal-Mart abrió un supermercado en esta zona, los expertos predijeron que Wal-Mart vendería más barato que estas dos tiendas locales. Un periódico publicó los precios de 15 artículos que se presentan en la siguiente tabla. Artículo Tops 0.49 Plátanos (1lb) Sopa Cambell’s (10.75 oz) 0.60 10.47 Pechuga de pollo (3 lb) 1.99 Pasta de dientes (6.2 oz) Huevos (1 docena) 1.59 2.59 Salsa cátsup (36 oz) 0.67 Jell-o (3 oz) Cacahuatina (18 oz) 2.29 1.34 Leche (descremada, ½ gal) 3.29 Oscar Meyer hotdogs (1 lb) Salsa ragú para pasta (1 lb, 10 oz) 2.09 Galleta Ritz (1 lb) 3.29 6.79 Detergente Tid (líquido, 100 oz) Jugo de naranja Tropicana (1/2 gal) 2.50 Twizzlers (frambuesas, 1 lb) 1.19
Wal-Mart Wegman
0.48 0.54 8.61 2.40 0.88 1.78 0.42 1.78 1.24 1.50 1.50 2.00 5.24 2.50 1.27
0.49 0.77 8.07 1.97 0.79 2.59 0.65 2.09 1.34 3.39 1.25 3.39 5.99 2.50 1.69
Con α=0.05 como nivel de significancia, pruebe si hay una diferencia significativa entre las tiendas en las medias del
precio de estos 15 artículos. SOLUCION: TRATAMIENTO. 1) Ho: m1 = m2 =m3. Ha: Al menos uno es diferente. 2) Para α=0.05
27
Laboratorio de Estadística Industrial
3) F 4)
F= 3.34 5)
28
Laboratorio de Estadística Industrial
Intervalos: R.C: <3.34, ∞> R.A: <-∞, 3.34] Fk= 5.64 ԑ R.C →Rechazo Ho, acepto Ha.
Interpretación: Si hay una diferencia significativa entre las medias del precio de estos 15 artículos, según los supermercados.
29
Laboratorio de Estadística Industrial
BLOQUE: 1) Ho: m1 = m2= …m15 Ha: Al menos uno es diferente. 2) Para α = 0.05 3) F 4)
F= 2.06 5) Intervalos: R.C: <2.06 , ∞> R.A: <-∞, 2.06] Fk= 64.18 ԑ R.C → Rechazo Ho, acepto Ha.
Interpretación: Si hay una diferencia significativa entre las medias del precio , según los 15 artículos.
30
Laboratorio de Estadística Industrial
REGRESION SIMPLE: Problema 1.Un gerente de ventas recolectó los datos siguientes sobre ventas anuales y años de experiencia. (Problema 9 pág. 556 anderson) Vendedor Años de experiencia Ventas anuales (miles de $) 1 80 1 2 3 97 4 92 3 4 102 4 5 6 103 6 8 111 10 119 7 10 123 8 9 11 117 13 136 10
a) Elabore un diagrama de dispersión con estos datos, en el que la variable independiente sean los años de experiencia.
b) Dé la ecuación de regresión estimada que puede emplearse para predecir las ventas anuales cuando se conocen los años de experiencia.
31
Laboratorio de Estadística Industrial
INTERPRETACION: Por cada año de experiencia de un trabajador las ventas anuales aumentan en 4. c) Use la ecuación de regresión estimada para pronosticar las ventas anuales de un vendedor de 9 años de experiencia.
Para un vendedor de 9 años de experiencia: Y=80 +4x =80 +4×9=116 INTERPRETACION:
Para un vendedor de tiene 9 años de experiencia sus ventas anules serán de 116 miles de dólares anuales.
Problema 2.Una aplicación importante del análisis de regresión a la contaduría es la estimación de costos. Con datos sobre volumen de producción y costos y empleando el método de mínimos cuadrados para obtener la ecuación de regresión estimada que relacione volumen de producción y costos, los contadores pueden estimar los costos correspondientes a
32
Laboratorio de Estadística Industrial
un determinado volumen de producción. Considere la siguiente muestra de datos sobre volumen de producción y costos totales de una operación de fabricación. Volumen de producción Costos totales (unidades) ($) 400 4000 450 5000 550 5400 600 5900 700 6400 750 7000 a) Con estos datos obtenga la ecuación de regresión estimada para pronosticar los costos totales dado un volumen de producción. Técnica de mínimos cuadrados: Pendiente de la línea de regresión:
Intersección con el eje x:
Donde la ecuación de regresión es: INTERPRETACION:
∑ ×∑ = ×∑ ×∑ = 7. 6 (∑ ) = ∑= 1247× ∑ = 12477.6 ×
Por cada unidad de volumen de producción los costos totales aumentan en un 7.6.
b) ¿Cuál es el costo por unidad producida? Para 400 unidades: Para 450 unidades: Para 550 unidades: Para 600 unidades: Para 700 unidades: Para 750 unidades:
33
= 12477.6 ×400 = 4287 = 12477.6 ×450 = 4667 = 12477.6 ×550 = 5427 = 12477.6 ×600 = 5807 = 12477.6 ×700 = 6567 = 12477.6 ×750 = 6947
Laboratorio Laboratorio de Estadística Industrial
c) Calcule el coeficiente de determinación. ¿Qué porcentaje de la variación en los costos totales puede ser explicada por el volumen de producción? Coeficiente de determinación: INTERPRETACION:
El 95.9% de la variación de los costos totales se debe al número de unidades del volumen de producción
d) De acuerdo con el programa de producción de empresa, el mes próximo se deberán producir 500 unidades. ¿Cuál es el costo total estimado de esta operación? Para 500 unidades:
34
= 12412477 7.7.6 × 500500 = 50450477
Laboratorio Laboratorio de Estadística Industrial
Problema 3.Al gerente de comercialización de una cadena grande de supermercados le gustaría determinar el efecto del espacio en estantes sobre las ventas de comida para mascotas. Se selecciona una muestra aleatoria de 12 supermercados de igual tamaño y los resultados se presentan a continuación: Tienda Espacio en estante, Ventas semanales, X (pies) Y (cientos de dólares) 1 5 1.6 2 5 2.2 3 5 1.4 4 10 1.9 5 10 2.4 6 10 2.6 7 15 2.3 8 15 2.7 9 15 2.8 10 20 2.6 11 20 2.9 12 20 3.1 SOLUCIÓN: (n=12, α=0.05)
= 150 ==28.22505 ==70.38469 (600010)10))(150 5220))((12(1200)2200(70.7)0.(6197)19)997) 28,) 5) = 0.827 5220) = (10(10(6000)
a) Coeficiente de correlación
b) Coeficiente de determinación r 2 = 0.684 c) Coeficiente de no determinación 1-r 2 =0.316 d) Y=a+bX
Y=1.45+0.074X e) Error estándar
2122250150 384 150150228.8. 5 = 0.074 = 1 2384 = 2128.5 0.074 15012 = 1.45 = 70.70.691.4528.12250.074384 = 0.308
Inferencia sobre los coeficientes de regresión
35
Laboratorio Laboratorio de Estadística Industrial
1) Ho: β = 0 Ha: β ≠ 0 2) α=0.05
3) t 4) t(0.05,10)=2.228 5)
= −−. = 0.016
Inferencia sobre el coeficiente de correlación 1) Ho: p = 0
= 0.00.70416 0 = 4.625
Ha: p ≠ 0 2) α=0.05
3) t 4) t(0.05,10)=2.228 5)
= .√ √ −.−.√ √ −− = 4.65 0.0742.2280.0.001638≤≤≤≤0.0.01742. 2 280. 0 16 1 (812. 812.1505) = 2.042±2.2280.308 12 1 2250 12 (812. 812.1505) = 2.042±2.2280.308 1 121 2250 12
Estimado del intervalo de confianza (α=0.05)
Intervalo de confianza (α=0.05) X=8: Y=1.45+0.074(8)=2.042
IC=[1.7878 ; 2.296]
Intervalo de predicción (α=0.05)
IP=[1.31 ; 2.77]
36
Laboratorio de Estadística Industrial
37
Laboratorio de Estadística Industrial
Problema 4.A un agrónomo le gustaría determinar el efecto de un fertilizante orgánico natural sobre la producción de tomates. Se van a utilizar 5 cantidades diferentes de fertilizante sobre 10 parcelas equivalentes: 0, 10 , 20 , 30 y 40 libras por cada 100 pies cuadrados. Los niveles de fertilizante son designados aleatoriamente a las parcelas con los siguientes resultados: Parcela Cantidad de fertilizante Producción X (lb/100 pies2) Y (lb) 1 0 6 2 0 8 3 10 11 4 10 14 5 20 18 6 20 23 7 30 25 8 30 28 9 40 30 10 40 34 SOLUCIÓN (n=10 , α=0.05)
= 200 == 6000197 == 47355220 (197) ) = 0.98 10)(5220)()(120(00)4735)197 = (10(6(000)200
a) Coeficiente de correlación
b) Coeficiente de determinación r 2 = 0.96 c) Coeficiente de no determinación 1-r 2 =0.04 d) Y=a+bX
Y=6.9+0.64X e) Error estándar
( 2 00) 1 97) = (10)10(( 1597220)( 200 = 0.64 6 000)200 = 10 0.64 10 = 6.9 6 45220 = 47356.91970. 102 = 2.0886
Inferencia sobre los coeficientes de regresión 1) Ho: β = 0
38
Laboratorio de Estadística Industrial Ha: β ≠ 0 2) α=0.05
3) t 4) t(0.05,8)=2.306 5)
= .− = 0.0467
Inferencia sobre el coeficiente de correlación 1) Ho: p = 0
= 00..6040467 = 13.7
Ha: p ≠ 0 2) α=0.05
3) t 4) t(0.05,8)=2.306 5)
= .√ −.√ − = 13.86 0.642.3060.0.05467323 ≤≤ ≤≤ 0.0.7647742.3060.0467 (1520)200 = 16.5±2.3062.0886 10 1 6000 10 (1520)200 = 16.5±2.3062.0886 1 101 6000 10
Estimado del intervalo de confianza (α=0.05)
Intervalo de confianza (α=0.05) X=15: Y=6.9+0.64(15)=16.5
IC=[14.88 ; 18.1]
Intervalo de predicción (α=0.05)
IP=[11.42 ; 21.58]
REGRESION MULTIPLE PROBLEMA 1:
Montgomery y Peck (1982) describen el empleo de un modelo de regresión para relacionar la cantidad de tiempo requerido por un vendedor de ruta (chofer) para abastecer una maquina vendedora de refrescos con el número de latas que incluye la misma, y la distancia del vehículo de servicio a la ubicación de la máquina. Este modelo se empleo para el diseño de la ruta, el programa y el despacho de vehículos. La tabla presenta 25 observaciones respecto al tiempo de entrega tomadas del mismo estudio descrito por Montgomery y Peck.
39
Laboratorio de Estadística Industrial
40
Numero de observaciones 1
Tiempo de entrega (min.) 9.95
Numero de latas
Distancias(pies)
2
50
2
24.45
8
110
3
31.75
11
120
4
35.00
10
550
5
25.02
8
295
6
16.8
4
200
7
14.38
2
375
8
9.60
2
52
9
24.35
9
100
10
27.50
8
300
11
17.08
4
412
12
37.00
11
400
13
41.95
12
500
14
11.66
2
360
15
21.65
4
205
16
17.89
4
400
17
69.00
20
600
18
10.30
1
585
19
34.93
10
540
20
46.59
15
250
21
44.88
15
290
22
54.12
16
510
23
56.63
17
590
24
22.13
6
100
Laboratorio de Estadística Industrial
25
21.15
5
400
Determine la ecuación de regresión. Calcule R2.Interprete. Estimar el tiempo de entrega si se sabe que el número de latas es 20 y la distancia del vehículo es 110.
Solucion:
̌ = 2.262.74(20)0.0125(110) ̌ = 58.435 : = = = 0 : 0
Coeficiente de determinación: es 0.981, entonces el 98.1% del tiempo de un vendedor para abastecer una maquina vendedora puede ser explicado mediante el número de latas y la distancia del camión.
41
Laboratorio de Estadística Industrial
Si se selecciona un nivel de significancia de 0.05, podemos observar que, el valor de P=0.000 es menor a 0.05 por lo tanto rechazamos la hipótesis nula y concluimos que al menos un coeficiente de regresión no es 0.
Interpretación: Observamos un relación lineal entre la variable dependiente Nro. De latas con respecto al T.de entrega (Variable independiente), y en menor grado de linealidad Distancia Vs Tiempo de entrega.
42
Laboratorio de Estadística Industrial
43
Laboratorio de Estadística Industrial
Contribución de la variable X 1 sabiendo que X 2 está incluida
SSR(X1 / X2) = SSR(X1 y X2) – SSR(X2) =5992.4-5887.3=105.1
= 15.05.21 = 20.23 Para un nivel de significancia de 0.05 con 1 y 22 gl F=4.3 ,20.23>4.3 Entonces la variable X1(nro de latas), si contribuye significativamente a la ecuación de regresión
Contribución de la variable X 2 sabiendo que X 1 está incluida
SSR(X2 / X1) =SSR(X1 y X2) – SSR(X1)
44
Laboratorio de Estadística Industrial
=5992.4-1483.9=4508.5
= 4508.5.2 5 = 867.019
Para un nivel de significancia de 0.05 con 1 y 22 gl F=4.3 ,867.019>4.3
Entonces la variable X2(distancia), si contribuye significativamente a la ecuación de regresión, y podríamos concluir que es más importante que la varia X1.
45
Laboratorio de Estadística Industrial
PROBLEMA 2 En la Facultad de Ingeniería de Sistemas y Computo de la Universidad "Inca Garcilaso de la Vega" se quiere entender los factores de aprendizaje de los alumnos que cursan la asignatura de PHP, para lo cual se escoge al azar una muestra de 15 alumnos y ellos registran notas promedios en las asignaturas de Algoritmos, Base de Datos y Programación como se muestran en el siguiente cuadro.
46
Laboratorio de Estadística Industrial
Alumno 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
PHP 13 13 13 15 16 15 12 13 13 13 11 14 15 15 15
Algoritmos 15 14 16 20 18 16 13 16 15 14 12 16 17 19 13
Base de Datos 15 13 13 14 18 17 15 14 14 13 12 11 16 14 15
Programación 13 12 14 16 17 15 11 15 13 10 10 14 15 16 10
Lo que buscamos es construir un modelo para determinar la dependencia que exista de aprendizaje reflejada en las notas de la asignatura de PHP, conociendo las notas de las asignaturas Algoritmos, Programación. Determine la ecuación de regresión. Calcule R2.Interprete. Estimar la nota del curso de PHP si se sabe que en Algoritmos tiene 15 , Base de Datos 16 y Programación 17. Solucion:
47
Laboratorio de Estadística Industrial
̌ = 2.550.583(15)0.373(16)0.242(17) ̌ = 13.149 : = = = 0 : 0
Coeficiente de determinación: es 0. 697 , entonces el 69.70% del aprendizaje del Curso de PHP puede ser explicado mediante las notas obtenidas por las asignaturas de Algoritmos, Base de Datos y Programación.
Si se selecciona un nivel de significancia de 0.05, podemos observar que, el valor de P=0.003 es menor a 0.05 por lo tanto rechazamos la hipótesis nula y concluimos que al menos un coeficiente de regresión no es 0.
48
Laboratorio de Estadística Industrial
Interpretación: Podemos observar que hay una buena relación de linealidad entre las variables dependientes con la dependiente.
49
Laboratorio de Estadística Industrial
50
Laboratorio de Estadística Industrial
51
Laboratorio de Estadística Industrial
52
Laboratorio de Estadística Industrial
METODOS NO PARAMETRICOS: PRUEBA CHI_CUADRADO: PROBLEMA 1:
Un estudio referente a la relación entre la edad y la presión que el personal de ventas sienten con respecto a su trabajo presentó la información muestral que sigue. A nivel de significancia de 0.01, ¿Existe alguna relación entre la presión laboral y la edad? Nivel de presión en el trabajo Edad (años) Menor de 25 25 a 40 40 a 60 Mayor a 60
Bajo 20 50
Mediano 18 46
Alto 22 44
58 34
63 43
59 43
Solución: H0: No existe relación entre la edad y la presión que el personal de ventas siente con respecto a su trabajo H1: Existe relación entre la edad y la presión que el personal de ventas siente con respecto a su trabajo
Prueba Chi-cuadrada: BAJO, MEDIANO, ALTO
53
Laboratorio de Estadística Industrial
Los conteos esperados se imprimen debajo de los conteos observados Las contribuciones Chi-cuadradas se imprimen debajo de los conteos esperados BAJO 1 20 19.44 0.016
MEDIANO ALTO Total 18 22 60 20.40 20.16 0.282 0.168
2
50 46 44 140 45.36 47.60 47.04 0.475 0.054 0.196
3
58 63 59 180 58.32 61.20 60.48 0.002 0.053 0.036
4
34 43 43 120 38.88 40.80 40.32 0.613 0.119 0.178
Total 162
170 168 500
Chi-cuadrada = 2.191, GL = 6, Valor P = 0.901
Hallamos el valor crítico de X2 con un nivel de significancia de 0.01 y grados de libertad de 6.
. = 16.81
CONCLUSIÓN: Puesto que el valor del estadístico calculado de ji cuadrada (2.191) se encuentra en la región a la izquierda de 16.81, no se rechaza la hipótesis nula al nivel de 0.01. Se concluye que no hay una relación entre la edad y la presión que sufre el personal de ventas PRUEBA DE POISSON
El número de llamadas telefónicas que llegan por minuto al conmutador de una empresa tiene una distribución de Poisson. Use α 0.10 y los datos siguientes para probar esta suposición.
54
Laboratorio de Estadística Industrial
Solución: I)
PLANTEAMINETO DE LA HIPOTESIS
Ho: la población del número llamadas telefónicas que llegan por minuto al conmutador de la empresa sigue una distribución de poisson Ha: la población del número llamadas telefónicas que llegan por minuto al conmutador de la empresa sigue una distribución de poisson
II)
NIVEL DE SIGNIFICANCIA
III)
ESTADISTICO DE PRUEBA
= 0.01
Utilizaremos el estadístico de chi –cuadrado, mediante la siguiente Formula. Gl= n-1=6 IV)
55
INTERVALO DE CONFIANZA
Laboratorio de Estadística Industrial
V)
CALCULOS Y RESULTADOS
Haciendo los cálculos para calcular la media , que se realiza por media ponderada:
Para hallar las frecuencias esperadas realizaremos la tabla de poisson, para lo cual haremos ayuda de minitab.
= 0∗15312∗20∗154∗135∗46∗2 =2 80
56
Laboratorio de Estadística Industrial
Elegimos la variable a analizar que seria el numero de llamadas que llegan por minuto al conmutador de una empresa numero de llamadas telefonicas
fo 0 1 2 3 4 5 6
15 31 20 15 13 4 2
probabilidad fe (fo-fe) (fo-fe)^2 (fo-fe)^2/fe 0.13533528 13.5335283 1.46647168 2.15053918 0.1589045 0.27067057 27.0670566 3.93294335 15.4680434 0.5714712 0.27067057 27.0670566 -7.06705665 49.9432897 1.8451688 0.18044704 18.0447044 -3.04470443 9.27022508 0.5137366 0.09022352 9.02235222 3.97764778 15.8216819 1.7536094 0.03608941 3.60894089 0.39105911 0.15292723 0.0423745 0.0120298 1.2029803 0.7970197 0.63524041 0.5280555 5.4133207
se muestra la tabla del almacenamiento de los datos y la tabla de distribución de probabilidad poisson.
Operaciones para calcular el estadístico de chi-cuadrado , se muestran fe y fo.
# accidentes fo 0 1 2 3 4
57
34 25 11 7 3
probabilidad (fe) (fo-fe) (fo-fe)^2 (fo-fe)^2/fe 0.36787944 29.43 4.56964471 20.88165274 0.70952771 0.36787944 29.43 -4.43035529 19.62804803 0.66693208 0.18393972 14.72 -3.71517765 13.80254495 0.93798018 0.06131324 4.905 2.09494078 4.38877689 0.89474494 0.01532831 1.226 1.7737352 3.146136546 2.56562574 5.77481065
Calculo de X2 (k)=5.413
Laboratorio de Estadística Industrial
Conclusiones: 2
Como x (k) pertenece a la región de aceptación, entonces podemos
afirmar que la población del número de llamadas entrantes sigue una distribución binomial
PRUEBA DE SIGNO (MUESTRA PEQUEÑA) Muchos corredores de valores con poca experiencia se resisten a hacer presentaciones ante banqueros y otros grupos. Al percibir esta falta de confianza en ellos mismos, la dirección hizo arreglos para que un grupo muestra de nuevos corredores asistiera a un seminario para lograr la autoconfianza; contrato así a una organización capacitadora para que impartiera un curso de tres semanas. Antes de la primera sesión, los instructores midieron el nivel de confianza de cada participante y volvieron a medirlo después de concretado el seminario. Los niveles de confianza antes y después para los 14 asistentes al curso, se indican a continuación. La autoconfianza se clasifico como negativa, baja, alta o muy alta. Establecer la hipótesis nula y alternativa. a) Usando nivel de significancia 0.05, exprese la regla de solución con palabras o en diagramas. Corredor
Antes del seminario
Después del seminario
Signo
Numeración Probabilidad Probabilidad de éxito acumulada
Martin Jaimes Hammer Jones Cornwall Skeen Salas Ortega Ford Ugalde Marcos Arms Pierre Walker
Negativa Negativa Baja Muy alta Baja Baja Negativa Baja Baja Negativa Baja Negativa Baja Baja
Baja Negativa Alta Baja Alta Alta Alta Muy alta Alta Baja Alta Baja Alta Muy alta
+ 0 + + + + + + + + + + +
0 1 2 3 4 5 6 7 8 9 10 11 12 13
0 0.002 0.01 0.035 0.087 0.157 0.209 0.209 0.157 0.087 0.035 0.01 0.002 0
1 1 0.998 0.988 0.953 0.866 0.709 0.5 0.291 0.134 0.047 0.012 0.002 0
Solución: 1. Ho: p≤0.5 No hay cambio con respecto a la autoconfianza de los corredores, como resultado del seminario proporcionado por la organización capacitadora. Ha: p≥0.5 Si hay cambio con respecto a la autoconfianza de los corredores, como resultado del seminario
proporcionado por la organización capacitadora.
2. α=0.05 3. Distribución Binomial 4.
58
Laboratorio de Estadística Industrial
5. Numero de signo positivos: 12 12 ɛ R.C. Rechazamos Ho, aceptamos Ha. Interpretación: Si hay cambio con respecto a la autoconfianza de los corredores de valores con poca experiencia, como resultado del seminario proporcionado por la organización capacitadora.
Pasos en minitab: Utilizamos de la barra de menú la opción estadística. Luego a métodos no paramétricos. La opción prueba de signo. Luego escogemos nuestra variable y aceptar.
PRUEBA DE WILCONSON:
1.Un estudio busca evaluar la ganancia potencial de peso con cierto alimento aviar .Una muestra de 12 aves se usó durante un periodo de seis meses .Cada una de las aves se pesó antes y después de un periodo de prueba .Las diferencias entre los pesos antes y después observados en las 12 aves son: 1.5,1.2,-0.2,0,0.5,0.7,0.8,1,0,0.6,0.2,0.01.Valores negativos indican pérdida de peso durante el periodo de prueba y los ceros indican que no hubo ninguna variación durante el periodo de prueba .Use 0.05 como nivel de significancia y determine si este nuevo alimento parece ocasionar un aumento de peso en las aves. SOLUCION: 1. Ho: Los pesos de las aves con cierto alimento aviar son iguales Ha:Los pesos de las aves con cierto alimento aviar son diferentes 2. α=0.05 3. Z ,T
59
Laboratorio de Estadística Industrial
PESO
DIFERENCIA
1 2 3 4 5 6 7 8 9 10 11 12
1.50 1.20 -0.20 0.00 0.50 0.70 0.80 1.00 0.00 0.60 0.20 -0.01
VALOR ABSOLUTO 1.50 1.20 0.20 0.00 0.50 0.70 0.80 1.00 0.00 0.60 0.20 0.01
LUGAR 10 9 2.5
RANGO CON SIGNO 10 9 -2.5
4 6 7 8
4 6 7 8
5 2.5 1
5 2.5 -1
T=48 u =0
××
Ϭ=
=19.62
Zk Є RC: Rechazo Ho ,Acepto Ha
= 419.8062 = 2.45
INTERPRETACION: El nuevo alimento aviar provoca un aumento en el peso de las aves ,es decir con un nivel de significancia de 0.05 los pesos difieren luego del cambio. En minitab:
Pasos en minitab:
Utilizamos la opción estadísticos Luego métodos no paramétricos. La opción de wilcoxon para una muestra. Escogemos la opción de mediana de la prueba. Luego aceptar.
60
Laboratorio de Estadística Industrial PRUEBA DE MWW:
MUESTRA PEQUEÑA: 1.Se enseña un procedimiento de ensamble a un grupo de obreros empleando una secuencia de pasos ya conocida ,se enseña a otro grupo usando una técnica experimental .Los tiempos ,en segundos, necesarios para el ensamblaje , para una muestra de empleados se presentan a continuación : Método Actual: 41, 36, 42, 39, 36, 48, 49,38. Método Experimental: 21, 27, 36, 20, 19, 21, 39, 24,22. Al nivel de significancia de 0.05 ¿Se puede concluir que el método experimental es mas rápido? Supóngase que la distribución de líneas de ensamblaje no es normal. SOLUCION: 1. Ho: Las dos poblaciones son idénticas en términos del tiempo en segundos necesarios por el ensamblaje Ha: Las dos poblaciones no son idénticas en términos del tiempo en segundos necesarios por el ensamblaje 2. α=0.05 3. Definir el estadístico MWW. 4. Definir la RA y RC: TL(0.05,8,9)=55 TU=8×(8+9+1)-55=89 5. METODO ACTUAL 41 36 42 39 36 48 49 38
R1 Є RC : Rechazo Ho ,Acepto Ha
14 9 15 12.5 9 16 17 11
METODO EXPERIMENTAL 21 27 36 20 19 21 39 24 22
1 = 103.5
3.5 7 9 2 1 3.5 12.5 6 5
INTERPRETACION: Las dos poblaciones no son idénticas en base al tiempo utilizado por un grupo de obreros para realizar un ensamblaje, los obreros capacitados por el método experimental son más rápidos que los que realizan un procedimiento ya conocido. MINITAB:
61
Laboratorio de Estadística Industrial
Pasos en minitab:
Opción en la barra de menú de estadísticas. Luego métodos no paramétricos. La opción de mann wihtney. Escogemos nuestras dos muestras y luego aceptar.
METODO DE KRUSKALL WALLIS:
Un cliente desea saber si hay una diferencia significativa entre los tiempos que se requieren para realizar un programa de evaluación por tres métodos diferentes. A continuación se presentan los tiempos (en horas) requeridos por cada uno de los 18 evaluadores para llevar a cabo el programa de evaluación. METODO 1 68 74 65 76 77 72
METODO 2 8.5 15 6 17 18 12.5 77
METODO3
62 73 75 68 72 70
4.5 14 16 8.5 12.5 11 66.5
58 67 69 57 59 62
2 7 10 1 3 4.5 27.5
Use α=0.05 y realice una prueba para ver si existe una diferencia significativa entre los tiempos requeridos por los tres
métodos. Solución: 1. Ho: Son iguales las distribuciones de los tiempos que se requieren para realizar un programa de evaluación por tres métodos diferentes. Ha: No son iguales las distribuciones de los tiempos que se requieren para realizar un programa de evaluación por tres métodos diferentes. 2. α= 0.05 3. X2 4.
62
Laboratorio de Estadística Industrial
12 77 66. 5 27. 5 = 18∗19 6 3∗19 = 7.956
5.
H ԑ R.C., Rechazamos Ho, aceptamos Ha. Interpretación: No son iguales las distribuciones de los tiempos (horas) que se requieren para realizar un programa de evaluación por tres métodos diferentes.
Pasos en minitab:
Opción en la barra de menú de estadísticas. Luego métodos no paramétricos. La opción de kruskall wallis. Escogemos nuestro factor y nuestra respuesta. Le damos aceptar.
CORRELACION DE RANGO:
1. La Far West University ofrece clases matutinas y vespertinas en administración empresarial .Se realizara una extensa encuesta .Una pregunta implica a estudiantes de segundo grado y la forma en la que perciben el prestigio asociado con ciertas profesiones. A cada estudiante se le pidió que calificara las carreras de 1 a 8 ,con 1 a la mayor renombre ,y con 8 la de menor prestigio .Los resultados compuestos son:
63
Laboratorio de Estadística Industrial
CARRERA
PUNTUACION DE CURSOS MATUTINOS
DIFERENCIA
6 7
PUNTUACION DE CURSOS VESPERTINOS 3 2
CONTADOR PROGRAMADOR EN COMPUTACION GERENTE DE SUCURSAL BANCARIA ADMINISTRADOR DE HOSPITAL ESTADISTICO INVESTIGADOR DE MERCADOTECNIA ANALISTA DE BOLSA GERENTE DE PRODUCCION
2
6
-4
5
4
1
1 4
7 8
-6 -4
3 8
5 1
-2 7
3 5
Determine el coeficiente de correlación: SOLUCION:
= 1 8×( 6×156 8 1) = 0.85 = 0 −
El coeficiente de correlación es -0.85 PRUEBA DE SIGNIFICANCIA PARA LA CORRELACION DE RANGO: Ϭrs=
1. Ho: ps=0
=0.38
Ha: ps≠0 α=0.05
2. 3. Z
4. Calculo de estadístico:
Zk Є RC: Rechazo Ho, Acepto Ha.
= 0.0.83508 = 2.24
INTERPRETACION: El coeficiente de correlación es diferente de cero es decir hay diferencia de correlación en la forma en la que perciben el prestigio asociado con ciertas profesiones.
64
Laboratorio de Estadística Industrial SERIE DE TIEMPO:
SUAVIZAMIENTO EXPONENCIAL: En la serie de tiempo siguiente se dan las ventas de un determinado producto en los últimos 12 meses. MES 1 2 3 4 5 6 7 8 9 10 11 12
VENTAS 105 135 120 105 90 120 145 140 100 80 100 110
a) Emplee α =0.3 y calcule los valores que se obtienen para esta serie con el método de suavizamiento exponencial.
)×105==114105 0.0.33×135( ×105(110.0.33)×105 )×114 0.0.33×120( 1 0. 3 = 115. 8 )×115. ×105( 1 0. 3 8 = 112. 5 6 0.0.33×120( ×90(110.0.3)×112. 5 6 = 105. 7 92 )×105. 3 7 92 = 110. 0 54 )×110. 0.0.33×145( 1 0. 3 0 54 = 120. 5 38 )×120. ×140( 1 0. 3 5 38 = 126. 3 77 )×126. 0.0.33×100( 1 0. 3 3 77 = 118. 4 64 )×118. ×80( 1 0. 3 4 64 = 106. 9 25 0.3×100(10.3)×106.925 = 104.847
F1=Y1=105 F2=Y2= F3=Y3= F4=Y4= F5=Y5= F6=Y6= F7=Y7= F8=Y8= F9=Y9= F10=Y10= F11=Y11= F12=Y12=
MES VENTAS 1 2 3 4 5 6 7 8 9 10 11 12
65
105 135 120 105 90 120 145 140 100 80 100 110
PRONOSTICO DE SUAVIZAMIENTO EXPONENCIAL 105,000 105,000 114,000 115,800 112,560 105,792 110,054 120,538 126,377 118,464 106,925 104,847
Laboratorio de Estadística Industrial
MINITAB:
b) c) Use la constante de suavizamiento α =0.5 .calcular los valores de suavizamiento exponencial ¿Con cuál valor 0.3 o 0.5 .de las constante α se obtiene un mejor pronóstico?
66
Laboratorio de Estadística Industrial
MES VENTAS PRONOSTICO DE SUAVIZAMIENTO EXPONENCIAL 1 105 105,000 2 135 105,000 3 120 120,000 4 105 120,000 5 90 112,500 6 120 101,250 7 145 110,625 8 140 127,813 9 100 133,906 10 80 116,953 11 100 98,477 12 110 99,238
)×105==120105 0.0.55×135( ×105(110.0.33)×105 )×114 0.0.55×120( 1 0. 3 = 120 )×115. ×105( 1 0. 3 8 = 112. 5 0.0.55×120( ×90(110.0.3)×112. 5 6 = 101. 2 5 )×105. 3 7 92 = 110. 6 25 )×110. 0.0.55×145( 1 0. 3 0 54 = 127. 8 13 )×120. ×140( 1 0. 3 5 38 = 133. 9 06 )×126. 0.0.55×100( 1 0. 3 3 77 = 116. 9 53 )×118. ×80( 1 0. 3 4 64 = 98. 4 77 0.5×100(10.3)×106.925 = 99.238
F1=Y1=105 F2=Y2= F3=Y3= F4=Y4= F5=Y5= F6=Y6= F7=Y7= F8=Y8= F9=Y9= F10=Y10= F11=Y11= F12=Y12=
MINITAB:
67
Laboratorio de Estadística Industrial
CONCLUSION: El mejor pronóstico de ventas se observa para la constante de suavizamiento de 0.3 aunque para 0.5 se observa ventas altas los primeros meses se escoge 0.3 porque se mantiene altas el pronóstico de suaviza miento de ventas. MODELO MULTIPLICATIVO: PROMEDIOS MOVILES-INDICES ESTACIONALES: A continuación se presenta los datos, correspondientes a los últimos tres años de ventas trimestrales (número de ejemplares vendidos) de un libro de texto universitario. TRIMESTRE 1 2 3 4
AÑO1 1690 940 2625 2500
AÑO 2 1800 900 2900 2360
AÑO 3 1850 1100 2930 2615
a) Para esta serie de tiempo de los promedios móviles de cuatro trimestres y los promedios móviles centrados.
68
Trimestre
Ventas por año
1
1690
2
940
Promedio móvil
PROMEDIO MOVIL CENTRADO
Laboratorio de Estadística Industrial
1938,75 3
2625
1952,50 1966,25
4
2500
1961,25 1956,25
1
1800
1990,63 2025,00
2
900
2007,50 1990,00
3
2900
1996,25 2002,50
4
2360
2027,50 2052,50
1
1850
2056,25 2060,00
2
1100
2091,88 2123,75
3
2930
4
2615
Gráfica del Promedio móvil:
Gráfica del Promedio móvil:
69
Laboratorio de Estadística Industrial
b) Calcule los índices estacionales de los cuatro trimestres Trimestre
Ventas por año
1
1690
2
940
Promedio móvil
PROMEDIO MOVIL CENTRADO
VALOR ESTACIONAL IRREGULAR
1952,50
1.344
1961,25
1.274
1990,63
0.904
2007,50
0.448
1996,25
1.453
2027,50
1.164
2056,25
0.900
2091,88
0.526
1938,75 3
2625 1966,25
4
2500 1956,25
1
1800 2025,00
2
900 1990,00
3
2900 2002,50
4
2360 2052,50
1
1850 2060,00
2
1100 2123,75
3
2930
4
2615
70
Laboratorio de Estadística Industrial
TRIMESTRE 1
0.904
0.900
INDICES ESTACIONAL 0.902
2
0.448
0.526
0.487
3
1.344
1.453
1.3985
4
1.274
1.164
1.219 4.0065
o
HALLO EL FACTOR DE CORRECCION: FACTOR DE CORRECCION:
= 4 = 4.04065 = 0.998 ≈ 1 INDICES REALES
1
0.902
2
0.487
3
1.3985
4
1.219
1
1
INDICES VENTAS POR ESTACIONALES AÑO 0.902 1690
2
2
0.487
940
457.78
3
3
1.3985
2625
3671.0625
4
4
1.219
2500
3047.5
5
1
0.902
1800
1623.6
6
2
0.487
900
438.3
7
3
1.3985
2900
4055.65
8
4
1.219
2360
2876.84
9
1
0.902
1850
1668.7
71
VENTAS DESESTACIONALIZADAS 1524.38
Laboratorio de Estadística Industrial
10
2
0.487
1100
535.7
11
3
1.3985
2930
4097.605
12
4
1.219
2615
3187.685
LA ECUACION: y = 1593 + 103 x GRAFICA:
c) ¿Cuándo obtiene la editorial el mayor índice estacional? ¿Parece ser razonable este resultado? Explique. o La editorial obtiene mayor índice estacional en el tercer trimestre es decir es 139.85% se encuentra 39.85 % se encuentra por arriba del promedio anual. TENDENCIA LINEAL: Durante los últimos siete años, la empresa Hudson Marine ha sido distribuidor autorizado de los radios náuticos de C&D.En la tabla siguiente se da el número de radios vendidos por año por esa empresa. AÑO 1 NUMERO 35 VENDIDO a)
72
2 50
3 75
4 90
5 105
6 110
7 130
Laboratorio de Estadística Industrial
b) c) Trace la gráfica de esta serie de tiempo d) Obtenga la ecuación de tendencia lineal de esta serie de tiempo Ecuación de tendencia ajustada Yt = 22.86 + 15.5*t De la ecuación: El valor 15.5 indica que los radios vendidos por año de cada empresa aumenta en 15.5 ventas por año y 22.86 es el valor de ventas estimadas para el año cero.
73