GUÍA DE EJERCICIOS
ESTADÍSTICA APLICADA
1
GUIA DE EJERCICIOS ESTADÍSTICA APLICADA TEMA
1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. 13. 14. 15. 16. 17.
Intervalo de confianza para la media Intervalo de confianza para la proporción Tamaño de muestra para la media media Tamaño de muestra para la proporción proporción Intervalo de confianza para diferencia de medias Intervalo de confianza para diferencia de proporciones Prueba de Hipótesis para la media Prueba de Hipótesis para la proporción Prueba de Hipótesis para la varianza Prueba de Hipótesis para diferencia de medias Prueba de Hipótesis para diferencia de proporciones ANOVA Prueba Chi Cuadrada de independencia Prueba Chi Cuadrada de bondad de ajuste Análisis de Regresión lineal simple Análisis de Regresión lineal múltiple Series de Tiempo
2
GUIA DE EJERCICIOS ESTADÍSTICA APLICADA TEMA
1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. 13. 14. 15. 16. 17.
Intervalo de confianza para la media Intervalo de confianza para la proporción Tamaño de muestra para la media media Tamaño de muestra para la proporción proporción Intervalo de confianza para diferencia de medias Intervalo de confianza para diferencia de proporciones Prueba de Hipótesis para la media Prueba de Hipótesis para la proporción Prueba de Hipótesis para la varianza Prueba de Hipótesis para diferencia de medias Prueba de Hipótesis para diferencia de proporciones ANOVA Prueba Chi Cuadrada de independencia Prueba Chi Cuadrada de bondad de ajuste Análisis de Regresión lineal simple Análisis de Regresión lineal múltiple Series de Tiempo
2
Tema: Intervalos de Confianza para la media Problema 1 El gerente de control de calidad de una fábrica de lámparas eléctricas desea estimar la duración promedio de las lámparas del embarque que provienen provienen del proveedor A. Se sabe que estas lámparas tienen una desviación estándar de 120 horas. Se selecciona una muestra aleatoria (m.a.) de 64 lámparas y se obtiene que la duración promedio de esta muestra es de 540.12 horas. a) Con esta información estime estime con un 95% de confianza, la duración promedio de todas las lámparas del embarque, si se sabe que el tiempo de duración de estas lámparas siguen una distribución normal. Interprete. b) Realice la misma misma estimación que en la parte a, pero al 97% y al 99%. Comente c) En base al resultado de la estimación hallada en a, ¿es posible pensar que duran más más que las lámparas del proveedor B que tienen un promedio de duración igual a 500 h.? d) En base al resultado de la estimación hallada en a, es posible pensar que duran más que las lámparas del proveedor C que tienen un promedio de duración igual a 560 h.? Justifique su respuesta. e) Supongamos que el gerente de control de calidad, considera la posibilidad posibilidad de reducir el error de estimación hallado en la parte “a” en un 30%, si mantiene el mismo nivel de confianza ¿Qué tamaño de muestra debe seleccionar? Problema 2 Se va a vender un nuevo cereal para desayuno como prueba de mercados durante un mes en las tiendas de una cadena de autoservicio. Los resultados de una muestra de 26 tiendas indicaron una venta promedio de 1250.8 soles con una desviación estándar de 210.4 soles. Si las ventas tienen distribución distribución normal a) Establezca una estimación por intervalo con un 95% de confianza para la la venta promedio por tienda de este cereal cereal en este mes de prueba. b) Si la cadena de autoservicios autoservicios tiene 200 tiendas, estime con un 95% de confianza el monto de las ventas que por concepto de este producto tendrían las 200 tiendas. Problema 3 Responda las siguientes preguntas: a) Supongamos que de una población se toma una muestra aleatoria aleatoria de tamaño n = 64 personas, con el objetivo de estimar el gasto promedio en consumo, por mes, el cual tiene una distribución normal. A un nivel de confianza del 95% y sabiendo que la varianza (σ2) es de es de 62500 soles2, se encontró el siguiente intervalo de confianza para la media ( () = 〈 = 〈1138.75; 1138.75; 1261.25〉 1261.25〉. Halle el valor de la media muestral utilizada y el margen de error utilizado en el problema. b) Dentro del contexto del problema anterior (parte a), se desea reducir el error de estimación (margen de error) en un 40%, manteniendo 40%, manteniendo el mismo nivel de confianza, halle usted el tamaño de muestra que se requiere en este caso. c) La siguiente información información es una salida de MINITAB con respecto a una estimación mediante intervalos de confianza para el promedio de peso de un artículo: One-Sample Z: PESO The assumed sigma = 35 Variable N Mean PESO 11 246,2
d)
StDev SE Mean 21,3 10,6 10, 6
90,0% CI ( 228,8 ; .......)
Por error se perdió el límite superior del intervalo, determine Usted, con la información dada, dicho límite, indique además que distribución se utilizó en la construcción de dicho intervalo. En el problema anterior si el intervalo de confianza para la la media media es (226,4; 266,0). ¿Qué nivel de confianza se utilizó? 3
Problema 4 En un instituto de Enseñanza Superior hay matriculados 800 alumnos. Se tomó una muestra aleatoria de estudiantes la cual representa el 15% del total, y se llevó a cabo una pequeña encuesta con las siguientes preguntas: Pregunta 1: Pregun ta 2:
¿Utiliza la cafetería del instituto? Sí_____ No____ Si la repu esta anterior es afirmativ a, diga aproximadamente cuánto dinero gasta al día en esta cafetería _________
Lo resultados: fueron: Contestaron negativamente a la pregunta 1 un total de 24 alumnos. De los que contestaron afirmativamente la pregunta 1, se obtuvo que el gasto promedio diario es 12.2 soles con una desviación estándar de 3.48 soles. Considerando estas características y resultados mostrados responda las siguientes preguntas: a) Defina la población de interés en este caso, indique las variables y el tipo de variable involucradas en esta situación. b) Estime la proporción de alumnos que utilizan la cafetería con un 90% de confianza. c) Determine, con un nivel de confianza del 97%, el máximo error de estimación cometido con la estimación realizada en la parte b. d) Estime con un 97% de confianza, el monto promedio diario que gasta un alumno que utiliza la cafetería del instituto, suponiendo que el gasto diario que realizan los alumnos que hacen uso de la cafetería del instituto se distribuye normalmente. Para el cálculo no considere el factor de corrección por poblaciones finitas. Problema 5 Se tomó una muestra de bodegas de cierta zona de la ciudad con la finalidad de estimar el nivel promedio de ventas por semana (en miles de soles). Los datos obtenidos se procesaron mediante el programa MINITAB, y los resultados se muestran a continuación: One-Sample Z: VENTAS The assumed sigma = 10 Variable VENTAS
N 15
Mean .......
StDev 10,21
SE Mean 2,582
…………………………
( 56,21;
67,52)
A partir de esta información responda las siguientes pregu ntas: a) Se afirma que el nivel de venta promedio semanal, de estas bodegas es superior a los 54500 soles. Con el reporte dado ¿Qué puede decir al respecto? b) Halle el nivel promedio de las ventas. c) ¿Qué nivel de confianza se utilizó en este reporte? Problema 6 Resuelva las siguientes preguntas: a) El gerente comercial de una cadena de tiendas, que tiene un gran número de establecimientos distribuidos en todo el país, desea estimar el nivel de ventas promedio semanal de estos establecimientos, para lo cual se fija las siguientes condiciones: está dispuesto a tolerar un error de a lo más 120 soles y desea estar 90% seguro de sus resultados. Si se tiene como información que la desviación estándar en el nivel de ventas de dichos establecimientos es de 350 soles ¿Qué tamaño de muestra debe utilizar este gerente? b) La siguiente es una corrida del programa MINITAB, para una muestra de personas a las que se les preguntó acerca de su gasto semanal en movilidad (en soles)
One-Sample T N 25
Mean
StDev 15.0000
SE Mean 98% CI 3.0000 (44.5235, .......)
Calcule el límite superior del intervalo para el promedio del gasto semanal en movilidad. 4
Problema 7 Para decidir si un programa de ayuda social en cierta región del país se justifica, se realiza un estudio con respecto al ingreso mensual de las familias de esta región y a partir del resultado de éste, tomar una decisión al respecto. Si se tiene evidencia de que el ingreso total mensual en esta región es inferior a 900,000 dólares se considerará a esta zona como susceptible de ayuda social. Se seleccionó una muestra de 100 familias de esta región, en la cual radican 5000 familias. La muestra dio un ingreso mensual promedio de 150 US$ y una desviación estándar de 80 US$. Obtenga un intervalo del 90% de confianza para el ingreso total de la comunidad y a partir es este Intervalo determine si se puede considerar que se tiene evidencia para considerar que esta región requiere de ayuda social. Problema 8 Una casa comercial tiene 2500 clientes con cuenta de crédito. Para estimar el total adeudado por estos clientes, se selecciona una muestra aleatoria de 25 cuentas la cual da los siguientes resultados: una media de S/. 950 y una desviación estándar de S/.300. Construya un intervalo de confianza del 99% para estimar la cantidad total adeudada por los clientes de esta casa comercial, si se sabe que el monto adeudado por los clientes tiene una distribución normal con media y varianza 2 Problema 9 Se selecciona una muestra aleatoria de 100 familias de una comunidad de 15000 familias. La muestra dio como resultado un promedio de 150 (US$) de ingreso mensual y una varianza muestral de 400 (US$2), con esta información se entregó el siguiente informe “Los ingresos totales de la comunidad están comprendidos entre 2200800 y 2299200 (US$)”. Indique que nivel de confianza se usó en el informe dado. Problema 10 El gerente de producción desea estimar el tiempo promedio que demora cierto proceso, como el tiempo se mide en minutos, este gerente desea tener un error máximo de estimación, del tiempo promedio real, de a lo más 4 minutos, se sabe, por experiencias anteriores, que la desviación estándar de los tiempos de procesamiento es de 10 minutos, qué tamaño de muestra debe de considerar para el estudio, si desea un nivel de confianza del 95% para sus resultados?
Tema: Intervalos de Confianza para la proporción Problema 11 En cierto distrito de la capital se está realizando un estudio mediante el cual se podría tener la posibilidad de otorgar crédito monetario a los comerciantes de la zona y de este modo se puedan formalizar. Para esto se quiere estimar el ingreso mensual de un sector de comerciantes informales. Se tomó una muestra aleatoria de 120 de ellos y se encontró entre otros datos los siguientes: un ingreso promedio de S/.1800 con una desviación estándar de S/.150 y sólo el 36% tiene ingresos superiores a S/.2100. a) Construye un intervalo de confianza del 95% para estimar el ingreso promedio mensual. Interprete los resultados. b) Estimar la proporción de comerciantes con ingresos superiores a S/.2100, utilizando un nivel de confianza del 90%. c) Si la proporción de comerciantes con ingresos superiores a S/.2100 se estimó puntualmente mediante una muestra piloto, en 0.3, ¿qué tan grande debe ser la muestra para que el error de estimación no sea superior a 0.04 considerando un nivel de confianza del 95%? 5
Problema 12 En la actualidad, la Aseguradora del Fondo de Pensiones “NEPTUNO” cuenta con 145 000 afiliados que hacen sus aportaciones con regularidad. En una muestra aleatoria de 1200 afiliados que hicieron sus aportaciones en el último trimestre, se obtuvo los siguientes datos: un promedio $850 y una desviación estándar $225. Se conoce también que 650 de los 1200 afiliados seleccionados hicieron aportaciones superiores a $1250. a) Estime con 95% de confianza el monto total de aportaciones de los afiliados a esta AFP en el último trimestre. b) Con 98% de confianza estime el número de afiliados con aportaciones superiores a $1250 en dicho trimestre. Problema 13 Una industria lechera ubicada en el departamento de Ica está estudiando la posibilidad de cambiar sus botellas de vidrio para la leche a envases de plástico. Con esta finalidad, se realizó el estudio considerando una muestra aleatoria de 450 personas, las cuales fueron clasificadas por estrato socioeconómico. Los resultados se muestran en cuadro adjunto: A favor del cambio Si No
Estrato socioeconómico A (Alto) B (Medio) C(Bajo) 80 70 120 40 80 60
a) Estime la proporción de personas que están a favor del cambio. Use un nivel de confianza del 92% b) Si en la ciudad hay 4,000 personas que pertenecen al estrato A, 12,000 al estrato B y 20,000 al estrato C, estime el número de personas del estrato C que están a favor del cambio de envase. Use un nivel de confianza del 98% y suponga que las muestras fueron obtenidas independientemente de cada uno de los estratos. Problema 14 Para adquirir un lote que contiene artículos, un comerciante desea estimar el porcentaje de artículos defectuosos que contiene este lote, para lo cual se fija un error de estimación de a lo más 3% y un nivel de confianza del 93%. ¿Qué tamaño de muestra deberá tomar?, este comerciante sabe, por experiencias anteriores, que aproximadamente este tipo de lotes tienen 7.5% de artículos defectuosos. Problema 15 Un banquero desea estimar el porcentaje de gente que responde favorablemente a una nueva campaña de publicidad televisiva. Este banquero desea realizar dicha estimación con un error máximo de 2.5% y un nivel de confianza del 90%. Determine el tamaño de muestra necesario para realizar dicha estimación. Una muestra piloto determinó que p=65%.
Tema: Intervalos de Confianza para diferencia de medias Problema 16 Se lleva a cabo las pruebas de la resistencia a la tensión sobre dos diferentes clases de largueros de aluminio utilizados en la fabricación de alas de aeroplanos comerciales. Por experiencia pasada con el proceso de fabricación de largueros y del procedimiento de prueba, que las desviaciones estándar de las resistencias a la tensión de los largueros son σ1= 1 y σ2= 1.5 respectivamente. Los datos resultantes de la prueba realizada se presentan en la siguiente tabla: 6
Clase de larguero 1 2
Tamaño de la muestra n1=10 n2=12
Media Muestral(kg/mm )
Construya un intervalo de confianza del 90% para la diferencia de medias. Problema 17 Un artículo publicado dio a conocer los resultados de un análisis del peso de calcio en cemento estándar y en cemento contaminado con plomo. Los niveles bajos de calcio indican que el mecanismo de hidratación del cemento queda bloqueado y esto permite que el agua ataque varias partes de una estructura de cemento. Al tomar diez muestras de cemento estándar, se encontró que el peso promedio de calcio es de 90 con una desviación estándar de 5; los resultados obtenidos con 15 muestras de cemento contaminado con plomo fueron de 87 en promedio con una desviación estándar de 4. Supóngase que el porcentaje de peso de calcio está distribuido normalmente. Encuéntrese un intervalo de confianza del 95% para la diferencia entre medias de los dos tipos de cementos. Se conoce que la varianza del peso de calcio en cemento estándar y en cemento contaminado con plomo son: 27.5 y 15.875 respectivamente. Problema 18 Se ha realizado un estudio para comparar el contenido de nicotina (en gramos) de 2 marcas de cigarrillo en base a muestras de tamaño n A = 10 y nB = 8 cigarrillos respectivamente. Se sabe que estas dos marcas de cigarrillos tienen la misma varianza del contenido de nicotina de 0.36 gramos2. Los resultados del estudio se presentan a continuación: Marca
Promedio
Desviación Estándar
A B
3.1 2.1
0.5 0.7
a) Indique claramente los supuestos necesarios bajo los cuales se puede desarrollar este problema. b) Bajo los supuestos que Usted indicó, construya un intervalo de confianza del 95% para estimar la diferencia en el contenido promedio de nicotina de las 2 marcas de cigarrillos, Analice los resultados y comente.
Tema: Intervalos de Confianza para diferencia de proporciones Problema 19 Con respecto al problema 14 se tiene que en un mismo período y basado en una muestra de 1500 afiliados, la competencia más cercana, AFP “VENUS” indica que el promedio de aportaciones es $1020 con desviación estándar $190, además 780 afiliados tuvieron aportaciones superiores a los $1250. a) Con esta información adicional, estime con un 98% de confianza la diferencia entre las aportaciones promedios que realizan los afiliados de las dos aseguradoras. Interprete sus resultados. b) Con esta información adicional, estime con un 98% de confianza la diferencia entre las proporciones de aportaciones superiores a $1250 que realizan los afiliados de las dos aseguradoras. Interprete sus resultados. Problema 20 Se realizó un estudio, con la finalidad de explorar la aceptación de la cerveza Light, según nivel Socioeconómico (Nivel Socioeconómico A: NSE A, y Nivel Socioeconómico B: NSE B) y el grupo de edad del público consumidor (Jóvenes y Adultos). Para realizar el estudio se 7
consideró muestras aleatorias de personas mayores de 18 años del estrato socioeconómico A y otra del estrato socioeconómico B y se consultó acerca de su preferencia por alguna de las cervezas mencionadas (Cerveza Light o cerveza tradicional), y los resultados obtenidos se muestran en la siguiente tabla:
NSE A NSE B
Cerveza Tradicional Jóvenes Adultos 170 210 203 250
Cerveza Light Jóvenes Adultos 260 176 188 120
a) Estime con una confianza del 96% la diferencia de proporción de personas entre los estratos A y B que prefieren la cerveza tradicional. Interprete el resultado. b) Estime con una confianza del 98% la diferencia de proporción de jóvenes que prefieren la cerveza Light entre los estratos A y B. Interprete el resultado.
Tema: Prueba de Hipótesis para la media Problema 21 El Gerente de control de calidad desea determinar si la máquina con la que embolsan un cereal está bajo control, es decir si se está embolsando con un promedio de 500 gramos. Para determinar esto toma una muestra aleatoria de 36 bolsas y encuentra un promedio de 496.5 gramos. a) Plantee la hipótesis adecuadas indique, si es necesario, los supuestos bajo los cuales se puede resolver este problema. b) Describa en que consiste los errores tipo I y error tipo II c) Indique la estadística apropiada de esta prueba d) A que conclusión llegará el jefe de control de calidad, si sabe que el proceso tiene una varianza de 81 gramos2 y utiliza una 5% de significancia? e) Calcule la probabilidad de aceptar la hipótesis nula cuando la verdadera media es de: 498 gramos y 502 gramos. Problema 22 En una oficina de defensa del consumidor se han recibido quejas de los consumidores con respecto a que una determinada marca de aceite vende botellas que indican 850 c.c. pero que en realidad es menor a esa cantidad. Un funcionario de esta oficina con la finalidad de determinar si los clientes tienen fundamento en sus quejas decide tomar una m.a. de 49 botellas de aceite y encontró que el promedio de esta muestra fue 848.3c.c. y una desviación estándar de 10c.c. a) Plantee la hipótesis adecuadas b) Usando un nivel de significancia del 5% ¿A qué conclusión llegará el funcionario de la oficina de defensa del consumidor? Problema 23 Se sabe que en una compañía de taxis el gasto diario promedio en combustible, por unidad, es una variable con distribución normal, cuyo promedio es de 187.6 galones, y una desviación estándar de 32.5 galones. El gerente de operaciones decide incluir un aditivo especial al combustible que le permitirá un ahorro en ese rubro. Después de incluir el aditivo toma una muestra de 6 unidades y encontró los siguientes gastos en combustible expresado en galones por día: 180.3 179.6 185.7 170.5 158.3 180.6
8
El gerente operativo afirma que el gasto promedio diario en combustible disminuyó en más de 12% ¿En base a la información muestral presentada, se puede aceptar lo afirmado por el gerente operativo?. En la solución de este problema considere: i. Plantear el o los parámetros que crea conveniente ii. Realizara la prueba respectiva iii. Describa claramente sus conclusiones Problema 24 La cantidad promedio que se coloca en un recipiente en un proceso de llenado se supone que es 20 onzas. En forma periódica se escogen al azar 25 recipientes y el contenido de cada uno de ellos se pesa. Se juzga el proceso fuera de control cuando x < 19.8 ó x >20.2 onzas. Se supone que la cantidad que se coloca en cada recipiente es una v.a. con distribución normal con una desviación estándar de = 0.5 onzas. a) Formule H0 y H1 e indique en qué consisten los errores de tipo I y II. b) Calcular . c) Para = 0.05, calcular cuando = 20.1. Problema 25 Considerando el reporte Minitab que se presenta líneas abajo, responda cada una de las siguientes preguntas justificando brevemente su respuesta
T de una muestra Prueba de mu = 16 vs. > 16 Media del Error N Media Desv.Est. estándar 10 17.209 0.937 0.296
95% Límite inferior 16.666
T 4.08
P 0.001
a.- Plantee la hipótesis Nula y Alternativa b.- ¿Cuál es el valor de la media muestral? c.- Utilizando el valor del estadístico de prueba y un nivel de significancia del 5% ¿Cuál es la decisión? Problema 26 El gerente de producción de la compañía de cerveza Inca revisa su línea de producción. El llenado automático debe dar un contenido medio de 320 cm3. Para el control del llenado promedio se tomó se tomó una muestra aleatoria de 36 unidades del producto y se encontró un contenido medio de 317 cm3 con una desviación estándar de 12cm. a. ¿Hay suficiente razón para creer que existe una baja en el promedio de los contenidos?. Realice la prueba al nivel de significación del 5%. b. Calcule la probabilidad de cometer el error tipo II cuando la verdadera media es de 312cm3. c. Calcule la potencia de la prueba. Problema 27 Las cajas de avena llenadas por un proceso automático deben tener un contenido de 160 gramos en promedio, si no es así, debe detenerse la producción para regular la máquina. El peso en gramos Xi de 10 cajas seleccionadas aleatoriamente de la producción da los siguientes resultados: 10
10
X
i
i 1
1580
X
2
i
249658
i 1
9
a.- ¿Es razonable detener la producción Use el nivel de significación de 0.01. b.- Con que probabilidad debe rechazar la hipótesis nula si el verdadero valor promedio de la media es de 158 gramos.
Tema: Prueba de Hipótesis para la desviación estándar Problema 28 El gerente de ventas de una empresa industrial tiene que decidir si compra o no una nueva máquina para reemplazar la que tienen en uso actualmente en .el departamento de producción. Se sabe que la máquina que está en uso tiene una varianza, con respecto al tiempo que demora en producir una pieza, de 0.067 min2. Al tomar un muestra aleatoria de 20 piezas producidas por la máquina que se desea comprar se encontró una desviación estándar de 0.15 minutos. Si se utiliza un 5% de significancia y la decisión estará basada en la menor variabilidad, ¿Cuál será la decisión del gerente de ventas? Problema 29 Con cierto proceso de producción, el cual se utiliza en la actualidad, se tiene que la utilidad promedio por unidad producida es de 115 soles con una desviación estándar de 10 soles. Se realizan ciertas medidas de reajuste en el proceso de producción de este artículo, con dos objetivos principalmente, uno es el de mejorar el rendimiento del proceso, en términos de utilidad, y el otro es hacer que las utilidades sean más homogéneas. Luego de estas medidas se toma una muestra aleatoria de 6 objetos y se determinó las siguientes utilidades: 115.6, 118.5, 123.6, 119.5 , 114.2 , 116.3 Utilizando un 5% de significancia, diga Usted ¿si se puede concluir que se lograron los dos objetivos establecidos para mejorar el proceso?. Problema 30 El jefe de ventas de una empresa decidirá que su equipo de vendedores debe ser recompuesto si la varianza de las ventas en la última semana es mayor a 10.15 (dólares al cuadrado). Si para esta semana recolecta datos de una muestra aleatoria de 25 ventas del equipo y encuentra una varianza de 18.03 (dólares al cuadrado). a) ¿Indican los resultados que se debe recomponer el equipo de ventas? Considere =0.05 b) ¿Qué valor máximo debe tener la varianza muestral para no rechazar la hipótesis nula? c) Si se fija =0.05, determine la probabilidad del error de tipo II cuando la Desviación estándar real es de 3.8 dólares. d) Indique que supuestos fueron necesarios para resolver este problema de aplicación? Problema 31 En un estudio acerca de las economías latinoamericanas, se plantea como hipótesis principal lo siguiente: "Los países Latinoamericanos se han caracterizado por presentar economías sumamente inestables productos de las diversas políticas económicas aplicadas por los distintos gobiernos, este hecho se aprecia por las fuertes fluctuaciones presentadas en el crecimiento de nivel de PBI de dichos países, lo cual contrasta con las economías europeas caracterizada por una estabilidad en el nivel de su PBI". Por estudios anteriores se conoce que la desviación estándar del crecimiento del PBI generado por los países europeos es de 2.5235 (en millones de dólares) y que está normalmente distribuido. Si en una muestra aleatoria de 10 países latinoamericanos se ha obtenido una varianza muestral de 10.758, ¿se puede afirmar que la hipótesis planteada es correcta? 10
Problema 32 Se desea evaluar el desempeño del departamento de cobranzas de una sucursal ubicada en Ica, de una determinada empresa crediticia. Según datos históricos recopilados por la gerencia que lleva a cabo la investigación, el promedio mensual de las captaciones por cobros asciende a 15000 millones de soles, con una desviación estándar de 1540 millones de soles. Para efecto de la evaluación de la sucursal en Ica se elige las captaciones logradas en año y medio de cobranzas, obteniendo un promedio de 12000 y desviación estándar de 2500 millones de soles. Se le pide a Ud., utilizando las herramientas estadísticas adecuadas que informe a la gerencia sobre el desempeño de la sucursal en Ica, considerando el nivel promedio de captaciones y sobre la estabilidad de los mismos, asimismo, señale los supuestos que fueron necesarios para llevar a cabo la evaluación.
Tema: Prueba de Hipótesis para la proporción Problema 33 El Dpto. de Marketing de una compañía que produce el detergente ABC encontró en una muestra de 200 amas de casa que el 20% utiliza esta marca de detergente. Después de una intensa campaña publicitaria, se tomó otra muestra de 300 amas de casa la que indicó que el 27% favorece esta marca. Al 5% de significación, ¿puede el jefe del Dpto. concluir, en base a los resultados de esta muestra, que la campaña fue exitosa? Problema 34 Una oficina relacionada con la cobranza de impuestos comprobó que el 5% de las declaraciones juradas de impuestos eran inexactas. Después de un programa de educación aplicado a los contribuyentes se comprobó que de 1124 declaraciones juradas, 45 eran inexactas. ¿Existe suficiente evidencia para concluir que el programa de educación ha rendido buenos resultados? Problema 35 Al señor Juan Pérez le han propuesto participar en una lista para el congreso, en representación de su provincia. Para aceptar la propuesta este señor quiere estar seguro de que al menos el 25% de los votantes en la provincia que reside están a favor de su candidatura. Para determinar esto toma una muestra aleatoria de tamaño n = 450 personas encontrando que 90 están a favor de su candidatura. ¿Aceptará el señor Juan Pérez participar en la lista? Considere = 5% Problema 36 Una compañía telefónica está tratando de determinar si algunas líneas en una determinada comunidad deben instalarse subterráneas. Debido a que se hará un pequeño cargo adicional en las cuentas telefónicas para pagar los costos extras de la instalación, la compañía ha determinado hacer un estudio entre los clientes y proceder con la instalación subterránea solo si el estudio indica que más del 60% de todos los clientes están a favor de la instalación. a) Defina en forma clara el parámetro que utilizará en la prueba de hipótesis respectiva. b) Si 118 de 160 clientes entrevistados están a favor de esta instalación a pesar del cargo adicional, ¿qué debe hacer la compañía? Use un =0.01 c) ¿Cuáles son las conclusiones al respecto? d) Defina el error tipo I y error tipo II en términos del problema
11
Problema 37 “Fresquito”, es una nueva marca de gaseosas que entró al mercado y logró un nivel de aceptación del 12% (es decir el 12% de consumidores de gaseosas prefieren esta marca). Con la finalidad de tener una mayor participación del mercado la Gerencia de Producción de “Fresquito” decide realizar una agresiva campaña de publicidad por televisión, radio y medios escritos. a) Luego de la campaña de publicidad la Gerencia desea, como es lógico, evaluar los resultados de esta campaña de publicidad, para lo cual se toma una muestra de 450 personas y se fija un nivel de significancia del 5%. Determine las hipótesis de interés para la Gerencia y establezca la regla de decisión correspondiente, definiendo con claridad el parámetro que se está sometiendo a prueba. b) Si luego de la campaña de publicidad, el porcentaje real de consumidores que prefieren la marca “Fresquito” es del 14%, (pero lógicamente esto no lo sabe el Gerente de producción). Determine, bajo estas condiciones, la probabilidad de que el Gerente de Producción, concluya de que la campaña no fue efectiva, cuando utiliza la regla de decisión hallada anteriormente. c) Debido al costo que implica una campaña publicitaria, el Gerente desea tener un criterio de decisión con el cual se tenga una probabilidad de 0.01 de concluir que la campaña publicitaria si fue efectiva, cuando en realidad dicha campaña no lo fue. ¿Cuál debe ser el criterio de decisión (la regla de decisión) que debe utilizar?
Tema: Prueba de Hipótesis para la diferencia de medias Problema 38 Se piensa que en el espesor de una película de plástico (en mili pulgadas) que se coloca en un material de sustrato influye la temperatura a la que se aplica el recubrimiento. Se lleva a cabo un experimento totalmente aleatorizado. Once sustratos se recubren a 125 °F, dando como resultado un espesor medio muestral del recubrimiento de 103.5 y una desviación estándar de 10.2. Otros 13 sustratos se recubren a 150°F para los que se observa una media de 99.7 y una desviación estándar de 20.1. Se creía al principio que con el incremento de la temperatura del proceso se reducirá el espesor medio del recubrimiento. a) Defina claramente el o los parámetros que están involucrados en esta prueba b) Realice la prueba de hipótesis correspondiente ¿Qué se puede concluir con respecto al espesor promedio luego de realizada la prueba? Use un =0.05. Se considerará válida la solución si se indican claramente las hipótesis y el criterio de decisión utilizado. Como información adicional para el desarrollo de este problema se tiene la siguiente corrida del programa MINITAB: Test for Equal Variances 95% Bonferroni confidence intervals for standard deviations Sample N Lower StDev Upper 1 11 6.7912 10.2 19.6037 2 13 13.7803 20.1 35.9441 F-Test (normal distribution) Test statistic = 0.26, p-value = 0.039
Problema 39 El gerente de marketing de una compañía desea determinar si un nuevo envase podría aumentar las ventas de su producto. Para probar la factibilidad de la nueva forma de envase se seleccionó una muestra de 18 tiendas similares y se asignaron, en forma aleatoria, 10 de ellas como mercado de prueba de la nueva forma de envase, en tanto que las otras 8 continuarían recibiendo el envase antiguo. Las ventas semanales durante el tiempo de estudio fueron las siguientes: 12
Envase nuevo n1 = 10 x1 = 130 cajas S1 = 10 cajas
Envase antiguo n1 = 8 x 2 = 118 cajas S2 = 12 cajas
Si se sabe que el nivel de ventas con el envase nuevo y con el envase antiguo se comporta según una distribución normal y que las muestras tomadas son independientes, ¿Tiene evidencia de que la nueva forma de envase dio como resultado un mayor nivel de ventas? Utilizar un nivel de significancia del 5% Problema 40 La tabla siguiente resume algunos datos de un experimento realizado para estudiar varias características de tornillos de anclaje, puesto que la empresa “Ferriti” desea realizar la compra de un lote de estos tornillos: Diámetro de tornillo 3/8 1/2
Tamaño de la muestra 15 14
Resistencia promedio (kilo/ libra) 4.25 7.14
Desviación Estándar 1.3 1.68
a) Un aspecto importante es la homogeneidad en cuanto a la resistencia de estas dos marcas de tornillos, podemos concluir, en base a la información mostrada ¿Las resistencias de los tornillos de ambos diámetros son homogéneas? Use un nivel de significancia =0.05 b) Realice una prueba, con un =0.05 para decidir si el verdadero promedio de resistencia para tornillos de media pulgada excede a la resistencia promedio de los tornillos de 3/8 en más de 2 kilos/libra. Problema 41 En la siguiente tabla se muestran los datos obtenidos al tomar una muestra de 23 establecimientos y medir el nivel de ventas de dos productos A y B (en miles de soles por semana) de acuerdo al tipo de establecimiento en el que se expenden (Botica o Bodega).
Bodega
Farmacia
Producto A 2.5 3.0 4.3 5.1 4.5 3.8 4.2 4.6 5.3 6.7 8.1 7.9
Producto B 3.5 4.3 5.3 7.1 6.5 5.4 6.5 8.1 6.9 7.3 8.6
a) ¿Se puede decir que el nivel de ventas promedio del producto B es mayor al nivel de ventas del producto A? . Utilizar un nivel de significancia del 5%. b) Considerando ambos productos, y utilizando un 5% de significancia, ¿se puede afirmar que el nivel de ventas promedio en bodegas es igual al nivel de ventas promedio en la Farmacias? c) El gerente de producción afirma que el nivel de ventas promedio del producto B es de 7500 soles semanales por lo que recomienda tomar las medidas del caso con la finalidad de incrementar el consumo de dicho producto. Utilizando un 5% de significancia, se puede aceptar la recomendación del gerente de producción? d) Si la Desviación Estándar en el nivel de ventas del producto B es de 4000 soles o más se tendrá que tomar las medidas necesarias para homogenizar estos niveles de venta. Tomando en cuenta los resultados observados en la muestra y utilizando un 2.5% de significancia ¿Considera que es necesario tomar dichas medidas? 13
Problema 42 La siguiente información representa los datos obtenidos en una m.a. de tiempos utilizados en la fabricación de un determinado artículo. La empresa que los fabrica tiene dos líneas de producción, en dos turnos diferentes (el tiempo está en minutos). Las muestras del cada uno de los turnos y de cada una de las líneas de producción fueron extraídas aleatoriamente y en forma independiente Línea A 2.5 3.0 Mañana 4.3 5.1 4.5 4.6 5.3 Tarde 6.7 8
Línea B 3.5 4 5.3 7.1 6.5 5 6.5 8.1 6.9
Planteando las hipótesis correspondientes, responda las siguientes interrogantes: a) ¿Se puede decir que el promedio de tiempo en el turno de la mañana es diferente al tiempo promedio en el turno de la tarde?. Usar un nivel de significancia del 10% b) El gerente de producción afirma que el tiempo promedio de producción en la Línea A es de 7.5 minutos y por lo tanto se deben realizar reajustes pues es necesario reducir ese tiempo. Con un 5% de significancia ¿Tiene razón el gerente? c) Si la Desviación Estándar en el tiempo de producción del proceso B durante el turno de la mañana es 4 minutos o más se tendrá que detener el proceso y reajustar la línea. Usando un nivel de significancia de 1% ¿Será necesario el reajuste? Problema 43 Se supone que la duración (en horas) de unas pilas eléctricas para calculadoras de escritorio tiene una distribución normal. Un fabricante desea comparar la durabilidad de las pilas producidas por dos proveedores (A y B). Para ello prueba una muestra aleatoria de 14 pilas de cada marca hasta el agotamiento. Los datos obtenidos fueron procesados con el programa MINITAB, y algunos de los resultados se muestran en el recuadro adjunto, en base a esta información y utilizando las pruebas correspondientes responda las siguientes preguntas: a) El gerente de la fábrica B afirma que las pilas que producen tienen un promedio de duración mayor al de las pilas producidas por la fábrica A. En base a la información muestral presentada, ¿se puede confirmar la afirmación del gerente? Utilizar = 5% b) El gerente de producción de la fábrica B indica que la desviación estándar de la duración de las pilas que fabrican supera las 35 horas y por lo tanto se debe detener el proceso para realizar los reajustes necesarios? Si se utiliza un 5% de significancia, se puede concluir que el gerente de producción tiene razón, y que por lo tanto se debe de detener el proceso? c) Con respecto a las hipótesis planteadas en la parte “b”, ¿Cuál es la probabilidad de que se decida no detener el proceso, cuando en realidad la desviación estándar es de 38.5 horas?. Test for Equal Variances Level1 A Level2 B Confvl 95.00 F-Test (normal distribution) Test Statistic : 0.494 P-Value : 0.133
14
Prueba T de dos muestras e IC Muestra 1 2
N 14 14
Media 280,3 253,0
Desv.Est. 31,9 22,4
Media del Error estándar 8,5 6,0
Diferencia = mu (1) - mu (2) Estimado de la diferencia: 27,3 Límite inferior 95% de la diferencia: 9,4 Prueba T de diferencia = 0 (vs. >): Valor T = 2,62 Valor P = 0,008 GL = 23
Prueba T de dos muestras e IC Muestra 1 2
N 14 14
Media 280,3 253,0
Desv.Est. 31,9 22,4
Media del Error estándar 8,5 6,0
Diferencia = mu (1) - mu (2) Estimado de la diferencia: 27,3 Límite inferior 95% de la diferencia: 9,5 Prueba T de diferencia = 0 (vs. >): Valor T = 2,62 Valor P = 0,007 GL = 26 Ambos utilizan Desv.Est. agrupada = 27,5624
Problema 44 En un estudio realizado con la finalidad de explorar la aceptación de la cerveza Light, según el nivel Socioeconómico y el grupo de edad del público consumidor. Se tomó una muestra aleatoria de personas mayores de 18 años y se consultó acerca del gasto mensual aproximado en el consumo de cerveza, en soles, y los resultados obtenidos se muestran en la siguiente tabla:
NSE A
NSE B
Cerveza Tradicional Jóvenes Adultos 50 60 64 48 56 40 52 44 58 50 65 40 40 48 44 32 28 40 25 43 40
Cerveza Light Jóvenes Adultos 80 56 65 58 60
76 56 48 74 30
40 45 42 35
40 52 65
En base a esta información responda lo siguiente: a) Se impulsará una agresiva campaña de publicidad orientada a inducir el consumo de cerveza, y esta campaña estará orientada al nivel socioeconómico (NSE) que muestre un promedio de consumo menor. Utilizando un 5% de significancia ¿A qué nivel socioeconómico se debería orientar dicha campaña publicitaria? b) El gerente de ventas afirma que la nueva cerveza light ha logrado un buen nivel de aceptación en el mercado, tanto así que el gasto promedio en este tipo de cerveza es igual al gasto promedio en el consumo de la cerveza tradicional. Utilizando un nivel de significancia del 5% ¿Qué puede decir con respecto a la afirmación hecha por el gerente de ventas? c) En general se puede afirmar que ambos grupos de edad tienen el mismo gasto promedio en el consumo de cerveza utilice un 5% de significancia, d) Lo afirmado en la parte c) también se cumple cuando se especifica el tipo de cerveza, es decir se cumple tanto en el consumo de la cerveza tradicional como en el consumo de la cerveza light. Utilizar un 5% de significancia.
15
Tema: Prueba de Hipótesis para la diferencia de proporciones Problema 45 El jefe de ventas de una gran cadena de tiendas debe decidir entre dos cursos similares de capacitación para sus vendedores. Para esto decide comprobar la eficacia de los cursos tomando un muestra de 350 vendedores para el curso A y otra muestra de 400 vendedores para el curso B, al final de cada curso encontró que en el primer caso 82% de los vendedores mejoraron significativamente su desempeño, mientras que en con el curso B ese porcentaje fue del 74%. Como el curso A es más costoso decidirá enviar a sus vendedores a dicho curso siempre y cuando el porcentaje de vendedores que mejoran significativamente su desempeño supere en más de 6% al porcentaje de vendedores que mejoran significativamente su desempeño y que recibieron el curso B, utilizando un = 0,05. ¿Cuál será la decisión del jefe de ventas de esta cadena de tiendas? Problema 46 Una fábrica produce dos tipos de productos en dos turnos diferentes y se desea observar el número de productos defectuosos en ambos turnos. Para esto se toman dos muestras independientes, una de cada turno de trabajo, y se determinó la cantidad de artículos defectuosos y el tipo de producto producido, los resultados se muestran en la siguiente tabla: PRODUCTO TURNO Mañana Tarde
A Defectuosos 20 5
B Buenos 200 150
Defectuosos 50 25
Buenos 300 200
a) ¿Podemos afirmar que el turno de la tarde se producen artículos con un menor porcentaje de unidades defectuosas que en el turno de la mañana?. I. Defina los parámetros de interés en este caso II. Realice la prueba de hipótesis correspondiente y de sus conclusiones
b) ¿Podemos afirmar que en el turno de tarde, la proporción de defectuoso del producto B es mayor que la proporción de defectuosos del turno de la mañana en más de 0.04?. I. Defina, en este caso, los parámetros involucrados II. Realice la prueba de hipótesis correspondiente e indique sus conclusiones al respecto.
Problema 47 Se entrevistó a 900 personas y se les preguntó acerca de su preferencia con respecto a tres tipos de programas de televisión, los entrevistados se clasificaron de acuerdo al distrito donde residían y de acuerdo al grupo de edad. Los resultados fueron los siguientes:
Distrito A
Distrito B
Distrito C
Adolescentes Jóvenes Adultos Adolescentes Jóvenes Adultos Adolescentes Jóvenes Adultos
Cómico 40 45 55 35 30 105 25 25 40
Tipo de Programa Deportivo Musical 50 20 30 60 20 15 60 15 40 40 15 5 40 15 30 20 15 10
Se desea lanzar al aire un novedoso programa Cómico, y se realizará este lanzamiento si se tiene evidencia de que en la población adulta, considerando los tres distritos en conjunto, el porcentaje de personas que prefieren programas cómicos es mayor al porcentaje de personas que prefieren un programa Deportivo. Utilizando un nivel de significancia del 2.5% ¿Cuál será la decisión al respecto? 16
Considerando que las muestras aleatorias tomadas de los distritos son independientes, resuelva las siguientes cuestiones: i. Plantear el o los parámetros que crea conveniente ii. Realice la prueba respectiva iii. Describa claramente sus conclusiones Problema 48 Cierta compañía comercializa sus productos mediante catálogos y ventas puerta por puerta. Esta compañía ha decidido comprobar la eficacia de una campaña de TV, para lo cual selecciona dos territorios semejantes. Uno recibió campaña por TV y en la otra no. El porcentaje de visitas con éxito en el territorio con campaña fue de 18%, mientras que en el otro territorio (sin campaña) fue 14%. Se hicieron 900 visitas en cada territorio. Para justificar el costo de la campaña se requiere más de 3% de aumento en la proporción de visitas con éxito. ¿Dan estos datos pruebas de que la campaña por TV se justifica?. Utilice un nivel de significancia = 5% Problema 49 En la actualidad, la Aseguradora de Fondo de Pensiones “NEPTUNO” cuenta con afiliados que hacen sus aportaciones con regularidad. En una muestra tomada de los últimos aportes realizados por 850 afiliados durante el último trimestre, se obtuvo los siguientes datos: promedio de aportaciones trimestrales $480 y una desviación estándar $225, además se encontró que 600 de los afiliados seleccionados hicieron aportaciones superiores a los $1250. a) Se puede afirmar, utilizando un 5% de significancia, que el promedio de aportaciones de los afiliados de la AFP NEPTUNO, es superior a los 465 dólares trimestrales. b) En un mismo período y basado en una muestra de 1200 afiliados, la competencia más cercana, AFP “VENUS” indica que 778 afiliados hicieron aportaciones superiores a los $1250 trimestrales. ¿Esta información evidencia que en la AFP NEPTUNO, el porcentaje de afiliados con aportaciones superiores a los $1250 supera los de la AFP VENUS en más de 2.5%? Utilizar un nivel de significancia del 8% .
Tema: Análisis de Varianza Unidireccional (ANOVA) Problema 50 El jefe de producción de una fábrica desea determinar si las cuatro máquinas que tiene utilizan el mismo tiempo promedio en la fabricación de un artículo. Para esto selecciona muestras aleatorias de cada máquina de tamaños n1 = 6, n2 = 4, n3 = 4 y n4 = 6 respectivamente, midiendo el tiempo que utilizan en la fabricación de un artículo. Debido a un descuido de su ayudante la información obtenida se perdió parcialmente, encontrándose sola la siguiente tabla incompleta: Fuente de variación Entre tratamientos
Suma de cuadrados
Grados de libertad
Cuadrados medios
F
152.62
Error TOTAL
542.92
Con esta información, plantee las hipótesis adecuadas y diga cuál será la conclusión del jefe de producción, interpretando adecuadamente sus resultados. Use = 0.05
17
Problema 51 Con la finalidad de comparar los precios del producto “Escaso A1” se llevó a cabo un experimento en tres zonas de Lima: Cono Sur, Cono Norte y Lima Centro. En cada una de dichas zonas se tomaron muestras de las tiendas más grandes: 6 tiendas de Lima Centro, 4 tiendas de Cono Norte y 5 tiendas del Cono Sur y se consultó acerca del precio de dicho producto, los resultados se muestran en la siguiente tabla: Lima Centro 29 27 31 29 32 30
ZONAS Cono Norte Cono Sur 27 30 27 30 30 31 28 27 29
¿Constituyen los datos anteriores, al nivel de significación del 5%, suficiente evidencia que indique una diferencia en el precio promedio del producto escaso A1 en las tiendas de las 3 zonas de Lima? Problema 52 Los miembros de un equipo ciclista se dividen al azar en tres grupos que entrenan con métodos diferentes. El primer grupo realiza largos recorridos a ritmo pausado, el segundo grupo realiza series cortas de alta intensidad y el tercero trabaja en el gimnasio con pesas y se ejercita en el pedaleo de alta frecuencia. Después de un mes de entrenamiento se realiza un test de rendimiento consistente en un recorrido cronometrado de 9 Km. Los tiempos empleados fueron los siguientes: Método 1 15 16 14 15 17
Método 2 14 13 15 16 14
Método 3 13 12 11 14 11
A un nivel de significación del 5% ¿Puede considerarse que los tres métodos producen resultados equivalentes? O por el contrario ¿Hay algún método superior a los demás?. Plantee las hipótesis y realice las pruebas necesarias. Problema 53 Una lista de palabras sin sentido se presenta en la pantalla del ordenador con cuatro procedimientos diferentes, asignados al azar a un grupo de sujetos. Posteriormente se les realiza una prueba de recuerdo de dichas palabras, obteniéndose los siguientes resultados: PROC1 5 7 6 3 9 7 4
PROC2 9 11 8 7 7 4 4
PROC3 8 6 9 5 7 4
PROC4 1 3 4 5 1
a) ¿Qué conclusiones pueden sacarse acerca de las cuatro formas de presentación, con un nivel de significación del 5%?. b) Realice un análisis más extenso con ayuda de la siguiente salida proporcionada por el MINITAB 18
Problema 54 Los siguientes datos muestran los tiempos (en minutos) que tardan en procesar una pieza cada una de las cuatro máquinas, para determinar si hay diferencia en el tiempo de procesamiento. Las muestras obtenidas son independientes y el gerente de producción tiene evidencia suficiente como para asumir que la distribución de los tiempos sigue una distribución normal. Máquina 1 4 5 4 5 4 3 4
Máquina 2 2 2 3 3 3 2 2
Máquina 3 3 4 3 4 4 3 4
Máquina4 2 3 3 2 3 4 3
Determine si se puede considerar que los tiempos de procesamiento de utiliza cada máquina no son iguales, utilizando un nivel de significancia del 5% y además si esto es cierto ¿qué máquina recomendaría utilizar?
Tema: Pruebas Chi- Cuadrado de Bondad de Ajuste Problema 55 El área de Matemática, basándose en informaciones de semestres anteriores sabe que, el 43% de los alumnos aprobaron todas las materias inscritas, un 30% aprobó la mitad, un 12% reprobó todas las materias y un 15% se retiró. Al final de este semestre el coordinador selecciono a 400 alumnos y encontró que: 195 aprobaron todas las asignaturas, 136 aprobaron la mitad, 41 reprobaron todas las asignaturas y 28 se retiraron. ¿Podemos concluir, a raíz de los resultados, que en el último semestre varió la estructura de los cursos aprobado y retirados con respecto a los semestres anteriores? Use un α=0.05. Problema 56 Un egresado de la especialidad de Marketing es contratado por una empresa para evaluar la distribución de ventas de gaseosa en la temporada de invierno. Según sus estimaciones, considera los principales distritos a los cuales se distribuye la gaseosa tienen los siguientes porcentajes de ventas: Distrito Porcentaje
A 21
B 18
C 30
D 17
E 14
Usted, quiere verificar estadísticamente ésta afirmación y decide que una forma de verificar la anterior hipótesis propuesta es seleccionando una muestra de las ventas realizadas en los últimos 3 meses (en miles de unidades) y obtiene lo siguiente: Distrito Ventas realizadas
A B 54 61
C 83
D 46
E 56
¿Qué conclusión obtiene según sus conocimientos de estadística?. Use = 0.025 Problema 57 El gerente de una planta industrial pretende determinar si el número de empleados que asisten al consultorio médico de la planta se encuentra distribuido, en forma equitativa, durante los cinco días de trabajo de la semana. Con base en una muestra aleatoria de cuatro semanas completas de trabajo, se observó el siguiente número de consultas: 19
Lunes
Martes
Miércoles
Jueves
Viernes
49
35
32
39
45
Con un nivel de significación del 5%, ¿existe alguna razón para creer que el número de empleados que asisten al consultorio médico, no se encuentra distribuido en forma equitativa durante los días de trabajo de la semana? Problema 58 El gerente de un banco afirma que los tipos de préstamos personales para auto, casa y viaje están en la relación 4:2:1. Para corroborar su afirmación selecciona aleatoriamente a 140 clientes que se les otorga un crédito y los clasifica en la siguiente tabla. Motivo del préstamo Auto Casa Nº de clientes 90 35
Viaje 15
Estos datos corroboran la afirmación del gerente del banco. Use un =0.1.
Problema 58 Una compañía de seguros desea establecer el pago de la prima a cobrar por asegurar un determinado modelo de auto. La información que tienen y que fue obtenida en un estudio realizado al año pasado indica que el 30% de clientes asegurados tienen un accidente, y que cuando este ocurre el accidente puede considerarse leve el 60% de las veces, se puede considerar que el accidente es de medianas proporciones el 30% de las veces y un accidente se considera grave el 10% de las veces. Para determinar si los resultados del estudio realizado el año pasado aún permanecen vigentes se toma una muestra aleatoria de asegurados de la compañía y se encontró los siguientes resultados: Condición del Asegurado
No tiene Accidente
Accidente Leve
Accidente de medianas proporciones
Accidente Grave
Número de Veces
198
47
37
18
Determine Usted si se puede tener en cuenta los resultados del estudio realizados el año pasado para poder determinar el monto de la prima que debe cobrar. Justifique e intérprete adecuadamente sus resultados. Utilizar un nivel de significación el 2.5%
Problema 59 Un ingeniero de control de calidad del proceso de ensamblaje de llantas, desea verificar si el número de llantas con defectos sigue una distribución binomial con una proporción de llantas defectuosas del 5%. Para esto tomó 200 muestras de 10 neumáticos cada una y encontró lo siguiente: Número de llantas defectuosas 0 1 2 o más Total
Número de muestras 138 53 9 200
Problema 60 Se afirma que el número de errores que comete una secretaria al transcribir un documento es una variable aleatoria que tiene una distribución de Poisson con media de 3 errores por trascripción. Se revisó 440 transcripciones hechas por ella y se obtuvo los siguientes resultados: Realice la prueba con un α = 0.01 20
Número de errores 0 1 2 3 4 5 6 7 8 ≥9
Frecuencia 18 53 103 107 82 46 18 10 2 1
Problema 61 La solicitud de préstamo que presentan los clientes de un banco está compuesto por cuatro rubros. El gerente de préstamos desea realizar un estudio sobre la distribución de la cantidad de rubros que son rechazados por cada solicitud, para esto toma una muestra de 60 solicitudes, obteniéndose los siguientes resultados: 0 20
N° de rubros rechazados N° de solicitudes
1 15
2 7
3 10
4 8
¿Se puede afirmar que el número de rubros rechazados sigue una distribución binomial con la probabilidad p=0.4?. Use un =0.01. Problema 62 El responsable de servicio de mantenimiento de una empresa de transporte, quien lleva el control desde los inicios de creación de la empresa, afirma que el número de vehículos que necesitan reparación en un día, sigue una distribución de Poisson con media igual a 2. Se hace estadísticas de 200 días sobre el número de vehículos que necesitan reparación, los resultados fueron: N° de días N° de vehículos
54 0
70 1
50 2
21 3
4 4
1 5 o más
Realice la prueba necesaria para corroborar esta afirmación. Use un =0.1.
Tema: Pruebas Chi- Cuadrado de Independencia Problema 63 Se toma una muestra aleatoria de 2200 familias y se les clasifica en una tabla de doble entrada según su nivel de ingresos (Alto, Medio y Bajo) y el tipo de Colegio a la que envían a sus hijos. La siguiente tabla muestra los resultados obtenidos: Ingresos Altos Medio Bajo
Tipo de Colegio Privada Pública 506 494 438 162 215 385
¿A un nivel de significación del 1% hay razón para creer que el ingreso y el tipo de colegios no son variables independientes? 21
Problema 64 Un editor de periódicos trata de determinar las características del mercado de su periódico. Se pregunta si la costumbre de la gente de la comunidad de leer diarios está relacionada con el nivel educativo de los lectores. Aplica una encuesta a los adultos del área referente a su nivel educativo y la frecuencia con que leen el periódico. Plantee y resuelva las hipótesis correspondientes, indicando claramente cuál será la conclusión a la que llega el editor de periódicos. Utilice un nivel de significación del 5%. Y el reporte del programa MINITAB que se muestra a continuación: Chi-Square Test: Profesional, Sup. no Univ., Termino Sec, No Termino Sec. Frec. Profesional o posgrado 1 10 18.64 4.007 2
Superior no Univ. 17 21.28 0.859
Terminó Secundaria 11 8.99 0.448
Total 59
12 15.17 0.661
……. ……..
8 7.32 0.064
5 8.21 1.254
3
35 30.33 0.718
38 34.62 0.331
16 14.63 0.128
……… ………. ……….
4
28 20.86 2.448
19 23.80 0.968
6 10.06 1.638
13 11.29 0.260
66
41
46
269
Total
85
23
No terminó Secundaria 21 10.09 ...........
97
Chi-Sq = …………………..,
…….
96
DF = ……………..
Problema 65 Se entrevistó a 900 personas y se les preguntó acerca de su preferencia con respecto a tres programas de televisión, los entrevistados se clasificaron de acuerdo al distrito donde residían, de acuerdo al grupo de edad y el tipo de programa de su preferencia. Los resultados se muestran en la siguiente tabla:
Distrito A
Distrito B
Distrito C
Adolescentes Jóvenes Adultos Adolescentes Jóvenes Adultos Adolescentes Jóvenes Adultos
Tipo de Programa Cómico Deportivo Musical 40 50 20 45 30 60 55 20 15 35 60 15 30 40 40 105 15 5 25 40 15 25 30 20 40 15 10
Usando un 5% de significancia se puede decir que el grupo de edad no influye en el tipo de programa que prefiere la persona. Problema 66 Una socióloga estuvo investigando esta cuestión: ¿existe alguna relación entre el nivel de Instrucción alcanzado y el nivel de actividad social de una persona? Decidió manejar tres niveles de Instrucción: primaria, secundaria y universitaria o más. Cada persona llevó un registro de sus actividades sociales, como jugar boliche en grupo, asistir a bailes, eventos sociales, ceremonias religiosas, etc. La socióloga los dividió en actividad social inferior al 22
promedio, actividad social promedio y actividad social superior al promedio. Los resultados de su muestra se dan en la siguiente tabla: Nivel Educación Universitaria Secundaria Primaria
Actividad Social Superior al promedio Promedio Inferior al promedio 20 10 10 30 50 80 10 60 130
¿Cuál será la conclusión de esta socióloga, en base a esta muestra aleatoria y un 5% de significación?
Tema: Regresión Lineal Simple Problema 67 A continuación se muestran los gastos en publicidad (ciento de dólares) que realiza una empresa y sus ventas (miles de artículos) que tiene una empresa en 10 semanas tomadas al azar. Gasto en Publicidad
Ventas
Semana
X (ciento de dólares)
Y (miles artículos)
1 2 3 4 5 6 7 8 9 10
9 7 5 14 15 12 6 10 15 21
10 6 5 12 10 15 5 12 17 20
a) Comente el diagrama de dispersión que se muestra a continuación. Gráfica de dispersión de Ventas vs. Gasto en Publicidad 20,0 17,5 15,0 s a t n e V
12,5
10,0 7,5 5,0 5,0
7,5
10,0
12,5
15,0
17,5
20,0
22,5
Gasto en Publicidad
b) Determine la línea de regresión que permita estimar el nivel de ventas en base al gasto en propaganda. c) Interprete el coeficiente de regresión estimado. 23
d) Estime el nivel de ventas que se espera obtener si se realiza un gasto de 1700 dólares en publicidad. e) Halle e interprete el coeficiente de determinación. f) Construya un intervalo de confianza del 95% para el nivel de ventas promedio cuando se realiza un gasto en propaganda de 1700 soles. Interpretar. g) Halle el coeficiente de correlación de Pearson. h) Pruebe con un nivel de significación del 5%, si existe una correlación lineal entre el gasto en publicidad y las ventas i) Con un nivel de significación del 5%, se puede afirmar que el gasto en publicidad y la publicidad en ventas están correlacionados en más del 80%. j) Se aplicó la prueba de Durbin Watson con el siguiente re sultado: Durbin-Watson statistic = 2.36249, ¿Cuál es su conclusión al respecto? Problema 68 En ocasiones es conveniente comprar la mayor cantidad posible de ciertos artículos. Por lo general el precio unitario es menor al adquirir grandes cantidades. Para contrastar esta teoría se obtuvieron los siguientes datos: Número de Unidades (X) Costo Unitario (Y) $
1 55
3 5 52 48
10 36
12 32
15 30
24 25
Los resultados obtenidos con el MINITAB son los siguientes: Predictor Constant Num. de S = 4.104
Coef 53.793 -1.4079
SE Coef 2.615 0.2105
R-Sq = 89.9%
Analysis of Variance Source DF Regression 1 Residual Error 5 Total 6
SS 753.22 84.20 837.43
T 20.57 -6.69 R-Sq(adj) = 87.9% MS 753.22 16.84
F 44.73
a) b) c) d)
Interprete el del coeficiente de regresión estimado. ¿Qué % de la variabilidad en el costo no es explicada por la recta de regresión? ¿Es la pendiente de la recta diferente de cero significativamente?. Use un α=0.05. Estime, mediante un intervalo de confianza del 95%, el costo promedio unitario cuando se compran 40 unidades. e) Es posible afirmar, en base a la información muestral obtenida y utilizando un nivel de significación del 5%, que por cada unidad adicional que se compre el precio del artículo disminuye en más de $1,2. Use un α=0.05. Problema 69 A continuación se muestran el nivel de ventas (ciento de dólares) que realiza una empresa y el precio (dólares) que tiene una empresa en 10 semanas tomadas al azar. Semana Precio (X en dólares) 1 1.3 2 2 3 1.7 4 1.5 5 1.6 6 1.2 7 1.6 8 1.4 9 1 10 1.1
Ventas (Y en ciento de dólares) 10 6 5 12 10 15 5 12 17 20
24
a) Comente el diagrama de dispersión que se muestra a continuación. Gráfica de dispersión de Ventas vs. Precio 20,0 17,5 15,0 s a t 12,5 n e V
10,0 7,5 5,0 1,0
1,2
1,4
1,6
1,8
2,0
Precio
b) c) d) e) f)
Estime la línea de regresión del nivel de ventas en base al precio del artículo. Interprete el coeficiente de regresión estimado. Estime el nivel de ventas que se espera obtener si el precio del artículo es de $1.8. Halle e interprete el coeficiente de determinación. Construya un intervalo de confianza del 95% para el nivel de ventas promedio cuando el precio del artículo es de $1.8. Interpretar. g) Halle el coeficiente de correlación de Pearson. h) Pruebe con = 5%, si existe una correlación lineal entre el precio y las ventas. i) Aplique la prueba de Durbin Watson para determinar si los residuales presentan autocorrelación. ¿Cuál es su conclusión?. j) El análisis de los residuales presenta el siguiente gráfico: Normal Probability Plot
Versus Fits
99
4
90
2
e j a t n e 50 c r o P
l a u 0 d i s e R -2
10 -4 1 -5.0
-2.5
0.0
2.5
5.0
5
10
Residual
15
20
Fitted Value
Histogram
Versus Order 4
2.0
2
a 1.5 i c n e u c 1.0 e r F
l a u d 0 i s e R -2
0.5 -4 0.0 -4
-3
-2
-1
0
1
2
3
1
Residual
2
3
4
5
6
7
8
9
10
Observation Order
¿Qué podemos concluir acerca del análisis de ellos? Problema 70 El gerente de ventas permite que los agentes vendedores que tiene a su cargo reciban charlas para motivarlos, dichas charlas se dan en diferentes horarios y los agentes tienen absoluta libertad para elegir el horario que crean conveniente. El gerente cree que dichas charlas influyen en la eficiencia de las ventas. Para verificar esto toma una muestra de 10 vendedores y determinó el tiempo acumulado de horas en las que estuvo presente en una o más charlas durante el último trimestre y la eficiencia de sus ventas, los datos encontrados fueron: Tiempo acumulado (Horas) 27 45 41 19 35 39 19 49 15 31 Eficiencia en las ventas (%) 47 84 80 46 62 72 52 87 37 68 25
Los resultados obtenidos en con el MINITAB son los siguientes:
The regression equation is
Predictor
Coef
Constant tiempo
SE Coef
………………… 1.4200
S = 5.385
eficiencia = ...... +........tiempo 5.163 0.1523
R-Sq = ………………
Analysis of Variance Source DF Regression Residual Error Total
……… ……… ………
T 3.497966 ………………… R-Sq(adj) = 90.5%
SS
MS
………………
F
………………
232.0
86.91
29.0
2752.5
a) Complete los espacios en blanco. b) ¿Es posible afirmar que existe una relación lineal entre el número de horas de charla y la eficiencia en las ventas?. Use un α=0.05. c) Interprete adecuadamente el coeficiente de regresión. d) Utilizando un nivel de confianza del 90%, calcule e interprete adecuadamente, un intervalo de confianza para el promedio de eficiencia en las ventas de un vendedor cuando el número de horas de charla que reciba sea de 60. e) El Gerente de ventas afirma que cuando un agente vendedor recibe charlas esto permite un mejor desempeño en sus nivel de ventas y cree además que por cada hora adicional de charla su rendimiento se incrementa en más de un punto porcentual. Utilizando un nivel de significación del 5% ¿Qué puede concluir con respecto a la afirmación que hace el gerente de ventas?. Problema 71 La empresa comercializadora de productos agrícolas ECOPA está interesada en precisar qué relación existe entre la distancia que una carga de fruta es transportada (por tierra) y la cantidad de fruta malograda, medida en kilogramos (Y) al llegar a su destino. Se obtuvieron los siguientes resultados de un estudio de 9 despachos de fruta: 10
X
i
i 1
10
10
765 ;
X i
i 1
2
69225 ;
Y 316 i
i 1
10
10
;
Y i
i 1
2
12128 ;
X Y 28605 i
i
i 1
a) Ajuste una recta de regresión para determinar la cantidad de fruta malograda en función de la distancia recorrida. Interprete el coeficiente de regresión estimado. b) ¿Existe una relación lineal entre la cantidad de fruta malograda y la distancia que recorrida?. Use un α=0.05. c) Es posible afirmar que por cada kilómetro que recorre la carga de fruta hasta llegar a su destino la cantidad de fruta malograda se incrementa en más de 300 gramos. d) Estime un intervalo de confianza para la cantidad de fruta malograda cuando la distancia recorrida fue de 95 Kilómetros, utilizar un 99% de confianza.
26
Tema: Regresión Lineal Múltiple Problema 72 Se desea modelar la producción de los trabajadores de una fábrica en función de una prueba de aptitud y los años de experiencia. Para realizar este estudio se seleccionó una muestra de 10 empleados y se registró el número de unidades que había producido por hora (Y), el puntaje que obtenido en una prueba de aptitud (X1) y los años de experiencia del empleado. Matriz de correlaciones Y X1 X2
Y
X 1
X 2
1 0,8137 0,7088
1 0,1814
1
Análisis de regresión: Y vs. X1; X2 La ecuación de regresión esY = Predictor Coef SE Coef Constante -13,825 1,795 X1 0,21217 0,01266 X2 1,9995 0,1456 S = 1,29778
R-cuad. = 98,8%
Análisis de varianza Fuente GL SC Regresión 2 962,71 Error residual 7 11,79 Total 9 974,50
a) b) c) d) e)
13,8 + 0,212 X1 + 2,00 X2 T -7,70 16,76 13,73 R-cuad.(ajustado) = 98,4%
MC 481,36 1,68
F 285,80
¿Existe problema de multicolinealidad?. Realice el análisis correspondiente. El modelo con las dos variables es válido?. Use un α=0.05 Interprete el (los) coeficiente (s) de regresión. Interprete el coeficiente de determinación. Es posible afirmar que por cada punto adicional que obtuviera un trabajador en la prueba de aptitud su producción aumentaría en más de 0.15 artículos por hora? Use un α=0.05
Problema 73 La Compañía ACEROX ha estado buscando los factores que influyen en la cantidad de acero (en millones de toneladas) que es capaz de vender cada año. La administración sospecha que los siguientes son los factores principales: La tasa anual de inflación del país, el precio promedio por tonelada mediante el cual el acero importado acota los precios (en dólares) de la ACEROX, y el número de automóviles (en millones) que los fabricantes del país están planeando producir en ese año. Sean recogido los datos correspondientes a los últimos 7 años y se ha trabajado con el MINITAB obteniéndose los siguientes resultados Regression Analysis: Venta versus Inflación, Importación,Producción The regression equation is: Venta = - 0.915 - ______Inflación + 0.0408 Importación + 0.850 Producción Predictor Coef SE Coef T Constante -0.9146 0.8376 -1.09 Inflación _________ 0.04259 -2.05 Importación 0.04081 0.08268 Producción 0.8497 _______ 5.98 S = ______
R-Sq = _______
R-Sq(adj) = 85.6%
27
Analysis of Variance Source DF Regression ___ Residual Error ___ Total ___
a) b) c) d) e)
SS 1.60978 _______ 1.73429
MS _______ _______
F ______
Complete los espacios en blanco. Si se considera que no hay problema de multicolinealidad. ¿Al menos una de las variables es significativa? Plantee las hipótesis adecuadas y de su conclusión. Interprete el coeficiente de la variable inflación ¿Qué variables deben quedarse en el modelo? Plantee las hipótesis y de sus conclusiones Interprete el coeficiente de determinación
Problema 74 Se desea estimar la variable Y en función a otras cuatro variables. Al tomar una muestra de tamaño 10 se encontró los siguientes resultados con el MINITAB: Regression Analysis: Y versus X1; X2; X3; X4
The regression equation is Y = - 15,398 + 0,218 X1 + 2,00 X2 + 0,0136 X3 + 0,0012 X4
Predictor Constant X1 X2 X3 X4
Coef -15,398 0,21847 2,0008 0,01361 0,00117
S = 1,481
SE Coef 3,289 0,01812 0,1739 0,02231 0,03455
R-Sq = 98,9%
Analysis of Variance Source DF Regression 4 Residual Error 5 Total 9
SS 963,53 10,97 974,50
T -4,68 12,06 11,51 0,61 0,03 R-Sq(adj) = 98,0%
MS 240,88 2,19
F 109,80
P 0,000
a) Si se supone que no hay problemas de multicolinealidad. Determine, mediante la prueba adecuada, si al menos una de las cuatro variables es significativa. Utilizar un α= 0.05. b) ¿Todas las variables serían significativas en el modelo? Utilizar un α= 0.05. Problema 75 Un distribuidor de cerveza está estudiando el sistema de reparto de su producto. Específicamente, el distribuidor está interesado en predecir el tiempo de servicio a un expendio al menudeo. El ingeniero industrial a cargo del estudio ha sugerido que los dos factores más importantes que intervienen en el tiempo de reparto son el número de cajas de cerveza que se entregan (X1) y la distancia que debe recorrer el repartidor (X2). El ingeniero recopiló la muestra de tiempos de reparto que aparece en la tabla siguiente: Número de cajas Distancia (km) Tiempo (min.)
10 15 10 20 25 18 12 14 16 22 24 17 13 30 24 30 25 40 18 22 31 26 34 29 37 20 25 27 23 33 24 27 29 31 25 33 26 28 31 39 33 30 25 42 40 28
Matriz de correlaciones Número de cajas
Distancia
Tiempo
1 -0,4053 0,7246
1 0,1269
1
Número de cajas Distancia Tiempo
Al procesar la información con el Minitab, se obtiene: Regression Analysis: TIEMPO versus Nº DE CAJAS, DISTANCIA The regression equation: TIEMPO=2.31+0.877Nº DE CAJAS+0.456 DISTANCIA Predictor Constant Nº DE CA DISTANCI
Coef 2.311 0.8772 0.4559
S = 3.141
SE Coef 5.857 0.1530 0.1468
R-Sq = 73.7%
T 0.39 5.73 3.11
R-Sq(adj) = 69.3%
Analysis of Variance Source DF SS Regression 2 331.36 Residual Error 12 118.37 Total 14 449.73
MS 165.68 9.86
F 16.80
a) b) c) d)
¿Existe problema de multicolinealidad?. El modelo de regresión de Y con las dos variables es válido? Use un α=0.05 Interprete los coeficientes de la ecuación de regresión estimada. Estime el tiempo de entrega del producto cuando se tienen que entregar 18 cajas, para lo cual se tiene que recorrer un distancia de 35 km. e) ¿Qué indica el coeficiente de determinación? Problema 76 El señor Jorge Pérez recientemente ha sido contratado como sub-gerente de una empresa. Como primera labor se le pide que estudie las ganancias brutas anuales (en miles de dólares) en la industria hotelera. ¿Qué factores afectan la ganancia en esa industria? El señor Pérez selecciona una muestra de 16 empresas hoteleras y obtiene los datos sobre el número de empleados (en cientos de empleados), número de acciones (en miles de acciones) ofrecidas por cada empresa y el valor del inventario al principio del año (miles de dólares). Num.Empl : Número de empleados Num.Acc. : Número de acciones InvInic : Inventario al principio de año Los datos fueron procesados y se obtuvieron los siguientes resultados Analysis of Variance Source DF SS MS F Regression ___ ______ ______ ______ Residual Error ___ 1385.0 ______ Total ___ 6420.0 The regression equation is Ganancia Bruta= 733+3.11 Num.Empl +7.9 Num.Acc + _____ InvInic Predictor Coef SE Coef T Constant ______ 332.1 _____ Num.Empl ______ 1.285 _____ Num.Acc. ______ 10.94 _____ InvInic ______ 0.118 3.00 S = _______
R-Sq = _______
29
a. Escriba la ecuación de regresión e interprete cada uno de los coeficientes de regresión. b. Interprete el valor 0.673 de la matriz de correlación c. Realice la prueba global con un nivel de significancia del 5%. Planteé las hipótesis, criterio de decisión, resultados de la prueba y la conclusión de acuerdo al caso estudiado. d. ¿Qué variables deben quedar en el modelo?. Use un nivel de significancia de 5%. Planteé las hipótesis, criterio de decisión, y resultados de la prueba así como la conclusión de acuerdo al caso estudiado e. ¿Qué porcentaje la variabilidad de la ganancia bruta es explicada por el número de empleados, número de acciones y el Inventario a principio del año? f. Suponiendo que el modelo con las tres variables es el adecuado, se desea saber la ganancia bruta estimada cuando el número de empleados fue de 1200 empleados, el número de acciones es de 2300 acciones y el inventario inicial es de 15 mil dólares g. Encuentre el Error Estándar de estimación. Problema 77 El gerente comercial de una cadena de tiendas desea estimar la utilidad (UTIL) mensual de una empresa comercial (en miles de dólares), y considera que las variables que pueden explicar las fluctuaciones de la utilidad son: el Nivel de Ventas (NV) en cientos de unidades mensuales, el Gasto en Publicidad (GP) en miles de soles, el Precio unitario (Precio) en soles y el monto de pago enImpuestos (PI) en cientos de soles. Se tomó una muestra de tamaño 20 y al procesar estos datos en el programa MINITAB se observaron los siguientes resultados: Regression Analysis: UTIL versus PI, PRECIO, NV, GP The regression equation is UTIL = - 1.826 - 0.081 PI - 0.258 PRECIO + 1.427 NV + 0.615 GP Predictor Constant PI PRECIO NV GP
Coef -1.826 -0.081 -0.258 1.427 0.615
S = 1.60207
SE Coef 5.045 0.1200 0.2622 0.5597 0.1750
e)
P 0.723 0.509 0.340 0.022 0.003
R-Sq = ………………………
Analysis of Variance Source DF ………… Regression
a) b) c) d)
T -0.36 -0.68 -0.99 2.55 3.51
SS
MS
F
…………………
73.240
………………
………………
Residual Error
…………
………………
Total
…………
331.460
Complete el cuadro de Análisis de Varianza ¿Qué porcentaje de la variación en la Utilidad, no es explicada por las variables del modelo ¿Considera que el modelo es significativo?. Usar un nivel de significancia del 5% ¿Son todas las variables del modelo significativas? Realice las pruebas correspondientes y luego indique que variable o que variables deben de salir del modelo. Usar = 5% De acuerdo a sus resultados obtenidos indique en forma clara el modelo final que le recomendaría al Gerente Comercial de esta cadena de tiendas. Indique el modelo con sus respectivos coeficientesbiy además interprete el porcentaje de variación de la Utilidad que es explicado por este su modelo final. Utilice las salidas del programa MINITAB que usted crea conveniente y que adjuntan a esta prueba.
Anexo: Algunas salidas del programa MINITAB que se lograron con los datos d el problema: 30
Regression Analysis: UTIL versus PI, PRECIO The regression equation is UTIL = 11.8 + 0.384 PI + 0.489 PRECIO Predictor Coef SE Coef T P Constant 11.823 6.012 1.97 0.066 PI 0.3840 0.1344 2.86 0.011 PRECIO 0.4886 0.2306 2.12 0.049 S = 2.82434 R-Sq = 59.1% R-Sq(adj) = 54.3% Analysis: UTIL versus NV, PI, GP The regression equation is UTIL = - 0.15 + 0.954 NV - 0.026 PI + 0.673 GP Predictor Coef SE Coef T P Constant -0.151 4.746 -0.03 0.975 NV 0.9541 0.2866 3.33 0.004 PI -0.0264 0.1063 -0.25 0.807 GP 0.6728 0.1646 4.09 0.001 S = 1.60059 R-Sq = 87.6% R-Sq(adj) = 85.3% Regression Analysis: UTIL versus PRECIO, NV, GP The regression equation is UTIL = 0.09 - 0.176 PRECIO + 1.17 NV + 0.616 GP Predictor Coef SE Coef T P Constant 0.095 4.098 0.02 0.982 PRECIO -0.1763 0.2285 -0.77 0.452 NV 1.1750 0.4095 2.87 0.011 GP 0.6155 0.1720 3.58 0.003 S = 1.57465 R-Sq = 88.0% R-Sq(adj) = 85.8% Regression Analysis: UTIL versus PRECIO, NV The regression equation is UTIL = - 3.99 - 0.484 PRECIO + 2.17 NV Predictor Coef SE Coef T P Constant -3.992 5.123 -0.78 0.447 PRECIO -0.4841 0.2755 -1.76 0.097 NV 2.1703 0.3913 5.55 0.000 S = 2.04969 R-Sq = 78.5% R-Sq(adj) = 75.9% Regression Analysis: UTIL versus NV, GP The regression equation is UTIL = 0.42 + 0.912 NV + 0.666 GP Predictor Coef SE Coef T P Constant 0.424 4.027 0.11 0.917 NV 0.9118 0.2240 4.07 0.001 GP 0.6655 0.1574 4.23 0.001 S = 1.55579 R-Sq = 87.6% R-Sq(adj) = 86.1% RegressionAnalysis: UTIL versus NV, PI The regression equation is UTIL = - 2.79 + 1.49 NV + 0.051 PI Predictor Coef SE Coef T P Constant -2.792 6.521 -0.43 0.674 NV 1.4903 0.3534 4.22 0.001 PI 0.0512 0.1451 0.35 0.729 S = 2.21997 R-Sq = 74.7% R-Sq(adj) = 71.8%
31