FACULTAD DE PRODUCCIÓN Y SERVICIOS
ESTADISTICA EN INGENIERÍA
EJERCICIOS DE ESTADISTICA EN INGENIERÍA
ING. CESAR CARRASCO
- ARRATEA FRANCO JULY
13-49) la asociación de atletismo de carolina esta interesada interesa da en organizar el primer triatlón anual de tarheel, para atraer a atletas de alto a lto nivel, la asociación desea ofrecer premio en efectivo a los primeros lugares, estableciendo tiempos para los ganadores globales de la competencia, hombres y mujeres. Como el trayecto no se ha recorrido antes, la asociación ha recogido 10 carreras de diferentes longitudes que considera comparables en clima y condiciones del recorrido.
Millas Triatlón Bud light ironman World´stoughest Muncie enduration Texas hill country Leon´s Q.E.M. Sacramento international Malibu Bud light endurance Wendy´s Mammoth/Snowcreek
Tiempo de ganadores ( hr:min:seg) Hombres Mujeres 8:09:15 9:00:56 8:25:09 9:49:04 4:05:30 4:40:06 3:24:24 3:55:02 1:54:32 2:07:10
Nado 2.4 2.0 1.2 1.5 0.93
Ciclismo 112 100 55.3 48 24.8
Carrera 26.2 18.6 13.1 10 6.2
0.93
24.8
6.2
1:48:16
2:00:45
0.50 2.4 0.5 0.6
18 112 20 25
5.0 26.2 4.0 6.2
1:19:25 9:26:30 1:14:59 1:56:07
1:30:19 11:00:29 1:23:09 2:11:49
a) Determine la ecuación de regresión para predecir los tiempos de hombres hombres y mujeres ganadoras, en términos de la longitud de cada etapa individual. (Convierta los tiempos en minutos para los cálculos).
Resumen Est adíst ic as d e la r egres ión
Coeficiente de correlación múltiple
0.99424427
Coeficiente de determinación R^2
0.98852168
R^2 ajustado
0.98278251
Error típico
25.5301614
Observaciones
10
ANÁLISIS DE VARIANZA Grados de libertad
Suma de cuadrados
Promedio de los cuadrados
Regresión
3
336795.3252
112265.1084
Residuos
6
3910.734837
651.7891395
Total
9
340706.06
Coeficientes Intercepción
Error típico
Estadístico t
F
Valor crítico de F
172.2414529
Probabilidad
-6.324235205
20.47788735
-0.308832405
0.767891464
Nado
-21.7431201
50.02834362
-0.43461603
0.679036753
Ciclismo
6.347238143
1.455502159
4.360857937
0.00476605
Carrera
-4.747116006
5.888188504
-0.806209924
0.450885194
Resumen del modelo Modelo
R
R cuadrado
,994a
1
R cuadrado corregida
.989
Error típ. de la estimación
.983
25.53021
Media cuadrática
F
Sig.
172.241
a. Variables predictoras: (Constante), Carrera, Nado, Ciclismo
ANOVAa Modelo
Suma de cuadrados
1
Regresión
336795.220
3
112265.073
Residual Total
3910.749 340705.969
6 9
651.792
gl
,000
a. Variable dependiente: THombres b. Variables predictivas: (Constante), Carrera, Nado, Ciclismo
Coeficientesa Modelo
Coeficientes no estandarizados B
1
(Constante) Nado
Error típ.
-7.338
30.175
-28.273
73.719
Coeficientes tipificados
t
Sig.
Beta -.094
-.243
.816
-.384
.715
3.29387E-06
Ciclismo
7.912
2.145
1.381
3.689
.010
Carrera
-7.996
8.677
-.306
-.922
.392
a. Variable dependiente: TMujeres
ECUACIÓN DE REGRESIÓN PARA EL TIEMPODE MUJERES
=−.−..+.−.
b) Prediga los tiempos de ganadores si el triatlón de Tarheel comprende 1 milla de nado, 50 millas de recorrido en bicicleta y 12.5 millas de carrera.
PARA LOS HOMBRES
PARA LAS MUJERES
230.065 MIN 259.94 MIN
=−6.324−21.743+6.347−4.747 =−7.338−28..273+7.912−7.996
c) Si la asociación desea utilizar el límite inferior de un intervalo de confianza aproximado del 90% para los tiempos de los primeros lugares para hombres y mujeres. ¿cuales serán esos tiempos?
Resumen Est adíst ic as d e la reg resi ón
Coeficiente de correlación múltiple Coeficiente de determinación R^2 R^2 ajustado Error típico Observaciones
0.994244273 0.988521675 0.982782513 25.53016137 10
AN LISIS DE VARIANZA Grados de libertad
Suma de cuadrados
Promedio de los cuadrados
Regresi n
3
336795.3252
112265.1084
Residuos
6
3910.734837
651.7891395
Total
9
340706.06
Coeficientes
Error típico
Estadístico t
F
172.2414529
Valor cr tico de F
3.29387E-06
Probabilidad
Inferior 95%
Superior 95%
Inferior 90.0%
Superio
-6.324235205
20.47788735
-0.308832405
0.767891464
-56.43182046
43.78335
-46.1164621
33.46
Nado
-21.7431201
50.02834362
-0.43461603
0.679036753
-144.158067
100.671827
-118.9572109
75.47
Ciclismo
6.347238143
1.455502159
4.360857937
0.00476605
2.78575266
9.90872363
3.518935049
9.175
Carrera
-4.747116006
5.888188504
-0.806209924
0.450885194
-19.15499424
9.66076223
-16.1889278
6.69
Intercepción
La tabla MR 13-1 contiene información financiera acerca de las 28 compañías mas grandes de Carolina del Norte con acciones en la bolsa. Las variables de la tabla son:
NOMBRE PRECIO
Nombre de la compañía Precio de cierre de una acción en la bolsa de valores DIV Dividiendo pagados por acción en 1992 GPA Ganancias por acción de 1992 VENTAS Porcentaje de cambio en las ventas totales en 1992 INGRESOS Porcentaje de cambio en los ingresos netos de 1992 ACTIVOS Porcentaje de cambio en activos de 1992 PREANTE Precio de cierre de una acción en 1992 NY 1 si las acciones se negocian en la bolsa de valores de Nueva York, 0 en otro caso. BANCO 1 si la compañía es un banco o institución de crédito, 0 en otro caso. Utilice esta información para resolver los ejercicios 13-50 a 13-53
13-50) Use las variable DIV,GPA, VENTAS, INGRESOS, ACTIVOS y PREANTES como variables explicativas de una regresión para explicar la variación en PRECIO. ¿ Que fracción de la variación explica ese modelo?. NOMBRE DukePower FirstUnion Wachovia Carolina Power& Light Nucor Food Lion Jefferson- Pilot Unifi FamilyDollarStores BB&T Financial Lance Cato Piedmont Natural Gas SouthernNational FirstCitizensBaneshares
PRECIO DIV 39.50 47.50 36.50 33.00 91.25 7.00 55.00 33.88 18.50 34.13 23.63 30.50 22.00 21.88 53.00
1.76 1.28 1.00 1.58 0.28 0.11 1.30 0.40 0.25 0.91 0.92 0.08 0.91 0.50 0.53
GP A 2.21 3.72 2.48 2.36 1.83 0.37 3.99 1.04 1.00 2.75 1.25 1.03 1.40 1.73 5.45
VENT AS 3.8 1.4 -15.7 3.0 10.5 11.8 2.5 13.4 17.1 -3.3 2.6 24.5 11.7 6.0 -7.5
INGRES OS -14.6 69.7 88.7 4.0 22.4 -13.2 15.7 6.9 38.3 26.4 3.8 94.7 71.8 48.0 77.4
ACTIV OS 3.2 11.4 0.6 2.6 26.1 24.9 6.3 64.7 19.7 7.4 4.4 54.2 8.7 23.3 -1.0
PREAN TE 35.00 30.00 29.00 27.00 44.75 18.25 37.75 22.38 17.25 22.00 21.75 14.50 16.75 13.88 27.50
N Y 1 1 1 1 1 0 1 1 1 0 0 0 1 1 0
BANCO S 0 1 1 0 0 0 0 0 0 1 0 0 0 1 1
Ruddick UnitedDominion Industries Centura Banks Guilford Mills CC13 Financial United Carolina Bancshares CoastalHealthcareGroup PublicService of NC OakwoodHornes NC Natural Gas Bank of Granite PCA international Ingles Markets
21.38 13.13
0.39 1.30 0.20 0.61
6.2 26.7
14.9 -12.6
8.8 16.4
15.25 9.13
1 1
0 0
23.88 26.13 40.50 22.50
0.63 0.57 1.14 0.66
1.66 1.73 3.10 2.01
-6.6 16.3 -9.0 -9.6
182.3 56.2 18.0 21.7
10.1 9.1 7.1 7.1
12.75 22.25 28.63 15.88
1 1 0 0
1 0 1 1
21.00 17.25 20.25 26.63 30.00 16.25 6.25
0.00 0.75 0.06 0.98 0.38 0.28 0.22
0.85 1.09 0.90 1.79 1.65 0.89 0.31
30.4 24.4 42.4 18.9 -9.7 8.0 2.1
43.0 58.9 58.0 38.3 13.3 5.6 -48.8
51.7 8.1 25.3 23.0 7.9 51.4 2.0
27.75 11.88 10.63 16.38 19.63 14.88 6.13
0 0 1 1 0 0 0
0 0 0 0 1 0 0
ECUACION DE REGRESION Resumen Estadísticas de la regresión
Coeficiente de correlación múltiple Coeficiente de determinación R^2 R^2 ajustado Error típico Observaciones
0.89685249 0.8043444 0.7484428 8.57726718 28
r a os e
er a
u ma e c ua r a o s
r om e o e os c ua r a os
aor crítico de F
egres n
.
. 73.5695123
.
.
06
Residuos
21
1544.95976
Total
27
7896.32259
oe c en es
rror p co
s a s co
ro a
a
n er or
uper or
95%
ntercepc n
- .
.
- .
.
-
.
17.490113 08 - .
.
- .
.
-
.
18.028362 84 .
.
.
.
-
.
1.0014512 54 .
.
.
.
-
.
0.2898653 23 INGRESOS
0.03957979
0.04036759
0.98048426
0.33800875
-
0.12352878
0.0443692 12 ACTIVOS
-0.01804623
0.12923161
-0.13964255
0.89027304
-
0.25070562
0.2867980 86 .
.
.
.
-
.
. 36
Resumen del modelo Modelo
R
R cuadrado ,897a
1
R cuadrado corregida
.804
Error típ. de la estimación
.748
8.57727
a. Variables predictoras: (Constante), PREANTE, INGRESOS, ACTIVOS, VENTAS, DIV, GPA
=−5.79−7.71∗+3.82∗+0.35∗+0.40∗−0.18∗+1.53∗ LA FRACCIÓN QUE EXPLICA ESTE MODELO ES 80.4% DEL PRECIO
Coeficientesa Modelo
Coeficientes no estandarizados B
1
Error típ.
(Constante)
-5.789
5.626
DIV
-7.713
4.960
GPA
3.823
VENTAS INGRESOS
Coeficientes tipificados
t
Sig.
Beta -1.029
.315
-.214
-1.555
.135
2.320
.261
1.648
.114
.035
.156
.028
.225
.824
.040
.040
.103
.980
.338
ACTIVOS
-.018
.129
-.019
-.140
.890
PREANTE
1.533
.255
.817
6.007
.000
a. Variable dependiente: PRECIO
13-51) Tres de las variables independientes utilizadas en el modelo del ejercicio 13-50 son no significativas, incluso para x= 0.30. Elimine estas variables y correa otra regresión utilizando solamente las tres restantes. ¿ Cuanto menos de la variación en PREC 10 se explica con este método? SELECCIONAMOS VARIABLES
PARA ESTA SELECCIÓN DE VARIABLES nos fijaremos en el Recuadro Precio-Div Resumen Est adíst ic as d e la reg resi ón
Coeficiente de correlación múltiple Coeficiente de determinación R^2 R^2 ajustado Error típico Observaciones
0.32700006 0.10692904 0.07258016 16.4690577 28
bajo
AN LISIS DE VARIANZA
Grados de libertad Suma de cuadrados Promedio de los cuadrados
Regresión Residuos Total
1 26 27 Coeficientes
844.346195 7051.97639 7896.32259 Error típico
844.346195 271.229861
Estadístico t
F
3.11302816
Probabilidad
Valor crítico de F
0.089415678
Inferior 95%
Intercepción
22.1118939
5.32222495
4.15463346
0.00031204
11.1719038
DIV
11.8033742
6.68982337
1.76437756
0.08941568
-1.947754674
PrecioGPA
Precio Preante Resumen del modelo
Modelo
1
R
R cuadrado
,643a
Resumen del modelo
R cuadrado corregida
.413
.391
Error típ. de la estimación 13.34881
a. Variables predictoras: (Constante), GPA
Modelo
R
1
,856a
R cuadrado
R cuadrado corregida
Error típ. de la estimación
.734
.723
8.99615
a. Variables predictoras: (Constante), PREANTE
Precio-Ventas Resumen del modelo Modelo
R
1
,280a
R cuadrado
R cuadrado corregida
Error típ. de la estimación
.078
.043
16.72987
a. Variables predictoras: (Constante), VENTAS
Precio - Div
Precio - Ingresos Resumen del modelo
Resumen del modelo
R Error típ. R cuadrado de la Modelo R cuadrado corregida estimación 1 ,124a .015 -.022 17.29176 a. Variables predictoras: (Constante), INGRESOS
R Error típ. R cuadrado de la Modelo R cuadrado corregida estimación 1 ,327a .107 .073 16.46906 a. Variables predictoras: (Constante), DIV
Precio -activos Resumen del modelo Modelo
R
1
,091a
R cuadrado
R cuadrado corregida
Error típ. de la estimación
.008
-.030
17.35507
a. Variables predictoras: (Constante), ACTIVOS
OBSERVACION: LAS VARIABLES A UTILIZAR SON : GPA, PREANTE,DIV CONSTRUIMOS UN NUEVO MODELO PARA ESTE CASO USANDO ESTAS TRES VARIABLES
Resumen del modelo
Modelo 1
R
R cuadrado corregida
R cuadrado ,891a
.795
Error típ. de la estimación
.769
8.21966
a. Variables predictoras: (Constante), DIV, PREANTE, GPA
Coeficientesa Modelo
Coeficientes no estandarizados B
1
Coeficientes tipificados
Error típ.
(Constante)
-4.009
3.993
PREANTE
1.472
.221
GPA
4.501
DIV
-8.278
t
Sig.
Beta -1.004
.325
.785
6.655
.000
1.845
.307
2.439
.023
4.172
-.229
-1.984
.059
a. Variable dependiente: PRECIO
=−4.009+1.472∗+4.501∗−8.278∗
ANOVAa Modelo
1
Suma de cuadrados
gl
Media cuadrática
F
Regresión
6274.815
3
2091.605
Residual
1621.508
24
67.563
Total
7896.323
27
Sig.
30.958
,000
a. Variable dependiente: PRECIO b. Variables predictoras: (Constante), DIV, PREANTE, GPA
Resumen del modelo Modelo 1
R ,904a
R cuadrado .817
R cuadrado corregida .740
Error típ. de la estimación 8.71322
a. Variables predictoras: (Constante), BANCO, PREANTE, NY, ACTIVOS, INGRESOS, DIV, GPA, VENTAS
13-52) ahora agregue las variables NY y BANCO como variables explicativas. Para X=0.10 ¿existe evidencia de que, si los demás factores permanecen igual, estar en la lista de la bolsa de valores de nueva york tiene un efecto significativo sobre PRECIO? Para x= 0.10 ¿ los precios de las acciones de bancos e instituciones de crédito difieren significativamente de los precios de otras compañías del grupo? AGREGANDO NY BANCO
Coeficientesa Modelo
Coeficientes no estandarizados B
1
Coeficientes tipificados
Error típ.
(Constante)
-5.850
6.577
DIV
-9.644
5.423
GPA
4.381
VENTAS INGRESOS
t
Sig.
Beta
Intervalo de confianza de 90,0% para B Límite inferior
Límite superior
-.889
.385
-17.222
5.522
-.267
-1.778
.091
-19.020
-.267
2.637
.299
1.661
.113
-.179
8.941
-.032
.225
-.026
-.145
.887
-.421
.356
.024
.047
.064
.515
.612
-.057
.106
ACTIVOS
.002
.133
.002
.018
.986
-.227
.232
PREANTE
1.461
.279
.779
5.238
.000
.978
1.943
NY
4.547
3.937
.134
1.155
.262
-2.259
11.354
BANCO
-.183
6.706
-.005
-.027
.978
-11.779
11.413
a. Variable dependiente: PRECIO
Resumen
Est adíst ic as d e la regres ión
Coeficiente de correlación múltiple Coeficiente de determinación R^2 R^2 ajustado Error típico
0.904058722 0.817322173 0.740405193 8.713217581
Observaciones
28
VARIANZA
ra os e libertad
uma e cuadrados
egres n
ro me o e o s
a o r cr t co
cuadrados
.
de F
.
.
. 305
es uos
.
ota
.
oe c e nt es
r ror t p c o
05
.
s ta s t c o t
ro a
n eror
uper or
n er o r
uper or
95%
90.0%
90.0%
dad
ntercepc n
-5.84973612
6.57662512
-0.88947386
0.38487
-
7.915298
-
5.5221221
223
19.6147706
45
17.22159
6
9 - .
.
- .
.
406
44 .
20.9936530
23
1 .
.
.
.
997
.
1.13873580
.
- .
.
168
.
.
.
.
0.50300227 -
082
0.07447644
54
2 .
0.179081
7
58 7
8 .
0.2668794
99
5 - .
19.02034
.
0.421199
7
15 .
04
0.057298
. 6
3 .
.
.
.
67
86 .
-
0.27533688
72
0.227059
7 1.46054552 .
0.27884933 .
5.2377587 .
4.6875E-
0.87690715
05
9
.
712
.
- .
.
2.044183
0.978377
88
99
.
3.69192116 -
155
14.2197736
4
21
84
1.9427130 5 .
2.259458
3 - .
.
1
84 .
81
.
11.77941
5
4
7
=−5.85−9.64 +4.38−0.03+0.024+0.002 +1.46+4.55−0.18 CONCLUSIÓN: Agregando las variable NY y Banco si influyen significativamente en el precio. Los precios aumentan si se trata de bancos o instituciones, en otros casos el precio seria menor. 13-53) Use el modelo del ejercicio 13-51. a) ¿puede usted llegar a la conclusión, al nivel x= 0.05, de que un aumento en los dividendos conduce a una disminución significativa en el precio de las acciones? Establezca y pruebe las hipótesis adecuadas.
USANDO EL MODELO DEL EJERCICIO 13-51
=−4.009+1.472∗+4.501∗−8.278∗
Si aumentamos los Dividendos los precios disminuirán Veamos: El coeficiente que acompaña a D es negativo, es decir cuando aumentemos los dividendo el precio disminuirá.
b) Si lo demás se deja igual, ¿ el incremento de S1 en la ganancia por acción lleva aun aumento en el precio de las acciones en una cantidad significativamente mayor que S2? Establezca y pruebe las hipótesis adecuadas para x=0.05.
=−4.009+1.472∗+4.501∗−8.278∗ Precio Precio normal
42.88893
Si aumentamos 1 ala GPA
47.38993 El precio aumenta
c) Encuentre un intervalo de confianza del 98% para el cambio en el precio de la acción para el 4/1/93 por cada $1 de aumento en el precio por acción el 12/31/91.
el intervalo de predicción:
0.921 - 2.023 Coeficientesa
Modelo
Coeficientes no estandarizados B
1
Error típ.
Coeficientes tipificados
t
Sig.
Intervalo de confianza de 98,0% para B Límite Límite inferior superior
-1.004
.325
-13.961
5.943
Beta
(Constante)
-4.009
3.993
PREANTE
1.472
.221
.785
6.655
.000
.921
2.023
DIV
-8.278
4.172
-.229
-1.984
.059
-18.677
2.120
GPA
4.501
1.845
.307
2.439
.023
-.098
9.099
a. Variable dependiente: PRECIO
d) El National Bank tiene DIV= 1.51, GPA =4.52 y PREANTE = 40.63. ¿Qué precio de acción predice el modelo para el 4/1/93.¿ cual es la comparación entre la predicción y el precio por acción verdadero de $54.88 que tuvo el National Bank ese dia?.
=−4.009+1.472∗+4.501∗−8.278∗
PRECIO PREDECIDO PRECIO VERDADERO
63.643 1 54.88
CONCLUCION EL PRECIO PREDECIDO ES MAYOR
13-55) La cooperativa NationalCranberry, una organización formada por cultivadores de arándanos que se dedica a procesar y comercializar su producto, está tratando de establecer una relación entre el precio promedio por barril recibido en cualquier año dado, y el número total de barriles vendidos el año anterior( dividido en ventas del producto fresco y del producto para procesar).
a) Calcule la ecuación de mínimos cuadrados para predecir el precio a partir de las siguientes cifras: Ventas (en cientos de barriles) Fresco Para proceso 844 256 965 335 470 672
Precios del Ventas (en cientos de año anterior barriles) Fresco Para proceso 15.50 320 60 17.15 528 860 11.71 340 761
Precios del año anterior 9.79 10.90 15.88
Coeficientesa Modelo
Coeficientes no estandarizados B Error típ. 1
(Constante)
8,100
4,209
fresco
,008
,005
proceso
,002
,004
a. Variable dependiente: precios
Coeficientes tipificados Beta
t
Sig.
1,924
,150
,695
1,564
,216
,169
,381
,729
b) Prediga el precio por barril para el siguiente año si las ventas de este son 980 (fresco) y 360 (para proceso).
El siguiente año tendremos un precio de 16,47151089 cuando las ventas tengan en fresco 980 y en proceso 360.
13-56) Los teléfonos celulares fueron introducidos en Europa en 1980, y desde entonces, su crecimiento en popularidad ha sido algo fenomenal. El número de suscriptores en los años siguientes está contenido en la siguiente tabla: 1981 1982 1983
3,510 34,520 80,180
1984 1985 1986
143,300 288,420 507,930
1987 1988 1989
877,850 1,471.200 2,342,080
Utilizando el número de años desde la introducción de teléfonos celulares como la variable independiente (es decir 1981 = 1, etc.) encuentre la ecuación lineal de mínimos cuadrados que relaciona a estas dos variables. Observe los residuos ¿siguen un patrón notorio? Encuentre la ecuación cuadrática de mínimos cuadrados ¿cual parece ser un mejor ajuste? Coeficientesa Modelo
Coeficientes no estandarizados B 1
Error típ.
(Constante)
-663,248
281,201
años
260,405
49,971
a. Variable dependiente: numero_celulares
Coeficientes tipificados
t
Sig.
Beta ,892
-2,359
,050
5,211
,001
13-57) mientras se encontraba de comprar, buscando una nueva bolsa para dormir, Fred Montana sintió curiosidad acerca de que características de una bola para dormir son mas importantes para determinar su precio. Fred tomo seis bolsas para dormir de Gore-Tex y realizo un análisis de regresión lineal para averiguarlo.
Swarllow Snow Bunting Puffin
Relleno (Onzas) 14.0 18.0
Peso Total Grueso del (libras) aislante (pulg) 2.00 5.5 2.25 6.5
Condiciones detemp (°F) 20 10
Precio (dólares) 255 285
24.0
3.13
10
329
6.5
a) Haga una regresión del precio sobre el relleno de plumas, peso total, grueso del aislante y condiciones de temperatura. Utilizando los valores prob, determine cuales de estas variables son significativas al nivel x=o.o1.
Resumen stadísticas de la regresión
Coeficiente Coeficiente R^2 ajustad Error típico Observacion
0,99998017 0,99996034 0,99980168 1,40788257 6
ANÁLISIS DE VARIANZA Grados de libert a de cuadra io de los cua
Regre si ón Residuos Total
4 49972,0179 12493,0045 1 1,98213334 1,98213334 5 49974
F
6302,8073
Valor crítico de F
0,009446695
Coeficientes Error típico Estadístico t Probabilidad Inferior 95% uperior 95% nferior 0,01 uperior 0,01
Intercepción 373,039158 51,9179104
7,1851728 0,08803636 -286,640441 1032,71876 373,031003 373,047313
(onzas)
0,03050519 1,11836044 0,02727671 0,98263941 -14,1796115 14,2406219 0,03032952 0,03068086
(libras)
50,4939988 7,30263996 6,91448559 0,09143647 -42,2948397 143,282837 50,4928517 50,4951459
(pulgadas)
-24,7215886 8,21922767 -3,00777514 0,20433894 -129,156778 79,7136009 -24,7228797 -24,7202976
ºf
-4,17160798
0,3894393 -10,711831 0,05925971 -9,11990346 0,77668749 -4,17166916 -4,17154681
b) ¿Qué sucede con la regresión como un todo? Use el valor prob de ANOVA, de nuevo para x=0.01, para determinar si la regresión como un todo es significativo.
La regresión como un todo si es significativa c) ¿Qué problema podría surgir si se usan todas estas variables juntas? ¿ Las respuestas a los inicios a) y b) parecen indicar que este problema podría estar presente?
si se utilizaran todas las variables nuestro valor de r^2 sería más significativo
13-58) Home Depot es una cadena en crecimiento de centro de descuento en materiales para mejoras las casas. La tabla proporciona información de los reportes anuales, que son los datos típicos que usan los analistas financieros para predecir el ingreso futuro de la compañía. a) Desarrolle la ecuación de regresión múltiple que describa el ingreso total como función del numero de tiendas y el tamaño promedio de la tienda. ¿ Que factor parece ser mas importantes para determinar el crecimientos en los ingresos? Como consultor, ¿recomendaría una estrategia de expansión enfocada a una dispersión geográfica amplia ( aumentando el numero de tiendas) o la construcción de un número menor de tiendas muy grandes (que aumenta el tamaño de las tiendas)?
Resumen del modelo Modelo
R
R cuadrado ,996a
1
R cuadrado corregida
Error típ. de la estimación
,990
39,172,152
R cuadrado corregida
Error típ. de la estimación
,887
132,244,879
,991
a. Variables predictivas: (Constante), tiendas
Resumen del modelo Modelo
R 1
R cuadrado ,948a
,898
a. Variables predictores: (Constante), tamaño de tienda
Interpretación: El factor más importante para determinar el incremento en los ingresos Es usando la variable predictiva del número de tiendas Como consultora yo recomendaría la construcción de un mayor número de tiendas
b) Desarrolle una columna de ingreso promedio por empleado. Encuentre la recta de regresión que mejor describa esa variable como función del año (con 1984 codificado como 1, 1985 como 2, etc.) y el tamaño promedio de la tienda. ¿Son más productivos los empleados en tiendas más grandes o es la recta de tendencia (el factor de regresión AÑO) un factor más importante? Como analista, ¿calificaría la tendencia a poner tiendas mas grandes como una estrategia exitosa, o juzgaría que la inflación y otros factores son mas importantes.
Año
Numero De tiendas
Tamaño promedio De tienda (miles de pies2)
Ingreso
Numero
Total de (millones de dólares) empleados
1984 1985 1986 1987 1988 1989 1990 1991 1992 1993 1994
31 50 60 75 96 118 145 174 214 264 340
77 80 80 82 86 88 92 95 98 100 103
433 701 1,001 1,454 2,000 2,758 3,815 5,136 7,148 9,239 12,477
4,000 5,400 6,600 9,100 13,000 17,500 21,500 28,000 38,900 50,600 67,300
Resumen del modelo Modelo
R
R cuadrado ,948a
1
,898
R cuadrado corregida ,887
Error típ. de la estimación 31,393,763
R cuadrado corregida
Error típ. de la estimación
,927
25,152,322
a. Variables predictoras: (Constante), tamañodtienda
Resumen del modelo Modelo
R
R cuadrado ,967a
1
,934
a. Variables predictoras: (Constante), periodo
9-6) Se pidió a nueve distribuidores de componentes de computadora en una área metropolitana importante que proporcionaran sus precios de dos impresoras a color de inyección de tinta. Los resultados de la encuesta se dan en la tabla ( con precios en dólares). Para x=0.05, ¿es razonable asegurar que en promedio la impresora Apson es menos costosa que la Okaydata? Distribuidor Precio de Apson Precio de Okaydata
1 $250
2 319
3 285
4 260
5 305
6 295
7 289
8 309
9 275
$270
325
269
275
289
285
295
325
300
Análisis de varianza de un factor
RESUMEN Grupos
Cuenta
Precio de Apson Precio de Okaydata
Suma
9 9
Promedio
Varianza
2587 287.444444 518.027778 2633 292.555556 451.027778
ANÁLISIS DE VARIANZA Origen de las variaciones
Suma de cuadrados
Grados de libertad
Promedio de los cuadrados
Entre grupos
117.555556
1
117.555556
Dentro de los grupos
7752.44444
16
484.527778
7870
17
Total
F
Probab ilidad
Valor crítico para F
0.2426 1882
0.6290 1175
4.4939984 8
El precio de la impresora Okaydata es mayor ala Apson
APLICACIONES: 9.7) Los datos de la tabla correponden a una muestra aleatoria de nueve empresas tomadas de la sección ¨Digest of EarningsReports¨( Resumen de informes de ingresos) del The Wall Street Journal del 6 de febrero de 1992. a) Encuentre el cambio medio en los ingresos por acción, entre 1991 y 1992. b) Encuentre la desviación estándar del cambio y la desviación estándar del error de la media. c) ¿Fueron diferentes los ingresos medios por acción en 1991 y 1992? Pruebe con un nivel x=0.02 Empresa Ingreso de 1991 Ingreso de 1992
1 1.38
2 1.26
3 3.64
4 3.50
5 2.47
6 3.21
7 1.05
8 1.93
9 2.72
2.48
1.50
4.59
3.06
2.11
2.80
1.59
0.92
0.47
9-15) Jeff Richardson, el encargado de recepción de un distribuidor de productos químicos, se enfrenta con el problema continuo de recibir tubo de ensayo, platos Petri y matraces rotos. Jeff determino algunas precauciones adicionales de empaque que se pueden tomar para prevenir la rotura de las piezas y ha pedido al director de adquisiciones que informe a los proveedores de las nuevas medidas. En la tabla se da los datos de 8 proveedores en términos del numero promedio de piezas rotas por envio. ¿Indican los datos, para x=0.05, que las nuevas medidas han disminuido el numero promedio de piezas rotas?
Proveedor Antes Después
1 16 14
2 12 13
3 18 12
4 7 6
5 14 9
6 19 15
7 6 8
8 17 15
Análisis de varianza de un factor RESUMEN Grupos
Antes Después
Cuenta
Suma
8 8
Promedio
109 92
13.625 11.5
Varianza
24.2678571 11.7142857
ANÁLISIS DE VARIANZA Origen de las Suma de variaciones cuadrados
Grados de libertad
Promedio de los cuadrados
Entre grupos
18.0625
1
18.0625
Dentro de los grupos
251.875
14
17.9910714
269.9375
15
Total
F
Proba bilidad
Valor crítico para F
1.003 97022
0.333 35641
4.600109 94
El número de piezas rotas han disminuido 9-16) Additives-R-Us desarrollo un aditivo para mejorar la eficiencia del combustible en camiones de carga pesada. Probaron el aditivo seleccionado al azar en 18 camiones y agrupándolos en nueve pares. En cada par, ambos camiones llevaban el mismo tipo de carga en la misma carretera, pero solo se puso el nuevo aditivo a uno de ellos. Cada par siguió rutas distintas y llevo diferentes cargas. ¿Indican los datos, al nivel x=0.01, que los camiones que usaron aditivo lograron una eficiencia en el uso de combustible significativamente mejor que los camiones con combustible normal? Par 1 Normal 5.7 Aditivo 6.0
2 6.1 6.2
3 5.9 5.8
4 6.2 6.6
5 6.4 6.7
6 5.1 5.3
7 5.9 5.7
8 6.0 6.1
9 5.5 5.9
Análisis de varianza de un factor RESUMEN Grupos
Cuenta
Suma
Promedio
Varianza
Normal Aditivo
9 9
52.8 54.3
5.86666667 6.03333333
0.1525 0.19
Grados de libertad
Promedio de los cuadrados
F
Proba bilidad
Valor crítico para F
0.729 92701
0.405 51774
8.530965 29
ANÁLISIS DE VARIANZA Origen de las Suma de variaciones cuadrados
Entre grupos
0.125
1
0.125
Dentro de los grupos
2.74
16
0.17125
Total
2.865
17
El aditivo añadido hace q la eficiencia aumente
9.17) El club deportivo AquariusHealth anuncia un riguroso programa de acondicionamiento físico. El club asegura que después de un mes de seguir el programa, un participante promedio será capaz de hacer 8 ¨lagartijas¨ más en 2 minutos que las que podía hacer al principio. ¿ La muestra aleatoria de 10 participantes en el programa, cuyos datos se dan en la tabla siguiente, apoya la afirmación del club? Utilice un nivel de significancia de 0.025. Participante Antes Después
1 38 45
2 11 24
3 34 41
4 25 39
5 17 30
6 38 44
7 12 30
8 27 39
9 32 40
10 29 41
Análisis de varianza de un factor RESUMEN Grupos
Cuenta
Suma
Promedio
Varianza
Antes Después
10 10
263 373
26.3 37.3
100.011111 47.5666667
ANÁLISIS DE VARIANZA Origen de las Suma de variaciones cuadrados
Grados de libertad
Promedio de los cuadrados
Entre grupos
605
1
605
Dentro de los grupos
1328.2
18
73.7888889
Total
1933.2
19
Ho: Uantes=Udesp Hi : Uantes!=Udesp
F
Proba bilidad
Valor crítico para F
8.199 06641
0.010 32942
5.978052 46
aceptamos , las medias son diferentes
Como se puede observar en los resultados el promedio de "lagartijas" ha aumentado
9-18) Donna Rose es supervisora de producción de la línea de ensamble de unidades de disco de Winchester Technologies, Recientemente, Winchester instaló un sistema de audio para música ambiental en sus instalaciones, con la idea de que la música relajara a sus obreros y condujera a una mayor productividad. Donna duda de esta hipótesis, teme que la música sea foco de distracción y produzca una baja en la productividad. Muestreo la producción semanal de los mismos seis trabajadores antes de tener música ambiental y después instalar el sistema. Sus datos se presentan a continuación. A un nivel X=0.02 ¿ha cambiado la producción promedio?
EMPLEADO Semana sin música Semana con música
1 219
2 205
3 226
4 198
5 209
6 216
235
186
240
203
221
205
Análisis de varianza de un factor RESUMEN Grupos
Semana sin música Semana con música
Cuenta
Suma
6
1273
6
1290
Promedio
Varianza
212.166667 102.966667 215
429.2
ANÁLISIS DE VARIANZA Origen de las Suma de variaciones cuadrados
Entre grupos Dentro de los grupos Total
24.083333 3 2660.8333 3 2684.9166 7
Grados de libertad
Promedio de los cuadrados
1
24.0833333
10
266.083333
11
F
Proba bilidad
Valor crítico para F
0.090 51049
0.769 6913
7.638421 62