Pronósticos Segundo Parcial Andrea Cujilema Sangolquí 2015
Actividad de aprendizaje 2.1. el li!ro !ase" resuelva los siguientes pro!lemas del capítulo #" desde la p$gina 25% &asta la 2#5' ( 1" ()" (1*" (21
Pro!lema 1' +Cu$l de las siguientes situaciones es inconsistente, a- / % 0"21 3 r / 0")5 !- / 100 0" 3 r / 40")0 c- / 420 1 3 r / 0"%0 d- / 4) 4 % 3 r / 40"0 Como conocemos, existe relación entre la pendiente b 1 y el coeficiente r si sus signos signos son iguale iguales, s, es decir decir,, una relaci relación ón lineal lineal existe existente nte entre entre las variables X e Y que se está analizando, esto en un modelo de regresión lineal Y = bo b1X! "e acuerdo a lo anterior, anterior, de las alternativas alternativas planteadas, solo el caso caso #b$ es inconsistente, esto debido a que tenemos para b 1 = %,& y para r = '%,(% y como podemos ver tienen signos diferentes, lo cual no es válido y por esto esta situación es inconsistente!
Pro!lema )' n la ta!la P.) se muestra la in6ormación proporcionada por un negocio de órdenes por correo para 12 ciudades. ) continuación se presenta la tabla de cálculos! Ciudad A ; C < = > ? @
78 9eci!idas
9epartidas
.
:
:
*+
1++
-
.(
1
*
-*
+
*.
*-
.
11.
*.
.*&
1.
1
1.
1
**.
-*
1%
-*%
1%%
1%*+
*.
(
1(.
+&
*.
1/
1.
*(%
**.
-*+
1/
-
.+
&
-*+
-.
11
-/.
1*1
1**.
-+
1-
++*
1&
11.
Actividad de aprendizaje 2.1. el li!ro !ase" resuelva los siguientes pro!lemas del capítulo #" desde la p$gina 25% &asta la 2#5' ( 1" ()" (1*" (21
Pro!lema 1' +Cu$l de las siguientes situaciones es inconsistente, a- / % 0"21 3 r / 0")5 !- / 100 0" 3 r / 40")0 c- / 420 1 3 r / 0"%0 d- / 4) 4 % 3 r / 40"0 Como conocemos, existe relación entre la pendiente b 1 y el coeficiente r si sus signos signos son iguale iguales, s, es decir decir,, una relaci relación ón lineal lineal existe existente nte entre entre las variables X e Y que se está analizando, esto en un modelo de regresión lineal Y = bo b1X! "e acuerdo a lo anterior, anterior, de las alternativas alternativas planteadas, solo el caso caso #b$ es inconsistente, esto debido a que tenemos para b 1 = %,& y para r = '%,(% y como podemos ver tienen signos diferentes, lo cual no es válido y por esto esta situación es inconsistente!
Pro!lema )' n la ta!la P.) se muestra la in6ormación proporcionada por un negocio de órdenes por correo para 12 ciudades. ) continuación se presenta la tabla de cálculos! Ciudad A ; C < = > ? @
78 9eci!idas
9epartidas
.
:
:
*+
1++
-
.(
1
*
-*
+
*.
*-
.
11.
*.
.*&
1.
1
1.
1
**.
-*
1%
-*%
1%%
1%*+
*.
(
1(.
+&
*.
1/
1.
*(%
**.
-*+
1/
-
.+
&
-*+
-.
11
-/.
1*1
1**.
-+
1-
++*
1&
11.
B Sumas'
1.
*
-%
+
**.
-*
1*
-/+
1++
1%*+
2)
)
2*##
)
)51*
a- etermine si eDiste una relación lineal signi6icativa entre estas 2 varia!les. EPruF!alo con un nivel 0"05 de signi6icancia-. Calculando el coeficiente de correlación tenemos0
∑
n.
r =
∑ XY − ( ∑ X ).( ∑ Y ) − ( ∑ X ) × n.∑ Y − ( ∑ Y )
n.
r =
2
X 2
2
12 × 2366 − 87 × 287 12 × 887 − ( 87 ) × 12 × 7513 − ( 287 ) 2
2
=
2
3423 3075 × 7787
r = 0,6995
"e acuerdo al resultado, se videncia una relación lineal positiva existencia de una moderada entre las variables analizadas! ) continuación se realiza rueba de significancia para el coeficiente r! r! rimero se realiza el planteo de 2ipótesis0 Ho : ρ = 0 H 1 : ρ ≠ 0
3stad4stico de prueba0 t =
r . n − 2 2
1 − r
=
0,6995. 12 − 2 1 − 0,6995
2
= 3,095
3stad4stico t cr4tico! ara ara 5 = %,%. de * colas y n'* = 1%gl0 tc = 6*,**/
7egla de decisión0 7ec2azamos 7ec2azamos 8o si t esta fuera de 6*,**/, de lo contrario la aceptamos!
"ebido a que t = -,%&. está fuera del intervalo de 6*,**/, rec2azamos 8o, conc conclu luim imos os en ento tonc nces es que que al nive nivell de sign signif ific ican anci cia a de dell .9 ex exis iste te un una a correlación lineal significativa entre las variables analizadas!
!- etermine la línea de regresión ajustada. :4nea de regresión0 Y; = bo b1X
Cálculo de la pendiente de la recta0 b1 =
∑ XY − ( ∑ X .( ∑ Y n.∑ X − ( ∑ X )
n.
2
2
=
12 × 2366 − 87 × 287 3423 = = 1,1132 3075 12 × 887 − 87 2
∑ Y − b .∑ X = 287 − 1,1132 × 87 = 15,8462 1
n
n
12
12
3cuación de regresión0 Y; = 1.,/+* 1,11-*!X
c- Calcule el error est$ndar de estimación.
S y . x =
∑ Y
2
− b0 .∑ Y − b1 .∑ XY = n−2
7513 − 15,8462 × 287 − 1,1132 × 2366 12 − 2
= 5,7559
"e acurdo al resultado, existe un alto grado de dispersión de los datos!
d- la!ore una ta!la A7GHA. ) continuación se presenta la tabla de cálculos! 2% 1# 2* 15 *2 25 1 1 *5 *% 15 *2
I
E4I-:
E4m-:
**,.-
*,1(.%
%,%%&
*
1/,%(
+,*&.-
*,(-
.
*1,+1
*,.*1
%,/+%-
1
1,&
-,/-&1
(&,.%&
1%
*,&/
*.,**1
.,-+%-
(
*-,+
1,/.+%
1,1(-
1.
-*,.+
*11,.*%+
-.,%%&
-
1&,1&
1,+%.&
-.,%%&
11
*/,%&
+(,(--.
1**,/+%-
1-
-%,-*
1-,.1
1%1,(-
*
1/,%(
&,++%+
(&,.%&
1*
*&,*%
(,/1-
.,-+%-
**1"*%)
#%"1#)
Sumas'
ariación total0 =
∑ (Y − Y )
SSE =
∑ ( Y − Y ')
SST
2
= 648,9167
ariación de error0 2
= 331,3847
ariación de la regresión0 SSR = SST − SSE = 648,9167 − 331,3847 = 317,532
) continuación se presenta la >abla )?<)0 otal
gl @=1 n'#@1$= 1% n'1= 11
SS AA7=-1(,.-* AA3=--1,-/+( AA>=+/,&1(
JS AA7B@=-1(,.-* AA3B1%=--,1-/
Halor < &,./*
e- +KuF porcentaje de la variación en las órdenes por correo se eDplica por el nLmero de cat$logos repartidos, 2
2
r = 0,6995 = 0,4893
Concluimos que solo el +/,&-9 de la variación en las órdenes por correo se explica por el nmero de catálogos repartidos!
6- 9ealice la prue!a de &ipótesis para determinar si la pendiente o coe6iciente de regresión es signi6icativamente di6erente a cero. EMtilice el nivel 0"01 de signi6icancia-. rimero realzamos el planteo de 2ipótesis0 Ho : β 1 = 0 H 1 : β 1 ≠ 0
3rror estándar para el coeficiente de regresión! S b1 =
S y . x
∑ ( X − X ) S b1 =
= 2
S y. x
∑ X − ( ∑ X ) 2
5,7559 887 − 87 2 / 12
2
/n
= 0,3596
3stad4stico de prueba0 t =
b1 S b1
=
1,1132 0,3596
= 3,096
3stad4stico t cr4tico0 ara 5 = %,%1 de * colas y n'* = 1%gl0 tc = 6-,1&
7egla de decisión0 7ec2azamos 8o si t esta fuera del intervalo 6-,1&
Como t = -,%&, está dentro del intervalo 6-,1& aceptamos 8o, entonces al nivel de significancia del 19 se concluye que el coeficiente de regresión no es diferente de cero en forma significativa!
g- Prue!a la signi6icancia de la regresión usando la estadística < de la ta!la A7GHA. EMse el nivel de signi6icancia de 0"01- +s el resultado consistente en el punto 6, +e!e serlo, rimero planteamos de 2ipótesis para la prueba global! 8o0 β 1 = 0
:a variable nmero de catálogos repartidos no es explicativa significativa! 8a0 β 1 ≠ 0 :a variable X es explicativa!
?ivel de significancia0 5 = %,%1
ara realizar la prueba global, aplicamos la distribución D! 3stad4stico de prueba #del literal d$0 F =
SSR / k SSE /(n − k − 1)
=
317,532 / 1 331,3847 / 10
= 9,582
3stad4stico D cr4tico0 ara @ = 1gl en el numerador y n'@'1 = 1%gl en el denominador0 Dc = 1%,%
7egla de decisión0 Ai D E 1%,% se rec2azamos 8o
3l valor de es D = &,./*, y siendo menor que 1%,% aceptamos 8o, entonces con un nivel de significancia del 19 concluimos que el nmero de catálogos repartidos no es explicativa significativa!
&- Pronostique el nLmero de órdenes por correo reci!idas cuando se &an repartido 10 mil cat$logos con un intervalo para la predicción de 0N de con6ianza. 3stimación puntual0 Y; = 1.,/+* 1,11-*#1%$ Y; = *,&/ miles de órdenes! 3stimamos que se recibirán *,&/ miles de ordenes por correo!
3rror estándar del pronóstico0 Sf = S y. x
( X − X ) 1+ + n ∑ ( X − X ) 2
1
2
= 5,7566 × . 1 +
1 12
+
(10 − 87 / 12) 2 2
887 − 87 / 12
= 6,0727
Fntervalo de predicción0 F = Y; 6 t!Af ara el &%9 y n'* = 1%gl0 t = 1,/1* F = *,&/ 6 1,/1* x ,%(*( = *,&/ 6 11,%% :F = *,&/ G 11 = 1.,&/ :A = *,&/ 11 = -(,&/
Cuando se reparten 1% mil catálogos, tenemos la confianza de que el nmero de órdenes recibidas estarán comprendidas entre 1.,&/ y -(,&/ miles!
Pro!lema 1*' >arr3 aniels es un ingeniero de control de calidad de Speci6ic lectric Corporation" una empresa dedicada a 6a!ricar motores elFctricos. Mno de los pasos en el proceso de manu6actura implica el uso de una 6resadora autom$tica para &acer las ranuras en el eje de los motores. Cada lote de ejes de motor se prue!a 3 todos los ejes que no tengan las dimensiones requeridas se desec&an. Ba 6resadora de!e reajustarse al comenzar a tra!ajar con cada nuevo lote porque su ca!eza cortadora se desgasta ligeramente durante la producción. A >arr3 se le asigna el tra!ajo de pronosticar cómo a6ecta el tamaOo de un lote al nLmero de ejes de6ectuosos en el lote" de manera que pueda seleccionar el mejor tamaOo de lote. l recopila los datos del tamaOo promedio del lote de los 1* lotes considerados en la ta!la P41* 3 le pide a usted analizarla. ) continuación se presenta la tabla de cálculos! Bote 1 2 * % 5 # ) 10 11 12 1* Sumas'
78 de de6ectos
QamaOo
Y
X
X!Y
XH
YH
+
*.
1%%
*.
1
/
.%
+%%
*.%%
+
(.
+.%
.*.
-
1
1%%
1%%
1%%%%
*.
**
1*.
*(.%
1.*.
+/+
*(
1.%
+%.%
**.%%
(*&
-
1(.
-%%
-%*.
1*&
+&
*%%
&/%%
+%%%%
*+%1
.-
**.
11&*.
.%*.
*/%&
(%
*.%
1(.%%
*.%%
+&%%
/*
*(.
**..%
(.*.
(*+
&.
-%%
*/.%%
&%%%%
&%*.
1%&
-*.
-.+*.
1%.*.
11//1
5))
22)5
1%1*50 511)5
%0#21
a- iagrama de dispersión.
"e acuerdo al gráfico, podemos observar una relación lineal positiva entre el lote de producción y el nmero de defectos!
!- Bínea de regresión lineal simple' R / !o ! 1 Cálculo de la pendiente de la recta de regresión! b1 =
× 577 524875 ∑ XY − ( ∑ X ).( ∑ Y ) = 13 × 141350 − 2275 = = 0,3549 1478750 × − 13 511875 2275 n.∑ X − ( ∑ X )
n.
2
2
2
Cálculo de la ordenada al origen! b0 =
∑ Y − b .∑ X = 577 − 0,3549 × 2275 = −17,7308 1
n
13
n
13
3cuación de regresión0 Y; = '1(,(-%/ %,-.+&!X
c- Prue!a de signi6icancia con / 5N para la pendiente de la regresión" !1. rimero planteamos las 2ipótesis0 Ho : β 1 = 0 H 1 : β 1 ≠ 0
3rror estándar de estimación0
S y . x =
∑ Y
2
− b0 .∑ Y − b1 .∑ XY = n−2 S y . x
40621 + 17,7308 × 577 − 0,3549 × 141350 13 − 2 = 7,9003
3rror estándar para el coeficiente de regresión0 S b1 =
S y . x
∑ X − ( ∑ X ) 2
= 2
/n
7,9003 511875 − 2275 / 13 2
= 0,0234
3stad4stico de prueba0 t =
b1 S b1
=
0,3549 0,0234
= 15,1509
3stad4stico t cr4tico! ara 5 = %,%. de * colas y n'* = 11gl0 tc = 6*,*%1
7egla de decisión0 Ai t esta fuera del intervalo 6*,*%1 rec2azamos 8o!
"ebido a que t = 1.,1. y está fuera del intervalo 6*,*%1, rec2azamos 8o, y concluimos que a nivel de significancia del .9 el coeficiente de regresión es significativamente diferente de cero!
d- Daminar los residuales.
3n el gráfico se puede observar que tenemos arcos de residuales positivos, seguidos por residuales negativos y seguidos finalmente por residuales positivos, es decir que no 2ay una relación lineal entre X e Y!
e- esarrollar un modelo curvilíneo 3 mediante trans6ormación de ajustar a un modelo de regresión lineal simple. )l transformar X a X*, tenemos un nuevo gráfico de dispersión!
Como podemos ver en el gráfico, existe una relación lineal positiva!
3l modelo de regresión lineal simple será0 Y; = bo b 1X* "e acuerdo a los nuevos cálculos tenemos0 Y; = +,&(- %,%%1!X*
6- Prue!a de signi6icancia con / 5N para la pendiente de la varia!le trans6ormada" ! 1. 7ealizamos el planteamiento de las 2ipótesis0 Ho : β 1 = 0 H 1 : β 1 ≠ 0
3rror estándar del coeficiente de regresión0
S b1 = 1,93 × 10
−5
3stad4stico de prueba0 t =
b1 S b1
=
0,001 1,93 × 10 − 5
= 51,813
3stad4stico t cr4tico! ara 5 = %,%. de * colas y n'* = 11gl0 tc = 6*,*%1
7egla de decisión0 Ai t esta fuera de 6*,*%1 rec2azamos 8o
Como t = .1,/1- está fuera de 6*,*%1 rec2azamos 8o, y concluimos que a un nivel de significancia del .9 el coeficiente de regresión es diferente de cero significativamente, para el modelo lineal con variable transformada!
g- Daminar los residuales.
3n el gráfico se observa que la dispersión es constante, y la variabilidad del error es constante y la relación con X * a2ora es lineal!
&- Pronostico de de6ectuosos para un lote de producción con / *00 piezas. Y; = +,&(- %,%%1#-%%$* Y; = +,&(-&% = &+,%(- I &.
Como podemos ver, para un lote de producción con X = -%% piezas, se estima que 2abrán &. piezas defectuosas, entonces preferimos el modelo original por ser más preciso el modelo con variable transformada a XH!
i- ?n6orme. "el análisis anterior, sabemos que la cantidad de piezas defectuosas presenta una relación curvil4nea positiva respecto al tamaJo del lote de producción, y si se desea tener una meKor ecuación de regresión para pronósticos, podemos transformar X a X*!
Pro!lema 21' n el conteDto del ejemplo 241* se presenta la ta!la 24 con los datos so!re el costo real E- 3 el costo estimado E-" en millones de dólares" para n / 2# pro3ectos de construcción. Ba 6igura 241) muestra la gr$6ica de la línea ajustada para estos datos. ) continuación se muestra la tabla de cálculos!
9eal
stimado
:
:
%,&1/
%,.(.
%,.*(/.
%,--%*.
%,/+*(*+
(,*1+
,1*(
++,*%%1/
-(,.+%1-
.*,%+1/
1+,.((
11,*1.
1-,+/11
1*.,((*
*1*,+//&
-%,%*/
*/,1&.
/+,-&.
(&+,&./
&%1,/%/
-/,1(-
-%,1
11+&,%%(
&%,%1
1+.(,1(/
1.,-*
*1,%&1
-*-,11+1
+++,/-%-
*-+,(%*+
1+,/-(
/,.&
1*/,+(-
(+,&(/*/
**%,1-
.1,*/+
+%,-
*%/-,&
1.%,(&(
*-%,%+&
-+,1
-(,/
1*//,&/
1+*/,/+
11*,/1
*,%%-
1,/%-
-,11+%&
-,*.%/%&
+,%1*%%&
*%,%&&
1/,%+/
-*,(+/
-*.,(-%-
+%-,&&/
+,-*+
/,1%*
-.,%--%.
.,+*+
1/,&&/
1%,.*-
1%,(-
11*,&11/
11.,1-*&
11%,(--.
1-,-(1
/,&+(
11&,-%-
/%,%+//1
1(/,(/-
1,..-
-,1.(
+,&%*/*1
&,&+&
*,+11/%&
+,%&
-,.+
1+,+%+*
1*,.-1
1,..(
*(,&(-
-(,+
1%+,1&
1-&/,(
(/*,+//(
(,+*
(,.
./,+1-
./,.**.
./,+%%1
-,&*
1-,(
.%,./%+
1/(,&
1-,-%/
*&,.**
*&,%%-
/.,**
/+1,1(+
/(1,.+/.
1.,-1(
1+,-&
**+,**.
*1+,-%%-
*-+,1%.
.,*&*
.,*&*
*/,%%.*
*/,%%.*
*/,%%.*
%,(%(
%,&
%,(/(*
%,&*1
%,+&&/+&
1,*+
1,*+
1,.+.%+
1,.-(
1,..*.1
1,1+-
1,+1&
1,*1&1(
*,%1-.1
1,-%++&
*1,.(1
-/,&-
/-&,///.
1.1,%1*
+.,-%/
*)#"%
*"5
)")5#
10*25"*
100#%"%5
a- 9eanalice los datos de costos usando un modelo de regresión lineal simple. la!ore una gr$6ica de los residuos contra los valores ajustados. Cálculo de la pendiente de la recta de regresión! b1 =
∑ XY − ( ∑ X ).( ∑ Y ) = 26 × 9788,756 − 388,958 × 376,498 = 108065,7469 = 0,9223 117169,4742 26 × 10325,3 − 388,958 n.∑ X − ( ∑ X )
n.
2
2
2
∑ Y − b .∑ X = 376,498 − 0,9223 × 388,958 = 0,6831 1
n
3cuación de regresión0
n
26
26
Y; = %,/-1 %,&**-!X
3n el grafico se observa a los residuos distribuidos en forma aleatoria alrededor del valor promedio cero, lo que indica que el modelo no tiene problemas de autocorrelación!
!- +s signi6icativa la regresión del costo real so!re el costo estimado, @usti6ique su respuesta. Calculando en 3xcel tenemos0 ariación total0 SST
=
∑ (Y − Y )
2
= 4612,493
ariación de error0 SSE =
∑ ( Y − Y ')
2
= 779,057
ariación de la regresión0 SSR = SST − SSE = 4612,493 − 779,057 = 3833,436
) continuación se muestra la tabla )?<)! otal
=l @=1 n'#@1$= *+ n'1= *.
SS AA7=-/--,+- AA3=((&,%.( AA>=+1*,+&-
JS AA7B@=-/--,+- AA3B1%=-*,+1
Halor < 11/,%&.
Ae realiza el planteamiento de la 2ipótesis para la prueba global! 8o0 β 1 = 0 3l modelo de regresión no es explicativa significativa! 8a0 β 1 ≠ 0 3l modelo de regresión es significativo! ?ivel de significancia0 Aea 5 = %,%. ara realizar la prueba global, aplicamos la distribución D!
3stad4stico de prueba0 F =
SSR / k SSE /(n − k − 1)
= 118,095
3stad4stico D cr4tico! ara @ = 1gl en el numerador y n'@'1 = *+gl en el denominador0 Dc = +,*
7egla de decisión0 Ai D E +,* rec2azamos 8o! Como D = 11/,%&. es mayor que +,* rec2azamos 8o, concluimos entonces que a un nivel de significancia del .9 el modelo de regresión es significativo!
c- ?denti6ique e interprete r 2. 2
r
r = 2
[ n.∑ XY ∑ X ∑ Y ] [n∑ X ( ∑ X ) ] [n∑Y ( ∑Y ) −
=
2
−
2
2
×
×
2
−
[ 26 × 9788,756 − 388,958 × 376,498] 2
[ 26 × 10325,3 − 388,958 ] × [26 × 10064,45 − 376,498 ] 2
2
=
2
] 108065,7469 2
117169.4742 × 119924,956
r 2 = 0,831
3ntonces el /-,19 de la variación en los costos reales corresponden a las variaciones en los costos estimados!
d- +Cu$les son los valores apropiados de los coe6icientes de la pendiente 3 de la intersección de la 6unción de regresión de la po!lación si el costo estimado es un 6actor de pre4dicción per6ecto del costo real esperado, +Son congruentes los coe6icientes estimados en la ecuación de la línea recta ajustada con estos valores, iscLtalo. :os coeficientes para la muestra permiten estimar los coeficientes de regresión para la población, as40 β ˆ 0 = b 0 = 0,6831 y β ˆ1 = b1 = 0,9223 !
e- Considere la gr$6ica de los residuos contra los valores ajustados. +Parece como si los costos estimados 6ueran" en general" 6actores de predicción m$s eDactos de los costos reales de los pro3ectos relativamente !aratos que de los pro3ectos de alto costo, +Por quF,
Actividad de aprendizaje 2.2. el li!ro !ase" resuelva los siguientes pro!lemas del capítulo )" desde la p$gina *1* &asta la *2%' ( 5" (1*" (15" (21
Pro!lema 5' Ba ecuación de regresión mLltiple es Pronostique el valor de si 1 / 20 3 2 / ).
ˆ = Y
ˆ = 7,52 + 3 X − 12,2 X . Y 1 2
7,52 + 3(20) − 12,2(7) = 7,52 + 60 − 85,4 = −17,88
3l valor estimado de Y para las condiciones dadas es '1(,//!
Pro!lema 1*' l gerente de ventas de >artman Auto Supplies decide investigar una nueva varia!le dependiente" la del ingreso personal por región
Evea el pro!lema 12-. Bos datos para esta nueva varia!le se presentan en la ta!la P.1*. a- +l ingreso personal por región tiene alguna contri!ución en el pronóstico de ventas, Lodelo del problema 1* del libro gu4a0 9egión
Hentas Anuales
78 Jinoristas
78 Automóviles 9egistrados
1
2
1
.*,-
*%11
*+,
2
*
*/.%
**,1
*
*%,*
.%
(,&
%
1
+/%
1*,.
5
-%
1&+
&
#
+,*
*-%*
11,.
)
-.
**1+
*%,.
-,.
1*.
+,1
--,1
1/+%
/,&
10
*.,*
1*--
,1
11
-/,*
1&&
&,.
Ae presentan los resultados en 3xcel para la regresión lineal para ventas con * variables independientes!
Estadísticas de la regresión Coeficiente de correlación mltiple Coeficiente de determinación 7M* 7M* aKustado 3rror t4pico
%,(+*+( %,..1* %,+-&%/ 1%,-%.1 11
An$lisis de Harianza 7egresión
Grados de libertad *
Suma de cuadrados 1%+-,+(+
Promedio de los cuadrados .*1,/-*-&
F +,&1-//*
7esiduos
/
/+&,.+-.-
1%,1&..++
>otal
1%
1/&-,**&%&
Coeficientes
Error típico
Estadístico t
Probabilidad
Fntercepción
1%,1%&*.&
(,*1&.../
1,+%%*%+
%,1&&%%+*
X1
%,%1%&///&
%,%%.*%%1+
*,11-1&*-(
%,%(.-(
X*
%,1&+%-+
%,-&/++%-
%,-%+*-%&-
%,(/(1.*
:a ecuación de regresión mltiple es la siguiente0
3l coeficiente para este modelo de regresión es0 r* = %,..1Ae concluye que solo el ..,1-9 de las variaciones en las ventas se explica por el modelo analizado, el baKo valor del estad4stico D = +,&1 seJala que no es un modelo confiable para realizar las estimaciones de las ventas! 7esolvemos entonces el planteamiento anterior con una nueva variable aleatoria X-, que corresponde al ingreso personal por regiones0 9egión
Hentas Anuales
78 Jinoristas
78 Autos 9egistrados
?ngreso Personal
1
2
*
1
.*,-
*%11
*+,
&/,.
2
*
*/.%
**,1
-1,1
*
*%,*
.%
(,&
-+,/
%
1
+/%
1*,.
-*,(
5
-%
1&+
&
/,/
#
+,*
*-%*
11,.
&+,(
)
-.
**1+
*%,.
(,
-,.
1*.
+,1
1&,(
--,1
1/+%
/,&
(,&
10
*.,*
1*--
,1
1,+
11
-/,*
1&&
&,.
/.,
Ae presentan los resultados en 3xcel para el nuevo modelo de regresión lineal mltiple0
Estadísticas de la regresión Coeficiente de correlación mltiple Coeficiente de determinación 7M* 7M* aKustado 3rror t4pico
%,&/(. %,&(-/ %,&*+ *,(&/ 11
Análisis de la Varianza
7egresión 7esiduos >otal
Grados de libertad ( 1%
Fntercepción X1 X* X-
Coeficiente s '-,&1(( %,%%*-/+ %,+.(+* %,+%%.(
Suma de cuadrados 1/+-,+%**. +&,/*/+*/ 1/&-,**&%&
Promedio de los cuadrados 1+,+(+1 (,11/1*%+
Error típico
Estadístico t
Probabilidad
*,*&%1(-1 %,%%1.(*1* %,1(+&&*& %,%-((&1+-
'1,(1%.(++ 1,.1+(/ *,(-%&1++/ 1%,.&&-/&
%,1-%//+.%,1(-1/1&%,%*&*&&&( %,%%%%1+...
F /,-*+-&*1
:a ecuación de regresión lineal mltiple para el nuevo modelo es0
3l coeficiente de determinación para este nuevo modelo es0 r* = %,&(-(, 3sto nos indica que el &(,-(9 de las variaciones en las ventas se explican por este nuevo modelo, el nuevo valor de D se 2a incrementado considerablemente, y concluimos que este es un modelo muy confiable para estimar de las ventas además de que el ingreso personal contribuye considerablemente en el pronóstico de ventas!
!- Pronostique las ventas anuales de la región 12 con un ingreso personal de %0 mil millones de dólares" usando las tres varia!les independientes. rocedemos a pronosticar las ventas anuales utilizando0 X1 = *.%% puntos de venta X* = *%,* millones de autos registrados X- = +% mil millones de dólares!
ˆ = Y
−3,9177 + 0,0024(2500) + 0,4574( 20,2) + 0,4006(40) = 27,3458
:a estimación de ventas baKo los valores detallados es de *(,-. millones NAO
c- iscuta so!re la eDactitud del pronóstico realizado en el inciso !. "e acuerdo al modelo de regresión lineal mltiple inicial, podemos afirmar que el pronóstico de ventas obtenido es bastante preciso!
d- +KuF varia!les independientes incluiría en su modelo de pronostico 6inal, +Por quF, ) continuación se presentan los distintos coeficientes de regresiones de acuerdo a cada variable0
Haria!les
Coe6iciente r:
1
%,.+1
2
%,-%%/
*
%,/(/
1 3 2
%,..1-
1 3 *
%,&+.
2 3 *
%,&.
1" 2 3 *
%,&(-(
"e acurdo al cuadro presentado, concluimos que para una mayor precisión en los pronósticos de las ventas, el modelo debe incluir las - variables independientes, tambiPn se puede trabaKar con dos variables y aunque los resultados serán menos precisos, el modelo deberá incluir necesariamente las variables X* y X-!
Pro!lema 15' Ca!e esperar que las compras con tarjeta de crFdito sean di6erentes de las compras en e6ectivo en la misma tienda. Ba ta!la P415 indica las ventas diarias !rutas 3 los artículos vendidos que se pagan en
e6ectivo" así como las ventas diarias !rutas en e6ectivo 3 los artículos vendidos que se pagan con tarjetas de crFdito en la misma tienda de consignación por 25 días consecutivos. Compras e6ectivo
Con tarjeta crFdito
ía
entas
art4culos
entas
)rt4culos
1
-+/
..
1+/
+
2
+*
/
111
*
1
&
*
(
%
&+
1
%
%
5
%
11
-&
.
#
1.
*
(
1
)
1*
*(
1+-
*
111
1&
*(
.
*
.
1+
*
10
1%%
1/
(1
1*
11
1/%
*(
11
*1
12
*1*
-
.%
&
1*
./
1%
1-
*
1%
11.
*%
1%.
1
15
1.
/
1&
-
1#
&(
1.
++
1+
1)
1
1%
%
%
1
/.
1.
*+
-
1
1.(
*+
1++
1%
20
//
1.
-
11
21
&
1&
%
%
22
*%*
--
1+
-
2*
1%/
*-
%
%
2%
1./
*1
*+
+
25
1(
+-
*.-
*/
a- la!ore un diagrama de dispersión de las ventas !rutas diarias" " contra artículos vendidos que se pagan en e6ectivo. Msando otros sím!olos" o !ien" colores di6erentes" agregue las ventas !rutas diarias 3 los artículos vendidos que se pagan con tarjeta de crFdito. Compare visualmente la relación entre las ventas 3 el nLmero de
artículos vendidos que se pagan en e6ectivo con los pagados con tarjeta de crFdito.
Como podemos ver que las ventas en efectivo son similares a las ventas con tarKeta aunque estas ltimas tienen una mayor dispersión de datos, para cada situación existe una relación lineal!
!- e6ina la varia!le 6icticia. 1 si paga compras en efectivo
X 2 =
0 si paga compras con tarjeta
ajuste el modelo de regresión. ˆ = β + β X + β X + ∈ Y 0 1 1 2 2
Ae presentan los resultados de 3xcel! Estadísticas de la regresión Coeficiente de correlación mltiple Coeficiente de determinación 7M*
%,&1%%( %,/*/**
7M* aKustado 3rror t4pico
%,/*%&1 -%,&1 .%
An$lisis de la Harianza
7egresión 7esiduos >otal
Grados de libertad * +( +& Coeficientes
Suma de Promedio de los cuadrados cuadrados *1(*&.,1+ 1%/+(,.(+.%/,-(-& &./,&%1.(* **--,.* Error típico
Fntercepción 1-,.(((/*+ (,%/+%* X1 .,&&(/+./ %,++-.(-1 X* '1&,%1%*( 1%,++/1%
Estadístico t 1,&*%/+(/. 1-,.1/(-*/ '1,/1&+&+-
F 11-,-%+1&(
Probabilida d %,%%/*/( /,*-3'1/ %,%(.*%/&(
3cuación de regresión0 ˆ = 13,5778 + 5,9977 X − 19 Y ,0103 X 2 1
:a pendiente de X* tienen un valor negativo, lo que se interpreta como que una compra pagada en efectivo es 1&,%1 NAO menos costoso que cuando se paga con tarKeta!
c- Analice el ajuste del inciso 3l coeficiente de este modelo es0 r* = %,/*/* :o que indica que el /*,/*9 de las variaciones en las ventas se explican por la ecuación de regresiónQ el valor de D = 11-,-% indica que podemos realizar pronósticos confiables, pero si analizamos las pendientes de cada variable podemos concluir que solo X1 es significativa en el modelo! )l analizar los residuales, verificamos que las ventas pagadas con tarKeta de crPdito #X* = %$ presentan un mayor grado de dispersión que las ventas pagadas en efectivo, lo que ya se descubrió en como ya se 2ab4a visto en el literal #a$!
3l modelo no es satisfactorio en su totalidad!
d- Con !ase en el modelo ajustado del inciso !-" ela!ore un pronóstico de las ventas diarias para un individuo que compra 25 artículos 3 paga en e6ectivo. Para una muestra grande" constru3a un intervalo de predicción del 5N para las ventas diarias. 3l pronóstico puntual para esta compra será de0 ˆ Y
= 13,5778 + 5,9977( 25) − 19,0103(1) = 24,58
ara una predicción del &.9 para muestras grandes, el intervalo será0 Ay!x = -%,&1 F = Y; 6 t R Ay!x ara el &%9 y n'* = +/gl0 t = *,%1 F = *+,./ 6 *,%1 x -%,&1 = *+,./ 6 *,*+ :F = *+,./ G *,*+ = '-(, I % :A = *+,./ *,*+ = /,/* 3xiste el &%9 de confianza que el valor de las compras para las condiciones dadas estará comprendido entre % y /,/* dólares!
e- escri!a la naturaleza de la 6unción ajustada del inciso !-. +Cree usted que es mejor justar dos líneas rectas separadas" una para las ventas en e6ectivo 3 otra para las ventas con tarjeta de crFdito" para los datos de la ta!la P415, iscLtalo. 3ste análisis se desarrolló previamente en el literal #c$, donde se determinó que la variable ficticia X* no es muy significativa para el modelo, por esto se la puede eliminar, entonces resulta adecuado aKustar dos rectas separadas a los datos, una para ventas en efectivo y otra para ventas con tarKeta de crPdito!
Pro!lema 21'
Ba ta!la P421 contiene el numero de cuentas Een miles- 3 los activos Een miles de millones de dolares- de 10 corredurias de !olsa online. =ra6ique los activos contra el numero de cuentas. ?nvestigue la posi!ilidad de que la relacion sea curva ela!orando una regresion multiple para pronosticar los activos" considere el numero de cuentas 3 el numero de cuentas elevado al cuadrado como varia!les independientes. Fniciamos con el diagrama de dispersión!
odemos ver una relación curvil4nea entre las variables!
a-Proporcione la 6uncion de regresion ajustada. +s signi6icativa la regresion, Dplique. ˆ = b + b . X + b . X 2 Y 0 1 2
resentamos los resultados de 3xcel! Estadísticas de la regresión Coeficiente de correlación mltiple Coeficiente de determinación 7M* 7M* aKustado 3rror t4pico
An$lisis de la Harianza
%,&/&* %,&(&-. %,&(-++ 1*,+11( 1%
7egresión 7esiduos >otal
Fntercepción X XH
Grados de libertad * ( &
Suma de cuadrados .11-%,1 1%(/,-. .**%/,+
Promedio de los cuadrados *...,1 1.+,%.
Coeficientes
Error típico
Estadístico t
(,%/-1 '%,%%+ -,-3'%.
/,.%-1( %,%*-(/ /,&-3'%
%,/&+( '%,1&*1 -,(-.+
ˆ = Y
7,6083 − 0,0046. X + 0,00003. X
F 1.,&.-
Probabilida d %,+%%%,/.-%& %,%%(%+
2
ara este modelo0 r* = %,&(&Fndica que el &(,&-9 de las variaciones de los activos se explican en este modelo, los valores D = 1.,&. y t = -,( respaldan al modelo como confiable para realizar los pronósticos a pesar de que el valor de r * es muy pequeJo!
!-Prue!e la signi6icancia del coe6iciente del termino elevado al cuadrado. 9esuma su conclusion. "e acuerdo a los resultados de 3xcel tenemos0 b* = %,%%%%-- Ab* = %,%%%%%/&lanteamiento de 2ipótesis0 Ho : β 2 = 0 H 1 : β 2 ≠ 0
3stad4stico de prueba0 t =
b2 S b 2
=
0,0000336 8,93 × 10 −6
= 3,763
3stad4stico t cr4tico! Aea 5 = %,%. de * colas y n'* = /gl0 tc = 6*,-%
7egla de decisión0
Ai t esta fuera del intervalo 6*,-%, rec2azamos 8o
Como t = -,(- está fuera del intervalo 6*,-%, rec2azamos 8oQ se concluye que a un nivel de significancia del .9 el coeficiente de regresión es diferente de cero significativamente para este modelo!
c-Corra otra vez el analisis sin el termino cuadratico Eelevado al cuadrado-. Dplique porque el coe6iciente del numero de cuentas no es el mismo que el que usted o!tuvo en el inciso a-. ˆ = b + b X Y 0 1
resentamos los resultados de 3xcel! Estadísticas de la regresión Coeficiente de correlación mltiple %,&/*( Coeficiente de determinación 7M* %,&-(.. 7M* aKustado %,&*&(. 3rror t4pico *%,1/((
An$lisis de la Harianza 7egresión 7esiduos >otal
Grados de libertad 1 / &
Fntercepción X
Coeficiente s '1(,1*1 %,%/-*1
3cuación de regresión simple0
Suma de cuadrados +/&+/,1 -*%,-+ .**%/,+
Promedio de los cuadrados +/&+/,1 +%(,.+*
Error típico
Estadístico t
/,((/*1 %,%%(.&
'1,&.%. 1%,&.&-
F 1*%,1%
Probabilida d %,%/&+,*(3'%
ˆ Y
= −17,1215 + 0,0832 X
Como podemos ver en este modelo, los valores r * y D disminuyeronQ el coeficiente b1 y b% cambian sus valores notoriamente por corresponder a otro modelo de regresión, aunque resulta más adecuado que el modelo mltiple curvil4neo para realizar los pronósticos de la cantidad de acciones en forma más confiable!
Actividad de aprendizaje 2.*. el li!ro !ase" capítulo " pp. *# T *)" resuelva los siguientes pro!lemas' ( 5" (1*" (1)" (21
Pro!lema 5' Msted realiza una prue!a para sa!er si &a3 alguna correlación serial en el nivel 0"01 con *2 residuos de una regresión con dos varia!les independientes. Si la estadística ur!in4Uatson que se &a calculado es igual a 1.0 +Cu$l es su conclusión, 3mpezamos con el análisis para determinar si existe una correlación serial! ε 1 = ρε t −1 + ν t
lanteamiento de 2ipótesis0 H 0 : ρ = 0
H 1 : ρ E%
Conocidos0 "S = 1Q 5 = %,%1Q n = -*Q @ = *! >omamos datos de la tabla C'0 d: = 1,1 y dN = 1,-.
7egla de decisión0
Ai "S E dN se concluye que H 0 : ρ = 0 Ai "S T d: se concluye que H 1 : ρ E% Ai d: U "S U dN la prueba no es concluyente! Como "S = 1 T d:, concluimos que H 1 : ρ E% y que existe autocorrelación positiva, por lo que en el modelo 2ay una correlación serial, y que sus perturbaciones no son independientes!
Pro!lema 1*' Ba Q&ompson Airlines determinó que el 5N del nLmero total de pasajeros nacionales estadounidenses vuela en los aviones de la compaOía. Se le asigna a usted la tarea de pronosticar el nLmero de pasajeros que volar$n en la Q&ompson Airlines en 200). Bos datos se presentan en la ta!la P41*. ) continuación se muestra la tabla de datos0 AVG
78 Pasajeros
AOo codi6icado
1)
**,/
1
10
*,1
*
11
*&,+
-
12
-+,.
+
1*
-(,
.
1%
+%,-
15
-&,.
(
1#
+.,+
/
1)
+,-
&
1
+.,/
1%
1
+/
11
10
.+,
1*
11
1,&
1-
12
&,&
1+
1*
(&,&
1.
1%
&,-
1
15
1%&
1(
1#
11
1/
1)
11(,*
1&
1
1*+,&
*%
1
1-,
*1
2000
1++,/
**
2001
1+(,&
*-
2002
1.%,1
*+
200*
1.1,&
*.
a- esarrolle un modelo de regresión de series de tiempo" usando el tiempo como la varia!le independiente 3 el nLmero de pasajeros como la varia!le dependiente. Ajuste este modelo. ˆ = b + b X Y 0 1
>enemos el siguiente diagrama de dispersión0
Como podemos observar en el gráfico de dispersión, existe una relación lineal positiva entre la cantidad de pasaKeros y el tiempo, y los datos están distribuidos de forma que siguen un patrón!
) continuación se presentan los resultados de 3xcel0 Estadísticas de la regresión Coeficiente de correlación mltiple %,&(1*(
Coeficiente de determinación 7M* 7M* aKustado 3rror t4pico
%,&+--/ %,&+%&1 11,%1(1 *.
An$lisis de la Hariación 7egresión 7esiduos >otal
Grados de libertad 1 **+
Coeficientes Fntercepción 1,-11 X .,&/1-1
Suma de cuadrados +.%/,& *(&1,+ +&-%%,.
Promedio de los cuadrados +.%/,& 1*1,-(
Error típico +,.+*+. %,-%..
Estadístico t %,*//1 1&,.(.
F -/-,1/1
Probabilidad %,((.+ (,(*3'1
3cuación de regresión0 ˆ Y
+ 5,9813 X = 1,31
Au coeficiente de determinación0 r* = %,&+-+ 3sto nos ayuda a determinar que el &+,-+9 de las variaciones de la cantidad de pasaKeros se explica e n este el modelo! :os valores de D = -/-,1/ y t = 1&,.(. indican que el modelo es confiable para realizar estimaciones confiables del nmero de pasaKeros que viaKan anualmente!
!- +s via!le el supuesto de errores independientes para este modelo, 3l grafico de residuales, indica que los tPrminos de error no están dispersos aleatoriamente, por lo tanto los datos no ser4an aleatorios, y que en general responde a que los tPrminos de error no son independientes!
c- Ajuste el modelo del inciso a- con los logaritmos del nLmero de pasajeros como la varia!le dependiente. ara este modelo es adecuado un modelo auto regresivo de primer orden! ˆ Y t
= b0 + b1Y t −1
3l diagrama de dispersión del nuevo modelo ser4a el siguiente0
3l diagrama permite ver una relación lineal positiva en este nuevo modelo!
d- 9epita el inciso a- con el tiempo representado por una tendencia eDponencial EvFase la ecuación 5.#-. ) continuación se presentan los resultados de 3xcel0
Estadísticas de la regresión Coeficiente de correlación mltiple Coeficiente de determinación 7M* 7M* aKustado 3rror t4pico
%,&&.+( %,&&%& %,&&%.. +,-+(/ *+
An$lisis de la Harianza 7egresión 7esiduos >otal
Grados de libertad 1 ** *-
Coeficiente s Fntercepción -,/*1(& ariable X 1 1,%*%+/
ˆ Y t
Suma de cuadrados +../, +1.,/(+ +%%*,.
Promedio de los cuadrados +../, 1/,&%-+
Error típico
Estadístico t
1,/1** %,%*%(/
*,1%/&* +&,1%((
F *+11,.
Probabilida d %,%+. .,.(3'*+
= 3,8218 + 1,0205Y t −1
Coeficiente de determinación0 r* = %,&&1 3sto indica que el &&,19 de las variaciones de la cantidad de pasaKeros se explican por este modelo! :os valores de D = *+11,. y t = +&,1%/ indican que este es un modelo confiable para realizar pronósticos sobre la cantidad de pasaKeros que viaKan anualmente! "iagrama para los nuevos tPrminos de error0
3n este nuevo modelo los tPrminos de error están distribuidas en forma aleatoria, con lo cual se puede considerar que los tPrminos de error son independientes y constantes!
e- +Cu$l modelo pre6iere usted" el del inciso c- o d-, +Por quF, )unque ambos modelos son confiables, es preferible el modelo del literal c, ya que al ver las gráficas de los residuales, la gráfica del modelo c muestra datos menos dispersos y con un patrón definido!
6- +Bos errores de los modelos de los incisos c- 3 d- parecen ser independientes, Si no es así" +quF pro!lemaEs- podríaEn- surgir cuando se use uno Eo am!os- de estos modelos ajustados para pronosticar, ara el modelo c, los tPrminos de error no son independientes y los del modelo d están ligeramente dispersos, lo que indica que son ligeramente independientes
g- Con !ase en su modelo pre6erido" pronostique el nLmero de pasajeros para 200% de la Q&ompson Airlines. ara *%%-0 Yt'1 = 1.1,& pasaKeros! ˆ Y t
= 3,8218 + 1,0205Y t −1
ˆ Y 2004 = 3,8218 + 1,0205Y 2003 = 3,8218 + 1,0205(151,9) = 158,8357
3stimamos que en el aJo *%%+, el nmero de pasaKeros de la empresa de transporte aPreo maneKará 1./,/ miles de pasaKeros!
Pro!lema 1)' Msar los datos que aparecen en la ta!la .5" convierta las ventas 3 los valores de ingresos disponi!les a di6erencias simples. s decir" crear los nLmeros tR / t T t41 3 tR / t T t41. Ajuste un modelo de regresión lineal simple. Compare sus resultados con los resultados o!tenidos por el mFtodo de di6erencias generalizadas en el ejemplo .5. +spera!a que 6ueran distintos, Dplique su respuesta. ) continuación presentamos los resultados para el mPtodo del eKemplo /!.0 ˆ = 54,483(1 − 0,997) + 9,26 X Y t ˆ = 0,997 ρ
ˆ ' = Y − 0,997Y ; X ' = X − 0,997 X Y t t t −1 t t t −1 b0 = 54,483; b1 = 9,26 S b1 = 7,241 t = b1 / S b1 = 1,28 DW = 1,12
>enemos el siguiente diagrama de dispersión0
) continuación se presentan los resultados de 3xcel0
Estadísticas de la regresión Coeficiente de correlación mltiple Coeficiente de determinación 7M* 7M* aKustado 3rror t4pico
%,(*((+ %,.*&1 %,.%-+( *-&,(*1 *%
An$lisis de la Harianza Grados de
Suma de
Promedio de
F
7egresión 7esiduos >otal
Fntercepción ariable X 1
libertad 1 1/ 1&
cuadrados 11+.&/ 1%-+-/& *1&/&/(
los cuadrados 11+.&/ .(+
Coeficientes
Error típico
Estadístico t
1+/,&*&,1..+
&(,(%*+ *,%--(+
1,.*+*. +,.%1(
*%,*./
Probabilida d %,1++/* %,%%%*/
ˆ = 148, ,9233 + 9,1554 X Y t
Ae estima que0 ˆ ρ
=1
ˆ ' = Y − Y ; X ' = X − X Y t t t −1 t t t −1
b0 = 148,9233; b1 = 9,1554 S b1 = 2,0337
t = b1 / S b1 = 4,5018
:a mayor4a de los resultados de este nuevo modelo presentan diferencias significativas, solo b1 mantiene el mismo valor, se esperaba que los resultados fueran similares y que bo fuera similar a %, y analizando el diagrama de dispersión de este modelo identificamos que los ltimos pares de datos presentan un comportamiento distinto a los demás datos, esto ocasiona que bo sea mayor que cero, y si se quitan estos ltimos valores del modelo, el coeficiente bo se aproxima a cero y se asemeKa al modelo de diferencias generalizadas!
Pro!lema 21' 9epita los incisos !- 3 c- del pro!lema 20 con los datos trans6ormados logarítmicamente. >aga una interpretación de los coe6icientes del ingreso 3 del precio del pollo en tFrminos de elasticidades. Con !ase en su 6unción de regresión ajustada 6inal" indique como se o!tendría un pronóstico del consumo de pollo para los aOos siguientes.
Problema 20:
La demanda de una mercancía depende generalmente del ingreso del consumidor, el precio real de la mercancía y el precio real de los accesorios o productos similares. La tabla P-19 indica el consumo per cpita de pollo en Estados !nidos "en libras#$ el ingreso disponible per cpita "en dólares#$ y los precios al menudeo del pollo, puerco y carne de res "en centa%os por libra# de %arios a&os. a. 'alcule la matri( de correlación para todas las %ariables, usando tanto las unidades originales como las unidades trans)ormadas en logaritmos. 'omente sobre la )ortale(a implicada de la asociación lineal entre el pollo consumido y cada una de las %ariables restantes. *Puede usted pensar una ra(ón por la +ue se debe tener cuidado al interpretar las magnitudes de los coe)icientes de correlación obtenidos a partir de los datos de la serie de tiempo Ae presenta arámetros del modelo mltiple con las variables iniciales, a continuación se muestran los resultados en 3xcel0
Estadísticas de la regresión Coeficiente de correlación mltiple Coeficiente de determinación 7M* 7M* aKustado 3rror t4pico
%,&..*1 %,&1*+%,/&*&( *,1*1 *-
An$lisis de la Harianza
7egresión 7esiduos >otal
Fntercepción X1 X* XX+
Grados de libertad
Suma de cuadrados
+ 1/ **
/+(,/. /1,-(%+ &*&,**
Coeficiente s -&,*&* %,%%+'%,*+& %,1-. %,%/%.
3cuación de regresión mltiple0
Error típico +,%+&* %,%%.-%,1((*( %,%&- %,%...
Promedio de los cuadrados *11,&* +,.*%./
F +,///+
Estadístic Probabilida o t d &,(%&11 1,+%3'%/ %,///& %,-&-. '-,.*.* %,%%*+* *,-.&*/ %,%*&/1 1,+.%+ %,1+1-
ˆ = 39,29 + 0,0046 X − 0,6249 X + 0,1636 X + 0,0805 X Y 1 2 3 4
>enemos0 r* = %,&1*+ D = +,/// 3l valor t es significativo solamente para X*!
b. !sando los datos originales, corra un programa de regresión por pasos con el consumo de pollo como la %ariable dependiente y las %ariables restantes como %ariables eplicati%as. Estable(ca al)a para enter .alp/a to remo%e .0 >abla de coeficientes de determinación r * para los diferentes modelos, al combinar las distintas variables independientes! Haria!les
Coe6iciente r:
Signi6icativos
lnE1-
%,&%(1
lnE2-
%,.(//
lnE*-
%,(&1(
lnE%-
%,/-1(
lnE1- 3 lnE2-
%,&(*
)mbos
lnE1- 3 lnE*-
%,&-1.
ln#X1$
lnE1- 3 lnE%-
%,&1(*
ln#X1$
lnE2- 3 lnE*-
%,/..&
ln#X-$
lnE2- 3 lnE%-
%,/&++
ln#X+$
lnE*- 3 lnE%-
%,/-.&
?inguno
lnE1" 2 3 *-
%,&(-
ln#X1$ y ln#X*$
lnE1" 2 3 %-
%,&/-
ln#X1$ y ln#X*$
lnE2" * 3 %-
%,&+((
>odos
Qodos
%,&&%
ln#X1$ y ln#X*$
ara cada variable es más significativo pronosticar la demanda del consumo del pollo con la variable ln#X1$, y le sigue en importancia la variable ln#X+$! Ai combinamos * variables independientes el meKor modelo está formado por ln#X1$ y ln#X*$, que meKoran significativamente el porcentaKe anterior!
Ai combinamos - variables independientes el meKor modelo está formado por ln#X1$Q ln#X*$ y ln#X+$, y se meKora ligeramente el porcentaKe anterior, pero se mantienen como explicativas para este modelo solo los tPrminos de variable ln#X1$ y ln#X*$! Ai combinamos + variables independientes, se meKora un poco más el porcentaKe anterior, pero se mantienen como explicativas para este modelo solo los tPrminos de variable ln#X1$ y ln#X*$! Ai sacrificamos el porcentaKe, el meKor modelo aKustado es el que tiene * variable independiente con ln#X1$ y ln#X*$, que se presenta a continuación como resultados de 3xcel0 Estadísticas de la regresión Coeficiente de correlación mltiple %,&/-+& Coeficiente de determinación 7M* %,&(*. 7M* aKustado %,&-&( 3rror t4pico %,%-*1+
An$lisis de la Harianza 7egresión 7esiduos >otal
Grados de libertad * *% **
Fntercepción ln#X1$ ln#X*$
Coeficiente s *,-(+(& %,+-&&* '%,+++&
Suma de cuadrados %,1%%1 %,%*% %,-%(
Promedio de los cuadrados %,-%. %,%%1%-
Error típico
Estadístico t
%,1-++ %,%*/.( %,%(-+*
1(,( 1.,-&&& ',%%1
F *&.,-%-
Probabilida d 1,1-3'11,+/3'1* ,-.3'%
Lodelo de regresión mltiple aKustado0 ˆ = ln(Y ) = b + b . ln( X ) + b . ln( X ) Y 0 1 1 2 2
ˆ = ln(Y ) = 2,3748 + 0,4399. ln( X ) − 0,4449. ln( X ) Y 1 2
arámetro del modelo0 r* = %,&(* 3sto indica que el &,(*9 de las variaciones del consumo de pollos se explica en este modelo!
:os valores de D = *&.,-% y t= 1.,+ para la variable ln#X1$ y t = ',% para la variable ln#X*$ califican a este como un modelo altamente significativo y muy confiable para realizar los pronósticos del consumo de pollo! 3ntonces b1 = %,+-&& indica el cambio porcentual de ln#Y$ por cada O1 de incremento en el ingreso disponible! ara b* = '%,+++& indica el cambio porcentual de ln#Y$ por cada O1 de incremento en el precio de la libra del pollo! ara realizar pronósticos para este modelo aKustado, aplicamos logaritmos al valor del ingreso disponible, y al precio de la libra del pollo y con este modelo se calcula el valor de ln#Y$, para finalmente estimar la cantidad de pollo a consumir se aplica antilogaritmo natural al resultado obtenido usando la ecuación de regresión!
c. 'orra una regresión completa del consumo de pollo sobre las %ariables restantes. segrese de eliminar una por una las %ariables +ue considere +ue no son signi)icati%as /asta +ue usted est3 satis)ec/o con su modelo )inal. *Es congruente su resultado con el resultado del procedimiento por pasos del inciso b# *Es probable +ue la correlación serial sea un problema en este anlisis de regresión
) continuación se muestra el modelo de regresión completa con las + variables, dada por 3xcel0
Estadísticas de la regresión Coeficiente de correlación mltiple Coeficiente de determinación 7M* 7M* aKustado 3rror t4pico
%,&/+- %,&/&( %,&*%/ %,%-*&( *-
An$lisis de la Harianza Grados de
Suma de
Promedio
F
+ 1/ **
cuadrado s %,111 %,%1&.( %,-%(
de los cuadrados %,1.*(( %,%%1%&
Coeficiente s *,+(+%%,-+&(+ '%,.+1( %,%(*-/ %,11/(1
Error típico %,1/%/ %,%&&. %,1-*.* %,11&11 %,1*%-
Estadístic Probabilida o t d 1-,*&.+ &,.-3'11 -,.1+/ %,%%*+( '+,%/(/ %,%%%& %,%( %,..1 %,&/*( %,--(%(
libertad 7egresión 7esiduos >otal
Fntercepción ln#X1$ ln#X*$ ln#X-$ ln#X+$
1+%,.*/
Lodelo de regresión mltiple0
ˆ = ln(Y ) = b + b . ln( X ) + b . ln( X ) + b . ln( X ) + b . ln( X ) Y 0 1 1 2 2 3 3 4 4
ˆ = ln(Y ) = 2,474 + 0,3497. ln( X ) − 0,5417. ln( X ) + 0,0724. ln( X ) + 0,1187. ln( X ) Y 1 2 3 4
arámetros del modelo0 r* = %,&&% D = 1+%,.3stos valores clasifican al modelo como muy confiable para realizar los pronósticos, sin embargo en el análisis de significancia de cada tPrmino de variable son explicativos solamente los tPrminos de ln#X1$ y ln#X*$, pero no son explicativos para este modelo los tPrminos de variables ln#X-$ y ln#X+$, tal que se decide eliminar de este modelo! 3l análisis del modelo reducido que consta solo de los * tPrminos de variable ln#X1$ y ln#X*$ ya se realizó en el literal anterior, y por sus buenas caracter4sticas nuevamente se elige como meKor a este modelo aKustado con estos * tPrminos de variable! )s4 que concuerda completamente la selección del meKor modelo aKustado de regresión mltiple del literal anterior! ) que los modelos de regresión mltiples presentan altos valores para el coeficiente de determinación mltiple r* existe el riesgo que se presente problemas de correlación serial!
Actividad de aprendizaje 2.%.
a. el li!ro !ase" capítulo pp. %%# &asta la %5)" resuelva los siguientes pro!lemas del ( 1" (5" Pro!lema 1' a- Para una muestra de 100 o!servaciones de datos aleatorios calcule un intervalo de con6ianza de 5N para el coe6iciente de auto correlaciones en cualquier retraso. "atos0 ?C = &.9 #V = *$ n = 1%%Q r@ = % Fntervalo de confianza0 I = r k ±
I = 0 ±
2 100
Z
=±
n 2 10
= ± 0, 2
ara que el coeficiente no sea significativo, debe estar en el intervalo de 6%,*!
!- Si todos los coe6icientes de auto correlación est$n dentro de sus intervalos individuales de con6ianza de 5N 3 no muestran un patrón particular" +quF conclusión se puede o!tener acerca del proceso, ara este comportamiento, concluimos que no 2ay autocorrelación, ya que los errores son constantes y aleatorios, y estamos trabaKando con una serie estacionaria y es válido aplicar algn modelo auto regresivo adecuado!
cSi las primeras auto correlaciones son positivas signi6icativamente distintas de cero 3 los patrones de auto correlación declinan a cero" +quF conclusión puede o!tener acerca del proceso, Como se puede ver, este proceso tiene una tendencia creciente significativa y es una serie no estacionaria, que al aplicar diferencias de primer orden se lograra transformar en una nueva serie estacionaria para poder aplicar
algn modelo auto regresivo apropiado para poder realizar pronósticos muy precisos!
d- Se o!serva un proceso trimestralmente" si las auto correlaciones r%" r 3 r12 son signi6icativamente distintas de cero" +quF conclusión puede o!tenerse, ara el proceso trimestral, 2ay una componente estacional significativa, que se puede corregir aplicando diferencias de orden @ = + y si es necesario @ = / para transformarla a serie estacionaria con variaciones controladas que facilitara usar un modelo auto regresivo adecuado!
Pro!lema 5' adas las gr$6icas de la 6igura P45 de las autocorrelaciones de la muestra 3 las autocorrelaciones parciales de la muestra" identi6ique tentativamente un modelo A9?JA para cada par de gr$6icas. 3ntre los modelos )7FL) #p, d, q$ de acuerdo a la autocorrelación y basándonos en el principio de parsimonia, tenemos0 •
•
•
Cuando corresponde a una serie creciente no lineal, el modelo adecuado es el auto regresivo )7FL) #*, %, *$ o )7FL) #1, 1, 1$, y se elige la que proporcione los parámetros más adecuados! Cuando corresponde a una serie creciente lineal, el modelo adecuado es el auto regresivo )7FL) #1, %, 1$ o )7FL) #1, %, %$! Cuando corresponde a una serie estacionaria no lineal, el modelo adecuado es el auto regresivo )7FL) #1, %, 1$ o )7FL) #1, %, %$!
!. 9esuelva el Caso 4 1 EHentas del restaurante-" p. %5). CASG 41 EHentas del restauranteste caso se re6iere a los datos de ventas 3 a la situación del restaurante descrito en el caso 4*. @im Price conclu3ó un curso de pronósticos 3 est$ ansioso por aplicar la metodología ;oD4@enWins a las ventas del restaurante. stos datos" presentados en la ta!la 41)A" inician en la semana que termina el domingo % de enero de 11 3 continLa &asta la semana que termina el domingo 2# de diciem!re de 12. Ba ta!la 41); contiene datos nuevos de la semana que termina el 2 de
enero de 1*" &asta la semana que termina el *0 de octu!re de 1*. Ae muestra el diagrama de dispersión para datos originales0
Ae observa que las ventas semanales corresponden a una serie estacionaria, por lo que podemos aplicar un modelos autoregresivos estacionales!
1.4 +Cu$l es el modelo ;oD4@enWins apropiado para usarse con los datos originales, ara los datos de ventas semanales de un periodo de * aJos, determinamos que el modelo que aporta parametros adecuados es el siguinte0 ˆt Y
= φ 0 + φ 1Y t −52 + φ 2Y t −53
Ae presentan los resultados de 3xcel0 Estadísticas de la regresión Coeficiente de correlación mltiple Coeficiente de determinación 7M* 7M* aKustado 3rror t4pico
%,(&..( %,-*&%,1(/+,1 .1
An$lisis de la Harianza Grados de libertad
Suma de cuadrados
Promedio de los cuadrados
F
Valor crítico de F
7egresión 7esiduos
* +/
-,&3%( *,-3%(
>otal
.%
,13%(
Fntercepción ariable X 1
11/.,*%,+/.*
Error típico +-,&/. %,%&-*(
ariable X *
%,-11*+
%,%&*+-
Coeficientes
1,&3%( +/(1
+1,-/*1
-,./3'11
*,(1**/ .,*%*-.
Probabilida d %,%%&*. +,%-3'%
Inferior 95% -%,1 %,*&(/
-,-(-1
%,%%1.
%,1*.+
Estadístico t
Lodelo de pronostico0 ˆt = 1185,23 + 0,4852Y + 0,3112Y t −53 Y t − 52
Como podemos ver en los diagramas de residuales, los residuos se distribuyen alrededor del valor constante cero, aleatoriamente!
"e acuerdo a los resultados, este modelo explica el -,*&9 de las variaciones de las ventas semanales! :os valores de D = +1,-/ y t de .,*% para Yt'.* y -,-( para Yt'.- nos permiten concluir que este modelo es muy confiable para realizar estimaciones de las ventas a futuro!
2.4 +Cu$les son sus pronósticos para las primeras cuatro semanas de enero de 1*, :os pronosticos de las ventas semanales se detallan en la segunda columna de la tabla que se muestra a continuación y se aKustan bastante bien con las ventas reales correspondientes!
Semana
tI
t real
rror
N rror
1X2X*
*(%-,+1
*+-1
'*(*,+1
11,*1
1XX*
*/-,*&
*(&
11*,(1
+,%-
1X1#X*
-/&,1
++-*
(+*,-&
1,(.
1X2*X*
.-1,+(
.(1+
-&(,.-
,&
*.4 +e quF manera se comparan estos pronósticos con las ventas reales, :os pronosticos semanales para el mes de enero y los errores de pronóstico se relacionan aceptablemente, solo para la tercera semana se evidencia un nivel importante de desvio!
%.4 e quF manera se compara el modelo ;oD4@enWins con los modelos de regresión empleados en el capítulo . :os modelos de Wox'en@ins analizan parametros de correlaciones, significancia y residuos para medir la calidad del modelo autoregresivo yBo media movil apropiado para una serie de tiempo, y se diferencian de los modelos del capitulo / ya que son funciones de una o mas variables independientes X, y los modelos de Wox'en@ins son dependientes de la misma serie con uno o mas ordenes de retrasos!
5.4 +Mtilizaría el mismo modelo ;oD4@enWins si los datos nuevos se com!inaran con los anteriores,