Problemas resueltos La línea r e c t a 13.1
a)
Construya una línea recta que se aproxime a los datos de la tabla 13-1.
b)
Encuentre una ecuación para esta recta. T a b l a 13-1
X
2
3
5
7
9
10
Y
1
3
7
11
15
17
SOLUCIÓN
á)
Grafique los puntos (2, 1), (3, 3), (5, 7), (7, 11), (9, 15) y (10. l T i a a s a B * rectangular de coordenadas, como se muestra en la figura 13-4. Estádarocananas-
2 9 C
_-Z
•
Ajuste
de curvas
y el método
de mínimos
cuadrados
F I G U R A 13-4
/ 4 /
16-
P / /
124 / 8-
*
/
/ /
4^ 4 /
1 4
b)
1
1 8
—x
1
12
ra que todos los puntos se encuentran en una línea recta (marcada con línea» discontinuas); por lo tanto, una línea recta se ajusta a los datos exactamente, Para determinar la ecuación de la recta dada por Y=a + a,X (26* sólo se necesitan dos puntos. Elija los puntos (2, 1) y (3, 3), por ejemplo. Par; : punto (2, 1), X= 2 y K = 1; sustituyendo estos valores en la ecuación (26) resulta a
1 = a + 2a, 0
De manera similar, para el punto (3, 3), X = 3 y Y = 3; sustituyendo estos valores a la ecuación (26) resulta 3 = a + 3a, 0
Resolviendo las ecuaciones (27) y (28) simultáneamente, a = -3 y ai = 2, la ecuac::: requerida es y = - 3 + 2X o y=2X-3 Para verificar, se puede mostrar que los puntos (5, 7), (7, 11), (9, 15) y (10. también se encuentran en la recta. 0
13.2
En el problema 13.1 calculea) Y cuando X - 4, b) y c u a n d o X = 15, c) ycuando.Y = 0, d) Xcuando Y= 7.5, e) Xcuando Y-0 y / ) el incremento en y correspondiente al crecimiento de una unidad en X. SOLUCIÓN
Se asume que la misma ley de relación, Y= 2 X - 3, es válida para valores d e X y Kdiferentes de aquellos especificados en la tabla 13-1. a)
b)
c)
d) e)
/)
Si X = 4, Y= 2(4) - 3 = 8 - 3 = 5. Dado que se busca el valor de y correspondiente a un valor de X incluido entre dos valores dados de X, este proceso suele llamarse interpolación lineal. Si X = 15, y = 2(15) - 3 = 30 - 3 = 27. Puesto que se busca el valor de Kcorrespondiente a un valor de Xfuera de o exterior a los valores dados de X, este proceso suele llamarse extrapolación lineal. Si X = 0, y = 2(0) - 3 = 0 - 3 = - 3 . El valor de Y cuando X = 0 se denomina la intersección en Y. Es el valor de y en el punto en que la recta (extendida si es necesario) se cruza con el eje Y. Si y = 7 . 5 , 7.5 = 2 X - 3 ; entonces, 2 X = 7.5+ 3 = 10.5 y X = 10.5/2 = 5.25. Si y = 0, 0 = 2X - 3; luego, 2X = 3 y X = 1.5. El valor de X cuando Y = 0 se llama la intersección en X. Es el valor de X en el punto donde la recta (extendida si es preciso) se cruza con el eje X. Si X se incrementa una unidad de 2 a 3, y se incrementa de 1 a 3, un cambio de dos unidades. Si X se incrementa de 2 a 10, o (10 - 2) = 8 unidades, entonces y se incrementa de 1 a 17 o (17 - 1) = 16 unidades; es decir, un aumento de 16 unidades en Y corresponde a un aumento de 8 unidades en X o y se incrementa dos unidades por cada incremento de una unidad en X.
Problemas
resueltos
•
291
En general, si A Y denota el cambio en y debido a un cambio en Xde AX. entonces d cambio en Y por unidad de cambio en X está dado por A17AX = 2. Esto se llama la pendiente de la recta y siempre es igual a a, en la ecuación Y=a + a,X. La constante oo es la intersección en y de la recta [véase el inciso c)]. 0
La pregunta anterior también puede responderse directamente de la gráfica de la figura 13-4. 13.3
a)
Muestre que la e c u a c i ó n de una recta que pasa por los puntos ( X , , y , ) y está dada por
(X ,Y ) 2
2
Y-Y =-?—±{X-X ) x
b)
x
Encuentre la e c u a c i ó n de una recta que pasa por los puntos (2, - 3 ) y (4, - 5 ) .
SOLUCIÓN
a)
La ecuación de una recta es y = a + aiX
(29)
y, = a + a,X,
(30)
Y =a + X
(31)
0
Dado que ( X , ^ ) está en la recta, 0
Dado que (X ,K ) está en la recta, 2
2
2
0
a¡
2
Restando la ecuación (30) de la (29), y-y^CÍX-X,)
(32)
Restando la ecuación (50) de la (31), y -y,=a,(X -X,) 2
o
2
a,=^—^ X - Ai 2
Sustituyendo este valor de a, en la ecuación (32) se obtiene Y, -Y, y -y,
x -x, 2
2
como se requirió. La cantidad Y -y, }
x -x, 2
que suele abreviarse como m, representa el cambio en Y, dividido entre el cambio correspondiente en X y es la pendiente de la línea. La ecuación requerida puede escribirse Y— Y\= m(X-X ). x
b)
P r i m e r método [usando el resultado del inciso a)] Correspondiente al primer punto (2, - 3 ) , se tiene X, = 2 y Y, = - 3 ; correspondiente al segundo punto (4, 5), se tiene X = 4 y Y = 5. Por lo tanto, la pendiente es 2
2
W
2
L
=
X -Xi
5- -3) i
4-2
2
=
8
=
2
y la ecuación requerida es y - y , = m(X-X,)
o
y-(-3) = 4(X-2)
que puede escribirse Y + 3 = 4(X - 2) o Y - 4X - 11. S e g u n d o método [con el método del problema 13.1Í»)] La ecuación de la recta es Y = a + a\X. Dado que el punto 12. -31 está ea ta mam -3 = a + 2a, y que el punto (4, 5) está en la recta 5=a, + 4a¿lesarneaa: a » » 0
0
2 92
:
Z-
_.C
'2
•
A j u s t e d e curvas y el método
de mínimos
cuadrados
ecuaciones simultáneamente se obtiene a, = 4 y a = - 1 1 . Entonces, la ecuaciós requerida es 0
y=-ll+4X 13.4
o
y=4X-ll
D é una interpretación gráfica de la respuesta dada en el problema 13.3a). SOLUCIÓN
La figura 13-5 muestra la recta que pasa por los puntos P y Q, que tienen las coordenaci.(X,, Y¡) y (X , Y ), respectivamente. El punto R, con coordenadas (X, Y), representa c:r: punto de esta recta. 2
2
FIGURA 13-5
Y-Y,
De los triángulos semejantes PRT y PQS RT_QS
Y
YP~~SP
X — X\
(33)
X — X\ 2
Entonces, multiplicando ambos lados por X - X,, Y,-Y, L
Y-Yj=—
(X-X,)
X - X, 2
que es la ecuación requerida de la recta. Obsérvese que cada uno de los cocientes en la ecuación (33) es la pendiente m; esto puede expresarse como Y - Y, = m(X-X ). t
13.5
Calcule a) la pendiente, b) la e c u a c i ó n , c) la i n t e r s e c c i ó n en Y y d) la intersección en X de la línea que pasa por los puntos ( 1 , 5) y (4, - 1 ) . SOLUCION
a)
(X, = 1, Y¡ = 5) y (X = 4, Y '= - 1 ) . Entonces 2
2
m = pendiente =
Yr-Y,
- 1 - 5 _ -6 _
x -x, 2
4 - i
-
_
r
_
_
El signo negativo de la pendiente indica que conforme X aumenta Y disminuye, como se muestra en la figura 13-6. b)
La ecuación de la recta es Y-Y
= m(X-X )
o
y-5=-2(X-l)
y - 5 = -2X + 2
o
y=7-2X
l
Estoes,
í
Esto también puede obtenerse por medio del segundo método del problema 13.3¿>). c)
La intersección en Y, que es el valor de y cuando X = 0, está dada por Y= 1 - 2(0) = 7. Esto también puede verse directamente en la figura 13.6.
Problemas
d)
13.6
resueftos
•
La intersección en X es el valor de X cuando Y = 0. Sustituyendo Y = 0 en la ecuación Y = 7 - 2X se obtiene 0 = 7 - 2 X o 2 X = 7 y X = 3.5. Esto también puede verse directamente en la figura 13-6.
Encuentre la e c u a c i ó n de una recta que pasa por el punto (4, 2) y es paralela a la recta2X+3r=6. SOLUCIÓN
Si dos rectas son paralelas, sus pendientes son iguales. A partir de 2X + 3Y= 6 se obtiene 3 Y = 6 - 2X o Y = 2 - § X, de tal modo que la pendiente de la recta es m = - § . Entonces, la ecuación requerida de la recta es Y-Y
= m(X-X,)
t
o
K-2= -|(X-4)
que también puede escribirse 2X + 3Y = 14. O t r o método
Cualquier recta paralela a 2X + 3Y = 6 tiene la ecuación 2X + 3Y = c. Para calcular c, sean X = 4 y K = 2. Entonces, 2(4) + 3(2) = c o c = 14; la ecuación requerida es 2X + 3 K = 14. 13.7
Busque la e c u a c i ó n de una recta cuya pendiente es -A y cuya intersección en Kes 16. SOLUCIÓN
En la ecuación Y = a + a X, a = 16 es la intersección en Y y a, = - 4 es la pendiente. Por tanto, la ecuación requerida es Y = 16 - 4X. 0
13.8
x
0
a)
Construya una recta que se aproxime a los datos de la tabla 13-2.
b)
Encuentre una e c u a c i ó n para esta recta. Tabla 13-2
X
1
3
4
6
8
9
11
14
Y
1
2
4
4
5
7
8
9
SOLUCIÓN
a)
Grafique los puntos (1, 1), (3, 2), (4, 4), (6, 4), (8, 5), (9, 7), (11, 8) y (14, 9) en un sistema rectangular de coordenadas, como se muestra en la figura 13-7. En la figura está dibujada a mano una recta que se aproxima a los datos. Para conocer un método que elimina la necesidad del juicio personal véase el problema 13.11, en donde se utiliza el método de mínimos cuadrados.
- T —
CAtîïïUUD
13
•
Ajusfe
de curvas
y el método
F I G U R A 13-7
de mínimos
cuadrados
108642-
i—i—i—i—i—i—i—i—i—i—i—i—i—i— X 2 b)
4
6
8
10
12
14
Para obtener la ecuación de la recta construida en el inciso a), elija cualesqu i c puntos de la recta, como P y Q; las coordenadas de los puntos P y Q, de acuerde ; : la gráfica, son aproximadamente (0, 1) y (12, 7.5). La ecuación de la recta es >'= a a,X. Entonces, para el punto (0, 1) se tiene 1 = a + cJi(O) y para el punto (12,7.5 = Í J + 12ai; puesto que la primera ecuación resulta en a = 1, la segunda es ei 6.5/12 = 0.542. Luego, la ecuación requerida es Y= 1 + 0.542X. 0
0
0
O t r o método
Por lo tanto, Y= 1 + 0.542X. 13.9
a) b)
Compare los valores de Y obtenidos a partir de la recta de aproximación ce aquellos dados en la tabla 13-2. Estime el valor de Y cuando X = 10.
SOLUCIÓN
a)
ParaX = 1, Y = 1 + 0.542(1) = 1.542 o 1.5. ParaX = 3, Y= 1 + 0.542(3) = 2.626 o 2.6 Los valores de Y correspondientes a otros valores de X pueden obtenerse de mane:; similar. Los valores de Y estimados a partir de la ecuación Y= 1 + 0.542X se denotar. por y . Estos valores estimados, junto con los datos reales de la tabla 13-2, se presentan en la tabla 13-3. cst
b)
El valor estimado de Y cuando X = 10 es Y= 1 + 0.542(10) = 6.42 o 6.4. Tabla 13-3
13.10
X
1
3
4
6
8
9
11
14 .
Y
1
2
4
4
5
7
8
9
^est
1.5
2.6
3.2
4.3
5.3
5.9
7.0
8.6
L a tabla 13-4 contiene las estaturas redondeadas en pulgadas (pulg) y los pesos redondeados en libras (Ib), de una muestra de 12 estudiantes hombres obtenida al azar de los estudiantes del primer a ñ o de la universidad estatal. Tabla 13-4
Estatura X (pulg) Peso'y (Ib)
70
63
72
60
66
70
74
65
62
67
65
68
155
150
180
135
156
168
178
160
132
145
139
152
a)
Obtenga un diagrama de dispersión de los datos.
b)
Construya una recta que se aproxime a los datos.
Problemas
resuelta
•
c)
Encuentre la ecuación de la recta construida en el inciso b).
d)
Estime el peso de un estudiante cuya estatura es de 63 pulg.
e)
Calcule la estatura de un estudiante cuyo peso es de 168 Ib.
295
SOLUCION
a)
El diagrama de dispersión mostrado en la figura 13-8 se obtiene al graficar los puntos (70, 155), (63, 150),..., (68, 152).
b)
En la figura 13-8 se muestra una recta que se aproxima a los datos. Ésta es sólo una de las muchas rectas posibles que podían haberse construido.
c)
Elija cualesquiera dos puntos sobre la recta construida en el inciso b), como P y Q, por ejemplo. Las coordenadas de estos puntos, como se ve en la gráfica, son aproximadamente (60, 130) y (72, 170). Por lo tanto Y, - Y, (X-X X -X
130
i
2
l
170-130 (X - 60) 72-60
Y ^ X - 7 0
d)
Si X = 63, entonces Y = ¥ ( 6 3 ) - 70 = 140 Ib.
é)
Si Y= 168, luego 168 = %X- 7 0 , ^ X = 238 y X = 71.4 o 71 pulg.
FIGURA 13-8
190 180 170i
•'a
160 o 150 (O a 140 130 120
i — i — i — i — i — i — i — i — r ~ 60
62
64
66
68
70
72
74
76
Estatura (pulgadas)
La r e c t a d e mínimos c u a d r a d o s 13.11
Ajuste una recta de m í n i m o s cuadrados a los datos del problema 13.8 usando a) X como la variable independiente y b) X como la variable dependiente. SOLUCIÓN
a)
La ecuación de la recta es Y = a + a¡X- Las ecuaciones normales son 0
£
Y
¿ZXY
= aN
+a ~2X
0
l¿
= a 2X ol
+
1
^Y,X
El procedimiento para calcular las sumas puede ordenarse como en la tab'. A pesar de que la columna en el extremo derecho no se requiere para esta paite del problema, se agregó a la tabla para utilizarla en b). Dado que hay ocho pares de valores de X y Y, N = 8, y las ecuaciones noracaies se convierten en 8ao + 56a, = 40 56ao + 524a, = 364
CAPITULO 13
•
Ajuste
de curvas
y el método
de mínimos
cuadrados
Resolviendo simultáneamente, a = t i o 0.545; a¡ = r i o 0.636; la recta de minia cuadrados requerida es Y = u + uX o Y = 0.545 + 0.636X. 0
Tabla 13-5
X
Y
X
2
XY
1
Y
1
1
1
1
1
3
2
9
6
4
4
4
16
16
16
6
4
36
24
16
8
5
64
40
25
9
7
81
63
49
11
8
121
88
64
14
9
196
126
81
ZX
= 56
E
7 = 40
2
}~2 X = 524
¿ZXY
= 364
2
E
Y = 256
O t r o método
2
aY)(.XX )-(ZX)aXY)
(40X524)- (56)(364) 6 •=— (8)(524)-(56)
a, =
ATZXr-(SX)g;y) (8X364) -(56)(40) 7 —; ——;— = :— = — N1X -(IX) (8)(524)-(56) 11 2
Entonces, Y=a
2
0.543
. . . . 0.636
o
2
+ a)X oY = 0.545 + 0.636X, como antes.
0
b)
o
2
iVl^-flA-f
Si se considera X como la variable dependiente y Y como la variable independie la ecuación de la recta de mínimos cuadrados es X= b + b,Yy las ecuaciones normales son 0
E X
=b N
E^Y
=b
+b ZY
0
]¿
0
Z Y +
2
b ZY l2
Entonces, de la tabla 13-5, las ecuaciones normales se convierten en 8¿>o + 40fc, = 56 40¿> + 256¿, = 364 0
de donde b¡¡ = - j o -0.50 y b¡ = § o 1.50. Estos valores también se pueden obtener de 2
b
=
( E * ) ( E Y ) - ( E n ( E XY) 2
N E Y - (E n _ N E ^
¿
'
N}Z
2
- ( E * ) ( E y) 2
Y - ( E K)
2
'
=
(56)(256) - (40)(364) (8) (256) - (40)
(8)(364) - (56)(40) _ (8)(256) - (40)
{
¡
=
_
Q
2
Q
2
Por lo tanto, la ecuación d é l a recta de mínimos cuadrados requerida es X = b + b,Y o X = - 0 . 5 0 + 1.50y. 0
Obsérvese que al resolver esta ecuación para y se obtiene Y= 3 + § l o y = 0.333 + 0.667X, que no es igual a la recta obtenida en el inciso a). 13.12
Para los datos de estatura/peso del problema 13.10, suponga que la estatura sea la variable independiente y utilice M i n i t a b para calcular la recta de m í n i m o s cuadrados. Grafique los valores de los datos observados y los puntos sobre la recta de m í n i m o s cuadrados en la misma gráfica.
Problemas
resueltos
•
297
SOLUCIÓN
A continuación se muestran los resultados de Minitab. El comando regress c2 on 1 var i a b l e i n o í produce la ecuación de la recta de mínimos cuadrados, weight = -60.7 + 3.22 h e i g h t . Para apreciar completamente el poder del software, vea los cálculos necesarios para encontrar la ecuación de la recta de mínimos cuadrados, como ocurre en el problema 13.17. MTB > p r i n t e l c 2 Data Display ROW 1 2 3 4 5 6 7 8 9 10 11 12
height
weight
70 63 72 60 66 70 74 65 62 67 65 68
155 150 180 135 156 168 178 160 132 145 139 152
MTB > r e g r e s s c 2 on 1 v a r i a b l e i n c l Regression Analysis
The regression equation is
weight = - 60.7 + 3.22 height En la figura 13-9 los valores de los datos observados se muestran como círculos y los puntos predichos, dados por la recta de mínimos cuadrados, se muestran como signos de más.
FIGURA 13-9
180
• +
170
o
160
140
+
•
150 -
• +
130
+
•
+
•
r~
-1 65
60
75
70 Estatura
13.13
a)
Muestre que las dos rectas de m í n i m o s cuadrados obtenidas en el problema 13.11 se intersectan en el punto (X, Y).
b) c)
Estime el valor de Y cuando X = 12. Calcule el valor de X cuando Y - 3.
SOLUCIÓN
N
8
E
Y
'
Por lo tanto, el punto (X, Y), denominado centroide, es (7,
40
.
ULO
?3
•
Ajusfe
a)
de curvas
y el método
de mínimos
cuadrados
El punto (7, 5) está en la recta Y= 0.545 + 0.636X o con mayor exactitud Y= u + rX.] dado que 5 = f i + n ( 7 ) . El punto (7, 5) está en la recta X = - s + 1Y, pues;: - i + 1(5). O t r o método
Las ecuaciones de las dos rectas son Y = fí + n X y X = - 2 + | y. Resolviese»] simultáneamente, se obtiene que X = 1 y Y =5. Por lo tanto, las rectas se interseca en el punto (7, 5).
13.14
b)
Sustituyendo X = 12 en la recta de regresión de Y (problema 13.11), Y = 0 : 0.636(12) = 8.2.
c)
Poniendo Y= 3 en larecta de regresión deX (problema 13.11), X = -0.50 + 1 5 4.0.
Pruebe que las rectas de m í n i m o s cuadrados pasan siempre por el punto (X, I SOLUCIÓN
C a s o 1 (X es la variable independiente) La ecuación de la recta de mínimos cuadrados es Y = a + aX 0
t
Una ecuación normal para la recta de mínimos cuadrados es XY=a N+a 0
]
Ix
(U|j
Dividiendo ambos lados de la ecuación (35) entre N da Y = a + a,X
(36>!
0
Restando la ecuación (36) de la ecuación (34), la recta de mínimos cuadrados puede e birse (J7>
r-F=a,(X-X) que muestra que la recta pasa por el punto (X, Y). C a s o 2 (/es la variable independiente)
Procediendo como en el caso 1, pero intercambiando X y y lo mismo que sustituyendo las constantes a y a¡ por b y b , respectivamente, se encuentra que la recta de mínimos cuadrados puede escribirse 0
0
x
X-X
=
fc,(y-F)
I.Í-
que indica que la recta pasa por el punto (X, Y). Nótese que las rectas (37) y (38) no son coincidentes, pero se intersecan en (X, Y). 13.15
a)
Considerando a X como la variable independiente, muestre que la ecuación de la recta de m í n i m o s cuadrados puede escribirse x
(Y. y\ donde jc = X - X y y = b)
(E*Y
Y-Y.
Si X - 0, pruebe que la recta de m í n i m o s cuadrados del inciso a) puede escribirse
Problemas
c) d)
resuehc:
•
Escriba la ecuación de la recta de mínimos cuadrados correspondiente al nK*so a) si Yes la variable independiente. Verifique que las rectas en los incisos a) y c) no son necesariamente las mismas.
SOLUCIÓN
a)
L a ecuación (37) puede escribirse y = a\X, donde x = X-Xyy=Y-Y. solución simultánea de las ecuaciones normales (18) se tiene NZXY-(1X)(1Y) 2
_ Nl(x
+ X)(y + YJ-[l(x
2
+ Xy][l(y + Y)]
2
NIX -(IX)
2
N2Z(x + X) -[I(x
_N22(xy + xY + Xy + XY)-(Y;x 2
+ NX){Zy
2
+ X)] + NY)
2
N E (x + 2XX + X )-CL,X
+ NX) 2
N22xy + MYZx
+ NX2Zy + X XY-(2Zx
2
2
N Zx
2
+ 2NX £ > + N X
¿
Además, de la
+ NX)(22y + NY) 2
- ( E * + NX)
P e r o X * = X (X-X) = 0 y X y = X (Y- F) = 0; por lo tanto, lo anterior se simplifica a 2
_NZxy y
"~
2
+ N XY 2
2
- N XY
N E x + NX
2
2
_¿Zxy
2
2
- NX
~¿Zx
Esto también puede escribirse como ¿Z xy _E l
° 'Ex
x(Y ~ Y)
2
E*
Z xY - Y 2Zx _E
2
E *
xY
2
2
Ex
Por lo tanto, la recta de mínimos cuadrados es y = a,x; esto es,
b)
SiX=0,x
= X-X
= X. Entonces, a partir de y
setiene
y
=
l ^ - ± L )
o
X
Y= Y+ f ^ Z V E *
)x 2
O t r o método
Las ecuaciones normales de la recta de mínimos cuadrados Y= a + a X son Q
XY = a N + a Xx 0
y
i
t
2
X XY = a X X + a, X X 0
Si X = ( X AT/JV = 0, entonces X X = 0 y las ecuaciones normales se convierten en lY= N
y
ao
de donde
Y ÜQ =
Y
= Y
l X Y = y
a
i
l x
2
Y.XY a, = ^ ^
2
Por lo tanto, la ecuación de la recta de mínimos cuadrados requerida es Y =a
0 +
c)
X
a[
o
Y=Y+(^pjX
Intercambiando X y Y o x y y, se puede mostrar como en el inciso a) que
Z-'-~..Z
13
•
Ajusfe de curvas y el método
d)
de mínimos
cuadrados
Del inciso a), la recta de mínimos cuadrados es
Del inciso c), la recta de mínimos cuadrados es
(4 i E
r, A
xy
Yxy,Yy
Dado que,
„ E
, t ^ ^ E
^
las rectas de mínimos cuadrados (39) y (40) son diferentes en general. Obsérvese, sin embargo, que se intersecan en x = 0 y y = 0 [es decir, en el punto (X, Y)].
13.16
Si X'= X + AyY'-Y+B,
donde Ay B son cualesquiera constantes, pruebe que
n ^ x y - j t , x)(J2 y) _n 2
E * - (E *)
z x'y'
2
- ( E * ' ) ( E r')
- (E *')
* E
2
SOLUCION
x' = X'-
X' = (X + A)-(X
+ A) = X- X =x
y' = Y' - Y' = (Y + B) - (Y + B) = Y - Y = y
E *y _ E Entonces
E*
2
E
x'y' x' 2
y el resultado se obtiene a partir del problema 13.15. Un resultado similar es válido para b Este resultado es útil, ya que permite simplificar cálculos para obtener la recta de regresión restando constantes adecuadas de las variables Xy Y (véase el segundo método del problema 13.17). Nota: El resultado no es válido si X' = C\X + A y Y' = c Y + B, a menos que Cj = c . h
2
13.17
2
Ajuste una recta de m í n i m o s cuadrados a los datos del problema 13.10 utilizando a) X como variable independiente y b) X como variable dependiente. SOLUCIÓN P r i m e r método
a)
Del problema 13.15a), la recta requerida es
donde x = X - Xy y = Y - Y. El trabajo requerido para calcular las sumas puede ordenarse como en la tabla 13-6. De las dos primeras columnas, se encuentra que X = 802/12 = 66.8 y Y = 1 850/12 = 154.2. La última columna se agregó para utilizarla en el inciso b).
Problemas
resueltos
•
301
Tabla 13-6
Estatura X
x =
Peso Y
X-X
y=
Y-
2
xy
Y
x
2.56
y
10.24
2
70
155
3.2
0.8
63
150
-3.8
-4.2
15.96
14.44
17.64
72
180
5.2
25.8
134.16
27.04
665.64
60
135
-6.8
-19.2
130.56
46.24
368.64
66
156
-0.8
1.8
-1.44
0.64
3.24
70
168
3.2
13.8
44.16
10.24
190.44
74
178
7.2
23.8
171.36
51.84
566.44
0.64
65
160
-1.8
5.8
-10.44
3.24
33.64
62
132
-4.8
-22.2
106.56
23.04
492.84
67
145
0.2
-9.2
-1.84
0.04
84.64
65
139
-1.8
-15.2
27.36
3.24
231.04
68
152
1.2
-2.2
-2.64
1.44
4.84
E X = 802 X = 66.8
£
£
Y = 1 850
xy = 616.32
X>
2
E .v = 191.68
2
= 2 659.68
Y = 154.2 La recta de mínimos cuadrados requerida es y = |
191.68
x = 3.22*
o Y- 154.2 = 3.22(X-66.8), que puede escribirse Y= 3.22X-60.9. Esta ecuación se denomina recta de regresión de Y sobre X y se utiliza para estimar Y a partir de valores dados de X. b)
Si X es la variable dependiente, la recta requerida es x
y Y, y2
E
616.32 2 659.68
y = 0.232;^
que puede escribirse X - 66.8 = 0.232(y- 154.2) o X = 31.0 + 0.232K. Esta ecuación se denomina recta de regresión de X sobre y y es útil para estimar X a partir de valores dados de Y. Nótese que también puede usarse el método del problema 13.11, si así se desea. S e g u n d o método
Utilizando el resultado del problema 13.16, se pueden restar constantes adecuadas de X y y. Se decide restar 65 de X y 150 de Y. Entonces, los resultados llegan a ordenarse igual que en la tabla 13-7. N E X' Y' - ( E * ' ) ( £ Y') _ (12)(708) - (22)(50) «i
2
N E X'
- ( E X'f
N1X'Y'-(1Y')(ZX') '
2
2
N1Y' -(1Y')
= 3.22
(12)(232) - (22)' _ (12)(708)-(50)(22) _ (12)(2 8 6 8 ) - ( 5 0 )
Q
2
3
2
2
Dado que X = 65 + 22/12 = 66.8 y Y = 150 + 50/12 = 154.2, las ecuaciones de regresión son y - 154.2 = 3.22(X- 66.8) y X - 6 6 . 8 = 0.232(y- 154.2); esto es. )'= 3 22X- 6 0 9 y X = 0.232y + 31.0, que coincide con el primer método. 13.18
a)
En el mismo conjunto de ejes, dibuje las gráficas de las dos rectas del problema 13.17.
b)
Estime el peso de un estudiante cuya estatura es de 63 p u l g .
c) Calcule la estatura de un estudiante cuyo peso es de 168 Ib.
Ajusfe
de curvas
y el m é t o d o d e mínimos
cuadrados
Tabla 13-7
r'
X'
a
5
Y'
5
25
25
25
-2
0
4
0
0
7
30
49
210
900
-15
25
75
225
1
6
1
6
36
5
18
25
90
324
9
28
81
252
784
10
0
0
100
9
54
324
-5
0 -3
E
2
X
-18
2
-5
4
-10
25
0
-11
0
0
121
3
2
9
6
A " = 22
J2 Y' = 50
E
2
X ' = 232
¿2 X'Y'
4
= 708
£
2
K ' = 2 868
SOLUCIÓN
a)
Las dos rectas se muestran en la figura 13-10, junto con los puntos de los da:: originales. Obsérvese que se intersecan en (X, Y) o (66.8, 154.2).
FIGURA 13-10
—
60
1
1
1
1
62 64 66 68 Estatura
1
1
1
1—
70 72 7 4 76
(pulgadas)
b)
Para estimar Y a partir de X utilice la recta de regresión de Y sobre X dada en e problema 13.17 como Y= 3.22X - 60.9. Entonces, si X= 63, Y = 3.22(63) - 60.9 ; 142 Ib.
c)
Para encontrar X a partir de Y, use la recta de regresión de X sobre Y dada en e problema 13.17 como X= 31.0 + 0.232 Y. Luego, si Y= 168, X= 31.0 + 0.232(1681 : 70.0 pulg. Los resultados de los incisos b) y c) deben compararse con los del problema 13.1' incisos d) y e).
Aplicaciones a series d e t i e m p o 13.19
En la tabla 13-8 se presenta el valor total de los cultivos en Estados Unidos, en miles de millones de dólares, de 1989 a 1995. Utilice un software estadístico par¿ hacer lo siguiente:
Problemas
Tabla
resueltos
•
303
13-8
Año
1989
1990
1991
1992
1993
1994
1995
Valor total
660.0
671.4
688.0
695.5
717.1
759.2
807.0
Fuente: U.S. Department of Agriculture, Economic Research Service.
a)
Grafique los datos
b)
Encuentre la e c u a c i ó n de la recta de m í n i m o s cuadrados que se ajuste a los datos.
c)
Estime el valor de los cultivos en Estados Unidos en 1988 y c o m p á r e l o con el valor de $626.8 m i l millones.
d)
Calcule el valor de los cultivos en Estados Unidos en 1996 y c o m p á r e l o con el valor de $859.7 m i l millones.
SOLUCION
a)
La línea continua en la figura 13-11 muestra una gráfica de los datos para la tabla 138, y la línea discontinua indica la gráfica de la recta de mínimos cuadrados.
FIGURA 13-11
800
•slores de cultivos totales ae Estados Unidos, en *b es de millones de dólares.
700
600
-
1988
1 1 1989 1990
- 1 1 1991 1992
1 1 1 1 1993 1994 1995 1996
Año b)
El siguiente resultado parcial de Minitab ofrece la solución de la recta de cuadrados: Data Display
Row
Year
Value
1 2 3 4 5 6 7
1989 1990 1991 1992 1993 1994 1995
660.0 671.4 688.0 695.5 717 . 1 759.2 807.0
MTB > r e g r e s s c2 on 1 v a r i a b l e i n c l Regression Analysis
The regression equation is V a l u e = - 4 5 2 2 2 . 9 1 4 2 8 6 + 23.060714 Year La tabla 13-9 incluye los valores ajustados y ¡os residuales paca i » tabla 13-8. Los valores ajustados se obtienen sustituyendo d año en la « regresión (ecuación para la recta de mínimos cuadrados). Por e j e ^ É o . - € 5 .
Ajusfe
de curvas
y el método
de mínimos
cuadrados
+ 23.060714 (1989) = 644.846. El residual es igual al valor menos el valor ijii T—th» Los residuales indican qué tan bien se ajusta la recta de mínimos cuadrad: i i valores reales de los datos. Tabla 13-9
Año
Valor
Valor ajustado
1989
660.0
644.846
1990
671.4
667.907
3.4929
1991
688.0
690.968
-2.9679
1992
695.5
714.029
-18.5286
1993
717.1
737.089
-19.9893
1994
759.2
760.150
-0.9500
1995
807.0
783.211
23.7893
Residual 15.1536
Con frecuencia los años se codifican antes de analizar los datos. El siguí resultado de Minitab ilustra el análisis usando valores codificados para los años Data Display Row
Year-coded
Value
1 2 3 4 5 6 7
0 1 2 3 4 5 6
660.0 671.4 688.0 695.5 717.1 759.2 807.0
MTB > r e g r e s s c2 on 1 v a r i a b l e i n c l
The regression equation is V a l u e = 644.846 + 23.061 Y e a r - c o d e d La tabla 13-10 ofrece los valores ajustados y los residuales para los datos de 1; tabla 13-8, usando los valores codificados para los años. Tabla 13-10
c)
Año codificado
Valor
0
660.0
644.846
1
671.4
667.907
3.4929
2
688.0
690.968
-2.9679
Valor ajustado
Residual 15.1536
3
695.5
714.029
-18.5286
4
717.1
737.089
-19.9893
5
759.2
760.150
-0.9500
6
807.0
783.211
23.7893
Cualquiera de las ecuaciones de mínimos cuadrados obtenidas en el inciso b) puede usarse para estimar el valor total de los cultivos en 1988. La ecuación obtenida utilizando los años sin codificar es Valor = -45 222.914286 + 23.060714 (1988) o $621.8 mil millones. El valor real es $626.8 mil millones y el residual es 626.8 - 621.8 = $5 mil millones. La ecuación obtenida usando el valor codificado es Valor = 644.846 + 23.061 (—1) = 621.8. Obsérvese que, utilizando el esquema de codificación, 1988 se codifica c o m o - 1 .
Problemas
d)
13.20
resueltos
•
3 8 5
Cualquiera de las ecuaciones de mínimos cuadrados obtenidas en d r a e r » r usarse para estimar el valor total de los cultivos en 1996. La ecuación otitcaada —ÉV zando los años sin codificar es Valor = -45 222.914286 + 23.060714(1996) o $306-27 mil millones. El valor real es $859.7 mil millones y el residual es 85v ~ - ; - i' $53.43 mil millones. La ecuación resultante usando el valor codificado es Vaie: = 644.846 + 23.061(7) = $806.27. Obsérvese que, usando el esquema de codificación. 1996 se codifica como 7.
L a tabla 13-11 muestra el poder de compra del dólar, medido por los precios al consumidor, de acuerdo con la Agencia de Estadísticas Laborales, Inspección de Negocios Actuales de Estados Unidos (U.S. Bureau o f Labor Statistics, Survey of Current Business). T a b l a 13-11
Año Precios al consumidor Año Precios al consumidor
1983
1984
1985
1986
1987
1988
1989
1.003
0.961
0.928
0.913
0.880
0.846
0.807
1990
1991
1992
1993
1994
1995
1996
0.766
0.734
0.713
0.692
0.675
0.656
0.638
Fuente: U.S. Bureau of Labor Statistics, Survey of Current Business.
d)
Grafique los datos.
b)
Encuentre la ecuación de la recta de m í n i m o s cuadrados, ajusfando los datos al calcular la e c u a c i ó n de la recta de tendencia y usando M i n i t a b para encontrar la e c u a c i ó n de la recta de tendencia.
c) Prediga el poder de compra para 1998, bajo el supuesto de que la tendencia continúa. SOLUCIÓN
a)
La línea continua de la figura 13-12 muestra una gráfica de los datos de la tabla 1311 y la línea discontinua, la gráfica de la recta de mínimos cuadrados.
FIGURA 13-12
0.99 0.94
o. 0 . 8 9 E o 0.84 o
0) 0 . 7 9 •o O) 0 . 7 4 •o o 0.69 Q.
— i
0.64 0.59
1
1
1
1
1
1
1
1
1
1
1981 1983 1 9 8 5 1 9 8 7 1 9 8 9 1 9 9 1 1 9 9 3 1 9 9 5 1 9 9 7 1 9 9 9
Año b)
Los cálculos para encontrar la recta de tendencia se muestran en la tabla 13-12- La ecuación es y = ( X *y/X x*)x, donde x = X-X yy=Y-Y, que puede escribarse d é l a siguiente manera: Y - 0.801 = -0.0289(X - 6.5)
o
Y= -0.0289X + O J O »
306
CAPÍTULO
73
•
Ajusfe
de curvas
y el método
de mínimos
cuadrados
Tabla 13-12
Año
X
Y
x =
X-X
y=Y-Y
x
2
xy
1983
0
1.003
-6.5
0.202
42.25
-1.3130
1984
1
0.961
-5.5
0.160
30.25
-0.8800
1985
2
0.928
-4.5
0.127
20.25
-0.5715
1986
3
0.913
-3.5
0.112
12.25
-0.3920
1987
4
0.880
-2.5
0.079
6.25
-0.1975
1988
5
0.846
-1.5
0.045
2.25
-0.0675
1989
6
0.807
-0,5
0.006
0.25
-0.0030
1990
7
0.766
0.5
-0.035
0.25
-0.0175
1991
8
0.734
1.5
-0.067
2.25
-0.1005
1992
9
0.713
2.5
-0.088
6.25
-0.2200
1993
10
0.692
3.5
-0.109
12.25
-0.3815
1994
11
0.675
4.5
-0.126
20.25
-0.5670
1995
12
0.656
5.5
-0.145
30.25
-0.7975
1996
13
0.638
6.5
-0.163
42.25
-1.0595
E
* = 91 X = 6.5
E
2
E* =
Y = 11.212 Y = 0.801
227.50
E
xy = -6.5680
La solución de Minitab se obtiene de la siguiente manera: Los valores X codificados se ponen en la columna C l y los valores Kdel poder de compra se ponen en la columna C2. MTB > R e g r e s s ' P u r c h a s i n g p o w e r ' 1 ' Y e a r ' ; Regression Analysis
The regression equation is P u r c h a s i n g power = 0.989 - 0.0289 Y e a r
La tabla 13-13 incluye los valores ajustados y los residuales para la recta de tendenc i c) El poder de compra predicho para 1998 es 0.989 - 0.0289(15) = 0.556. Tabla 13-13
Poder de compra
Valor ajustado
1983
1.003
0.989
0.014
1984
0.961
0.960
0.001
1985
0.928
0.931
-0.003
1986
0.913
0.902
0.011
1987
0.880
0.873
0.007
1988
0.846
0.844
0.002
1989
0.807
0.815
-0.008
1990
0.766
0.786
-0.020
1991
0.734
0.758
-0.024
1992
0.713
0.729
-0.016
1993
0.692
0.700
-0.008
1994
0.675
0.671
0.004
1995
0.656
0.642
0.014
1996
0.638
0.613
0.025
Año
Residual
Problemas
resueltos
•
307
Ecuaciones n o lineales reducibles a una forma lineal 13.21
En la tabla 13-14 se presentan valores experimentales de la presión P de una masa de gas dada, correspondientes a diversos valores del volumen V. De acuerdo con los principios t e r m o d i n á m i c o s , debe existir una relación entre las variables en la y
forma PV = C, donde y y C son constantes. a)
Calcule los valores de y y C.
b)
Escriba la e c u a c i ó n que relacione P y V.
c)
Estime P cuando V = 100.0 pulg .
3
Tabla 13-14 3
Volumen V en pulgadas cúbicas (pulg ) 2
Presión P en libras por pulgada cuadrada (lb/pulg )
54.3
61.8
72.4
88.7
118.6
194.0
61.2
49.2
37.6
28.4
19.2
10.1
SOLUCION Dado que PV = C, se tiene log P + y log V= log C o log P = log C-y
log V
Llamando a log V = X y a log P = Y, la última ecuación puede escribirse Y = a + a,X
(41)
0
donde a = log C y a, = -y. 0
La tabla 13-15 proporciona X = log V y Y = log P, correspondientes a los valores de V y F de la tabla 13-14, y también indica los cálculos considerados para obtener la recta de mínimos cuadrados (41). Las ecuaciones normales correspondientes a la recta de mínimos cuadrados (41) son
lY= N
+
ao
a
i
lx
y
2
Y XY = aoT X + aiX X
de donde (E
1
y)(E x ) E *
x){¿Z ( E x)
- (E 2
-
XY)
N}ZXY-(Y:
=
Y)
= -1.40
2
Portante, y = 4 . 2 0 - 1.40X. 4
a)
Dado que a = 4.20 = log C y a, = -1.40 = -y, C = 1.60 X 10 y y = 1.40.
b)
La ecuación requerida, en términos de P y V, puede escribirse PV
c)
Cuando V = 100, X = log V = 2 y y = log P = 4.20 - 1.40(2) = 1.40. Entonces, P •• antilog 1.40 = 25.1 lb/pulg .
0
iA0
= 16 000.
2
Tabla 13-15
E
xy
y = \ogP
1.7348
1.7868
3.0095
1.7910
1.6946
3.2077
3.0350
1.8597
1.5752
3.4585
2.9294
1.9479
1.4533
3.7943
2.830»
2.0741
1.2833
4.3019
2-6617
2.2878
1.0043
5.2340
X = 11.6953
E
Y = 8.7975
X
2
X = log V
E
2
X
= 23.005»
3.0997
i
-
-
-
I 308
CAPITULO
13
•
Ajuste
13.22
de curvas
y el método
de mínimos
cuadrados
Resuelva el problema 13.21 graneando los datos en papel gráfico log-log. SOLUCIÓN Primero se obtiene un punto por cada par de valores de la presión P y el volumen Vd< tabla 13-14 y se grafican estos puntos en papel gráfico log-log, tal como se muestra er figura 13-13. Después se traza una recta que aproxime estos puntos (la recta de la figi 13-13 está dibujada a mano). La gráfica resultante muestra que existe una relación lin entre log P y log V, que puede representarse por medio de la ecuación log P = a + a¡ log V 0
o
Y=a
0
+ a\X
FIGURA 13-13
10
20
30
40
50
60
70
80
90 100
160
200
250
M
Volumen V
La pendiente a¡, que en este caso es negativa, está dada numéricamente por el c cíente de las longitudes de AB entre AC (usando la unidad de longitud apropiada), medida en este caso da a¡ = -1.4.
Para obtener a se requiere un punto de la recta. Por ejemplo, cuando V = 100 en gráfica, P = 25; por lo tanto, a = log P - a, log V = log 2 5 + 1 . 4 log 100 = 1.4 + (1.4)1 = 4.2; en consecuencia, log P + 1.4 log V = 4.2, log PV = 4.2 y PV' = 16 000. 0
0
lA
A
La parábola d e mínimos c u a d r a d o s 13.23
L a tabla 13-16 muestra la p o b l a c i ó n de Estados Unidos en millones, en interval de 5 a ñ o s , de 1950 a 1995. Ajuste una recta, a s í como una p a r á b o l a a los datos, comente sobre los dos ajustes. Utilice ambos modelos para predecir la poblacu de Estados Unidos en el 2000.
Problemas
•
resueltos
309
Tabla 13-16
Año
1950
1955
1960
1965
1970
1975
1980
1985
1990
1995
Población
152
166
181
194
205
216
228
238
250
263
Fuente: U.S. Bureau of Census. SOLUCIÓN
A continuación se muestra un impreso parcial de la solución de Minitab para la recta de mínimos cuadrados y la parábola de mínimos cuadrados: Row 1 2 • 3 4 5 6 7 8 9 10
Year
Population
X
xsquare
1950 1955 1960 1965 1970 1975 1980 1985 1990 1995
152 166 181 194 205 216 228 238 250 263
0 1 2 3 4 5 6 7 8 9
0 1 4 9 16 25 36 49 64 81
MTB > R e g r e s s ' p o p u l a t i o n ' on 1 p r e d i c t o r ' x ' Regression Analysis
T h e regression equation is
Population » 155 + 12.0 x MTB > R e g r e s s ' p o p u l a t i o n ' on 2 p r e d i c t o r s ' x ' ' x s q u a r e ' Regression Analysis
T h e regression equation is
Population - 153 + 13.6 x - 0.178 xscruare La tabla 13-17 muestra los valores ajustados y residuales para el ajuste de la recta a los datos: Tabla 13-17
Año
Población
Valor ajustado
Residual
1950 1955
152
155.164
-3.16364
166
167.194
-1.19394
1960
181
179.224
1.77576
1965
194
191.255
2.74545
1970
205
203.285
1.71515
1975
216
215.315
0.68485
1980
228
227.345
0.65455 -1.37576
1985
238
239.376
1990
250
251.406
-1.40606
1995
263
263.436
-0.43636
La tabla 13-18 muestra los valores ajustados y los residuales parada de los datos. La suma de los cuadrados de los residuales para la i de los cuadrados de los residuales para la parábola parábola se ajusta mejor a los datos que la recta.
G A P Í I U L O 13
•
Ajusfe
de curvas
y el método
de mínimos
cuadrados
Tabla 13-18
Año
Población
Valor ajustado
Residual
1950
152
153.027
-1.02727
1955
166
166.482
-0.48182
1960
181
179.580
1.41970
1965
194
192.323
1.67727
1970
205
204.709
0.29091
1975
216
216.739
-0.73939
1980
228
228.414
-0.41364
238
239.732
-1.73182
1990
250
250.694
-0.69394
1995
263
261.300
1.70000
1985
Para predecir la población en el año 2000, Obsérvese que el valor codificado p 2000 es 10. El valor de la recta predicha es 155 + 12.0(10) = 275 millones y el modele parábola predice lo siguiente: 153 + 13.6(10) - 0.178(100) = 271.2 millones.